Demonstratie: Spengi spraaksynthese software

Authors
de Pijper, Jan-Roelof
Abstract
Spengi (SPeech ENGine) is de benaming voor het spraaksynthesesysteem dat op het IPO is ontwikkeld en nog steeds in ontwikkeling is. Spengi is een Phonetics-to-Speech engine, en verwacht dus een fonetische transcriptie als invoer. De synthese is gebaseerd op difonen en de kwaliteit van de spraak is state-of-the-art, mede door goede prosodische beregeling en geavanceerd gebruik van PSOLA technieken.

Er zijn momenteel drie difoondatabases beschikbaar: een vrouwenstem en een mannenstem voor het Nederlands en een vrouwenstem voor het Brits-Engels.

Spengi is beschikbaar als een API en kan daardoor makkelijk in bijvoorbeeld een C-programma geïntegreerd worden. Verder zijn er twee front-end applicaties beschikbaar voor demonstratie- en onderzoeksdoeleinden: Ipologue is een conventioneel command-line programma (DOS en UNIX); Calipso is een Windows programma. Beide applicaties zullen op deze dag gedemonstreerd worden.

Beide applicaties kunnen gebruik maken van grafeem-foneemomzetters die ontwikkeld zijn aan de KUN en aan de KUB. Calipso is verder nauw geïntegreerd met het signaalbewerkingsprogramma GIPOS.
Publication type
Demonstratie
Year of publication
1999
Conference location
Utrecht
Conference name
Dag van de Fonetiek 1999
Publisher
Nederlandse Vereniging voor Fonetische Wetenschappen