De automatische generatie van foneemtranscripties en segmentaties voor het Nederlands
Title | De automatische generatie van foneemtranscripties en segmentaties voor het Nederlands |
Publication Type | Presentation |
Year of Publication | 2003 |
Conference Name | Dag van de Fonetiek 2003 |
Authors | Demuynck, Kris, Tom Laureys, Dirk Van Compernolle, and Patrick Wambacq |
Publisher | Nederlandse Vereniging voor Fonetische Wetenschappen |
Conference Location | Utrecht, The Netherlands |
Abstract | In deze presentatie beschrijven we de automatische generatie van foneemtranscripties en de bijhorende foneem- en woordsegmentaties zoals die gemaakt worden voor het Vlaamse deel van het Corpus Gesproken Nederlands. Eerst beschrijven we de automatische generatie van een netwerk van alternatieve foneemtranscripties op basis van de orthografie. Uit dit netwerk selecteert de automatische spraakherkenner het akoestisch best passende pad. Vervolgens behandelen we de gebruikte algoritmes voor het maken van woord- en foneemsegmentaties. We besluiten met een gedetailleerde analyse van de verschillen tussen enerzijds de manueel geproduceerde foneemtranscripties en woordoplijningen en anderzijds de resultaten van het automatische proces. Deze evaluatie gebeurt op de uiteenlopende componenten die binnen het CGN aanwezig zijn: van voorgelezen spraak over spontane conversaties tot telefoonspraak. |