Akoestische parameters versus fonetische kenmerken voor ASH

Authors
Strik, Helmer, Jacques Koreman, and Bistra Andreeva
Abstract
In automatische spraakherkenning (ASH) worden als akoestische parameters meestal cepstrale parameters gebruikt. Deze cepstrale parameters zijn door ons afgebeeld op 2 sets van fonetische kenmerken, resp. gebaseerd op de kenmerken van IPA (International Phonetic Association) en op die van SPE (Sound Pattern of English).

Door de akoestische parameters op fonetische kenmerken af te beelden is het mogelijk de linguistische informatie in het signaal explicieter te modelleren [1,2]. De resultaten van onze experimenten laten zien dat hierdoor ook de foneemidentificatie verbeterd van 15,6% correct voor cepstrale parameters, naar 42,3% respectievelijk 31,7% voor IPA- en SPE-gebaseerde kenmerken. Bovendien zijn de verwisselingen tussen fonemen fonetisch gezien in het algemeen minder ernstig wanneer fonetische kenmerken gebruikt worden.

J. Koreman, B. Andreeva, W.J. Barry (1998) Do phonetic features help to improve consonant identification in ASR? Proc. ICSLP-98, Sydney.
J. Koreman, B. Andreeva, H. Strik (1999) Acoustic parameters versus phonetic features in ASR. Proceedings of the 14th International Congress of Phonetic Sciences, San Francisco, USA, pp. 719-722.
Publication type
Presentation
Year of publication
1999
Conference location
Utrecht
Conference name
Dag van de Fonetiek 1999
Publisher
Nederlandse Vereniging voor Fonetische Wetenschappen