Verschil in spraakkwaliteit tussen natuurlijke en synthetische spraak bij normaal en snel tempo
Title | Verschil in spraakkwaliteit tussen natuurlijke en synthetische spraak bij normaal en snel tempo |
Publication Type | Presentation |
Year of Publication | 2001 |
Conference Name | Dag van de Fonetiek 2001 |
Authors | Janse, Esther |
Publisher | Nederlandse Vereniging voor Fonetische Wetenschappen |
Conference Location | Utrecht, The Netherlands |
Abstract | Dit onderzoek werd opgezet om het verschil in spraakkwaliteit te meten tussen synthetische en natuurlijke spraak, bij normaal tempo en na matige versnelling. Eerder onderzoek heeft laten zien dat verstaanbaarheid en verwerkingsgemak van snelle spraak verhoogd worden door segmentele redundantie. Difonen zijn segmenteel redundante stukjes spraak: alles is oorspronkelijk beklemtoond en nauwkeurig uitgesproken. Hoewel deze segmentele redundantie bij normaal tempo misschien onnatuurlijk klinkt, zou het een voordeel kunnen zijn wanneer synthetische spraak versneld wordt. Op basis hiervan werd verwacht dat het kwaliteitsverschil tussen synthetische difoonspraak en natuurlijke spraak kleiner wordt nadat beide typen spraak versneld zijn. Foneemdetectietijd werd gebruikt als maat van verwerkingsgemak van de spraak en daarmee als maat van de spraakkwaliteit. De hypothese dat het verschil in spraakkwaliteit tussen synthetische en natuurlijke spraak kleiner wordt na versnelling werd niet bevestigd door de resultaten: het kwaliteitsverschil tussen de twee typen spraak was op beide tempo's gelijk. Enkele mogelijke verklaringen zullen besproken worden. |