2007 Emotionele spraaksynthese

Authors
Melanie Kroes
Abstract
In dit onderzoek heb ik drie methodes om synthetische spraak emotioneel te laten klinken met elkaar vergeleken. Twee methodes passen de grondfrequentie en de klankduren aan. Voor deze twee methodes gebruiken we hetzelfde difoonsynthesesysteem om de initiële intonatie en klankduren te bepalen. De derde methode kopieert de intonatie en klankduren uit natuurlijke emotionele spraak. De spraak is geselecteerd uit een Engelstalige emotionele database en de transcripties van de fragmenten zijn ook gebruikt voor synthese met de andere methodes. Om de spraak te genereren is voor alle methodes dezelfde Engelse MBrola-stem gebruikt. In een luisterexperiment is aan 20 proefpersonen gevraagd om van ieder fragment aan te geven wat de 'arousal' (activatie) en 'valence' (waardering) is en om het emotielabel (afraid, angry, happy, neutral, relaxed en sad) te kiezen dat het beste past bij het fragment. Ik zal de resultaten van dit experiment presenteren
Publication type
Presentation
Year of publication
2007
Conference location
Utrecht
Conference name
Dag van de Fonetiek 2007
Publisher
Nederlandse Vereniging voor Fonetische Wetenschappen