Intonatie modellering voor meerdere talen en verschillende tekst-types

TitleIntonatie modellering voor meerdere talen en verschillende tekst-types
Publication TypePresentation
Year of Publication2001
Conference NameNieuwe Projecten
AuthorsBuhmann, Jeska
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationAmsterdam, The Netherlands
Abstract

Om een intonatiemodel voor meerdere talen te ontwikkelen werd eerder al met een datagedreven methode geëxperimenteerd. Deze methode bestaat eruit vijf pitch waarden per syllabe te voorspellen aan de hand van een set features die afgeleid wordt uit de orthografie. Hiervoor wordt een recurrent neuraal netwerk (RNN) gebruikt.

De methode is met succes toegepast om intonatiecontouren van geïsoleerde zinnen in zes verschillende talen te voorspellen. Eén van de doelen van dit project was te experimenteren met grote tekstdocumenten van verschillende teksttypes. De ontwikkelde methode is daarom in de eerste plaats aangepast om met grote tekstdocumenten om te gaan. Vervolgens is er voor drie talen (Engels, Nederlands en Frans) geëxperimenteerd met modellen die enkel getraind zijn op één teksttype, en modellen die getraind zijn op data van meerdere teksttypes. Voor elke taal werden tests uitgevoerd voor vier verschillende teksttypes, namelijk instructies, nieuws, verhalen en technische teksten.

Een tweede uitbreiding ten opzichte van intonatiemodellering voor geïsoleerde zinnen, is het gebruik van HTML-features. In tegenstelling tot geïsoleerde zinnen, zijn de tekstdocumenten afkomstig van het internet. Onderzoek moest uitwijzen of het gebruik van HTML-features, die iets zeggen over de structuur van een tekst (vb. eerste woord in paragraaf), of die aangeven of een woord bijvoorbeeld "bold" of "italic" geschreven is, het eindresultaat positief beïnvloedt.

In de presentatie zal uitleg gegeven worden over de opzet van de verschillende experimenten en de daaruit volgende resultaten.