"Landgenooten..." Verbeterde toegang tot historische toespraken

Title"Landgenooten..." Verbeterde toegang tot historische toespraken
Publication TypePresentation
Year of Publication2006
Conference NameDag van de Fonetiek 2006
AuthorsHeeren, Willemijn, and Laurens van der Werff
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

Het CHoral project heeft tot doel om technologie te ontwikkelen ter verbetering van de toegang tot historische audiocollecties. Via spraakherkenning proberen we audio-archieven om te zetten in tekst, waardoor het mogelijk wordt om de audio te doorzoeken op woordniveau. Relevante fragmenten kunnen vervolgens direct worden beluisterd. Het automatisch verwerken van historische gesproken documenten is lastig, omdat de audiokwaliteit vaak slecht is, en de spreekstijl en het woordgebruik ouderwets zijn. Dit leidt tot een mismatch met bestaande akoestische modellen en taalmodellen, die zijn ontwikkeld op het nieuwsdomein.

In deze presentatie willen we ons onderzoek introduceren aan de hand van experimenten op een specifieke, historische audiocollectie: de toespraken van Koningin Wilhelmina uitgezonden op Radio Oranje tijdens de Tweede Wereldoorlog. Deze collectie bestaat niet alleen uit audio; alle toespraken zijn tevens volledig uitgeschreven. Daarom was het mogelijk om door oplijning van de audio met de teksten tot een index op woordniveau te komen. In een demo zullen we laten zien dat - met behulp van deze index - online gezocht kan worden in de audio en de tekst als ondertiteling bij de audio kan worden gepresenteerd.