Verbeterde toegang tot het TIMIT-spraakcorpus

TitleVerbeterde toegang tot het TIMIT-spraakcorpus
Publication TypePresentation
Year of Publication2000
Conference NameDag van de Fonetiek 2000
AuthorsWeenink, David
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

Het TIMIT-spraakcorpus op CDROM is een Amerikaans spraakbestand dat bestaat uit 6300 zinnen uitgesproken door 630 verschillende sprekers. Ongeveer 70% van de sprekers is man en 30% is vrouw. De sprekers stammen uit de 8 belangrijkste dialectregios van de Verenigde Staten. Alle 6300 zinnen zijn gelabeld op zinsnivo, woordnivo en foneemnivo. Voor elk van de 6300 uitgesproken zinnetje staat de informatie in 4 aparte bestanden op de CDROM:

  • een bestand met de audio,
  • een bestand met de tekst van de zin met begin- en eindtijd,
  • een bestand met de woorden met begin- en eindtijd en
  • een bestand met de phonemen met begin- en eindtijd.

Om de toegang tot de informatie in deze 4x6300 bestanden te verbeteren, hebben we alle, bijna 250.000, fonemen van dit corpus met additionele informatie in een database gezet. In de database zijn van elk foneem een groot aantal gegevens verzameld, waaronder de duur van het foneem, het foneemtype, de foneemcontext, woord- en zinsinformatie, klemtooninformatie en sprekerinformatie. Om het ruwe materiaal te kunnen lezen hebben we verder het computerprogramma praat zo aangepast dat de audio- en labelbestanden van de CDROM gelezen kunnen worden.