Het IFA corpus

TitleHet IFA corpus
Publication TypePresentation
Year of Publication2001
Conference NameNieuwe Projecten
Authorsvan Son, Rob
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationAmsterdam, The Netherlands
Abstract

Het IFA corpus is een middelgroot corpus van ongeveer 50.000 woorden met de hand gelabelde en gesegmenteerde spraak (in totaal ongeveer 5 1/2 uur spraak). De spraak stamt van 8 sprekers, 4 mannen en 4 vrouwen, die ieder meer dan een uur ingesproken hebben in 8 verschillende spreekstijlen, van informeel (spontaan) tot voorgelezen onzinwoordjes. Het gehele corpus is toegankelijk via: http://www.fon.hum.uva.nl/IFAcorpus. Het corpus is beschikbaar voor iedereen onder de GNU General Public License (dwz., Open Source).