Automatische sprekerherkenning

TitleAutomatische sprekerherkenning
Publication TypePresentation
Year of Publication2000
Conference NameDag van de Fonetiek 2000
Authorsvan Buuren, Ronald
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

Met behulp van berekeningstechnieken op basis van covariantiematrices (Bimbot et al, 1995) is het mogelijk om onafhankelijk van de inhoud, een spreker te herkennen aan de hand van een fragment spraak. De herkenning vergelijkt het onbekende fragment met een reeks eerder verzamelde en (met de hand) geïdentificeerde fragmenten en kiest hieruit het meest gelijkende. Het criterium wordt berekend uit de "afstand" tussen de covariantiematrices van de bekende fragmenten en het onbekende fragment.

De automatische sprekerherkenning werkt het beste op spraakmateriaal van hoge kwaliteit: bij 400 bekende sprekers wordt een nieuw fragment van één van hen in circa 95% van de gevallen correct herkend. Voor spraakmateriaal met telefoonbandbreedte en achtergrondruis zakt deze score naar circa 60%.

Multimedia-demonstratie op draagbare PC is beschikbaar.

Literatuur

  • Bimbot, F., Magrin-Chagnolleau, I., en Mathan, L.(1995).
  • Second-order statistical measure for text-independent speaker identification. Speech Communication 17 177-192.