Back to Search Start Over

Analyse conjointe du signal sonore et de sa transcription pour l'identification nommée de locuteurs

Authors :
Jousse, Vincent
Meignier, Sylvain
Jacquin, Christine
Petitrenaud, Simon
Estève, Yannick
Daille, Béatrice
Laboratoire d'Informatique de l'Université du Mans (LIUM)
Le Mans Université (UM)
Laboratoire d'Informatique de Nantes Atlantique (LINA)
Mines Nantes (Mines Nantes)-Université de Nantes (UN)-Centre National de la Recherche Scientifique (CNRS)
Le projet régional Miles (pays de la loire)
Source :
Revue TAL, Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2009, 50 (1), pp.201-225
Publication Year :
2009
Publisher :
HAL CCSD, 2009.

Abstract

International audience; For some years, processing mass of multimedia documents has become a very crucial issue for applications like indexation or information retrieval. Among the focused information, speaker identity can be very useful for such applications. A huge collection of documents cannot be manually processed with a reasonable cost: only automatic systems are a relevant solution.In this paper, we consider the extraction of speaker identity (firstname and lastname) from audio records of broadcast news. Using a rich transcription system, we present a method which allows to extract speaker identities from automatic transcripts and to assign them to speaker turns. Experiments are carried out on French broadcast news records from the ESTER 1 phase II evaluation campaign.; Depuis quelques années, le traitement de très grandes collections de documents mul-timédias devient crucial pour certaines applications comme les systèmes d'indexation ou de recherche documentaire. Mais ces collections ne peuvent être traitées manuellement avec un coût raisonnable : seuls les systèmes automatiques apportent une solution viable. Dans ce document , nous traiterons de l'extraction automatique de l'identité du locuteur (prénom et pa-tronyme) présente dans les enregistrements sonores. À partir des résultats d'un système de transcription enrichie, nous présentons une méthode qui vise à extraire l'identité des locuteurs de la transcription et à l'assigner aux différents tours de parole. Le système a été évalué sur des enregistrements radiophoniques provenant de la campagne d'évaluation ESTER 1 phase II.

Details

Language :
French
ISSN :
12489433 and 19650906
Database :
OpenAIRE
Journal :
Revue TAL, Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2009, 50 (1), pp.201-225
Accession number :
edsair.dedup.wf.001..60030501ba02115a111827b38b7d27f8