Back to Search Start Over

Contribution of automatic adaptation of language models for speech recognition : extrinsic qualitative evaluation in a context of educational courses

Authors :
Mdhaffar, Salima
Estève, Yannick
Hernandez, Nicolas
Laurent, Antoine
Quiniou, Solen
Laboratoire d'Informatique de l'Université du Mans (LIUM)
Le Mans Université (UM)
Laboratoire Informatique d'Avignon (LIA)
Avignon Université (AU)-Centre d'Enseignement et de Recherche en Informatique - CERI
Laboratoire des Sciences du Numérique de Nantes (LS2N)
IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Nantes - UFR des Sciences et des Techniques (UN UFR ST)
Université de Nantes (UN)-Université de Nantes (UN)-École Centrale de Nantes (ECN)-Centre National de la Recherche Scientifique (CNRS)
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI)
Université Paris Saclay (COmUE)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université - UFR d'Ingénierie (UFR 919)
Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Université Paris-Sud - Paris 11 (UP11)
Centre d'Enseignement et de Recherche en Informatique - CERI-Avignon Université (AU)
Centre National de la Recherche Scientifique (CNRS)-École Centrale de Nantes (ECN)-Université de Nantes - UFR des Sciences et des Techniques (UN UFR ST)
Université de Nantes (UN)-Université de Nantes (UN)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)
Source :
Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN)-PFIA 2019-Volume II : Articles courts, Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN)-PFIA 2019-Volume II : Articles courts, Jul 2019, Toulouse, France. pp.167-174
Publication Year :
2019
Publisher :
HAL CCSD, 2019.

Abstract

International audience; Malgré les faiblesses connues de cette métrique, les performances de différents systèmes de reconnaissance automatique de la parole sont généralement comparées à l'aide du taux d'erreur sur les mots. Les transcriptions automatiques de ces systèmes sont de plus en plus exploitables et utilisées dans des systèmes complexes de traitement automatique du langage naturel, par exemple pour la traduction automatique, l'indexation, la recherche documentaire... Des études récentes ont proposé des métriques permettant de comparer la qualité des transcriptions automatiques de différents systèmes en fonction de la tâche visée. Dans cette étude nous souhaitons mesurer, qualitativement, l'apport de l'adaptation automatique des modèles de langage au domaine visé par un cours magistral. Les transcriptions du discours de l'enseignant peuvent servir de support à la navigation dans le document vidéo du cours magistral ou permettre l'enrichissement de son contenu pédagogique. C'est à-travers le prisme de ces deux tâches que nous évaluons l'apport de l'adaptation du modèle de langage. Les expériences ont été menées sur un corpus de cours magistraux et montrent combien le taux d'erreur sur les mots est une métrique insuffisante qui masque les apports effectifs de l'adaptation des modèles de langage.

Details

Language :
French
Database :
OpenAIRE
Journal :
Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN)-PFIA 2019-Volume II : Articles courts, Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN)-PFIA 2019-Volume II : Articles courts, Jul 2019, Toulouse, France. pp.167-174
Accession number :
edsair.dedup.wf.001..b8433b2c1c848453eb9e29008125d154