Back to Search Start Over

Un traitement hybride du vague textuel : du système expert VAGO à son clone neuronal

Authors :
Icard, Benjamin
Claveau, Vincent
Atemezing, Ghislain
Égré, Paul
Institut Jean-Nicod (IJN)
Département d'Etudes Cognitives - ENS Paris (DEC)
École normale supérieure - Paris (ENS-PSL)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS-PSL)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École des hautes études en sciences sociales (EHESS)-Collège de France (CdF (institution))-Centre National de la Recherche Scientifique (CNRS)-Département de Philosophie - ENS Paris
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)
Université Paris sciences et lettres (PSL)
Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)
Mondeca
Programme PLEXUS (Marie Skłodowska-Curie Action, Horizon Europe Research and Innovation Programme, grant agreement n°101086295)
ANR-21-ASIA-0003,HYBRINFOX,Traitement des fake news et du vague informationnel : une approche hybride entre IA symbolique et apprentissage profond(2021)
ANR-17-EURE-0017,FrontCog,Frontières en cognition(2017)
Source :
Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2023), Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2023), Jun 2023, Paris, France
Publication Year :
2023
Publisher :
HAL CCSD, 2023.

Abstract

International audience; The VAGO tool is an expert system for lexical vagueness detection that also measures the degree of subjectivity of the speech, as well as its level of detail. In this paper, we build a neural clone of VAGO, based on a BERT-like architecture, trained on symbolic VAGO scores on a French press corpus (FreSaDa). The qualitative and quantitative analysis shows the fidelity of the neural version. By exploiting explainability tools (LIME), we then show the interest of this neural version for the enrichment of the lexicons of the symbolic version, and for the production of versions in other languages.; L'outil VAGO est un système expert de détection du vague lexical qui mesure aussi le degré de subjectivité du discours, ainsi que son niveau de détail. Dans cet article, nous construisons un clone neuronal de VAGO, fondé sur une architecture de type BERT, entraîné à partir des scores du VAGO symbolique sur un corpus de presse française (FreSaDa). L'analyse qualitative et quantitative montre la fidélité de la version neuronale. En exploitant des outils d'explicabilité (LIME), nous montrons ensuite l'intérêt de cette version neuronale d'une part pour l'enrichissement des lexiques de la version symbolique, et d'autre part pour la production de versions dans d'autres langues.

Details

Language :
French
Database :
OpenAIRE
Journal :
Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2023), Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2023), Jun 2023, Paris, France
Accession number :
edsair.dedup.wf.001..3a3e1ff024d07521eab8d84cbd610472