1. Quelques expériences de TAL sur le discours radiophonique : le cas de la revue de presse
- Author
-
Agata Jackiewicz, Frédérik Bilhaut, Praxiling (Praxiling), Université Paul-Valéry - Montpellier 3 (UPVM)-Centre National de la Recherche Scientifique (CNRS), Equipe CODAG - Laboratoire GREYC - UMR6072, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU), and Jackiewicz, Agata
- Subjects
Natural language processing ,études expérimentales sur corpus ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,05 social sciences ,[INFO.INFO-TT] Computer Science [cs]/Document and Text Processing ,revue de presse radiophonique ,050801 communication & media studies ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Traitement automatique des langues ,[SHS.INFO] Humanities and Social Sciences/Library and information sciences ,050105 experimental psychology ,SemioLabs ,[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing ,0508 media and communications ,Anesthesiology and Pain Medicine ,France Inter ,natural language processing (NLP) ,0501 psychology and cognitive sciences ,experimental studies on corpora ,radio press review ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,traitement automatique des langues (TAL) - Abstract
Nous présentons une série d’expériences linguistico-informatiques appliquées aux revues de presse de France Inter (716 textes, de mai 2005 - juin 2011). Le corpus a fait l’objet d’une annotation sémantique automatique sur différents axes : sources et relais d’informations (type de publication, périodicité, chroniqueurs, etc.), contenus factuels (entités, faits, marqueurs thématiques, etc.), discours rapporté, et marques de subjectivité traduisant différentes attitudes, notamment émotionnelles (enthousiasme, inquiétude, etc.) ou axiologiques (accord, validité, etc.). L’étude se décompose en trois volets : (i) analyse de corpus et construction d’une grille d’analyse ; (ii) constitution de ressources linguistiques opérationnelles ; (iii) mise en œuvre informatique et analyse des résultats., We present an experiment in computational linguistics applied to press reviews issued by France Inter (716 texts, May 2005 - June 2011). The corpus has been automatically annotated following various formal and semantic criteria: sources and information channels (kind of publication, periodicity, columnists, etc.), factual contents (named entities, facts, topic markers, etc.), quotes, and subjective aspects related to various attitudes such as emotional ones (enthusiasm, anxiety, etc.) or axiological ones (agreement, validity, etc.). The study is divided into three parts: (i) corpus analysis and building of the analytical framework; (ii) establishment of operational language resources; (iii) implementation and analysis of results.
- Published
- 2013
- Full Text
- View/download PDF