Back to Search Start Over

ANNODIS : une approche outillée de l'annotation de structures discursives

Authors :
Marie-Paule Péry-Woodley
Nicholas Asher
Patrice Enjalbert
Farah Benamara
Myriam Bras
Cécile Fabre
Stéphane Ferrari
Lydia-Mai Ho-Dac
Anne Le Draoulec
Yann Mathet
Philippe Muller
Laurent Prévot
Josette Rebeyrolle
Ludovic Tanguy
Marianne Vergez-Couret
Laure Vieu
Antoine Widlöcher
Cognition, Langues, Langage, Ergonomie (CLLE-ERSS)
Université Bordeaux Montaigne-École pratique des hautes études (EPHE)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université Toulouse - Jean Jaurès (UT2J)-Centre National de la Recherche Scientifique (CNRS)
Equipe de Recherche en Syntaxe et Sémantique (ERSS)
Université Bordeaux Montaigne-Université Toulouse - Jean Jaurès (UT2J)-Centre National de la Recherche Scientifique (CNRS)
Department of Philosophy
University of Texas at Austin [Austin]
MEthodes et ingénierie des Langues, des Ontologies et du DIscours (IRIT-MELODI)
Institut de recherche en informatique de Toulouse (IRIT)
Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées
Centre National de la Recherche Scientifique (CNRS)
Equipe Hultech - Laboratoire GREYC - UMR6072
Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC)
Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN)
Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN)
Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN)
Normandie Université (NU)
Université Toulouse III - Paul Sabatier (UT3)
Laboratoire Parole et Langage (LPL)
Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)
Equipe CODAG - Laboratoire GREYC - UMR6072
ATALA : Association pour le Traitement Automatique des Langues
ANR-07-CORP-0002,ANNODIS,Annotation discursive : corpus de référence pour le français et outils d'aide à l'annotation et à l'exploitation(2007)
École pratique des hautes études (EPHE)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université Toulouse - Jean Jaurès (UT2J)-Université Bordeaux Montaigne-Centre National de la Recherche Scientifique (CNRS)
Institute of Molecular Cancer Research
University of Zürich [Zürich] (UZH)
Université Toulouse 1 Capitole (UT1)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)
Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen (GREYC)
Université de Caen Normandie (UNICAEN)
Normandie Université (NU)-Normandie Université (NU)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN)
Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-Université de Caen Normandie (UNICAEN)
Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)
Péry-Woodley, Marie-Paule
Corpus et outils de la recherche en sciences humaines et sociales - Annotation discursive : corpus de référence pour le français et outils d'aide à l'annotation et à l'exploitation - - ANNODIS2007 - ANR-07-CORP-0002 - CORP - VALID
École Pratique des Hautes Études (EPHE)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Bordeaux Montaigne (UBM)-Centre National de la Recherche Scientifique (CNRS)
Université Toulouse Capitole (UT Capitole)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université de Toulouse (UT)-Toulouse Mind & Brain Institut (TMBI)
Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Université Toulouse Capitole (UT Capitole)
Université de Toulouse (UT)
Source :
Actes de TALN 2009, Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper_TALN_52, Traitement Automatique des Langues Naturelles 2009, Traitement Automatique des Langues Naturelles 2009, Jun 2009, Senlis, France, HAL, Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles (TALN'2009), Senlis (France), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper 52
Publication Year :
2009
Publisher :
HAL CCSD, 2009.

Abstract

The ANNODIS project has two interconnected objectives: to produce a corpus of texts annotated at discourse-level, and to develop tools for corpus annotation and exploitation. Two sets of annotations are proposed, representing two complementary perspectives on discourse organisation: a bottom-up approach starting from minimal discourse units and building complex structures via a set of discourse relations; a top-down approach envisaging the text as a whole and using pre-identified cues to detect discourse macro-structures. The construction of the corpus goes hand in hand with the development of two interfaces: the first one supports manual annotation of discourse structures, and allows different views of the texts using NLP-based pre-processing; another interface will support the exploitation of the annotations. We present the discourse models and annotation protocols, and the interface which embodies them.<br />Le projet ANNODIS vise la construction d'un corpus de textes annotés au niveau discursif ainsi que le développement d'outils pour l'annotation et l'exploitation de corpus. Les annotations adoptent deux points de vue complémentaires : une perspective ascendante part d'unités de discours minimales pour construire des structures complexes via un jeu de relations de discours ; une perspective descendante aborde le texte dans son entier et se base sur des indices pré-identifiés pour détecter des structures discursives de haut niveau. La construction du corpus est associée à la création de deux interfaces : la première assiste l'annotation manuelle des relations et structures discursives en permettant une visualisation du marquage issu des prétraitements ; une seconde sera destinée à l'exploitation des annotations. Nous présentons les modèles et protocoles d'annotation élaborés pour mettre en œuvre, au travers de l'interface dédiée, la campagne d'annotation.

Details

Language :
French
Database :
OpenAIRE
Journal :
Actes de TALN 2009, Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper_TALN_52, Traitement Automatique des Langues Naturelles 2009, Traitement Automatique des Langues Naturelles 2009, Jun 2009, Senlis, France, HAL, Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles (TALN'2009), Senlis (France), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper 52
Accession number :
edsair.dedup.wf.001..701275af105e96173a42228acf113ec1