Back to Search
Start Over
ANNODIS : une approche outillée de l'annotation de structures discursives
- Source :
- Actes de TALN 2009, Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper_TALN_52, Traitement Automatique des Langues Naturelles 2009, Traitement Automatique des Langues Naturelles 2009, Jun 2009, Senlis, France, HAL, Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles (TALN'2009), Senlis (France), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper 52
- Publication Year :
- 2009
- Publisher :
- HAL CCSD, 2009.
-
Abstract
- The ANNODIS project has two interconnected objectives: to produce a corpus of texts annotated at discourse-level, and to develop tools for corpus annotation and exploitation. Two sets of annotations are proposed, representing two complementary perspectives on discourse organisation: a bottom-up approach starting from minimal discourse units and building complex structures via a set of discourse relations; a top-down approach envisaging the text as a whole and using pre-identified cues to detect discourse macro-structures. The construction of the corpus goes hand in hand with the development of two interfaces: the first one supports manual annotation of discourse structures, and allows different views of the texts using NLP-based pre-processing; another interface will support the exploitation of the annotations. We present the discourse models and annotation protocols, and the interface which embodies them.<br />Le projet ANNODIS vise la construction d'un corpus de textes annotés au niveau discursif ainsi que le développement d'outils pour l'annotation et l'exploitation de corpus. Les annotations adoptent deux points de vue complémentaires : une perspective ascendante part d'unités de discours minimales pour construire des structures complexes via un jeu de relations de discours ; une perspective descendante aborde le texte dans son entier et se base sur des indices pré-identifiés pour détecter des structures discursives de haut niveau. La construction du corpus est associée à la création de deux interfaces : la première assiste l'annotation manuelle des relations et structures discursives en permettant une visualisation du marquage issu des prétraitements ; une seconde sera destinée à l'exploitation des annotations. Nous présentons les modèles et protocoles d'annotation élaborés pour mettre en œuvre, au travers de l'interface dédiée, la campagne d'annotation.
- Subjects :
- [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
annotation tools
[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL]
structures de discours
annotation de corpus
[INFO.INFO-TT] Computer Science [cs]/Document and Text Processing
discourse structures
interface d'annotation
[SHS.LANGUE]Humanities and Social Sciences/Linguistics
corpus annotation
[SHS.LANGUE] Humanities and Social Sciences/Linguistics
ComputingMilieux_MISCELLANEOUS
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]
Subjects
Details
- Language :
- French
- Database :
- OpenAIRE
- Journal :
- Actes de TALN 2009, Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper_TALN_52, Traitement Automatique des Langues Naturelles 2009, Traitement Automatique des Langues Naturelles 2009, Jun 2009, Senlis, France, HAL, Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles (TALN'2009), Senlis (France), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), 16ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2009), ATALA : Association pour le Traitement Automatique des Langues, Jun 2009, Senlis, France. paper 52
- Accession number :
- edsair.dedup.wf.001..701275af105e96173a42228acf113ec1