1. Genre et classification automatique en TAL : le cas de genres journalistiques
- Author
-
Amalia Todirascu, Linguistique, Langues et Parole (LILPA), and Université de Strasbourg (UNISTRA)
- Subjects
Automatic classification by genre ,syntactic properties for classification ,05 social sciences ,linguistique des genres ,[SCCO.COMP]Cognitive science/Computer science ,050801 communication & media studies ,morphosyntaxiques ,journalistic genres ,02 engineering and technology ,propriétés statistiques ,genres journalistiques ,0508 media and communications ,0202 electrical engineering, electronic engineering, information engineering ,morpho-syntactic ,020201 artificial intelligence & image processing ,genre linguistics ,Classification automatique par genre ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,statistical ,syntaxiques pour la classification ,ComputingMilieux_MISCELLANEOUS - Abstract
La classification automatique par genre est une tâche difficile, pour les systèmes de Traitement automatique des langues, due à la diversité des définitions du genre et à l’absence d’une définition adaptée pour une approche automatique. Le genre discursif détermine les procédés d’écriture et de réception du texte (Rastier, 1989, Bouquet, 2004). En effet, par son caractère normatif, le genre influence les choix de vocabulaire, de syntaxe, de style (Biber et Conrad, 2009), y compris les procédés de création lexicale. Nous exploitons ces propriétés linguistiques pour la classification automatique des genres discursifs, appartenant aux champs génériques de l’opinion et de l’information dans le domaine du journalisme. Les propriétés choisies pour la classification automatique sont établies après une analyse de corpus de genres discursifs et champs génériques journalistiques. The automatic genre classification represents a difficult task for NLP systems, due to the absence of a unique definition of genre, useful for automatic classification. The discursive genre is determinant for text production and interpretation (Rastier, 1989, Bouquet, 2004). The genre influences the choice of lexical words, syntactic structures or styles (Biber et Conrad, 2009) or the process of neologism creation. We exploit the linguistic properties induced by the genre to automatically classify newspapers discourse genre or more generic categories (information vs opinion). The properties are established on the basis of a linguistic analysis of the newspapers genres and categories.
- Published
- 2019
- Full Text
- View/download PDF