Start Over

Modèle-s bayés-ien-s pour la segment-ation à deux niveau-x faible-ment super-vis-é-e

Authors :: Okabe, Shu
Yvon, François
Laboratoire Interdisciplinaire des Sciences du Numérique (LISN)
Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
Traitement du Langage Parlé (TLP )
Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Sciences et Technologies des Langues (STL)
Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
Estève, Yannick
Jiménez, Tania
Parcollet, Titouan
Zanon Boito, Marcely
ANR-19-CE38-0015,CLD2025,La documentation computationnelle des langues à l'horizon 2025(2019)
Source :: Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, Traitement Automatique des Langues Naturelles, Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.174-182
Publication Year :: 2022
Publisher :: HAL CCSD, 2022.
Abstract: National audience; La segmentation automatique en mots et en morphèmes est une étape cruciale dans le processus de documentation des langues. Dans ce travail, nous étudions plusieurs modèles bayésiens pour réaliser une segmentation conjointe des phrases à ces deux niveaux : d’une part, en introduisant un couplage déterministe entre deux modèles spécialisés pour identifier chaque type de frontières, d’autre part, en proposant une modélisation intrinsèquement hiérarchique. Un objectif important de cette étude est de comparer ces modèles dans un scénario où une supervision faible est disponible. Nos expériences portent sur deux langues et permettent de comparer dans des conditions réalistes les mérites de ces diverses modélisations.

Subjects :: modèle bayésien non-paramétrique
segmentation en morphèmes
documentation automatique des langues
segmentation en mots
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]

Details

Language :: French
Database :: OpenAIRE
Journal :: Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, Traitement Automatique des Langues Naturelles, Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.174-182
Accession number :: edsair.od.......165..17c0b1ca7cc9dda1f262f96ccd0cdbce

Tools

Email
Cite

Printer

Authors Abstract Subjects Details

Searchworks

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources

Modèle-s bayés-ien-s pour la segment-ation à deux niveau-x faible-ment super-vis-é-e

Abstract

Subjects

Details

Tools

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Modèle-s bayés-ien-s pour la segment-ation à deux niveau-x faible-ment super-vis-é-e

Abstract

Subjects

Details

Tools

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources