Back to Search Start Over

Structural and semantic methods to establish mappings between textual cases of fetal dysmorphia

Authors :
Parès, Yves Jean Vincent
Laboratoire d'Informatique Médicale et Ingénierie des Connaissances en e-Santé (LIMICS)
Université Paris 13 (UP13)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Institut National de la Santé et de la Recherche Médicale (INSERM)
Université Pierre et Marie Curie - Paris VI
Marie-Christine Jaulent
Xavier Aimé
Institut National de la Santé et de la Recherche Médicale (INSERM)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Université Paris 13 (UP13)
STAR, ABES
Source :
Informatique et langage [cs.CL]. Université Pierre et Marie Curie-Paris VI, 2016. Français. ⟨NNT : 2016PA066568⟩
Publication Year :
2016
Publisher :
HAL CCSD, 2016.

Abstract

This thesis is set within the context of Accordys, a knowledge engineering project aiming at providing a case-based reasoning system for fetopathology, i.e. the medical domain studying rare diseases and dysmorphia of fetuses. The project is based on a corpus of french fetal exam reports. This material consists in raw text reports diplaying a very specific vocabulary (only partially formalized in french medical terminologies), a "note taking" style that makes difficult to use tools analysing the grammar in the text, and a layout and formatting that shows a latent common structuration (organisation in sections, sub-sections, observations). This thesis aims at testing the hypothesis that a uniformisation of the representation of cases that could exploit this arborescent structure by mapping it with a tree-shaped case model can support the constitution of a case base which preserves the information contained in original reports and the similarity measurement between two cases. Mapping a case with the model (instanciating the case model) is done through a Monte Carlo tree matching method. We compare this with similarity measurements obtained by representing our reports (both without further processing and after semantic enrichment through a semantic annotator) in a vector model.<br />Cette thèse se place dans le contexte d'Accordys, un projet d'ingénierie des connaissances qui vise à fournir un système de rapprochement de cas en fœtopathologie, qui est le domaine de l'étude des maladies rares et dysmorphies du fœtus. Ce projet se base sur un corpus de comptes rendus d'examens fœtaux. Ce matériel consiste en des comptes rendus en texte brut présentant un vocabulaire très spécifique (qui n'est que partiellement formalisé dans des terminologies médicales en français), des économies linguistiques (un style "prise de notes" très prononcé rendant difficile l'utilisation d'outils analysant la grammaire du texte) et une mise en forme matérielle exhibant une structuration commune latente (un découpage en sections, sous-sections, observations). Cette thèse vise à tester l'hypothèse qu'une uniformisation de la représentation des cas exploitant cette structure arborescente en la faisant correspondre à un modèle de cas (lui aussi arborescent) peut supporter la constitution d'une base de cas qui conserve les informations contenues dans les comptes rendus originaux et permette la mesure de similarité entre deux cas. La mise en correspondance entre cas et modèle (instanciation du modèle) est réalisée via un mapping d'arbres ayant pour base une méthode de Monte Carlo. Nous comparerons ceci avec des mesures de similarités obtenues en représentant nos comptes rendus (soit tels quels, soit enrichis sémantiquement grâce à un annotateur sémantique) dans un modèle vectoriel.

Details

Language :
French
Database :
OpenAIRE
Journal :
Informatique et langage [cs.CL]. Université Pierre et Marie Curie-Paris VI, 2016. Français. ⟨NNT : 2016PA066568⟩
Accession number :
edsair.dedup.wf.001..f175a05c7afabf7af8c1a48fdeb2a797