Back to Search Start Over

FORUM: Building a Knowledge Graph from public databases and scientific literature to extract associations between chemicals and diseases

Authors :
Maxime Delmas
William Garrier
Franck Giacomoni
Fabien Jourdan
Clément Frainay
Nils Paulhe
Florence Vinson
Yoann Pitarch
Olivier Filangi
Christophe Duperier
Paul-Emeric Saunier
Métabolisme et Xénobiotiques (ToxAlim-MeX)
ToxAlim (ToxAlim)
Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole Nationale Vétérinaire de Toulouse (ENVT)
Institut National Polytechnique (Toulouse) (Toulouse INP)
Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université de Toulouse (UT)-Ecole d'Ingénieurs de Purpan (INP - PURPAN)
Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Institut de Génétique, Environnement et Protection des Plantes (IGEPP)
Université de Rennes (UR)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-INSTITUT AGRO Agrocampus Ouest
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)
Unité de Nutrition Humaine (UNH)
Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Clermont Auvergne (UCA)
Institut Supérieur d'Informatique, de Modélisation et de leurs Applications (ISIMA)
Université Clermont Auvergne [2017-2020] (UCA [2017-2020])
Recherche d’Information et Synthèse d’Information (IRIT-IRIS)
Institut de recherche en informatique de Toulouse (IRIT)
Université Toulouse Capitole (UT Capitole)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université de Toulouse (UT)-Toulouse Mind & Brain Institut (TMBI)
Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Université Toulouse Capitole (UT Capitole)
Université de Toulouse (UT)
INRA SDN (Schema Directeur du Numerique)
ANR-11-INBS-0010,METABOHUB,Développement d'une infrastructure française distribuée pour la métabolomique dédiée à l'innovation(2011)
European Project: 825489,H2020,GOLIATH(2019)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Ecole Nationale Vétérinaire de Toulouse (ENVT)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université Fédérale Toulouse Midi-Pyrénées-Ecole d'Ingénieurs de Purpan (INPT - EI Purpan)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Université de Rennes 1 (UR1)
Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-AGROCAMPUS OUEST
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées
Source :
Bioinformatics, Bioinformatics, 2021, 37 (21), pp.3896-3904. ⟨10.1093/bioinformatics/btab627⟩, Bioinformatics, Oxford University Press (OUP), 2021, ⟨10.1093/bioinformatics/btab627⟩
Publication Year :
2021
Publisher :
HAL CCSD, 2021.

Abstract

Metabolomics studies aim at reporting a metabolic signature (list of metabolites) related to a particular experimental condition. These signatures are instrumental in the identification of biomarkers or classification of individuals, however their biological and physiological interpretation remains a challenge. Overcoming this challenge is critical when aiming to associate metabolic signatures with potential pathological outcomes. To support this task, we introduce FORUM: a Knowledge Graph (KG) providing a semantic representation of relations between chemicals and biomedical concepts, built from a federation of life science databases and scientific literature repositories. An important number of scientific articles discuss relations between chemical compounds and biomedical concepts in various contexts, from biomarkers to therapeutic uses. The extraction of these statements and their interconnection in a graph structure can thus allow us to identify and explore relations strongly supported in the scientific literature.The use of a Semantic Web framework on biological data allows us to apply ontological based reasoning to infer new relations between entities. We show that these new relations provide different levels of abstraction and could open the path to new hypotheses. We estimate the statistical relevance of each extracted relation, explicit or inferred, using an enrichment analysis, and instantiate them as new knowledge in the KG to support results interpretation/further inquiries. Beyond this result, FORUM can also provide insights into complex biological questions and the extracted information could then be used for further developments.Containing more than 8 billion triples and providing more than 8 million relations, FORUM leverages the increasing availability of linked datasets in life science and is built in agreement with FAIR principles. A web interface to browse and download the extracted relations, as well as a SPARQL endpoint to directly probe the whole FORUM knowledge graph, are available at https://forum-webapp.semantic-metabolomics.fr. The code needed to reproduce the triplestore is available at https://github.com/eMetaboHUB/Forum-DiseasesChem.

Details

Language :
English
ISSN :
13674803 and 13674811
Database :
OpenAIRE
Journal :
Bioinformatics, Bioinformatics, 2021, 37 (21), pp.3896-3904. ⟨10.1093/bioinformatics/btab627⟩, Bioinformatics, Oxford University Press (OUP), 2021, ⟨10.1093/bioinformatics/btab627⟩
Accession number :
edsair.doi.dedup.....408bbdbb2d0de4ce81db991cc3f461cf