1. Sparse factor model for co-expression networks with an application using prior biological knowledge
- Author
-
Magalie Houée-Bigot, Yuna Blum, David Causeur, University of California at Los Angeles [Los Angeles] ( UCLA ), Laboratoire de Mathématiques Appliquées Agrocampus ( LMA2 ), AGROCAMPUS OUEST, Institut de Recherche Mathématique de Rennes ( IRMAR ), Université de Rennes 1 ( UR1 ), Université de Rennes ( UNIV-RENNES ) -Université de Rennes ( UNIV-RENNES ) -AGROCAMPUS OUEST-École normale supérieure - Rennes ( ENS Rennes ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Institut National des Sciences Appliquées ( INSA ) -Université de Rennes 2 ( UR2 ), Université de Rennes ( UNIV-RENNES ) -Centre National de la Recherche Scientifique ( CNRS ), ANR-11-BSV7-0004,FatInteger,Recherche de régulateurs clefs de la plasticité lipidique chez deux espèces monogastriques majeures (porc et poule) en combinant des données haut débit et des approches statistique, bioinformatique et phylogénique. ( 2011 ), University of California [Los Angeles] (UCLA), University of California, Laboratoire de Mathématiques Appliquées Agrocampus (LMA2), Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Institut de Recherche Mathématique de Rennes (IRMAR), Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Université de Rennes 2 (UR2), Université de Rennes (UNIV-RENNES)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA), FatInteger ANR-11-BSV7-0004, Agence Nationale de la Recherche, ANR-11-BSV7-0004,FatInteger,Recherche de régulateurs clefs de la plasticité lipidique chez deux espèces monogastriques majeures (porc et poule) en combinant des données haut débit et des approches statistique, bioinformatique et phylogénique.(2011), University of California (UC), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), and Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-École normale supérieure - Rennes (ENS Rennes)-Université de Rennes 2 (UR2)-Centre National de la Recherche Scientifique (CNRS)-INSTITUT AGRO Agrocampus Ouest
- Subjects
Statistics and Probability ,obesity ,Computer science ,Systems biology ,0206 medical engineering ,Gene regulatory network ,Inference ,02 engineering and technology ,computer.software_genre ,Machine learning ,algorithms ,01 natural sciences ,coordinate descent ,010104 statistics & probability ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,framework ,Expectation–maximization algorithm ,gene-espression ,Genetics ,Animals ,Computer Simulation ,Gene Regulatory Networks ,[ MATH.MATH-ST ] Mathematics [math]/Statistics [math.ST] ,0101 mathematics ,KEGG ,Cluster analysis ,Molecular Biology ,ComputingMilieux_MISCELLANEOUS ,Factor analysis ,Adiposity ,Models, Genetic ,business.industry ,Gene Expression Profiling ,Systems Biology ,modules ,dependence ,package ,Expression (mathematics) ,Computational Mathematics ,Liver ,maximum-likelihood ,Artificial intelligence ,Data mining ,heterogeneity ,business ,computer ,Chickens ,020602 bioinformatics - Abstract
Inference on gene regulatory networks from high-throughput expression data turns out to be one of the main current challenges in systems biology. Such networks can be very insightful for the deep understanding of interactions between genes. Because genes-gene interactions is often viewed as joint contributions to known biological mechanisms, inference on the dependence among gene expressions is expected to be consistent to some extent with the functional characterization of genes which can be derived from ontologies (GO, KEGG, …). The present paper introduces a sparse factor model as a general framework either to account for a prior knowledge on joint contributions of modules of genes to latent biological processes or to infer on the corresponding co-expression network. We propose an ℓ 1 – regularized EM algorithm to fit a sparse factor model for correlation. We demonstrate how it helps extracting modules of genes and more generally improves the gene clustering performance. The method is compared to alternative estimation procedures for sparse factor models of relevance networks in a simulation study. The integration of a biological knowledge based on the gene ontology (GO) is also illustrated on a liver expression data generated to understand adiposity variability in chicken.
- Published
- 2016