1. Computational pan-genomics : Status, promises and challenges
- Author
Lodewyk F. A. Wessels, Jan O. Korbel, Jasmijn A. Baaijens, Francesca Chiaromonte, Gunnar W. Klau, Kai Ye, Alexander Schönhuth, Francesca D. Ciccarelli, Tobias Marschall, Robin Cijvat, Matthias Schlesner, Adam M. Novak, Eleazar Eskin, Ashley D. Sanders, Sven Rahmann, Carl Shneider, Wigard P. Kloosterman, Knut Reinert, Eric-Wubbo Lameijer, Sandra Smit, Benedict Paten, Mohammed El-Kebir, Valentina Boeva, Evan E. Eichler, Cornelia M. van Duijn, Can Alkan, Jeroen de Ridder, Benjamin Langmead, Dick de Ridder, Jiayin Wang, David Porubsky, Fabio Vandin, Erwin Datema, Ben Raphael, Paul Kersey, Nadia Pisanti, Corinna Ernst, Klaasjan G. Ouwens, Y. Zhang, Thomas Abeel, Erik Garrison, Veli Mäkinen, Paul I.W. de Bakker, Victor Guryev, Siavash Sheikhizadeh, Manja Marz, Marcel Martin, Ole Schulz-Trieglaff, Pieter B. Neerincx, Rayan Chikhi, Eric Rivals, John C. Mu, Raoul J. P. Bonnal, Bas E. Dutilh, Paul Medvedev, Louis Dijkstra, Pierre Peterlongo, Ali Ghaffaari, Daniel Valenzuela, Epidemiology, Gastroenterology & Hepatology, Erasmus MC other, Alkan, Can, Saarland University [Saarbrücken], Max Planck Institute for Informatics [Saarbrücken], Karlsruhe Institute of Technology (KIT), Broad Institute of MIT and Harvard (BROAD INSTITUTE), Harvard Medical School [Boston] (HMS)-Massachusetts Institute of Technology (MIT)-Massachusetts General Hospital [Boston], Delft Bioinformatics Lab [Delft], Delft University of Technology (TU Delft), Computational Science Lab [Amsterdam], University of Amsterdam [Amsterdam] (UvA), Theoretical Biology & Bioinformatics [Utrecht], University Medical Center [Utrecht], Universidade Federal do Rio de Janeiro (UFRJ), European Bioinformatics Institute [Hinxton] (EMBL-EBI), EMBL Heidelberg, Section genetics [Utrecht], Center for Molecular medicine [Utrecht], University Medical Center [Utrecht]-University Medical Center [Utrecht], Helsinki Institute for Information Technology, Department of Computer Science [Helsinki], Falculty of Science [Helsinki], University of Helsinki-University of Helsinki, Howard Hughes Medical Institute [Santa Cruz] (HHMI), Center for Biomolecular Science & Engineering, European Research Institute for the Biology of Ageing [Groningen] (ERIBA), University Medical Center Groningen [Groningen] (UMCG), Institut de Biologie Computationnelle (IBC), Institut National de la Recherche Agronomique (INRA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS), Méthodes et Algorithmes pour la Bioinformatique (MAB), Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM), Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS), Department of Computer Engineering (Bilkent-CS), Bilkent, Life Sciences [Amsterdam] (MAC4), Centrum Wiskunde & Informatica (CWI), Institut Cochin (IC UM3 (UMR 8104 / U1016)), Université Paris Descartes - Paris 5 (UPD5)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS), PSL Research University (PSL), Centre de Bioinformatique (CBIO), MINES ParisTech - École nationale supérieure des mines de Paris-PSL Research University (PSL), Cancer et génôme: Bioinformatique, biostatistiques et épidémiologie d'un système complexe, MINES ParisTech - École nationale supérieure des mines de Paris-Institut Curie-Institut National de la Santé et de la Recherche Médicale (INSERM), Integrative Biology Program [Milano], Istituto Nazionale Genetica Molecolare [Milano] (INGM), Department of Statistics [Pennsylvania], Pennsylvania State University (Penn State), Penn State System-Penn State System, Bioinformatics and Sequence Analysis (BONSAI), Université de Lille, Sciences et Technologies-Inria Lille - Nord Europe, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189 (CRIStAL), Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Ecole Centrale de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Ecole Centrale de Lille-Centre National de la Recherche Scientifique (CNRS), Centre National de la Recherche Scientifique (CNRS), Monet DB Solutions [Amsterdam], KeyGene [Wageningen], Department of Epidemiology [Rotterdam], Erasmus University Medical Center [Rotterdam] (Erasmus MC), Howard Hughes Medical Institute [Berkeley], University of California [Berkeley], University of California-University of California, Genome Informatics [Duisburg], Universität Duisburg-Essen [Essen], Departement of human genetics [Los Angeles], Computer Science Department [Los Angeles] (UCLA), University of California [Los Angeles] (UCLA), University of California-University of California-University of California [Los Angeles] (UCLA), The Wellcome Trust Sanger Institute [Cambridge], Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale (ERABLE), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Universiteit Leiden [Leiden], Department of Computer Science [Baltimore], Johns Hopkins University (JHU), Centre de Physique des Particules de Marseille (CPPM), Centre National de la Recherche Scientifique (CNRS)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Aix Marseille Université (AMU), University of Pennsylvania [Philadelphia], China Agricultural University (CAU), University of Groningen [Groningen], Department of Biological Psychology [Amsterdam], Vrije Universiteit Amsterdam [Amsterdam] (VU), Scalable, Optimized and Parallel Algorithms for Genomics (GenScale), Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-GESTION DES DONNÉES ET DE LA CONNAISSANCE (IRISA-D7), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes 1 (UR1), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Dipartimento di Informatica [Pisa] (DI), University of Pisa - Università di Pisa, Faculty of Computer Science [Dortmund], Technische Universität Dortmund [Dortmund] (TU), Service de Pneumologie A [Paris], AP-HP - Hôpital Bichat - Claude Bernard [Paris], Department of Mathematics and Computer Science (Freie Universität Berlin), Freie Universität Berlin, Wageningen University and Research Centre [Wageningen] (WUR), Catholic University of Leuven - Katholieke Universiteit Leuven (KU Leuven), Division of Theoretical Bioinformatics [Heidelberg], German Cancer Research Center - Deutsches Krebsforschungszentrum [Heidelberg] (DKFZ), Illumina Cambridge, Illumina, Terry Fox Laboratory, BC Cancer Agency (BCCRC)-British Columbia Cancer Agency Research Centre, Bioinformatics Group [Wageningen], Leiden Observatory [Leiden], Regeneron Pharmaceuticals [Tarrytown], Shaanxi University of Science and Technology, Netherlands Cancer Institute (NKI), Antoni van Leeuwenhoek Hospital, Universita degli Studi di Padova, The Netherlands Organization for Scientific Research (NWO) Vidi (639.072.309 to A.S., 864.14.004 to B.E.D.), CAPES/BRASIL (to B.E.D.), the Academy of Finland (284598 [CoECGR] to V.M. and D.V.), the Russian Scientific Foundation (14–11–00826 to L.D.), Institut de Biologie Computationnelle (ANR-11-BINF- 0002 to E.R.), and the French Colib’read project (ANR–12– BS02–0008 to E.R.). NSFC 31671372 (to K. Y.), the Dutch Graduate School for Experimental Plant Sciences (054EPS15 to S.S.), the EMGO Institute for Health and Care Research (EMGO+) to K.O., the National Human Genome Research Institute (1U54HG007990 [BD2K] to B.P. and A.M.N., 5U41HG007234 [GENCODE] to B.P.), the W. M. Keck Foundation (DT06172015 to B.P. and A.M.N.), the Simons Foundation (SFLIFE# 351901 to B.P. and A.M.N.), the ARCS Foundation (2014–15 ARCS fellowship to A.M.N.), Edward Schulak (Edward Schulak Fellowship in Genomics to A.M.N.), ANR-11-BINF-0002,IBC,Institut de Biologie Computationnelle de Montpellier(2011), ANR-12-BS02-0008,Colib'read,Méthodes d'extraction d'information biologique dans les données HTS non assemblées(2012), Karlsruhe Institute of Technology ( KIT ), Broad Institute of MIT and Harvard ( BROAD INSTITUTE ), Harvard Medical School [Boston] ( HMS ) -Massachusetts General Hospital [Boston] ( MGH ) -Massachusetts Institute of Technology ( MIT ), Delft University of Technology ( TU Delft ), University of Amsterdam [Amsterdam] ( UvA ), Universidade Federal do Rio de Janeiro ( UFRJ ), European Bioinformatics Institute [Hinxton] ( EMBL-EBI ), European Molecular Biology Laboratory [Hinxton], Department of Computer Science, Howard Hughes Medical Institute [Santa Cruz] ( HHMI ), European Research Institute for the Biology of Ageing [Groningen] ( ERIBA ), University Medical Center Groningen [Groningen] ( UMCG ), Institut de Biologie Computationnelle ( IBC ), Centre de Coopération Internationale en Recherche Agronomique pour le Développement ( CIRAD ) -Institut National de la Recherche Agronomique ( INRA ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Université de Montpellier ( UM ) -Centre National de la Recherche Scientifique ( CNRS ), Méthodes et Algorithmes pour la Bioinformatique ( MAB ), Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier ( LIRMM ), Université de Montpellier ( UM ) -Centre National de la Recherche Scientifique ( CNRS ) -Université de Montpellier ( UM ) -Centre National de la Recherche Scientifique ( CNRS ), Department of Computer Engineering ( Bilkent-CS ), Life Sciences [Amsterdam] ( MAC4 ), Centrum Wiskunde & Informatica ( CWI ), Institut Cochin ( UM3 (UMR 8104 / U1016) ), Université Paris Descartes - Paris 5 ( UPD5 ) -Institut National de la Santé et de la Recherche Médicale ( INSERM ) -Centre National de la Recherche Scientifique ( CNRS ), PSL Research University ( PSL ), Centre de Bioinformatique ( CBIO ), MINES ParisTech - École nationale supérieure des mines de Paris-PSL Research University ( PSL ), MINES ParisTech - École nationale supérieure des mines de Paris-Institut National de la Santé et de la Recherche Médicale ( INSERM ) -INSTITUT CURIE, Istituto Nazionale Genetica Molecolare [Milano] ( INGM ), PennState University [Pennsylvania] ( PSU ), Bioinformatics and Sequence Analysis ( BONSAI ), Institut National de Recherche en Informatique et en Automatique ( Inria ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL) - UMR 9189 ( CRIStAL ), Ecole Centrale de Lille-Institut National de Recherche en Informatique et en Automatique ( Inria ) -Institut Mines-Télécom [Paris]-Université de Lille-Centre National de la Recherche Scientifique ( CNRS ) -Ecole Centrale de Lille-Institut Mines-Télécom [Paris]-Université de Lille-Centre National de la Recherche Scientifique ( CNRS ) -Centre National de la Recherche Scientifique ( CNRS ), Centre National de la Recherche Scientifique ( CNRS ), Erasmus University Medical Center [Rotterdam], Computer Science Department [Los Angeles] ( UCLA ), University of California at Los Angeles [Los Angeles] ( UCLA ) -University of California at Los Angeles [Los Angeles] ( UCLA ), Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale ( ERABLE ), Institut National de Recherche en Informatique et en Automatique ( Inria ) -Institut National de Recherche en Informatique et en Automatique ( Inria ), Johns Hopkins University ( JHU ), Centre de Physique des Particules de Marseille ( CPPM ), Centre National de la Recherche Scientifique ( CNRS ) -Institut National de Physique Nucléaire et de Physique des Particules du CNRS ( IN2P3 ) -Aix Marseille Université ( AMU ), China Agricultural University ( CAU ), Vrije Universiteit Amsterdam [Amsterdam] ( VU ), Scalable, Optimized and Parallel Algorithms for Genomics ( GenScale ), Institut National de Recherche en Informatique et en Automatique ( Inria ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -GESTION DES DONNÉES ET DE LA CONNAISSANCE ( IRISA_D7 ), Institut de Recherche en Informatique et Systèmes Aléatoires ( IRISA ), Université de Rennes 1 ( UR1 ), Université de Rennes ( UNIV-RENNES ) -Université de Rennes ( UNIV-RENNES ) -Institut National des Sciences Appliquées - Rennes ( INSA Rennes ) -Université de Bretagne Sud ( UBS ) -École normale supérieure - Rennes ( ENS Rennes ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -CentraleSupélec-Centre National de la Recherche Scientifique ( CNRS ) -IMT Atlantique Bretagne-Pays de la Loire ( IMT Atlantique ) -Université de Rennes 1 ( UR1 ), Université de Rennes ( UNIV-RENNES ) -Université de Rennes ( UNIV-RENNES ) -Institut National des Sciences Appliquées - Rennes ( INSA Rennes ) -Université de Bretagne Sud ( UBS ) -École normale supérieure - Rennes ( ENS Rennes ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -CentraleSupélec-Centre National de la Recherche Scientifique ( CNRS ) -IMT Atlantique Bretagne-Pays de la Loire ( IMT Atlantique ) -Institut de Recherche en Informatique et Systèmes Aléatoires ( IRISA ), Université de Rennes ( UNIV-RENNES ) -Université de Rennes ( UNIV-RENNES ) -Institut National des Sciences Appliquées - Rennes ( INSA Rennes ) -Université de Bretagne Sud ( UBS ) -École normale supérieure - Rennes ( ENS Rennes ) -CentraleSupélec-Centre National de la Recherche Scientifique ( CNRS ) -IMT Atlantique Bretagne-Pays de la Loire ( IMT Atlantique ), Dipartimento di Informatica [Pisa] ( DI ), University of Pisa [Pisa], Technische Universität Dortmund [Dortmund] ( TU ), Department of Mathematics and Computer Science ( Freie Universität Berlin ), Freie Universität Berlin [Berlin], Wageningen University and Research Centre [Wageningen] ( WUR ), K.U.Leuven, German Cancer Research Center [Heidelberg] ( DKFZ ), Helmholtz-Gemeinschaft-Helmholtz-Gemeinschaft, BC Cancer Agency ( BCCRC ) -British Columbia Cancer Agency Research Centre, Netherlands Cancer Institute ( NKI ), ANR-11-BINF-0002,IBC,Institut de Biologie Computationnelle de Montpellier ( 2011 ), ANR-12-BS02-0008,Colib'read,Méthodes d'extraction d'information biologique dans les données HTS non assemblées ( 2012 ), Helsinki Institute for Information Technology (HIIT), Helsingin yliopisto = Helsingfors universitet = University of Helsinki-Aalto University, Helsingin yliopisto = Helsingfors universitet = University of Helsinki-Helsingin yliopisto = Helsingfors universitet = University of Helsinki, University of California [Santa Cruz] (UC Santa Cruz), University of California (UC), Bilkent University [Ankara], Université Paris sciences et lettres (PSL), Mines Paris - PSL (École nationale supérieure des mines de Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL), Cancer et génome: Bioinformatique, biostatistiques et épidémiologie d'un système complexe, Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Institut Curie [Paris]-Institut National de la Santé et de la Recherche Médicale (INSERM), Department of Statistics [PennState], Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL), Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Centre National de la Recherche Scientifique (CNRS), University of Washington [Seattle], Howard Hughes Medical Institute (HHMI), Universität Duisburg-Essen = University of Duisburg-Essen [Essen], University of California (UC)-University of California (UC)-University of California [Los Angeles] (UCLA), University of California (UC)-University of California (UC), Universiteit Leiden, Aix Marseille Université (AMU)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS), University of Pennsylvania, Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique), Assistance publique - Hôpitaux de Paris (AP-HP) (AP-HP)-Assistance publique - Hôpitaux de Paris (AP-HP) (AP-HP), Department of Mathematics and Computer Science, Wageningen University and Research [Wageningen] (WUR), Università degli Studi di Padova = University of Padua (Unipd), ANR-11-BINF-0002,IBC,Institut de biologie Computationnelle(2011), Aalto University-University of Helsinki, University of California [Santa Cruz] (UCSC), University of California, Université de Montpellier (UM)-Institut National de la Recherche Agronomique (INRA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS), Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM), Centre National de la Recherche Scientifique (CNRS)-Université Paris Descartes - Paris 5 (UPD5)-Institut National de la Santé et de la Recherche Médicale (INSERM), MINES ParisTech - École nationale supérieure des mines de Paris, Centre National de la Recherche Scientifique (CNRS)-Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL), Université de Lille-Centrale Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Centrale Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille, Sciences et Technologies-Inria Lille - Nord Europe, Université de Bretagne Sud (UBS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-CentraleSupélec-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Bretagne Sud (UBS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), and Groningen Research Institute for Asthma and COPD (GRIAC)
- Subjects
0301 basic medicine ,Data structures ,Computer science ,Medizin ,02 engineering and technology ,computer.software_genre ,Genome ,Computational and Statistical Genetics ,data structures ,haplotypes ,pan-genome ,read mapping ,sequence graph ,Tumours of the digestive tract Radboud Institute for Molecular Life Sciences [Radboudumc 14] ,0303 health sciences ,education.field_of_study ,Point (typography) ,Genomics ,Papers ,Data mining ,Sequence graph ,Computational problem ,Construct (philosophy) ,Algorithms ,Human ,Information Systems ,Bioinformatics ,0206 medical engineering ,Population ,Pan-genome ,03 medical and health sciences ,[ INFO.INFO-BI ] Computer Science [cs]/Bioinformatics [q-bio.QM] ,Bioinformatica ,Humans ,Haplotypes ,Read mapping ,Computational Biology ,Genome, Human ,Software ,Molecular Biology ,education ,Representation (mathematics) ,030304 developmental biology ,Computational genomics ,Data structure ,Data science ,Human genetics ,030104 developmental biology ,Paradigm shift ,ddc:004 ,[INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM] ,EPS ,computer ,020602 bioinformatics - Abstract
Many disciplines, from human genetics and oncology to plant breeding, microbiology and virology, commonly face the challenge of analyzing rapidly increasing numbers of genomes. In case ofHomo sapiens, the number of sequenced genomes will approach hundreds of thousands in the next few years. Simply scaling up established bioinformatics pipelines will not be sufficient for leveraging the full potential of such rich genomic datasets. Instead, novel, qualitatively different computational methods and paradigms are needed. We will witness the rapid extension ofcomputational pan-genomics, a new sub-area of research in computational biology. In this paper, we generalize existing definitions and understand apan-genomeas any collection of genomic sequences to be analyzed jointly or to be used as a reference. We examine already available approaches to construct and use pan-genomes, discuss the potential benefits of future technologies and methodologies, and review open challenges from the vantage point of the above-mentioned biological disciplines. As a prominent example for a computational paradigm shift, we particularly highlight the transition from the representation of reference genomes as strings to representations as graphs. We outline how this and other challenges from different application domains translate into common computational problems, point out relevant bioinformatics techniques and identify open problems in computer science. With this review, we aim to increase awareness that a joint approach to computational pan-genomics can help address many of the problems currently faced in various domains.
- Published
- 2018
- Full Text
- View/download PDF