Back to Search Start Over

Ortho-proteogenomics: Multiple proteomes investigation through orthology and a new MS-based protocol

Authors :
Christine Carapito
Christine Schaeffer
Jean-Marc Reyrat
Alain Van Dorsselaer
Emmanuel Perrodou
Caroline Deshayes
Sebastien Gallien
Odile Lecompte
Olivier Poch
Institut Pluridisciplinaire Hubert Curien (IPHC)
Université Louis Pasteur - Strasbourg I-Centre National de la Recherche Scientifique (CNRS)
Institut de génétique et biologie moléculaire et cellulaire (IGBMC)
Centre National de la Recherche Scientifique (CNRS)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Université Louis Pasteur - Strasbourg I
Laboratoire de Spectrométrie de Masse BioOrganique [Strasbourg] (LSMBO)
Département Sciences Analytiques et Interactions Ioniques et Biomoléculaires (DSA-IPHC)
Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Institut Pluridisciplinaire Hubert Curien (IPHC)
Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Centre National de la Recherche Scientifique (CNRS)
Pathogénie des infections systémiques (UMR_S 570)
Université Paris Descartes - Paris 5 (UPD5)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)
Université Louis Pasteur - Strasbourg I-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)
Peney, Maité
Institut Pluridisciplinaire Hubert Curien ( IPHC )
Université Louis Pasteur - Strasbourg I-Centre National de la Recherche Scientifique ( CNRS )
Institut de génétique et biologie moléculaire et cellulaire ( IGBMC )
Université Louis Pasteur - Strasbourg I-Institut National de la Santé et de la Recherche Médicale ( INSERM ) -Centre National de la Recherche Scientifique ( CNRS )
Laboratoire de Spectrométrie de masse Bio-organique
UMR CNRS-ULP
Pathogénie des infections systémiques ( UMR_S 570 )
Université Paris Descartes - Paris 5 ( UPD5 ) -Institut National de la Santé et de la Recherche Médicale ( INSERM ) -Centre National de la Recherche Scientifique ( CNRS )
Source :
Genome Research, Genome Research, Cold Spring Harbor Laboratory Press, 2009, 19 (1), pp.128-35. ⟨10.1101/gr.081901.108⟩, Genome Research, 2009, 19 (1), pp.128-35. ⟨10.1101/gr.081901.108⟩, Genome Research, Cold Spring Harbor Laboratory Press, 2009, 19 (1), pp.128-35. 〈10.1101/gr.081901.108〉
Publication Year :
2008
Publisher :
Cold Spring Harbor Laboratory, 2008.

Abstract

The progress in sequencing technologies irrigates biology with an ever-increasing number of genome sequences. In most cases, the gene repertoire is predicted in silico and conceptually translated into proteins. As recently highlighted, the predicted genes exhibit frequent errors, particularly in start codons, with a serious impact on subsequent biological studies. A new “ortho-proteogenomic” approach is presented here for the annotation refinement of multiple genomes at once. It combines comparative genomics with an original proteomic protocol that allows the characterization of both N-terminal and internal peptides in a single experiment. This strategy was applied to the Mycobacterium genus with Mycobacterium smegmatis as the reference, and identified 946 distinct proteins, including 443 characterized N termini. These experimental data allowed the correction of 19% of the characterized start codons, the identification of 29 proteins missed during the annotation process, and the curation, thanks to comparative genomics, of 4328 sequences of 16 other Mycobacterium proteomes.

Details

ISSN :
10889051 and 15495469
Volume :
19
Database :
OpenAIRE
Journal :
Genome Research
Accession number :
edsair.doi.dedup.....deccb835dd2973e2567249e02fd9273a