Back to Search Start Over

PepLine: A Software Pipeline for High-Throughput Direct Mapping of Tandem Mass Spectrometry Data on Genomic Sequences

Authors :
Jérôme Garin
Thierry Vermat
Marielle Vigouroux
Marianne Tardif
Romain Cahuzac
Christophe Bruley
Erwan Reguer
Yves Vandenbrouck
Myriam Ferro
Alain Viari
Estelle Nugues
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)
Laboratoire d'étude de la dynamique des protéomes (LEDyP)
Université Joseph Fourier - Grenoble 1 (UJF)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de la Santé et de la Recherche Médicale (INSERM)
John Innes Centre [Norwich]
Biotechnology and Biological Sciences Research Council (BBSRC)
Laboratoire de Biologie à Grande Échelle (BGE - UMR S1038)
Institut National de la Santé et de la Recherche Médicale (INSERM)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut de Recherche Interdisciplinaire de Grenoble (IRIG)
Direction de Recherche Fondamentale (CEA) (DRF (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Fondamentale (CEA) (DRF (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)
Equipe de recherche européenne en algorithmique et biologie formelle et expérimentale (ERABLE)
Inria Grenoble - Rhône-Alpes
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
Institut de Recherche Interdisciplinaire de Grenoble (IRIG)
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])
Source :
Journal of Proteome Research, Journal of Proteome Research, 2008, 7 (5), pp.1873-1883. ⟨10.1021/pr070415k⟩, Journal of Proteome Research, American Chemical Society, 2008, 7 (5), pp.1873-1883. ⟨10.1021/pr070415k⟩
Publication Year :
2008
Publisher :
HAL CCSD, 2008.

Abstract

PepLine is a fully automated software which maps MS/MS fragmentation spectra of trypsic peptides to genomic DNA sequences. The approach is based on Peptide Sequence Tags (PSTs) obtained from partial interpretation of QTOF MS/MS spectra (first module). PSTs are then mapped on the six-frame translations of genomic sequences (second module) giving hits. Hits are then clustered to detect potential coding regions (third module). Our work aimed at optimizing the algorithms of each component to allow the whole pipeline to proceed in a fully automated manner using raw nucleic acid sequences (i.e., genomes that have not been "reduced" to a database of ORFs or putative exons sequences). The whole pipeline was tested on controlled MS/MS spectra sets from standard proteins and from Arabidopsis thaliana envelope chloroplast samples. Our results demonstrate that PepLine competed with protein database searching softwares and was fast enough to potentially tackle large data sets and/or high size genomes. We also illustrate the potential of this approach for the detection of the intron/exon structure of genes.

Details

Language :
English
ISSN :
15353893 and 15353907
Database :
OpenAIRE
Journal :
Journal of Proteome Research, Journal of Proteome Research, 2008, 7 (5), pp.1873-1883. ⟨10.1021/pr070415k⟩, Journal of Proteome Research, American Chemical Society, 2008, 7 (5), pp.1873-1883. ⟨10.1021/pr070415k⟩
Accession number :
edsair.doi.dedup.....85f34b80802dac6845792564d6a1e27e