Back to Search
Start Over
Crosslinking and mass spectrometry for the study of biomolecular structures on the systems level
- Publication Year :
- 2022
- Publisher :
- Technische Universität Berlin, 2022.
-
Abstract
- Proteins play a crucial role for the functioning of the cell, may it be by conveying structural integrity, being involved with molecular transport and signal transduction, or by catalysing metabolic reactions. The cell’s proteome is modular, so while many proteins carry out their functions acting either on their own, many do so as part of higher-order complexes. Since a protein’s function is tightly coupled to its individual molecular structure, by studying protein structures the mechanisms behind their function can be understood. A tool to assess protein structure is crosslinking and mass spectrometry (CLMS) in which chemical crosslinks are first introduced into a protein, and these crosslinks are then detected by chromatography-coupled mass spectrometry. Here, the observed crosslinks provide information on molecular distance relationships within the structures of proteins and their complexes which helps to describe these. A main motivation of the work presented in this thesis was to develop the CLMS approach to investigate more complex biological entities, i.e., proteome-wide studies focussing on protein-protein interactions in their native cellular environment. Some pioneering studies had attempted this in the past but their output remained rather limited in comparison to analyses of purified protein complexes. Major challenges needed to be overcome in the detection and identification of crosslinked peptides to make this conceptual leap. These challenges are mostly of technical nature and include: (1) the low abundance of crosslinked peptide analytes within a sample spanning a wide dynamic range and with a large underlying chemical heterogeneity, (2) the enormous combinatorial complexity from considering all theoretically possible peptide pairs of a crosslinked proteome during the crosslink search, and (3) the lack of consensus over reliable error control procedure for detecting protein-protein interactions in experiments of such scale. In this thesis, I tackle each of these challenges. I demonstrate how leveraging liquid- and gas-phase fractionation and/or enrichment of crosslinks, respectively, addresses methodological hurdles related to the high sample heterogeneity and its wide dynamic range, as well as to the combinatorial complexity encountered in proteome-wide CLMS. First, addressing the low abundance of crosslinked peptides, I show the effective combination of size-exclusion-based peptide pre-fractionation with a differential ion mobility separation dimension coupled in between reversed-phase liquid chromatography and the mass spectrometer. The gains from following this approach are shown for samples of moderate up to cellular complexity. Second, to reduce crosslinked peptide identification ambiguity, I demonstrate how the analyte retention behaviour during multidimensional fractionation involving two modes of offline-ion-exchange plus online-reversed-phase chromatography can be leveraged via deep learning to complement mass spectrometric information, leading to an increase in crosslink identification yields at constant confidence. Third, by using protein co-elution profiling as an independent benchmark to existing error control procedures, I show how error rates can be reliably estimated for protein-protein interaction studies by CLMS. In this study, many known protein interactions in the model organism Escherichia coli could be confirmed while others could extend existing knowledge on essential protein complexes. To this end, I verified the interaction between the RNA polymerase and the uncharacterized protein YacL by affinity-purification and mass spectrometry and further confined YacL’s interaction site on RNA polymerase by means of photo-crosslinking. The contributions towards proteome-wide CLMS presented in this thesis on aspects of sample separation - on the protein- and the peptide-level - and efficient use of information derived from it, as well as the establishment of an approach to reliably control for error rates on protein-protein interaction-level, represent important steps towards unlocking the full potential of CLMS for high-confidence proteome-wide studies at protein residue-resolution.<br />Proteine spielen eine zentrale Rolle für das Funktionieren der Zelle, beispielsweise durch das Vermitteln struktureller Integrität, während molekularer Transportprozesse und Signalkaskaden oder bei der Katalyse metabolischer Reaktionen. Die Gesamtheit aller Proteine einer Zelle - das Proteom - ist modular organisiert, sodass zwar einige Proteine unabhängig von Anderen agieren können, viele andere aber nur eingebunden in höher geordneten Komplexen funktionieren. Da die Struktur eines Proteins in direktem Zusammenhang mit dessen Funktion steht, ermöglicht das Erforschen von Proteinstrukturen deren Funktion mechanistisch zu verstehen. Ein Ansatz Proteinstrukturen zu untersuchen stellt die Kombination aus Quervernetzung und Massenspektrometrie (CLMS) dar. Hierbei werden zuerst chemische Quervernetzungen (crosslinks) in ein Protein eingeführt, welche anschließend per Flüssigchromatographiegekoppelter Massenspektrometrie detektiert werden. Die so gefundenen crosslinks liefern Information zu molekularen Distanzbeziehungen innerhalb einer Proteinstruktur bzw. zwischen den Proteinen von Proteinkomplexen mit deren Hilfe ebendiese Strukturen und Interaktionen beschrieben und modelliert werden können. Die wesentliche Motivation für die in dieser Dissertation enthaltenen Arbeiten war es den CLMS Forschungsansatz für die Untersuchung komplexerer biologischer Systeme, wie beispielsweise des gesamten zellulären Proteoms, weiterzuentwickeln, um so Protein-Protein-Interaktionen in deren nativer Umgebung erforschen zu können. Frühere Forschungsanstrengungen widmeten sich zwar bereits diesem Versuch, ergaben aber vergleichsweise wenig neue Erkenntnisse. Große analytische Herausforderungen in Detektion und Identifikation quervernetzter Peptide müssen zuerst für diesen konzeptionellen Sprung überwunden werden. Diese Herausforderungen sind größtenteils technischer Natur und umfassen: (1) die niedrige Häufigkeit quervernetzter Peptide in Proben mit großem Dynamikbereich und hoher chemischer Heterogenität, (2) die enorme kombinatorische Komplexität der Datenbanksuche, resultierend aus der paarweisen Kombination aller theoretisch möglichen Peptide eines quervernetzten Proteoms und (3) das Fehlen eines Konsenses über ein verlässliches Verfahren zur Fehlerkontrolle in proteomweiten Protein-Protein-Interaktionsstudien (PPI-Studien). In dieser Dissertation widme ich mich der Bewältigung jeder dieser Herausforderungen. Ich zeige, wie die Verwendung von Flüssig- und Gasphasen-Frakionierung und -Anreicherung von quervernetzten Peptiden dazu genutzt werden kann, um die oben genannten methodischen Hürden in CLMS-basierten proteom-weiten PPI-Studien anzugehen. In der ersten Arbeit liegt der Fokus auf der Adressierung der niedrigen Häufigkeit quervernetzter Peptide. Hier zeige ich die effiziente Kombination zweier Anreicherungsverfahren quernetzter Peptide: die vorgeschaltete Größenausschluss-Chromatographie und differentielle Ionenmobilitätsspektrometrie, gekoppelt zwischen Umkehrphasen-Flüssigchromatograph und Massenspektrometer. Der Gewinn an crosslink-Identifikationen durch Verwendung dieses Verfahrens wird anhand von Proben moderater bis hin zu zellulärer Komplexität demonstriert. Die zweite Arbeit widmet sich der Reduktion von Ambiguität bei der Identifikation quervernetzter Peptide. Hier nutze ich multidimensionale Fraktionierung, bestehend aus zwei komplementären vorgeschalteten Ionenaustausch- und der Massenspektrometrie-gekoppelten UmkehrphasenChromatographie für die Trennung einer komplexen Probe, abgeleitet vom quervernetzten hochmolekularen Proteom von Escherichia coli. Die Ergänzung der massenspektrometrischen Information um das Retentionsverhalten quervernetzter Peptide aus diesem Vorgehen mittels maschinellen Lernens führt zur verbesserten Identifikation von crosslinks. Dies ermöglicht letztlich mehr Quervernetzungen bei konstanter statistischer Konfidenz in einem CLMSDatensatz identifizieren zu können. Die dritte Arbeit dieser Thesis zielt darauf ab, ein verlässliches Verfahren zur Fehlerkontrolle von CLMS-basierten PPI-Studien zu etablieren. Hierbei bediene ich mich des SEC-MS Verfahrens (Größenausschlusschromatographie komplexer Proteinproben unter nativen Bedingungen gefolgt von massenspektrometrischer Proteinidentifikation in den erhaltenen Fraktionen), in dem das Co-Elutionsverhalten von Proteinen und deren Komplexe während nativer Fraktionierung per Größenausschluss-Chromatographie untersucht wird. Diese Methodik gewährt einen unabhängigen Vergleichspunkt zu den PPIs, welche aus dem CLMS Ansatz unter Verwendung verschiedener bestehender Fehlerkontrollverfahren resultieren. In dieser Studie konnte ich viele bereits bekannte Proteininteraktionen im Modellorganismus Escherichia coli bestätigen und bestehendes Wissen essenzieller Proteinkomplexe erweitern. Weiterhin konnte ich die Interaktion zwischen RNA-Polymerase und dem nicht charakterisierten Protein YacL mittels Affinitätsbasierter Reinigung und Massenspektrometrie bekräftigen. Durch zusätzliches Photo-Crosslinking und Massenspektrometrie konnte ich schließlich den Interaktionsbereich zwischen YacL und RNA-Polymerase noch weiter räumlich eingrenzen. Die in dieser Dissertation präsentierten Beiträge zu proteom-weiten CLMS Studien umfassen Aspekte der Probenaufbereitung auf Protein- und Peptid-Ebene, sowie die effiziente Verwendung der daraus resultierenden Information, als auch die Etablierung eines Verfahrens zur verlässlichen Fehlerkontrolle auf Protein-Protein-Interaktions-Level. Diese Erkenntnisse werden zukünftig dabei helfen, das volle Potenzial der chemischen Quervernetzung und Massenspektrometrie-Methodik für konfidente proteom-weite PPI-Studien mit AminosäureAuflösung auszuschöpfen.
Details
- Language :
- English
- Database :
- OpenAIRE
- Accession number :
- edsair.doi...........d7f6883a9bd1562a5a5bcfa2c9fef003
- Full Text :
- https://doi.org/10.14279/depositonce-15535