Back to Search Start Over

Concepts to Interfere with Protein-Protein Complex Formations: Data Analysis, Structural Evidence and Strategies for Finding Small Molecule Modulators

Authors :
Block, Peter
Klebe, Gerhard (Prof. Dr.)
Publication Year :
2005
Publisher :
Philipps-Universität Marburg, 2005.

Abstract

Diese Arbeit beschreibt eine Klassifizierung von Protein-Protein Komplexen mit Algorithmen aus dem Bereich des Maschinellen Lernens (ML). Es wird die Vorhersagequalität von vier verschiedenen ML Algorithmen verglichen: Support Vector Maschinen, C4.5 Entscheidungsbäume, K-Nächste-Nachbarn und Naïve Bayes. In Kombination mit so genannten Feature-Selektionsverfahren konnte ein Datensatz von 345 Protein-Protein Komplexen (147 permanente und 198 transiente Komplexe) in einer „Leave-One-Out Cross-Validierung“ zu 93,6% richtig vorhergesagt werden. Des Weiteren wurde eine Klassifizierung von Protein-Protein Kristallkontakten gegenüber funktionellen Protein-Protein Komplexen durchgeführt. Ein Datensatz von 172 Protein-Protein Komplexen (76 funktionelle Komplexe gegenüber 96 Kristallkontakten) konnte zu 94,8% richtig klassifiziert werden. Mit Hilfe der Auswertung und Optimierung anhand Genetischer Algorithmen ließ sich ein Verfahren entwickeln, das es ermöglicht, eine quantitative Aussage über die Relevanz einzelner Deskriptoren zu treffen. Dazu werden alle so genannten Individuen des Genetischen Algorithmus evaluiert und die relative Häufigkeit der einzelnen Deskriptoren ins Verhältnis zur der Vorhersagerate gesetzt. Durch diese Analyse konnte gezeigt werden, dass beispielsweise das Verhältnis von hydrophober zu hydrophiler Oberfläche zwischen den Protein-Protein Komplexen eine für die Diskriminierung entscheidende Rolle spielt. Der zweite Teil dieser Arbeit konzentriert sich auf die Suche und das Design von Stabilisatoren für Protein-Protein Interaktionen. Obwohl ein Großteil der heute eingesetzten Arzneistoffe allosterisch fungierende Effektoren bzw. Agonisten oder Antagonisten unterschiedlichster Rezeptoren sind, ist die funktionelle Regulierung biologischer Systeme prinzipiell auch durch die Modulierung von Protein-Protein Interaktionen möglich. Das ehrgeizige Ziel kleine, arzneistoffähnliche Moleküle zu entwerfen, die in der Lage sind Protein-Protein Interaktionen zu inhibieren, führte allerdings bis heute nur in Einzelfällen zu Erfolg. Eine Modulierung von Protein-Protein Interaktionen muss allerdings nicht zwangsläufig durch eine kompetitive Inhibierung erfolgen. Mittels einer gezielten Stabilisierung, bei der kleine Moleküle im Randbereich der Proteinkontaktfläche eines Protein-Protein Komplexes binden, kann man ebenfalls die gewünschte Modulierung erzielen. Dieses Phänomen wird eindrucksvoll durch die Bindung von Fusicoccin, das die Interaktion zwischen einer pflanzlichen H+-ATPase und einem 14-3-3 Protein um nahezu den Faktor 100 verstärkt, beschrieben. Auf der Suche nach niedermolekularen Verbindungen, die ebenso wie Fusicoccin den Protein-Protein Komplex stabilisieren, wurden Datenbanken mit ca. 2 Millionen käuflich erwerbbaren Molekülen durchmustert, deren Anzahl ich durch verschiedene Filterschritte reduzieren ließ. Mit verschiedenen Dockingprogrammen wurden über 160.000 Kandidatenmoleküle in die Bindetasche des H+-ATPase/14-3-3-Komplexes eingepasst. Die zahlreichen generierten Dockingposen wurden anhand geeigneter Pharmakophorfilter selektiert. Dazu ließen sich Methoden entwickeln, die effizient mit großen Datenmengen umgehen können. Diejenigen Moleküle mit pharmakophorerfüllenden Eigenschaften und Geometrien wurden anschließend mit verschiedenen Bewertungsfunktionen evaluiert. Für einen intuitiven Einblick in die Beiträge einzelner Atome des Liganden zu dessen Gesamtbewertung, wurde eine etablierte Bewertungsfunktion in ihrer Funktionalität erweitert. Des Weiteren konnte an einem Datensatz mit 198 Protein-Protein Komplexen gezeigt, dass nahezu alle der untersuchten Komplexe taschenförmige Vertiefungen im Randbereich ihrer Kontaktfläche aufweisen. Eine nähere Betrachtung der Taschen zeigt, dass einige eine ähnliche Gestalt zu Bindetaschen in globulären Proteinen aufweisen, die bekanntermaßen kleine Moleküle binden. Diese Erkenntnis lässt vermuten, dass auch Bindetaschen im Randbereich von Protein-Protein Komplexen ein vielversprechendes Target für die Bindung kleiner Moleküle darstellen. Eine Modulierung von Protein-Protein Interaktionen im Sinne einer Stabilisierung durch niedermolekulare Verbindungen erscheint somit als interessante Alternative zur Inhibierung solcher Interaktionen. Ein weiterer Teil dieser Arbeit entstand im Verlaufe eines Projektes zur Entwicklung einer verbesserten Bewertungsfunktion in silico generierter Dockingposen, wie sie bei der Auswahl möglicher Liganden zum Binden in die Fusicoccin Bindetasche des H+-ATPase/14-3-3-Komplexes eingesetzt wurden. Für die Entwicklung empirischer Bewertungsfunktionen, bei denen vorhergesagte gegenüber gemessenen Affinitäten regressionsbasiert korreliert werden, sind große und diverse Datensätze von Protein-Ligand Kristallkomplexen und deren ermittelter Affinität essentiell. In diesem Zusammenhang konnte die webbasierte Datenbank AffinDB entwickelt werden. AffinDB ist im Internet unter http://www.agklebe.de/affinity frei verfügbar.<br />(1) Analyzing protein-protein interactions at the atomic level is critical for our understanding of the principles governing the interactions involved in protein-protein recognition. For this purpose descriptors explaining the nature of different protein-protein complexes are desirable. In this work, we introduce Epic Protein Interface Classification (EPIC) as a framework handling the preparation, processing, and analysis of protein-protein complexes for classification with machine learning algorithms. We applied four different machine learning algorithms: Support Vector Machines (SVM), C4.5 Decision Trees, K Nearest Neighbors (KNN), and Naïve Bayes (NB) algorithm in combination with three feature selection methods, Filter (Relief F), Wrapper, and Genetic Algorithms (GA) to extract discriminating features from the protein-protein complexes. To compare protein-protein complexes to each other, we represented the physicochemical characteristics of their interfaces in four different ways, using two different atomic contact vectors (ACVs), DrugScore pair potential vectors (DPV) and SFCscore descriptor vectors (SDV). We classified two different datasets: (A) 172 protein-protein complexes comprising 96 monomers, forming contacts enforced by the crystallographic packing environment (crystal contacts), and 76 biologically functional homodimer complexes; (B) 345 protein-protein complexes containing 147 permanent complexes and 198 transient complexes. We were able to classify up to 94.8% of the packing enforced/functional and up to 93.6% of the permanent/transient complexes correctly. Furthermore, we were able to extract relevant features from the different protein-protein complexes and introduce an approach for scoring the importance of the extracted features. (2) Since protein-protein interactions play pivotal role in the communication on the molecular level in virtually every biological system and process, the search and design for modulators of such interactions is of utmost interest. In recent years many inhibitors for specific protein-protein interactions have been developed, however, in only a few cases, small and druglike molecules are able to interfere the complex formation of proteins. On the other hand, there a several small molecules known to modulate protein-protein interactions by means of stabilizing an already assembled complex. To achieve this goal, a ligand is binding to a pocket, which is located rim-exposed at the interface of the interacting proteins, e.g. as the phytotoxin Fusicoccin, which stabilizes the interaction of plant H+-ATPase and 14-3-3 protein by nearly a factor of 100. To suggest alternative leads, we performed a virtual screening campaign to discover new molecules putatively stabilizing this complex. Furthermore, we screen a dataset of 198 transient recognition protein-protein complexes for cavities, which are located rim-exposed at their interfaces. We provide evidence for high similarity between such rim-exposed cavities and usual ligand accommodating active sites of enzymes. This analysis suggests that rim-exposed cavities at protein-protein interfaces are druggable targets. Therefore, the principle of stabilizing protein-protein interactions seems to be a promising alternative to the approach of the competitive inhibition of such interactions by small molecules. (3) AffinDB is a database of affinity data for structurally resolved protein-ligand complexes from the PDB. It is freely accessible at http://www.agklebe.de/affinity. Affinity data are collected from the scientific literature, both from primary sources describing the original experimental work of affinity determination and from secondary references which report affinity values determined by others. AffinDB currently contains over 730 affinity entries covering more than 450 different protein-ligand complexes. Besides the affinity value, PDB summary information and additional data are provided, including the experimental conditions of the affinity measurement (if available in the corresponding reference); 2D drawing, SMILES code, and molecular weight of the ligand; links to other databases, and bibliographic information. AffinDB can be queried by PDB code or by any combination of affinity range, temperature and pH-value of the measurement, ligand molecular weight, and publication data (author, journal, year). Search results can be saved as tabular reports in text files. The database is supposed to be a valuable resource for researchers interested in biomolecular recognition and the development of tools for correlating structural data with affinities, as needed, for example, in structure-based drug design.

Details

Language :
English
Database :
OpenAIRE
Accession number :
edsair.doi.dedup.....60756c1f4b20dec88495b0037335c85a
Full Text :
https://doi.org/10.17192/z2005.0686