217 results on '"Systembiologie"'
Search Results
2. From Nose to Lung: Using Systems Biology to Fight Pathogens in the Human Respiratory Tract
- Author
-
Renz, Alina and Dräger, Andreas (Jun.-Prof. Dr.)
- Subjects
Staphylococcus aureus ,SARS-CoV-2 ,Systembiologie ,Pseudomonas aeruginosa ,genome-scale metabolic model ,flux balance analysis ,systems biology ,Dolosigranulum pigrum - Abstract
In December 2019, the world was hit by the global SARS-CoV-2 pandemic. Two years later, the number of infections and deaths is still increasing, affecting everyday’s life. Although several vaccines have been successfully approved for SARS-CoV-2, therapeutic strategies are still minimal. As viruses rely on the host’s metabolism for replication, analyzing the viral reprogramming of the host cells might reveal potential antiviral targets. Such metabolic alterations can be evaluated and analyzed using genome-scale metabolic models (GEMs). These models represent large metabolic networks that connect metabolites with biochemical reactions facilitated by proteins and encoded by genes. With the help of genomic information, the so-called genotype, we can create metabolic models that can predict the phenotypic behavior of an organism. However, these GEMs can be used to analyze virus-host interactions and predict potential antiviral targets and understand the genotype-phenotype relationship of pathogens and commensals such as Staphylococcus aureus. High-quality models with a high predictive value help us to better understand an organism, determine metabolic capabilities in health and disease, identify potential targets for treatment interventions, and analyze the interplay between different cells and organisms. Such models can answer relevant and urgent questions of our time quickly and efficiently and become an indispensable constituent in future research. In my thesis, I demonstrate (I) how the quality and predictive value of an existing genome-scale metabolic model can be assessed, (II) how high-quality genome-scale metabolic models can be curated, and (III) how high-quality genome-scale metabolic models can be used for model-driven discoveries. All three points are addressed in the context of pathogens and commensals in the human respiratory tract. To assess the quality and predictive value of GEMs, we collected all currently available models of the pathogen Staphylococcus aureus, which colonizes the human nose. We evaluated the models concerning their validity, compliance with the FAIR data principle, quality, simulatability, and predictive value. Using high-quality models with a high predictive value enables model-driven hypotheses and discoveries. However, if no such model is available, one needs to curate a high-quality model. For this purpose, we developed a pipeline that focuses on the model curation of nasal pathogens and commensals. This pipeline is adaptable to incorporate other tools and bacteria, pathogens, or cells while maintaining certain community standards. We demonstrated the applicability of this pipeline by curating the first model of the nasal commensal Dolosigranulum pigrum. We showed how to use high-quality GEMs for model-driven discoveries by identifying novel antiviral targets. To do so, we virtually infected human alveolar macrophages in the lung with SARS-CoV-2.
- Published
- 2022
3. Modelling and Quantification of scRNA-seq Experiments and the Transcriptome Dynamics of the Cell Cycle
- Author
-
Laurentino Schwabe, Daniel, Falcke, Martin, Rajewsky, Nikolaus, and Klipp, Edda
- Subjects
Modellierung von Experimenten ,ddc:519 ,519 Wahrscheinlichkeiten und angewandte Mathematik ,Zellzyklus ,data analysis ,modelling experiments ,systems biology ,570 Biologie ,single-cell sequencing ,dynamical systems ,500 Naturwissenschaften und Mathematik ,Datenanalyse ,dynamische Systeme ,Transkriptom ,ddc:570 ,Einzelzellsequenzierung ,Systembiologie ,scRNA-seq ,mathematische Modellierung ,cell cycle ,ddc:500 ,mathematical modelling ,transcriptome - Abstract
In dieser Dissertation modellieren und analysieren wir scRNA-Seq-Daten, um Mechanismen, die biologischen Prozessen zugrunde liegen, zu verstehen In scRNA-Seq-Experimenten wird biologisches Rauschen mit technischem Rauschen vermischt. Mittels eines vereinfachten scRNA-Seq-Modells leiten wir eine analytische Verteilungsfunktion für die beobachtete Verteilung unter Kenntnis einer Ausgangsverteilung her. Charakteristiken und sogar ein allgemeines Moment der Ausgangsverteilung können aus der beobachteten Verteilung berechnet werden. Unsere Formeln stellen den Ausgangspunkt zur Quantifizierung von Zellvariabilität dar. Wir haben eine vollständig lineare Analyse von Transkriptomdaten entwickelt, die zeigt, dass sich Zellen während des Zellzyklus auf einer ebenen zirkulären Trajektorie im Transkriptomraum bewegen. In immortalisierten Zelllinien stellen wir fest, dass die Transkriptomdynamiken des Zellzyklus hauptsächlich unabhängig von den Dynamiken anderer Zellprozesse stattfinden. Unser Algorithmus (“Revelio”) bringt eine einfache Methode mit sich, um unsynchronisierte Zellen nach der Zeit zu ordnen und ermöglicht das exakte Entfernen von Zellzykluseffekten. Die Form der Zellzyklus-Trajektorie zeigt, dass der Zellzyklus sich dazu entwickelt hat, Änderungen der transkriptionellen Aktivitäten und der damit verbundenen regulativen Anstrengungen zu minimieren. Dieses Konstruktionsprinzip könnte auch für andere Prozesse relevant sein. Durch die Verwendung von metabolischer Molekülmarkierung erweitern wir Modelle zur mRNA-Kinetik, um dynamische mRNA-Ratenparameter für Transkription, Splicing und Degradation zu erhalten und die Lösungen auf den Zellzyklus anzuwenden. Wir zeigen, dass unser Modell zwischen Genen mit ähnlicher Genexpression aber unterschiedlicher Genregulation unterscheiden kann. Zwar enthalten scRNA-Seq-Daten aktuell noch zu viel technisches Rauschen, unser Modell wird jedoch für das zukünftige Errechnen von dynamischen mRNA-Ratenparametern von großem Nutzen sein., In this dissertation, we model and analyse scRNA-seq data to understand mechanisms underlying biological processes. In scRNA-seq experiments, biological noise gets convoluted with various sources of technical noise. With the help of a simplified scRNA-seq model, we derive an analytical probability distribution function for the observed output distribution given a true input distribution. We find that characteristics and even general moments of the input distribution can be calculated from the output distribution. Our formulas are a starting point for the quantification of cell-to-cell variability. We developed a fully linear analysis of transcriptome data which reveals that cells move along a planar circular trajectory in transcriptome space during the cell cycle. Additionally, we find in immortalized cell lines that cell cycle transcriptome dynamics occur largely independently from other cellular processes. Our algorithm (“Revelio”) offers a simple method to order unsynchronized cells in time and enables the precise removal of cell cycle effects from the data. The shape of the cell cycle trajectory indicates that the cell cycle has evolved to minimize changes of transcriptional activity and their related regulatory efforts. This design principle may be of relevance to other cellular processes. By considering metabolic labelling, we extend existing mRNA kinetic models to obtain dynamic mRNA rate parameters for transcription, splicing and degradation and apply our solutions to the cell cycle. We can distinguish genes with similar expression values but different gene regulation strategies. While current scRNA-seq data contains too much technical noise, the model will be of great value for inferring dynamic mRNA rate parameters in future research.
- Published
- 2022
- Full Text
- View/download PDF
4. Modelling and Quantification of scRNA-seq Experiments and the Transcriptome Dynamics of the Cell Cycle
- Author
-
Falcke, Martin, Rajewsky, Nikolaus, Klipp, Edda, Laurentino Schwabe, Daniel, Falcke, Martin, Rajewsky, Nikolaus, Klipp, Edda, and Laurentino Schwabe, Daniel
- Abstract
In dieser Dissertation modellieren und analysieren wir scRNA-Seq-Daten, um Mechanismen, die biologischen Prozessen zugrunde liegen, zu verstehen In scRNA-Seq-Experimenten wird biologisches Rauschen mit technischem Rauschen vermischt. Mittels eines vereinfachten scRNA-Seq-Modells leiten wir eine analytische Verteilungsfunktion für die beobachtete Verteilung unter Kenntnis einer Ausgangsverteilung her. Charakteristiken und sogar ein allgemeines Moment der Ausgangsverteilung können aus der beobachteten Verteilung berechnet werden. Unsere Formeln stellen den Ausgangspunkt zur Quantifizierung von Zellvariabilität dar. Wir haben eine vollständig lineare Analyse von Transkriptomdaten entwickelt, die zeigt, dass sich Zellen während des Zellzyklus auf einer ebenen zirkulären Trajektorie im Transkriptomraum bewegen. In immortalisierten Zelllinien stellen wir fest, dass die Transkriptomdynamiken des Zellzyklus hauptsächlich unabhängig von den Dynamiken anderer Zellprozesse stattfinden. Unser Algorithmus (“Revelio”) bringt eine einfache Methode mit sich, um unsynchronisierte Zellen nach der Zeit zu ordnen und ermöglicht das exakte Entfernen von Zellzykluseffekten. Die Form der Zellzyklus-Trajektorie zeigt, dass der Zellzyklus sich dazu entwickelt hat, Änderungen der transkriptionellen Aktivitäten und der damit verbundenen regulativen Anstrengungen zu minimieren. Dieses Konstruktionsprinzip könnte auch für andere Prozesse relevant sein. Durch die Verwendung von metabolischer Molekülmarkierung erweitern wir Modelle zur mRNA-Kinetik, um dynamische mRNA-Ratenparameter für Transkription, Splicing und Degradation zu erhalten und die Lösungen auf den Zellzyklus anzuwenden. Wir zeigen, dass unser Modell zwischen Genen mit ähnlicher Genexpression aber unterschiedlicher Genregulation unterscheiden kann. Zwar enthalten scRNA-Seq-Daten aktuell noch zu viel technisches Rauschen, unser Modell wird jedoch für das zukünftige Errechnen von dynamischen mRNA-Ratenparametern von großem Nutzen sein, In this dissertation, we model and analyse scRNA-seq data to understand mechanisms underlying biological processes. In scRNA-seq experiments, biological noise gets convoluted with various sources of technical noise. With the help of a simplified scRNA-seq model, we derive an analytical probability distribution function for the observed output distribution given a true input distribution. We find that characteristics and even general moments of the input distribution can be calculated from the output distribution. Our formulas are a starting point for the quantification of cell-to-cell variability. We developed a fully linear analysis of transcriptome data which reveals that cells move along a planar circular trajectory in transcriptome space during the cell cycle. Additionally, we find in immortalized cell lines that cell cycle transcriptome dynamics occur largely independently from other cellular processes. Our algorithm (“Revelio”) offers a simple method to order unsynchronized cells in time and enables the precise removal of cell cycle effects from the data. The shape of the cell cycle trajectory indicates that the cell cycle has evolved to minimize changes of transcriptional activity and their related regulatory efforts. This design principle may be of relevance to other cellular processes. By considering metabolic labelling, we extend existing mRNA kinetic models to obtain dynamic mRNA rate parameters for transcription, splicing and degradation and apply our solutions to the cell cycle. We can distinguish genes with similar expression values but different gene regulation strategies. While current scRNA-seq data contains too much technical noise, the model will be of great value for inferring dynamic mRNA rate parameters in future research.
- Published
- 2022
5. De-novo pathway discovery for multi-omics data
- Author
-
Winkler, Sebastian and Kohlbacher, Oliver (Prof. Dr.)
- Subjects
Multi-omics ,Krebs ,Kombinatorische Optimierung ,Hepatozelluläres Karzinom ,Hepatocellular carcinoma ,Bioinformatics ,Systems Biology ,Bioinformatik ,Fractional integer programming ,Network Biology ,Netzwerkbiologie ,Fraktionale ganzzahlige Optimierung ,Systembiologie ,Combinatorial Optimization ,Cancer - Abstract
In der vorliegenden Arbeit werden Methoden und Software vorgestellt, die es erlauben, aus Hochdurchsatz Omics-Daten und biomolekularen Interaktionsnetzwerken biologisch relevante Muster zu extrahieren. Es wird ein Algorithmus entwickelt, der es ermöglicht, aus großen gerichteten molekularen Interaktionsnetzwerken sog. deregulierte Teilnetzwerke zu extrahieren. Deregulierung wird hierbei über auf die Knoten des Netzwerkes abgebildete Omics-Daten definiert. Es wird eine statistische Grundlage für den vorgestellten Algorithmus diskutiert und eine Evaluierung hinsichtlich methodisch verwandter Verfahren vorgenommen. Der Algorithmus und seine Implementierung, DeRegNet, beruhen auf fraktionaler ganzzahliger Optimierung und erlauben zahlreiche Anwendungsszenarien. Exemplarisch wird die Anwendung auf öffentlich zugängliche Daten des TCGA-Projekts vorgestellt (TCGA: The Cancer Genome Atlas), hier genauer an Hand der Daten zum hepatozellulären Karzinom (Leberkrebs). Weiterhin werden Anwendungen auf eine Studie des Folate One-Carbon Metabolismus im Leberkrebs, als auch auf die phosphoproteomische Regulierung des Saccharomyces cerevisiae (Backhefe) Zellzyklus beschrieben. Abschließend wird auf die allgemeine Architektur und einige Implementationsdetails einer web-basierten API (Application Programming Interface) zur Bereitstellung von DeRegNet eingegangen. This thesis presents algorithms and software which allow the extraction of biologically meaningful patterns from high-throughput multi-omics data and biomolecular networks. It describes the concept and implementation of an algorithm which allows the extraction of deregulated subnetworks from large directed molecular interaction networks based on node scores derived from omics data. Statistical underpinnings of the algorithms are derived and the algorithm is benchmarked against its closest methodological relative. Relying on fractional integer programming, the algorithm and its implementation, DeRegNet, allow many flexible modes of application. I demonstrate the application of the algorithm in the context of the public TCGA (The Cancer Genome Atlas) liver cancer dataset, a study investigating the role of folate one-carbon metabolism in liver cancer and a study about the phosphoproteomic regulation of the Saccharomyces cerevisiae (baker's yeast) cell cycle. Finally, the general architecture and some implementation details of a web-based API for DeRegNet are presented.
- Published
- 2022
6. Crosslinking and mass spectrometry for the study of biomolecular structures on the systems level
- Author
-
Sinn, Ludwig Roman
- Subjects
543 Analytische Chemie ,Massenspektrometrie ,protein-protein-Interaction ,Strukturbiologie ,Systembiologie ,572 Biochemie ,structural biology ,crosslinking ,systems biology ,Quervernetzung ,Protein-Protein-Interaktion ,mass spectrometry - Abstract
Proteins play a crucial role for the functioning of the cell, may it be by conveying structural integrity, being involved with molecular transport and signal transduction, or by catalysing metabolic reactions. The cell’s proteome is modular, so while many proteins carry out their functions acting either on their own, many do so as part of higher-order complexes. Since a protein’s function is tightly coupled to its individual molecular structure, by studying protein structures the mechanisms behind their function can be understood. A tool to assess protein structure is crosslinking and mass spectrometry (CLMS) in which chemical crosslinks are first introduced into a protein, and these crosslinks are then detected by chromatography-coupled mass spectrometry. Here, the observed crosslinks provide information on molecular distance relationships within the structures of proteins and their complexes which helps to describe these. A main motivation of the work presented in this thesis was to develop the CLMS approach to investigate more complex biological entities, i.e., proteome-wide studies focussing on protein-protein interactions in their native cellular environment. Some pioneering studies had attempted this in the past but their output remained rather limited in comparison to analyses of purified protein complexes. Major challenges needed to be overcome in the detection and identification of crosslinked peptides to make this conceptual leap. These challenges are mostly of technical nature and include: (1) the low abundance of crosslinked peptide analytes within a sample spanning a wide dynamic range and with a large underlying chemical heterogeneity, (2) the enormous combinatorial complexity from considering all theoretically possible peptide pairs of a crosslinked proteome during the crosslink search, and (3) the lack of consensus over reliable error control procedure for detecting protein-protein interactions in experiments of such scale. In this thesis, I tackle each of these challenges. I demonstrate how leveraging liquid- and gas-phase fractionation and/or enrichment of crosslinks, respectively, addresses methodological hurdles related to the high sample heterogeneity and its wide dynamic range, as well as to the combinatorial complexity encountered in proteome-wide CLMS. First, addressing the low abundance of crosslinked peptides, I show the effective combination of size-exclusion-based peptide pre-fractionation with a differential ion mobility separation dimension coupled in between reversed-phase liquid chromatography and the mass spectrometer. The gains from following this approach are shown for samples of moderate up to cellular complexity. Second, to reduce crosslinked peptide identification ambiguity, I demonstrate how the analyte retention behaviour during multidimensional fractionation involving two modes of offline-ion-exchange plus online-reversed-phase chromatography can be leveraged via deep learning to complement mass spectrometric information, leading to an increase in crosslink identification yields at constant confidence. Third, by using protein co-elution profiling as an independent benchmark to existing error control procedures, I show how error rates can be reliably estimated for protein-protein interaction studies by CLMS. In this study, many known protein interactions in the model organism Escherichia coli could be confirmed while others could extend existing knowledge on essential protein complexes. To this end, I verified the interaction between the RNA polymerase and the uncharacterized protein YacL by affinity-purification and mass spectrometry and further confined YacL’s interaction site on RNA polymerase by means of photo-crosslinking. The contributions towards proteome-wide CLMS presented in this thesis on aspects of sample separation - on the protein- and the peptide-level - and efficient use of information derived from it, as well as the establishment of an approach to reliably control for error rates on protein-protein interaction-level, represent important steps towards unlocking the full potential of CLMS for high-confidence proteome-wide studies at protein residue-resolution., Proteine spielen eine zentrale Rolle für das Funktionieren der Zelle, beispielsweise durch das Vermitteln struktureller Integrität, während molekularer Transportprozesse und Signalkaskaden oder bei der Katalyse metabolischer Reaktionen. Die Gesamtheit aller Proteine einer Zelle - das Proteom - ist modular organisiert, sodass zwar einige Proteine unabhängig von Anderen agieren können, viele andere aber nur eingebunden in höher geordneten Komplexen funktionieren. Da die Struktur eines Proteins in direktem Zusammenhang mit dessen Funktion steht, ermöglicht das Erforschen von Proteinstrukturen deren Funktion mechanistisch zu verstehen. Ein Ansatz Proteinstrukturen zu untersuchen stellt die Kombination aus Quervernetzung und Massenspektrometrie (CLMS) dar. Hierbei werden zuerst chemische Quervernetzungen (crosslinks) in ein Protein eingeführt, welche anschließend per Flüssigchromatographiegekoppelter Massenspektrometrie detektiert werden. Die so gefundenen crosslinks liefern Information zu molekularen Distanzbeziehungen innerhalb einer Proteinstruktur bzw. zwischen den Proteinen von Proteinkomplexen mit deren Hilfe ebendiese Strukturen und Interaktionen beschrieben und modelliert werden können. Die wesentliche Motivation für die in dieser Dissertation enthaltenen Arbeiten war es den CLMS Forschungsansatz für die Untersuchung komplexerer biologischer Systeme, wie beispielsweise des gesamten zellulären Proteoms, weiterzuentwickeln, um so Protein-Protein-Interaktionen in deren nativer Umgebung erforschen zu können. Frühere Forschungsanstrengungen widmeten sich zwar bereits diesem Versuch, ergaben aber vergleichsweise wenig neue Erkenntnisse. Große analytische Herausforderungen in Detektion und Identifikation quervernetzter Peptide müssen zuerst für diesen konzeptionellen Sprung überwunden werden. Diese Herausforderungen sind größtenteils technischer Natur und umfassen: (1) die niedrige Häufigkeit quervernetzter Peptide in Proben mit großem Dynamikbereich und hoher chemischer Heterogenität, (2) die enorme kombinatorische Komplexität der Datenbanksuche, resultierend aus der paarweisen Kombination aller theoretisch möglichen Peptide eines quervernetzten Proteoms und (3) das Fehlen eines Konsenses über ein verlässliches Verfahren zur Fehlerkontrolle in proteomweiten Protein-Protein-Interaktionsstudien (PPI-Studien). In dieser Dissertation widme ich mich der Bewältigung jeder dieser Herausforderungen. Ich zeige, wie die Verwendung von Flüssig- und Gasphasen-Frakionierung und -Anreicherung von quervernetzten Peptiden dazu genutzt werden kann, um die oben genannten methodischen Hürden in CLMS-basierten proteom-weiten PPI-Studien anzugehen. In der ersten Arbeit liegt der Fokus auf der Adressierung der niedrigen Häufigkeit quervernetzter Peptide. Hier zeige ich die effiziente Kombination zweier Anreicherungsverfahren quernetzter Peptide: die vorgeschaltete Größenausschluss-Chromatographie und differentielle Ionenmobilitätsspektrometrie, gekoppelt zwischen Umkehrphasen-Flüssigchromatograph und Massenspektrometer. Der Gewinn an crosslink-Identifikationen durch Verwendung dieses Verfahrens wird anhand von Proben moderater bis hin zu zellulärer Komplexität demonstriert. Die zweite Arbeit widmet sich der Reduktion von Ambiguität bei der Identifikation quervernetzter Peptide. Hier nutze ich multidimensionale Fraktionierung, bestehend aus zwei komplementären vorgeschalteten Ionenaustausch- und der Massenspektrometrie-gekoppelten UmkehrphasenChromatographie für die Trennung einer komplexen Probe, abgeleitet vom quervernetzten hochmolekularen Proteom von Escherichia coli. Die Ergänzung der massenspektrometrischen Information um das Retentionsverhalten quervernetzter Peptide aus diesem Vorgehen mittels maschinellen Lernens führt zur verbesserten Identifikation von crosslinks. Dies ermöglicht letztlich mehr Quervernetzungen bei konstanter statistischer Konfidenz in einem CLMSDatensatz identifizieren zu können. Die dritte Arbeit dieser Thesis zielt darauf ab, ein verlässliches Verfahren zur Fehlerkontrolle von CLMS-basierten PPI-Studien zu etablieren. Hierbei bediene ich mich des SEC-MS Verfahrens (Größenausschlusschromatographie komplexer Proteinproben unter nativen Bedingungen gefolgt von massenspektrometrischer Proteinidentifikation in den erhaltenen Fraktionen), in dem das Co-Elutionsverhalten von Proteinen und deren Komplexe während nativer Fraktionierung per Größenausschluss-Chromatographie untersucht wird. Diese Methodik gewährt einen unabhängigen Vergleichspunkt zu den PPIs, welche aus dem CLMS Ansatz unter Verwendung verschiedener bestehender Fehlerkontrollverfahren resultieren. In dieser Studie konnte ich viele bereits bekannte Proteininteraktionen im Modellorganismus Escherichia coli bestätigen und bestehendes Wissen essenzieller Proteinkomplexe erweitern. Weiterhin konnte ich die Interaktion zwischen RNA-Polymerase und dem nicht charakterisierten Protein YacL mittels Affinitätsbasierter Reinigung und Massenspektrometrie bekräftigen. Durch zusätzliches Photo-Crosslinking und Massenspektrometrie konnte ich schließlich den Interaktionsbereich zwischen YacL und RNA-Polymerase noch weiter räumlich eingrenzen. Die in dieser Dissertation präsentierten Beiträge zu proteom-weiten CLMS Studien umfassen Aspekte der Probenaufbereitung auf Protein- und Peptid-Ebene, sowie die effiziente Verwendung der daraus resultierenden Information, als auch die Etablierung eines Verfahrens zur verlässlichen Fehlerkontrolle auf Protein-Protein-Interaktions-Level. Diese Erkenntnisse werden zukünftig dabei helfen, das volle Potenzial der chemischen Quervernetzung und Massenspektrometrie-Methodik für konfidente proteom-weite PPI-Studien mit AminosäureAuflösung auszuschöpfen.
- Published
- 2022
- Full Text
- View/download PDF
7. New insights in Rett syndrome using pathway analysis for transcriptomics data.
- Author
-
Ehrhart, Friederike, Coort, Susan, Cirillo, Elisa, Smeets, Eric, Evelo, Chris, and Curfs, Leopold
- Abstract
Copyright of Wiener Medizinische Wochenschrift is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2016
- Full Text
- View/download PDF
8. Network Inference from Perturbation Data: Robustness, Identifiability and Experimental Design
- Author
-
Blüthgen, Nils, Saez-Rodriguez, Julio, Steuer, Ralf, Groß, Torsten, Blüthgen, Nils, Saez-Rodriguez, Julio, Steuer, Ralf, and Groß, Torsten
- Abstract
Hochdurchsatzverfahren quantifizieren eine Vielzahl zellulärer Komponenten, können aber selten deren Interaktionen beschreiben. Daher wurden in den letzten 20 Jahren verschiedenste Netzwerk-Rekonstruktionsmethoden entwickelt. Insbesondere Perturbationsdaten erlauben dabei Rückschlüsse über funktionelle Mechanismen in der Genregulierung, Signal Transduktion, intra-zellulärer Kommunikation und anderen Prozessen zu ziehen. Dennoch bleibt Netzwerkinferenz ein ungelöstes Problem, weil die meisten Methoden auf ungeeigneten Annahmen basieren und die Identifizierbarkeit von Netzwerkkanten nicht aufklären. Diesbezüglich beschreibt diese Dissertation eine neue Rekonstruktionsmethode, die auf einfachen Annahmen von Perturbationsausbreitung basiert. Damit ist sie in verschiedensten Zusammenhängen anwendbar und übertrifft andere Methoden in Standard-Benchmarks. Für MAPK und PI3K Signalwege in einer Adenokarzinom-Zellline generiert sie plausible Netzwerkhypothesen, die unterschiedliche Sensitivitäten von PI3K-Mutanten gegenüber verschiedener Inhibitoren überzeugend erklären. Weiterhin wird gezeigt, dass sich Netzwerk-Identifizierbarkeit durch ein intuitives Max-Flow Problem beschreiben lässt. Dieses analytische Resultat erlaubt effektive, identifizierbare Netzwerke zu ermitteln und das experimentelle Design aufwändiger Perturbationsexperimente zu optimieren. Umfangreiche Tests zeigen, dass der Ansatz im Vergleich zu zufällig generierten Perturbationssequenzen die Anzahl der für volle Identifizierbarkeit notwendigen Perturbationen auf unter ein Drittel senkt. Schließlich beschreibt die Dissertation eine mathematische Weiterentwicklung der Modular Response Analysis. Es wird gezeigt, dass sich das Problem als analytisch lösbare orthogonale Regression approximieren lässt. Dies erlaubt eine drastische Reduzierung des nummerischen Aufwands, womit sich deutlich größere Netzwerke rekonstruieren und neueste Hochdurchsatz-Perturbationsdaten auswerten lassen., 'Omics' technologies provide extensive quantifications of components of biological systems but rarely characterize the interactions between them. To fill this gap, various network reconstruction methods have been developed over the past twenty years. Using perturbation data, these methods can deduce functional mechanisms in gene regulation, signal transduction, intra-cellular communication and many other cellular processes. Nevertheless, this reverse engineering problem remains essentially unsolved because inferred networks are often based on inapt assumptions, lack interpretability as well as a rigorous description of identifiability. To overcome these shortcoming, this thesis first presents a novel inference method which is based on a simple response logic. The underlying assumptions are so mild that the approach is suitable for a wide range of applications while also outperforming existing methods in standard benchmark data sets. For MAPK and PI3K signalling pathways in an adenocarcinoma cell line, it derived plausible network hypotheses, which explain distinct sensitivities of PI3K mutants to targeted inhibitors. Second, an intuitive maximum-flow problem is shown to describe identifiability of network interactions. This analytical result allows to devise identifiable effective network models in underdetermined settings and to optimize the design of costly perturbation experiments. Benchmarked on a database of human pathways, full network identifiability is obtained with less than a third of the perturbations that are needed in random experimental designs. Finally, the thesis presents mathematical advances within Modular Response Analysis (MRA), which is a popular framework to quantify network interaction strengths. It is shown that MRA can be approximated as an analytically solvable total least squares problem. This insight drastically reduces computational complexity, which allows to model much bigger networks and to handle novel large-scale perturbation data.
- Published
- 2021
9. Systems biology of tumour evolution : estimating orders from omics data
- Author
-
Schäfer, Lisa Monika, Kestler, Hans A., Kühl, Michael, Frasconi, Paolo, Hoffmann, Steve, and Börries, Melanie
- Subjects
Ordinal classification ,Krebs ,Biomathematik ,Neoplasms ,Datasets as topic ,Systembiologie ,%22">Krebs ,ddc:610 ,Systems biology ,DDC 610 / Medicine & health - Abstract
Multi-class datasets often comprise samples of various classes united under a common research context. Based on this limited amount of data one searches for concepts that employ specific data characteristics to define general rules that can then be applied to new data. One concept of interest is the relation between classes. Hereby, the classes correspond to a grouping and labelling of samples, and the samples are given by the measurements. These relations might be of interest in basic research to analyse development or relationships between organisms or phenotypes. But they are also relevant in medical diagnostics as they might guide treatment options or serve as basis for knowledge transfer. If solely one feature is measured, an ordinal relation might be concluded directly. For example, in histological examinations of pre-cancer stage tissues only the grade of observable tissue disruption with respect to the normal stage is measured, and a semantic order on pre-cancer stages is proposed based on this measure. If in the following a molecular profile is gathered additionally, an order between classes cannot easily be defined due to the quantity of different features but the previously proposed order might be assumed to be reflected in the molecular profile. This assumption, however, has not been proven and requires further analysis. Transferring semantic ordinal relations between measurements or searching for them in high-dimensional data goes along with the following questions: • How to check whether a proposed linear order is reflected in the given measurements, how to reveal linear orders from them and how to combine several linear ordinal relations to one order structure? • Which data structures should be considered as ordinal in high-dimensional space? • How can the revealed ordinal relations be interpreted? In this thesis, I target the first and second question by the functionality of the ordinal classifier cascade. The third question is targeted by the application of ordinal classifier cascades to various real data examples, among them pre-cancer stages of different cancer types.
- Published
- 2021
10. From Parts to the Whole
- Author
-
Klipp, Edda, Dittmar, Gunnar, Brockmann, Dirk, Hahn, Jens, Klipp, Edda, Dittmar, Gunnar, Brockmann, Dirk, and Hahn, Jens
- Abstract
Die Durchführung von Experimenten und das mathematische Modellieren von zellulären Prozessen gehören in der Systembiologie untrennbar zusammen. Das gemeinsame Ziel ist die Aufklärung des Zusammenspiels intrazellulärer Prozesse wie Metabolismus, Genexpression oder Signaltransduktion. Während sich molekularbiologische Untersuchungen mit den molekularen Mechanismen einzelner isolierter Systeme beschäftigen, zielt die Systembiologie auf die Aufklärung der Zusammenhänge ganzer Prozesse und schließlich auch ganzer Zellen ab. Die Verfügbarkeit von umfangreichen Datensätzen und die steigenden Möglichkeiten im Bereich der Computersimulation haben in den letzten Jahren den Weg geebnet, um auch Ganzzellsimulationen nicht mehr unmöglich erscheinen zu lassen. Diese Arbeit stellt das erste eukaryotische Ganzzellmodell der Bäckerhefe Saccharomyces cerevisiae vor. Hefe als eukaryotischer Modellorganismus ist hierbei der perfekte Kandidat für die Erstellung eines solchen Modells. Er bietet, als wohl meist erforschter eukaryotischer Einzeller in Verbindung mit der Verfügbarkeit einer großen Menge experimenteller Daten, beste Voraussetzungen zur Erstellung eines solchen Modells. Das Projekt ist hierbei in drei Teile gegliedert: i) Die Erstellung eines modularen Ganzzellmodells das alle zellulären Funktionen wie Zellzyklus, Genexpression, Metabolismus, Transport und Wachstum abbildet. ii) Die Implementation einer spezialisierten Simulationsumgebung in Verbindung mit einer Datenbank, um die Erstellung, Simulation und Parametrisierung von Modulen zu ermöglichen. iii) Die Durchführung von Experimenten, um einen ganzheitlichen Datensatz zu erlangen, der Wachstum, Genexpression und Metabolismus abbildet. Die hier vorgestellte Arbeit liefert nicht nur ein mathematisches Modell, sondern benennt auch die Herausforderungen, die während der Arbeit an einem Ganzzellmodell auftreten und stellt mögliche Lösungsansätze vor., In systems biology experiments and mathematical modeling are going hand in hand to gain and increase understanding of cellular processes like metabolism, gene expression, or signaling pathways. While molecular biology investigates single isolated parts and molecular mechanisms of cellular processes, systems biology aims at unraveling the whole process and ultimately whole organisms. Today the availability of comprehensive high-throughput data and computational power paved the way to increase the size of analyzed systems to reach the cellular level. This thesis presents the first whole-cell model (WCM) of a eukaryotic cell, the yeast Saccharomyces cerevisiae. This established model organism is the perfect candidate for the implementation of a holistic model based on the available experimental data and the accumulated biological knowledge. The project is split into three parts: i) The creation of a modular functional-complete whole-cell model, combining the processes cell cycle, gene expression, metabolism, transport, and growth. ii) The implementation of a specialized simulation environment and a database to support module creation, simulation, and parameterization. iii) The elicitation of experimental data by conducting an experiment to achieve a comprehensive data set for parameterization, combining growth, metabolic, proteomic, and transcriptomic data. The presented work provides not only a simple mathematical model but also addresses challenges occurring during the development of whole-cell models and names possible solutions and new methodologies required for the creation of WCMs.
- Published
- 2020
11. Identification of differential regulation in central carbon metabolism between related cell lines
- Author
-
Klipp, Edda, Sawitzki, Birgit, Banga, Julio R., Rainer, Roman Josef, Klipp, Edda, Sawitzki, Birgit, Banga, Julio R., and Rainer, Roman Josef
- Abstract
Darmkrebszellen und T-Zellen regulieren ihren zentralen Kohlenstoffmetabolismus um ihren anabolen Bedarf zu erfüllen. Tumorzellen mit einer KRAS- oder BRAF-Mutation zeigen ein schnelles Wachstum, welches eine Umprogrammierung des Metabolismus vor aussetzt. Der mitochondriale T-Zellen-Aktivierungsinhibitor (TCAIM) ist bekannt dafür die mitochondriale Zellstruktur zu beeinflussen. Der Einfluss auf den Metabolismus nicht klar. In dieser Arbeit präsentiere ich erstmalig ein mathematische Model des zentralen Kohlen stoffmetabolismus in Darmkrebszellen und T-Zellen. Mithilfe dieses Modells analysiere ich, wie sich die Regulation in ähnlichen Zelllinien unterscheidet. In Bezug auf die Darm krebszellen vergleiche ich BRAF-(CaCO2-BRAFV600E), KRAS-(CaCO2-KRASG12V) mu tierte Zelllinien mit einer Basiszelllinie (CaCO2-control) und zeige, dass der Kohlenstoff metabolismus in BRAF-mutierten Zellen im Vergleich zu den beiden übrigen Zelllinien herabreguliert ist. Das Modell bestätigt außerdem, dass der Monocarboxylattransporter (MCT) in den Darmkrebszellen eine wichtige Rolle, insbesondere in den KRAS mu tierten Zellen, spielt. In T-Zellen zeigt der Vergleich von Wildtypzellen (CD8 T-Zellen) mit TCAIM homozygoten Zellen (TCAIM homozygote CD8 T-Zellen), dass der Kohlen stoffmetabolismus in zweiteren überwiegend herabreguliert und weniger aktiv ist. Diesen Effekt konnte ich durch die Analyse von RNASeq-Daten der jeweiligen Zelltypen bestä- tigen. Des Weiteren stelle ich fest, dass sich der Tricarbonsäurezyklus umkehrt, wenn durch die Glykolyse nicht ausreichend Laktat exportiert und die Biomasseproduktion unterstützt werden kann. Meine Arbeit stellt damit insgesamt einen neuartigen Ansatz zur Integration von Meta bolomik und RNAseq Daten dar, um die Regulation des zentralen Kohlenstoffmetabo lismus zu verstehen., Colon cancer cells and T cells regulate central carbon metabolism to meet their anabolic needs. In KRAS and BRAF tumors, metabolic reprogramming is a premise to support rapid proliferation. In T cells, the mitochondrial T cell activation inhibitor (TCAIM) is known to affect mitochondrial morphology but its effect on cellular metabolism is not well understood. Via mathematical modelling, I investigate the differential regulation of closely related cell lines. I present the first mathematical model for colon cancer and T cell metabolism, unraveling differential regulation between related cell lines. The model shows that CaCO2-BRAFV600Ecells are mostly downregulated compared to CaCO2-KRASG12Vand CaCO2-control. Additionally, it demonstrates the critical role of monocarboxylate transporter (MCT), especially for CaCO2-KRASG12V. Concerning T cells, I compare wild-type T cells to homozygous TCAIM T cells. This unveils that TCAIM homozygous cells have a mostly downregulated TCA cycle, validated by RNASeq data, and are less metabolically active than wild-type T cells. Furthermore, if the glycolytic flux is not sufficient to support lactate export and biomass production, the model reveals that the TCA cycle is reversed as it requires less regulation. Taken together, this work presents a novel approach to integrate data referring to metabolic and genetic regulation of metabolism. On this basis, we can now better discriminate the metabolic capacity of CaCO2-control, CaCO2-BRAFV600E, CaCO2-KRASG12V, wildtype CD8 T cells, and homozygous TCAIM CD8 T cells.
- Published
- 2020
12. Estimating Gene Regulatory Activity using Mathematical Optimization
- Author
-
Leser, Ulf, Nowick, Katja, Siebert, Heike, Trescher, Saskia, Leser, Ulf, Nowick, Katja, Siebert, Heike, and Trescher, Saskia
- Abstract
Die Regulation der Genexpression ist einer der wichtigsten zellulären Prozesse und steht in Zusammenhang mit der Entstehung diverser Krankheiten. Regulationsmechanismen können mit einer Vielzahl von Methoden experimentell untersucht werden, zugleich erfordert die Integration der Datensätze in umfassende Modelle stringente rechnergestützte Methoden. Ein Teil dieser Methoden modelliert die genomweite Genexpression als (lineares) Gleichungssystem über die Aktivität und Beziehungen von Transkriptionsfaktoren (TF), Genen und anderen Faktoren und optimiert die Parameter, sodass die gemessenen Expressionsintensitäten möglichst genau wiedergegeben werden. Trotz ihrer gemeinsamen Wurzeln in der mathematischen Optimierung unterscheiden sich die Methoden stark in der Art der integrierten Daten, im für ihre Anwendung notwendigen Hintergrundwissen, der Granularität des Regulationsmodells, des konkreten Paradigmas zur Lösung des Optimierungsproblems, und der zur Evaluation verwendeten Datensätze. In dieser Arbeit betrachten wir fünf solcher Methoden und stellen einen qualitativen und quantitativen Vergleich auf. Unsere Ergebnisse zeigen, dass die Überschneidungen der Ergebnisse sehr gering sind, was nicht auf die Stichprobengröße oder das regulatorische Netzwerk zurückgeführt werden kann. Ein Grund für die genannten Defizite könnten die vereinfachten Modelle zellulärer Prozesse sein, da diese vorhandene Rückkopplungsschleifen ignorieren. Wir schlagen eine neue Methode (Florae) mit Schwerpunkt auf die Berücksichtigung von Rückkopplungsschleifen vor und beurteilen deren Ergebnisse. Mit Floræ können wir die Identifizierung von Knockout- und Knockdown-TF in synthetischen Datensätzen verbessern. Unsere Ergebnisse und die vorgeschlagene Methode erweitern das Wissen über genregulatorische Aktivität können die Identifizierung von Ursachen und Mechanismen regulatorischer (Dys-)Funktionen und die Entwicklung von medizinischen Biomarkern und Therapien unterstützen., Gene regulation is one of the most important cellular processes and closely interlinked pathogenesis. The elucidation of regulatory mechanisms can be approached by many experimental methods, yet integration of the resulting heterogeneous, large, and noisy data sets into comprehensive models requires rigorous computational methods. A prominent class of methods models genome-wide gene expression as sets of (linear) equations over the activity and relationships of transcription factors (TFs), genes and other factors and optimizes parameters to fit the measured expression intensities. Despite their common root in mathematical optimization, they vastly differ in the types of experimental data being integrated, the background knowledge necessary for their application, the granularity of their regulatory model, the concrete paradigm used for solving the optimization problem and the data sets used for evaluation. We review five recent methods of this class and compare them qualitatively and quantitatively in a unified framework. Our results show that the result overlaps are very low, though sometimes statistically significant. This poor overall performance cannot be attributed to the sample size or to the specific regulatory network provided as background knowledge. We suggest that a reason for this deficiency might be the simplistic model of cellular processes in the presented methods, where TF self-regulation and feedback loops were not represented. We propose a new method for estimating transcriptional activity, named Florae, with a particular focus on the consideration of feedback loops and evaluate its results. Using Floræ, we are able to improve the identification of knockout and knockdown TFs in synthetic data sets. Our results and the proposed method extend the knowledge about gene regulatory activity and are a step towards the identification of causes and mechanisms of regulatory (dys)functions, supporting the development of medical biomarkers and therapies.
- Published
- 2020
13. Network Inference from Perturbation Data: Robustness, Identifiability and Experimental Design
- Author
-
Groß, Torsten, Blüthgen, Nils, Saez-Rodriguez, Julio, and Steuer, Ralf
- Subjects
experimental design ,gene regulatory network ,network reconstruction ,WC 7700 ,Versuchsplanung ,Mathematische Modellierung ,500 Naturwissenschaften und Mathematik ,logic programming ,Netzwerkinferenz ,Signaltransduktion ,WD 9200 ,ddc:570 ,Systembiologie ,Reverse Engineering ,Perturbationsdaten ,mathematical modelling ,total least squares ,Netzwerkrekonstruktion ,Logische Programmierung ,Answer Set Programming ,Genregulationsnetzwerk ,systems biology ,Identifizierbarkeit ,identifiability ,perturbation data ,network inference ,Orthogonale Regression ,ddc:621 ,ddc:500 ,621 Angewandte Physik ,SK 950 ,signal transduction ,570 Biowissenschaften ,Biologie - Abstract
Hochdurchsatzverfahren quantifizieren eine Vielzahl zellulärer Komponenten, können aber selten deren Interaktionen beschreiben. Daher wurden in den letzten 20 Jahren verschiedenste Netzwerk-Rekonstruktionsmethoden entwickelt. Insbesondere Perturbationsdaten erlauben dabei Rückschlüsse über funktionelle Mechanismen in der Genregulierung, Signal Transduktion, intra-zellulärer Kommunikation und anderen Prozessen zu ziehen. Dennoch bleibt Netzwerkinferenz ein ungelöstes Problem, weil die meisten Methoden auf ungeeigneten Annahmen basieren und die Identifizierbarkeit von Netzwerkkanten nicht aufklären. Diesbezüglich beschreibt diese Dissertation eine neue Rekonstruktionsmethode, die auf einfachen Annahmen von Perturbationsausbreitung basiert. Damit ist sie in verschiedensten Zusammenhängen anwendbar und übertrifft andere Methoden in Standard-Benchmarks. Für MAPK und PI3K Signalwege in einer Adenokarzinom-Zellline generiert sie plausible Netzwerkhypothesen, die unterschiedliche Sensitivitäten von PI3K-Mutanten gegenüber verschiedener Inhibitoren überzeugend erklären. Weiterhin wird gezeigt, dass sich Netzwerk-Identifizierbarkeit durch ein intuitives Max-Flow Problem beschreiben lässt. Dieses analytische Resultat erlaubt effektive, identifizierbare Netzwerke zu ermitteln und das experimentelle Design aufwändiger Perturbationsexperimente zu optimieren. Umfangreiche Tests zeigen, dass der Ansatz im Vergleich zu zufällig generierten Perturbationssequenzen die Anzahl der für volle Identifizierbarkeit notwendigen Perturbationen auf unter ein Drittel senkt. Schließlich beschreibt die Dissertation eine mathematische Weiterentwicklung der Modular Response Analysis. Es wird gezeigt, dass sich das Problem als analytisch lösbare orthogonale Regression approximieren lässt. Dies erlaubt eine drastische Reduzierung des nummerischen Aufwands, womit sich deutlich größere Netzwerke rekonstruieren und neueste Hochdurchsatz-Perturbationsdaten auswerten lassen. 'Omics' technologies provide extensive quantifications of components of biological systems but rarely characterize the interactions between them. To fill this gap, various network reconstruction methods have been developed over the past twenty years. Using perturbation data, these methods can deduce functional mechanisms in gene regulation, signal transduction, intra-cellular communication and many other cellular processes. Nevertheless, this reverse engineering problem remains essentially unsolved because inferred networks are often based on inapt assumptions, lack interpretability as well as a rigorous description of identifiability. To overcome these shortcoming, this thesis first presents a novel inference method which is based on a simple response logic. The underlying assumptions are so mild that the approach is suitable for a wide range of applications while also outperforming existing methods in standard benchmark data sets. For MAPK and PI3K signalling pathways in an adenocarcinoma cell line, it derived plausible network hypotheses, which explain distinct sensitivities of PI3K mutants to targeted inhibitors. Second, an intuitive maximum-flow problem is shown to describe identifiability of network interactions. This analytical result allows to devise identifiable effective network models in underdetermined settings and to optimize the design of costly perturbation experiments. Benchmarked on a database of human pathways, full network identifiability is obtained with less than a third of the perturbations that are needed in random experimental designs. Finally, the thesis presents mathematical advances within Modular Response Analysis (MRA), which is a popular framework to quantify network interaction strengths. It is shown that MRA can be approximated as an analytically solvable total least squares problem. This insight drastically reduces computational complexity, which allows to model much bigger networks and to handle novel large-scale perturbation data.
- Published
- 2021
14. Robust and nonparametric classification of gene expression data
- Author
-
Szekely, Robin, Kestler, Hans A., Schwenker, Friedhelm, Lausen, Berthold, and Hoffmann, Steve
- Subjects
Datasets as topic ,Classification ,Systembiologie ,Machine learning ,Klassifikation ,ddc:610 ,ddc:004 ,DDC 004 / Data processing & computer science ,Gene expression ,DDC 610 / Medicine & health ,Electronic data processing ,Data management ,Maschinelles Lernen - Abstract
Interpretable and accurate diagnostics models are one of the major components of personalised medicine. This setting shifts a conventional therapy of patients more to a treatment based on multiple molecular markers. Nowadays, a large amount of gene expression data can be obtained by technologies such as microarrays or RNA-Seq within hours or days. The analysis of gene expression data is special since they are high-dimensional: A very high number of measurements usually comes with a low number of samples. Due to the high dimensionality, manual verification by human experts is typically impossible. Automatic systems are needed for further analyses. Supervised learning is a possible way to predict diagnostic classes of unseen samples based on a set of molecular measurements. In this thesis, I analysed three topics that combine the aspects of data acquisition, feature selection and complexity reduction for the classification of gene expression data. In the first part, feature selection is analysed in a multi-class context. Multi-class classifier systems decompose a multi-class classification problem in numerous two-class base classifiers. The main question was how an individually tailored feature selection for the base classifiers compares to a common feature selection for the whole system. Cross-validation experiments were performed on 9 multi-class gene expression datasets with different feature set sizes and two filters as feature selection algorithms. I analysed the predictive performance of such systems along with the relative feature overlaps and the stability against resampling. The use of feature selection led to a better performance in over 80% of all experiments and nearly 60% of it was achieved by the individual feature selection. However, a commonly used feature signature for the multi-class classifier system showed only slightly lower performance for larger signatures. In this case, multi-class classifier systems achieved high accuracies even if individual members worked on possibly unspecific measurements. In the second part of this thesis I performed cross-validation experiments on the same 9 multi-class datasets as in the previous part and analysed if a transfer of foreign features can improve the prediction accuracy instead of using the original subspace. Indeed, the equal or higher accuracies could be achieved using foreign features instead of the original features in over 60% over all experiments. One of the possible reasons might be an overfitting of the original features. In addition, I analysed the behaviour of a correlation based feature selection that incorporates one foreign class used as an intermediate class to estimate the relationship between two original classes. The foreign feature selection algorithm was analysed empirically and the impact on the predictive performance was discussed. Using external knowledge from a foreign class to construct a feature selection either improved or lead to equal accuracies in over 67% of all experiments. An empirical analysis additionally showed that incorporating a foreign class leads to an underestimation of the original feature score in the vast majority of cases. For one aggregation strategy, in over 98% of all cases the original score was underestimated by a foreign feature selection. This enables to find markers suitable for the original classification task without explicitly knowing their relationship but by using an intermediate foreign class. The last part of this thesis focused on invariant linear classifiers which are not affected if test samples are distorted by different types of noise. These classification models come with a lower model complexity and are more robust than a traditional linear classifier. I discussed the invariance attributes and compared the performance of four subclasses of invariant linear classifiers on 27 two-class gene expression datasets as well as artificial datasets for multiple dimensions. Experiments were performed in cross-validation experiments and with two variants of invariant support vector machines. In addition, invariance attributes were confirmed experimentally on noisy artificial data. Overall, 15000 noisy artificial datasets were used in these experiments. The results showed that for high dimensions three out of four invariant linear classifiers achieved very similar results compared to the standard linear classifier, despite having a reduced model complexity. For the 27 gene expression datasets and all artificial datasets, the differences in accuracies were under 2%. An exception is the strictest invariant subclass that only operates on two markers. For this model, the accuracies could drop up to 30% compared to the general linear classifier. Additionally, an analysis of feature selecting invariant support vector machines on the 27 gene expression datasets revealed that on average only up to 0.51% of all markers are needed to construct an invariant set of features.
- Published
- 2021
- Full Text
- View/download PDF
15. Die ERK-Kaskade in der Pathophysiologie der Herzhypertrophie
- Author
-
Claßen, Alexandra
- Subjects
ddc:570 ,Systembiologie ,Herzhypertrophie - Abstract
ERK1/2 are known key players in the pathophysiology of heart failure, but the members of the ERK cascade, in particular Raf1, can also protect the heart from cell death and ischemic injury. An additional autophosphorylation (ERK1 at Thr208, ERK2 at Thr188) empowers ERK1/2 translocation to the nucleus and phosphorylation of nuclear targets which take part in the development of cardiac hypertrophy. Thereby, targeting this additional phosphorylation is a promising pharmacological approach. In this thesis, an in silico model of ERK cascade in the cardiomyocyte is introduced. The model is a semi-quantitive model and its behavior was tested with different softwares (SQUAD and CellNetAnalyzer). Different phosphorylation states of ERK1/2 as well as different stimuli can be reproduced. The different types of stimuli include hypertrophic as well as non-hypertrophic stimuli. With the introduced in-silico model time courses and synergistic as well as antagonistic receptor stimuli combinations can be predicted. The simulated time courses were experimentally validated. SQUAD was mainly used to make predictions about time courses and thresholds, whereas CNA was used to analyze steady states and feedback loops. Furthermore, new targets of ERK1/2 which partially contribute, also in the formation of cardiac hypertrophy, were identified and the most promising of them were illuminated. Important further targets are Caspase 8, GAB2, Mxi-2, SMAD2, FHL2 and SPIN90. Cardiomyocyte gene expression data sets were analyzed to verify involved components and to find further significantly altered genes after induced hypertrophy with TAC (transverse aortic constriction). Changes in the ultrastructure of the cardiomyocyte are the final result of induced hypertrophy., ERK1/2 sind bekannte Schlüsselfiguren bei der Entstehung der Herzinsuffizienz. Weitere Komponenten der ERK-Kaskade, insbesondere Raf1, können das Herz jedoch vor Zelltod und ischämischem Schaden schützen. Eine zusätzliche Autophosphorylierung von ERK1 an Thr208 bzw. von ERK2 an Thr188 ermöglicht ERK1/2 die Translokation zum Zellkern und befähigt ERK dort zur Phosphorylierung von nukleosolischen Zielproteinen, welche eine Herzmuskelhypertrophie auslösen. Daher erscheint diese zusätzliche Autophosphorylierung als eine vielversprechende pharmakologische Zielstruktur. In dieser Arbeit wird ein in-silico Modell der ERK-Kaskade im Kardiomyozyten präsentiert. Das Modell ist ein semi-quantitatives Modell und wurde mit den Programmen SQUAD und CellNetAnalyzer getestet. Verschiedene Phosphorylierungs-Zustände von ERK1/2 als auch verschiedene Stimuli (hypertrophe als auch nicht-hypertrophe) können mit dem Modell reproduziert werden. Mit dem präsentierten in-silico Modell können sowohl zeitliche Abläufe als auch synergistische und antagonistische Effekte vorhergesagt werden. Die simulierten zeitlichen Abläufe wurden durch in-vitro Experimente validiert. SQUAD wurde hauptsächlich für die Modellierung von zeitlichen Abläufen und Schwellenwerte genutzt, wohingegen CellNetAnalyzer vor allen Dingen zur Analyse von Fließgleichgewichten und Rückkopplungs-Mechanismen genutzt wurde. Darüberhinaus wurden Zielstrukturen von ERK1/2, welche zusätzlich an der Entstehung der Herzhypertrophie mitwirken, identifiziert. Diese umfassen unter anderem Caspase 8, GAB2, Mxi-2, SMAD2, FHL2 und SPIN90. Gen-Expressions-Datensätze von Kardiomyozyten nach TAC (transverse aortic constriction) wurden analysiert. Diese wurden mit den im Model vorhandenen Strukturen verglichen und signifikant veränderte Expressionslevel wurden identifiziert. Veränderungen der Ultrastruktur des Kardiomyozyten sind das Ergebnis der induzierten Hypertrophie.
- Published
- 2021
- Full Text
- View/download PDF
16. Visual Exploration and Analytics of Disease Maps with the MINERVA Platform
- Author
-
Ostaszewski, Marek and Schneider, Reinhard
- Subjects
MINERVA Platform ,Systems Biology ,Systembiologie ,Visual Analysis ,Disease Maps - Abstract
Disease maps are knowledge repositories that support the discovery process of molecular mechanisms of human diseases by elucidating complex cross-talks of multiple relevant pathways. At the core of disease maps are diagrams that are constructed following the standards of systems biology. These diagrams can be used for exploration and visual analytics but requires a proper set of tools. The MINERVA Platform is a web server developed for the visual analysis of molecular interaction diagrams, especially disease maps. We discuss different aspects of discovery processes in disease maps, including their reproducibility. We illustrate them with examples using the MINERVA Platform. Extensive exploration is enabled through interactive browsing, the visualization of protein structures and multi-omics datasets, and integration with databases of drug, chemical or miRNA targets. The platform offers a contextualized view of omics datasets, including genetic variants, improving their interpretation. Reproducible and customizable analytics is attainable via dedicated API and plugins, allowing the establishment of entire visualization workflows. In summary, the MINERVA Platform supports exploration and visual analysis of complex disease maps by offering dedicated, built-in functionalities, but also by flexible data interfaces., Disease Maps sind Wissensspeicher, die den Erkenntnisprozess der molekularen Mechanismen menschlicher Krankheiten unterstützen, indem sie komplexe Querverbindungen zwischen mehreren relevanten Signalwegen aufdecken. Der Kern von Disease Maps sind Diagramme, die nach systembiologischen Standards konstruiert sind. Diese Diagramme können zur Exploration und zur visuelle Analysen verwendet werden, erfordern aber ein geeignetes Set von Werkzeugen. Die MINERVA-Plattform ist ein Webserver, der für die visuelle Analyse von molekularen Interaktionsdiagrammen, insbesondere von Krankheitsdiagrammen entwickelt wurde. Wir diskutieren verschiedene Aspekte von Entdeckungsprozessen in Krankheitskarten, einschließlich ihrer Reproduzierbarkeit und veranschaulichen sie mit Beispielen unter Verwendung der MINERVA Plattform. Eine umfangreiche Visualisierung ermöglicht die Darstellung von Proteinstrukturen und Multi-omics-Datensätzen, und die Integration mit Datenbanken von Medikamenten, Chemikalien oder miRNA-Targets. Die Plattform bietet eine kontextualisierte Ansicht von Omics-Datensätzen, einschließlich genetischer Varianten, und verbessert so deren Interpretation. Reproduzierbare und anpassbare Analytikverfahren können über dedizierte API’s und Plugins angesprochen werden, was die Erstellung ganzer Visualisierungs-Workflows ermöglicht. Zusammenfassend lässt sich sagen, dass die MINERVA Plattform die Exploration und visuelle Analyse komplexer Krankheitskarten unterstützt, indem sie dedizierte, eingebaute Funktionalitäten bereitstellt, aber auch durch flexible Datenschnittstellen erweitert werden kann., Mission – Innovation: Telematics, eHealth and High-Definition Medicine in Patient-Centered Acute Medicine, p. 129
- Published
- 2021
- Full Text
- View/download PDF
17. Modelling pathway crosstalk and dynamics with qualitative models
- Author
-
Kühlwein, Silke Daniela, Kestler, Hans A., and Kühl, Michael
- Subjects
Qualitative Modelle ,DDC 570 / Life sciences ,Netzwerktheorie ,Pathway prediction ,System analysis ,ddc:570 ,Systembiologie ,Modeling ,Modellierung ,Systems biology ,Boolsche Netzwerke - Abstract
Given the complex nature of biological systems and organisms, the examination of single protein interactions is not enough to understand ageing, the development of diseases or cancer. For this reason, this thesis aimed to explore new relationships between signalling pathways. This was achieved by studying various signalling pathways with Boolean network models. First, the crosstalk of insulin-like growth factor 1 (IGF-1) and Wingless (Wnt), as well as the signalling pathway of nuclear factor kappa-light chain-enhancer of activated B-cells (NF- B) were investigated by a literature-based and a data-driven approach. Despite huge differences in the model setups, similar conclusions were drawn from model simulations. Although the process of ageing could only be simulated by crosstalk of IGF-1 and Wnt, it could be shown that Wnt signalling dominates IGF-1 by impairing feedback. Thereby, proteins maintain their activity state. Likewise, proteins that were constantly inactive could be found in the reconstructed NF- B networks of young and aged phenotype. Network analyses further indicated a loss of redundant protein interactions accompanied by an escalation in error susceptibility with age. These alterations in activity and accumulation of damage can, in turn, be attributed to the development of ageing-associated diseases. In particular, activation of the mammalian target of rapamycin complex 1 (mTORC1) could be identified in the IGF-1/Wnt model, which can be associated with the development of diabetes mellitus type II and the inhibition of autophagy. Likewise, constantly inactive components in the NF- B model seem to be involved in a decreased inflammatory response and reduced angiogenesis. The next step in this work was to investigate the role of cofilin-1 (CFL1) in pancreatic cancer. Previously it was already known that CFL1 is highly expressed in pancreatic cancer and correlates with high invasiveness and poor prognosis. However, pathways that contribute to fast cancer progression were still unknown. Based on a Boolean network model newly established in this thesis, it was possible to predict them. Model simulations indicated that Kirsten rat sarcoma (KRAS) induces an imbalance in actin remodelling leading to overexpression and activation of CFL1. Due to the imbalance in actin remodelling, it seems that the expression of the transcription factor 7-like 2 (TCF7L2) can no longer be suppressed by protein kinase D1 (PRKD1) which leads to an increased expression of TCF7L2 itself and subsequently induces the expression of CFL1. In addition, the activator of CFL1, slingshot (SSH1L), seems to be increasingly expressed by an increased AURKA expression. Thus, CFL1 would not only be present in increased quantities but can also be activated. These model-based assumptions that both AURKA and TCF7L2 are overexpressed in pancreatic cancer patients could be confirmed by gene expression data from pancreatic cancer tissues. Besides the signalling pathway leading to the overexpression and activation of CFL1, the model could also provide an explanation for the involvement of CFL1 in proliferation control and apoptosis inhibition. Here, model simulations suggested that CFL1 regulates cell cycle components based on its impact on the signal transducer and activator of transcription 3 (STAT3). This assumption could be supported by western blots showing reduced protein levels of STAT3. Moreover, STAT3 also seems to be involved in the abrogation of apoptosis in pancreatic cancer cells by inducing the expression of anti-apoptotic proteins. In addition, to reveal the role of CFL1 in pancreatic cancer, the newly established model was used to suggest new therapeutic targets for pancreatic cancer patients with high CFL1 expression. Here, the most promising identified intervention target was CD44 antigen whose in silico inhibition blocked the proliferative phenotype and induced apoptosis. The last part of this thesis dealt with the identification of dynamic-influencing nodes, called implicants. Here, a new algorithm was established that is able to identify these implicants in a feasible time frame. By studying 35 publically available, biologically motivated Boolean network models, it could be shown that a small set of nodes is sufficient to determine the dynamics of a complete system. Although highly connected components (hubs) are frequently considered to be master regulators of biological processes, the majority of implicants were not static hubs. Furthermore, it could be shown that targeting these implicants reduces the risk for side effects in comparison to targeting static hubs. The superiority of dynamic influencing-targets versus static hubs was confirmed by experimental validation of a newly established Boolean network model depicting the crosstalk of Wnt and mitogen activating protein kinase (MAPK) in colorectal cancer. Based on this model dynamic determining proteins were identified. The two most promising targets, extracellular signal-regulated protein kinase (ERK) and cancerous inhibitor of protein phosphatase 2A (CIP2A) were treated with specific inhibitors. Thereby, it was shown that their inhibition reduced the proliferative and invasive potential of colorectal cancer cells.
- Published
- 2021
- Full Text
- View/download PDF
18. Identification of differential regulation in central carbon metabolism between related cell lines
- Author
-
Rainer, Roman Josef, Klipp, Edda, Sawitzki, Birgit, and Banga, Julio R.
- Subjects
Optimization ,Colon Cancer ,Systems Biology ,Optimierung ,T cells ,XH 4213 ,XH 7211 ,T-Zellen ,XH 7213 ,ddc:570 ,Systembiologie ,Regularisierung ,Regularization ,Darmkrebs ,570 Biowissenschaften ,Biologie - Abstract
Darmkrebszellen und T-Zellen regulieren ihren zentralen Kohlenstoffmetabolismus um ihren anabolen Bedarf zu erfüllen. Tumorzellen mit einer KRAS- oder BRAF-Mutation zeigen ein schnelles Wachstum, welches eine Umprogrammierung des Metabolismus vor aussetzt. Der mitochondriale T-Zellen-Aktivierungsinhibitor (TCAIM) ist bekannt dafür die mitochondriale Zellstruktur zu beeinflussen. Der Einfluss auf den Metabolismus nicht klar. In dieser Arbeit präsentiere ich erstmalig ein mathematische Model des zentralen Kohlen stoffmetabolismus in Darmkrebszellen und T-Zellen. Mithilfe dieses Modells analysiere ich, wie sich die Regulation in ähnlichen Zelllinien unterscheidet. In Bezug auf die Darm krebszellen vergleiche ich BRAF-(CaCO2-BRAFV600E), KRAS-(CaCO2-KRASG12V) mu tierte Zelllinien mit einer Basiszelllinie (CaCO2-control) und zeige, dass der Kohlenstoff metabolismus in BRAF-mutierten Zellen im Vergleich zu den beiden übrigen Zelllinien herabreguliert ist. Das Modell bestätigt außerdem, dass der Monocarboxylattransporter (MCT) in den Darmkrebszellen eine wichtige Rolle, insbesondere in den KRAS mu tierten Zellen, spielt. In T-Zellen zeigt der Vergleich von Wildtypzellen (CD8 T-Zellen) mit TCAIM homozygoten Zellen (TCAIM homozygote CD8 T-Zellen), dass der Kohlen stoffmetabolismus in zweiteren überwiegend herabreguliert und weniger aktiv ist. Diesen Effekt konnte ich durch die Analyse von RNASeq-Daten der jeweiligen Zelltypen bestä- tigen. Des Weiteren stelle ich fest, dass sich der Tricarbonsäurezyklus umkehrt, wenn durch die Glykolyse nicht ausreichend Laktat exportiert und die Biomasseproduktion unterstützt werden kann. Meine Arbeit stellt damit insgesamt einen neuartigen Ansatz zur Integration von Meta bolomik und RNAseq Daten dar, um die Regulation des zentralen Kohlenstoffmetabo lismus zu verstehen. Colon cancer cells and T cells regulate central carbon metabolism to meet their anabolic needs. In KRAS and BRAF tumors, metabolic reprogramming is a premise to support rapid proliferation. In T cells, the mitochondrial T cell activation inhibitor (TCAIM) is known to affect mitochondrial morphology but its effect on cellular metabolism is not well understood. Via mathematical modelling, I investigate the differential regulation of closely related cell lines. I present the first mathematical model for colon cancer and T cell metabolism, unraveling differential regulation between related cell lines. The model shows that CaCO2-BRAFV600Ecells are mostly downregulated compared to CaCO2-KRASG12Vand CaCO2-control. Additionally, it demonstrates the critical role of monocarboxylate transporter (MCT), especially for CaCO2-KRASG12V. Concerning T cells, I compare wild-type T cells to homozygous TCAIM T cells. This unveils that TCAIM homozygous cells have a mostly downregulated TCA cycle, validated by RNASeq data, and are less metabolically active than wild-type T cells. Furthermore, if the glycolytic flux is not sufficient to support lactate export and biomass production, the model reveals that the TCA cycle is reversed as it requires less regulation. Taken together, this work presents a novel approach to integrate data referring to metabolic and genetic regulation of metabolism. On this basis, we can now better discriminate the metabolic capacity of CaCO2-control, CaCO2-BRAFV600E, CaCO2-KRASG12V, wildtype CD8 T cells, and homozygous TCAIM CD8 T cells.
- Published
- 2020
19. From condition-specific interactions towards the differential complexome of proteins
- Author
-
Will, Thorsten
- Subjects
Systembiologie ,Bioinformatik ,Transkriptionsfaktor ,Multiproteinkomplex - Published
- 2020
- Full Text
- View/download PDF
20. Estimating Gene Regulatory Activity using Mathematical Optimization
- Author
-
Trescher, Saskia, Leser, Ulf, Nowick, Katja, and Siebert, Heike
- Subjects
Systembiologie ,Mathematical optimization ,regulatorisches Netzwerk ,Mathematische Optimierung ,WC 7700 ,ddc:004 ,Regulatory network ,Systems biology ,004 Informatik ,Genregulation ,Gene regulation - Abstract
Die Regulation der Genexpression ist einer der wichtigsten zellul��ren Prozesse und steht in Zusammenhang mit der Entstehung diverser Krankheiten. Regulationsmechanismen k��nnen mit einer Vielzahl von Methoden experimentell untersucht werden, zugleich erfordert die Integration der Datens��tze in umfassende Modelle stringente rechnergest��tzte Methoden. Ein Teil dieser Methoden modelliert die genomweite Genexpression als (lineares) Gleichungssystem ��ber die Aktivit��t und Beziehungen von Transkriptionsfaktoren (TF), Genen und anderen Faktoren und optimiert die Parameter, sodass die gemessenen Expressionsintensit��ten m��glichst genau wiedergegeben werden. Trotz ihrer gemeinsamen Wurzeln in der mathematischen Optimierung unterscheiden sich die Methoden stark in der Art der integrierten Daten, im f��r ihre Anwendung notwendigen Hintergrundwissen, der Granularit��t des Regulationsmodells, des konkreten Paradigmas zur L��sung des Optimierungsproblems, und der zur Evaluation verwendeten Datens��tze. In dieser Arbeit betrachten wir f��nf solcher Methoden und stellen einen qualitativen und quantitativen Vergleich auf. Unsere Ergebnisse zeigen, dass die ��berschneidungen der Ergebnisse sehr gering sind, was nicht auf die Stichprobengr����e oder das regulatorische Netzwerk zur��ckgef��hrt werden kann. Ein Grund f��r die genannten Defizite k��nnten die vereinfachten Modelle zellul��rer Prozesse sein, da diese vorhandene R��ckkopplungsschleifen ignorieren. Wir schlagen eine neue Methode (Florae) mit Schwerpunkt auf die Ber��cksichtigung von R��ckkopplungsschleifen vor und beurteilen deren Ergebnisse. Mit Flor�� k��nnen wir die Identifizierung von Knockout- und Knockdown-TF in synthetischen Datens��tzen verbessern. Unsere Ergebnisse und die vorgeschlagene Methode erweitern das Wissen ��ber genregulatorische Aktivit��t k��nnen die Identifizierung von Ursachen und Mechanismen regulatorischer (Dys-)Funktionen und die Entwicklung von medizinischen Biomarkern und Therapien unterst��tzen., Gene regulation is one of the most important cellular processes and closely interlinked pathogenesis. The elucidation of regulatory mechanisms can be approached by many experimental methods, yet integration of the resulting heterogeneous, large, and noisy data sets into comprehensive models requires rigorous computational methods. A prominent class of methods models genome-wide gene expression as sets of (linear) equations over the activity and relationships of transcription factors (TFs), genes and other factors and optimizes parameters to fit the measured expression intensities. Despite their common root in mathematical optimization, they vastly differ in the types of experimental data being integrated, the background knowledge necessary for their application, the granularity of their regulatory model, the concrete paradigm used for solving the optimization problem and the data sets used for evaluation. We review five recent methods of this class and compare them qualitatively and quantitatively in a unified framework. Our results show that the result overlaps are very low, though sometimes statistically significant. This poor overall performance cannot be attributed to the sample size or to the specific regulatory network provided as background knowledge. We suggest that a reason for this deficiency might be the simplistic model of cellular processes in the presented methods, where TF self-regulation and feedback loops were not represented. We propose a new method for estimating transcriptional activity, named Florae, with a particular focus on the consideration of feedback loops and evaluate its results. Using Flor��, we are able to improve the identification of knockout and knockdown TFs in synthetic data sets. Our results and the proposed method extend the knowledge about gene regulatory activity and are a step towards the identification of causes and mechanisms of regulatory (dys)functions, supporting the development of medical biomarkers and therapies.
- Published
- 2020
21. Modeling regulatory processes with qualitative networks
- Author
-
Schwab, Julian, Kestler, Hans A., and Kühl, Michael
- Subjects
Boolean Networks ,Algebra, Boolean ,Control theory ,Systembiologie ,Regulatory Systems ,Boolesches Netz ,DDC 004 / Data processing & computer science ,ddc:004 ,Systems biology - Abstract
In systems biology, dynamic computer models are used to simulate the changing behavior of a system over time. Boolean networks are one popular class of dynamic models for regulatory processes. These models are based on propositional logic. They are used as tools to predict the qualitative behavior of a system over time. Stable states in the dynamics of Boolean networks are called attractors. Attractors are of particular interest for researchers as they represent biological phenotypes. Simulation of Boolean networks under perturbed conditions can help to identify drugable targets in a system. This work comprises different methods for model- ing and simulation of Boolean networks under normal and perturbed conditions. An algorithm to automatically detect meaningful perturbations and perturbation combinations which result in a user-specified change of the underlying network’s dynamics was developed. This algorithm aims to reduce the simulation effort when searching for specific effects on the system’s behavior. These methods are integrated into a framework for Boolean network modeling, called ViSiBooL. This framework was used to create and simulate a literature-based model of the Wnt/IGF crosstalk in hematopoietic stem-cells. The automated screening algorithm was successfully applied for target identification in a model of the senescence-associated regulatory phenotype after DNA damage. Boolean networks can be reconstructed from time-series data. The new reconstruc- tion pipeline in this work reduces computation time and increases the sensitivity of the predicted regulations compared to the compared base algorithm. Robustness is an essential property of biological systems, which makes it sustain- able against various kinds of stress. In this work, the changing robustness of a biological system during the process of aging was analyzed. Exhaustive attractor search in Boolean networks is an NP-hard problem which limits the manageable size of Boolean networks. An implementation of Boolean networks and attractor search on programmable hardware chips, called FPGAs, accelerates the attractor search by orders of magnitude. The simulation on these specialized hardware chips enables a more detailed analysis of larger networks than with software-based approaches.
- Published
- 2020
22. From Parts to the Whole
- Author
-
Hahn, Jens, Klipp, Edda, Dittmar, Gunnar, and Brockmann, Dirk
- Subjects
WD 9200 ,ddc:570 ,Systembiologie ,WF 9500 ,Whole-cell model ,mathematical modeling ,mathematische Modellierung ,WL 5190 ,Saccharomyces cerevisiae ,Ganzzellmodell ,Systems biology ,570 Biowissenschaften ,Biologie - Abstract
Die Durchführung von Experimenten und das mathematische Modellieren von zellulären Prozessen gehören in der Systembiologie untrennbar zusammen. Das gemeinsame Ziel ist die Aufklärung des Zusammenspiels intrazellulärer Prozesse wie Metabolismus, Genexpression oder Signaltransduktion. Während sich molekularbiologische Untersuchungen mit den molekularen Mechanismen einzelner isolierter Systeme beschäftigen, zielt die Systembiologie auf die Aufklärung der Zusammenhänge ganzer Prozesse und schließlich auch ganzer Zellen ab. Die Verfügbarkeit von umfangreichen Datensätzen und die steigenden Möglichkeiten im Bereich der Computersimulation haben in den letzten Jahren den Weg geebnet, um auch Ganzzellsimulationen nicht mehr unmöglich erscheinen zu lassen. Diese Arbeit stellt das erste eukaryotische Ganzzellmodell der Bäckerhefe Saccharomyces cerevisiae vor. Hefe als eukaryotischer Modellorganismus ist hierbei der perfekte Kandidat für die Erstellung eines solchen Modells. Er bietet, als wohl meist erforschter eukaryotischer Einzeller in Verbindung mit der Verfügbarkeit einer großen Menge experimenteller Daten, beste Voraussetzungen zur Erstellung eines solchen Modells. Das Projekt ist hierbei in drei Teile gegliedert: i) Die Erstellung eines modularen Ganzzellmodells das alle zellulären Funktionen wie Zellzyklus, Genexpression, Metabolismus, Transport und Wachstum abbildet. ii) Die Implementation einer spezialisierten Simulationsumgebung in Verbindung mit einer Datenbank, um die Erstellung, Simulation und Parametrisierung von Modulen zu ermöglichen. iii) Die Durchführung von Experimenten, um einen ganzheitlichen Datensatz zu erlangen, der Wachstum, Genexpression und Metabolismus abbildet. Die hier vorgestellte Arbeit liefert nicht nur ein mathematisches Modell, sondern benennt auch die Herausforderungen, die während der Arbeit an einem Ganzzellmodell auftreten und stellt mögliche Lösungsansätze vor., In systems biology experiments and mathematical modeling are going hand in hand to gain and increase understanding of cellular processes like metabolism, gene expression, or signaling pathways. While molecular biology investigates single isolated parts and molecular mechanisms of cellular processes, systems biology aims at unraveling the whole process and ultimately whole organisms. Today the availability of comprehensive high-throughput data and computational power paved the way to increase the size of analyzed systems to reach the cellular level. This thesis presents the first whole-cell model (WCM) of a eukaryotic cell, the yeast Saccharomyces cerevisiae. This established model organism is the perfect candidate for the implementation of a holistic model based on the available experimental data and the accumulated biological knowledge. The project is split into three parts: i) The creation of a modular functional-complete whole-cell model, combining the processes cell cycle, gene expression, metabolism, transport, and growth. ii) The implementation of a specialized simulation environment and a database to support module creation, simulation, and parameterization. iii) The elicitation of experimental data by conducting an experiment to achieve a comprehensive data set for parameterization, combining growth, metabolic, proteomic, and transcriptomic data. The presented work provides not only a simple mathematical model but also addresses challenges occurring during the development of whole-cell models and names possible solutions and new methodologies required for the creation of WCMs.
- Published
- 2020
- Full Text
- View/download PDF
23. RobustQ : ein Webservice zur Quantifizierung zellulärer Robustheit in metabolischen Modellen
- Author
-
Viehböck, Dominic
- Subjects
Metabolische Modelle ,Quantification of cellular robustness ,Systembiologie ,Minimal Cut Sets (MCS) ,Genome-scale metabolic models ,Systems biology ,Quantifizierung zellulärer Robustheit - Abstract
Diese Arbeit stellt einen öffentlich zugänglichen Webdienst namens RobustQ vor, welcher es ermöglicht zelluläre Robustheit in Stoffwechselmodellen zu quantifizieren. RobustQ nutzt neue Methoden der Systembiologie und basiert auf dem Konzept der \textit{probility of failure} (PoF), um ein quantitatives Maß für die Robustheit einer Zelle abzuleiten. Der PoF ist definiert als der (gewichtete) Teil der tödlichen Kombination von Reaktionen von allen möglichen Kombinationen von Reaktionen, die zu einem Funktionsverlust führen (auch bekannt als Minimal Cut Sets, MCS). Zur Berechnung integriert RobustQ eine neue benutzerfreundliche Bioinformatik-Pipeline, die ein vorhandenes Stoffwechselmodell im SBML-Format als Eingabe verwendet. Dem Benutzer wird die Möglichkeit gegeben Berechnungsparameter festzulegen und den PoF des Modells automatisch berechnen zu lassen. Dank der jüngsten Entwicklungen und Verbesserungen in dieser Pipeline kann dies sogar in absehbarer Zeit in Stoffwechselmodellen im Genommaßstab erfolgen (genome scale metabolic models, GSMMs). Sehr große Modelle bleiben jedoch weiterhin eine rechnertechnische Herausforderung. RobustQ ist in Python 3 geschrieben und verwendet Django, ein Webframework, und Celery, ein Task-Managementsystem. Die erfolgreiche Anwendung und Nützlichkeit von RobustQ wird anhand der Quantifizierung der Robustheit mehrerer öffentlich verfügbarer GSMM demonstriert. Unsere Ergebnisse zeigen, dass der PoF effektiv für eine Vielzahl von Organismen berechnet werden kann. Außerdem wird gezeigt, dass diese Organismen selbst bei Stämmen derselben Art sehr unterschiedliche Robustheitswerte aufweisen. Des weiteren wurden von Patienten abgeleitete metabolische Modelle von diversen Krebsarten untersucht. Es hat sich gezeigt, dass bei Krebsarten des gleichen Typs eine große Heterogenität, bezogen auf die metabolischen Robustheit, vorliegt. Diese Beobachtung wird von aktuellen Studien gestützt. In this thesis, we present a publicly available web service termed RobustQ to quantify cellular robustness in metabolic models. RobustQ leverages new methods of systems biology and makes use of the concept of the probability of failure (PoF) to infer a quantitative measure of a cell's robustness. The PoF is defined as the (weighted) portion of lethal combination of reactions of all possible combinations of loss-of-function mutations, also known as minimal cut sets (MCS). To calculate it, RobustQ integrates a new user-friendly bioinformatics pipeline that takes a metabolic model in SBML format as input, lets the user set their calculation parameters, and conveniently evaluates the model's PoF. Thanks to recent developments and improvements in this process, this can even be done in genome-scale metabolic models in a timely manner. However, very large models remain computationally challenging. RobustQ is written in Python 3 and makes use of Django, a web framework, and Celery, a distributed task queue system. We demonstrate its usefulness by quantifying the robustness of multiple publicly available genome-scale metabolic models. Our results show that the PoF can effectively be calculated for a wide array of organisms across all domains of life, and that these organisms possess widely varying robustness measures, even across strains of the same species. We further examined patient-derived genome scale metabolic cancer models which, in cancers of the same type, unveil a large heterogeneity from a metabolic robustness perspective, confirming what recent studies have shown. vorgelegt von: Dominic Viehböck Auch als Printexemplar in der Bibliothek verfügbar Wien, FH Campus Wien, Masterarb., 2020
- Published
- 2020
24. Understanding metabolic robustness of Escherichia coli using genetic and environmental perturbations
- Author
-
Donati, Stefano and Link, Hannes (Dr.)
- Subjects
Metabolism ,Biowissenschaften, Biologie ,Systembiologie ,ddc:570 ,Mikrobiologie ,Escherichia coli ,Life sciences - Abstract
Metabolism provides the essential biochemical intermediates and energy that enable life and its growth. In this thesis we studied robustness of Escherichia coli metabolism, by perturbing it with different methods and measuring the response at a molecular level. In Chapter 1, we introduce the latest insight into metabolic regulation and optimality in microbial model organisms. Overall, we identified and described two major gaps in knowledge: the limited amount of known metabolite-protein interactions and the unknown objectives towards which cells optimize their enzyme levels. Moreover, we provide a short introduction to the relevant methods utilized in this thesis. In Chapter 2, we describe a series of experiments which confirmed that CRISPRi is a reliable tool to specifically perturb metabolism in E. coli. We showcase the advantage of using a CRISPRi system integrated in the genome, which is suitable to apply inducible knockdowns of essential genes. We demonstrate this by characterizing growth for a library of over 100 strains and verifying inducibility and specificity with proteomics data. In Chapter 3 we applied the validated CRISPRi setup to perturb and study metabolism systematically. First, we used a pooled CRISPRi library to knock down all metabolic genes in E. coli. By following the appearance of growth defects with next generation sequencing, we show that metabolic enzymes are expressed at higher levels than strictly necessary. We then focused on a panel of 30 CRISPRi strains and characterize their response to lower enzyme levels with metabolomics and proteomics. We show that the metabolome can buffer perturbations of enzyme levels in two different stages: first, metabolites increase enzyme activity to maintain optimal growth and only later they activate gene regulatory feedbacks to specifically upregulate perturbed pathways. In Chapter 4 we employed a different approach to perturb bacterial metabolism, by growing E. coli in different environmental conditions and measuring the response at the metabolome level. We could show that in exponentially growing cells key biosynthetic products as amino acids and nucleotides are kept at relatively stable levels across different environments. We compared our dataset to a matching published proteomics dataset, showing that unlike the proteome, metabolite levels are independent from growth effects., Der Stoffwechsel, oder auch Metabolismus, stellt die essentiellen Bausteine und die Energie bereit, die Leben und zelluläres Wachstum voraussetzen. In dieser Doktorarbeit wurde die Robustheit des Metabolismus von Escherichia coli untersucht, indem er mit verschiedenen Methoden perturbiert und die zelluläre Antwort auf molekularer Ebene verfolgt wurde. In Kapitel 1 werden die neuesten Erkenntnisse über die Regulation und Optimalität des Metabolismus in mikrobiellen Modellorganismen betrachtet. Zusammenfassend ließen sich zwei große Probleme feststellen: Zum einen die niedrige Zahl an nachgewiesenen Metabolit-Protein Interaktionen und zum anderen die unbekannten Ziele, auf deren Grundlage Bakterien ihre Enzymlevel regulieren und einstellen. Darüber hinaus werden in diesem Kapitel die für diese Arbeit relevanten und verwendeten Methoden besprochen. In Kapitel 2 werden eine Reihe von Experimenten beschrieben, die bestätigen, dass CRISPRi eine zuverlässige Methode ist, um den Metabolismus in E. coli spezifisch zu perturbieren. Außerdem werden die Vorteile von einem genomisch integriertem CRISPRi-System gezeigt, das dazu verwendet werden kann die Expression von essentiellen Genen induzierbar zu reprimieren. Die Induzierbarkeit und Spezifität konnten durch ein Wachstumsscreening von 100 Stämmen und Proteom-Analysen belegt werden. In Kapitel 3 wird dargestellt, wie das im vorherigen Kapitel beschriebene CRISPRi- System verwendet wurde, um den Metabolismus systematisch zu perturbieren und zu untersuchen. Zunächst wurde das Wachstum von Stämmen in einer gepoolten CRISPRi-Library, welche alle Gene im zentralen Stoffwechsel von E. coli beinhaltete, mittels Next-Generation Sequencing verfolgt. Hierbei konnte gezeigt werden, dass Enzyme im zentralen Metabolismus in höheren Mengen von der Zelle hergestellt werden, als es für die Aufrechterhaltung des Wachstums nötig wäre. Es wurden 30 CRISPRi Stämme mit Hilfe von Metabolomics und Proteomics genauer untersucht, um die zelluläre Antwort auf niedrigere Enzymlevel zu studieren. Hierbei konnte festgestellt werden, dass das Metabolom die Störung von Enzymleveln auf zwei unterschiedliche Wege puffern kann. Zunächst erhöhen Metabolite die Aktivität von Enzymen, um optimales Wachstum zu gewährleisten, und erst später aktivieren sie genregulatorische Feedback-Mechanismen, um perturbierte Stoffwechselwege spezifisch hochzuregulieren. In Kapitel 4 wird geschildert, wie eine alternative Methode, nämlich das Wachstum unter verschiedenen Bedingungen, genutzt wurde, um den Metabolismus zu perturbieren und anschließend die metabolische Antwort zu bestimmen. Hierbei konnte gezeigt werden, dass in exponentiell wachsenden Zellen unter verschiedenen Wachstumsbedingungen die Konzentrationen von Schlüsselbausteinen, wie Aminosäuren und Nukleotiden, stabil gehalten werden. Diese Daten wurden zudem mit einem passenden, bereits publizierten Proteomics Datensatz verglichen und es konnte gezeigt werden, dass Metabolitkonzentrationen, im Gegensatz zu Proteinkonzentrationen, unabhängig von Wachstumseffekten sind.
- Published
- 2020
25. Leben systembiologisch
- Author
-
Martin Döring
- Subjects
Biowissenschaften ,Forschung ,GND ,Simulation ,Systembiologie ,Technikfolgenabschätzung ,Technology ,Social Sciences - Published
- 2012
- Full Text
- View/download PDF
26. Tibetische Rezepturen als pleiotrope Signaturen - Einsatz von Netzwerk-Arzneien bei Multimorbidität.
- Author
-
Schwabl, Herbert, Vennos, Cécile, and Saller, Reinhard
- Abstract
Copyright of Research in Complementary Medicine / Forschende Komplementärmedizin is the property of Karger AG and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2013
- Full Text
- View/download PDF
27. Omics und Systembiologie.
- Author
-
Oberbauer, R.
- Abstract
Copyright of Der Nephrologe is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2012
- Full Text
- View/download PDF
28. Chinesische Medizin als vegetative Systembiologie.
- Author
-
Greten, H.J.
- Abstract
Copyright of HNO is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2011
- Full Text
- View/download PDF
29. Biofunktionale Alter(n)sdiagnostik des Menschen.
- Author
-
Pöthig, D., Gerdes, W., Viol, M., Wagner, P., and Simm, A.
- Abstract
Copyright of Zeitschrift für Gerontologie und Geriatrie is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2011
- Full Text
- View/download PDF
30. Public Health Genomics.
- Author
-
Brand, A., Rosenkötter, N., Schulte in den Bäumen, T., and Schröder-Bäck, P.
- Published
- 2009
- Full Text
- View/download PDF
31. Mathematische Modellierung in der Systembiologie.
- Author
-
Groh, A., Louis, A.K., Weichert, F., Richards, T., and Wagner, M.
- Abstract
Copyright of Der Pathologe is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2008
- Full Text
- View/download PDF
32. Virtuelles Gewebe.
- Author
-
Wagner, M., Breiner, T., Betz, T., Bernhardt, I., Pütz, N., Weichert, F., Shamaa, A., Brochhausen, M., Awad, S., Richards, T., Groh, A., Linder, R., and Landes, C.A.
- Abstract
Copyright of Der Pathologe is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2008
- Full Text
- View/download PDF
33. Signaltheoretische Analyse histologischer Daten im Ortsfrequenzraum.
- Author
-
Weichert, F., Groh, A., Shamaa, A., Richards, T., Awd, S., Linder, R., Landes, C.A., and Wagner, M.
- Abstract
Copyright of Der Pathologe is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2008
- Full Text
- View/download PDF
34. Virtuelle Mikroskopie in der Systempathologie.
- Author
-
Grabe, N.
- Abstract
Copyright of Der Pathologe is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2008
- Full Text
- View/download PDF
35. Big Biology: Supersizing Science During the Emergence of the 21st Century
- Author
-
Niki Vermeulen
- Subjects
0301 basic medicine ,History ,life sciences ,Philosophy ,05 social sciences ,systems biology ,050905 science studies ,innovation ,Article ,Lebenswissenschaften ,collaboration ,03 medical and health sciences ,030104 developmental biology ,Zusammenarbeit ,Systembiologie ,Large-scale research ,large-scale research ,Großforschung ,0509 other social sciences ,Innovation ,Humanities - Abstract
Ist Biologie das jungste Mitglied in der Familie von Big Science? Die vermehrte Zusammenarbeit in der biologischen Forschung wurde in der Folge des Human Genome Project zwar zum Gegenstand hitziger Diskussionen, aber Debatten und Reflexionen blieben meist im Polemischen verhaftet und zeigten eine begrenzte Wertschatzung fur die Vielfalt und Erklarungskraft des Konzepts von Big Science. Zur gleichen Zeit haben Wissenschafts- und Technikforscher/innen in ihren Beschreibungen des Wandels der Forschungslandschaft die Verwendung des Begriffs Big Science gemieden. Dieser interdisziplinare Artikel kombiniert eine begriffliche Analyse des Konzepts von Big Science mit unterschiedlichen Daten und Ideen aus einer Multimethodenuntersuchung mehrerer groser Forschungsprojekte in der Biologie. Ziel ist es, ein empirisch fundiertes, nuanciertes und analytisch nutzliches Verstandnis von Big Biology zu entwickeln und die normativen Debatten mit ihren einfachen Dichotomien und rhetorischen Positionen hinter sich zu lassen. Zwar kann das Konzept von Big Science als eine Mode in der Wissenschaftspolitik gesehen werden – inzwischen vielleicht sogar als ein altmodisches Konzept –, doch lautet meine innovative Argumentation, dass dessen analytische Verwendung unsere Aufmerksamkeit auf die Ausweitung der Zusammenarbeit in den Biowissenschaften lenkt. Die Analyse von Big Biology zeigt Unterschiede zu Big Physics und anderen Formen von Big Science, namentlich in den Mustern der Forschungsorganisation, der verwendeten Technologien und der gesellschaftlichen Zusammenhange, in denen sie tatig ist. So konnen Reflexionen uber Big Science, Big Biology und ihre Beziehungen zur Wissensproduktion die jungsten Behauptungen uber grundlegende Veranderungen in der Life Science-Forschung in einen historischen Kontext stellen.
- Published
- 2016
- Full Text
- View/download PDF
36. Big Biology: Supersizing Science During the Emergence of the 21st Century
- Author
-
Vermeulen, Niki
- Published
- 2016
- Full Text
- View/download PDF
37. Identifikation prognostischer Biomarker für chronische Nierenerkrankungen bei Typ 2 Diabetes Patienten
- Author
-
Hu, Karin
- Subjects
Chronische Nierenerkrankungen ,Progression ,diabetes ,Systembiologie ,Nierenfunktionsstörung ,Omics ,Prognose ,biomarkers ,systems biology ,prognosis ,Biomarker ,chronic kidney disease - Abstract
Hintergrund und Ziel Diabetische Nephropathie ist die häufigste Ursache für chronische Nierenerkrankungen und terminaler Niereninsuffizienz. Biomarker mit prognostischer Relevanz könnten Individuen mit erhöhtem Krankheitsrisiko identifizieren und dadurch eine frühe Intervention ermöglichen. Ziel dieser Studie ist die Identifikation eines klinisch relevanten Biomarker-Panels, das eine prognostische Aussage über den Verlauf der Nierenfunktion ermöglicht. Methode 17 Biomarker Kandidaten wurde in der PROVALID Kohorte getestet (n=2560, medianer Ausgangs-eGFR 84ml/min/1.73m²; UACR 8.1 mg/g). Insgesamt wurden 481 Patienten anhand ihres renalen Funktionsverlustes selektiert und in die Gruppen „fortschreitend“ (eGFR -24.9 bis -5.2 ml/min/Jahr) und „stabil“ (eGFR -0.79 bis 1.39 ml/min/Jahr) unterteilt. Biomarker-Konzentrationen wurden mittel ELISA und Luminex gemessen. Die prädiktive Wertigkeit dieser Biomarker wurde durch linear gemischte Modelle beurteilt. Ergebnisse Bei neun Biomarkern konnte ein statistisch signifikanter Unterschied zwischen den Gruppen festgestellt werden. Ein Modell mit relevanten Biomarkers sowie klinischen Faktoren wies einen korrigierten multiplen Determinationskoeffizient (R²) von 62,5% auf – Biomarker und klinische Faktoren tragen jeweils 34,4% und 28,1% bei. In einem Modell mit Ausgangs-eGFR als Kovariable steigt das R² auf 79,2%; jedoch ist die Ausgangs-eGFR verantwortlich für 78.1% des Modells. Zusammenfassung Die Ausgangs-eGFR ist der stärkste Prädiktor für die Nierenfunktion bei Diabetes-Patienten mit chronischer Nierenerkrankung. Biomarker sind mit Nierenfunktionsverlust assoziiert, können jedoch ein prädiktives Modell mit klinischen Faktoren nicht erheblich verbessern. Background and Objective Diabetic kidney disease is the leading cause of chronic kidney disease and end stage renal disease. Biomarkers may contribute to early identification of individuals at risk of eGFR decline providing possibilities for therapeutic interventions or planning for ESRD treatment in time. The aim is to establish a prognostic multi-marker panel explaining additional variability in change of eGFR in addition to a set of established clinical covariates. Research Design and Methods Seventeen biomarker candidates were tested in the PROVALID cohort (n=2560, baseline median eGFR 84ml/min/1.73m²; UACR 8.1 mg/g). Two groups of participants were identified according to their eGFR course, i.e. 481 samples consisting of fast progressors (eGFR -24.9 to -5.2 ml/min/year) and stable patients (eGFR -0.79 to 1.39 ml/min/year). Biomarkers were measured using Luminex and ELISA technologies. Prediction values were assessed using mixed linear regression models. Results Nine biomarkers showed statistically significantly different concentrations in the two patient groups. A parsimonious panel which included biomarkers as well as clinical risk factors yielded an adjusted R² of 62.5%. Biomarkers and clinical variables contributed 34.4% and 28.1% respectively. Addition of baseline eGFR as a covariate increased the overall R² to 79.2%. However, baseline eGFR alone contributes 78.1% to the overall R² leaving no predictive power to any of the remaining variables in the model. Conclusion These results show that baseline eGFR is the strongest predictor for renal function changes in early CKD patients – biomarkers were associated with eGFR decline but did not add much explained variability on top of clinical risk factors. vorgelegt von: Karin Hu Wien, FH Campus Wien, Masterarb., 2018
- Published
- 2018
38. Predictive computational modeling for improved treatment strategies
- Author
-
Klipp, Edda, Herzel, Hanspeter, Timmer, Jens, Schelker, Max, Klipp, Edda, Herzel, Hanspeter, Timmer, Jens, and Schelker, Max
- Abstract
Krebs und Infektionskrankheiten, wie z.B. Influenza, stellen zwei der großen Bedrohungen für die Menschheit dar. Gerade durch den demographischen Wandel sind immer mehr Menschen gefährdet. Mathematische Modelle von Krankheiten decken verschiedene Detailebenen ab -- von epidemologischen Modellen der Virusinfektion bis zu intrazellulären Modellen der Signaltransduktion in einzelnen Krebszellen. Diese Modelle, sofern sie anhand von biologische Daten kalibriert wurden, können sich als sehr nützlich erweisen um Hypothesen zu bisher unbekannten Wechselwirkungen zu generieren, Wirkstoffkandidaten vorherzusagen, und die Funktionsweise von existierenden Wirkstoffen besser zu verstehen. Im Rahmen dieser Arbeit möchte ich mehrere Projekte vorstellen, in denen prädiktive mathematische Modelle dazu benutzt wurden, tiefere Einblicke in die biologischen Prozesse zu gewinnen und die Therapieansätze bei Krebserkrankungen und den damit verbundenen Gesundheitsproblemen zu verbessern. Im ersten Teil geht es um die Bedeutung von gemeinschaftlich entwickelter Software für die Systembiologie. Eine offene und erweiterbare Modellierungssoftware ermöglicht es ständig verbessert zu werden und an die Bedürfnisse der Nutzer angepasst zu werden. Im zweiten Projekt wurden die intrazellulären Prozesse während der frühen Influenza A Infektion untersucht. Durch eine Kombination von biologischen Messungen und mathematischer Modellierung konnte der Abbau von viraler RNA wähernd des Transportes durch das Wirtszellzytoplasma als limitierender Faktor für die erfolgreiche Infektion identifiziert werden. Mit Hilfe eines experimentell modifizierten viralen Hämagglutintin-Proteins mit veränderter pH-Abhängigkeit konnte gezeigt werden, dass sich der Abstand zum Zellkern, in dem das virale Genom freigesetzt wird, vergrößert. Die Modellvorhersage, dass die Infektion dadurch weniger effektiv wird, konnte experimentell bestätigt werden. Im dritten Projekt beschäftigte ich mich mit gesundheitlichen Problemen, die, Cancer and infectious diseases, such as influenza infection, represent major threats to the human population, especially since demographic change makes more and more people vulnerable. Mathematical modeling of disease covers several layers of detail ranging from epidemiological models for infection spread to cancer-associated signaling within individual cells. These models, when being calibrated to biological data, can provide useful means for generating hypothesis of priorly unknown interactions, predicting drug targets for novel therapeutic substances and for improving the understanding and efficient functioning of existing treatment strategies. In this thesis, I present several projects in which predictive computational models are utilized to gain deeper insights into the biological processes and to improve therapy of cancer and associated health problems. The first part highlights the importance of community-driven software development for systems biology applications. Efficient, yet expandable and open software continuously improves, driven by an active community of users and developers. In the second project, the intracellular processes during the early influenza A infection are investigated. Using a combination of experimental measurements and mathematical modeling, degradation of the viral genome during its diffusion through the cytoplasm could be identified as a limiting factor for a successful infection. By experimentally increasing the pH sensitivity of the viral hemagglutinin protein, the distance of diffusion was increased and the computationally predicted decrease in infectivity could be validated in experiment. The third project deals with cancer-associated health issues and their treatment. Patients suffering from anemia, caused by the cancer itself or as a side-effect of chemotherapy, are treated either with blood transfusions or with an erythropoiesis stimulating agent (ESA). By adapting a published model of ESA-EpoR interaction, not only the bioch
- Published
- 2017
39. Predictive computational modeling for improved treatment strategies
- Author
-
Schelker, Max, Klipp, Edda, Herzel, Hanspeter, and Timmer, Jens
- Subjects
Krebs ,Anämie ,WC 7000 ,Anemia ,Influenza A ,Mathematische Modellierung ,Immuntherapie ,WD 9200 ,ddc:570 ,Systembiologie ,Mathematical modeling ,Immunotherapy ,Systems biology ,Cancer ,570 Biowissenschaften ,Biologie - Abstract
Krebs und Infektionskrankheiten, wie z.B. Influenza, stellen zwei der großen Bedrohungen für die Menschheit dar. Gerade durch den demographischen Wandel sind immer mehr Menschen gefährdet. Mathematische Modelle von Krankheiten decken verschiedene Detailebenen ab -- von epidemologischen Modellen der Virusinfektion bis zu intrazellulären Modellen der Signaltransduktion in einzelnen Krebszellen. Diese Modelle, sofern sie anhand von biologische Daten kalibriert wurden, können sich als sehr nützlich erweisen um Hypothesen zu bisher unbekannten Wechselwirkungen zu generieren, Wirkstoffkandidaten vorherzusagen, und die Funktionsweise von existierenden Wirkstoffen besser zu verstehen. Im Rahmen dieser Arbeit möchte ich mehrere Projekte vorstellen, in denen prädiktive mathematische Modelle dazu benutzt wurden, tiefere Einblicke in die biologischen Prozesse zu gewinnen und die Therapieansätze bei Krebserkrankungen und den damit verbundenen Gesundheitsproblemen zu verbessern. Im ersten Teil geht es um die Bedeutung von gemeinschaftlich entwickelter Software für die Systembiologie. Eine offene und erweiterbare Modellierungssoftware ermöglicht es ständig verbessert zu werden und an die Bedürfnisse der Nutzer angepasst zu werden. Im zweiten Projekt wurden die intrazellulären Prozesse während der frühen Influenza A Infektion untersucht. Durch eine Kombination von biologischen Messungen und mathematischer Modellierung konnte der Abbau von viraler RNA wähernd des Transportes durch das Wirtszellzytoplasma als limitierender Faktor für die erfolgreiche Infektion identifiziert werden. Mit Hilfe eines experimentell modifizierten viralen Hämagglutintin-Proteins mit veränderter pH-Abhängigkeit konnte gezeigt werden, dass sich der Abstand zum Zellkern, in dem das virale Genom freigesetzt wird, vergrößert. Die Modellvorhersage, dass die Infektion dadurch weniger effektiv wird, konnte experimentell bestätigt werden. Im dritten Projekt beschäftigte ich mich mit gesundheitlichen Problemen, die im Zusammenhang mit einer Krebserkrankung und deren Behandlung auftreten können. Chemotherapie oder die Krebserkrankung selbst führt bei vielen Patienten zu einer Blutarmut (Anämie). Diese wird aktuell entweder durch regelmäßige Bluttransfusionen oder durch Verabreichung von sogenannten Erythropoiesis-Stimulating Agents (kurz: ESA, zu Deutsch: Erythropoese-stimulierende Substanzen) behandelt. Mithilfe eines publizierten mathematischen Modells zur ESA-EpoR Interaktion konnten die Bindungseigenschaften verschiedener ESAs charakterisiert und zudem die Anzahl der Bindungsstellen auf unterschiedlichen Zelllinien bestimmt werden. Durch eine Erweiterung des Modells mit einem pharmakokinetischen und -dynamischen Teil konnte die Dosierung für Anämiepatienten retrospektiv verbessert werden. Das letzte Projekt stellt eine computerbasierte Methode zur Analyse und Entschlüsselung der zellulären Zusammensetzung von Tumorproben dar. In den vergangenen Jahren wurde vermehrt eine neue Klasse von Krebsmedikamenten entwickelt, die sich das körpereigene Immunsystem zunutze macht, um den Krebs zu bekämpfen. Das Funktionieren dieser Medikamente hängt jedoch davon ab, ob bestimmte Immunzellen in der Umgebung des Tumors vorhanden sind. Auf Grundlage von Einzelzell RNA-Sequenzierungsdaten konnte eine existierende Methode so erweitert werden, dass nunmehr auch Proben von soliden Tumoren entschlüsselt werden können. Zudem wurden die Einflüsse von verschiedenen Faktoren, wie etwa der Gewebeherkunft oder dem verwendeten Algorithmus, systematisch ausgewertet. Zusammengefasst habe ich in dieser Arbeit dargestellt, wie prädiktive Computermodelle dazu verwendet werden können bestehende Behandlungsansätze zu verbessern und neue Wirkstoffkandidaten zu identifizieren. Cancer and infectious diseases, such as influenza infection, represent major threats to the human population, especially since demographic change makes more and more people vulnerable. Mathematical modeling of disease covers several layers of detail ranging from epidemiological models for infection spread to cancer-associated signaling within individual cells. These models, when being calibrated to biological data, can provide useful means for generating hypothesis of priorly unknown interactions, predicting drug targets for novel therapeutic substances and for improving the understanding and efficient functioning of existing treatment strategies. In this thesis, I present several projects in which predictive computational models are utilized to gain deeper insights into the biological processes and to improve therapy of cancer and associated health problems. The first part highlights the importance of community-driven software development for systems biology applications. Efficient, yet expandable and open software continuously improves, driven by an active community of users and developers. In the second project, the intracellular processes during the early influenza A infection are investigated. Using a combination of experimental measurements and mathematical modeling, degradation of the viral genome during its diffusion through the cytoplasm could be identified as a limiting factor for a successful infection. By experimentally increasing the pH sensitivity of the viral hemagglutinin protein, the distance of diffusion was increased and the computationally predicted decrease in infectivity could be validated in experiment. The third project deals with cancer-associated health issues and their treatment. Patients suffering from anemia, caused by the cancer itself or as a side-effect of chemotherapy, are treated either with blood transfusions or with an erythropoiesis stimulating agent (ESA). By adapting a published model of ESA-EpoR interaction, not only the biochemical properties of different ESAs could be characterized in silico but also the number of binding sites (i.e. Epo receptors on the cell surface) in different cell lines was accurately determined. The model was extended by a pharmaco-kinetic and -dynamic part. The combined ESA-EpoR-PK/PD model could be utilized to retrospectively optimize the dosing regimen of patients suffering from anemia. In the last project, a computational method for analyzing and deciphering the cellular composition of bulk tumor samples is presented. Only recently, a new class of anti-cancer drugs was introduced recruiting the body’s own immune system to combat malignant tissue. However, the efficient functioning of these immunotherapeutical drugs heavily depends on the presence of specific immune cells in the tumor micro-environment. Based on single-cell RNA sequencing data, an existing method for computational deconvolution could be adapted for data from solid tumor tissue and its performance was benchmarked. Taken together, in this thesis I present approaches how predictive computational models can be utilized to render more efficient existing treatment strategies.
- Published
- 2017
40. Sichtbare Netzwerke – Forschungspolitik und Life Sciences zwischen 1990 und 2016 in der Schweiz. Eine Fallstudie zu SystemsX.ch
- Author
-
Frei, Alban, Gugerli, David, Tanner, Jakob, and Strasser, Bruno
- Subjects
Forschungspolitik ,Life sciences ,BIOLOGIEGESCHICHTE ,Computer science, information & general works ,ddc:0 ,SYSTEMBIOLOGIE ,Wissenschaftsgeschichte ,ddc:570 ,Schweiz ,GESCHICHTE ,1990er Jahre - Published
- 2017
41. Systems biology analysis of interactions: Cytokinins (plant pathogens), 3D cell cultures (cancer therapy) and drug targets
- Author
-
Kunz, Meik
- Subjects
ddc:570 ,Systembiologie - Abstract
Der Einsatz von computergestützten Analysen hat sich zu einem festen Bestandteil der biowissenschaftlichen Forschung etabliert. Im Rahmen dieser vorliegenden Arbeit wurden systembiologische Untersuchungen auf verschiedene biologische Themengebiete und Organismen angewendet. In diesem Zusammenhang liefert die Arbeit einen innovativen und interdisziplinären methodischen Ansatz. Die grundlegende Frage lautet: Wie verstehe und beschreibe ich Signalwege und wie kann ich sie beeinflussen? Der Ansatz verknüpft verschiedene biologische Datensätze und Datenebenen miteinander, beginnend vom Genom und Interaktionskontext über semiquantitative Simulationen hin zu neuen Interventionen und Experimenten, welche therapeutisch und biotechnologisch genutzt werden können. Die Analysen können auf diese Weise - zu einem besseren Verständnis experimenteller Daten und biologischer Fragestellungen beitragen und ermöglichen ein systematisches Verständnis der zugrunde liegenden Signalwege und Netzwerkeffekte (z.B. in Pflanzen). - Darüber hinaus ermöglichen sie die Identifizierung wichtiger funktioneller Hubproteine und die Entwicklung neuer therapeutischer Strategien für weitere experimentelle Testungen (z.B. Tumormodelle), - stellen zudem einen hilfreichen Schritt auf dem Weg zur personalisierten Medizin (z.B. lncRNAs und Tumormodelle) und Medikamentenentwicklung (z.B. Datenbank DrumPID) dar. (i) Als Grundlage wurde hierzu eine integrierte systembiologische Methode entwickelt, welche experimentelle Daten (z.B. Transkriptomdaten) hinsichtlich ihrer biologischen Funktionen untersucht und die Identifizierung relevanter funktioneller Cluster und Hubproteine ermöglicht. In einem ersten Teil wurden Analysen zum pflanzlichen Immunsystem durchgeführt. Mithilfe der entwickelten Methode wurden Genexpressionsdatensätze von A. thaliana, die mit dem Pathogen Pst DC3000 infiziert wurden, untersucht, um den Einfluss verschiedener Virulenzfaktoren auf das Interaktom der Wirtspflanze zu untersuchen und neue Modulatoren einer CK-vermittelten Immunabwehr zu finden. In diesem Zusammenhang konnte gezeigt werden, dass die von Pst DC3000 sekretierten Abwehrstoffe wichtige pflanzliche Hormonsignalwege für die Immunabwehr in A. thaliana beeinflussen. Die Ergebnisse zeigen zudem, dass sich der Einfluss auf das Netzwerkverhalten der Effektorproteine und COR-Phytotoxine von dem der PAMPs unterscheidet, sich jedoch auch eine Regulierung gemeinsamer Signalwege und eine Überlappung der beiden Phasen der Immunantwort (PTI und ETI) in A. thaliana finden lassen. Die komplexe Immunantwort auf eine Infektion spiegelt sich zudem in einer höheren Anzahl an funktionellen Clustern und Hubproteinen in Pst DC3000 gegenüber den beiden untersuchten Mutanten wider, wobei sich für Pst DC3000 insbesondere ein stark vernetztes immunrelevantes Cluster um den JA-Signalweg zeigt. Weiterhin wurden anhand der entwickelten Methode wichtige Hubproteine für die Immunabwehr identifiziert. Als bedeutende Vertreter sind AHK2 und AAR14 zu nennen, welche Teil des Zweikomponentensystems der Signalübertragung von CK sind und hierbei wichtige Modulatoren für eine CK-vermittelte Immunabwehr darstellen. (ii) Im zweiten Teil der Arbeit schließen sich Untersuchungen an einem in vitro-Experiment einer 2D- und 3D-Zellkultur einer HSP90-Behandlung in einem Lungentumormodell an. In diesem Zusammenhang wurden mithilfe der entwickelten Methode Unterschiede zwischen den beiden Zellkultursystemen gefunden, die das unterschiedliche Behandlungsansprechen erklären, und für die beiden KRAS-mutierten Zelllinien A549 und H441 des 3D-Testsystems neue prognostische und therapeutische Kandidaten identifiziert. Hierbei haben die durchgeführten Analysen zwei funktionelle Cluster von Protein-Interaktionen um p53 und die STAT-Familie gefunden, welche eine Verbindung zu HSP90 haben und die entsprechenden Behandlungsunterschiede nach einer HSP90-Inhibierung zwischen den beiden Zellkultursystemen erklären können. Unter Berücksichtigung des zelllinien-spezifischen Mutationshintergrunds wurde eine prognostische Markersignatur und daraus abgeleitet HIF1A für die H441-Zelllinie und AMPK für die A549-Zelllinie als neue therapeutische Targets gefunden, wobei die anschließend durchgeführten in silico-Simulationen einen potentiellen therapeutischen Effekt aufzeigen konnten. Weiterhin wurden wichtige experimentelle Readout-Parameter in ein in silico-Lungentumormodell integriert, wobei unter Einbeziehung des Mutationshintergrunds für die verwendeten Zelllinien die HSP90-Behandlung des 3D-Testsystems computergestützt abgebildet werden konnte. Im weiteren Verlauf wurden im in silico-Lungentumormodell Resistenzmechanismen nach einer Gefitinib-Behandlung mit bekanntem Mutationsstatus für die Zelllinien HCC827 und A549 untersucht und daraus folgend neue Therapieansätze abgeleitet, die von potentieller klinischer Bedeutung sein können. Die durchgeführten in silico-Simulationen für HCC827 konnten hierbei zeigen, dass eine EGFR- und c-MET-Koaktivierung zu einer Gefitinib-Resistenz führen kann, wohingegen bei den A549 eine Komutation von KRAS und IGF-1R zu einem geringen Behandlungsansprechen beiträgt. Die Simulationen lassen zudem erkennen, dass eine direkte Inhibierung der an der Resistenzentwicklung beteiligten Rezeptoren c-MET und IGF-1R in beiden Fällen nicht die bestmögliche Therapiestrategie darstellt. In beiden Zelllinien konnte gezeigt werden, dass eine kombinierte Inhibierung von PI3K und MEK den bestmöglichen therapeutischen Effekt liefert, was demnach einen vielversprechenden Therapieansatz bei Gefitinib-resistenten Lungentumorpatienten darstellt. In einem weiteren Schritt wurde das therapeutische Potential der miRNA-21 im in silico-Modell für die HCC827-Zelllinie untersucht. Die durchgeführten Simulationen zeigen, dass eine miRNA-21-Überexpression zu einer Resistenzentwickung nach Gefitinib-Behandlung beitragen kann, wobei eine Inhibierung der miRNA-21 diesen Effekt umkehren kann. Die Ergebnisse lassen zudem erkennen, dass eine PTEN-Aktivierung als potentieller Marker einer erfolgreichen therapeutischen Inhibierung der miRNA-21 fungieren kann, wohingegen eine reduzierte miRNA-21-Expression als möglicher Marker für eine erfolgreiche Gefitinib-Behandlung dienen kann. (iii) Im dritten Teil der Arbeit wurden systematisch RNA- und Protein-Interaktionen untersucht. Hierzu wurden integrierte systembiologische Analysen an neu identifizierten und funktionell bislang unbekannten lncRNAs durchgeführt. Die Analysen für die infolge einer Herzhypertrophie hochregulierte lncRNA Chast haben umfassend gezeigt, dass diese Proteine und Transkriptionsfaktoren regulieren und binden kann, welche die Signalübertragung und Genexpression regulieren, aber auch eine Verbindung zum kardiovaskulären System und stressinduzierter Herzhypertrophie besitzt. Anhand der Ergebnisse lässt sich schlussfolgern, dass Chast direkt und indirekt (a) Proteine binden und die Translation beeinflussen kann, zudem eine Chromatin-modifizierende Funktion besitzt und so die Transkription, z.B. für herz- und stress-assoziierte Gene, reguliert, und/oder (b) in einem negativen Feedbackloop seine eigene Transkription reguliert. Obwohl lncRNAs meist eine geringe Konservierung aufweisen, konnten die durchgeführten Analysen für Chast eine Sequenz-Struktur-Konservierung in Säugetieren aufzeigen. Weiterhin haben die Untersuchungen an zwei hypoxie-induzierten lncRNAs in Endothelzellen gezeigt, dass die lncRNA MIR503HG eine hohe Sequenz-Struktur-Konservierung in Säugetieren besitzt, wohingegen die LINC00323-003 eine geringe Konservierung aufzeigt. Dies untermauert die Tatsache, dass lncRNAs häufig eine geringe Konservierung aufweisen, was Untersuchungen in Modellorganismen hinsichtlich einer therapeutischen Nutzung schwierig machen. Da sich zahlreiche Untersuchungen auf Interaktionen und Signalwege konzentriert haben, wurde abschließend eine Datenbank entwickelt, welche Analysen von Protein-Interaktionen und Signalwegen nachhaltig voranbringt. Die entwickelte DrumPID-Datenbank stellt insbesondere die Interaktion zwischen einem Medikament und seinem Target in den Fokus und ermöglicht Analysen einzelner Interaktionen und beteiligter Signalwege, bietet zusätzlich aber auch verschiedene Links zu anderen Datenbanken für individuelle weiterführende Analysen. DrumPID ermöglicht ein geeignetes Medikament u. a. für ein vorgegebenes Zielprotein zu finden und dessen Wirkmechanismus und Interaktionskontext zu untersuchen, was zu einem besseren experimentellen Verständnis beitragen kann. Zudem erlaubt DrumPID eine potentielle chemische Leitstruktur für ein Zielprotein zu entwickeln, was z.B. spezifisch ein parasitisches Protein inhibiert, ohne dabei einen toxischen Effekt im Menschen zu haben. Zahlreiche weitere Pharmakabeispiele belegen, dass DrumPID für den täglichen wissenschaftlichen Gebrauch auf dem Gebiet der Analyse von Protein-Pharmaka-Interaktionen und der Medikamentenentwicklung geeignet ist. Die beschriebenen Ergebnisse der Promotionsarbeit wurden in fünf Originalarbeiten, zwei Übersichtsartikeln und einem Buchteil, u. a. in Science Translational Medicine, veröffentlicht, sechs dieser Publikationen erfolgten im Rahmen von Erstautorschaften., The use of computer-based analysis has become an integral part of life science research. Within this thesis, systems biology investigations have been applied to various biological topics and organisms which provides an innovative and interdisciplinary methodological approach. The basic question was: How do I understand and describe signaling pathways and how can I influence them? The approach combines various biological data sets and data levels starting from the genome and interaction context over semiquantitative simulations towards new interventions and experiments which can be used therapeutically and biotechnologically. The analysis can contribute to - a better understanding of experimental data and biological questions and enables a systematic understanding of the signaling pathways and network effects (e.g. in plants). - They enable the identification of important functional hub nodes as well as the development of new therapeutic strategies for further experimental testing (e.g. tumor models), - also representing a helpful step on the path to personalized medicine (e.g. lncRNAs and tumor models) and drug development (e.g. database DrumPID). (i) As a basis, an integrated systems biology methodology was developed which examines experimental data sets (e.g. transcriptome data) with respect to their biological functions and enables the identification of relevant functional clusters and hub nodes. In the first part of the thesis, analyzes regarding the plant immune system were accomplished. Using the developed methodology, gene expression datasets of A. thaliana infected with the pathogen Pst DC3000 were analyzed in order to investigate the influence of different virulence factors on the host interactome, and to find new modulators of CK-mediated immune defense. In this context, the analysis could show that the secreted defense compounds of Pst DC3000 influence important plant hormone signaling pathways for the immune defense in A. thaliana. Moreover, the results show that the impact on the network behavior of the effector proteins and COR phytotoxins differ from the PAMPs, but there also exists an overlap in common regulated signal pathways as well as an overlap between the two phases of immune response (PTI and ETI) in A. thaliana. In addition, the complex immune response to an infection is also reflected by a higher number of functional clusters and hub nodes in Pst DC3000 compared to the two studied mutants, whereby for Pst DC3000 a highly connected immune-relevant cluster around the JA pathway has been found. Furthermore, using the developed methodology several important hub nodes for the immune defense have been identified. As most important candidates, AHK2 and AAR14 have to be highlighted which are part of the two-component-system of signal transduction of CK and represent in this context important modulators for a CK mediated immune defense. (ii) In the second part of the thesis, analyzes of a HSP90 treatment in lung cancer in an in vitro experiment in 2D and 3D cell cultures were accomplished. In this context using the developed methodology, differences between the two cell cultures explaining the differences in treatment responses were found, and for the two KRAS mutated cell lines A549 and H441 of the 3D test system new prognostic marker and therapeutic drug candidates were identified. However, the analyzes found two functional clusters of protein interactions around p53 and the STAT family which have a connection to HSP90 and might explain the observed treatment differences for the HSP90 inhibition between the two cell culture systems. Considering the mutational background of the cell lines, a prognostic marker signature were found and derived from it HIF1A for the H441 cell line and AMPK for the A549 cell line as new therapeutic drug targets. Moreover, the subsequently performed in silico simulations could show a potential therapeutic effect of the identified drug targets. Furthermore, important experimental read-out parameters were integrated into the in silico lung tumor model, and by considering the mutation background of the used cell lines the HSP90 treatment of the 3D test system could be in silico simulated. In the further course of the thesis, resistance mechanisms after gefitinib treatment with known mutation status for the HCC827 and A549 cell lines were investigated in the in silico lung tumor model and consequently new therapeutic approaches were derived which may be of potential clinical relevance. Here, the in silico simulations for HCC827 cells show that a co-activation of EGFR and c-MET can lead to a gefitinib resistance, whereas in the A549 a co-mutation of KRAS and IGF-1R can contribute to the reduced treatment response. In addition, the simulations reveal that a direct inhibition of the resistance contributing receptors c-MET and IGF-1R reflect not the best treatment strategy in both cases. However, in both cell lines a combined inhibition of PI3K and MEK provides the best therapeutic effect, thus representing a promising new therapeutic approach in gefitinib resistant lung cancer patients. In a further step, the therapeutic potential of the miRNA-21 was examined in the in silico model for the HCC827 cells. The simulations show that an overexpression of the miRNA-21 can contribute to a resistance development after gefitinib treatment, in which an inhibition of the miRNA-21 reverses this effect. Moreover, the results show that a PTEN activation can function as a potential marker of therapeutic success of miRNA-21 inhibition whereas a reduced miRNA-21 expression may serve as a potential marker for a successful gefitinib treatment. (iii) In the third part of the thesis, systematic RNA and protein interactions were investigated. For this, integrated systems biology analyzes were carried out on new identified and previously functional unknown lncRNAs. The analyzes of the cardiac hypertrophy caused upregulated lncRNA Chast have extensive demonstrated that Chast can regulate and bind proteins and transcription factors which regulate signal transduction and gene expression, but it has also a connection to the cardiovascular system and stress-induced cardiac hypertrophy. Based on the results, it can be concluded that Chast can directly and indirectly (a) bind proteins and influence the translation but also possess a chromatin-modifying function and regulate transcription e.g. for cardiac and stress-associated genes, and/or (b) regulate its own transcription in a negative feedback loop. Although lncRNAs often have a low conservation the analysis could show a sequence-structure-conservation for Chast in mammalians. Furthermore, the investigations for two hypoxia induced endothelial lncRNAs have shown that the lncRNA MIR503HG represents a high sequence-structure-conservation in mammalians, whereas the LINC00323-003 shows a low conservation. This underscores the fact that lncRNAs often have a low conservation thereby making studies regarding the therapeutic potential in model organisms difficult. Finally, as numerous analyzes in this thesis have focused on interactions and signaling pathways, a database was developed which brings a sustainable progress in analysis of protein interactions and signaling pathways. The developed DrumPID database puts especially the interaction between a drug and its target into its focus and allows analysis of individual interactions and involved signaling pathways but, additionally, provides various crosslinks to other databases for individual further analysis. DrumPID enables to find a suitable drug, e.g. for a given target protein, and to analyze its mechanism of action as well as interaction context which can contribute to a better understanding of experimental data. Moreover, DrumPID allows to develop a potential chemical lead structure for a target protein which e.g. specifically inhibits a parasitic protein but has no toxic effect in humans. Numerous additional pharmaceutical examples verify that DrumPID is suitable for the daily scientific usage in the field of analysis of protein-drug-interactions and drug development. The described results of the doctoral thesis were published in five research papers, two review articles and a book chapter, e.g. in Science Translational Medicine, including six first authorships.
- Published
- 2017
42. Information processing in cellular signaling
- Author
-
Uschner, Friedemann, Klipp, Edda, Herzel, Hanspeter, and Blüthgen, Nils
- Subjects
stochastische Modellierung ,zelluläre Signaltransduktion ,scaffolding ,Chemische Master Gleichung ,HOG pathway ,32 Biologie ,systems biology ,WC 7700 ,moment closure ,WE 5320 ,Pheromon Signalweg ,chemical master equation ,ddc:570 ,Systembiologie ,S.cerevisiae ,570 Biowissenschaften, Biologie ,HOG Signalweg ,cellular signaling ,Informationstheorie ,information theory ,pheromone pathway ,stochastic modeling - Abstract
Information spielt in der Natur eine zentrale Rolle. Als intrinsischer Teil des genetischen Codes ist sie das Grundgerüst jeder Struktur und ihrer Entwicklung. Im Speziellen dient sie auch Organismen, ihre Umgebung wahrzunehmen und sich daran anzupassen. Die Grundvoraussetzung dafür ist, dass sie Information ihrer Umgebung sowohl messen als auch interpretieren können, wozu Zellen komplexe Signaltransduktionswege entwickelt haben. In dieser Arbeit konzentrieren wir uns auf Signalprozesse in S.cerevisiae die von osmotischem Stress (High Osmolarity Glycerol (HOG) Signalweg) und der Stimulation mit α-Faktor (Pheromon Signalweg) angesprochen werden. Wir wenden stochastische Modelle an, die das intrinsische Rauschen biologischer Prozesse darstellen können, um verstehen zu können wie Signalwege die ihnen zur Verfügung stehende Information umsetzen. Informationsübertragung wird dabei mit einem Ansatz aus Shannons Informationstheorie gemessen, indem wir sie als einen Kanal in diesem Sinne auffassen. Wir verwenden das Maß der Kanalkapazität, um die Genauigkeit des Phosphorelays einschränken zu können. In diesem Modell, simuliert mit dem Gillespie Algorithmus, können wir durch die Analyse des Signalverhaltens den Parameterraum zusätzlich stark einschränken. Eine weitere Herangehensweise der Signalverarbeitung beschäftigt sich mit dem “Crosstalk” zwischen HOG und Pheromon Signalweg. Wir zeigen, dass die Kontrolle der Signalspezifizität vor allem bei Scaffold-Proteinen liegt, die Komponenten der Signalkaskade binden. Diese konservierten Motive zellulärer Signaltransduktion besitzen eine geeignete Struktur, um Information getreu übertragen zu können. Im letzten Teil der Arbeit untersuchen wir potentielle Gründe für die evolutionäre Selektion von Scaffolds. Wir zeigen, dass ihnen bereits durch die Struktur des Mechanismus möglich ist, Informationsgenauigkeit zu verbessern und einer verteilten Informationsweiterleitung sowohl dadurch als auch durch ihre Robustheit überlegen sind. Information plays a ubiquitous role in nature. It provides the basis for structure and development, as it is inherent part of the genetic code. It also enables organisms to make sense of their environments and react accordingly. For this, a cellular interpretation of information is needed. Cells have developed sophisticated signaling mechanisms to fulfill this task and integrate many different external cues with their help. Here we focus on signaling that senses osmotic stress (High Osmolarity Glycerol (HOG) pathway) as well as α-factor stimulation (pheromone pathway) in S.cerevisiae. We employ stochastic modeling to simulates the inherent noisy nature of biological processes to assess how systems process the information they receive. This information transmission is evaluated with an information theoretic approach by interpreting signal transduction as a transmission channel in the sense of Shannon. We use channel capacity to both constrain as well as quantify the fidelity in the phosphorelay system of the HOG pathway. In this model, simulated with the Gillespie Algorithm, the analysis of signaling behavior allows us to constrain the possible parameter sets for the system severely. A further approach to signal processing is concerned with the mechanisms that conduct crosstalk between the HOG and the pheromone pathway. We find that the control for signal specificity lies especially with the scaffold proteins that tether signaling components and facilitate signaling by trans-location to the membrane and shielding against miss-activation. As conserved motifs of cellular signal transmission, these scaffold proteins show a particularly well suited structure for accurate information transmission. In the last part of this thesis, we examine the potential reasons for an evolutionary selection of the scaffolding structure. We show that due to its structure, scaffolds are increasing information transmission fidelity and outperform a distributed signal in this regard.
- Published
- 2016
43. Improvement of Corynebacterium glutamicum for production of lysine and ectoine from industrial raw materials
- Author
-
Schäfer, Rudolf Anton and Wittmann, Christoph
- Subjects
Corynebacterium glutamicum ,Xylose ,lysine ,ectoine ,ddc:570 ,Systembiologie ,Lysin ,Ectoin ,systems biology ,ddc:620 - Abstract
Corynebacterium glutamicum is of huge importance in the production of amino acids and has an impressive portfolio of substrates and products. In this thesis it was shown that elevated growth temperature led to decreased biomass yield and specific growth rate and to increased lysine yield. At 38°C, the lysine yield was ca. 40-55% higher than at 30°C. Metabolic flux analysis of C. glutamicum Lys12 revealed 101% flux through the pentose phosphate pathway at 38°C as compared to 86% at 30°C. In a fed-batch bioreactor setup, the cultivation at 38°C led to a 10% higher yield, as compared to 30°C. Also, C. glutamicum Lys12 was modified to allow for growth and lysine production from xylose via expression of the Escherichia coli genes xylA and xylB. The resulting strain C. glutamicum Xyl1 was able to grow at 0.17 1/h and converted xylose into lysine at a yield of 0.25 mol/mol. In a more industry-like fed-batch bioreactor setup 116 g/L lysine were produced with a xylose based medium. Finally, the Pseudomonas stutzeri ectABCD operon (with the osmosensitive promoter exchanged for a constitutive one and the codon usage of C. glutamicum considered) was expressed in C. glutamicum lysC T311I to enable ectoine production. This strain produced ectoine (19 mmol/mol) from glucose, but also lysine, which was stopped by deletion of lysE. Elevated temperatures led to improved ectoine secretion and 4.5 g/L ectoine could be produced in a fed-batch process at 35°C. Corynebacterium glutamicum ist von großer Bedeutung für die Produktion von Aminosäuren und weist ein beeindruckendes Spektrum an Substraten und Produkten auf. In dieser Arbeit wurde gezeigt, dass erhöhte Wachstumstemperaturen zu reduzierter Biomasseausbeute und spezifischen Wachstumsrate sowie erhöhter Lysinausbeute führten. Bei 38°C lag die Ausbeute ca. 40-555 höher als bei 30°C. Metabolische Flussanalyse zeigte 101% Kohlenstofffluss durch den Pentosephosphatweg bei 38°C, während bei 30°C nur 86% erreicht wurden. In einem Fedbatch Prozesses im Bioreaktor war die Lysinausbeute bei 38°C 10% höher als bei 30°C. Das Einbringen der Escherichia coli Gene xylA und xylB in C. glutamicum ermöglichte außerdem Wachstum mit 0,17 1/h sowie Lysinproduktion mit einer Ausbeute von 0,25 mol/mol auf Xylose. In einem Fedbatch Bioreaktorexperiment wurden in einem auf Xylose basierten industrienahen Medium 116 g/L Lysin produziert. Schließlich wurde noch das Pseudomonas stutzeri ectABCD Operon (mit ausgetauschtem Promotor und berücksichtigter Codonverwendung) in C. glutamicum lysC T311I eingebracht, was die Ectoinproduktion von Glukose ermöglichte (19 mmol/mol). Die Sekretion des Nebenprodukts Lysin wurde durch Deletion von lysE unterbunden. Wie bei der Produktion von Lysin führten erhöhte Temperaturen zu einer verbesserten Ectoinproduktion und in einem Fedbatch Bioreaktor konnten bei 35°C 4,5 g/L Ectoin produziert werden.
- Published
- 2016
- Full Text
- View/download PDF
44. From signal to metabolism
- Author
-
Lubitz, Timo, Klipp, Edda, Holzhütter, Hermann-Georg, and Blüthgen, Nils
- Subjects
Metabolismus ,WD 9200 ,ddc:570 ,Systembiologie ,Systems Biology ,cancer research ,32 Biologie ,570 Biowissenschaften, Biologie ,Krebsforschung ,metabolism ,signalling pathways ,Signalwege - Abstract
Das Leben und Überleben einer Zelle wird auf verschiedenen Ebenen streng reguliert. Diese Ebenen sind eng miteinander verknüpft: (i) Signalwege leiten extrazelluläre Signale in den Zellkern, wo (ii) Genregulation sie zu Proteinen übersetzt, und (iii) Proteine kontrollieren metabolische Funktionen, die Nährstoffe zu Energie und zellulären Bausteinen konvertieren. Diese Systeme sind hochkomplex und werden oft nur einzeln betrachtet. Systembiologie ist ein interdisziplinäres Forschungsgebiet, das Methoden anbietet, um Informationen aus heutigen Hochdurchsatz-Experimenttechnologien zu extrahieren. Diese Methoden können effektiv sein, um die vorgenannten Systeme einzeln oder im Ganzen zu untersuchen. In dieser Doktorarbeit wende ich Methoden an, um Signalwege und Zellmetabolismus zu erforschen, und ich präsentiere neue Arbeitsabläufe für das Modellieren und Analysieren dieser Systeme. Beide Methoden sind auf großskalige Netzwerkrekonstruktionen fokussiert. Da die Erhältlichkeit von xperimentellen Daten eines der größten Probleme der Systembiologie darstellt, befassen sich die Methoden explizit mit dem Umgang mit Wissenslücken. Sie werden auf den Snf1 Signalweg und den Metabolismus von Hefezellen angewendet und vermitteln neue Erkenntnisse über diesen Modellorganismus. Des Weiteren präsentiert diese Arbeit eine eingehende Analyse vom metabolischen Reprogrammieren in Darmkrebszellen, welche bisher unbekannte Zusammenhänge von metabolischer Funktionalität und Onkogenen beinhaltet. Zum Abschluss stelle ich unseren Vorschlag für ein standardisiertes Datenaustauschformat vor, welches seinen Schwerpunkt auf Datentabellen der Systembiologie legt. Zusammenfassend behandelt diese Doktorarbeit die Signalwege und den Metabolismus von Zellen, inklusive neuer Modellierabläufe und biologischer Erkenntnisse. Diese Erkenntnisse werden in den Kontext unseres aktuellen Wissensstandes gesetzt und darauf aufbauend werden neue potentielle Ansatzpunkte für Experimente vorgeschlagen. Cellular life is governed on different layers of regulation, which are tightly interconnected: (i) Signalling pathways transmit extracellular signals to the cells’ nucleus, where (ii) gene regulation translates these signals into proteins, and (iii) proteins control metabolic functions, which convert nutrients to energy and cell building blocks. Due to the complexity of each of these systems, they are often analysed individually or only partially. Systems Biology is an interdisciplinary field of research that offers techniques to harvest the information of todays high-throughput experiments. These techniques can be powerful approaches to investigate the aforementioned regulatory layers of a cell either individually or as a whole. In this thesis, I am employing means of Systems Biology to explore signalling pathways and metabolism, and I provide novel workflows for modelling and exploring these systems. Both workflows are focussed on accurate large-scale network reconstructions of the target system. Since one of the major problems in Systems Biology is the availability of experimental data, the workflows put emphasis on the handling of knowledge gaps. They are applied on the Snf1 pathway and metabolism in yeast and provide new findings about this model organism. Furthermore, this thesis presents an in-depth analysis of metabolic reprogramming in colorectal cancer cells, which yields previously unknown coherences of metabolic function and oncogenes. Finally, I am presenting a proposal for a standardised data format in Systems Biology, which is based on data tables. In summary, this thesis comprises works on signalling pathways and cell metabolism, which includes novel modelling workflows and new biological findings, analyses their impact on the scientific state of the art, and proposes directions for new experimental targets.
- Published
- 2016
45. Modeling the Interleukin 2 gene expression in activated T cells
- Author
-
Benary, Manuela, Herzel, Hanspeter, Baumgrass, Ria, and Höfer, Thomas
- Subjects
ddc:570 ,Systembiologie ,32 Biologie ,mathematische Modellierung ,570 Biowissenschaften, Biologie ,T-Helferzelle ,systems biology ,mathematical modelling ,T helper cell ,interleukin 2 - Abstract
Interleukin 2 (IL-2) ist ein Zytokin, welches in menschlichen Gedächtnis-T-Helfer-Zellen (Teff Zellen) exprimiert und sekretiert wird und damit die Immunantwort formt. Im Gegensatz dazu wird IL-2 normalerweise nicht in regulatorischen T-Zellen (Treg Zellen) exprimiert, sondern von diesen nur aufgenommen. Durch die Aktivierung des T-Zellrezeptors werden Signalkaskaden induziert, welche zur Aktivierung der Transkriptionsfaktoren AP-1, NFAT, und NF-kB führen. Diese sind entscheidend für die Genexpression von IL-2. Im Rahmen meiner Dissertation habe ich die Regulation der IL-2 Genexpression untersucht. Dabei vergleiche ich die transkriptionelle Regulation in Teff Zellen mit der Regulation in Treg Zellen. Insbesondere konnte ich zeigen, dass die endogene Konzentration der Transkriptionsfaktoren sich auf die Anzahl der IL-2 Produzenten auswirkt, aber nicht auf die Konzentration von IL-2 innerhalb einer Zelle. Deshalb untersuche ich wie sich die Konzentration der Transkriptionsfaktoren auf die Häufigkeit von IL-2 Produzenten auswirkt. Ich nutze die vorhandenen endogenen Konzentrationen und kann damit vorhersagen, dass die Zahl der IL-2 Produzenten entscheidend von der c-fos Konzentration in Teff Zellen abhängt. Mit Hilfe des entwickelten Modells kann ich voraussagen, wie der spezifische Inhibitor U0126 die Häufigkeit von IL-2 Produzenten verringert. Diese Vorhersage wurde durch Experimente belegt. Meine Modelle zeigen weiterhin, dass c-fos und NFATc2 die Häufigkeit der IL-2 Produzenten in Teff Zellen kooperativ regulieren. In Treg-Zellen zeigt meine Analyse, dass alle Transkriptionsfaktoren eine ähnliche sigmoidale Wirkung auf die Häufigkeit der IL-2-Produzenten ausüben. Im Gegensatz zu den Teff Zellen haben alle Transkriptionsfaktor eine ähnliche maximale Wirkung auf Genexpression von IL-2. Mittels eines Inhibitionsmodelles konnte ich zeigen, dass der Treg zellspezifische Transkriptionsfaktor FoxP3 allen aktivierenden Transkriptionsfaktoren entgegenwirkt. Interleukin 2 (IL-2) is a cytokine expressed in human memory T helper cells (Teff cells) and the secretion of IL-2 shapes the immune response. In contrast, human regulatory T-cells (Treg cells) commonly do not express IL-2. The gene expression of IL-2 is induced by the activation of the T-cell receptor signaling network activating the transcription factors AP-1, NFAT, and NF-kB. These transcription factors are crucial for initiating IL-2 gene expression. Within my thesis I compare the regulation of IL-2 gene expression in Teff cells and Treg cells using experiments and modeling. I demonstrate that the transcription factor concentrations correlate with number of IL-2 producers but do not affect IL-2 concentration per cell. Thus, I investigate how the transcription factor concentration of c-fos, NFATc2, p65, and p-c-jun affects the frequency of IL-2 producing cells as a proxy for the probability of a cell to produce IL-2. Using the endogenous heterogeneity of transcription factor concentrations, I predict that the number of IL-2 producers is critically dependent on the amount of c-fos in Teff cells. I use my model to predict how perturbations of c-fos by the specific inhibitor U0126 decrease the frequency of IL-2 producers in Teff cells. This prediction was than validated by experiments. My models furthermore indicate the cooperative behavior of c-fos and NFATc2 on the level of frequency of IL-2 producers in Teff cells. In Treg cells, I show that all transcription factors exert a similar sigmoidal effect on the frequency of IL-2 producers. In contrast to the effects seen in Teff cells, all transcription factor have a similar maximal effect on the IL-2 gene expression. With an inhibitory model I explore the relation between the Treg cell-specific transcription factor FoxP3 the transcription factors c-fos, NFATc2, p65, and p-c-jun on the frequency of IL-2 producers. This model indicates that FoxP3 counteracts the activating function of NFATc2, AP-1, and also NF-kB.
- Published
- 2016
46. Model Selection for Gaussian Process Regression by Approximation Set Coding
- Author
-
Fischer, Benjamin
- Subjects
BIOLOGICAL INFORMATICS AND COMPUTER APPLICATIONS IN BIOLOGY ,02 engineering and technology ,01 natural sciences ,Life sciences ,SUPERVISED LEARNING (ARTIFICIAL INTELLIGENCE) ,ÜBERWACHTES LERNEN (KÜNSTLICHE INTELLIGENZ) ,GAUSSIAN PROCESSES AND GAUSSIAN MEASURES (PROBABILITY THEORY) ,BIOLOGISCHE INFORMATIK UND COMPUTERANWENDUNG IN DER BIOLOGIE ,Data processing, computer science ,SYSTEMBIOLOGIE ,0103 physical sciences ,SYSTEMS BIOLOGY ,0202 electrical engineering, electronic engineering, information engineering ,020201 artificial intelligence & image processing ,GAUSSSCHE PROZESSE UND GAUSSSCHE MASSE (WAHRSCHEINLICHKEITSRECHNUNG) ,010303 astronomy & astrophysics - Published
- 2016
- Full Text
- View/download PDF
47. Bio-basierte Produktion von Succinat aus nachwachsenden Rohstoffen : Aufklärung des Stoffwechsels von Basfia succiniciproducens mittels 13C-metabolischer Flussanalyse zur rationalen Stammoptimierung
- Author
-
Lange, Anna and Wittmann, Christoph
- Subjects
Erneuerbare Ressourcen ,13C metabolic flux analysis ,ddc:570 ,Systembiologie ,13C metabolische Flussanalyse ,ddc:620 ,Bernsteinsäure ,Basfia succiniciproducens ,metabolic engineering - Abstract
Succinic acid is a highly versatile chemical with the potential of replacing the maleic acid platform currently derived from petroleum. Among the microorganisms suitable for succinic acid production, Basfia succiniciproducens stands out as one of the most efficient commercial producers. In the present work, succinic acid production by B. succiniciproducens from sucrose, fructose, and xylose was analyzed at a systems level by means of 13C metabolic flux analysis. Qualitative 13C tracer studies and in vitro enzymatic assays shed light on so far unknown key properties of the B. succiniciproducens metabolism. Strategies for systems metabolic engineering of B. succiniciproducens were inferred from these results and successfully applied. Compared to other sugars, succinate yields on sucrose and fructose were reduced. This effect could be traced back to the PTS systems responsible for substrate uptake. The beneficial effect of fructokinase, a key enzyme of the B. succiniciproducens sucrose catabolism newly discovered in this work, was exploited to engineer a mutant strain with a tremendously increased succinate yield. Towards utilizing hemicellulose as a raw material, xylose was identified as a promising substrate for succinate production, with formate dehydrogenase possibly involved in superior redox recycling, leading to high succinate yields coupled to reduced by-product formation. Bernsteinsäure ist eine vielfältig einsetzbare Chemikalie mit dem Potential, die aus Rohöl gewonnene Plattformchemikalie Maleinsäure zu ersetzen. Unter den verschiedenen Bernsteinsäure-produzierenden Mikroorganismen sticht Basfia succiniciproducens als effizienter kommerzieller Produzent hervor. Im Rahmen dieser Arbeit wurde die Bernsteinsäurebildung durch B. succiniciproducens auf Saccharose, Fructose und Xylose mithilfe von 13C-metabolischer Flussanalyse auf Systemebene untersucht. Qualitative 13C Markierungsstudien und Enzymaktivitätsmessungen trugen zur Aufklärung bisher unbekannter Eigenschaften des Metabolismus von B. succiniciproducens bei. Aus den Ergebnissen wurden Strategien zur Stammverbesserung mittels Systems Metabolic Engineering abgeleitet und erfolgreich umgesetzt. Die Produktausbeuten auf Saccharose und Fructose waren vergleichsweise gering. Dies konnte auf die für die Aufnahme der Zucker verantwortlichen PTS Systeme zurückgeführt werden. Der vorteilhafte Effekt der Fruktokinase, eines wichtigen Enzyms im Saccharosekatabolismus von B. succiniciproducens, das in dieser Arbeit erstmals nachgewiesen wurde, konnte zur Konstruktion eines Produzenten mit deutlich erhöhter Bernsteinsäureausbeute genutzt werden. In Hinblick auf die Verwendung von Hemicellulose als Rohstoff wurde Xylose als vielversprechendes Substrat identifiziert. Dabei war das Enzym Formiatdehydrogenase in einen vorteilhaften Redoxstoffwechsel involviert, der zu hohen Produktausbeuten führte.
- Published
- 2016
- Full Text
- View/download PDF
48. Inferability and inference of gene regulatory networks
- Author
-
Ud-Dean, S.M. Minhaz, Hungerbühler, Konrad, and Gunawan, Rudiyanto
- Subjects
GENREGULATION, REGULATION DER GENEXPRESSION (MOLEKULARBIOLOGIE) ,DELETION MUTATIONS (GENETICS) ,SYSTEMBIOLOGIE ,STATISTISCHE ANALYSE UND INFERENZMETHODEN (MATHEMATISCHE STATISTIK) ,ddc:570 ,SYSTEMS BIOLOGY ,DELETIONSMUTATIONEN (GENETIK) ,GENE REGULATION, REGULATION OF GENE-EXPRESSION (MOLECULAR BIOLOGY) ,STATISTICAL ANALYSIS AND INFERENCE METHODS (MATHEMATICAL STATISTICS) ,Life sciences - Published
- 2016
49. Multi-level proteome characterization using high resolution mass spectrometry
- Author
-
Rosenberger, George A., Aebersold, Ruedi, Malmström, Lars, Ban, Nenad, and Hardt, Wolf-Dietrich
- Subjects
BIOLOGICAL INFORMATICS AND COMPUTER APPLICATIONS IN BIOLOGY ,BIOLOGISCHE INFORMATIK UND COMPUTERANWENDUNG IN DER BIOLOGIE ,MASSENSPEKTROSKOPIE + MASSENSPEKTROMETRIE (BIOLOGISCHE TECHNIKEN) ,PROTEOMICS (PROTEINS AND PEPTIDES) ,DATENBEHANDLUNG + DATENAUSWERTUNG (EXPERIMENTELLE BIOLOGIE) ,FLÜSSIGKEITSCHROMATOGRAPHIE ,PROTEOMIK (PROTEINE UND PEPTIDE) ,MASS SPECTROSCOPY + MASS SPECTROMETRY (BIOLOGICAL TECHNIQUES) ,LIQUID CHROMATOGRAPHY ,SYSTEMS BIOLOGY ,DATA TREATMENT + DATA INTERPRETATION (EXPERIMENTAL BIOLOGY) ,SYSTEMBIOLOGIE ,Life sciences ,ddc:570 - Published
- 2016
50. High throughput approaches to study molecular pathways from genotype to phenotype
- Author
-
Zhu, Chenchen, Bühlmann, Peter Lukas, and Huber, Wolfgang
- Subjects
PHENOTYPE + PHENOTYPIC VARIATION + PHENOTYPIC VARIABILITY (GENETICS) ,GENMUTATIONEN + PUNKTMUTATIONEN (GENETIK) ,MODELLRECHNUNG UND SIMULATION IN BIOCHEMIE UND MOLEKULARBIOLOGIE ,GENOTYP + GENOTYPISCHE VARIABILITÄT + GENOTYPISCHE VARIATION (GENETIK) ,GENOTYPE + GENOTYPIC VARIABILITY + GENOTYPIC VARIATION (GENETICS) ,Life sciences ,PHÄNOTYP + PHÄNOTYPISCHE VARIABILITÄT + PHÄNOTYPISCHE VARIATION (GENETIK) ,TRANSCRIPTOMICS (MOLECULAR GENETICS) ,MATHEMATICAL MODELING AND SIMULATION IN BIOCHEMISTRY AND MOLECULAR BIOLOGY ,SYSTEMBIOLOGIE ,GENE MUTATIONS + POINT MUTATIONS (GENETICS) ,ddc:570 ,TRANSKRIPTOMIK (MOLEKULARE GENETIK) ,SYSTEMS BIOLOGY - Published
- 2016
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.