Please use this identifier to cite or link to this item: doi:10.22028/D291-26617
Title: Integrative computational approaches for studying stem cell differentiation and complex diseases
Other Titles: Integrative computer-basierte Ansätze zur Untersuchung von Stammzell differenzierung und komplexen Krankheiten
Author(s): Hamed, Mohamed
Language: English
Year of Publication: 2015
SWD key words: Systembiologie
Angewandte Informatik
Bioinformatik
Free key words: bioinformatics
genomic data integration
gene regulatory network
complex diseases pathways
DDC notations: 500 Science
004 Computer science, internet
Publikation type: Dissertation
Abstract: The biological functions of the molecular components (genes, proteins, miRNAs, siRNAs,..etc) of biological cells and mutations/perturbations thereof are tightly connected with cellular malfunctions and disease pathways. Moreover, these molecular elements interact with each other forming a complex interwoven regulatory machinery that governs, on one hand, regular cellular pathways, and on the other hand, their dysregulation or malfunction in pathological processes. Therefore, revealing these critical molecular interactions in complex living systems is being considered as one of the major goals of current systems biology. In this dissertation, we introduce practical computational approaches implemented as freely available software tools to integrate heterogeneous sources of large-scale genomic data and unravel the combinatorial regulatory interactions between different molecular elements. First, we present an automated GRN pipeline that constructs the genomic regulatory machinery of a cell from expression, sequencing, and annotation datasets through three modules implemented as separated software components (plugins) and hosted by our software framework Mebitoo that aims at automation of bioinformatics workflows. Then, we extended this pipeline to a general integrative network-based approach that involves also post-transcriptional interactions and reports the computational analysis of gene and miRNA transcriptomes, DNA methylome, and somatic mutations. This workflow enables users to identify putative disease drivers and novel targets for therapeutic treatment. Regarding the incorporation of somatic mutations with other genomic data sets, a stand-alone pipeline named “SnvDMiR” was implemented to explore possible genomic proximity relationships between somatic variants and both differentially methylated CpG sites as well as differentially expressed miRNAs. Along the same lines, but targeting the effects of genomic mutations, we developed an NGS pipeline and applied it to two groups of bacterial isolates (nasal and invasive) to investigate the phylogenetic positions of the recently emerged t504 clone (Spa-type t504) in the Saarland province of Germany and to better understand the infectivity mechanism of the invasive group. Motivated by all of this, we developed TFmiR as a freely available web server for deep and integrative downstream analysis of combinatorial regulatory interactions between TFs/genes and miRNAs that are involved in the pathogenesis of human diseases. In the frame of this thesis, we employed these approaches to investigate the molecular mechanisms of cellular differentiation (namely hematopoiesis) as an example for biological processes and human breast cancer and diabetes as examples for complex diseases. In summary, the work presented in this thesis has led to the development of interesting computational approaches that have been made available as non-commercial software toolkits. The provided topological and functional analyses of our approaches as validated on cellular differentiation and complex diseases promotes them as reliable systems biology tools for researchers across the life science communities.
Die Funktionsweise verschiedener molekularer Elemente (Gene, Proteine, Mutationen, miRNAs, siRNAs,... etc.) ist mit den darunterliegenden zellulären Fehlfunktionen als auch mit Krankheits-assoziierten zellulären Signalwegen verknüpft. Darüber hinaus interagieren diese molekularen Elemente auch miteinander und bilden eine komplexe ineinander verwobene regulatorische Maschinerie, die wiederum zelluläre Signalwege oder auch Krankheitsentwicklungen auf zellulärer Ebene beeinflusst. Aufgrund dessen ist heutzutage die Aufklärung dieser molekularen Interaktionen in komplexen lebenden Systemen eines der Hauptziele der Systembiologie. In dieser Dissertation stellen wir rechnerbasierte Ansätze vor welche als Software frei verfügbar sind und die Integration von großen genomischen Datensätzen als auch eine damit verbundene Aufklärung der kombinatorischen Vielfalt dieser regulatorischen Interaktionen zwischen den verschiedenen molekularen Elementen, ermöglichten. Dafür entwickelten wir anfangs eine automatisierte GRN Pipeline, welche die regulatorische Maschinerie einer Zelle auf der Grundlage von Daten zur Genexpression, über Sequenzierung als auch Annotierung von Datensätzen konstruiert. Diese Pipeline wurde in drei separate Module aufgeteilt, die alle als Software plugins verfügbar sind, und in unser Framework Mebitoo, welches bioinformatische Arbeitsabläufe automatisiert, integriert sind. Daraufhin erweiterten wir unser bisheriges Framework um einem allgemeinen und integrativen Netzwerk-basierten Ansatz, welcher post-transkriptionelle Interaktionen berücksichtigt und die rechnerbasierte Analyse von Genen als auch miRNA Transkriptomen, dem DNA Methylom und somatischen Mutationen mit einbezieht. Unser Ziel war es, dabei vermeintliche Verursacher von Krankheitsbildern als auch neue Ziele für die therapeutische Behandlung von Krankheiten zu identifizieren. Für die Integration somatischer Mutationen wurde eine eigenständige Pipeline namens „SnvDMiR“ entwickelt, welche die Analyse von möglichen genomischen Nachbarschaftsbeziehungen zwischen somatischen Mutationen und differentiell methylierten CpG Positionen als auch differentiell exprimierten miRNAs, ermöglicht. Für die Analyse von somatischen Mutationen entwickelten wir zudem eine NGS Pipeline und wendeten diese auf zwei unterschiedliche Gruppen von bakteriellen Isolaten (nasale und invasive) an, um einerseits die phylogenetische Position des kürzlich im Saarland aufgekommenen Klons t504 (Spa-type t504) zu untersuchen, aber auch um den Mechanismus, der zu einer Infektion durch invasive Stämme führt, besser zu verstehen. All dies motivierte uns dazu TFmiR als frei verfügbare Web-Applikation zu entwickeln, welche eine tief gehende integrative Analyse von den kombinatorischen regulatorischen Interaktionen zwischen TFs/Genen und miRNAs ermöglicht, die an der Krankheitsentwicklung im Menschen beteiligt sind. Die entwickelten Methoden wurden auf die zelluläre Differenzierung (Hämatopoese), als Beispiel für einen biologischen Prozess, als auch auf Brustkrebs und Diabetes, als Beispiele für komplexe Krankheiten, angewendet um deren molekulare Mechanismen zu untersuchen. Zusammenfassend hat diese Arbeit zur Entwicklung von interessanten, rechnergestützten Methoden geführt, welche als nicht-kommerzielle Software publiziert wurden. Die Validierung unserer Methoden anhand von topologischen und funktionsbasierten Analysen sowohl in zellulärer Differenzierung als auch komplexen Krankheiten, machen diese zu verlässlichen systembiologischen Werkzeugen für Wissenschaftler aus den unterschiedlichsten Naturwissenschaftsbereichen.
Link to this record: urn:nbn:de:bsz:291-scidok-62505
hdl:20.500.11880/26673
http://dx.doi.org/10.22028/D291-26617
Advisor: Helms, Volkhard
Date of oral examination: 10-Aug-2015
Date of registration: 22-Sep-2015
Notes: Richtiger akademischer Titel "Dr.-Ing."
Faculty: MI - Fakultät für Mathematik und Informatik
Department: MI - Informatik
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
MH_PHD_Thesis_Final.pdf30,88 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.