Integrated Analysis and Application Pipelines for Complex Disease Data

Christian Spaniol

Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-23087

Titel:	Integrated Analysis and Application Pipelines for Complex Disease Data
Alternativtitel:	Integrative Datenerfassung und Softwarepipelines zur Analyse multifaktorieller Krankheiten
VerfasserIn:	Christian Spaniol
Sprache:	Deutsch
Erscheinungsjahr:	2015
Kontrollierte Schlagwörter:	Bioinformatik Systembiologie Anwendungssoftware
Freie Schlagwörter:	Regulatorische Netzwerke Regulatory Networks
DDC-Sachgruppe:	500 Naturwissenschaften
Dokumenttyp:	Dissertation
Abstract:	The increasing amount of biological data available from high-throughput technologies poses great interdisciplinary challenges to research. Today, cost-efficient platforms generate manifold types of data and allow to build comprehensive resources that include but are not limited to genomics, proteomics, and metabolomics on a systemic scale. In order to adapt to this development in the post-wetlab analysis, computer scientists in computational biology work on methods and software frameworks that are able to account for data size and diversity, and allow to scrutinize data in respect to a specific context, such as the emergence of diseases. Aiming for this, we first present a desktop software framework designed to integrate biological data that features a uniform interface to perform consecutive analysis steps managed by an automated task processing system. The extensibility of the platform based on a concise plugin interface was used for a study on breast cancer for which we developed a plugin to derive gene regulatory networks. From this analysis, we derived a general approach to generate transcription factor-microRNA regulatory networks and built a webservice available for public use: TFmiR. Using differentially expressed sets of mRNAs and miRNAs, TFmiR generates a network with experimental or predicted evidence and provides downstream investigation, e.g. applying various network measures and overrepresentation analysis. Further in-depth analysis is provided with a motif search algorithm. For all motifs of particular interest, the software allows to investigate co-regulated and co-targeted subnetworks and calculates the functional similarity scores of the participating genes. We investigated a comprehensive dataset on Alzheimer's disease that was provided by the neurological laboratory in Homburg. We conducted the individual analysis of the various types of data, followed by applying our approaches to build regulatory networks, and search for potential key drivers of the Alzheimer's disease. Moreover, we show a different strategy based on patient-similarity networks with the aim to find a descriptive combination of markers for AD spanning the multiple data sources. Biotechnologische Hochdurchsatzverfahren und die damit verbundene stetig anwachsende Menge an biologischen Daten stellen die Forschung vor ebenso wachsende Herausforderungen. Neue und kosteneffiziente Verfahren erlauben die Erstellung umfangreicher Datenbanken, die beispielsweise das vollständige Genom, Proteom, oder Metabolom eines Organismus oder Individuums enthalten können. Informatiker, Bioinformatiker, und Biologen arbeiten daher an Methoden und Softwareumgebungen um dieser Entwicklung nachzukommen und diese Daten trotz ihres Umfangs und Vielfältigkeit einheitlich erfassen zu können. Dabei gilt besonderes Interesse der Notwendigkeit, diese Daten im Hinblick auf ihre Bedeutung in bestimmten Kontexten zu untersuchen, wie zum Beispiel im Zusammenhang mit Krankheiten. Mit diesem Ziel vor Augen zeigen wir zunächst die Softwareumgebung Mebitoo, die wir zur Integration und automatisierten Analyse von biologischen Daten entwickelten. Mit einer Erweiterung der Software zur Erstellung regulatorischer Netzwerke zeigen wir die vielfältige Einsetzbarkeit der Platform am Beispiel von Daten zu Brustkarzinomen. Aufbauend darauf entwickelten wir eine allgemeine Strategie zur Erstellung regulatorischer Netzwerke, die auf differentiell exprimierten Genen und microRNAs basiert. Wir stellten einen Webservice zur Verfügung, der durch die Einbindung verschiedener Datenbanken zu experimentell bestimmten oder in silico berechneten mutmaßlichen Interaktionen ein regulatorisches Netzwerk, wahlweise im Hinblick auf eine mögliche Krankheit, erstellt und untersucht. Die bereitgestellten Analysen umfassen Methoden zur generellen Netzwerkevaluierung, sowie aufwändigere Algorithmen zur Bestimmung von Netzwerkmotiven und deren Subnetzen, und die Untersuchung auf deren Funktionalität. Abschließend beschreiben wir die Untersuchung eines umfassenden Datensatzes zur Alzheimer'schen Krankheit, welcher vom neurologischen Labor der Universitätsklinik des Saarlandes zusammengestellt wurde. Die Daten umfassen Gen- und miRNA Expressionsprofile, Methylierung, Proteinlevelmessungen, und SNPs zu einer Kohorte von Alzheimerpatienten und Kontrollen. Wir untersuchten die Daten jeweils individuell und zeigten anschließend die Anwendung unserer Pipeline Identifikation von mutmaßlichen Key Drivern. Darüberhinaus verfolgten wir einen Ansatz, der auf Ähnlichkeitsnetzen für die jeweiligen Patienten beruht.
Link zu diesem Datensatz:	urn:nbn:de:bsz:291-scidok-62468 hdl:20.500.11880/23143 http://dx.doi.org/10.22028/D291-23087
Erstgutachter:	Helms, Volkhard
Tag der mündlichen Prüfung:	3-Sep-2015
Datum des Eintrags:	9-Sep-2015
Fakultät:	NT - Naturwissenschaftlich- Technische Fakultät
Fachrichtung:	NT - Biowissenschaften
Sammlung:	SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:

Datei	Beschreibung	Größe	Format
Dissertation_C_Spaniol.pdf		5,07 MB	Adobe PDF	Öffnen/Anzeigen

Export: BibTex Statistik anzeigen

Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.