Please use this identifier to cite or link to this item: doi:10.22028/D291-22792
Title: Novel approaches to the integration and analysis of systems biology data
Other Titles: Neue Methoden zur Integration und Analyse von Systembiologie-Daten
Author(s): Ramírez, Fidel
Language: English
Year of Publication: 2011
SWD key words: Systembiologie
Bioinformatik
Wissensextraktion
Proteine
High throughput screening
Free key words: Proteininteraktionen
BioSim-Methode
Hochdurchsatz-Methoden
systems biology
functional similarity
protein-protein interaction
data mining
bioinformatics
DDC notations: 570 Life sciences, biology
004 Computer science, internet
Publikation type: Dissertation
Abstract: The opportunity to investigate whole cellular systems using experimental and computational high-throughput methods leads to the generation of unprecedented amounts of data. Processing of these data often results in large lists of genes or proteins that need to be analyzed and interpreted in the context of all other biological information that is already available. To support such analyses, repositories aggregating and merging the biological information contained in different databases are required. To address this need, we created an integrative data warehouse containing millions of up-to-date annotations related to human genes and proteins from over thirty major molecular biology databases. In particular, this data warehouse was instrumental in assessing the data quality of human protein interactions and in predicting an important, but largely unidentified, group of proteins that function as molecular scaffolds in the formation of signaling cascades. Additionally, the data warehouse enabled us to devise the novel computational method BioSim for the discovery of biological relationships based on the functional similarity of gene and protein annotations. Furthermore, we showed how this method allows identifying disease-associated genes. To facilitate the analysis and interpretation of large lists of genes or proteins derived from high-throughput methods, we built the new web portal BioMyn. It provides a powerful search engine with public access to the data warehouse and the BioSim method. BioMyn also offers a number of useful tools for own functional enrichment analysis and the visualization of the results.
Die Möglichkeit, ganze zelluläre Systeme mit experimentellen und computerbasierten Hochdurchsatz-Methoden zu erforschen, führt zur Generierung beispielloser Datenmengen. Die Verarbeitung dieser Daten ergibt oft große Listen von Genen oder Proteinen, die im Kontext all der anderen bereits vorhandenen, biologischen Informationen analysiert und interpretiert werden müssen. Um solche Analysen zu unterstützen, werden Datensammlungen benötigt, die die in verschiedenen Datenbanken enthaltenen biologischen Informationen zusammenführen und verknüpfen. Um diesem Bedarf Rechnung zu tragen, wurde ein integratives Data-Warehouse angelegt, das Millionen aktueller Annotationen bezüglich humaner Gene und Proteine aus über dreißig wichtigen Datenbanken der Molekularbiologie beinhaltet. Insbesondere war dieses Data-Warehouse nützlich bei der Bewertung der Datenqualität humaner Proteininteraktionen und bei der Vorhersage einer bedeutenden, jedoch größtenteils unidentifizierten Gruppe von Proteinen, die als molekulares Gerüst der Bildung von Signalkaskaden dienen. Zudem ermöglichte es das Data-Warehouse, die neuartige Computermethode BioSim zur Aufdeckung biologischer Ähnlichkeiten, basierend auf funktionellen Ähnlichkeiten von Gen- und Proteinannotationen, zu entwickeln. Des Weiteren wurde gezeigt, wie diese Methode die Identifizierung krankheitsassoziierter Gene erlaubt. Um die Analyse und Interpretation großer Listen von Genen oder Proteinen, die aus Hochdurchsatz-Methoden stammen, zu erleichtern, wurde das neue Webportal BioMyn geschaffen. Es bietet eine starke Suchmaschine, die das Data-Warehouse und die BioSim-Methode öffentlich zugänglich macht. Auch stellt BioMyn eine Reihe praktischer Tools für eigene Funktionsanalysen und die Visualisierung der Ergebnisse zur Verfügung.
Link to this record: urn:nbn:de:bsz:291-scidok-48554
hdl:20.500.11880/22848
http://dx.doi.org/10.22028/D291-22792
Advisor: Lengauer, Thomas
Date of oral examination: 19-Apr-2012
Date of registration: 11-May-2012
Faculty: NT - Naturwissenschaftlich- Technische Fakultät
Department: NT - Biowissenschaften
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
thesis.pdf15,94 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.