Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-32073
Titel: Integration of protein three-dimensional structure into the workflow of interpretation of genetic variants
VerfasserIn: Gress, Alexander
Sprache: Englisch
Erscheinungsjahr: 2020
DDC-Sachgruppe: 004 Informatik
500 Naturwissenschaften
570 Biowissenschaften, Biologie
Dokumenttyp: Dissertation
Abstract: Life stores information in large biopolymer molecules, which can be repre- sented as a sequence of letters. Computers stores information in sequences of zeros and ones. This predestines computers for automated processing of biological data and with a great success. Computational biology has produced many methods and tools based on biological sequences. However, reducing life to just sequences radically reduces the whole picture. The functionality of biomolecules, especially proteins, is performed in the three-dimensional (3D) space. Thus, limiting methods in computational biology to sequences will never yield sufficient insights in the ways molecular biology operates. In this thesis I present my work on the integration of protein 3D structure information into the methodological workflow of computational biology. We developed an algorithmic pipeline that is able to map protein sequences to protein structures, providing an additional source of information. We used this pipeline in order to analyze the effects of genetic variants from the perspective of protein 3D structures. We analyzed genetic variants associated with diseases and compared their structural arrangements to that of neutral variants. Additionally, we discussed how structural information can improve methods that aim to predict the consequences of genetic variants.
Das Leben speichert Informationen mit der Hilfe von langen Biopolymermolekülketten. Man kann solche Ketten durch Buchstabensequenzen beschreiben. Computer speichern Informationen in Sequenzen von Nullen und Einsen. Dies prädestiniert Computer zur Verabeitung biologischer Daten und tatsächlich hat die Bioinformatik, mit großem Erfolg, Methoden und Werkzeuge entwickelt, die auf der Verarbeitung solcher Sequenzen basieren. Allerdings, spielt sich die Funktionalität von Biomolekülen, insbesonders die von Proteinen, im drei-dimensionalen (3D) Raum ab. Und deshalb werden bioinformatische Methoden, die sich auf Sequenzdaten beschränken niemals in der Lage sein, mikrobiologische Vorgänge funktionell zu beschreiben. Diese Thesis widmet sich der Integration von Protein 3D Strukturinformationen in die Abläufe bioinformatischer Methodiken. Wir haben eine algorithmische Pipeline entwickelt, die es ermöglicht Proteinsequenzen auf Proteinstrukturen abzubilden um so eine zusätzliche Informationsquelle beizusteuern. Wir benutzten diese Methodik um die Effekte von genetischen Variationen aus der Sichtweise von Proteinstrukturen zu analysieren. Wir haben die Tendenzen der räumlichen Verteilung von genetischen Varianten, die man mit Krankheiten in Verbidung gebracht hat, analysiert und sie mit denen von neutralen Varianten verglichen. Desweiteren, haben wir geprüft in wie weit das Einbeziehen strukureller Daten die Vorhersage von Konsequenzen genetischer Varianten verbessert.
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-320737
hdl:20.500.11880/29683
http://dx.doi.org/10.22028/D291-32073
Erstgutachter: Kalinina, Olga
Tag der mündlichen Prüfung: 24-Jul-2020
Datum des Eintrags: 15-Sep-2020
Fakultät: MI - Fakultät für Mathematik und Informatik
Fachrichtung: MI - Informatik
Professur: MI - Keiner Professur zugeordnet
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
Gress - Thesis.pdf12,11 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.