Please use this identifier to cite or link to this item: doi:10.22028/D291-26575
Title: Evolutionary epigenomics - identifying functional genome elements by epigenetic footprints in the DNA
Other Titles: Evolutionäre Epigenomik - Identifizierung von funktionalen Genome Elementen durch epigenetische Footprints in der DNS
Author(s): Feuerbach, Lars
Language: English
Year of Publication: 2014
SWD key words: Epigenetik
Methylierung
Bioinformatik
Free key words: Deaminierung
Evolution
CpG Inseln
evolution
epigenetics
methylation
CpG island
DDC notations: 004 Computer science, internet
Publikation type: Dissertation
Abstract: Over the last decade, advances in genome sequencing have substantially increased the amount of genomic DNA sequences available. While these rich resources have improved our understanding of genome function, research of the epigenome as a transient but heritable memory system of the cell has only profited from this development indirectly. Although epigenetic information in the form of DNA methylation is not directly encoded in the genomic nucleotide sequence, it increases the mutation rate of cytosine-guanine dinucleotides by the CpG decay effect, and thus leaves epigenetic footprints in the DNA. This thesis proposes four approaches to facilitate this information for research. For largely uncharacterized genomes, CgiHunter presents an exhaustive algorithm for an unbiased DNA sequence-based annotation of CpG islands as regions that are protected from CpG decay. For species with well characterized point mutation frequencies, EqiScore identifies regions that evolve under distinct DNA methylation levels. Furthermore, the derived equilibrium distributions for methylated and unmethylated genome regions predict the evolutionary robustness of transcription factor binding site motifs against the CpG decay effect. The AluJudge annotation and underlying L-score provide a method to identify putative active copies of CpG-rich transposable elements within genomes. Additionally, epigenetic footprints in these sequences are applied to predict the germline epigenome of their loci. Moreover, AluJudge provides support for the targeted removal of epigenetically silenced repeat copies from CpG island annotations, which are subjected to a methylation-induced erosion process. Finally, the FFK approach enables the prediction of the germline methylome for homologous genome loci. In a number of case studies on the human genome, I demonstrate how this evolutionary epigenomics toolkit can be applied to enhance the epigenomic characterization of the large quantity of currently sequenced vertebrate genomes. Furthermore, these studies show how to improve the identification of novel epigenetic functional genome regions in already well characterized species. Finally, the toolkit opens new avenues for computer-based research of the evolution of genome-wide DNA methylation.
In den letzten Jahrzehnten haben Fortschritte in der Genom-Sequenzierung zu einem substanziellen Zuwachs an verfügbaren DNS-Sequenzen geführt. Während diese Ressourcen zu einem verbesserten Verständnis der Funktionsweise von Genomen führten, konnte die Erforschung des Epigenoms als veränderlichem und doch vererbbarem zellulärem Informationsspeicher nur indirekt von dieser Entwicklung profitieren. Obwohl epigenetische Information nicht direkt in Form von genomischen Nukleotid-Sequenzen kodiert wird, sind beide Systeme derart miteinander verflochten, dass gemeinsame evolutionäre Abhängigkeiten einen epigenetischen Fußabdruck in der genomischen DNS erzeugen. In dieser Arbeit werden vier Ansätze vorgestellt, um diese bisher weitgehend unerforschte Informationsquelle zu erschließen. Gleichsam einem Werkzeugkasten für Probleme der Evolutionären Epigenomik, bieten sie für eine Vielzahl verschiedener Szenarien eine Auswahl von einsetzbaren Methoden an. Für weitgehend uncharakterisierte Genome ermöglicht CgiHunter, als kombinatorisch präziser Algorithmus, die auf der DNS-Sequenz basierende Identifikation von CpG Inseln, welche als Zentren von epigenetischer Regulation in Wirbeltier-Genomen bekannt sind. Für Spezies in denen bereits Modelle der Punktmutationshäufigkeit existieren, können Dinukleotid-Gleichgewichtsverteilungen eingesetzt werden. Sie bieten über den EqiScore-Ansatz die Möglichkeit, Genomregionen zu identifizieren, die unter einem erhöhten DNS methylierungs Nieveau evolvieren. Des Weiteren ermöglichen sie eine Vorhersage der evolutionären Robustheit von Transkriptionsfaktor-Bindestellen gegenüber dieser epigenetischen Einflüsse. Komplementär dazu bietet die AluJudge Annotation und der ihr zugrundeliegende L-Score für Genome mit CpG-reichen transponierenden Elementen einen Weg, unter ihnen potentiell aktive Kopien zu identifizieren. Darüber hinaus können diese Sequenzen als positions-spezifische Sonden des Keimbahn-Epigenoms eingesetzt werden. Auch unterstützt der L-Score die gezielte Entfernung von jenen mehrheitlich epigenetisch inaktiven Regionen aus CpG-Insel-Annotationen, welche einem methylierungs-induziertem Erosions-Prozess unterworfen sind. Zuletzt wird der FFK-Algorithmus, als ein phylogenetischer Ansatz beschrieben, der für nahe verwandte Spezies, wie jene des Primaten-Stammbaums, eine Vorhersage des Keimbahnmethyloms für beliebige Genomregionen ermöglicht. In einer Reihe von Fallstudien an Hand des menschlichen Genoms, demonstriere ich im Anschluss, die Funktionalität dieser bioinformatischen Werkzeuge. Zum Einen ermöglichen sie die Identifizierung von neuen epigenetisch kontrollierten Regionen im menschlichen Genom. Zum Anderen dienen sie als Beispiel für die epigenomische in-silico Charakterisierung der Vielzahl von bald verfügbaren Vertebraten-Genomen. Zuletzt wird das Potential dieser neuen Ansätze für die computerbasierte Erforschung der evolutionären Entwicklung von genomeweiter DNS-Methylierung thematisiert.
Link to this record: urn:nbn:de:bsz:291-scidok-58884
hdl:20.500.11880/26631
http://dx.doi.org/10.22028/D291-26575
Advisor: Lengauer, Thomas
Date of oral examination: 16-Jan-2014
Date of registration: 11-Sep-2014
Faculty: MI - Fakultät für Mathematik und Informatik
Department: MI - Informatik
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
Feuerbach_PhD_Thesis_2014_Final.pdf2,95 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.