Please use this identifier to cite or link to this item: doi:10.22028/D291-28659
Title: From genes to transcripts : integrative modeling and analysis of regulatory networks
Author(s): Dehghani Amirabad, Azim
Language: English
Year of Publication: 2019
DDC notations: 004 Computer science, internet
Publikation type: Doctoral Thesis
Abstract: Although all the cells in an organism posses the same genome, the regulatory mechanisms lead to highly specific cell types. Elucidating these regulatory mechanisms is a great challenge in systems biology research. Nonetheless, it is known that a large fraction of our genome is comprised of regulatory elements, the precise mechanisms by which different combinations of regulatory elements are involved in controlling gene expression and cell identity are poorly understood. This thesis describes algorithms and approaches for modeling and analysis of different modes of gene regulation. We present POSTIT a novel algorithm for modeling and inferring transcript isoform regulation from transcriptomics and epigenomics data. POSTIT uses multi-task learning with structured-sparsity inducing regularizer to share the regulatory information between isoforms of a gene, which is shown to lead to accurate isoform expression prediction and inference of regulators. Furthermore, it can use isoform expression level and annotation as informative priors for gene expression prediction. Hence, it constitute a novel accurate approach applicable to gene or transcript isoform centric analysis using expression data. In an application to microRNA (miRNA) target prioritization, we demonstrate that it out-competes classical gene centric methods. Moreover, pinpoints important transcription factors and miRNAs that regulate differentially expressed isoforms in any biological system. Competing endogenous RNA (ceRNA) interactions mediated by miRNAs were postulated as an important cellular regulatory network, in which cross-talk between different transcripts involves competition for joint regulators. We developed a novel statistical method, called SPONGE, for large-scale inference of ceRNA networks. In this framework, we designed an efficient empirical p-value computation approach, by sampling from derived null models, which addresses important confounding factors such as sample size, number of involved regulators and strength of correlation. In an application to a large pan-cancer dataset with 31 cancers we discovered protein-coding and non-coding RNAs that are generic ceRNAs in cancer. Finally, we present an integrative analysis of miRNA and protein-based posttranscriptional regulation. We postulate a competitive regulation of the RNAbinding protein IMP2 with miRNAs binding the same RNAs using expression and RNA binding data. This function of IMP2 is relevant in the contribution to disease in the context of adult cellular metabolism. As a summary, in this thesis we have presented a number of different novel approaches for inference and the integrative analysis of regulatory networks that we believe will find wide applicability in the biological sciences.
Obwohl jede Zelle eines Organismus das gleiche Genom beinhaltet, führen regulatorische Mechanismen zu hoch spezialisierten Zelltypen. Die Aufdeckung dieser regulatorischen Mechanismen ist eine große Herausforderung für Forschung in der Systembiologie. Obwohl ein Großteil unseres Genoms aus regulatorischen Elementen besteht, sind die genauen Mechanismen, durch die verschiedene regulatorische Elemente miteinander kombiniert Genexpression und Zellidentität bestimmen, bislang noch unbekannt. Diese Arbeit beschreibt Algorithmen und Ansätze zur Modellierung und Analyse verschiedener Aspekte der Genregulation. Wir stellen POSTIT als einen neuen Algorithmus zur Modellierung und Vorhersage der Regulierung von Transkript-Isoformen basierend auf Transcriptomics- und Epigenomics-Daten vor. POSTIT verwendet multi-task learning mit Regularisierung auf Grundlage der Transkriptannotation, um Information zwischen Isoformen des gleichen Gens zu teilen. Dies führt zur besseren Vorhersage der Isoformexpression, sowie der Detektierung von Regulatoren. Außerdem können Isoform-expression und -annotation als informativer Prior zur Genexpressionsvorhersage verwendet werden. Daher stellt es einen neuen, genaueren Ansatz dar, der zur Gen- oder Transkriptisoformabhängigen Analyse von Genexpressiondaten verwendbar ist. In einer Anwendung auf miRNA target prioritization zeigen wir, dass es die Genauigkeit der Vorhersage durch das klassische genabhängige Modell übertrifft. Zusätzlich werden wichtige Transkriptionsfaktoren und miRNAs, die differentiell exprimierte Genisoformen in Krebs regulieren, erkannt. Competing endogeneous RNA (ceRNA) Interaktionen, die durch miRNAs mediiert werden, bilden ein wichtiges regulatorischen Netzwerk, in welchem ein Wettkampf um die gemeinsame Regulation verschiedener Transkripte entsteht. Dafür entwickelten wir eine neue statistische Methode, SPONGE, zur Vorhersage großer ceRNA Netzwerke. Im Zuge dessen leiteten wir einen Ansatz ab, der empirische p-Werte durch mehrmaliges Ziehen von Stichproben aus einem abgeleiteten Nullmodell efizient berechnen kann. Dadurch können wichtige fehlleitende Faktoren, wie Stichprobengröße, Anzahl der Regulatoren oder Stärke der Korrelation adressiert werden. Es handelt sich hierbei um einen einheitlichen, schnellen Ansatz, der Koregulation verschiedener miRNAs betrachtet. Durch die Anwendung auf einen Krebsdatensatz mit 31 Krebstypen detektierten wir proteinkodierende und nicht-proteinkodierende RNAs, die generische ceRNAs in Krebs darstellen. Abschließend präsentieren wir eine integrative Analyse von miRNAs und protein-basierter posttranslationaler Regulation. Wir postulieren eine kompetitive Regulation des RNA-bindenden Proteins IMP2 mit miRNAs, die die selbe RNA binden. Diese Funktion von IMP2 ist insbesondere für die Beteiligung an Krankheiten des adulten zellulären Metabolismus relevant. Zusammenfassend präsentieren wir hier verschiedene neuartige Ansätze zur integrativen Analyse regulatorischer Netzwerke, welche aus unserer Sicht in vielen Bereichen der Biologie Anwendung finden werden.
Link to this record: urn:nbn:de:bsz:291--ds-286598
hdl:20.500.11880/27669
http://dx.doi.org/10.22028/D291-28659
Advisor: Schulz, Marcel
Date of oral examination: 11-Jun-2019
Date of registration: 5-Sep-2019
Faculty: MI - Fakultät für Mathematik und Informatik
Department: MI - Informatik
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
Azim_Thesis_Final_Cover-1.pdf20,11 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.