Please use this identifier to cite or link to this item: doi:10.22028/D291-23132
Title: A bioinformatics approach for conceptual genome mining
Author(s): Duddela, Srikanth
Language: English
Year of Publication: 2015
SWD key words: Bioinformatik
EM-Algorithmus
Genom
Free key words: search and matching
bioinformatics
genomes
DDC notations: 570 Life sciences, biology
Publikation type: Dissertation
Abstract: Recent advances in sequencing technology have set the stage for a steadily growing number of microbial whole-genome sequences. At the same time, bioinformatic analysis increasingly sheds light on the genome-encoded capacity of certain microorganisms for the production of secondary metabolites. This work describes the development of a bioinformatic toolkit to underpin discovery and dereplication efforts in a genomics-based workflow aimed at the characterization of multimodular biosynthetic gene clusters from bacterial genomes. Key to the “conceptual genome mining” approach implemented here is the comparison of pathways architectures represented by arrangement and properties of domains in complex PKS-, NRPS- and hybrid pathways rather than resorting to DNA- or protein-level sequence similarity. The new analysis framework named BiosynML toolkit was interfaced to antiSMASH, the de-facto standard for automatic annotation of biosynthetic pathways, and integrated with an existing in-house research database system (Mxbase). BiosynML methods were tested using 42 characterized pathways from 71 myxobacterial genomes and also applied to publicly accessible genomes from relevant microbial taxa. BiosynML tools were ultimately used to create an overview of 1347 pathways of which 783 distinct models were identified. This analysis revealed minimal overlap between suborders and enabled the tentative estimation of myxobacterial secondary metabolite gene cluster richness.
Die fortschreitende Verbesserung von Sequenziertechnologien ermöglicht den Zugang zu einer stetig wachsenden Zahl von mikrobiellen Genomsequenzen. Gleichzeitig liefern bioinformatische Methoden ein immer besseres Bild des genetischen Potentials der Mikroorganismen für die Produktion von Sekundärmetaboliten. Die vorliegende Arbeit befasst sich mit der Entwicklung von bioinformatischen Werkzeugen um die Entdeckung, die Dereplikation und letztendlich die Charakterisierung von multimodularen Biosynthesewegen in mikrobiellen Genomen zu unterstützen. Kernstück des Ansatzes ist der „konzept-basierte“ Vergleich der Architekturen von komplexen PKS-, NRPS- und hybriden Genclustern, der sich auf Anordnung und Eigenschaften biosynthetischer Domänen stützt anstelle von Sequenzähnlichkeit. Das neu entwickelte Softwarewerkzeug, genannt BiosynML, wurde mit antiSMASH (dem de-facto Standard für die automatische Annotation von Biosynthesewegen) verknüpft und in eine bestehende Forschungsdatenbank (Mxbase) integriert. BiosynML Methoden wurden anhand der Biosynthesewege für 42 bekannte Naturstoffe in 71 myxobakteriellen Genomsequenzen getestet und auf öffentlich zugängliche Genome relevanter Mikroorganismen angewendet. Die Analyse von 1347 Biosyntheswegen aus den Genomen der Myxobakterien, darunter ein derepliziertes Set von 783 Typen, ergab eine nur minimale Überlappung zwischen Unterordnungen und ermöglichte die Abschätzung der Diversität an myxobakteriellen Sekundärmetaboliten-Genclustern.
Link to this record: urn:nbn:de:bsz:291-scidok-64509
hdl:20.500.11880/23188
http://dx.doi.org/10.22028/D291-23132
Advisor: Müller, Rolf
Date of oral examination: 22-Mar-2016
Date of registration: 8-Apr-2016
Faculty: NT - Naturwissenschaftlich- Technische Fakultät
Department: NT - Pharmazie
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
pdf_SrikanthThesisFinal.pdf10,74 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.