Please use this identifier to cite or link to this item: doi:10.22028/D291-27105
Title: Biomedical knowledge base construction from text and its applications in knowledge-based systems
Author(s): Ernst, Patrick
Language: English
Year of Publication: 2017
SWD key words: Wissensbanksystem
Information extraction
Text mining
DDC notations: 004 Computer science, internet
570 Life sciences, biology
610 Medicine and health
Publikation type: Dissertation
Abstract: While general-purpose Knowledge Bases (KBs) have gone a long way in compiling comprehensive knowledgee about people, events, places, etc., domain-specific KBs, such as on health, are equally important, but are less explored. Consequently, a comprehensive and expressive health KB that spans all aspects of biomedical knowledge is still missing. The main goal of this thesis is to develop principled methods for building such a KB and enabling knowledge-centric applications. We address several challenges and make the following contributions: - To construct a health KB, we devise a largely automated and scalable pattern-based knowledge extraction method covering a spectrum of different text genres and distilling a wide variety of facts from different biomedical areas. - To consider higher-arity relations, crucial for proper knowledge representation in advanced domain such as health, we generalize the fact-pattern duality paradigm of previous methods. A key novelty is the integration of facts with missing arguments by extending our framework to partial patterns and facts by reasoning over the composability of partial facts. - To demonstrate the benefits of a health KB, we devise systems for entity-aware search and analytics and for entity-relationship-oriented exploration. Extensive experiments and use-case studies demonstrate the viability of the proposed approaches.
Universelle Wissensbanken, die durch automatische Wissensextraktion aus Internetquellen konstruiert wurden, beinhalten eine Fülle an Detailwissen über Personen, Orte, Ereignisse, etc. Wichtige domänenspezifische Anwendungsfälle, wie im Gesundheits- und biomedizinischen Bereich, haben ebenfalls viel Beachtung erhalten. Umfassende Wissensbanken, die alle Aspekte der Lebenswissenschaften widerspiegeln, fehlen allerdings. Das Hauptaugenmerk dieser Dissertation liegt daher auf der Methodenentwicklung zur Konstruktion solcher Wissensbanken und auf der Realisierung von darauf aufbauender, wissensbasierter Anwendungen. Die Arbeit adressiert drei Problembereiche und entwickelt folgende Lösungsvorschläge: - Zur Konstruktion einer Wissensbank entwickeln wir einen weitgehend automatisierten und skalierbaren, musterbasierten Wissensextraktionsansatz. Ausgehend von einem Spektrum verschiedener Textgenres ist dieser in der Lage eine hohe Anzahl von Fakten zu extrahieren, die eine Vielzahl biomedizinischer Bereiche abdecken. - In komplexen Domänen wie der Biomedizin ist es erforderlich, höherstellige Relationen zu betrachten. Um diesem Umstand gerecht zu werden, verallgemeinern wir das "`Fact-pattern Duality"' Paradigma früherer Methoden. Ein Schwerpunkt liegt auf der Betrachtung von Fakten mit fehlenden Argumenten, die durch eine Erweiterung des Ansatzes auf partielle Muster und Fakten eingebunden werden. Die Vereinheitlichung partieller Fakten wird mittels logischer Deduktion realisiert. - Um die Vorteile einer medizinischen Wissensbank zu demonstrieren, präsentieren wir Systeme zur entitätsbasierten Suche und Analyse sowie zur relationalen Faktenexploration. Experimentelle Auswertungen und Anwedungsfallstudien zeigen die Tragfähigkeit der vorgeschlagenen Ansätze.
Link to this record: urn:nbn:de:bsz:291-scidok-ds-271051
hdl:20.500.11880/26987
http://dx.doi.org/10.22028/D291-27105
Advisor: Weikum, Gerhard
Date of oral examination: 6-Mar-2018
Date of registration: 20-Mar-2018
Faculty: MI - Fakultät für Mathematik und Informatik
Department: MI - Informatik
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
ClassicThesis.pdf5,52 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons