Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-27105
Titel: Biomedical knowledge base construction from text and its applications in knowledge-based systems
VerfasserIn: Ernst, Patrick
Sprache: Englisch
Erscheinungsjahr: 2017
Kontrollierte Schlagwörter: Wissensbanksystem
Information extraction
Text mining
DDC-Sachgruppe: 004 Informatik
570 Biowissenschaften, Biologie
610 Medizin, Gesundheit
Dokumenttyp: Dissertation
Abstract: While general-purpose Knowledge Bases (KBs) have gone a long way in compiling comprehensive knowledgee about people, events, places, etc., domain-specific KBs, such as on health, are equally important, but are less explored. Consequently, a comprehensive and expressive health KB that spans all aspects of biomedical knowledge is still missing. The main goal of this thesis is to develop principled methods for building such a KB and enabling knowledge-centric applications. We address several challenges and make the following contributions: - To construct a health KB, we devise a largely automated and scalable pattern-based knowledge extraction method covering a spectrum of different text genres and distilling a wide variety of facts from different biomedical areas. - To consider higher-arity relations, crucial for proper knowledge representation in advanced domain such as health, we generalize the fact-pattern duality paradigm of previous methods. A key novelty is the integration of facts with missing arguments by extending our framework to partial patterns and facts by reasoning over the composability of partial facts. - To demonstrate the benefits of a health KB, we devise systems for entity-aware search and analytics and for entity-relationship-oriented exploration. Extensive experiments and use-case studies demonstrate the viability of the proposed approaches.
Universelle Wissensbanken, die durch automatische Wissensextraktion aus Internetquellen konstruiert wurden, beinhalten eine Fülle an Detailwissen über Personen, Orte, Ereignisse, etc. Wichtige domänenspezifische Anwendungsfälle, wie im Gesundheits- und biomedizinischen Bereich, haben ebenfalls viel Beachtung erhalten. Umfassende Wissensbanken, die alle Aspekte der Lebenswissenschaften widerspiegeln, fehlen allerdings. Das Hauptaugenmerk dieser Dissertation liegt daher auf der Methodenentwicklung zur Konstruktion solcher Wissensbanken und auf der Realisierung von darauf aufbauender, wissensbasierter Anwendungen. Die Arbeit adressiert drei Problembereiche und entwickelt folgende Lösungsvorschläge: - Zur Konstruktion einer Wissensbank entwickeln wir einen weitgehend automatisierten und skalierbaren, musterbasierten Wissensextraktionsansatz. Ausgehend von einem Spektrum verschiedener Textgenres ist dieser in der Lage eine hohe Anzahl von Fakten zu extrahieren, die eine Vielzahl biomedizinischer Bereiche abdecken. - In komplexen Domänen wie der Biomedizin ist es erforderlich, höherstellige Relationen zu betrachten. Um diesem Umstand gerecht zu werden, verallgemeinern wir das "`Fact-pattern Duality"' Paradigma früherer Methoden. Ein Schwerpunkt liegt auf der Betrachtung von Fakten mit fehlenden Argumenten, die durch eine Erweiterung des Ansatzes auf partielle Muster und Fakten eingebunden werden. Die Vereinheitlichung partieller Fakten wird mittels logischer Deduktion realisiert. - Um die Vorteile einer medizinischen Wissensbank zu demonstrieren, präsentieren wir Systeme zur entitätsbasierten Suche und Analyse sowie zur relationalen Faktenexploration. Experimentelle Auswertungen und Anwedungsfallstudien zeigen die Tragfähigkeit der vorgeschlagenen Ansätze.
Link zu diesem Datensatz: urn:nbn:de:bsz:291-scidok-ds-271051
hdl:20.500.11880/26987
http://dx.doi.org/10.22028/D291-27105
Erstgutachter: Weikum, Gerhard
Tag der mündlichen Prüfung: 6-Mär-2018
Datum des Eintrags: 20-Mär-2018
Fakultät: MI - Fakultät für Mathematik und Informatik
Fachrichtung: MI - Informatik
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
ClassicThesis.pdf5,52 MBAdobe PDFÖffnen/Anzeigen


Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons Creative Commons