Please use this identifier to cite or link to this item: doi:10.22028/D291-25428
Title: Question answering and query processing for extended knowledge graphs
Other Titles: Frage-Antworten und Abfrageverarbeitung für erweiterte Wissengraphen
Author(s): Yahya, Mohamed
Language: English
Year of Publication: 2016
SWD key words: Information Extraction
Abfrageverarbeitung
Natürlichsprachiges System
Free key words: question answering
query processing
knowledge graphs
information extraction
DDC notations: 004 Computer science, internet
Publikation type: Dissertation
Abstract: Knowledge graphs have seen wide adoption, in large part owing to their schemaless nature that enables them to grow seamlessly, allowing for new relationships and entities as needed. With this rapid growth, several issues arise: (i) how to allow users to query knowledge graphs in an expressive and user-friendly manner, which shields them from all the underlying complexity, (ii) how, given a structured query, can we return satisfactory answers to the user despite possible mismatches between the query vocabulary and structure and the knowledge graph, and (iii) how to automatically acquire new knowledge, which can be fed into a knowledge graph. In this dissertation, we make the following contributions to address the above issues: - We present DEANNA, a framework for question answering over knowledge graphs, allowing users to easily express complex information needs using natural language and obtain tuples of entities as answers thereby taking advantage of the structure in the knowledge graph. - We introduce TriniT, a framework that compensates for unsatisfactory results of structured queries over knowledge graphs, either due to mismatches with the knowledge graph or the knowledge graph's inevitable incompleteness. TriniT tackles the two issues by extending the knowledge graph using information extraction over textual corpora, and supporting query relaxation where a user's query is rewritten in a manner transparent to the user to compensate for any mismatches with the data. - We present ReNoun, an open information extraction framework for extracting binary relations mediated by noun phrases and their instances from text. Our scheme extends the state-of-the-art in open information extraction which has thus far focused on relations mediated by verbs. Our experimental evaluations of each of the above contributions demonstrate the effectiveness of our methods in comparison to state-of-the-art approaches.
Der Einsatz von Wissensgraphen erfreut sich großer Beliebtheit, die vor allem der schemafreien Natur der Graphen geschuldet ist. Diese ermöglicht ein reibungsloses Anwachsen des Graphen, so dass neue Relationen und Entitäten je nach Bedarf hinzugefügt werden können. Durch dieses rapide Anwachsen des Graphen treten allerdings auch einige Fragestellungen auf: (i) Wie kann man Nutzern ermöglichen, Wissensgraphen in einer ausdrucksstarken und zugleich nutzerfreundlichen Weise anzufragen, die die Nutzer von der zugrundeliegenden Komplexität abschirmt, (ii) wie können für eine strukturierte Suchanfrage trotz möglicher Diskrepanzen in Vokabular und Struktur zwischen Suchanfrage und Wissensgraph zufriedenstellende Antworten geliefert werden, und (iii) wie kann neues Wissen automatisiert akquiriert werden, um es in einen Wissensgraphen zu integrieren? In der vorliegenden Dissertation werden die folgenden Beiträge entwickelt, um die obigen Problemstellungen zu adressieren: - Wir präsentieren mit DEANNA ein Frage-Antwort-System für Wissensgraphen, das Nutzern ermöglicht, auf einfache Art und Weise komplexe Informationsbedürfnisse natürlichsprachlich auszudrücken. Die Struktur des Wissensgraphen wird dabei dahingehend ausgenutzt, das die Antworten als Entitätentupel ausgegeben werden. - Mit TriniT entwickeln wir ein Framework, dass unbefriedigende Ergebnisse für strukturierte Suchanfragen auf Wissensgraphen kompensiert. Dabei werden sowohl Fehltreffer als auch unvermeidbare Lücken im Wissensgraphen berücksichtigt. Beide Probleme werden durch TriniT dadurch angegangen, dass der Wissensgraph mithilfe von Methoden der Informationsextraktion aus Textkorpora erweitert wird, und dass Suchanfragen relaxiert werden. Dafür wird die Suchanfrage eines Nutzers auf transparente und für den Nutzer nachvollziehbare Weise umgeschrieben, um Fehltreffer auszugleichen. - Außerdem stellen wir ReNoun vor, ein Framework für Open Information Extraction zum Extrahieren von binären Relationen, die durch Nominalphrasen ausgedrückt werden. Unser Schema erweitert dabei den aktuellen Forschungsstand im Bereich der offenen Informationsextraktion, da bislang der Fokus auf verbalen Relationen lag. Unsere experimentellen Evaluierungen der oben genannten Methoden und Systeme verdeutlichen die Effektivität unserer Methoden im Vergleich zu State-of-the-Art Ansätzen.
Link to this record: urn:nbn:de:bsz:291-scidok-64765
hdl:20.500.11880/25484
http://dx.doi.org/10.22028/D291-25428
Advisor: Weikum, Gerhard
Date of oral examination: 15-Apr-2016
Date of registration: 26-Apr-2016
Faculty: SE - Sonstige Einrichtungen
Department: SE - Max-Planck-Institut für Informatik
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
myahya_phd_thesis_final_2016_04_21.pdf1,14 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.