Please use this identifier to cite or link to this item:
doi:10.22028/D291-26776
Title: | Constructing lexicons of relational phrases |
Other Titles: | Konstruktion von Lexika von relationalen Phrasen |
Author(s): | Grycner, Adam |
Language: | English |
Year of Publication: | 2017 |
SWD key words: | Wissensbasis Lexikon Hierarchie Relation |
Free key words: | relationale Phrasen Entitäten Paraphrasierung knowledge bases relational phrases lexicons relations |
DDC notations: | 004 Computer science, internet |
Publikation type: | Dissertation |
Abstract: | Knowledge Bases are one of the key components of Natural Language Understanding systems. For example, DBpedia, YAGO, and Wikidata capture and organize knowledge about named entities and relations between them, which is often crucial for tasks like Question Answering and Named Entity Disambiguation. While Knowledge Bases have good coverage of prominent entities, they are often limited with respect to relations. The goal of this thesis is to bridge this gap and automatically create lexicons of textual representations of relations, namely relational phrases. The lexicons should contain information about paraphrases, hierarchy, as well as semantic types of arguments of relational phrases. The thesis makes three main contributions. The first contribution addresses disambiguating relational phrases by aligning them with the WordNet dictionary. Moreover, the alignment allows imposing the WordNet hierarchy on the relational phrases. The second contribution proposes a method for graph construction of relations using Probabilistic Graphical Models. In addition, we apply this model to relation paraphrasing. The third contribution presents a method for constructing a lexicon of relational paraphrases with fine-grained semantic typing of arguments. This method is based on information from a multilingual parallel corpus. Wissensbanken sind Schlüsselkomponenten für sprachverarbeitende Systeme. Prominente Vertreter wie zum Beispiel DBpedia, Yago und Wikidata enthalten und organisieren Wissen über benannte Entitäten und deren Relationen zueinander. Das so strukturierte Wissen spielt oft eine zentrale Rolle für Aufgaben wie automatische Fragebeantwortung (engl. Question Answering) oder Disambiguierung von Entitäten. Wissensbanken haben eine gute Abdeckung an Entitäten, sind aber hinsichtlich Relationen oft limitiert. Das Ziel dieser Dissertation ist es diese Lücke zu schließen und automatisch Lexika zu erstellen, die textuelle Repräsentationen von Relationen, so genannte relationale Phrasen, zur Verfügung stellen. Die Lexika sollten neben Informationen zu Paraphrasen und der Hierarchie relationaler Phrasen auch semantische Typisierung der Argumente einer Relation umfassen. Diese Dissertation leistet dafür drei wesentliche Beiträge. Der erste Beitrag behandelt die Disambiguierung relationaler Phrasen durch Verknüpfung mit Einträgen des WordNet Lexikons. Diese Verknüpfung ermöglicht es die WordNet Hierarchie auf relationale Phrasen zu übertragen. Im zweiten Beitrag wird eine Methode zur Konstruktion eines Graphen aus Relationen mittels probabilistischer graphischer Modelle vorgeschlagen. Das erzeugte Modell wird darüber hinaus zur Paraphrasierung von Relationen angewandt. Der dritte Beitrag ist eine Methode zur Lexikonkonstruktion relationaler Paraphrasen mit feingranularer semantischer Typisierung der Argumente von Relationen. Diese Methode basiert auf Informationen aus multilingualen parallelen Korpora. |
Link to this record: | urn:nbn:de:bsz:291-scidok-69101 hdl:20.500.11880/26789 http://dx.doi.org/10.22028/D291-26776 |
Advisor: | Weikum, Gerhard |
Date of oral examination: | 28-Jun-2017 |
Date of registration: | 10-Jul-2017 |
Faculty: | MI - Fakultät für Mathematik und Informatik |
Department: | MI - Informatik |
Collections: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Files for this record:
File | Description | Size | Format | |
---|---|---|---|---|
adam_grycner.pdf | 2,25 MB | Adobe PDF | View/Open |
Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.