Please use this identifier to cite or link to this item:
doi:10.22028/D291-25882
Files for this record:
File | Description | Size | Format | |
---|---|---|---|---|
Dissertation_4103_Theo_Anja_2004.pdf | 13,55 MB | Adobe PDF | View/Open |
Title: | Die XXL—Suchmaschine zur ontologiebasierten Ähnlichkeitssuche in XML—Dokumenten |
Author(s): | Theobald, Anja |
Language: | German |
Year of Publication: | 2004 |
SWD key words: | World Wide Web Suchmaschine XML Information Retrieval Ähnlichkeitssuche Ontologie <Wissensverarbeitung> |
Free key words: | XXL-Suchmaschine information retrieval query language XXL search engine similarity search ontology |
DDC notations: | 004 Computer science, internet |
Publikation type: | Dissertation |
Abstract: | Die effektive und effiziente Informationssuche in großen Mengen semistrukturierter Daten im XML-Format stehen im Mittelpunkt dieser Arbeit. In dieser Arbeit wird die XXL-Suchmaschine vorgestellt. Sie wertet Anfragen aus, die in der XML-Anfragesprache XXL formuliert sind. Eine XXL-Anfrage umfasst dabei Suchbedingungen an die Struktur und an den Inhalt von XML-Dokumenten. Als Ergebnis wird eine nach ihrer Relevanz absteigend sortierte Liste von Treffern produziert, wobei ein Treffer ein relevantes XML-Dokument oder nur der relevante Teil eines XML-Dokuments sein kann. Die relevanzorientierte Auswertung von gegebenen Suchbedingungen beruht zum einen auf Verfahren aus dem Vektorraummodell und zum anderen wird semantisches Wissen einer quantifizierten Ontologie hinzugezogen. Zu diesem Zweck werden Datenbank-Technologien und Verfahren aus dem Information Retrieval kombiniert, um die Qualität der Suchergebnisse im Vergleich zur traditionellen Stichwortsuche in Textdokumenten zu verbessern. Die hier vorgestellten Konzepte wurden in einem Prototypen implementiert und umfangreich evaluiert. The effective and efficient information retrieval in large sets of semistructured data using the XML format is the main theme of this thesis. This thesis presents the XXL search engine, which executes queries formulated in the XML query language XXL. An XXL query consists of search conditions on the structure and search conditions on the content of XML documents. The result is a ranked result list in descending order of relevance, where a result can be a relevant XML document or only the relevant part of an XML document. The relevance-based query evaluation uses methods from the vector space model and semantic knowledge from a quantified ontology. For this purpose, we combine database technologies and methods from information retrieval to improve the quality of search results in comparison to traditional keyword-based text retrieval. The presented concepts have been implemented and exhaustively evaluated. |
Link to this record: | urn:nbn:de:bsz:291-scidok-12690 hdl:20.500.11880/25938 http://dx.doi.org/10.22028/D291-25882 |
Advisor: | Weikum, Gerhard |
Date of oral examination: | 16-Jul-2004 |
Date of registration: | 30-Aug-2007 |
Faculty: | MI - Fakultät für Mathematik und Informatik |
Department: | MI - Informatik |
Collections: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.