Efficient querying and learning in probabilistic and temporal databases

Dylla, Maximilian

Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-26567

Titel:	Efficient querying and learning in probabilistic and temporal databases
Alternativtitel:	Effizientes Anfragen und Lernen in probabilistischen und temporalen Datenbanken
VerfasserIn:	Dylla, Maximilian
Sprache:	Englisch
Erscheinungsjahr:	2014
Kontrollierte Schlagwörter:	Datenbank Zeitliches Datenbanksystem Datalog Konsistenz <Informatik> Wahrscheinlichkeit Überwachtes Lernen
Freie Schlagwörter:	Probabilistische Datenbank temporal database probabilistic database consistency constraints learning querying
DDC-Sachgruppe:	004 Informatik
Dokumenttyp:	Dissertation
Abstract:	Probabilistic databases store, query, and manage large amounts of uncertain information. This thesis advances the state-of-the-art in probabilistic databases in three different ways: 1. We present a closed and complete data model for temporal probabilistic databases and analyze its complexity. Queries are posed via temporal deduction rules which induce lineage formulas capturing both time and uncertainty. 2. We devise a methodology for computing the top-k most probable query answers. It is based on first-order lineage formulas representing sets of answer candidates. Theoretically derived probability bounds on these formulas enable pruning low-probability answers. 3. We introduce the problem of learning tuple probabilities which allows updating and cleaning of probabilistic databases. We study its complexity, characterize its solutions, cast it into an optimization problem, and devise an approximation algorithm based on stochastic gradient descent. All of the above contributions support consistency constraints and are evaluated experimentally. Probabilistische Datenbanken können große Mengen an ungewissen Informationen speichern, anfragen und verwalten. Diese Doktorarbeit treibt den Stand der Technik in diesem Gebiet auf drei Arten vorran: 1. Ein abgeschlossenes und vollständiges Datenmodell für temporale, probabilistische Datenbanken wird präsentiert. Anfragen werden mittels Deduktionsregeln gestellt, welche logische Formeln induzieren, die sowohl Zeit als auch Ungewissheit erfassen. 2. Ein Methode zur Berechnung der k Anworten höchster Wahrscheinlichkeit wird entwickelt. Sie basiert auf logischen Formeln erster Stufe, die Mengen an Antwortkandidaten repräsentieren. Beschränkungen der Wahrscheinlichkeit dieser Formeln ermöglichen das Kürzen von Antworten mit niedriger Wahrscheinlichkeit. 3. Das Problem des Lernens von Tupelwahrscheinlichkeiten für das Aktualisieren und Bereiningen von probabilistischen Datenbanken wird eingeführt, auf Komplexität und Lösungen untersucht, als Optimierungsproblem dargestellt und von einem stochastischem Gradientenverfahren approximiert. All diese Beiträge unterstützen Konsistenzbedingungen und wurden experimentell analysiert.
Link zu diesem Datensatz:	urn:nbn:de:bsz:291-scidok-58146 hdl:20.500.11880/26623 http://dx.doi.org/10.22028/D291-26567
Erstgutachter:	Weikum, Gerhard
Tag der mündlichen Prüfung:	9-Mai-2014
Datum des Eintrags:	20-Jun-2014
Fakultät:	MI - Fakultät für Mathematik und Informatik
Fachrichtung:	MI - Informatik
Sammlung:	SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:

Datei	Beschreibung	Größe	Format
phd_thesis_maximilian_dylla.pdf		3,11 MB	Adobe PDF	Öffnen/Anzeigen

Export: BibTex Statistik anzeigen

Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.