Please use this identifier to cite or link to this item: doi:10.22028/D291-41867
Title: Characteristics and commonalities : differentially describing datasets with insightful patterns
Author(s): Dalleiger, Sebastian
Language: English
Year of Publication: 2023
DDC notations: 000 Generalities
004 Computer science, internet
Publikation type: Dissertation
Abstract: Empirical science revolves around gaining insights from complex data. With the advent of computational science, increasingly more, larger, and richer datasets are becoming available to expand our scientific knowledge. However, the analysis of these datasets by domain experts is often impaired by a lack of suitable computational tools. In particular, there is a shortage of methods identifying insightful patterns, i.e., sets of strongly associated feature values that are informative, contrasting, probabilistically sound, statistically sound, and discoverable using scalable algorithms. This thesis leverages ideas and concepts from pattern-set mining, maximum-entropy modeling, statistical testing, and matrix factorization to develop methods for discovering insightful patterns.
Kern der empirischen Wissenschaft ist die Gewinnung von Erkenntnissen aus komplexen Daten. Durch den Aufstieg der computationellen Wissenschaft werden zunehmend zahlreichere, umfangreichere und reichhaltigere Datensätze verfügbar, mit deren Hilfe wir unser Wissen erweitern können. Gleichzeitig erschwert ein Mangel an geeigneten computationellen Werkzeugen die Analyse dieser Datensätze durch Domänenexperten. Insbesondere fehlt es an Methoden zur Identifizierung von aufschlussreichen Mustern (insightful patterns), d.h., Mengen von stark assoziierten Merkmalsausprägungen (feature values), die informativ, kontrastierend, probabilistisch fundiert, statistisch fundiert und durch skalierbare Algorithmen auffindbar sind. Diese Dissertation nutzt Ideen und Konzepte aus Pattern-Set Mining, Maximum-Entropy Modeling, statistischen Testverfahren und Matrixfaktorisierung, um Methoden zu entwickeln, die aufschlussreiche Muster identifizieren.
Link to this record: urn:nbn:de:bsz:291--ds-418674
hdl:20.500.11880/37476
http://dx.doi.org/10.22028/D291-41867
Advisor: Vreeken, Jilles
Date of oral examination: 16-Nov-2023
Date of registration: 12-Apr-2024
Faculty: MI - Fakultät für Mathematik und Informatik
Department: MI - Informatik
Professorship: MI - Keiner Professur zugeordnet
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
dissertation.pdf4,63 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.