Please use this identifier to cite or link to this item:
doi:10.22028/D291-41867
Title: | Characteristics and commonalities : differentially describing datasets with insightful patterns |
Author(s): | Dalleiger, Sebastian |
Language: | English |
Year of Publication: | 2023 |
DDC notations: | 000 Generalities 004 Computer science, internet |
Publikation type: | Dissertation |
Abstract: | Empirical science revolves around gaining insights from complex data. With the advent of computational science, increasingly more, larger, and richer datasets are becoming available to expand our scientific knowledge. However, the analysis of these datasets by domain experts is often impaired by a lack of suitable computational tools. In particular, there is a shortage of methods identifying insightful patterns, i.e., sets of strongly associated feature values that are informative, contrasting, probabilistically sound, statistically sound, and discoverable using scalable algorithms. This thesis leverages ideas and concepts from pattern-set mining, maximum-entropy modeling, statistical testing, and matrix factorization to develop methods for discovering insightful patterns. Kern der empirischen Wissenschaft ist die Gewinnung von Erkenntnissen aus komplexen Daten. Durch den Aufstieg der computationellen Wissenschaft werden zunehmend zahlreichere, umfangreichere und reichhaltigere Datensätze verfügbar, mit deren Hilfe wir unser Wissen erweitern können. Gleichzeitig erschwert ein Mangel an geeigneten computationellen Werkzeugen die Analyse dieser Datensätze durch Domänenexperten. Insbesondere fehlt es an Methoden zur Identifizierung von aufschlussreichen Mustern (insightful patterns), d.h., Mengen von stark assoziierten Merkmalsausprägungen (feature values), die informativ, kontrastierend, probabilistisch fundiert, statistisch fundiert und durch skalierbare Algorithmen auffindbar sind. Diese Dissertation nutzt Ideen und Konzepte aus Pattern-Set Mining, Maximum-Entropy Modeling, statistischen Testverfahren und Matrixfaktorisierung, um Methoden zu entwickeln, die aufschlussreiche Muster identifizieren. |
Link to this record: | urn:nbn:de:bsz:291--ds-418674 hdl:20.500.11880/37476 http://dx.doi.org/10.22028/D291-41867 |
Advisor: | Vreeken, Jilles |
Date of oral examination: | 16-Nov-2023 |
Date of registration: | 12-Apr-2024 |
Faculty: | MI - Fakultät für Mathematik und Informatik |
Department: | MI - Informatik |
Professorship: | MI - Keiner Professur zugeordnet |
Collections: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Files for this record:
File | Description | Size | Format | |
---|---|---|---|---|
dissertation.pdf | 4,63 MB | Adobe PDF | View/Open |
Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.