Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen:
doi:10.22028/D291-41867
Titel: | Characteristics and commonalities : differentially describing datasets with insightful patterns |
VerfasserIn: | Dalleiger, Sebastian |
Sprache: | Englisch |
Erscheinungsjahr: | 2023 |
DDC-Sachgruppe: | 000 Allgemeines, Wissenschaft 004 Informatik |
Dokumenttyp: | Dissertation |
Abstract: | Empirical science revolves around gaining insights from complex data. With the advent of computational science, increasingly more, larger, and richer datasets are becoming available to expand our scientific knowledge. However, the analysis of these datasets by domain experts is often impaired by a lack of suitable computational tools. In particular, there is a shortage of methods identifying insightful patterns, i.e., sets of strongly associated feature values that are informative, contrasting, probabilistically sound, statistically sound, and discoverable using scalable algorithms. This thesis leverages ideas and concepts from pattern-set mining, maximum-entropy modeling, statistical testing, and matrix factorization to develop methods for discovering insightful patterns. Kern der empirischen Wissenschaft ist die Gewinnung von Erkenntnissen aus komplexen Daten. Durch den Aufstieg der computationellen Wissenschaft werden zunehmend zahlreichere, umfangreichere und reichhaltigere Datensätze verfügbar, mit deren Hilfe wir unser Wissen erweitern können. Gleichzeitig erschwert ein Mangel an geeigneten computationellen Werkzeugen die Analyse dieser Datensätze durch Domänenexperten. Insbesondere fehlt es an Methoden zur Identifizierung von aufschlussreichen Mustern (insightful patterns), d.h., Mengen von stark assoziierten Merkmalsausprägungen (feature values), die informativ, kontrastierend, probabilistisch fundiert, statistisch fundiert und durch skalierbare Algorithmen auffindbar sind. Diese Dissertation nutzt Ideen und Konzepte aus Pattern-Set Mining, Maximum-Entropy Modeling, statistischen Testverfahren und Matrixfaktorisierung, um Methoden zu entwickeln, die aufschlussreiche Muster identifizieren. |
Link zu diesem Datensatz: | urn:nbn:de:bsz:291--ds-418674 hdl:20.500.11880/37476 http://dx.doi.org/10.22028/D291-41867 |
Erstgutachter: | Vreeken, Jilles |
Tag der mündlichen Prüfung: | 16-Nov-2023 |
Datum des Eintrags: | 12-Apr-2024 |
Fakultät: | MI - Fakultät für Mathematik und Informatik |
Fachrichtung: | MI - Informatik |
Professur: | MI - Keiner Professur zugeordnet |
Sammlung: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Dateien zu diesem Datensatz:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
dissertation.pdf | 4,63 MB | Adobe PDF | Öffnen/Anzeigen |
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.