Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-41867
Titel: Characteristics and commonalities : differentially describing datasets with insightful patterns
VerfasserIn: Dalleiger, Sebastian
Sprache: Englisch
Erscheinungsjahr: 2023
DDC-Sachgruppe: 000 Allgemeines, Wissenschaft
004 Informatik
Dokumenttyp: Dissertation
Abstract: Empirical science revolves around gaining insights from complex data. With the advent of computational science, increasingly more, larger, and richer datasets are becoming available to expand our scientific knowledge. However, the analysis of these datasets by domain experts is often impaired by a lack of suitable computational tools. In particular, there is a shortage of methods identifying insightful patterns, i.e., sets of strongly associated feature values that are informative, contrasting, probabilistically sound, statistically sound, and discoverable using scalable algorithms. This thesis leverages ideas and concepts from pattern-set mining, maximum-entropy modeling, statistical testing, and matrix factorization to develop methods for discovering insightful patterns.
Kern der empirischen Wissenschaft ist die Gewinnung von Erkenntnissen aus komplexen Daten. Durch den Aufstieg der computationellen Wissenschaft werden zunehmend zahlreichere, umfangreichere und reichhaltigere Datensätze verfügbar, mit deren Hilfe wir unser Wissen erweitern können. Gleichzeitig erschwert ein Mangel an geeigneten computationellen Werkzeugen die Analyse dieser Datensätze durch Domänenexperten. Insbesondere fehlt es an Methoden zur Identifizierung von aufschlussreichen Mustern (insightful patterns), d.h., Mengen von stark assoziierten Merkmalsausprägungen (feature values), die informativ, kontrastierend, probabilistisch fundiert, statistisch fundiert und durch skalierbare Algorithmen auffindbar sind. Diese Dissertation nutzt Ideen und Konzepte aus Pattern-Set Mining, Maximum-Entropy Modeling, statistischen Testverfahren und Matrixfaktorisierung, um Methoden zu entwickeln, die aufschlussreiche Muster identifizieren.
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-418674
hdl:20.500.11880/37476
http://dx.doi.org/10.22028/D291-41867
Erstgutachter: Vreeken, Jilles
Tag der mündlichen Prüfung: 16-Nov-2023
Datum des Eintrags: 12-Apr-2024
Fakultät: MI - Fakultät für Mathematik und Informatik
Fachrichtung: MI - Informatik
Professur: MI - Keiner Professur zugeordnet
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
dissertation.pdf4,63 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.