Please use this identifier to cite or link to this item: doi:10.22028/D291-25438
Title: Polyrepräsentation, Relevanz-Approximation und aktives Lernen im Vektorraummodell des Information-Retrievals
Other Titles: Polyrepresentation, relevance-approximation and active learning in the linear space model of information retrieval
Author(s): Bachelier, Günter
Language: German
Year of Publication: 2001
SWD key words: Information Retrieval
Informationssystem
Neuronales Netz
Maschinelles Lernen
Approximation
Free key words: adaptives Information Retrieval System
Relevanz-Feedback
Relevanz-Approximation
aktives Lernen
Mehr-Ziel-Optimierung
Pareto-Menge
Information Retrieval
Machine Learning
Active Learning
Self-Organizing Maps
Clustering
DDC notations: 004 Computer science, internet
Publikation type: Doctoral Thesis
Abstract: Relevance-Feedback (RF) bezeichnet die Relevanzbewertung von Dokumenten eines Information Retrieval Systems (IRS) durch den Nutzer, sowie Adaptionsstrategien interner Repräsentationen des IRS. Relevanz-Approximationsmodelle (Rel-AM) sind RF-Verfahren, da die Dokumentvektoren und Relevanzwerte als Stützpunkte eines instanzbasierten bzw. als Lernstimuli eines prototypbasierten AMs verwendet werden. Mit einem Rel-AM kann für alle Punkte des Dokumentvektorraums eine Relevanzschätzung gebildet werden, die für Retrievalstrategien genutzt werden. Die passive Nutzung von Rel-AM verwendet das Relevanz-Maximierungskriterium, bei dem die Dokumentvektoren ausgewählt werden, von denen das IRS annimmt, dass die zugehörigen Dokumente die höchsten Relevanzwerte besitzen, was zu Modellverzerrungen führen kann, da Stimuli mit niedrigem Relevanzwert untergewichtet werden. Bei aktivem Lernen (AL) besitzt der Lernende Einfluss auf die Komponenten des Lernprozesses. Im IR soll AL zum Aufbau von guten Rel-AM mit wenigen Stimuli verwendet werden. Die aktive Nutzung von Rel-AM verwendet das Modell-Maximierungskriterium, bei dem Dokumentvektoren ausgewählt werden, von denen das IRS annimmt, dass sie zu der größten Modellverbesserung führen. Die Integration des AL im IR erfordert die Integration der beiden Kriterien durch konfliktlösende Strategien wie der Reformulierung als Mehr-Ziel-Optimierungsproblem. Polyrepräsentation (PR) ist die mehrfache und unterschiedliche Repräsentation von Informationsobjekten. Es wird gezeigt, was PR innerhalb des Vektorraummodells des IR bedeuten kann. Weiterhin benötigen nahezu alle Modelle zum AL eine AM-PR. Diese kann bei einer Monorepräsentation im IRS ad-hoc durch Stochastisierung der deterministischen Rel-AM erzeugt werden.
--
Link to this record: urn:nbn:de:bsz:291-scidok-665
hdl:20.500.11880/25494
http://dx.doi.org/10.22028/D291-25438
Advisor: Zimmermann, Harald H.
Date of oral examination: 31-Jan-2002
Date of registration: 21-Feb-2002
Faculty: ZZ - Ehemalige Einrichtungen
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
BachelierDiss.pdf12,99 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.