Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-42289
Volltext verfügbar? / Dokumentlieferung
Titel: Expert-adapted language models improve the fit to reading times
VerfasserIn: Škrjanec, Iza
Broy, Frederik Yannick
Demberg, Vera
Sprache: Englisch
Titel: Procedia Computer Science
Bandnummer: 225
Seiten: 3488-3497
Verlag/Plattform: Elsevier
Erscheinungsjahr: 2023
Erscheinungsort: Amsterdam
Konferenzort: Athens, Greece
Freie Schlagwörter: Eye tracking
Background knowledge
Surprisal
DDC-Sachgruppe: 004 Informatik
400 Sprache, Linguistik
Dokumenttyp: Konferenzbeitrag (in einem Konferenzband / InProceedings erschienener Beitrag)
Abstract: The concept of surprisal refers to the predictability of a word based on its context. Surprisal is known to be predictive of human processing difficulty and is usually estimated by language models. However, because humans differ in their linguistic experience, they also differ in the actual processing difficulty they experience with a given word or sentence. We investigate whether models that are similar to the linguistic experience and background knowledge of a specific group of humans are better at predicting their reading times than a generic language model. We analyze reading times from the PoTeC corpus [15,27] of eye movements from biology and physics experts reading biology and physics texts. We find experts read in-domain texts faster than novices, especially domain-specific terms. Next, we train language models adapted to the biology and physics domains and show that surprisal obtained from these specialized models improves the fit to expert reading times above and beyond a generic language model.
DOI der Erstveröffentlichung: 10.1016/j.procs.2023.10.344
URL der Erstveröffentlichung: https://www.sciencedirect.com/science/article/pii/S1877050923015028
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-422898
hdl:20.500.11880/37960
http://dx.doi.org/10.22028/D291-42289
ISSN: 1877-0509
Datum des Eintrags: 27-Jun-2024
Bemerkung/Hinweis: Procedia Computer Science, Volume 225, 2023, Pages 3488-3497
Fakultät: MI - Fakultät für Mathematik und Informatik
Fachrichtung: MI - Informatik
Professur: MI - Prof. Dr. Vera Demberg
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Es gibt keine Dateien zu dieser Ressource.


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.