Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-37904
Titel: Modeling intra-textual variation with entropy and surprisal: topical vs. stylistic patterns
VerfasserIn: Degaetano-Ortlieb, Stefania
Teich, Elke
Sprache: Englisch
Titel: Proceedings of the Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature
Verlag/Plattform: Association for Computational Linguistics
Erscheinungsjahr: 2017
Erscheinungsort: Stroudsburg, PA
Konferenzort: Vancouver, Canada
DDC-Sachgruppe: 400 Sprache, Linguistik
Dokumenttyp: Konferenzbeitrag (in einem Konferenzband / InProceedings erschienener Beitrag)
Abstract: We present a data-driven approach to investigate intra-textual variation by combining entropy and surprisal. With this approach we detect linguistic variation based on phrasal lexico-grammatical patterns across sections of research articles. Entropy is used to detect patterns typical of specific sections. Surprisal is used to differentiate between more and less informationally-loaded patterns as well as type of information (topical vs. stylistic). While we here focus on research articles in biology/genetics, the methodology is especially interesting for digital humanities scholars, as it can be applied to any text type or domain and combined with additional variables (e.g. time, author or social group).
DOI der Erstveröffentlichung: 10.18653/v1/W17-22
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-379049
hdl:20.500.11880/34402
http://dx.doi.org/10.22028/D291-37904
ISBN: 978-1-945626-58-6
Datum des Eintrags: 18-Nov-2022
Drittmittel / Förderung: This work is funded by Deutsche Forschungsgemeinschaft (DFG) under grants SFB 1102: Information Density and Linguistic Encoding (www.sfb1102.uni-saarland.de) and EXC 284: Multimodal Computing and Interaction (www.mmci.uni-saarland.de).
Fakultät: P - Philosophische Fakultät
Fachrichtung: P - Sprachwissenschaft und Sprachtechnologie
Professur: P - Prof. Dr. Elke Teich
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
W17-2209.pdf573,61 kBAdobe PDFÖffnen/Anzeigen


Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons Creative Commons