Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen:
doi:10.22028/D291-37904
Titel: | Modeling intra-textual variation with entropy and surprisal: topical vs. stylistic patterns |
VerfasserIn: | Degaetano-Ortlieb, Stefania Teich, Elke |
Sprache: | Englisch |
Titel: | Proceedings of the Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature |
Verlag/Plattform: | Association for Computational Linguistics |
Erscheinungsjahr: | 2017 |
Erscheinungsort: | Stroudsburg, PA |
Konferenzort: | Vancouver, Canada |
DDC-Sachgruppe: | 400 Sprache, Linguistik |
Dokumenttyp: | Konferenzbeitrag (in einem Konferenzband / InProceedings erschienener Beitrag) |
Abstract: | We present a data-driven approach to investigate intra-textual variation by combining entropy and surprisal. With this approach we detect linguistic variation based on phrasal lexico-grammatical patterns across sections of research articles. Entropy is used to detect patterns typical of specific sections. Surprisal is used to differentiate between more and less informationally-loaded patterns as well as type of information (topical vs. stylistic). While we here focus on research articles in biology/genetics, the methodology is especially interesting for digital humanities scholars, as it can be applied to any text type or domain and combined with additional variables (e.g. time, author or social group). |
DOI der Erstveröffentlichung: | 10.18653/v1/W17-22 |
Link zu diesem Datensatz: | urn:nbn:de:bsz:291--ds-379049 hdl:20.500.11880/34402 http://dx.doi.org/10.22028/D291-37904 |
ISBN: | 978-1-945626-58-6 |
Datum des Eintrags: | 18-Nov-2022 |
Drittmittel / Förderung: | This work is funded by Deutsche Forschungsgemeinschaft (DFG) under grants SFB 1102: Information Density and Linguistic Encoding (www.sfb1102.uni-saarland.de) and EXC 284: Multimodal Computing and Interaction (www.mmci.uni-saarland.de). |
Fakultät: | P - Philosophische Fakultät |
Fachrichtung: | P - Sprachwissenschaft und Sprachtechnologie |
Professur: | P - Prof. Dr. Elke Teich |
Sammlung: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Dateien zu diesem Datensatz:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
W17-2209.pdf | 573,61 kB | Adobe PDF | Öffnen/Anzeigen |
Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons