Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-30973
Volltext verfügbar? / Dokumentlieferung
Titel: POS tag perplexity as a measure of syntactic complexity
VerfasserIn: von Prince, Kilu
Demberg, Vera
HerausgeberIn: Berdicevskis, Aleksandrs
Bentz, Christian
Sprache: Englisch
Titel: Proceedings of the First Shared Task on Measuring Language Complexity
Startseite: 20
Endseite: 25
Erscheinungsjahr: 2018
Titel der Konferenz: EvoLang 2018
Konferenzort: Toruń, Poland
Dokumenttyp: Konferenzbeitrag (in einem Konferenzband / InProceedings erschienener Beitrag)
Abstract: Comparing languages of the world with respect to their complexity is a long-standing open question in linguistics. We here focus on syntactic complexity, aconcept that has been particularly hard to address due to the lack of readily avail-able syntactically annotated corpora and the intricacies of syntactic theories. Wepropose to use a simple information-theoretic measure, perplexity, on the POS tagsequence of texts. Perplexity captures how predictable POS tags are on averagegiven their recent co-texts. Calculating perplexity based on POS tag sequenceshelps us to abstract away from morphological or lexical features of the language,in order to get at the predictability of word order. In this paper, we compare POStag perplexity to other recently proposed measures of syntactic complexity, andevaluate measures by correlating them with expert-proposed scores of syntacticflexibility (Bakker 1998).
URL der Erstveröffentlichung: http://www.christianbentz.de/MLC2018/Prince_Demberg.pdf
Link zu diesem Datensatz: hdl:20.500.11880/29760
http://dx.doi.org/10.22028/D291-30973
ISBN: 978-91-639-7435-9
Datum des Eintrags: 28-Sep-2020
Bemerkung/Hinweis: Beitrag des Workshops "Measuring Language Complexity (MLC)"
Fakultät: MI - Fakultät für Mathematik und Informatik
Fachrichtung: MI - Informatik
Professur: MI - Prof. Dr. Vera Demberg
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Es gibt keine Dateien zu dieser Ressource.


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.