Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen:
Volltext verfügbar? / Dokumentlieferung
doi:10.22028/D291-30973
Titel: | POS tag perplexity as a measure of syntactic complexity |
VerfasserIn: | von Prince, Kilu Demberg, Vera |
HerausgeberIn: | Berdicevskis, Aleksandrs Bentz, Christian |
Sprache: | Englisch |
Titel: | Proceedings of the First Shared Task on Measuring Language Complexity |
Startseite: | 20 |
Endseite: | 25 |
Erscheinungsjahr: | 2018 |
Titel der Konferenz: | EvoLang 2018 |
Konferenzort: | Toruń, Poland |
Dokumenttyp: | Konferenzbeitrag (in einem Konferenzband / InProceedings erschienener Beitrag) |
Abstract: | Comparing languages of the world with respect to their complexity is a long-standing open question in linguistics. We here focus on syntactic complexity, aconcept that has been particularly hard to address due to the lack of readily avail-able syntactically annotated corpora and the intricacies of syntactic theories. Wepropose to use a simple information-theoretic measure, perplexity, on the POS tagsequence of texts. Perplexity captures how predictable POS tags are on averagegiven their recent co-texts. Calculating perplexity based on POS tag sequenceshelps us to abstract away from morphological or lexical features of the language,in order to get at the predictability of word order. In this paper, we compare POStag perplexity to other recently proposed measures of syntactic complexity, andevaluate measures by correlating them with expert-proposed scores of syntacticflexibility (Bakker 1998). |
URL der Erstveröffentlichung: | http://www.christianbentz.de/MLC2018/Prince_Demberg.pdf |
Link zu diesem Datensatz: | hdl:20.500.11880/29760 http://dx.doi.org/10.22028/D291-30973 |
ISBN: | 978-91-639-7435-9 |
Datum des Eintrags: | 28-Sep-2020 |
Bemerkung/Hinweis: | Beitrag des Workshops "Measuring Language Complexity (MLC)" |
Fakultät: | MI - Fakultät für Mathematik und Informatik |
Fachrichtung: | MI - Informatik |
Professur: | MI - Prof. Dr. Vera Demberg |
Sammlung: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Dateien zu diesem Datensatz:
Es gibt keine Dateien zu dieser Ressource.
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.