Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen:
Volltext verfügbar? / Dokumentlieferung
doi:10.22028/D291-31440
Titel: | Optimal encoding! – Information Theory constrains article omission in newspaper headlines |
VerfasserIn: | Lemke, Tyll Robin Horch, Eva Reich, Ingo |
HerausgeberIn: | Lapata, Mirella Blunsom, Phil Koller, Alexander |
Sprache: | Englisch |
Titel: | 15th Conference of the European Chapter of the Association for Computational Linguistics - proceedings of conference : April 3-7, 2017, Valencia, Spain : EACL 2017, Volume 2: Short Papers |
Startseite: | 131 |
Endseite: | 135 |
Verlag/Plattform: | ACL |
Erscheinungsjahr: | 2017 |
Titel der Konferenz: | EACL 2017 |
Konferenzort: | Valencia, Spain |
Dokumenttyp: | Konferenzbeitrag (in einem Konferenzband / InProceedings erschienener Beitrag) |
Abstract: | In this paper we pursue the hypothesis that the distribution of article omission specifically is constrained by principles of Information Theory (Shannon 1948). In particular, Information Theory predicts a stronger preference for article omission before nouns which are relatively unpredictable in context of the preceding words. We investigated article omission in German newspaper headlines with a corpus and acceptability rating study. Both support our hypothesis: Articles are inserted more often before unpredictable nouns and subjects perceive article omission before predictable nouns as more well-formed than before unpredictable ones. This suggests that information theoretic principles constrain the distribution of article omission in headlines. |
URL der Erstveröffentlichung: | https://aclanthology.org/E17-2021.pdf |
Link zu diesem Datensatz: | hdl:20.500.11880/29401 http://dx.doi.org/10.22028/D291-31440 |
ISBN: | 978-1-945626-35-7 |
Datum des Eintrags: | 8-Jul-2020 |
Fakultät: | P - Philosophische Fakultät |
Fachrichtung: | P - Germanistik |
Professur: | P - Prof. Dr. Ingo Reich |
Sammlung: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Dateien zu diesem Datensatz:
Es gibt keine Dateien zu dieser Ressource.
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.