Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen:
doi:10.22028/D291-38086
Titel: | Generating linguistically relevant metadata for the Royal Society Corpus |
VerfasserIn: | Menzel, Katrin Knappen, Jörg Teich, Elke |
Sprache: | Englisch |
Titel: | Research in Corpus Linguistics |
Bandnummer: | 9 |
Heft: | 1 |
Seiten: | 1-18 |
Verlag/Plattform: | Asociación Española de Lingüística de Corpus |
Erscheinungsjahr: | 2021 |
Freie Schlagwörter: | corpus building and extension specialized diachronic corpora written scientific English discourse Royal Society Corpus register-based metadata |
DDC-Sachgruppe: | 400 Sprache, Linguistik |
Dokumenttyp: | Journalartikel / Zeitschriftenartikel |
Abstract: | This paper provides an overview on metadata generation and management for the Royal Society Corpus (RSC), aiming to encourage discussion about the specific challenges in building substantial diachronic corpora intended to be used for linguistic and humanistic analysis. We discuss the motivations and goals of building the corpus, describe its composition and present the types of metadata it contains. Specifically, we tackle two challenges: first, integration of original metadata from the data providers (JSTOR and the Royal Society); second, derivation of additional linguistically relevant metadata regarding text structure and situational context (register). |
DOI der Erstveröffentlichung: | 10.32714/ricl.09.01.02 |
Link zu diesem Datensatz: | urn:nbn:de:bsz:291--ds-380860 hdl:20.500.11880/34433 http://dx.doi.org/10.22028/D291-38086 |
ISSN: | 2243-4712 |
Datum des Eintrags: | 22-Nov-2022 |
Fakultät: | P - Philosophische Fakultät |
Fachrichtung: | P - Sprachwissenschaft und Sprachtechnologie |
Professur: | P - Prof. Dr. Elke Teich |
Sammlung: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Dateien zu diesem Datensatz:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
158-Article Text-969-2-10-20211002.pdf | 389,55 kB | Adobe PDF | Öffnen/Anzeigen |
Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons