Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-38086
Titel: Generating linguistically relevant metadata for the Royal Society Corpus
VerfasserIn: Menzel, Katrin
Knappen, Jörg
Teich, Elke
Sprache: Englisch
Titel: Research in Corpus Linguistics
Bandnummer: 9
Heft: 1
Seiten: 1-18
Verlag/Plattform: Asociación Española de Lingüística de Corpus
Erscheinungsjahr: 2021
Freie Schlagwörter: corpus building and extension
specialized diachronic corpora
written scientific English discourse
Royal Society Corpus
register-based metadata
DDC-Sachgruppe: 400 Sprache, Linguistik
Dokumenttyp: Journalartikel / Zeitschriftenartikel
Abstract: This paper provides an overview on metadata generation and management for the Royal Society Corpus (RSC), aiming to encourage discussion about the specific challenges in building substantial diachronic corpora intended to be used for linguistic and humanistic analysis. We discuss the motivations and goals of building the corpus, describe its composition and present the types of metadata it contains. Specifically, we tackle two challenges: first, integration of original metadata from the data providers (JSTOR and the Royal Society); second, derivation of additional linguistically relevant metadata regarding text structure and situational context (register).
DOI der Erstveröffentlichung: 10.32714/ricl.09.01.02
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-380860
hdl:20.500.11880/34433
http://dx.doi.org/10.22028/D291-38086
ISSN: 2243-4712
Datum des Eintrags: 22-Nov-2022
Fakultät: P - Philosophische Fakultät
Fachrichtung: P - Sprachwissenschaft und Sprachtechnologie
Professur: P - Prof. Dr. Elke Teich
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
158-Article Text-969-2-10-20211002.pdf389,55 kBAdobe PDFÖffnen/Anzeigen


Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons Creative Commons