Please use this identifier to cite or link to this item:
doi:10.22028/D291-25368
Title: | Morphic - Plus : ein morphologisches Analyseprogramm für die deutsche Flexionsmorphologieund Komposita-Analyse |
Author(s): | Lutzy, Ottmar |
Language: | German |
Year of Publication: | 1995 |
SWD key words: | Künstliche Intelligenz |
Free key words: | artificial intelligence |
DDC notations: | 004 Computer science, internet |
Publikation type: | Report |
Abstract: | Die morphologische Analyse nimmt bei der Verarbeitung geschriebener natürlicher Sprache eine überaus wichtige Position ein. Neben der Grundform- und Wortartbestimmung mit Hilfe einer morphologischen Analyse wird vor allem die Ermittlung von Flexionsinformationen verstanden. Die Wichtigkeit dieses Teilprozesses für die Textanalyse ist von der zu bearbeitetenden Sprache abhängig. Die deutsche Sprache gehört zu einer Sprachklasse mit freier Wortstellung, d. h. die grammatikalische Information für ein Wort wird fast ausschließlich durch die Analyse der Flexionsform des Wortes und nicht durch dessen Stellung im Satz gewonnen. Mit Morphic-Plus steht ein Lemmatisierungsmodul zur Verfügung, mit dessen Hilfe flektierte Wortformen auf deren kanonische Wortstämme zurückgeführt werden kann. In der deutschen Sprache sind häufig zusammengesetzte Wörter, sogenannte Komposita, zu finden. Insbesondere in der wissenschaftlichen Literatur ist die Bildung neuer Worte aus bekannten Teilworten gängig. Morphic-Plus bietet daher neben einer Flexionsmorphologie auch eine Kompositaanalyse für zusammengesetzte Wörter. Bei der Analyse der Komposita durch Morphic-Plus wird die Wortbildung dahingehend eingeschränkt, daß ein Kompositum nur aus Nomen, Verben und Adjektiven gebildet werden kann. In dieser Arbeit wird sowohl auf die Organisation des zugrundeliegenden Lexikons und dessen Aufbau als auch auf die Algorithmen von Morphic-Plus und deren Implementierung eingegangen. Das Lexikon und die darin verschlüsselten Information ist für die Analyse von zentraler Bedeutung. Im Lexikon, Morphic-Lex genannt, ist das Wissen über die Sprache kodiert. |
Link to this record: | urn:nbn:de:bsz:291-scidok-55793 hdl:20.500.11880/25424 http://dx.doi.org/10.22028/D291-25368 |
Series name: | Document / Deutsches Forschungszentrum für Künstliche Intelligenz : D [ISSN 0946-0098] |
Series volume: | 95-07 |
Date of registration: | 5-Dec-2013 |
Faculty: | SE - Sonstige Einrichtungen |
Department: | SE - DFKI Deutsches Forschungszentrum für Künstliche Intelligenz |
Collections: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Files for this record:
File | Description | Size | Format | |
---|---|---|---|---|
D_95_07.pdf | 30,49 MB | Adobe PDF | View/Open |
Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.