Please use this identifier to cite or link to this item: doi:10.22028/D291-25368
Title: Morphic - Plus : ein morphologisches Analyseprogramm für die deutsche Flexionsmorphologieund Komposita-Analyse
Author(s): Lutzy, Ottmar
Language: German
Year of Publication: 1995
SWD key words: Künstliche Intelligenz
Free key words: artificial intelligence
DDC notations: 004 Computer science, internet
Publikation type: Report
Abstract: Die morphologische Analyse nimmt bei der Verarbeitung geschriebener natürlicher Sprache eine überaus wichtige Position ein. Neben der Grundform- und Wortartbestimmung mit Hilfe einer morphologischen Analyse wird vor allem die Ermittlung von Flexionsinformationen verstanden. Die Wichtigkeit dieses Teilprozesses für die Textanalyse ist von der zu bearbeitetenden Sprache abhängig. Die deutsche Sprache gehört zu einer Sprachklasse mit freier Wortstellung, d. h. die grammatikalische Information für ein Wort wird fast ausschließlich durch die Analyse der Flexionsform des Wortes und nicht durch dessen Stellung im Satz gewonnen. Mit Morphic-Plus steht ein Lemmatisierungsmodul zur Verfügung, mit dessen Hilfe flektierte Wortformen auf deren kanonische Wortstämme zurückgeführt werden kann. In der deutschen Sprache sind häufig zusammengesetzte Wörter, sogenannte Komposita, zu finden. Insbesondere in der wissenschaftlichen Literatur ist die Bildung neuer Worte aus bekannten Teilworten gängig. Morphic-Plus bietet daher neben einer Flexionsmorphologie auch eine Kompositaanalyse für zusammengesetzte Wörter. Bei der Analyse der Komposita durch Morphic-Plus wird die Wortbildung dahingehend eingeschränkt, daß ein Kompositum nur aus Nomen, Verben und Adjektiven gebildet werden kann. In dieser Arbeit wird sowohl auf die Organisation des zugrundeliegenden Lexikons und dessen Aufbau als auch auf die Algorithmen von Morphic-Plus und deren Implementierung eingegangen. Das Lexikon und die darin verschlüsselten Information ist für die Analyse von zentraler Bedeutung. Im Lexikon, Morphic-Lex genannt, ist das Wissen über die Sprache kodiert.
Link to this record: urn:nbn:de:bsz:291-scidok-55793
hdl:20.500.11880/25424
http://dx.doi.org/10.22028/D291-25368
Series name: Document / Deutsches Forschungszentrum für Künstliche Intelligenz : D [ISSN 0946-0098]
Series volume: 95-07
Date of registration: 5-Dec-2013
Faculty: SE - Sonstige Einrichtungen
Department: SE - DFKI Deutsches Forschungszentrum für Künstliche Intelligenz
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
D_95_07.pdf30,49 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.