Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen:
doi:10.22028/D291-25309 | Titel: | A category based approach for recognition of out-of-vocabulary words |
| VerfasserIn: | Gallwitz, Florian Nöth, Elmar Niemann, Heinrich |
| Sprache: | Englisch |
| Erscheinungsjahr: | 1996 |
| Kontrollierte Schlagwörter: | Künstliche Intelligenz |
| Freie Schlagwörter: | artificial intelligence |
| DDC-Sachgruppe: | 004 Informatik |
| Dokumenttyp: | Forschungsbericht (Report zu Forschungsprojekten) |
| Abstract: | In almost all applications of automatic speech recognition, especially in spontaneous speech tasks, the recognizer vocabulary cannot cover all occurring words. There is always a significant amount of out-of-vocabulary words even when the vocabulary size is very large. In this paper we present a new approach for the integration of out-of-vocabulary words into statistical language models. We use category information for all words in the training corpus to define a function that gives an approximation of the out-of-vocabulary word emission probability for each word category. This information is integrated into the language models. Although we use a simple acoustic model for out-of-vocabulary words, we achieve a 6% reduction of word error rate on spontaneous speech data with about 5% out-of-vocabulary rate. |
| Link zu diesem Datensatz: | urn:nbn:de:bsz:291-scidok-53252 hdl:20.500.11880/25365 http://dx.doi.org/10.22028/D291-25309 |
| Schriftenreihe: | Vm-Report / Verbmobil, Verbundvorhaben, [Deutsches Forschungszentrum für Künstliche Intelligenz] |
| Band: | 132 |
| Datum des Eintrags: | 13-Jun-2013 |
| Fakultät: | SE - Sonstige Einrichtungen |
| Fachrichtung: | SE - DFKI Deutsches Forschungszentrum für Künstliche Intelligenz |
| Sammlung: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Dateien zu diesem Datensatz:
| Datei | Beschreibung | Größe | Format | |
|---|---|---|---|---|
| report_132_96.pdf | 188,59 kB | Adobe PDF | Öffnen/Anzeigen |
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.

