Lexicon access on parallel machines

Duda, Markus

Please use this identifier to cite or link to this item: doi:10.22028/D291-25099

Title:	Lexicon access on parallel machines
Author(s):	Duda, Markus
Language:	English
Year of Publication:	1994
OPUS Source:	Saarbrücken, 1994
SWD key words:	Künstliche Intelligenz
DDC notations:	004 Computer science, internet
Publikation type:	Report
Abstract:	To communicate with a computer in spoken language is an unattained challenge of Artificial Intelligence (AI) and Computational Linguistics. To solve such problems linguistic knowledge has to be combined with programming methods of AI and modern computer architectures. We will show how the complexity of linguistic processes can be handled by taking advantage of parallel architectures. In particular, speech systems where most lexicon queries are extremely underspecified suffer from the problem that the access to the lexicon module turns out to be a bottleneck. We introduce the search problem over a given lexicon and compute its time complexity for two different encodings. With the help of a space consuming encoding we define a total order over a lexicon, and, having a total order, logarithmic time becomes valid for the complexity of sequential lexicon search. Next, we will speed up the search by parallelisation, making use of the paracomputer. Last, we describe a practical approach to the parallelisation of a lexicon module with the aim to maximize the throughput. Lexikalische Einträge werden als gerichtete Graphen repräsentiert. Unter der Annahme, dass die für die Suche relevanten Teile dieser Graphen sich auf Bäume mit einer festen Maximaltiefe reduzieren lassen, wird ein Suchalgorithmus angegeben, der eine zu erwartende zeitliche Komplexität, linear zur Anzahl der lexikalischen Einträge, besitzt. Die Kodierung der lexikalischen Einträge als vollständige Bäume erlaubt die theoretisch mögliche Berechnung der Suche mit einer maximalen Anzahl von Prozessoren im Paracomputermodell in einem Schritt. Ein anderes Modell ergibt sich aus der Zerlegung des einen lexikalischen Eintrag repräsentierenden Baumes in die Menge seiner Pfade. Mit einer Numerierungsvorschrift für Pfade lässt sich nun eine totale Ordnung über alle Pfade aller lexikalischen Einträge definieren, was eine Suche in logarithmischer Zeit ermöglicht. Auf der Basis der Pfadzerlegung und -numerierung wird eine Pipeline-Architektur entworfen, die die Suche im Lexikon mit maximalem Durchsatz auf eine gegebene Anzahl von Prozessoren mit dem Ziel optimaler Lastverteilung realisiert.
Link to this record:	urn:nbn:de:bsz:291-scidok-40014 hdl:20.500.11880/25155 http://dx.doi.org/10.22028/D291-25099
Series name:	Vm-Report / Verbmobil, Verbundvorhaben, [Deutsches Forschungszentrum für Künstliche Intelligenz]
Series volume:	10
Date of registration:	22-Jul-2011
Faculty:	SE - Sonstige Einrichtungen
Department:	SE - DFKI Deutsches Forschungszentrum für Künstliche Intelligenz
Collections:	SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:

File	Description	Size	Format
report_10_94.pdf		206,09 kB	Adobe PDF	View/Open

Export: BibTex