Zweistufige kontextsensitive Sprecherklassifikation am Beispiel von Alter und Geschlecht

Müller, Christian

Please use this identifier to cite or link to this item: doi:10.22028/D291-25884

Title:	Zweistufige kontextsensitive Sprecherklassifikation am Beispiel von Alter und Geschlecht
Author(s):	Müller, Christian
Language:	German
Year of Publication:	2005
SWD key words:	Automatische Sprechererkennung Dialogsystem Lebensalter Geschlecht
Free key words:	kontextsensitive Sprecherklassifikation speaker classification dialog system age gender
DDC notations:	004 Computer science, internet
Publikation type:	Dissertation
Abstract:	In der vorliegenden Dissertation wird ein zweistufiger Ansatz zur Sprecherklassifikation am Beispiel Alter und Geschlecht vorgestellt. Dazu werden zunächst die Ergebnisse umfangreicher Korpusanalysen präsentiert, die als Referenzbasis humanwissenschaftlicher Studien geeignet sind. Es wird gezeigt, dass die Modelle, die mithilfe dieser Daten trainiert wurden, in der Lage sind, die genannten Sprechereigenschaften mit einer Genauigkeit zu erkennen, die teilweise das Fünffache des jeweiligen Zufallsniveaus beträgt. Darüber hinaus zeichnet sich der vorgestellte Ansatz vor allen Dingen durch die so genannte Zweite Ebene aus, auf der mithilfe von Dynamischen Bayesschen Netzen eine Fusion multipler Klassifikationsergebnisse unter Berücksichtigung des auditiven Kontextes erfolgt. In der Arbeit wird außerdem ein konkretes Sprecherklassifikationssystem beschrieben, welches für das Anwendungsszenario von mobilen, sprachbasierten Dialogsystemen entwickelt worden ist. This dissertation describes a two-layered speaker classification approach on the example of age and gender. First of all, the results of comprehensive corpus analyses are presented that are suitable to serve as a reference basis for further studies in human sciences. It is showed, that the models which are trained using these data are able to recognize the above mentioned characteristics with an accuracy that is up to five times better than the respective chance level. In addition, the presented approach distinguishes itself by the so called Second Layer, on which a context sensitive fusion of multiple classification results is accomplished using Dynamic Bayesian Networks. The dissertation also describes a concrete speaker classification system which was developed for the application scenario of mobile spoken dialog systems.
Link to this record:	urn:nbn:de:bsz:291-scidok-12685 hdl:20.500.11880/25940 http://dx.doi.org/10.22028/D291-25884
Advisor:	Wahlster, Wolfgang
Date of oral examination:	13-Jan-2006
Date of registration:	30-Aug-2007
Faculty:	MI - Fakultät für Mathematik und Informatik
Department:	MI - Informatik
Collections:	SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:

File	Description	Size	Format
Dissertation_3540_Muell_Chri_2005.pdf		7,94 MB	Adobe PDF	View/Open

Export: BibTex