Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-32058
Volltext verfügbar? / Dokumentlieferung
Titel: Shadowing Synthesized Speech — Segmental Analysis of Phonetic Convergence
VerfasserIn: Gessinger, Iona
Raveh, Eran
Le Maguer, Sébastien
Möbius, Bernd
Steiner, Ingmar
Sprache: Englisch
Titel: Situated interaction : 18th Annual Conference of the International Speech Communication Association
Startseite: 3797
Endseite: 3801
Verlag/Plattform: Curran Associates, Inc.
Erscheinungsjahr: 2018
Erscheinungsort: Red Hook, NY
Titel der Konferenz: Interspeech 2017
Konferenzort: Stockholm, Sweden
Dokumenttyp: Konferenzbeitrag (in einem Konferenzband / InProceedings erschienener Beitrag)
Abstract: To shed light on the question whether humans converge phonetically to synthesized speech, a shadowing experiment was conducted using three different types of stimuli — natural speaker, diphone synthesis, and HMM synthesis. Three segment-level phonetic features of German that are well-known to vary across native speakers were examined. The first feature triggered convergence in roughly one third of the cases for all stimulus types. The second feature showed generally a small amount of convergence, which may be due to the nature of the feature itself. Still the effect was strongest for the natural stimuli, followed by the HMM stimuli and weakest for the diphone stimuli. The effect of the third feature was clearly observable for the natural stimuli and less pronounced in the synthetic stimuli. This is presumably a result of the partly insufficient perceptibility of this target feature in the synthetic stimuli and demonstrates the necessity of gaining fine-grained control over the synthesis output, should it be intended to implement capabilities of phonetic convergence on the segmental level in spoken dialogue systems.
DOI der Erstveröffentlichung: 10.21437/Interspeech.2017-1433
URL der Erstveröffentlichung: https://www.isca-speech.org/archive/Interspeech_2017/abstracts/1433.html
Link zu diesem Datensatz: hdl:20.500.11880/29623
http://dx.doi.org/10.22028/D291-32058
ISBN: 978-1-5108-4876-4
Datum des Eintrags: 1-Sep-2020
Bemerkung/Hinweis: volume 6
Fakultät: P - Philosophische Fakultät
Fachrichtung: P - Sprachwissenschaft und Sprachtechnologie
Professur: P - Prof. Dr. Bernd Möbius
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Es gibt keine Dateien zu dieser Ressource.


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.