Yannick Frommherz (Dresden)

01. Dezember 2023

Mensch-Sprachassistenten-Interaktionen zwischen Natürlichkeit und Fehleranfälligkeit

Sprachassistenten sind Systeme, die ihren Benutzer:innen bei Aufgaben (z.B. beim Erstellen eines Termins) in mündlicher Modalität assistieren. Wie bei teilautomatisierter Interaktion generell stellt sich die Frage, inwiefern Mechanismen und Praktiken der Mensch-Mensch-Kommunikation die Interaktion mit Sprachassistenten formen bzw. welche formatspezifischen, kommunikativen Handlungsweisen sich stattdessen herausbilden (Reeves & Nass, 1996). Ein gut erforschter Mechanismus der Mensch-Mensch-Kommunikation ist das psycholinguistische Phänomen Alignment, also die primär unbewusste, sprachliche Angleichung unter Gesprächspartner:innen innerhalb einer Interaktion (Pickering & Garrod, 2004). Alignment konnte ebenfalls für verschiedene teilautomatisierte Formate, u.a. für Mensch-Chatbot- sowie Mensch-Roboter-Interaktionen (Fischer, 2016) experimentell nachgewiesen werden. Diese Ergebnisse werden von wenigen korpusbasierten Studien (insbesondere Lotze, 2016 zu Mensch-Chatbot-Interaktionen) gestützt. Dabei kann eine korpuslinguistische Herangehensweise keine Alignmentprozesse im Gehirn nachweisen, sondern nur die Persistenz sprachlicher Strukturen (bei gegebener Möglichkeit, alternative, semantisch quasi-äquivalente Ausdrucksweisen zu wählen; Szmrecanyi, 2005). Für Interaktionen mit Sprachassistenten fehlen Korpusanalysen gänzlich, erscheinen aber unerlässlich, da ihnen authentischere Daten (als in ökologisch begrenzt validen Experimenten erhobene) zugrunde liegen. Diese Forschungslücke beabsichtige ich in meinem Dissertationsprojekt zu schließen, indem ich mehrere Korpora mit Mensch-Alexa-Interaktionen auf Persistenzen untersuche.

In meinem Vortrag präsentiere ich erste Ergebnisse aus meinem Projekt. Dabei gehe ich insbesondere der Frage nach, inwiefern sich die mündliche Modalität auf Persistenzen in der Mensch-Sprachassistenten-Interaktion auswirkt. Die Modalität der Kommunikate legt die Existenz von Mechanismen und Praktiken natürlicher Mensch-Mensch-Kommunikation wie unbewusstes Alignment nahe. Gleichzeitig erhöht ebendiese Modalität die Komplexität sowie Fehleranfälligkeit der Technologie hinter Sprachassistenten (ASR/TTS), was wiederum andere, formatspezifische Kommunikationspraktiken bedingen könnte (darunter strategisches Alignment). Erste Ergebnisse deuten denn auch darauf hin, dass der Erfolg von Spracherkennung (ASR) und Parsing (NLU) die Tendenz beeinflusst, von Alexa zuerst benutzte Wörter/N-Gramme zu übernehmen. Gleichzeitig scheint die Auftretenswahrscheinlichkeit von Persistenzen sprecherindividuell und aufgabenabhängig (z.B. Terminerstellung vs. Fragenbeantwortung) zu sein.

Referenzen:

  • Fischer, K. (2016). Designing Speech for a Recipient: The roles of partner modeling, alignment and feedback in so-called simplified registers (Vol. 270). John Benjamins. https://doi.org/10.1075/pbns.270
  • Lotze, N. (2016). Chatbots: Eine linguistische Analyse (Vol. 9). Peter Lang. https://doi.org/10.3726/b10402
  • Pickering, M. J., & Garrod, S. (2004). Toward a mechanistic psychology of dialogue. Behavioral and Brain Sciences, 27(2), 169–190. https://doi.org/10.1017/S0140525X04000056
  • Reeves, B., & Nass, C. (1996). The Media Equation: How People Treat Computers, Television and New Media Like Real People and Places. The Center for the Study of Language and Information Publications.
  • Szmrecsanyi, B. (2005). Language users as creatures of habit: A corpus-based analysis of persistence in spoken English. Corpus Linguistics and Linguistic Theory, 1(1), 113–149. https://doi.org/10.1515/cllt.2005.1.1.113