tekom - Gesellschaft für technische Kommunikation - Deutschland e.V.
20. November 2019 | Regionalgruppe Baden

Chatbots - Einstieg und Blick in die Forschung

Nicht ohne Grund hat sich die Rede von der "Servicewüste Deutschland" einen Platz im Wortschatz erstritten: Hilfesuchende Kunden müssen sich oft entscheiden zwischen der Pest von Warteschleifen in der Hotline und der Cholera unbefriedigender Auskünfte gestresster Hotlinemitarbeiter. Aus diesem Dilemma könnten nun dank fortgeschrittener Sprachverarbeitungstechnologien sogenannte Chatbots heraushelfen – computergestützte maschinelle Auskunftssysteme, denen man sein Anliegen in natürlicher Sprache vortragen kann. Wie solche Systeme funktionieren, welche Fallen sich hier auftun und ob sie auch im Umfeld der Technischen Dokumentation Nutzen stiften können – davon berichtete Dr. Stefan Morana vom Karlsruher Institut für Technologie (KIT). 21 Besucher fanden sich zu diesem Vortrag in den Räumen der SAP in Walldorf ein.

Der stark interaktiv gestaltete Vortrag behandelte die Themen Grundlagen von Chatbots, Soziale Signale technischer Systeme ("social cues") und mündete in die Demonstration eines Doktorandenprojekts, das sich die Verbesserung der Dialogfähigkeiten von Chatbots mit Hilfe von Unterstützung durch die "Crowd" zum Ziel gesetzt hat. 

Untersuchungen zeigen, dass es 40% der Auskunftsuchenden egal ist, ob sie eine gewünschte Information von einem Menschen oder einer Maschine erhalten – so lange sie ihnen nur weiterhilft. Dazu passt eine Vorhersage aus dem Hause Gartner, wonach im Jahr 2020 rund 25% aller Auskunftsdienste ganz oder teilweise mit Chatbots ausgestattet sein werden.

Welche Prozessschritte spielen sich nun in einem Chatbot ab? Bei einem auf gesprochene Sprache ausgelegten System handelt es sich um folgende Schritte:

  1. Spracherkennung: Identifizierung akustischer Signale als gesprochene Sprache
  2. Sprachverständnis: Themen- und Absichtsextraktion aus dem empfangenen Sprachfluss
  3. Dialogmanagement: Zuordnung und Vereinheitlichung verschiedener Sprech- und Formulierungsvarianten ("Ich bin hungrig", "Mein Magen knurrt" usw.) zu einer im System verfügbaren Auskunft
  4. Formulierung der Antwort
  5. Spracherzeugung (Text to Speech - TTS)

Hinweis: Entscheidet man sich für ein textbasiertes System ("text-based conversational agent"), bei dem Benutzer Ihre Anfragen eintippen statt zu sprechen, können der erste und letzte der genannten Schritte entfallen. 

Auch wenn das Prinzip eigentlich klar und die Benutzerakzeptanz grundsätzlich vorhanden ist, setzen Chatbots sich in der Praxis derzeit nur erstaunlich langsam durch. Als Grund hierfür zeichnet sich ein nicht vorhergesehener unsachgemäßer Umgang der Benutzer mit den Bots ab, indem die Benutzer mit dem Bot flirten oder sonstige private Gespräche führen, dem Bot mithin wie einem vertrauenswürdigen menschlichen Gesprächspartner gegenübertreten. Dieses Phänomen wurde bereits 1966 erstmals von Joseph Weizenbaum beobachtet, der entgeistert feststellte, wie seine Sekretärin einem von ihm entworfenen Dialogsystem intime Themen anvertraute. Seither hat man zeigen können, dass Computer soziale Signale aussenden und von Menschen als soziale Akteure gesehen werden. Dabei erstreckt sich dieser unterbewusste und auf kulturellen Prägungen basierende Effekt nicht nur auf die Benutzer vermeintlich intelligenter Systeme, sondern auch auf deren Konstrukteure und Designer. 

So konnte der Referent am Beispiel der gezielt variierten Antwortzeit eines Auskunftssystems zeigen, dass es hier keine allgemeingültigen Lösungen gibt, sondern es einer Anpassung an die jeweilige Zielgruppe bedarf. Ein System, das für seine Antworten stets mehrere Sekunden Bedenkzeit benötigt, wird ebenso abgelehnt werden wie eines, das die Antworten praktisch verzögerungsfrei wie aus der Pistole geschossen erteilt. Dies relativiert sich jedoch in Abhängigkeit von der Expertise der Systembenutzer. Erfahrene Experten neigen zu geringer Toleranz gegenüber Verzögerungen aller Art, während ungeübte Benutzer eine künstliche Verzögerung als "menschlich" empfinden. Hieraus folgt, dass ein optimales System unterschiedliche Kommunikationsstrategien beherrschen sollte, was am einfachsten zu realisieren ist, wenn es den jeweiligen Benutzer identifizieren und auf dessen Erwartungen eingehen kann. 

Zum Abschluss gab der Referent den Teilnehmern Gelegenheit, sich selbst zu Nutz und Frommen von Wissenschaft und Menschheit einzubringen: Auf ihren mitgebrachten Notebooks konnten die Anwesenden die Äußerungen und Reaktionen eines rudimentären textbasierten Bots überprüfen und Formulierungsvorschläge für hilfreichere Auskünfte erfassen, die dann an  zentralem Ort gesammelt und auf Tauglichkeit geprüft werden können. Ein solches grundsätzlich öffentlich zugängliches System steht derzeit noch vor dem bislang ungelösten Problem, massenhaft eintreffende Textvorschläge aus der "Crowd" automatisiert zu sichten und auszuwerten.

In der abschließenden Diskussion kam das grundsätzliche Problem des angemessenen Umgangs der Bots mit Kontext- und Themenwechseln während einer laufenden Sitzung zur Sprache. Beim heutigen Stand der Technik erscheint es als guter Kompromiss, in einem hybriden Ansatz eine Grundmenge an Frage/Antwort-Paaren automatisiert abarbeiten zu lassen und das System bei darüber hinausgehenden Fragestellungen die Kontrolle an einen menschlichen Hotlinemitarbeiter übergeben zu lassen.

Claus Horn


Weitere Informationen:

https://chatbotresearch.com/

 

Termin der Veranstaltung
20.11.2019 | 18:00 Uhr
Veranstaltungsort
SAP SE, Walldorf
Referent:in
Dr. Stefan Morana (KIT)