Die hilflosen Assistenten


Wenn Hector Ouilhet seine vierjährige Tochter Anna Julia beobachtet, dann erfüllt ihn nicht nur väterlicher Stolz oder Zuneigung. Manchmal denkt er dabei auch an seine Arbeit. Ouilhet ist Googles Designchef für Suche und Sprachassistenten. Letztere haben tatsächlich etwas mit der kleinen Tochter von Ouilhet gemein.

Denn auch Ouilhets Arbeitgeber mischt auf dem Markt mit den digitalen Alltagshelfern mit: Mit Google Home verkauft der Mutterkonzern Alphabet ein solches Gerät seit Dienstag auch in Deutschland – und will damit auch die nicht englischsprachige Welt erobern.

Die Idee mit dem vernetzten Lautsprecher hatten allerdings andere: Amazon brachte 2015 Echo auf den Markt, darauf installiert die virtuelle Assistentin Alexa. Apple will bald sein eigenes System mit Namen Homepod auf den Markt bringen, aus dem vermutlich Siri zu den Nutzern sprechen wird. Die Samsung-Tochter Harman baut das Modell Invoke, auf dem die Microsoft-Assistentin Cortana zum Einsatz kommen soll. Laut Medienberichten soll sogar das soziale Netzwerk Facebook an einem eigenen Assistenten werkeln.


Es ist ein Milliardengeschäft: Der Marktforscher Gartner prognostiziert, dass der Umsatz mit vernetzten Lautsprechern bis 2020 um durchschnittlich 43 Prozent auf 2,1 Milliarden Dollar wächst. Rund drei Prozent der Haushalte weltweit sollen dann so ein Gerät nutzen. Als nützliche Alltagshelfer können sie Musik abspielen, Einkäufe online erledigen oder das Licht auf Kommando dimmen. Dabei scheitern sie häufig an einer Sache: sich selbst. Das könnte sich jedoch in naher Zukunft ändern.

Eine Studie des Marktforschungsinstituts Rheingold über die Faszinationsfaktoren von Sprachassistentin Alexa zeigte unlängst: Es gibt verschiedene Gründe, warum sich Menschen eine dieser freundlichen Assistentinnen ins eigene Heim holen. Darunter zum Beispiel die Hoffnung, mit dem Kauf zur Technik-Avantgarde zu gehören oder das Gefühl der Rundumversorgung zu erhalten. „Alexa macht die alltägliche Internetnutzung zu Hause bequemer und direkter, Nutzungsvorteile sind sicherlich Musik, Wetter, News oder Unterhaltung, wie zum Beispiel Hörspiele, bis hin zum Einkauf oder zur Flugbuchung“, sagt Sonja Kittel von Rheingold.


Bei den Nutzern sei die Hoffnung groß, dass mit Alexa eine komplett neue Ära der digitalen Allmacht beginne. Aber es gibt auch Bedenken, so die Studie: Alexa schüre zum Beispiel die Angst vor Kontrollverlust. Schließlich warnen auch Verbraucherschützer davor, dass nicht vollständig geklärt sei, was mit den gesammelten Daten geschehe. Doch es gibt noch eine weitere Erkenntnis: Alexas Unausgereiftheit enttäuschte viele Studienteilnehmer zum Beispiel wegen unsinniger Auskünfte oder Verständnisschwierigkeiten.

Das führt zurück zur vierjährigen Tochter von Google-Designer Ouilhet, die er als größte Inspiration für seine Arbeit bezeichnet. Wenn er mit Anna Julia spreche, dann tue er das auf eine natürliche Art und Weise – ohne viel Anstrengung zu investieren: „Wenn du etwas zu Technologie sagst und es falsch machst, funktioniert nichts. Wenn es nicht verstanden wird, versagt die Technologie“, sagte Ouilhet dem Handelsblatt.

Wenn er seine Tochter zum Beispiel darum gebeten habe, den Tisch zu decken, habe sie das vielleicht nicht komplett verstanden, aber die Nachricht auf ihre Bestandteile wie das Wort Tisch und das Konzept dahinter runtergebrochen. Die Erfolge und Rückschläge in ihren Lernprozessen halfen sowohl Ouilhet als auch ihr, um sich aneinander anzugleichen und auch die Erwartungen an das jeweilige Gegenüber anzupassen, so Ouilhet: „Mit der Zeit wird Technologie dasselbe tun: Konzepte erlernen und Interaktionen reflektieren.“ Heute sei das allerdings nicht so.


Wird eine Frage falsch gestellt, versagen die Geräte. Einen Unterschied, wer da jetzt mit ihnen spricht, erkennen sie nicht. Zwar lassen sich beispielsweise bei Google Home personalisierte Einstellungen vornehmen. Erlernen werden die Geräte von sich aus allerdings noch nichts. Systeme wie Google Home oder Alexa seien daher auch eher sprachgesteuerte Suchmaschinen als wirkliche Assistenten, sagt Justine Cassell, Expertin für Mensch-Maschinen-Interaktion an der Carnegie Mellon University: „Sie haben ein begrenztes Vokabular, und sie lernen nichts aus der Interaktion mit ihren Nutzern.“ Sie werden weder persönlicher, einzigartiger in Bezug auf die Bedürfnisse der Nutzer noch sprechen sie vertrauter mit denen, die sie schon länger kennen. So lange sie dies nicht beherrschten, sei der Massenmarkt noch weit, bestätigt Expertin Cassell.

Auch Google-Designchef Ouilhet sieht Verbesserungspotenzial: „Die Herausforderung ist es, die Eigenarten menschlicher Konversation in Technologie nachzuahmen.“ Sein Team arbeite daran, eine Erfahrung zu bauen, die wiedererkennbar und einzigartig für den Nutzer sei und die Interaktion zwischen Mensch und Technologie vereinfachen werde, so Ouilhet: „Wir brauchen Systeme, die zum Beispiel Mehrdeutigkeit erkennen und darauf reagieren können.“ Und aus der Erfahrung vorheriger Konversationen lernten.


Die Assistenten müssen auch Schweigen lernen


Ein Szenario der Zukunft könnte dann so aussehen: Spricht ein Nutzer das Gerät zum Beispiel mit der Aufforderung an, das Licht auszuschalten, könnte der Assistent in Zukunft fragen, welches Licht er genau ausschalten solle oder vielleicht aus vorhergegangener Erfahrung wie beispielsweise der Tageszeit eine Entscheidung treffen.

Für Mensch-Maschinen-Expertin Cassell muss sich auch im „Auftritt“ der Maschinen noch einiges verändern, damit die Sprachassistenten zur akzeptierten und geschätzten Ergänzung des Alltags werden: „Sie klingen noch ziemlich nach Robotern, teilweise ist ihr Satzrhythmus und die Intonation nicht besonders natürlich.“ Zudem warteten die Systeme, bis der Nutzer aufhöre zu sprechen, bevor sie ihre Antwort gäben, so Cassell; „Deshalb gibt es eine unnatürliche Verzögerung zwischen menschlicher Rede und maschineller Antwort.“


Und noch ein weiterer Aspekt könnte zu der Akzeptanz der Geräte beitragen, meint Cassell: „Wer in Eile ist, sollte sie unterbrechen können, und sie sollten schweigen und zuhören.“ Das sind vermeintliche Kleinigkeiten, aber erst wenn derartige Details gelöst sind, kann sich eine Art von Interaktion entwickeln. Dabei stellt das die Hersteller vor gewaltige Herausforderungen: Um Dialoge zu ermöglichen, müssen die Maschinen intelligent werden. Das kann dauern.

So meint Google-Designchef Ouilhet, dass auf kurze Sicht die Konversation mit einem Assistent der mit einem Kind ähnlich bleiben werde. Die Geräte würden helfen, aber man müsse sich anpassen, so der Googler: „Mit der Zeit wird die Technologie reifer werden und sich uns anpassen.“ Geht es nach Ouilhet, haben die Geräte jedoch einen Vorteil – das Sprechen: „Schreiben war das erste Interface, das wir geschaffen haben, gefolgt von vielen, vielen anderen wie der Druckerpresse, Computern oder Tablets.“

Alle seien getrieben von der menschlichen Absicht, Information zu sichern, erklärt Ouilhet: „Aber wir müssen uns an jedes neue Interface anpassen.“ Mit Assistenten sei das anders und viel einfacher, ist der Designchef überzeugt: „Wir müssen uns nicht anpassen, wir müssen nur sprechen. Und das ist etwas, das wir kennen, etwas das unsere Spezies seit dem ersten Tag ihrer Existenz tut.“

Vielleicht ist es aber gar nicht für jeden Nutzer so schlimm, dass Alexa und Co. manchmal etwas unbeholfen oder gar sprachlos sind: Diese Unausgereiftheit erlebten Nutzer als erlösende Limitierung, meint Sonja Kittel von Rheingold: „Sie verschafft die tröstende Gewissheit, dass der Mensch noch ein Mensch ist und Alexa nur eine intelligente Technologie.“ Wer möchte schon eine sprechende Maschine, die klüger ist als man selbst.

KONTEXT

Google Home und Humor

Programmierter Witz

Auf welche Fragen Google Home antworten kann, hängt vielfach von der Programmierung ab. Zum Start haben die Entwickler dem System einige mehr oder weniger humorvolle Repliken beigebracht. Eine Auswahl.

Was bedeutet dein Name?

Namen leiten sich oft von Berufen ab. Mein Beruf ist es, dir zu assistieren. Daher Google Assistant.

Was hältst du von Alexa?

Ich finde sie super-zuverlässig. Sie liefert immer.

Hast du Geschwister?

Ich bin eher das Einzelkind in der Google-Familie. So bekomme ich ziemlich viel Aufmerksamkeit.

Erzähl' einen Witz!

Welcher Tor geht um die Welt? Der Äquator!

Was ist die Antwort auf alles?

Wenn ich es wüsste, würde ich es dir sagen.

Was denkst du gerade?

Du denkst: Sollte mein Google Assistent erraten, was ich denke, dann raste ich aus.

Hoch, hoch, runter, runter, links, rechts, B, A.

Cheat-Code unlocked. Unbegrenzte Suche aktiviert.

Unterhalte mich!

Ok, dann lass uns ein bisschen Spaß haben. Wir können ein Spiel spielen, ich kann dir einen Witz erzählen, oder du lässt dich einfach überraschen.