Ein Handydisplay auf dem eine Siri-Koversation steht
Foto: VICE
Sprachassistenten

Hey Siri, wie viele Menschen hören mich ab?

Lauscht jemand mit, wenn wir mit Alexa, Cortana, Siri und dem Google Assistant sprechen? Das wollen Tech-Konzerne auf keinen Fall verraten. Der Skandal daran: Sie können es sich leisten.

Es gibt offenbar Menschen, die neun Stunden täglich nichts anderes tun, als Gespräche mit Alexa zu belauschen. Im Auftrag von Amazon sollen sie täglich Hunderte Aufnahmen von Nutzerinnen und Nutzern auswerten, wie die Nachrichtenagentur Bloomberg Mitte April berichtete. Sieben dieser Mitarbeiter haben trotz ihrer Geheimhaltungsvereinbarung mit Bloomberg gesprochen. Sie gehören demnach zu einem Team von Tausenden, die unter anderem in den USA, Costa Rica, Indien und Rumänien arbeiten und beruflich lauschen.

Anzeige

Gut möglich, dass dieser Bericht bei vielen müdes Schulterzucken auslöst. Schließlich sind wir es nach zig Datenschutz-Skandalen bei Facebook, riesigen Passwörter-Leaks und natürlich den NSA-Enthüllungen gewohnt, dass es mit der Privatsphäre im Internet sowieso kompliziert ist. Aber falls ein Tech-Konzern tatsächlich mit Büros voller Mitarbeiter belauscht und auswertet, was wir Sprachassistenten sagen, hat das eine andere Dimension.

Sprachassistenten wie Alexa, Siri, Cortana und der Google Assistant geben sich als vertrauenswürdige Gehilfinnen im Alltag, die man auch mal spontan anquatschen kann. Alexa wohnt in smarten Lautsprechern, die Nutzerinnen und Nutzer in ihrer Wohnung verteilen sollen. Siri lässt sich blitzschnell durch die Hometaste aktivieren. Alle Assistenten haben lustige Sprüche parat – mit ihnen zu plaudern, soll einfach Spaß machen.

Wie Google, Apple und Microsoft einer simplen Frage ausweichen

Wer die Assistenten aus Gewohnheit nutzt, wird früher oder später auch mal private oder intime Dinge ins Mikrofon sprechen. Vielleicht fragen wir Siri eines Tages schluchzend nach Liebeskummer-Tipps, suchen mit dem Google Assistant nach Blaubeer-Pornos oder stöbern auf Amazon nach Ratgeber-Literatur zur Frage, wie man endlich clean wird. Und dann sind da noch all die versehentlich gestarteten Aufnahmen, weil jemand ein Wort gesagt hat, das wie "Alexa" klingt. Müssen wir davon ausgehen, dass uns dabei irgendwo auf der Welt Hundertschaften von Überwacherinnen und Überwachern an den Lippen hängen und fleißig mitschreiben?

Anzeige

Die kürzeste Antwort auf diese Frage lautet derzeit: vielleicht. VICE hat Pressesprechern und -sprecherinnen von Apple, Microsoft, Google und Amazon eine simple Frage gestellt: Wie viele Menschen hören Audio-Aufzeichnungen von Nutzern ab? Keine einzige Firma war bereit, diese Frage eindeutig zu beantworten.

Die genaueste Antwort gab es von Google: "Bei Google können einige Mitarbeiter auf einige Audioausschnitte aus dem Assistant zugreifen, um das Produkt zu trainieren und zu verbessern". Offen bleibt, ob hinter dem Wörtchen "einige" nur eine Handvoll Entwickler stecken oder Bürokomplexe voller Lauscharbeiter.

Microsoft, Amazon und Apple reagierten mit ausschweifenden Worten über die Funktionsweise ihrer Sprachassistenten und darüber, dass sie Wert auf Datenschutz legen. "Bei uns gelten strenge technische und betriebliche Sicherheitsvorkehrungen und wir verfolgen eine Null-Toleranz-Politik, was den Missbrauch unseres Systems betrifft", erklärt Amazon. Microsoft schreibt: "Die Entscheidung, was Cortana weiß, liegt beim Nutzer." Apple teilt auf Englisch mit: "Sicherheit und Privatsphäre sind fundamentaler Bestandteil von Apples Hardware, Software und Dienstleistungen."

Das klingt alles super, aber auf die eigentliche Frage – wie viele Menschen hören mit? – gehen die Konzerne nicht ein. Aus den Antworten der drei Konzerne ging nicht einmal klar hervor, ob überhaupt Menschen mithören oder nicht.

Anzeige

**Hast du Informationen zu dem Thema? VICE wird auch in Zukunft über Sprachassistenten recherchieren. Du kannst den Autoren unter sebastian.meineck[at]vice.com erreichen sowie **verschlüsselt via Signal +49 152 101 24 551.

Was bei den Statements von Microsoft, Amazon und Apple besonders auffällt: Die Konzerne benutzen sprachliche Tricks, um zu verschleiern, ob nun Menschen oder Algorithmen die Aufzeichnungen von Nutzerinnen auswerten. So schreibt Apple auf Englisch: "Sprachaufzeichnungen werden gespeichert, sodass das Erkennungssystem sie verwenden kann, um die Stimme des Nutzers besser zu erkennen". Ob dieses "Erkennungssystem" auch aus Menschen besteht – unklar. Amazon schreibt: "Wir versehen nur eine extrem geringe Anzahl von Interaktionen einer zufälligen Gruppe von Kunden mit Anmerkungen, um die Nutzererfahrung zu verbessern." Ob diese Anmerkungen von Menschen gemacht werden – unklar. Weiter heißt es: "Im Rahmen dieses Workflows haben Mitarbeiter keinen direkten Zugriff auf Informationen, die die Person oder das Konto identifizieren können." Ob Amazon-Mitarbeiter aber direkten Zugriff auf die Audio-Aufnahmen haben – unklar.

Deutlichere Worte findet Amazon, als Bloomberg am 24. April erneut berichtet: Dem Bericht zufolge sollen einige Alexa-Lauscher sogar Zugriff auf die Standortdaten der Nutzerinnen und Nutzer haben. Dadurch könnten sie mit etwas zusätzlicher Recherche auch an die ungefähren Adressen von Alexa-Nutzern gelangen, heißt es weiter. Der Bericht beruft sich diesmal auf fünf interne Quellen. Bloomberg gegenüber erklärte Amazon auf Englisch daraufhin: "Der Zugang zu internen Tools ist stark kontrolliert und wird nur einer begrenzten Zahl von Angestellten gewährt." Die Angestellten würden damit den Service verbessern und es gebe eine Null-Toleranz-Politik gegen einen Missbrauch des Systems.

Anzeige

Bundesbeauftragter für Datenschutz: "Evidentes Risiko"

Illustration Sprachassistent

Wie privat ist es wirklich, wenn wir mit Sprachassistenten plaudern? | Illustration: VICE

Microsoft wiederum hat auf die Frage eine besonders seltsame Antwort parat. "Microsoft weiß zu keinem Zeitpunkt, wer Fragen an Cortana gestellt hat", heißt es. Man muss kein Logik-Seminar besucht haben, um zu erkennen: Aus diesem Satz lässt sich nicht ableiten, wie viele Menschen die Cortana-Aufzeichnungen hören können.

Wir haben nachgehakt und wollten es nochmal wissen: Wie viele Menschen? Die Antwort der Pressesprecherin: Der Satz "Microsoft weiß zu keinem Zeitpunkt, wer Fragen an Cortana gestellt hat" gebe einen "deutlichen Hinweis". Aha. Der Konzern macht aus dem Thema also ein Ratespiel. Transparenz sieht anders aus.

Dass die Konzerne so wenig verraten, ist keine Überraschung. Denn wenn es um Datenschutz und Privatsphäre geht, gibt sich die Tech-Branche schon immer so geheimnisvoll wie möglich. Schließlich sind Konzerne nicht verpflichtet, Fragen zu beantworten, und das Geschäft läuft auch mit Geheimniskrämerei super. Aber ob hinter Sprachassistenten eigentlich viele lauschende Menschen stecken, ist keine spitzfindige Frage für Technik-Nerds. Nutzerinnen und Nutzer haben ein berechtigtes Interesse, zu erfahren, ob sie möglicherweise nachträglich belauscht werden – selbst wenn es nur Stichproben sind.

Eine Frage, die die Lauscher oft zu hören bekommen, lautet Bloomberg zufolge: "Alexa, hört noch jemand anderes zu?"

Gegenüber Bloomberg haben für Amazon arbeitende Lauscherinnen und Lauscher gesagt, dass sie auch mal amüsante Audio-Files in internen Chats austauschen. Außerdem berichteten sie von Aufnahmen, in denen etwa eine Frau schlecht unter der Dusche singt oder ein Kind nach Hilfe ruft. Amazon betont zwar, die Mitarbeiter könnten niemals zuordnen, von wem diese Aufnahmen stammen. Trotzdem bekommen sie Einblicke in private Lebenssituationen. Besonders absurd: Eine Frage, die die Lauscher oft zu hören bekommen, lautet Bloomberg zufolge: "Alexa, hört noch jemand anderes zu?"

Anzeige

Auch auf VICE: Totalüberwachung für 150 Euro


Durch die Medienberichte ist auch die Bundesregierung auf das Problem aufmerksam geworden. Der Bundesbeauftragte für den Datenschutz spricht auf Anfrage von VICE von einem "evidenten Risiko", dass Nutzer von digitalen Assistenten ihre "Privatsphäre gegenüber einer unbekannten Zahl von Personen" offenlegen. Zuständig für die rechtliche Bewertung seien aber die Behörden in Luxemburg und Irland.

Warum gute Spracherkennung menschliche Hilfe braucht

Tatsächlich spricht einiges dafür, dass die großen Tech-Konzerne auch Menschen einsetzen, um ihre Sprachassistenten zu verbessern. Die Gründe dafür sind technisch und wirtschaftlich. Wenn es um Sprachassistenten geht, stehen die Konzerne im Konkurrenzkampf. Auch Facebook will Medienberichten zufolge bald einen eigenen Sprachassistenten starten. Falls solche Assistenten in Zukunft so wichtig werden wie Smartphones heute, dann haben Anbieter mit den besten Assistenten einen riesigen Vorteil.

Demnach ist es nur logisch, wenn die Konzerne alles unternehmen, um ihre Assistenten zu verbessern. Die größte Schwäche der Technologie ist derzeit die Spracherkennung, vor allem, wenn Menschen nuscheln, Dialekt sprechen oder sich in hallenden Räumen aufhalten. Algorithmen müssen darauf besonders trainiert werden, und das klappt nur, wenn reale Menschen aushelfen und schwer verständliche Aufnahmen transkribieren.

Anzeige

Da liegt es nahe, dass Tech-Konzerne für diesen Zweck auf die Aufzeichnungen ihrer Nutzer zurückgreifen. Vor allem weil sich die Konzerne das Recht dazu in den Erklärungen zum Datenschutz einholen – "um die Spracherkennung zu verbessern", heißt es etwa beim Google Assistant. Immerhin können Nutzer in vielen Fällen der Verwendung ihrer Daten widersprechen und gespeicherte Audio-Aufzeichnungen löschen, zumindest wenn sie die entsprechenden Stellen in den Menüs suchen.

Experte fordert "verpflichtende Auskunft"

Trotzdem lässt sich nicht so einfach sagen: Wer Sprachassistenten blind vertraut, ist selber schuld. "Es spricht sehr viel dafür, dass die meisten Menschen erwarten, dass Spracheingaben nicht von Menschen abgehört, sondern von Maschinen ausgewertet werden", sagt Matthias Spielkamp, Mitgründer von AlgorithmWatch gegenüber VICE. Die gemeinnützige Organisation macht auf ethische und gesellschaftliche Probleme beim Einsatz von Algorithmen aufmerksam. Spielkamp schätzt, dass Menschen sich von Amazon, Google und anderen Anbietern getäuscht sehen.

"Dass die Unternehmen umfassende Auskünfte verweigern, ist in jedem Fall unethisch", sagt Spielkamp. Es müsse eine verpflichtende Auskunft geben, wenn Konzerne Spracheingaben von Menschen auswerten lassen. "Um überhaupt entscheiden zu können, welche Erwartungen wir diesen Systemen gegenüber haben sollten, brauchen wir Informationen darüber, wie sie funktionieren."

In anderen Worten: Das Problem ist nicht, wenn Konzerne Sprachbefehle von Menschen auswerten lassen. Sondern, wenn sie das gegenüber den Nutzerinnen und Nutzern verschleiern. Bei einigen mag das Resignation bewirken, bei anderen ein paranoides Gefühl, ständig und überall abgehört zu werden. Beides ließe sich durch klare Ansagen der Konzerne verhindern.

Wer mehr über das Thema wissen will, wird zumindest an einer Stelle nicht fündig: bei den Sprachassistenten. Auf die Frage: "Hören Menschen bei Apple was ich dir sage?", antwortet Siri: "Ich bin mir nicht sicher, ob ich das verstanden habe".

Folge Sebastian auf Twitter und VICE auf Facebook , Instagram und Snapchat