Können Menschen hören, was ich zu Siri oder Alexa sage – und wenn ja, wie viele? Noch im Frühling wollte keiner der großen Tech-Konzerne diese Frage gegenüber VICE eindeutig beantworten. Vier Monate und zahlreiche Enthüllungen später ist klar: Alle hörten mit, Amazon, Apple, Google, Microsoft und auch Facebook.
Thomas, dessen echten Namen wir hier nicht nennen, um ihn zu schützen, arbeitete mehrere Jahre lang als Freelancer für eine Firma, die auch Aufnahmen von Google-Nutzern transkribiert hat. Er bricht seinen Geheimhaltungsvertrag, um VICE zu erzählen, wie er von zu Hause Tausende Google-Sprachbefehle transkribiert hat – für einen Hungerlohn, wie er sagt. Er erinnert sich an intime Audioschnipsel von fremden Menschen, die ihm ein mulmiges Gefühl bereitet hätten. An Drohungen und Liebesbekundungen von Fremden, die nicht wissen konnten, dass Thomas das einmal hören wird.
Videos by VICE
Thomas ist nicht der Erste, der öffentlich und anonym zugibt, Aufnahmen von Sprachassistenten abgetippt zu haben. Zuletzt war es ein Prüfer für Apples Sprachassistentin Siri, der gegenüber Spiegel Online sagte: “Ich sitze jeden Tag in einem Großraumbüro mit Kopfhörern vor dem Computer und höre mir Sprachaufzeichnungen an.” Aber Thomas berichtet ausführlicher als alle anderen von seinem Arbeitsalltag und seinen ethischen Bedenken. Er ist zudem der erste Mitarbeiter, der darüber spricht, wie er deutschsprachigen Aufnahmen von Google-Nutzern gelauscht hat.
Die Firma, für die Thomas gearbeitet hat, lässt im Auftrag von Tech-Konzernen unter anderem Audio-Aufnahmen transkribieren. Einige Aufnahmen, die Thomas abgehört hat, begannen mit den Worten “Ok, Google”, wie er erzählt. Das ist der Befehl, mit dem sich unter anderem der Assistent von Android-Smartphones starten lässt – den meist verbreiteten Smartphones der Welt. Wenn Thomas an die Menschen denkt, die er abgehört hat, sagt er: “Ich war geschockt, weil ich das Gefühl hatte, den Menschen ist nicht bewusst, dass Fremde ihre Aufnahmen abhören dürfen.”
“Wenn du das den ganzen Tag machst, bist du echt kaputt”
“Die Arbeit habe ich zu Hause am PC gemacht. Dafür musste ich eine spezielle Software verwenden. Damit hatte ich zeitweise Zugriff auf eine riesige Liste mit Sprachaufnahmen, die ich abarbeiten musste. Der Ablauf war simpel: zuerst den Audio-Schnipsel anklicken, dann den abgehörten Text in ein Fenster tippen. Dabei musst du dich aber extrem konzentrieren. Denn bezahlt wird nicht pro Stunde, sondern pro Aufnahme. Für eine einzelne Aufnahme gibt es nur Centbeträge. Machst du einen Fehler, wird dir die Aufnahme nicht bezahlt und zurückgeschickt.
Manchmal habe ich 30 bis 40 Stunden pro Woche gearbeitet, manchmal waren es nur einige Stunden. Das hing davon ab, wie viele Aufträge reinkamen. Ein Auftrag lautete zum Beispiel: mehrere Zehntausend Audio-Schnipsel transkribieren. Da habe ich tagelang rangeklotzt. Wenn du das den ganzen Tag machst, bist du echt kaputt. Aber ich brauchte das Geld. Nachdem alle Schnipsel abgearbeitet sind, kommt ein nächster Schwung – oder es kommt einige Zeit lang kein neuer Auftrag.
Ich war Teil von einem Team aus mehreren Freelancern. Direkten Kontakt zu meinen Kollegen hatte ich aber nicht. Wir konnten uns nicht schreiben und wir kannten auch nicht unsere Namen. Trotzdem gab es Konkurrenz im Team. Ich konnte in der Software nämlich sehen, wie gut die anderen performen.”
Menschen, die mechanisch die Arbeit von Maschinen kontrollieren
Nach der öffentlichen Kritik der vergangenen Monate haben viele Unternehmen einen Rückzieher gemacht: Apple und Facebook haben laut Medienberichten eine Pause eingelegt, Google pausiert das Lauschen in der EU, Amazon-Nutzer sollen es mit einem neuen Button abschalten können.
VICE liegen Dokumente vor, die zeigen, wie die Arbeit beim Transkribieren aussieht: Screenshots einer Software-Oberfläche mit langen Listen an Audio-Files, detaillierte Tutorials fürs korrekte Transkribieren, E-Mails von der Projektleitung, die Transkribier-Fehler anprangern, Online-Rechnungen mit kleinen Beträgen, bezahlt von einer Drittanbieterfirma. Die Dokumente zeichnen das Bild von introvertierten Arbeitstagen im Home Office, in denen Menschen mechanisch die Arbeit von Software kontrollieren.
“Es gab Audio-Schnipsel, die ich rassistisch und sexistisch fand. Da denkt man echt, die Welt ist kaputt”
“Ich glaube, die Firma hat eine hohe Fluktuation. Für meinen Job kann man sich online bewerben. Dann muss man – unbezahlt – eine Reihe von Tests machen, darin geht es zum Beispiel um das Sprachniveau und Grammatik-Kenntnisse. Ein persönliches Gespräch hatte ich nie.
Viel verdient habe ich dort nicht. Ich persönlich halte die Firma für einen Halsabschneider. Sie hat mir einen Verdienst über Mindestlohn versprochen. Doch nur durch den Einsatz von selbst finanzierter Soft- und Hardware konnte ich den erreichen. Aber ich schätze, dass andere Freelancer nur einen Hungerlohn geschafft haben. Da die Firma nur pro transkribierter Aufnahme bezahlt, zählt jede Sekunde. Das halte ich für Ausbeutung.
Ein Auftrag hatte mich geschockt. Wer der Auftraggeber war und woher die Aufnahmen kamen, habe ich nie erfahren. Es hieß, das seien speziell erstellte Sprachbeispiele, mit denen eine KI trainiert werden sollte. Tatsächlich musste ich aber auch Gespräche transkribieren, die sich wie private Telefonate anhörten. Die Gespräche waren in Schnipsel aufgeteilt und durcheinandergewürfelt. Aber ich kann mir gut Stimmen merken und konnte einige Schnipsel im Kopf verbinden.
Eine Unterhaltung ist mir besonders im Gedächtnis geblieben: Ich bin mir sicher, das war ein echtes Gespräch unter sehr engen Freundinnen. Es ging um Probleme mit dem Partner und den Kindern. Ich schätze, in der Summe habe ich ungefähr eine Stunde von dem Gespräch mitbekommen. Das war kein Fake. Beim Abhören habe ich mich schlecht gefühlt. Ich kam mir vor, als würde ich für einen Geheimdienst arbeiten.”
Hast du Informationen zu dem Thema? VICE wird auch in Zukunft über Sprachassistenten recherchieren. Du kannst uns unter sebastian.meineck[at]vice.com oder theresa.locker[at]vice.com erreichen sowie verschlüsselt via Signal +49 152 101 24 551.
“Bei Google-Aufträgen wusste ich, für wen ich arbeite. Da habe ich sogar detaillierte Tutorials zum Transkribieren bekommen, in denen ausdrücklich von Google die Rede war. Ich habe Tausende Sprachaufnahmen von Google-Nutzern abgehört. Häufig waren es gesprochene Anfragen für die Google-Suche. Am Anfang war oft der Befehl “Ok, Google” zu hören. Andere Audio-Schnipsel klangen wie Textnachrichten, die jemand in sein Handy spricht, um nicht tippen zu müssen.
Da war natürlich viel Belangloses dabei, aber auch intime Dinge: Liebesbotschaften, Hass, Suchanfragen für Pornos. Definitiv nichts, was für fremde Ohren bestimmt ist. Ich erinnere mich an einen Audio-Schnipsel, da hat jemand einer anderen Person Gewalt angedroht. Die Person klang sehr wütend. Ich glaube, es ging um einen Drogendeal. Es gab auch viele Audio-Schnipsel, die ich rassistisch und sexistisch fand. Da denkt man echt, die Welt ist kaputt.”
“Plötzlich war ich überzeugt: Das ist die Stimme von einem Freund”
“Ich war geschockt, weil ich das Gefühl hatte, den Menschen ist nicht bewusst, dass Fremde ihre Aufnahmen abhören dürfen. Ich spürte, da wird ganz stark in die Privatsphäre eingegriffen. Vor allem bei privaten Nachrichten, die per Speech-to-Text-Funktion aufgenommen wurden.
An ein Angebot für psychologische Betreuung vonseiten der Firma kann ich mich nicht erinnern. Mit Kollegen konnte ich mich nicht austauschen, weil ich nicht einmal wusste, wie sie heißen. Mein einziger Kontakt war die Projektleitung. Ich habe dort einmal nachgefragt, was ich tun soll, wenn ich zum Beispiel Nazi-Inhalte höre. Die Antwort ging in die Richtung: Ich soll das einfach ausblenden. Als Freelancer wurde ich vorher darauf hingewiesen, dass manche Inhalte nicht jugendfrei sein könnten.
Ich erinnere mich noch an einen Audio-Schnipsel, der hat meine Sicht auf das Ganze verändert. Ich hatte die Aufnahme abgehört und war plötzlich überzeugt: Das ist die Stimme von einem Freund von mir, der Journalist ist. Es war ein kurzer Suchbefehl. Leider konnte mein Freund sich nicht erinnern, ob das von ihm kam. Trotzdem hat das etwas bei mir ausgelöst. Vorher waren es immer die anderen, die ich da abhöre. Nun hatte ich das Gefühl, das betrifft auch mich.”
Ob Google mit dem Lauschen weitermachen wird? Offenbar ja
Wenn Google Sprachaufzeichnungen abhören lässt, ist das nicht verboten. Wir erlauben es sogar selbst und haben oft keine andere Wahl. Denn wer zum Beispiel sein Android-Smartphone einrichtet, muss der Datenschutzerklärung von Google zustimmen. Dort steht “Unter anderem könnten folgende Aktivitätsdaten erhoben werden: (…) Sprach- und Audiodaten bei Ihrer Nutzung von Audiofunktionen”. Was das wirklich bedeutet, verstehen wohl die Wenigsten: Google kann hören, wenn wir der Google-Suchmaschine einen Sprachbefehl geben oder dem Android-Handy Nachrichten diktieren, die in Text umgewandelt werden.
Schon im April hat ein Pressesprecher von Google gegenüber VICE bestätigt: “Bei Google können einige Mitarbeiter auf einige Audioausschnitte aus dem Assistant zugreifen, um das Produkt zu trainieren und zu verbessern”. Nun wissen wir: Es können auch Mitarbeiter von anderen Dienstleistern sein, die im Auftrag von Google handeln. Thomas war einer von ihnen.
Auch auf VICE: Totalüberwachung für 150 Euro
Wir haben Google per E-Mail gefragt, wie der Konzern die Privatsphäre seiner Nutzer schützt und die Vertraulichkeit der Sprachaufnahmen garantiert, wenn selbst Freelancer von Drittanbieterfirmen darauf Zugriff haben. Der Pressesprecher ging in seiner Antwort nicht näher auf die Frage ein, sondern schrieb: “Im Zuge der Auswertungen werden die Audioclips nicht mit den Nutzerkonten verknüpft. Im Übrigen wurden sie nur bei etwa 0,2 Prozent aller Clips durchgeführt.”
0,2 Prozent, das klingt wenig. Aber es ist immer noch viel, wenn man bedenkt, dass Android-Smartphones in Deutschland rund 80 Prozent Marktanteil haben und dementsprechend mehrere Millionen Menschen ihre Einwilligung zum Abhören gegeben haben.
Ob Google nach der angekündigten Pause mit dem Lauschen weitermacht? Offenbar ja. “Wir prüfen derzeit, wie wir künftig zum einen Audioaufnahmen auswerten und zum anderen unseren Nutzern die Verwendung der Daten besser erklären können”, schreibt der Konzern auf unsere Anfrage. Letztlich gehe es darum, die automatische Spracherkennung zu verbessern. Das heißt: Für Freelancer wie Thomas wird wohl es auch in Zukunft viel zu tun geben.
“Für mich ist das Diebstahl”
“Der Job hat mich am Ende wirklich runtergezogen. Ich habe mir in den Aufnahmen viel mehr aggressive Sprache, Rassismus und Beleidigungen anhören müssen, als ich der Gesellschaft zugetraut hätte. Nach ein paar Jahren bin ich ausgestiegen und habe mir etwas anderes gesucht.
Meiner Meinung nach sollten Nutzer ausdrücklich um Erlaubnis gefragt werden, ob sie ihre Aufnahmen weitergeben wollen. Das kann doch nicht so schwer sein! Firmen wie Google und Apple verstecken die Hinweise darauf irgendwo in der Datenschutzerklärung. Die meisten Nutzer wissen also nicht, dass ihre Sprachbefehle abgehört werden können.
Wenn Firmen das trotzdem tun, ist das Diebstahl für mich. Dabei gibt es bestimmt Menschen, die ihre Daten bewusst zur Verfügung stellen würden. Ich fände es gut, wenn sie dafür Geld bekommen. Schließlich helfen sie dabei, dass die Spracherkennung besser wird.”
Folge Theresa und Sebastian auf Twitter und VICE auf Facebook , Instagram und Snapchat.