Typ 19 keer het woord ‘dog’ in Google Translate, laat dit onzinnige bericht vanuit het Maori naar het Engels vertalen en er verschijnt iets wat op een vreemde bijeengeraapte religieuze voorspelling lijkt.

“Doomsday Clock is three minutes at twelve,” verschijnt er. “We are experiencing characters and a dramatic developments in the world, which indicate that we are increasingly approaching the end times and Jesus’ return.”

Dat is maar een van de vele bizarre en vaak onheilspellende vertalingen die redditors uit Google Translate hebben gevist. De dienst van Google bestaat nu 10 jaar en kan teksten in meer dan 100 talen vertalen. In het Somalisch veranderen reeksen van het woord ‘ag’ in profetische zinnen over de zonen van Gersom en wordt de naam van de Heer vaak aangehaald. Ook komen er allerlei bijbelse verwijzingen naar ‘cubits’ (een oude lengtemaat; vergelijkbaar met een el) en het boek Deuteronomium voorbij.

Op Twitter geven mensen geesten en demonen al de schuld van de vreemde vertalingen. De mensen op subreddit TranslateGate speculeren er al flink op los dat sommige van de vertalingen gegenereerd zijn door gebruik te maken van teksten uit e-mails of privéberichten.

“Google Translate leert van voorbeelden van vertalingen op het internet en gebruikt geen ‘privéberichten’ om vertalingen te maken. Het systeem heeft daar ook geen toegang toe,” zegt Google-woordvoerder Justin Burr in een e-mail. “Dit komt gewoon doordat er onzin in ons systeem wordt ingevoerd, waarna er weer onzin wordt gegenereerd.”

Nadat Motherboard Google die enge religieuze boodschappen liet zien, verdwenen ze uit Google Translate.

Er zijn verschillende verklaringen mogelijk voor al de paranoïde onzin die Translate uitspuugt. Misschien is het het werk van ontevreden Google-medewerkers of komt het doordat ondeugende gebruikers misbruik maken van functie waarmee je een betere vertaling kunt voorstellen.

Volgens Alexander Rush, universitair docent aan Harvard die onderzoek doet naar het verwerken van taal en vertaling door computers, worden dat soort dingen waarschijnlijk wel door de filters van Google opgemerkt. Volgens Rush is het waarschijnlijker dat het komt door aanpassingen die een paar jaar geleden aan Translate zijn gemaakt. Vanaf toen werd er gebruik gemaakt van een techniek die ‘neural machine translation’ heet.

Bij deze techniek wordt het systeem getraind met een hele berg tekst in de ene taal en vertalingen daarvan in een andere. Hiermee wordt een model gemaakt waarmee tussen de twee talen geswitcht kan worden. Maar als het systeem met alleen maar onzin wordt gevoed, kan het dus bizarre vertalingen gaan ‘hallucineren,’ zegt Rush. Het is een beetje te vergelijken met DeepDream van Google, dat patronen in afbeeldingen identificeert en accentueert, waardoor er allerlei lsd-achtige plaatjes kunnen ontstaan.

“De modellen zijn black-boxes die leren van zoveel trainingsdata als er maar te vinden is,” zegt Rush. “Het grootste gedeelte van deze data zal op menselijke taal lijken en het systeem is zo getraind dat als je het nieuwe data geeft, het koste wat het kost iets wil produceren dat op menselijke taal lijkt. Maar als je het iets heel anders voert, zal de beste vertaling iets zijn dat nog steeds vloeiend is, maar totaal niet op de input lijkt.”

Sean Colbath is een wetenschapper bij BBN Technologies die werkt aan computervertalingen. Hij denkt ook dat die vreemde religieuze praat waarschijnlijk te wijten is aan het algoritme van Google Translate dat orde probeert te scheppen in chaos. Hij wees er ook op dat er van de talen die voor de vreemdste resultaten zorgen – Somalisch, Hawaïaans en Maori – minder vertaalde teksten beschikbaar zijn dan veelgesproken talen als het Engels of Chinees. Hij denkt dat het daarom ook goed mogelijk is dat Google religieuze teksten die vertaald zijn in veel verschillende talen, zoals de Bijbel, heeft gebruikt om het algoritme te trainen. En daardoor gaat Translate dan weer religieus lopen raaskallen.

“Als ze hiermee een model proberen te bouwen, kan het ervoor zorgen dat het model op hoop van zegen maar iets probeert en iets wat het geleerd heeft uitbraakt,” zegt Colbath in een chat. Hij benadrukt nog dat hij voor zichzelf spreekt en niet voor zijn werkgever.

Rush denkt ook dat als Google de Bijbel gebruikt om hun model te trainen, dat dat die vreemde teksten kan verklaren. Sommige bizarre vertalingen in het Somalisch lijken inderdaad op specifieke passages uit het Oude Testament. In Exodus 27:18 gaat het over een lengte van 100 el en in verschillende verzen, waaronder Numeri 3:18, gaat het over de zonen van Gersom.

Google-woordvoerder Burr wilde niet bevestigen of ze Translate trainen met religieuze teksten.

Soms voelt het echt wel alsof het algoritme echt kwade geesten oproept – of zelfs een grap met je uithaalt.

Google Translate maakt van ‘w hy ar e th e tran stla tions so wei rd’ in het Somalisch “It is a great way to make it so much better.”

