Zašto Gugl Trenslejt izbacuje zlokobna religijska predskazanja

Gugl Trenslejt u slobodno vreme tezgari kao poremećeni prorok — eksperti kažu da je to verovatno zbog sablasne prirode neuralnih mreža.

|
Jul 24 2018, 6:51am

Ilustracija: Chris Kindred 

Prvobitno objavljeno na Motherboard.

Ukucajte reč “dog” u Gugl Trenslejt 19 puta, tražite da se ta besmislena poruka prevede sa maorskog na engleski i dobićete nešto što liči na izvitopereno religijsko predskazanje.

“Sat sudnjeg dana stoji na tri minuta do dvanaest”, glasi ono. “Srećemo likove i doživljavamo dramatične događaje svetu koji ukazuju na to da smo sve bliži smaku sveta i Isusovom povratku.”

To je samo jedan od mnogobrojnih bizarnih i ponekad zloglasnih prevoda koje su korisnici na Reditu i drugde izvukli sa Gugl Trenslejta, Guglove deset godina stare usluge koja sada može da tumači poruke na preko 100 jezika. Na somalijskom, na primer, niz reči “ag” prevode se u pasaže o “sinovima Geršona”, “ime GOSPODA” i reference na bliblijsku terminologiju kao što su “laktovi” i Deuteronomija.

Na Tviteru su ljudi čudne prevode krenuli da objašnjavaju duhovima i demonima. Korisnici na forumu nazvanom TranslateGate spekulisali su da bi neka od čudnijih rešenja mogla biti izvučena iz mejlova ili privatnih poruka.

“Gugl Trenslejt uči na osnovu primera prevoda sa interneta i ne koristi ‘privatne poruke’ za prevode niti bi sistem čak mogao da ima pristup tom sadržaju”, izjavio je u mejlu Džastin Bur, portparol Gugla. “To je prosto rezultat ubacivanja besmislica u sistem, koje onda generišu nove besmislice.”

Kad je Motherboard dao Guglu na uvid primere jezovitih poruka, njihov prevod je posle naprosto nestao sa Gugl Trenslejta.

Postoji nekoliko mogućih rešenja za ove neobične prevode. Moguće je da su zlokobne poruke rezultat nezadovoljnih nameštenika firme Gugl, na primer, ili da nestašni korisnici zloupotrebljavaju dugme “predloži izmenu”, koje prihvata sugestije za bolje prevode datog teksta.

Aleksandar Raš, vanredni profesor sa Harvarda koji proučava prirodnu obradu jezika i kompjuterske prevode, rekao je da bi, međutim, interni filteri kvaliteta verovatno registrovali takvu vrstu manipulacije. Verovatnije je, rekao je Raš, da neobični prevodi imaju veze sa promenom koju je Gugl Trenslejt uveo pre nekoliko godina, kad je počeo da koristi tehniku poznatu kao “neuralni mašinski prevod”.

U neuralnom mašinskom prevođenju, sistem se obučava na velikom broju tekstova na jednom jeziku i odgovarajućih prevoda na drugom, kako bi napravio model za kretanje između dva jezika. Ali kad se u njega ubace besmislice, rekao je Raš, sistem može da “halucinira” bizarna rešenja — to se ne razlikuje mnogo od načina na koji Guglov DeepDream prepoznaje i akcentuje obrasce u slikama.

“Modeli su crne kutije, koje nastaju na osnovu onoliko primera za učenje koliko možete da nađete”, rekao je Raš. “Velika većina tih izgledaće kao ljudski jezik, a kad mu dodate novi, on je obučen da proizvede nešto, i to po svaku cenu, što takođe izgleda kao ljudski jezik. Ako mu date nešto veoma drugačije, međutim, najbolji prevod biće nešto tečno, ali bez ikakvih dodirnih tačaka sa unosom.”

Šon Kolbat, viši naučnik sa BBN Tehnolodžiz koji radi na mašinskom prevodu, složio se da su neobična izlazna rešenja nastala verovatno zbog toga što algoritam Gugl Trenslejta traži red u haosu. On je istakao i da jezici koji generišu najčudnije rezultate — somalijski, havajski i maorski — imaju manji korpus prevedenog teksta od rasprostranjenijih govornih jezika kao što su engleski ili kineski. Kao posledica toga, rekao je on, moguće je da je Gugl koristio religijske tekstove kao što je Biblija, koja je prevedena na mnoge jezike, da bi se naučio model na tim jezicima, što se završilo religijskim sadržajem.

“Ako pokušaju da izgrade model na osnovu tih stvari, moguće je da model naprosto izvede očajnički manevar i ispljune komad svoje obuke”, rekao je Kolbat, koji je u četu istakao da govori u svoje ime, a ne u ime svog poslodavca.

Raš se složio da bi, ako Gugl koristi Bibliju za učenje svog modela, to moglo da objasni neke od njegovih čudnijih izlaznih rešenja. I zaista, nekoliko bizarnih prevoda na somalijskom liče na određene pasuse iz Starog zaveta. Izlazak 27:18 pominje stotinu lakata, a nekoliko stihova u Brojevi 3:18 govore o sinovima Geršona.

Bur, portparol Gugla, odbio je da kaže da li materijali za obuku Gugl Trenslejta uključuju i religijske tekstove.

Ponekad se, međutim, zaista stiče utisak da algoritam kanališe nečastive duhovne energije — ili čak da zbija šale.

Na kraju krajeva, Gugl Trenslejt tumači “w hy ar e th e tran stla tions so wei rd” na somalijskom, na primer, kao “It is a great way to make it so much better.”

Više na VICE
Vice Channels