Adobes nieuwe 'Photoshop voor stemmen' kan iedereen alles laten zeggen

Na 20 minuten luisteren, kan Adobe's nieuwe tool je stem vrijwel perfect imiteren.
7.11.16

Heb je ooit gewild dat Natalie Portman je luide bovenbuurman vreselijke verwensingen toeschreeuwt? Of dat George W. Bush een romantische voicemail inspreekt voor je moeders verjaardag? Of dat je altijd je moeder kan inzetten om school te bellen om te melden dat je ziek bent? Adobe zit er bovenop.

Toen Adobe in 1990 photoshop uitbracht, droomde het bedrijf van een wereld waarin filmstudio's en fotografen dingen in minuten konden doen die eerst uren duurden. Ze droomden toen nog niet dat de wereld hun fotobewerker zou gebruiken om hoofden van bekende mensen op pornosterren te plakken, onze kijk op vrouwenlichamen te manipuleren en vreselijke memes te maken.

Advertentie

Nu wil het bedrijf dat de wereld Photoshop bracht, hetzelfde doen voor de menselijke stem – ze willen mensen het gereedschap geven om deze op elke mogelijke manier aan te passen. Bij de Adobe Max Creativity Conference toonde het bedrijf voor het eerst VoCO: een audiobewerker waarmee mensen andere mensen dingen kunnen laten zeggen door alleen te typen.

Volgens Adobe kan het programma na 20 minuten luisteren naar een stem, die stem alles laten zeggen. Komiek en regisseur Jordan Peele presenteerde het evenement terwijl Adobe-technicus Zeyu Jin het proces demonstreerde. Hij nam bestaande audio van Keegan-Michael Key, de komediepartner van Peele, en gebruikte de software om hem te laten zeggen dat hij getongd had met Peele.

In het audiobestand vertelt Key over het enthousiasme dat hij voelde bij de nominatie voor een prijs. "Ik sprong uit bed," zei Key. "En ik kuste mijn honden en mijn vrouw … in die volgorde." Op het scherm boven Jins hoofd zien we een golfvorm en een klein venstertje met de getranscribeerde zin.

Jin verwijderde delen van de zin en typte nieuwe woorden, waarbij de golfvorm meteen veranderde. In luttele seconden kon de Adobe-mederwerker Key laten zeggen dat hij zijn vrouw kuste voor zijn hond, toen dat hij Jordan gekust had en toen dat hij Jordan drie keer gekust had. Hij deed dit alles door te typen en het klonk zo goed als naadloos.

"Geen zorgen," zei Jin. "We hebben ook onderzocht hoe we misbruik tegen kunnen gaan. We kunnen watermerken invoegen. Naar mate we beter worden, zodat mensen het verschil tussen de echte en neppe stem niet meer kunnen horen, werken we ook harder aan manieren om het verschil wél te kunnen detecteren." Toen grijnsde hij en gaf hij een thumbs up.

Jin en Adobe ontwikkelden de software om podcasters en audioboekmakers te helpen. Nieuwe audio typen in plaats van opnieuw op te nemen, zou een zegen zijn in die beroepen. Maar Adobe weet dat het ook gebruikt kan worden om mensen dingen te laten zeggen die ze niet gezegd. Sterker nog, het eerste wat ze deden met de technologie was een van de presentatoren van hun conferentie plagen.