Stemacteurs krijgen steeds vaker de vraag om de rechten tot hun stem weg te geven, zodat klanten kunstmatige intelligentie (AI) kunnen gebruiken om synthetische versies te genereren die de stemacteurs uiteindelijk zouden kunnen vervangen. Dit zou soms ook gebeuren zonder dat ze extra betaald krijgen, aldus belangenorganisaties en acteurs waar Motherboard mee sprak. Dergelijke contractuele verplichtingen zijn voor stemacteurs slechts een paar van de vele zorgen die bij de opkomst van stem-genererende AI komen kijken; volgens hen zouden er daardoor in de toekomst hele segmenten van de industrie zonder werk kunnen zitten.
Dit nieuws laat zien hoeveel impact de groeiende industrie van AI-stemmen heeft, en toont ook aan hoeveel makkelijker het voor iemand is om de stemmen van anderen te synthetiseren. In januari schreef Motherboard over hoe leden van 4chan met een bèta-programma van het kunstmatige stemmen-bedrijf ElevenLabs aan de haal gingen en de stemmen van beroemdheden genereerden, waaronder Emma Watson die stukken van Mein Kampf leest. De gevolgen voor arbeid in de stemacteur-industrie staan ook in directe relatie met het werk van ElevenLabs; het bedrijf adverteert zijn diensten als een bruikbare optie voor games, films, audioboeken en meer.
Videos by VICE
“Het is respectloos tegenover het vakmanschap om te suggereren dat een AI-performance gelijkstaat aan het acteerwerk van een echt persoon,” vertelt SungWon Cho, een stemacteur voor games en animaties die online bekend staat onder het pseudoniem ProZD, in een email aan Motherboard. “Ja, je kan het qua toon op een stem laten lijken, en misschien kun je het zelfs laten klinken alsof er een beetje emotie in zit, maar uiteindelijk zal zo’n stem alsnog hol en nep klinken. Als we hiermee verder gaan lopen we het risico dat mensen op een gegeven moment gaan denken dat voice-overs volledig door AI vervangen kunnen worden, wat ik een misselijkmakende gedachte vind.”
Er bestaan nu een hoop bedrijven die aanbieden om door middel van AI iemands stem te klonen, genereren of synthetiseren. Motherboard heeft een aantal van die producten getest en ze lijken over het algemeen hetzelfde te werken. Gebruikers kunnen allereerst hun eigen stem opnemen met een script dat door het bedrijf verschaft wordt. Als ze een bepaalde hoeveelheid audio hebben opgenomen, soms tussen de 10 en 60 minuten, maakt het bedrijf een replica van de stem van de gebruiker. De meeste sites die Motherboard testte maakten de stemmen standaard na met een Amerikaans Engels accent. Dit soort diensten zijn vaak erg goedkoop; gebruikers konden gratis of voor een lage prijs stemmen synthetiseren. Eén van de diensten die door Motherboard werd getest had bijvoorbeeld een pro-abonnement in de aanbieding voor nog geen 30 euro.
Bij sommige sites is het ook mogelijk om eerder opgenomen audio te uploaden, wat betekent dat opnames van beroemdheden of andere mensen zouden kunnen worden geript en gesynthetiseerd zonder dat die mensen ervan af weten of er toestemming voor hebben gegeven.
Fryda Wolff, een stemacteur en regisseur die aan games zoals Apex Legends heeft gewerkt, vertelt Motherboard dat “gameontwikkelaars, animatiestudio’s, en misschien zelfs commerciële cliënten me meer ‘performances’ zouden kunnen laten doen als ze mijn stem aan een AI zouden voeren om acteerwerk te genereren. Ik zou dan niet worden gecompenseerd voor het gebruik van mijn ‘kloon’, laat staan dat mijn agentschap erover zou worden geïnformeerd.”
Sarah Elmaleh, een stemacteur en regisseur die aan Fortnite en Halo: Infinite heeft gewerkt, zegt dat toestemming bij performances “altijd aanwezig moet zijn”.
“Wat gebeurt er als we met plezier een rol aannemen en eenmaal in de studio een zin in het script zien staan die niet goed voelt, en daar eenduidig ongemak over uiten? Wat als de producer de ernst van dat bezwaar niet begrijpt of accepteert? Normaliter kunnen we weigeren om die zin op te lezen, zodat die niet wordt gebruikt. Met deze technologie kun je dat soort dingen natuurlijk volledig omzeilen,” zegt ze.
“Het is respectloos tegenover het vakmanschap om te suggereren dat een gegenereerde performance gelijkstaat aan het acteerwerk van een echt persoon.”
Tim Friedlander, directeur en oprichter van de National Association of Voice Actors (NAVA), vertelt aan Motherboard dat clausules in een contract die producers het recht geven om de stem van een acteur te synthetiseren nu “erg vaak voorkomen.”
“Het taalgebruik kan verwarrend en dubbelzinnig zijn,” zegt Friedlander. “Veel stemacteurs zouden zo’n contract kunnen hebben ondertekend zonder door te hebben dat er zulke dingen instaan. We komen ook clausules in contracten voor niet-synthetische stemklussen tegen die de rechten om de stem van een acteur te gebruiken voor het trainen of creëren van een synthetische stem weggeven zonder enige verdere compensatie of goedkeuring. Sommige acteurs wordt verteld dat ze niet kunnen worden aangenomen zonder dat ze instemmen met deze clausules.”
Cho zegt dat hij zelf geen toename van dit soort clausules heeft gezien, maar “ik heb van mijn collega’s gehoord dat ze steeds vaker voorkomen.”
Als antwoord hierop heeft NAVA een advies uitgebracht voor acteurs die dergelijk taalgebruik in hun contracten tegenkomen, zoals bijvoorbeeld het aangeven van contracten bij vakbondsafgevaardigden.
Friedlander zegt dat delen van de stemacteur-industrie ook door synthetische stemmen verloren zullen gaan. Hij heeft het dan vooral over “stemacteurs in de arbeidersklassen die naast hun werkweek van 40 uur ook een voice-over carrière proberen op te bouwen. Die banen zullen als eerste door synthetische stemmen worden overgenomen, wat schadelijk zal zijn voor een groot deel van de industrie.”
“Normaliter kunnen we weigeren om die zin te lezen, zodat die niet wordt gebruikt. Met deze technologie kun je dat soort dingen natuurlijk volledig omzeilen.”
ElevenLabs zegt op diens website dat het “meertalige audio-ondersteuning op aanvraag wil verwezenlijken in educatie, streaming, audioboeken, gaming, films en zelfs realtime conversaties,” en dat het middelen heeft die “de nodige kwaliteit verschaffen om nieuws, nieuwsbrieven, boeken en video’s een stem te geven.”
Mati Staniszewski, medeoprichter van ElevenLabs, vertelt Motherboard dat het bedrijf een toekomst voor zich ziet waarin AI-bedrijven en stemacteurs samen kunnen werken. “Stemacteurs zullen niet langer gelimiteerd worden door het aantal opnamesessies die ze kunnen bijwonen; ze kunnen juist hun stem licenseren om tegelijkertijd aan meerdere projecten te werken en daarmee extra omzet en royalties te verwerven. Dit potentieel werd al door stemacteurs zelf erkend, en enkele tientallen van hen hebben ons laten weten dat ze interesse hebben in dergelijke partnerschappen,” schrijft Staniszewski.
Als antwoord op het statement van ElevenLabs zegt Wolff: “acteurs willen helemaal niet kunnen licenseren of ‘extra omzetstromen kunnen verwerven’; met dat soort onzin-jargon laat ElevenLabs zien dat ze geen idee hebben hoe stemacteurs hun geld verdienen. We kunnen muzikanten wel vragen hoe het met hun omzet gaat sinds de licentieverlening van streamingplatforms de ‘extra omzet en royaltystromen’ voor muzikanten de das om heeft gedaan. ElevenLabs’ woordenstroom is ergens wel grappig, op een duistere manier.”
Toen Motherboard aan Stanszewski vroeg om een van die tientallen stemacteurs die het bedrijf hadden gecontacteerd eens te introduceren verwees hij ons naar Lance Blair, een stemacteur wiens portfolio advertenties en conferentievideo’s bevat. “Ondanks de terechte punten van zorg van mijn collega’s, waar ik me ook in kan vinden, omarm ik deze technologie zodat ik mezelf kan horen zoals anderen mij horen en zodat ik mijn teksten op verschillende manieren kan benaderen,” zegt Blair.
Blair zegt dat hij niet bij een vakbond zit. SAG-AFTRA, een acteursvakbond in de VS, laat aan Motherboard weten dat het recht om de stem van een acteur te simuleren een verplicht onderwerp van onderhandeling is voor vakbondsmedewerkers. “Elke clausule in het contract van een performer die rechten voor digitale simulatie of creatie probeert te bemachtigen is ongeldig en niet af te dwingen totdat de voorwaarden zijn besproken met de vakbond,” zei SAG-AFTRA in een statement.
Friedlander voegt toe dat “NAVA niet tegen synthetische stemmen of tegen AI is, maar pro-stemacteur. We willen zeker weten dat stemacteurs actief en gelijkwaardig betrokken worden bij de evolutie van onze industrie en dat ze hun zelfbeschikking of vermogen om eerlijk voor hun werk en talent te worden gecompenseerd, niet verliezen.”
Wat betreft Cho: “Ik ben er helemaal tegen. Als je een stem synthetiseert haal je de ziel en spontaniteit uit een echte performance. Ik kan alleen maar hopen dat synthetische stemmen gewoon helemaal verdwijnen, maar acteurs zouden op z’n minst de optie moeten krijgen om niet in te stemmen met het gebruik ervan.”
Dit artikel verscheen oorspronkelijk op Motherboard.
Volg VICE België en VICE Nederland ook op Instagram.