Este novo programa da Adobe pode imitar a voz de qualquer pessoa
O Photoshop das vozes chegou. Crédito: Adobe Creative Cloud/ YouTube

FYI.

This story is over 5 years old.

Tecnologia

Este novo programa da Adobe pode imitar a voz de qualquer pessoa

O Photoshop das vozes chegou.

Você já quis fazer com que a Natalie Portman gritasse impropérios para seus vizinhos? Ou, quem sabe, pedir para que Fábio Junior gravasse uma mensagem de aniversário sexy para sua mãe? Sempre quis imitar a voz do seu irmão ou ligar para alguém declarando amor? A Adobe tem a solução.

Quando a Adobe lançou o Photoshop, em 1990, a empresa sonhava com um mundo no qual estúdios de cinema e editores de fotografia pudessem fazer em minutos o que antes demorava horas. No entanto, seus criadores nunca imaginaram que o editor de imagens seria usado para colocar cabeças de celebridades em corpos de estrelas pornôs, mutilar pedaços das mulheres que ilustram as capas de revistas ou criar memes horríveis.

Publicidade

Agora a empresa quer fazer para a voz humana o que ela já fez para sua imagem: oferecer a possibilidade de manipulá-la livremente. Durante a última Adobe Max Creativity Conference a empresa lançou o VoCo, um programa de edição de áudio que permite que os usuários façam com que outras pessoas digam o que eles bem quiserem.

De acordo com a empresa, após 20 minutos de amostras de áudio, os usuários podem fazer com que determinada voz diga o que eles quiserem. Para demonstrar a capacidade do programa, Zeyu Jin, funcionário da Adobe, editou uma entrevista dada por Jordan Peele, o comediante que apresentou o evento, e por seu parceiro, o também comediante Keegan-Michael Key. Usando amostras de áudio da voz de Key, Jin fez com que ele afirmasse ter beijado Peele em vez de sua esposa.

No áudio original, Key narra sua empolgação com uma indicação a um prêmio. "Pulei na minha cama", diz Key. "E depois eu, hm, beijei meu cachorro e minha mulher… nessa ordem". Como pode-se ver no vídeo acima, uma forma de onda e uma pequena caixa com a transcrição da frase aparecem na tela acima de Jin.

Em seguida, Jin apaga trechos da frase e digita novas palavras; enquanto isso acontece, o gráfico muda, adequando-se ao novo áudio. Em poucos segundos, o técnico da Adobe faz com que Key diga ter beijado sua esposa antes de seu cachorro, em seguida afirmando ter beijado Jordan três vezes seguidas. Jin faz tudo isso com alguns toques no teclado — e o resultado é impecável.

"Não se preocupem", diz Jin. "Estamos comprometidos em evitar a falsificação. A ideia é criar uma espécie de marca d'água. Como nossos resultados estão cada vez melhores, o que faz com que as pessoas não consigam diferenciar entre um áudio real e um falso, estamos nos focando em tornar essas alterações detectáveis". Ao dizer isso, Jin dá um joinha para a platéia e sorri.

Jin diz também que a Adobe desenvolveu o software para ajudar podcasters e editores de audiobooks. Digitar um novo áudio em vez de regravá-lo seria uma ajuda e tanto para esses profissionais. Mas a Adobe sabe que seu programa pode ser usado para fins criminosos, como áudios falsificados. A preocupação não é infundada — afinal, a primeira coisa que a empresa fez com seu programa foi zoar o apresentador de sua própria conferência.

Tempos de ceticismo auditivo estão por vir.

Tradução: Ananda Pieratti