Tech by VICE

Está ficando fácil demais criar vídeos falsos de rostos humanos

Pesquisadores desenvolveram um algoritmo que precisa de apenas uma imagem para criar vídeos falsos.

por Samantha Cole; Traduzido por Marina Schnoor
27 Maio 2019, 1:18pm

Imagem via Samsung AI Center.

Pesquisadores do Samsung AI Center em Moscou desenvolveram um jeito de criar “retratos vivos” de uma base de dados muito pequena – com apenas uma fotografia em alguns dos modelos deles.

O estudo, “Few-Shot Adversarial Learning of Realistic Neural Talking Head Models”, foi publicado no servidor arXiv na segunda-feira.

Os pesquisadores chamam isso de aprendizado com poucas e uma imagem, onde o modelo pode ser treinado usando apenas uma imagem para criar um retrato animado convincente. Com algumas imagens a mais – de oito ou 32 fotografias – o realismo é ainda maior.

Como só precisam de uma fonte de imagem, os pesquisadores conseguiram animar retratos e pinturas famosas, com resultados perturbadores. Fyodor Dostoevsky – que morreu muito antes das câmeras de imagem em movimento estarem disponíveis comercialmente – se move e fala em preto e branco. A Mona Lisa mexe silenciosamente a boca e os olhos, com um sorriso sutil no rosto. Até o famoso bigode do Salvador Dali se move.

Esses “modelos de cabeças falantes fotorrealistas” são criados usando rede neural convolucional: eles treinam algoritmos numa grande base de dados para fazer vídeos de cabeças falantes com uma ampla variedade de aparências. Neste caso, eles usaram a base de dados disponível ao público VoxCeleb, contendo mais de 7 mil imagens de celebridades de vídeos do YouTube.

Isso treina o programa para identificar o que eles chamam de características “marcantes” de rostos: olhos, formato da boca, comprimento e forma da ponte nasal.

De certa maneira, esse é um salto até do que deepfakes e outros algoritmos usando redes antagônicas geradoras conseguem fazer. Em vez de ensinar o algoritmo a colar um rosto no outro usando um catálogo de expressões de uma pessoa, eles usam características faciais que são comuns em todos os humanos, para então animar um novo rosto.

Leia mais: Um guia para detectar e se proteger de deepfakes antes que a mentira vença

Os pesquisadores escreveram no artigo que reconhecem as aplicações para avatares de rostos realistas em conferências por vídeo, videogames e efeitos especiais – mas o uncanny valley geralmente nos impede de abraçar totalmente o uso generalizado de avatares de rosto para pessoas reais. Eles esperam que esse trabalho mude isso, com sua baixa exigência de fontes e realismo “perfeito”.

Siga a VICE Brasil no Facebook, Twitter, Instagram e YouTube.