Esta IA cria imagens horríveis com base em suas palavras

Oba, pesquisadores treinaram um algoritmo para transformar suas frases em ilustrações. (Pena que ficam uma merda.)
27 August 2018, 7:37pm
Captura de tela: Sarah Emerson

Eu amo aquele tipo de tecnologia que é muito ruim em fazer as coisas. Robôs caindo das escadas? Algoritmos compondo músicas de karaokê transtornadas? Ao menos eles estão tentando! Nota 10 pelo esforço, caras.

Agora, uma nova IA chamada AttnGAN me deixou muitíssimo feliz. Trata-se de um algoritmo de aprendizado automático treinado para produzir imagens com base na digitação de texto. O algoritmo, do tipo Rede Generativa Antagônica (GAN, na sigla em inglês), foi publicada em janeiro por pesquisadores do centro de Tecnologia em Deep Learning da Microsoft. Seu trabalho também foi detalhado em um artigo publicado na arXiv.org.

O AttnGAN supostamente deveria visualizar as frases dos textos, contudo, ele não é muito bom nisso - às vezes, é simplesmente terrível. Para ser franca, quando os pesquisadores treinaram a IA em um conjunto de dados específicos, como imagens de pássaros, ela foi capaz de produzir imagens bastante convincentes de pássaros. Contudo, quando treinado em um conjunto de dados maior e com imagens mais diversificadas, a AttnGAN se tornou artisticamente sobrecarregada.

Captura de tela: Sarah Emerson

Captura de tela: Sarah Emerson

Captura de tela: Sarah Emerson

De acordo com uma publicação no blog da empresa:

O bot de desenho da Microsoft foi treinado com conjuntos de dados que continham imagens e frases pareados, o que permitia aos modelos aprender a associar palavras à sua representação visual. A GAN, por exemplo, aprende a criar uma imagem de um pássaro quando a frase diz “pássaro” e, de outro modo, aprende o modo como uma imagem de um pássaro deve ser.

A IA lida bem com frases simples como “um gato”. Contudo, “a qualidade fica comprometida com descrições de texto mais complexas como ‘um pássaro com um topete verde, asas amarelas e barriga vermelha’”, os pesquisadores observaram.

Captura de tela: Sarah Emerson

Você pode brincar com o AttGAN graças a uma versão demo criada por Cristóbal Valenzuela, tecnólogo e pesquisador residente na Universidade de Nova York, nos EUA. Ela faz parte de um projeto maior, o Runway, que permite que a IA seja utilizada de modo criativo. Valenzuela também trabalha no Marrow - um webdocumentário interativo que explora o modo como a IA pode se assemelhar à nossa mente.

“O motivo por que estou criando isso é porque acredito que a IA tem um potencial criativo que não está sendo explorado”, Valenzuela me contou por meio de mensagem de Twitter.

A versão demo está um tanto congestionada no momento, pois tem muita gente criando suas composições. Se você quiser ver algumas obras Cubistas genuínas de inteligência artificial, recomendo o post do blog de Janelle Shane, pesquisadora e cientista de óptica.

“Além de algumas imagens esquisitas (se você digitar qualquer coisa que tenha a ver com os humanos)”, Valenzuela afirma, “algumas pessoas estiveram digitando poesia, letras de músicas, trechos de livros e recebendo resultados bastante inspiradores e poéticos.”

Valenzuela acredita que, além de ser uma diversão, a IA também pode ser uma ferramenta prática. Ele acrescentou um projeto experimental para a criação de personagens sintéticos para programas de TV, filmes e animações.

Agora, por que os humanos gostam tanto de brincar com o AttnGAN e outros tipos de IA? “Tem a ver com a capacidade criadora que nós, humanos, gostamos tanto de assistir”, Valenzuela me contou.

“Acho que tem a ver também com a fascinação em ter algo que não é feito de carne e osso capaz de compreender o mundo e criar conteúdo significativo (ao menos, para nós).”

Leia mais matérias de ciência e tecnologia no canal

MOTHERBOARD

.

Siga o Motherboard Brasil no Facebook e no Twitter .

Siga a VICE Brasil no Facebook , Twitter , Instagram e YouTube .