FYI.

This story is over 5 years old.

Tecnologia

Questa IA produce immagini terrificanti in base a quello che scrivi

Un team di ricercatori ha addestrato un algoritmo a tradurre le tue parole in immagini e, ovviamente, il risultato è super inquietante.
Screenshot: Sarah Emerson

Adoro la tecnologia che prova a svolgere compiti con risultati disastrosi. Cosa dire dei robot che cascano giù dalle scale o degli algoritmi che compongono canzoni senza senso? Be' ci stanno provando con tutte le forze! Tanto di cappello per i loro sforzi.

Ed è proprio per questo che una nuova intelligenza artificiale nota come AttnGAN mi rende un essere umano estremamente felice. Si tratta di un algoritmo di apprendimento automatico che è stato addestrato a produrre immagini sulla base di input testuali. L'algoritmo, un Generative Adversarial Network (GAN), è stato presentato a gennaio dai ricercatori del Deep Learning Technology Center di Microsoft. Il loro lavoro è stato anche illustrato in un paper pubblicato su arXiv.org.

Pubblicità

AttnGAN dovrebbe visualizzare immagini in base ai testi che riceve in input, ma non riesce a farlo molto bene e, a volte, i suoi output sono inquietanti. A dire il vero, quando i ricercatori hanno addestrato l'IA su un insieme di dati specifico, come le immagini di uccelli, l'algoritmo ha prodotto rendering convincenti, ma una volta addestrato su un set di dati più ampio composto da immagini più diversificate, AttnGAN è stato sopraffatto dalla complessità del compito.

Screenshot: Sarah Emerson

Screenshot: Sarah Emerson

Screenshot: Sarah Emerson

Secondo il post dedicato all'IA pubblicato sul blog dei suoi creatori:

Il bot disegnatore di Microsoft è stato addestrato su un set di dati contenente immagini con abbinate delle didascalie che permettono ai modelli di imparare ad abbinare le parole alla rappresentazione visiva di tali parole. Il GAN, ad esempio, impara a creare l'immagine di un uccello quando una didascalia dell'immagine di un uccello riporta la parola ”uccello” e, allo stesso tempo, impara che aspetto dovrebbe avere l'immagine di un uccello.

L'intelligenza artificiale se la cava con richieste semplici come ”un gatto.” Ma ”la qualità delle sue risposte diminuisce con descrizioni di testo più complesse, come un uccello con corona verde, ali gialle e pancia rossa,” spiegano i ricercatori.

Screenshot: Sarah Emerson

Puoi provare a giocare con AttnGAN grazie a una demo creata da Cristóbal Valenzuela, tecnologo e ricercatore della New York University. La demo è parte di un progetto più ampio, Runway, pensato per usare le IA in modo creativo. Valenzuela sta lavorando anche a Marrow — un documentario web interattivo che esplora come l'intelligenza artificiale potrebbe rispecchiare il funzionamento delle nostre menti.

Pubblicità

”Il motivo per cui ci sto lavorando è perché credo che l'intelligenza artificiale abbia un potenziale creativo che non stiamo esplorando completamente,” mi ha raccontato Valenzuela su Twitter DM.

La demo è piuttosto sotto stress in questo momento, dato che in moltissimi stanno creando le proprie composizioni. Se volete vedere una serie di opere decisamente cubiste create da un'intelligenza artificiale, vi consiglio questo post del blog della ricercatrice Janelle Shane.

”Anche se alcune immagini prodotte risultano strane (se si scrive qualsiasi cosa abbia a che fare con gli esseri umani),” ha aggiunto Valenzuela, ”qualcuno ha provato a scrivere poesie, testi di canzoni o citazioni da libri e ha ottenuto risultati più stimolanti/poetici.”

Oltre ad essere un passatempo divertente, Valenzuela ritiene che l'intelligenza artificiale può rivelarsi anche uno strumento pratico. Ad esempio, ha segnalato, questo progetto sperimentale per la creazione di personaggi per la TV, i film e i cartoni animati.

Il motivo per cui gli esseri umani si divertono a giocare con AttnGAN e altre IA, è che ”hanno una capacità generativa che, in quanto esseri umani, ci piace osservare all'opera,” mi ha spiegato Valenzuela.

”Credo che abbia a che fare con il fascino di interagire con qualcosa che non è fatto di carne ma che in grado di comprendere il mondo e creare contenuti significativi (almeno per noi).”

Questo articolo è comparso originariamente su Motherboard US.