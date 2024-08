Se c’è una cosa di cui internet ha un disperato bisogno è un numero maggiore di immagini di gatti, così i ricercatori della Nvidia e della Cornell University hanno sviluppato un algoritmo che trasforma le immagini dei cani proprio in immagini di gatti.



Questa rete neurale — un’architettura di calcolo liberamente ispirata alle reti neurali del cervello umano — è stata sviluppata da alcuni degli stessi ricercatori che hanno sviluppato l’algoritmo che può trasformare i video ambientati d’inverno in video ambientati d’estate e sfrutta dei principi simili.



Come spiegato in un paper pubblicato su arXiv, la rete neurale in questione è una rete antagonista — generative adversarial network (GAN) — una classe di algoritmi per l’apprendimento automatico non supervisionati da esseri umani. Nelle GAN, due sistemi di reti neurali si sfidano l’uno con l’altro: una rete neurale genera delle nuove immagini cercando di portare l’altra a pensare che siano autentiche. Se la seconda rete identifica le immagini generate come false, la prima continua a modificare il proprio algoritmo fino a quando non riesce a produrre immagini praticamente indistinguibili da quelle autentiche.



In questo caso, le reti neurali vengono alimentate prima con delle immagini di cani. Una rete neurale prende l’immagine del cane, la scompone in codice descrivendo varie caratteristiche della foto e poi combinava queste caratteristiche con vari ”style code” derivati da feature prese dall’immagine di un gatto. Ogni iterazione di questo mashup di caratteristiche di cani e gatti viene tradotta in un’immagine ibrida, data in pasto a una rete neurale incaricata di determinare se è autentica.



Da sinistra a destra: l’immagine di input, l’immagine con le caratteristiche di stile e l’immagine di output.

I ricercatori hanno anche applicato la tecnica ad altri tipi di input con risultati simili. Sono riusciti a trasformare i gatti in cani, i gatti della giungla in gatti domestici e a trasformare di oggetti come scarpe e borse disegnati solo con una linea in prodotti dall’aspetto realistico.



Secondo i ricercatori, insegnare a una macchina come mappare immagini che in partenza sono gatti per trasformarle in cani e viceversa è stato particolarmente impegnativo perché ci sono un grande numero di feature diverse da prendere in considerazione. Non solo l’algoritmo deve tenere conto di fattori come la posizione della testa e il tipo di pelliccia, ma deve anche separare il contenuto significativo dell’immagine (cioè il volto dell’animale) da ciò che non è rilevante, come lo sfondo.

I ricercatori hanno scritto che vogliono applicare la tecnica a scenari più complicati, come testi e video. È un po’ come la versione del Ventunesimo Secolo del romanzo ”L’isola del dottor Moreau” di H.G. Wells incentrato su uno scienziato pazzo che crea degli inquietanti ibridi animale-umano — ma senza il bisogno di un laboratorio segreto su un’isola. Infatti, l’algoritmo e i dati presi come esempio sono disponibili gratuitamente online.



Fino a qualche tempo fa, le fotografie e i video erano il punto di riferimento per la nostra rappresentazione della realtà. Eppure, mentre le macchine imparano a modificare le immagini per creare le proprie versioni della realtà e questi strumenti diventano ampiamente disponibili, sarà sempre più difficile distinguere ciò che è reale da ciò che non lo è, nel bene e nel male.



Questo articolo è apparso originariamente su Motherboard US.

