DeepMind ha inventato un computer che impara a usare la propria memoria

Be', wow.

|
18 ottobre 2016, 10:56am

Immagine: Flickr/Andy Blackledge

DeepMind, la branca di sviluppo di intelligenze artificiali di Alphabet, ha pubblicato il suo terzo paper di ricerca questo mercoledì su Nature, ed è piuttosto astruso: il team ha inventato un nuovo tipo di IA che impara effettivamente a usare la sua memoria. L'hanno chiamato "Differential Neural Computer," per gli amici DNC.

Ma cosa si intende quando si parla di un computer che "impara" a usare i propri slot di memoria, e perché ci dovrebbe importare? Be', in primis, potrebbe aiutare le IA a diventare più potenti e utili che mai—per esempio, grazie a questa nuova abilità potrebbero guidarci in un percorso particolarmente complicato all'interno di una nuova città.

La prima cosa da sapere è che il deep learning, una forma molta avanzata di machine learning, è composto di "reti neurali"—una rete interconnessa di nodi che operano computazioni semi-randomiche sulla base di determinati input. Le reti neurali ripetono questa operazione all'infinito, riorganizzandosi di volta in volta, finché non diventano capaci di produrre un risultato affidabile. Questa fase è definita addestramento.

Per ora questo approccio ha prodotto dei successi incredibili. Il deep learning è la tecnica che ha permesso al computer AlphaGo di DeepMind di battere il campione del mondo di Go Lee Sedol al suo gioco preferito.

L'altra faccia della medaglia, però, è che le reti neurali non possono imparare a svolgere un secondo compito senza dimenticare prima come svolgere quelli appresi in precedenza. Questo imprevisto è definito "catastrophic forgetting". Il computer che stai usando per leggere questo articolo non soffre di questo problema, perché possieda una memoria esterna su cui puoi scrivere, riscrivere e a cui può fare riferimento.

Il DNC di DeepMind risolve questo problema. Hanno fornito a una rete neurale un'unità di memoria esterna, e ha insegnato a sé stessa a utilizzarla attraverso lo stesso processo sbaglia-e-riprova che sfrutta per apprendere qualunque altro compito. Il team di DeepMind l'ha spiegato così in un post sul loro blog:

"Quando DNC produce una risposta, compariamo questa risposta alla risposta corretta desiderata," spiega il post. "Col tempo, il controller impara a produrre risposte che sono sempre più vicine alla risposta corretta. E durante questo processo, impara ad usare la sua memoria."

I risultati sono impressionanti. Dopo aver fornito a DNC l'intera rete della metropolitana di Londra, il computer è stato capace di rispondere a una serie di domande complesse che richiedevano un briciolo di ciò che noi definiamo come ragionamenti deduttivi.

Per esempio, ecco una domanda a cui DNC ha risposta: "Partendo da Bond street, e prendendo la Central line in una direzione per una fermata, poi la Circle line in una direzione per quattro fermate e poi la Jubilee line in una direzione per due fermate, a quale fermata ti troverai?"

Prova a chiedere qualcosa di così complicato a Siri. Ci sono ottime probabilità che finirà per dirti per quando è prevista l'uscita del prossimo James Bond.

La ciliegina sulla torta di questo tipo di operazioni di problem-solving così potente, ha spiegato il team di DeepMind, è che i DNC possono immagazzinare i dati e le tecniche che apprendono per poi richiamarle quando necessarie.

Come qualunque cosa riguardi l'AI, siamo agli inizi: si tratta di un primo passo verso una gamma di macchine davvero utile nella nostra vita quotidiana. Un primo ma enorme passo.