Pubblicità
Motherboard

Questa intelligenza artificiale è stata creata a partire dal DNA

Questi ricercatori hanno creato una rete neurale in grado di riconoscere dei numeri scritti a mano, e tutto a partire dal DNA.

di Daniel Oberhaus
10 luglio 2018, 10:16am

Una rappresentazione artistica di ciò che stava succedendo nelle provette di Caltech. Immagine: Shutterstock

Lo scorso mercoledì, dei ricercatori della Caltech hanno annunciato di aver creato una rete neurale artificiale a partire da del DNA sintetico, e che la rete è in grado di riconoscere dei numeri codificati in delle molecole. Si tratta di una nuova implementazione di un classico test del machine learning che dimostra come i mattoni della vita siano assimilabili da parte di un computer.

Si tratta di una novità piuttosto stupefacente, ma che cosa significa? Per iniziare, "intelligenza artificiale" qui non significa l'AI super-umana che piace tanto a Hollywood. Invece, si riferisce al machine learning, una forma più specifica di intelligenza artificiale che può essere riassunta nel modo migliore come l'arte e la scienza del pattern recognition. La maggior parte delle novità più all'avanguardia nel machine learning coinvolgono le reti neurali, un tipo di architettura informatica che si basa pressapoco sul cervello umano. Queste rete neurali vengono addestrate con un sacco di dati di input e dopodiché viene insegnato loro a compiere determinati compiti con qui dati; a volte gli umani aiutano l'apprendimento dell'algoritmo, altre volte no.

Questo è ciò che i ricercatori della Caltech hanno progettato, ma invece di usare il silicio e i transistor, hanno usato il DNA e delle provette come hardware della loro neurale.

Tutto il DNA è composto da quattro nucleotidi base: adenina (A), citosina (C), guanina (G) e timina (T). I filamenti di questi nucleotidi possono unirsi ad altri filamenti di questi nucleotidi per formare la doppia elica del DNA, ma possono legarsi soltanto in combinazioni specifiche (per esempio, A-T o C-G). Questo pattern prevedibile di combinazioni rende i filamenti di nucleotidi i candidati ideali per creare dei dispositivi informatici che possono essere progettati di modo da produrre reazioni chimiche specifiche alla presenza di determinate molecole.

I ricercatori della Caltech hanno applicato a questa specie di computer basato sul DNA uno dei classici test nella ricerca in ambito computer vision e hanno insegnato a un algoritmo come riconoscere dei numeri scritti a mano. Si tratta di un compito piuttosto complesso per un computer perché tutti gli umani scrivono il numero 4 in maniera leggermente diversa, ma le macchine non possiedono questo tipo di lusso biologico. Addestrando una rete neurale artificiale un sacco di esempi di numero 4 scritti da umani, l'algoritmo più "imparare" a generalizzare le qualità di un esempio singolo e può riuscire ad avere un'idea astratta dell'aspetto di un numero 4 scritto.

Nel 2011, il bioingegnere di Caltech Lulu Qian ha creato la prima rete neurale artificiale sulla base del DNA, ma poteva riconoscere soltanto una manciata di pattern. Nel lavoro rivelato la scorsa settimana, uno dei laureandi di Qian, Kevin Cherry, ha reso possibile un avanzamento rilevante della tecnica applicando al riconoscimento della scrittura dei "numeri molecolari." Ogni numero molecolare è basato su un numero scritto a mano e tradotto in un pattern da 20-bit all'interno di una griglia da 100 bit (10x10). Ognuno dei bit sulla griglia rappresentava una molecola del DNA, e queste molecole di DNA venivano posizionate su una griglia 10x10 concettuale prima di venire mischiate all'interno di una provetta.

Il DNA nella provetta non assomiglia ad una griglia — è tutto mischiato —, per questo il posizionamento di una molecola sulla griglia è determinato dalla concentrazione di ogni molecola nella griglia. La rete neurale di DNA era un filamento di DNA che produceva una specifica reazione quando veniva aggiunto alla provetta soltanto se le 20 molecole di DNA assegnate che rappresentavano un certo numero era sistemate (con i giusti livelli di concentrazione) così da formare il numero quando venivano riportate nella griglia 10x10.

Esempi di 6 e 7 scritti a mano e piazzati su una griglia 10x10. Ogni quadrato della griglia è rappresentato da una molecole ad una certa concentrazione. Immagine: Nature

Cherry ha iniziato a sperimentare creando una rete neurale in grado di distinguere i numeri 6 e 7 scritti a mano tradotti in strutture molecolari. Ha testato questo approccio su 36 diverse versioni degli stessi numeri scritti a mano e in ogni caso la rete neurale è riuscita a riconoscerli. Cherry ha usato un approccio ”chi vince prende tutto” per permettere alle reti neurali di distinguere tra i numeri sintetizzando una cosiddetta molecola ”annientatore.”

”L'annientatore forma una struttura o prendendo una molecola da un concorrente e una molecola da un altro concorrente e reagisce formando delle specie inerti e non reattive,” ha spiegato Cherry. ”L'annientatore si mangia rapidamente tutte le molecole del concorrente fino a quando non rimane una sola specie concorrente. Il concorrente vincitore viene quindi riportato a una concentrazione alta e produce un segnale fluorescente che indica la decisione della rete.”

È importante sottolineare come questo approccio ”chi vince prende tutto” consenta anche alla rete neurale del DNA di differenziare tra i numeri 1-9 in un brodo di DNA. Dopo aver subito le sue reazioni, la provetta mostra due segnali fluorescenti, che indichano quale numero è rappresentato nella provetta. Ad esempio, la fluorescenza verde e gialla rappresentavano un cinque e quella verde o rossa un nove.

Guardando al futuro, Cherry e Qian sperano che questa tecnica possa essere potenziata con l'aggiunta di funzioni di memoria alle loro reti neurali basate sul DNA per consentire dei test medici più efficaci.

”La diagnostica medica comune rileva la presenza di alcune biomolecole, ad esempio il colesterolo o la glicemia,” ha concluso Cherry, ”Utilizzando circuiti biomolecolari più sofisticati come il nostro, un giorno, i test diagnostici potrebbero includere centinaia di biomolecole, con l'analisi e la risposta condotte direttamente in ambiente molecolare.”

Questo articolo è apparso originariamente su Motherboard US.