Tutti i dati digitali che stiamo creando — 44 milioni di bilioni di gigabyte entro il 2020 — dovranno finire da qualche parte. Secondo molti ricercatori, nel prossimo futuro questo “dove” corrisponderà ai filamenti di DNA, che possono immagazzinare migliaia di gigabyte in più del migliore iPhone sul mercato. Milioni di anni di evoluzione, infatti, hanno perfezionato questa forma di deposito biologico di informazioni.
Gli scienziati dibattono sull’utilizzo del DNA come storage dati ormai da anni, ma finora le applicazioni sono state limitate dagli elevati costi di implementazione e dagli errori nei dati. Qualche giorno fa, in uno studio pubblicato su Science, dei ricercatori hanno annunciato di essere riusciti a ottenere un processo di immagazzinamento 100 percento privo di errori e il 60 percento più efficiente rispetto ai risultati precedenti — Avvicinandosi così ai limiti di prestazioni teoretici per il DNA storage.
Videos by VICE
Ciononostante, ci sono ancora un paio di questioni da risolvere prima di far diventare queste pratica la normalità. Per esempio, il processo richiede parecchio tempo ed è piuttosto costoso.
Questo nuovo metodo funziona come un semplice Sudoku, in pratica sfrutta degli aiutini per evitare che qualunque frammento di dati perso possa rovinare l’insieme. “Anche se non riesci a trovare tutti i numeri, puoi comunque risolvere il Sudoku,” mi ha spiegato al telefono Yaniv Erlic, co-autore del paper e professione di informatica alla Columbia University.
Secondo lo studio, svolto in collaborazione con Dina Zielinski del New York Genome Center, questo metodo è decisamente più efficiente dei precedenti e permette di immagazzinare più dati nei filamenti di DNA — stiamo parlando di 215.000.000 gigabyte in un grammo di DNA. Paragonate queste specifiche agli 8.5 gigabyte dei DVD o ai 256 del migliore iPhone.
In uno studio svolto nel 2013, un altro team di ricercatori era riuscito a inserire 2.000.000 gigabyte di dati in un grammo di DNA.
Gli scienziati stanno cercando un modo per immagazzinare dati nel DNA per diversi motivi: si possono ficcare un sacco di informazioni in molecole veramente piccole, non diventerà mai obsoleto (a differenza dei CD o delle cassette) e può durare per decine di migliaia di anni.
L’alfabeto di quattro lettere su basi azotate del DNA (A, C, G e T) può essere trasformato in codice binario — Per esempio, 00 è A, 01 è C, 10 è G e 11 è T.
L’avanzamento cruciale in questo studio corrisponde all’utilizzo del ‘DNA fountain’, o codici a fontana — Un aspetto di teoria di programmazione che ti permette di trasformare interi file in frammenti codificati, o ‘goccioline’ — per immagazzinare i file, una tecnica che secondo Erlich permette di evitare la corruzione degli stessi. Se hai una fontana di dati codificati e recuperi abbastanza goccioline, puoi rimettere insieme l’intero file.
“Si può pensare ad ogni oligonucleotide del DNA come ad un indizio,” ha spiegato Erlich. Un oligo è una breve molecola di DNA.” Anche se non tutti gli oligo di DNA riusciranno a sopravvivere senza perdere dati o risultare ancora leggibili, puoi comunque risolvere il puzzle.
Finora, una delle tecniche più popolari per scrivere dati nel DNA (sfruttata in uno studio del 2013, per esempio) era la tecnica della ripetizione, ha spiegato. Se stavi codificando, per esempio, il testo dei ‘She Loves You’ dei Beatles, le sequenze sarebbero state “she loves”, “loves you”, “you yeah”, “yeah yeah”.
“Sfruttava una strategia di ripetizione cosicché, se un oligo fosse stato perso, avevi comunque ancora a disposizione l’altro oligo,” ha spiegato Erlich. Se perdevi il frammento “loves you”, avevi ancora quello di “she loves” e quello di “you yeah” per ricostruire il testo. “Se non conservi efficientemente le informazioni nel file, però, ci sono buone probabilità che tu perda tutti e quattro gli oligo nella sequenza.”
Per provare il loro metodo, Erlich e Zielinsky hanno codificato sei file nel DNA: l’intero sistema operativo di un computer, un virus, il film del 1895. “L’arrivo di un treno alla stazione di La Ciotat,” una carta regalo di Amazon, una placca dei Pioneer, e uno studio sulla teoria dell’informazione. Hanno copiato e diluito i loro file diverse volte, e hanno anche dato il manoscritto a uno dei follower su Twitter di Erlich: se avesse saputo scaricare e decodificare i file, gli hanno detto, la carta regalo da 50 dollari sarebbe stata sua. Ha comprato un libro con quei soldi.
A parte il tempo richiesto per codificare e immagazzinare i file, per scaricare e decodificare file così grossi serve parecchio tempo — Sono necessarie 24 ore solo per decodificare 2 megabyte di dati. Inoltre, ci sono dei limiti finanziari piuttosto evidenti in questo campo.
Erlich ha stimato che la codifica e la decodifica di 2 megabyte è costata lora 7.000 dollari. “Abbiamo migliorato l’efficienza della procedura del 60 per cento,” ha detto. “È comunque ancora parecchio costoso.” Con il tempo questo aspetto dovrebbe migliorare, però.