covid-sicilia-dati-f8_05
Immagine: screenshot di una delle tabelle dati pubblicata sulla piattaforma f8. Composizione grafica: Motherboard

Il programmatore siciliano che sta liberando i dati comunali del Covid-19

La piattaforma sviluppata per aiutare il padre nella gestione della pandemia permette di fare ciò che tutta Italia chiede da mesi al governo.
Riccardo Coluccini
Macerata, IT
15.4.21

Il Covid-19 è stata anche la pandemia dei dati. Le tabelle, gli indici Rt e le curve esponenziali ci hanno accompagnato in questi mesi dettando il ritmo delle nostre vite, imponendo chiusure e cambi di colore alle nostre regioni. Prima che i risultati dei tamponi inviati dai laboratori si trasformino in quei grafici, però, ci sono passaggi che rimangono ancora molto oscuri e, soprattutto, persone nelle aziende sanitarie che devono cercare di mettere insieme e comprendere tutti quei dati. 

Pubblicità

In Sicilia, in un distretto dell’Azienda Sanitaria Provinciale (ASP) di Palermo, quella che era nata come una piattaforma per aiutare la raccolta, l’analisi dei casi di COVID-19 e la loro comunicazione ai comuni si è trasformata ora in uno strumento per pubblicare finalmente anche i dati relativi ai contagi nei comuni. Una richiesta che da mesi è portata avanti anche dalla campagna #DatiBeneComune lanciata a novembre 2020 e da comunità locali come Open Data Sicilia.

“Ho voluto regalare a mio padre, e alla ASP, un sistema di database per il tracciamento dei pazienti, in modo tale che possano avere un'unica piattaforma che possa anche calcolare statistiche, tracciare focolai e tener conto di tutti i pazienti,” ha spiegato a Motherboard Italia in una chiamata telefonica Gabriele Scalici, sviluppatore della piattaforma f8.

Tutto è iniziato a ottobre 2020 quando Scalici si è reso conto che il padre, dirigente sanitario della ASP di Bagheria, era sopraffatto dalla gestione dei dati della pandemia. I dati sui singoli pazienti arrivavano dai laboratori in formato PDF via email e venivano poi caricati su file Excel e Word per tenere traccia dei positivi e dell’andamento della pandemia nei cinque comuni che rientrano nel Distretto di competenza. 

Pubblicità

“Non era stato fornito un framework su cui appoggiarsi per la gestione dei dati e per il calcolo statistico dei pazienti positivi al COVID,” ha aggiunto Scalici. 

IMAGE1_f8-screen01.png

Dashboard generale con i dati relativi ai 5 comuni della piattaforma f8. Screenshot dell'autore

Conosciamo già errori dovuti ai software utilizzati nella gestione dei dati: per colpa di un formato Excel obsoleto, in Regno Unito circa 16000 casi erano scomparsi dal conteggio complessivo. Errori nella formattazione dei dati si sono presentati anche in Spagna, dove ad esempio i decessi di persone sopra ai 100 anni finivano con l’essere conteggiati come bambini di 1-3 anni in una tabella pubblicata dalla rivista scientifica The Lancet—facendo schizzare in alto l’indice di mortalità dei bambini spagnoli.

In questi mesi il bollettino giornaliero dei contagi ha scandito le nostre giornate. A poco a poco ne abbiamo imparato anche i limiti, come il fatto che di lunedì i dati sembrano indicare dei miglioramenti solo perché di mezzo c’è il weekend e quindi si effettuano e processano meno tamponi, o il fatto che alcuni dati possono non essere una fotografia in tempo reale della situazione perché frutto di ritardi nelle comunicazioni tra ospedali e chi deve registrare i dati.

Abbiamo anche scoperto che quegli stessi dati possono essere sbagliati, come nel caso della regione Lombardia, e quindi portare a decisioni scorrette; o persino essere manipolati volutamente, come sembra essere avvenuto nel caso della regione Sicilia che, secondo un’indagine della Procura di Trapani, avrebbe distribuito il numero di decessi e di casi su diversi giorni per evitare la zona rossa.

Questi problemi potrebbero emergere più facilmente se i dati fossero pubblici anche a livello provinciale e comunale, e pubblicati online in formato facilmente accessibile e non come PDF da cui doverli copiare a mano.

Pubblicità

Le richieste di liberare i dati hanno portato la campagna DatiBeneComune a raccogliere circa 50.000 firme e finire al centro di alcuni interventi in Parlamento. Nel frattempo Scalici ha già iniziato a fare una parte di quello che si chiede al governo da tempo: pubblicare dati sui comuni

I dati sono derivati direttamente dalla piattaforma f8 sviluppata per il Distretto di Bagheria e cercano di rispettare la struttura suggerita dal Dipartimento della Protezione Civile che da marzo 2020 pubblica i dati sulle regioni e quelli relativi al solo numero dei casi totali delle province.

I dati dei comuni del Distretto 39 includono numeri riguardo il totale delle persone ospedalizzate, quelle in isolamento domiciliare, dati sui decessi, sulle persone dimesse guarite, sui tamponi molecolari effettuati, e chiaramente i dati sui positivi. 

I numeri della pandemia hanno diversi significati e valore in base a chi li legge. Per noi cittadini servono come un bastone in mezzo al mare a cui aggrapparsi mentre andiamo alla deriva nella pandemia; per i sindaci sono fondamentali per capire lo stato di salute della propria città e organizzare gli aiuti; per l’Istituto Superiore di Sanità (ISS), per le regioni e per il Governo servono per decidere quali misure adottare nel valzer dei colori che ci ha accompagnato negli ultimi mesi. 

Ma c’è anche un terzo punto di vista: chi quei dati li raccoglie e li deve mettere insieme. Chi aspetta ogni giorno il referto dei laboratori per far sì che poi ci sia il conteggio ufficiale da comunicare ai singoli comuni. Operatori sanitari che si devono muovere tra PEC, sistemi informativi, fogli excel e file PDF.

Nel caso della piattaforma f8, i risultati dei tamponi molecolari inviati dai laboratori vengono prima raccolti in un documento poi inseriti automaticamente in un database e infine resi accessibili e analizzabili agli operatori del Distretto sanitario. La piattaforma usa il software open-source Backpack for Laravel. Da lì poi i dati vengono inviati ai singoli comuni, che in alcuni casi pubblicano proprio lo screenshot della piattaforma sul proprio sito o sulle pagine di Facebook.

Pubblicità

Inizialmente la piattaforma era molto semplice, consentiva di trovare i pazienti tramite il loro nome o indirizzo ma “con il passare del tempo e in collaborazione con mio padre il software si è evoluto: è in grado di individuare i focolai attivi (raggruppando per indirizzo), tracciare tutte le date ed esiti dei tamponi, calcolare semplici statistiche come l'incidenza giornaliera e la prevalenza,” ha spiegato a Motherboard Scalici. Ora parte di quei dati si possono anche vedere pubblicamente grazie a una versione ridotta della piattaforma f8, chiamata f8lite, che pubblica online i dati complessivi giornalieri.

IMAGE2 f8lite dashboard bagheria.png

Andamento dei contagi nel comune di Bagheria. Screenshot dell'autore

L’idea che i dati, da soli, siano sufficienti per prendere decisioni informate è un’illusione pericolosa. Non tutti i dati sono equivalenti: il modo in cui sono prodotti, raccolti, trasferiti e comunicati tra i diversi organi—laboratori per i tamponi, assessorati alla sanità regionali, medici dei dipartimenti di prevenzione delle aziende ospedaliere, sindaci, Ministero della Salute, Istituto Superiore della Sanità—è cruciale. 

Proprio per questo, lo scorso 31 marzo la comunità di Open Data Sicilia ha chiesto che sia reso noto l’intero processo di pubblicazione dei dati sanitari COVID-19. “I dati da soli non sono abbastanza: i flussi operativi per la loro produzione e pubblicazione sono altrettanto importanti,” si legge nel loro comunicato, “è un passo propedeutico per la trasparenza dell'azione amministrativa della Regione Siciliana, in assenza del quale, ogni numero reso pubblico non può essere attendibile.”

Cercare di capire il percorso dei risultati dei tamponi una volta che vengono inviati dai laboratori non è facile, anche perché ogni regione ha adottato modalità diverse. 

In Emilia-Romagna, un laboratorio abilitato all’esecuzione dei tamponi molecolari ha spiegato a Motherboard Italia che i dati vengono inviati in formato PDF con tutti i casi e i conteggi complessivi. Dovrebbe essere attivo anche un sistema digitale per comunicare i dati. L’AUSL di Bologna pubblica un report settimanale con i numeri dei contagi nei comuni.

Pubblicità

In Toscana, un’altro laboratorio ha spiegato che i dati vengono inviati tramite il Sistema Informativo di Laboratorio (LIS) e scambiati direttamente con le ASL. In Toscana infatti è attiva una piattaforma dedicata per la raccolta, gestione e comunicazione dei dati e per la comunicazione tra i diversi soggetti che si occupano dell’epidemia. 

In Abruzzo, un laboratorio contattato da Motherboard Italia ha spiegato che i risultati dei tamponi vengono caricati manualmente sulla piattaforma regionale abruzzese, collegata con le ASL abruzzesi e le altre istituzioni. Per gli altri casi, i referti in PDF vengono inviati via email agli indirizzi delle ASL preposte. In Umbria, un laboratorio invia il PDF in un file zip al Servizio Igiene e Sanità Pubblica (ISP)—con dati relativi solo ai casi positivi—e carica i risultati (tutti sia positivi che negativi) sul portale regionale.

 In Puglia, i risultati delle analisi dei tamponi vengono inviati direttamente dal laboratorio alla piattaforma regionale Giava Covid-19 Puglia, a quel punto sia i dipartimenti di prevenzione delle ASL che chi ha eseguito il tampone può visualizzare i risultati.

Anche nel caso della regione Sicilia è stata sviluppata una piattaforma “per la raccolta centralizzata ed informatizzata dei dati relativi ai tamponi molecolari.” L’addetta stampa del commissario Covid nella città metropolitana di Palermo ha dichiarato a Motherboard Italia che “tutti i tamponi molecolari sono caricati all’interno del sistema Qualità Sicilia. Tutti i tamponi ed esiti sono a disposizione degli operatori che hanno eseguito il tampone. E vedono in base ai tempi di caricamento dei laboratori, l’esito del tampone effettuato.” E ha confermato che le ASP “hanno accesso ai dati da Qualità Sicilia e li inviano ai Comuni.”  Inoltre, “i laboratori seguono direttiva regionale che obbliga gli stessi al caricamento in autonomia sulla piattaforma Qualità Sicilia, per poi inviare i referti dei singoli pazienti alle ASP.”

Motherboard Italia ha chiesto chiarimenti anche alla Regione Sicilia. Al momento della pubblicazione di questo articolo non abbiamo ancora ricevuto risposta. Domande inviate ad alcuni laboratori siciliani per capire come funziona l’invio dei risultati dei tamponi non hanno trovato risposta.

La piattaforma f8 è stata importante “per la trasparenza attraverso la quale alcuni Comuni hanno cominciato a comunicare i dati alla popolazione, per la semplicità di utilizzo, e per la gestione degli indirizzi nell'organizzazione dei rifiuti speciali da parte dei Sindaci,” ha sottolineato Scalici.

Partendo dal bisogno di alleviare il carico di lavoro del padre e migliorare la comunicazione dei dati, questo sviluppatore informatico è riuscito a dimostrare che i dati che tutti stanno cercando esistono, ma sono bloccati da qualche parte in un flusso di comunicazioni tra laboratori, Aziende sanitarie e Regioni, probabilmente intrappolati in qualche PDF o tabella o, nei casi più virtuosi, protetti da una piattaforma da cui sarebbe facilissimo estrarli e renderli pubblici. 

Anche altri comuni siciliani hanno iniziato a rendere scaricabili i dati e condividerli apertamente—grazie anche all’attività di uno studente liceale. Inoltre ci sono piattaforme come CovidLeaks, promossa dall'Associazione Luca Coscioni insieme a "Soccorso civile", per incentivare chiunque abbia informazioni ad inviare i dati sulla pandemia. La caccia ai dati comunali, infine, è aperta.