Le compagnie che ti tracciano quando cerchi dei sintomi online
​Tim Libert, data viz.

FYI.

This story is over 5 years old.

Tecnologia

Le compagnie che ti tracciano quando cerchi dei sintomi online

La stragrande maggioranza dei siti che trattano di salute vendono le informazioni a terzi.

Siamo nel 2015—quando stiamo male, abbiamo paura di essere malati o abbiamo domande sul nostro stato di salute, per prima cosa facciamo una ricerca su Internet. Secondo quando sostenuto dal Pew Internet Project, negli USA il 72 percento degli utenti della rete cerca informazioni relative al proprio stato di salute online. Ma un sorprendente numero delle pagine che visitiamo per saperne di più sulla nostra salute tengono traccia delle nostre ricerche, mandano le informazioni a terzi, addirittura mandando le informazioni direttamente ai broker che monitorano i nostri crediti. Tutto ciò è finalizzato al profitto, per una "esperienza dell'utente migliore" e perchè gli sviluppatori si sono affidati a plugin "gratis" e strumenti forniti da compagnie che assorbono informazioni.

Pubblicità

Nell'aprile 2014 Tim Libert, un ricercatore presso la University of Pennsylvania, ha elaborato un software chiamato webXray per analizzare i primi 50 risultati di ricerche riguardo circa 2.000 delle malattie più comuni (per un totale di oltre 80.000). I risultati sono allarmanti: un 91 percento delle pagine hanno ottenuto third party request verso compagnie esterne. Questo significa che quando cercate "cold sores" (raffreddore), ad esempio, e cliccate sul quotatissimo "Cold Sores Topic Overview WebMD", il sito passa la vostra richiesta di informazioni sul malessere a un'altra o più (e spesso molte, molte altre) compagnie.

Secondo la ricerca di Libert, pubblicata su Communications of the ACM, circa il 70 percento delle volte le informazioni trasmesse "contenevano informazioni che esponevano condizioni specifiche, cure e malattie." Il che, afferma Libert, "mette potenzialmente a rischio la privacy degli utenti." Il che significa che è meglio pensarci due volte prima di cercare informazioni mediche su Internet.

"WebMD sostanzialmente avvisa tutti dicendo loro che cosa state guardando"

Vediamo cosa accade nel dettaglio: mettiamo che stiate cercando informazioni sull'herpes. Mettendo il termine nel motore di ricerca avrete una lista di risultati. Ci sono molte possibilità che qualsiasi sito scegliate, le vostre informazioni verranno mandate non volo al server del sito, ma anche alle compagnie che possiedono degli elementi installati sulla pagina.

Pubblicità

Quando cliccate su quel link state facendo una cosiddetta "first party request." Questa richiesta arriva ai server del sito, e manda indietro il file HTML con la pagina che state cercando. In questo caso potrebbe essere "Genital Herpes - CDC Factsheet," che è probabilmente l'ultima pagina che vorreste far sapere di aver guardato. Ma dato che il sito in questione ha installato Google Analytics per misurare il suo traffico e ha, per qualche motivo, incluso AddThis, che permette la condivisione su Facebook e Twitter (il che fa sorgere la domanda su chi voglia condividere con i propri contatti pagine che parlano di malattie), il sito manda una third party request a ognuna di queste compagnie. Questa richiesta è qualcosa del genere—http://www.cdc.gov/std/herpes/STDFact-Herpes.htm—e fa sapere a queste compagnie delle vostre ricerche sull'herpes.

Libert ha scoperto che la mgagior parte dei siti che parlano di salute sono carichi di elementi per il tracciamento che mandano i dati delle vostre ricerche a giganti del web come Google, Facebook e Pinterest, e data broker come Experian e Acxiom.

Da qui è piuttosto semplice per le compagnie ricevere le richieste, molte delle quali raccolgono altri tipi di dati (in cookie, ad esempio) sulla vostra ricerca, per identificare te e la tua malattia. Questo URL, o URI, che contiene chiaramente la malattia su cui cercavi informazioni, è trasmessa a Google, Twitter, Facebook, con l'IP del vostro computer e altre informazioni identificative.

Pubblicità

"Questo 91 percento significa che questo fenomeno è comune a tutti i tipi si siti," mi ha detto Libert, "non riguarda soltanto i siti commerciali che mirano al profitto, ma anche siti di cui ci si fida: siti del governo, no-profit e delle università."

Un esempio è quello del sito Centers of Disease Control, che si presumerebbe dovrebbe essere libero da logiche di profitto e sicuro per l'uso. "Fondamentalmente si tratta di negligenza," mi ha detto Libert.

Ma i siti no-profit spesso sono molto peggio. WebMD, per esempio, è il centoseiesimo sito più visitato negli Stati Uniti, secondo stime di Alexa, e appare nei risultati di ricerca delle malattie più comuni. Manda third party request a un totale di 34 domini separati, inclusi Experian e Acxiom.

"WebMD sostanzialmente avvisa tutti delle vostre ricerche," afferma Libert. Considerando che la malattia ricercata potrebbe essere un'informazione sensibile, gli utenti non sarebbero contenti di saperlo.

Si può dire lo stesso di About.com (che manda le vostre ricerche a comScore, Experian, Google e Microsoft tra gli altri), Helth.com (che manda i vostri dati a circa una dozzina di compagnie) e molti altri—se state visitando un sito no-profit che parla di salute state sicuri che le vostre mosse sono tenute sotto controllo, e le vostre richieste arrivano nelle mani non soltanto di compagnie che possono usarle per scopi pubblicitari (che è il motivo per cui Facebook e Google raccolgono questo tipo di dati), ma anche compagnie che guadagnano vendendo questi dati (come fanno Experian e Acxiom).

Pubblicità

Molti dei risultati di ricerca per i sintomi sono sono esplicitamente siti che parlano di questioni mediche—ma compaiono anche FreeDictionary, eHow, Merriam-Webster, Answers e LiveStrong—e hanno molti degli elementi analizzati da Libert. Una visita su uno qualsiasi di questi siti vi assicura di essere osservati da altre decine di compagnie.

Anche siti fidati e noprofit vi monitorano, Mayo Clinic e Planned Parenthood, ad esempio mandano i vostri dati a terzi come Google e Ensighten. Questo non perché i siti abbiano intenti maliziosi; ma perché hanno installato software gratuiti convenienti, che però mandano i dati sulla salute delle vostre ricerche a compagnie esterne.

Il lavoro di Libert conferma i report della Associated Press e della Electronic Frontier Foundation che riportavano il fatto che Healthcare.gov divulgasse i dati degli utenti.

"Heathcare.gov è solo la punta dell'iceberg" ha affermato Cooper Quintin, dello staff di EDD, che ha rivelato come il sito stava rendendo inavvertitamente pubblici i dati degli utenti in modo simile a quello spiegato da Libert. "Pensi che le informazioni che leggi su Internet rimangano private, tra te e il provider del servizio," mi ha detto Quintin. "Ma non è così."

Un esempio di 1000 third party request. Visualizzazione dei dati via Tim Libert.

Quindi qual è il motivo per cui così tanti siti trasmettono le vostre informazioni confidenziali, potenzialmente imbarazzanti e potenzialmente dannose a varie compagnie? Su alcuni siti accade semplicemente perché gli sviluppatori installano strumento gratuiti come Google Analytics e strumenti di condivisione sui social media, e molti utenti non hanno idea del fatto che questo significhi che le informazioni sulle proprie ricerche vengono condivise con terzi.

Pubblicità

"Il problema è che utilizzare questi strumenti di terzi è molto facile per gli sviluppatori. Non viene però considerato il motivo per cui questi strumenti sono gratuiti," afferma Libert. "Queste compagnie non fanno carità, forniscono strumenti per fare soldi dai dati degli utenti."

Google in questo caso è il più diffuso, non soltanto nei siti governativi ma anche in altri—possiede la vasta maggioranza di strumenti per monitorare i dati. Libert ha scoperto che "l'87 percento delle pagine analizzate includevano elementi di proprietà di Google," un risultato che lo ha colpito molto.

Google non è l'unica compagnia che monitora i siti di contenuti relativi alla salute. Ma il secondo posto di comScore ha risultati decisamente inferiori: il 38 percento delle 80000 pagine analizzate. Inoltre il 31 percento dei siti fanno transitare dati a Facebook, il 22 percento a AppNexus, il 18 percento a AddThis, il 18 percento a Twitter, il 16 percento ad Amazon e il 12 percento a Yahoo. Da notare quanti dati riceva Google rispetto alle altre compagnie.

"Me lo aspettavo che Google avesse risultati alti, ma non avevo realizzato quanto," mi ha detto Libert. "Anche se usi un iPhone, DuckDuckGo e Hotmail, nel momento in cui apri il tuo browser c'è un'alta probabilità che Google ottenga le tue informazioni." Questo perché Google assorbe le tue informazioni da una varietà di servizi di host e domini grazie a Google Analytics, che misura il traffico dei siti, fino a DoubleClick e Youtube.

Pubblicità

Se un sito ha installato Analytics, viene mandata automaticamente una third party request a Google, e ciò accade su quello che Libert definisce "il web invisibile", dove l'utente non è mai consapevole di ciò che sta accadendo.

"Non importa che servizio sia, in qualche modo tutte queste richieste HTTP finiscono per dare informazioni a Google," ha scritto Libert nel paper. "Questo significa che una sola compagnia ha la capacità di registrare l'attività sul web di un enorme numero di persone che ricercano informazioni sensibili riguardo la propria salute senza che loro lo sappiano o approvino."

Cosa potrebbe accadere se Google iniziasse ad assorbire informazioni sulla vostra salute? Un incidente verificatosi in Canada potrebbe essere un indizio.

Nel gennaio del 2014 la commissione per la privacy canadese aveva stabilito che Google aveva violato le leggi nazionali sulla privacy dopo che un utente aveva scoperto di essere tempestato di pubblicità di dispositivi per curare l'apnea notturna. Aveva utilizzato il motore di ricerca per saperne di più sul disturbo e cercare dispositivi per curarlo. La commissione per la privacy fu in grado di replicare l'esperienza dell'utente, e venne stabilito che Google aveva infranto la legge.

"La maggior parte dei canadesi considera le informazioni sulla salute dati estremamente sensibili," disse allora la commissione. "Non è appropriato che questo tipo di informazioni vengano utilizzate per la pubblicità." Google ha sostenuto che "i criteri e le liste di pubblicità nel suo network erano determinati da inserzionisti individuali," non da Google, secondo quanto riportato da The Register, e che era contro le sue policy utilizzare informazioni sensibili per scopi pubblicitari. Non venne stabilita alcuna sanzione, tuttavia, dato che il Canada fu soddisfatto dalla promessa di Google di utilizzare una politica più stringente sulla privacy. Tuttavia questo evento è esemplare delle capacità di Google: se la compagnia o il network di inserzionisti vogliono proporre una pubblicità mirata a coloro che hanno cercato rimedi per curare l'herpes, è chiaramente dimostrato che questo rientra nel rango delle loro possibilità.

Pubblicità

Il rischio, secondo la ricerca di Libert, è quello di arrivare all'identificazione personale o alla cieca discriminazione. Il caso di Google è un esempio della prima: se Google vuole, ha le informazioni per capire chi sei e cosa ti affligge. È inquietante, certo, ma ci sono ramificazioni ance nella vita reale oltre al fatto che il vostro provider sa che avete la colite. Gli utenti non hanno il minimo controllo sul modo in cui i dati vengono archiviati o messi al sicuro, ad esempio, e potrebbero essere vulnerabili ad attacchi hacker.

Un portavoce di Google mi ha scritto la seguente dichiarazione: "molti siti utilizzano i nostri servizi per misurare il proprio traffico, inseriscono video di YouTube o riempiono le loro pagine di pubblicità. Abbiamo politiche restrittive che proibiscono a questi siti di trasmettere dati personali identificabili. Non vogliamo e non usiamo questo tipo di dati sensibili. E per essere chiari: non permettiamo assolutamente al nostro sistema di pubblicità di essere usato per formare profili, o per creare pubblicità personalizzate basate su informazioni mediche o sulla salute."

Google non ha risposto immediatamente quando ho chiesto loro come queste affermazioni potrebbero combaciare con le scoperte di Libert. Libert, da parte sua, ha definito la risposta "una classica formula di rito".

"L'unica cosa che guida l'uso di questi dati è il profitto"

Le possibilità più sconcertanti però non risiedono in Google o Facebook, che assorbono dati dal web e li archiviano nei propri server, ma nelle pratiche dei data broker come Experian, i cui prodotti sono stati trovati in circa il 5 percento delle pagine esaminate da Libert—solitamente in siti no profit come WebMD, About.com e MedicineNet.com Experian è un credit bureau che si è ingrandito tanto da diventare un "gruppo di servizi di informazione globale." È stato oggetto di un'indagine da parte del Senato statunitense guidata da Jay Rockefeller nel 2013, e raccoglie quanti più dati possibile per poi venderli. E sì, sono inclusi i dati sanitari.

Pubblicità

"Ho trovato Experian su migliaia di siti," mi ha detto Libert, "una compagnia che conosce i dettagli del mio conto bancario e che potrebbe anche sapere anche i miei problemi di salute? È una cosa allucinante secondo me."

"È inquietante pensare che le compagnie che rilevano i tuoi movimenti finanziari monitorano anche la tua salute," ha aggiunto.

Ci sono molti motivi per cui è un problema il fatto che i data broker intorno al mondo archiviano i vostri dati sanitari senza che lo sappiate o abbiate acconsentito. Il primo motivo è semplice: potrebbero farne un uso improprio. Nel 2013 Experian è stata multata per aver venduto pacchetti di dati di consumatori a ladri di identità in Vietnam. I dati, archiviati da entità sconosciute con livelli di sicurezza non verificati, potrebbero essere alla mercè degli hacker. "La raccolta di informazioni personali identificative sulle condizioni di salute aumenta la possibilità di perdite, furti e abusi," ha scritto.

Libert nota nella sua ricerca che un'atra compagnia, Medbase200, avrebbe utilizzato "modelli proprietari" per generare e vendere liste contenenti classificazioni come "vittime di stupro", "vittime di abuso domestico," e "pazienti HIV/AIDS."

"Il problema è che i dati personali non sono da soli. Experian può prendere i dati e affiancarli ad altre informazioni già raccolte," afferma Qiuntin. "Con Google è la stessa cosa, hanno un cookie su di te con il tuo nome reale e i tuoi dati. E ci sono condivisioni di dati che avvengono dietro le quinte. Experian può condividere queste informazioni con altre compagnie."

Pubblicità

E questo tipo di pratiche portano a quello che Libert definisce il problema della cieca discriminazione.

"Experian è un data broker conosciuto per vendere informazioni finanziarie, inclusi i dati sulle bancarotte," ha affermato Libert. "Una ricerca accademica della senatrice Elizabeth Warren ha mostrato che oltre il 60 percento delle bancarotte sono collegate a questioni di salute. Considerato che ho scoperto che Experian monitora utenti su migliaia di siti che parlano di questioni mediche, è possibile che la compagnia non solo sappia quali individui sono andati in bancarotta per questioni di salute, ma anche quando per la prima volta sono andati online per saperne di più sulla propria malattia. Sostanzialmente Experian può seguire un individuo dal primo starnuto all'ultimo conto ospedaliero non pagato." (Experian non ha risposto alla richiesta di commenti.)

Quintin è d'accordo sul fatto che questo sia un grave pericolo. "Direi che è totalmente possibile." Sostiene che sia possibile che le informazioni sanitarie che questi broker assorbono potrebbero essere collegate ai dati finanziari, e anche usati per determinare quanto pagate per la vostra salute. "È tutta speculazione, giusto? Ma se sono una banca e tu richiedi un mutuo non c'è motivo per cui non dovrei volere queste informazioni." E i data broker potrebbero fornirle.

"Un altro scenario da incubo è quello delle application per un lavoro," ha continuato Quintin. "Una compagnia potrebbe ottenere un profilo demografico da uno di questi data broker e utilizzare queste informazioni per decidere se assumerti o no."

Ma il problema fondamentale è che tutte queste cose sopraelencate sono legali secondo le leggi attuali.

"L'unico che decide cosa accadrà ai dati è chi può trarne profitto," afferma Libert. "L'unica cosa che guida l'uso di questi dati è il profitto. Nessuna legge, nessun controllo."

"I dati sanitari sono tra le informazioni più private che esistano: rivelano molto di te." Quintin afferma che ci sono delle cose che gli utenti possono fare per proteggersi, installare ad blocker come Privacy Badger, ad esempio. O potreste smettere di visitare siti di contenuto medico: e qui c'è una luce in fondo al tunnel, Wikipedia. È uno dei pochi siti che, pur trattando di informazioni sanitarie, non manda third party request a compagnie esterne.

Per ora, tuttavia, milioni di persone stanno esponendo i propri profili sanitari a inserzionisti e data broker, proprio nel momento in cui stanno facendo le ricerche più confidenziali.

"È un grande problema sul web," afferma Quintin. "È il modo in cui funziona la rete, ed è necessario che le cose vadano in modo diverso, soprattutto quando si tratta di informazioni sulla salute delle persone."