Big Data e Salute

Progetto di Public Engagement promosso dall’Università degli Studi di Modena e Reggio Emilia, sostenuto da Edizioni Edra e da Accademia del Paziente Esperto Eupati.

BigData4Health [BD4H] ha l’obiettivo di divulgare conoscenza, contribuire a creare maggiore consapevolezza sulla importanza della rivoluzione digitale in atto nell’ambito della Salute, sull’impiego e la gestione dei Big Data nel complesso ecosistema.

Appunti e riflessioni: I Big Data in ambito sanitario

La quantità di dati raccolti e archiviati digitalmente è elevata e in rapida espansione. Gli informatici hanno coniato il termine “Big Data” per descrivere questo insieme di dati, complessi e “veloci”, in continua evoluzione. Da queste basi, le tecnologie e i processi di data management e data analysis stanno avanzando, per consentire velocemente alle organizzazioni di convertire le risorse generate, i data, in informazioni e cognizioni che sostengono l’evoluzione di vari settori, tra cui quelli legati al sistema sanitario, al fine di attuare una migliore, sistematica e concreta azione preventiva, con l’obiettivo di aiutare gli individui prima ancora che si ammalino e contribuire a un efficientamento del sistema.

I Big Data sono stati utilizzati con successo in astronomia, nel commercio, nei motori di ricerca e anche in politica. Tuttavia, l’applicazione più importante che si attende venga completamente compresa, e sfruttata al meglio, riguarda l’ambito della Salute.

Le stime globali suggeriscono che, entro il 2025, verranno creati 463 exabyte di dati giornalmente, originati da varie fonti.

Sebbene sia difficile immaginare il valore complessivo dei dati creati nel mondo, un parametro dei volumi che stiamo descrivendo può essere reso dal paragone: 44 zettabyte di dati dell’attuale universo digitale sono, in byte, oltre 40 volte il numero di stelle osservabili nell’universo.

Parte dei nuovi dati raccolti oggi non hanno bisogno di essere archiviati per lungo periodo, mentre gli esperti prevedono che, dati pari a circa 7,5 ZB (zettabyte = 10²¹ byte), avranno bisogno di un archivio a lungo termine nel 2025 – che rispetto ai circa 1,1 ZB prodotti nel 2019 rappresentano un incremento del 581% in circa 5 anni -.

A livello sanitario, l’attuale disponibilità di dati – sia a livello qualitativo, che quantitativo – non ha precedenti nella storia dell’umanità (a oggi si contano oltre 2,5 quintilioni di byte/giorno). Le stime più recenti suggeriscono che un singolo paziente genera quasi 80 MegaByte ogni anno di dati, comprese le immagini mediche digitali e le informazioni contenute nella cartella clinica elettronica (EMR).

Da valutazioni effettuate si trae che il volume complessivo di tutti i dati elettronici raddoppia circa ogni due anni. Per quanto riguarda i dati sanitari la stima viene ampiamente superata e si prevede che, al 2025, rappresenteranno il settore economico digitale con il più elevato incremento, con un tasso di crescita annuale composto (CAGR) del 36%.

Al contempo, con l’aumento delle richieste di dati (come nel caso del monitoraggio delle principali epidemie sanitarie, l’aggiornamento delle recenti statistiche in merito a trattamenti e vaccini, il rilevamento di diagnosi e di trattamenti dei pazienti tra più fornitori – anche di dati – e il supporto alla crescita della telemedicina), la funzione dei dati sanitari non è mai stata così critica.

Le organizzazioni sanitarie si trovano ad affrontare la gestione di questa enorme quantità di dati dei pazienti, oltre a una crescente domanda di accesso, in tempo reale, alle cartelle cliniche complete. Contestualmente, devono razionalizzare i loro portafogli di applicazioni per riadattare alle norme i sistemi di privacy e mantenere i dati sanitari protetti archiviati e accessibili per la conformità, la ricerca e il reporting. Non trascorrerà molto tempo, si prevede, prima che la tecnologia informatica, la interconnessione e la capacità di archiviazione comporteranno un’ulteriore disponibilità esponenziale di dati sanitari, in due modi:

Per l’aumento della digitalizzazione dei procedimenti e delle procedure mediche, si uniranno tutti i dati, le informazioni e le conoscenze in un virtuoso interscambio;
Per l’incremento di dispositivi mobili – come smartphone, sensori indossabili e qualsiasi altro fenotipo digitalmente riconducibile -, che consentiranno a ogni persona (in salute o meno) di rilevare le proprie condizioni fisiche (per questo si parla di quantifying self e mobile-health).

Entrambi, però, presentano potenziali problemi: per la crescente digitalizzazione dei processi e delle procedure mediche dovrebbero essere forniti i mezzi per collegare i dati ai referti e alle informazioni, in un interscambio virtuoso, mentre la quantifying self e il mobile-health – essendo fonte primaria di dati sanitari – dovrebbero essere combinati con l’accesso ai dati, l’uso, la portabilità, la privacy e – in Europa – con la conformità al GDPR.

C’è, poi, il contesto della ricerca clinica – direttamente orientata al paziente, condotta con soggetti umani (o con qualsiasi biomarcatore/materiale di origine umana, che può essere collegato con certezza a un individuo unico) – che rappresenta un vasto ambito di ricerca. Generando quantità crescenti di dati, il sistema ha bisogno di tecnologie e regole trasparenti per consentire la condivisione in modo significativo all’interno della comunità scientifica e industriale.

Si tratta, poi, il contesto della telemedicina, cui uno dei principali compiti consiste nel collegare pazienti e medici al di là della struttura clinica. Questo tipo di relazione e confronto si è ampliato con il coinvolgimento dei social network, attivando di conseguenza nuovi livelli di interazione sociale e ha aperto nuove finestre di comunicazione per quanto riguarda la Salute, oltre il tradizionale paradigma medico-paziente, verso quello, ad esempio, da paziente a paziente. Un esempio concreto: un quarto dei pazienti con malattie croniche (come diabete, cancro e cardiopatie) utilizzano i social network per condividere esperienze con altri pazienti con condizioni simili, attivando così un’ulteriore fonte potenziale di big data.

Come i social network, così anche le App rappresentano altre fonti di informazioni e dati. Oltre alle informazioni biologiche e le geolocalizzazioni, forniscono, ulteriori elementi per rilevare comportamenti e dati socio-demo dei pazienti, svincolando al contempo da studi intensivi e costosi su ampi campionamenti statistici. Questo tipo di vantaggio è già stato sfruttato nel caso di diversi studi epidemiologici in ambiti diversi (come per le epidemie di influenza, le dinamiche collettive sul fumo e l’abuso di antibiotici). Infatti, i messaggi di testo e i post sui social network sono una preziosa fonte di informazioni sanitarie, ad esempio per perfezionamento della gestione della salute mentale.

Rispetto ai metodi tradizionali – come i sondaggi -, le fluttuazioni e la regolazione delle emozioni, i pensieri e i comportamenti analizzati sulle piattaforme di social network (come Twitter, ad esempio) offrono nuove opportunità per l’analisi in tempo reale dell’andamento dell’umore e dei suoi contesti. Convalidando, ad esempio, dei modelli noti di variazione dell’umore – dai 2,73×10⁹ tweet emotivi raccolti in un periodo di 12 settimane per uno studio specifico, è emersa una correlazione significativa tra i tweet che esprimono emozioni e le stime sulla salute globale dell’Organizzazione Mondiale della Sanità sui tassi di ansia e suicidio -.

I social media e le ricerche su internet, tra l’altro, possono anche essere combinati con i dati ambientali – come i dati sulla qualità dell’aria – per prevedere, ad esempio, l’improvviso aumento delle visite di emergenza legate all’asma.