Lettera aperta sui dati di base e sulle competenze

Lettera aperta sui dati di base e sulle competenze

FIRMA LA PETIZIONE

Lotta al COVID-19: sono necessari dati di alta qualità per le analisi e competenze adeguate per analizzarli

L’emergenza dovuta alla pandemia da COVID-19 ha messo in luce l’importanza fondamentale della disponibilità di dati affidabili e di competenze elevate nell’analizzarli per permettere di comprendere la pandemia, prevederne l’evoluzione, approntare strumenti sia di politica sanitaria che di politica economica per affrontarla e valutare gli effetti delle scelte effettuate.
È sempre più evidente come sia fortemente necessario offrire un supporto competente per una raccolta di dati ispirata a criteri di qualità ed integrare informazioni disponibili sulla base di criteri statistici che tutelino tale qualità. Ed è ancor più evidente come, accanto alla raccolta di dati di alta qualità, occorra reclamare spazio per le competenze scientifiche necessarie per analizzarli.
 

Perché dati accessibili

In larga misura i dati necessari alla costruzione di informazioni efficaci vengono già raccolti da Enti e Agenzie governative, ma non sono resi disponibili alla comunità scientifica. Problemi di riservatezza, e ulteriori considerazioni non note, trasformano i dati grezzi in informazioni non accessibili.
Attualmente i dati disponibili sono raccolti con il dichiarato scopo di sorveglianza, ma se non ne viene garantita la qualità, la confrontabilità tra aree geografiche e gli aspetti definitori fondamentali, qualsiasi analisi di tali dati si limiterà ad un monitoraggio dello status quo che produrrà proiezioni più che previsioni. Per studiare in dettaglio l’andamento dell’epidemia occorrono informazioni il più possibile dettagliate, che permettano di seguire i percorsi individuali di contagio e di evoluzione clinica.
A livello aggregato, sono disponibili a tutti le grandezze aggiornate giornalmente dalla Protezione Civile. Riconosciamo e apprezziamo molto l’enorme lavoro di raccolta e diffusione dei dati compiuto da questa Agenzia. Notiamo però come, a questo punto dell’evoluzione della pandemia, quanto reso disponibile dalla Protezione Civile non sia più sufficiente per rendere trasparente il meccanismo decisionale del governo e la comprensione scientifica dell’evoluzione della pandemia stessa.

 

In particolare, sulla base di questi dati non è possibile svolgere alcune attività cruciali.

 

  • Riprodurre le basi quantitative delle decisioni istituzionali. Questo è emerso in tutta evidenza per ciò che riguarda la recente suddivisione del Paese in tre zone. Devono essere trasparenti le modalità con cui vengono definiti e costruiti indicatori e i criteri per determinare le decisioni finali. È fondamentale che i dati disaggregati con cui questi indicatori vengono alimentati siano resi disponibili. Solo così la comunità scientifica può essere messa in grado di valutare le metodologie usate.
     
  • Valutare ex-post, in modo quantitativo e rigoroso, gli effetti delle decisioni. Un esempio di fondamentale importanza in questo ambito è la scelta della chiusura o meno delle scuole. Molti ricercatori stanno tentando di dare una valutazione rigorosa dell'effetto “scuola”, tuttavia le numerose ricerche scientifiche sul tema non forniscono ancora conclusioni condivise, essendo tutte basate sull'analisi dati aggregati.
     
  • Comprendere aspetti ancora oscuri del fenomeno.Il mondo scientifico italiano è ricco di competenze che potrebbero utilmente investigare aspetti importanti del fenomeno sulla base dei dati disaggregati, in collaborazione con le Istituzioni e le Agenzie coinvolte nella gestione della crisi epidemiologica.

 

Perché competenze adeguate

Le competenze statistiche sono attualmente molto richieste e molto difficili da trovare in tutto il mondo. Sono diventate sempre più esclusive e rare data la richiesta in continuo aumento, rinforzata dall’attuale emergenza COVID-19. Ad esempio, la Pfizer, società farmaceutica in prima linea per lo sviluppo e la distribuzione del vaccino, condividerà i propri dati solo in gruppi di ricerca in cui sia un biostatistico a condurre le analisi. In Italia, i dati raccolti attualmente, sull’onda dell’emergenza, sono affetti da molti problemi e da un’elevata variabilità. Hanno dunque bisogno, ancora più di altri dati biomedici, di competenze specifiche che permettano di trattare correttamente elementi di confondimento, sbilanciamento ed alta variabilità. Tutti questi aspetti non possono essere gestiti correttamente se non avendo competenze avanzate di statistica.
Risposte tempestive ed efficaci, metodologicamente solide e condivise si ottengono nel momento in cui le giuste competenze sono coinvolte nella raccolta e validazione dei dati e nell’analisi degli stessi. Il processo scientifico richiede numerosi passaggi, in ciascuno dei quali competenze specifiche sono necessarie per una corretta costruzione degli strumenti informativi.

  • Definizione del problema. In primo luogo, è fondamentale definire cosa occorre osservare per rispondere alle domande di contenimento, monitoraggio e previsione dell’epidemia e del suo impatto in ambito sociale ed economico. In questo processo occorrono competenze diversificate. Gruppi altamente multidisciplinari, al cui interno possano interagire scienziati di aree diverse, sono necessari per affrontare tutti gli aspetti del problema. In questa fase si devono da un lato definire i dati di base necessari alle analisi e dall’altro costruire ed implementare protocolli di armonizzazione tra le diverse fonti di dati.
     
  • Gestione delle basi dati. Competenze specifiche di tipo informatico e statistico sono necessarie per la costruzione e gestione di archivi dati con grandi flussi di informazione. I dati non vanno solo memorizzati/salvati, ma soprattutto validati in tempi rapidi per dare risposte tempestive e per garantirne l’accesso pubblico.
     
  • Analisi dell’informazione. In questa fase diventa fondamentale la capacità di definire e sviluppare modelli capaci di cogliere le caratteristiche di fondo del fenomeno di interesse, che permettano di evidenziare potenziali relazioni causali, di definire specifiche procedure di stima per quantità non note ed indicatori, e di costruire previsioni che tengano conto dell’incertezza che accompagna ogni stima.
     
  • Condivisione dell’informazione.È necessario confrontare diversi modelli di analisi, ad esempio in termini di capacità predittiva, interpretabilità e robustezza. A tal fine è auspicabile istituire momenti di confronto periodico, a periodicità almeno bisettimanale, fra i ricercatori che sviluppano i modelli e le istituzioni che li potrebbero impiegare, in modo aperto e trasparente, al fine di condividere le migliori soluzioni.
     
  • Diffusione dell’informazione. Siamo sostenitori dell’accesso ai dati da parte di tutta la comunità scientifica. L’accogliere tale richiesta permetterebbe una maggiore trasparenza da parte della politica e consentirebbe alla società civile di ottenere informazioni affidabili e certificabili. L’accessibilità va però accompagnata da una incisiva e crescente promozione della cultura quantitativa in tutti gli ambiti, a partire dagli operatori della comunicazione e dai decisori politici.

 

È da notare che in questo documento si chiede l’accesso a dati dettagliati, e questo accesso non è cosa nuova per il sistema informativo nazionale. Infatti, su argomenti di natura economica, le informazioni sono reperibili al massimo dettaglio consentendo, a chi interessato, di condurre analisi ed elaborazioni di qualsiasi genere (ad esempio, i dati prodotti da ISTAT, Banca d’Italia, Camere di Commercio).

Va sottolineato con forza quanto le giuste competenze siano fondamentali per l’analisi di un fenomeno tanto complesso come la pandemia di COVID-19. L’enorme variabilità osservata a livello globale, nazionale e regionale, deve essere incorporata nelle valutazioni che conducono alle decisioni politiche ed economiche. Saper distinguere tra associazione e relazioni causali con riferimento a osservazioni e variabili incluse nei modelli di analisi è di fondamentale importanza al fine di evitare decisioni basate su variazioni casuali e/o effetti spuri.