Interpretare i dati: Veneto e Lombardia a confronto

Abbiamo iniziato, nel post precedente, a passare in rassegna i dati della Protezione civile e del Ministero della Salute, notando che si tratta di un insieme abbastanza eterogeneo ma che questi elementi sono comunque collegati: insomma, per leggerli bene dobbiamo esercitare alcune cautele, ma sappiamo che vanno letti insieme. Questa operazione di lettura incrociata trasforma i semplici dati in informazioni, come abbiamo visto fin dal primo articolo, il che significa che possiamo usarle per comprendere i fenomeni che ci interessano, in questo caso l’andamento dell’epidemia e l’efficacia delle misure che stanno venendo dispiegate per contrastarla.

Un altro aspetto importante di questo processo, dal dato all’informazione, è che è sempre reversibile: dall’informazione possiamo tornare ai dati che l’hanno originata e, attraverso questa decostruzione, osservare meglio i dati stessi e, eventualmente, rimetterli in discussione. Tutto questo, ovviamente, a patto che l’informazione sia buona nel senso che abbiamo visto, ossia che permetta di accedere direttamente ai dati che l’hanno originata. Un dato, infatti, può essere intrinsecamente carente in due modi fondamentali:

  • per errori materiali che ne inficiano l’attendibilità (per esempio, il giorno tale possono essere arrivati in ritardo i dati di una regione) e questi possono essere scoperti solo sul campo. Generalmente, se il processo di raccolta ed elaborazione dei dati non è strutturalmente carente, questi incidenti di percorso sono marginali e tendono a compensarsi in periodi relativamente brevi (il dato mancante ieri viene integrato in quelli di oggi, generando un risultato anomalo nei due giorni ma corretto nel periodo complessivo);
  • per difetti sistematici nei processi con cui vengono estratti i dati. Un caso esemplare è il conteggio dei decessi, come abbiamo già visto: il dato comunicato, per essere tempestivo, tiene conto di tutti i pazienti positivi al Covid-19 deceduti, anche se le cause principali sono altre e, correttamente, si rimanda ad altre comunicazioni (in questo caso, le analisi bisettimanali dell’Istituto superiore di sanità) per esaminare le cause reali di queste morti.

Queste due classi di problemi sono, come abbiamo visto, intrinseche, ossia originano dalla struttura del processo di raccolta ed elaborazione. Ma l’attività di interpretazione incrociata che trasforma il dato in informazione permette di identificare anche una terza classe di carenze, molto più importanti: sono quelle che riguardano i processi reali da cui questi dati vengono estratti e permettono di verificare la qualità delle pratiche a cui fanno riferimento. Facendoli lavorare insieme, i dati parlano davvero e mostrano se si sta lavorando bene o male.

Non è difficile interrogare, in questo modo, i dati del Ministero della Salute. Prendiamo la tabella riepilogativa pubblicata oggi (7 aprile) e confrontiamo alcuni dati, vale a dire il totale dei casi positivi e dei tamponi in Lombardia e in Veneto. Bene, nella prima regione abbiamo 52.325 casi totali con 159.331 tamponi, vale a dire poco meno di uno su tre; nella seconda, 11.925 casi e 153.542 tamponi, con un rapporto vicino a uno su tredici (per l’esattezza, 12,87). È abbastanza intuitivo, anzi, quasi ovvio, che facendo molti test si scoprono più casi e che un basso numero di positivi significa che la copertura è abbastanza ampia; per citare una fonte autorevole, Maria van Kerkhove, epidemiologa alla guida del gruppo di intervento OMS sul COVID-19, afferma che, quando i test vengono fatti in modo sufficientemente esteso, il tasso di positivi dovrebbe oscillare tra il 3 e il 12 per cento. Questo indice aiuta anche a capire se il campione è abbastanza rappresentativo: come sottolinea la stessa van Kerkhove, ci sono problemi anche al di sotto di questa soglia, dato che se i positivi sono meno del 3 per cento, significa che si sta guardando nel posto sbagliato. Insomma, si pone sempre il problema della rappresentatività del campione, oltre a quello della sua estensione

 Il 7,77 per cento del Veneto rientra perfettamente in questo intervallo, soprattutto considerando che si sta ulteriormente abbassando, mentre il 34 per cento lombardo causa forti sospetti di sottodiagnosi del fenomeno.

Un altro dato importante è la gravità dei casi: più è elevata, maggiore è la probabilità che, in popolazioni sostanzialmente omogenee come quelle delle due regioni in questione, vi siano molti casi non diagnosticati, specie i meno gravi. A sua volta, la mancata diagnosi precoce fa sì che ci si accorga dei casi solo quando sono particolarmente gravi, rendendo più difficile la terapia. Un buon indicatore della gravità dei casi è il rapporto tra decessi e guarigioni, anche se questo dato presenta delle complicazioni perché, come abbiamo detto in precedenza, i due dati sono asincroni: in altre parole, e soprattutto se il paziente entra nel sistema quando è già in condizioni gravi, il decesso si verifica in tempi mediamente più brevi di quelli che occorrono per la completa guarigione. Tuttavia, questo rapporto è molto più indicativo di quello tra decessi e casi totali, che viene normalmente usato dai media: infatti, in questo caso si trascura completamente il fatto che non si conosce l’esito di tutti i pazienti ancora in terapia. Possiamo dire che, tendenzialmente, il tasso di decessi rispetto alle guarigioni tende a diminuire (per lo sfasamento temporale di cui si diceva), mentre quello con i casi totali tende a incrementare, perché purtroppo  è probabile che qualcuno dei malati ricoverati oggi muoia.

Comunque, possiamo fare un raffronto tra i casi di Lombardia e Veneto perché sono sostanzialmente in sincronia, dal momento che l’epidemia è iniziata quasi contemporaneamente nelle due regioni. Di conseguenza, anche se la fotografia fornita dal tasso decessi/guarigioni ha dei limiti, questi sono sostanzialmente sovrapponibili nei due casi in questione.

I dati parlano con sufficiente chiarezza da poter compensare questo tipo di imprecisioni. Infatti, in Lombardia abbiamo 9.484 deceduti rispetto a 14.498 dimessi o guariti, vale a dire il 65 per cento. In Veneto, invece, siamo a 695 deceduti rispetto a 1.265 dimessi o guariti, ossia il 54 per cento. Sembra una differenza di poco conto, ma questo dato va letto in prospettiva: una settimana prima (31 marzo) i tassi erano rispettivamente del 66 per cento in Lombardia e del 57 in Veneto. Come si vede, il Veneto sta diminuendo il tasso dei decessi rispetto ai guariti in modo molto più rapido e cospicuo. Considerando che le linee guida che hanno portato il Veneto a intensificare i propri esami sono del 13 marzo, i tempi necessari a realizzare un numero di esami significativamente maggiore rispetto ad altre regioni e lo sfasamento temporale tra l’esame e l’esito della patologia, è possibile riscontrare una correlazione plausibilmente significativa (che in futuro potremmo quantificare in un modello statistico) tra questa decisione e l’esito migliore dei casi di COVID-19 in Veneto rispetto a quelli lombardi.

Ecco come, dal semplice raffronto tra i dati del Ministero, si può avere un’idea della gravità del caso lombardo e dell’insufficienza della risposta sanitaria, in quella regione in particolare, all’emergenza in atto.

Info Autore
Chief of Strategy , Tombolini & Associati
Ho studiato filosofia alla Sapienza (tesi su Hegel, dottorato su Husserl, qualche pubblicazione qua e là) e, fin dai miei ultimi anni da studente, lavoro nella comunicazione e nell’analisi strategica. Adesso faccio queste cose con Tombolini & Associati, di cui sono socio e partner.
×
Chief of Strategy , Tombolini & Associati
Ho studiato filosofia alla Sapienza (tesi su Hegel, dottorato su Husserl, qualche pubblicazione qua e là) e, fin dai miei ultimi anni da studente, lavoro nella comunicazione e nell’analisi strategica. Adesso faccio queste cose con Tombolini & Associati, di cui sono socio e partner.
Latest Posts

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Ridimensiona font
Contrasto