Le sole previsioni ufficiali del governo sullo sviluppo dell’epidemia sono state quelle inserite nella bozza della Relazione Tecnica del decreto Cura Italia dell’11 marzo scorso (testo integrale) e pubblicate dal Sole 24 Ore.
Secondo i tecnici del governo (nella bozza non è indicato a quale istituto facciano riferimento), il famoso picco era previsto per il 18 marzo: già a prima vista, questo dato diverge dalle nostre stime. Sin dai primi modelli pubblicati sosteniamo che il picco (o, per meglio dire, il plateau) potrà verificarsi nella seconda metà di aprile. Chi ha ragione?
Analizzando il grafico con maggior cura, si scopre che il picco individuato dalla relazione governativa è il giorno di massimo di incremento dei casi. Nel nostro modello, invece, riteniamo sia più corretto comunicare il picco dei casi complessivi.
Senza voler entrare in merito delle scelte comunicative del governo, spieghiamo quali sono le nostre. Il picco dell’incremento giornaliero rappresenta il punto in cui la velocità di incremento è massima. Ma il giorno dopo il numero di infetti continua a crescere: più lentamente, ma continua a farlo. È come quando siamo alla guida di un’auto: se dobbiamo decidere quando poter ingranare la retromarcia mentre siamo in corsa, dobbiamo badare non al punto in cui la decelerazione è massima, ma al punto in cui possiamo fermarci. Ecco perché, a nostro avviso, per monitorare l’andamento è necessario concentrare l’attenzione sul punto in cui il numero totale degli infetti non cresce più.
Detto questo, volendo accettare l’approccio governativo e rimanere al picco di incremento dei casi, a cui per la verità soltanto il Governo per ora sembra badare, tale picco, secondo il nostro modello, si sarebbe verificato non il 18 marzo, come da relazione governativa, ma una settimana più tardi, tra il 25 e il 27 marzo.
Ci troviamo così di fronte a due stime che differiscono di un intervallo ben definito, tra i sette e i nove giorni. Ammoniti dal detto di George Box, massima fondamentale per ogni studio statistico, secondo cui All models are wrong, but some are useful, possiamo leggere nell’animazione presentata all’inizio di questo articolo il confronto tra le stime del governo e il nostro modello, usando come benchmark i dati reali.
A colpo d’occhio è già visibile la differenza di precisione dei due modelli. Quello che pubblichiamo sul nostro sito, e che aggiorniamo quotidianamente sulla base dei dati reali, in modo trasparente, ha una precisione maggiore di circa tre volte rispetto alle stime del governo (per i più tecnici: MSE gov 33616634 – MSE CovStat_IT 13643029).
Va notato che il benchmark del numero degli infetti subisce, per entrambi i modelli alla pari, un bias dovuto alla variabilità del numero dei tamponi e del campione statistico. Ad esempio nei giorni del 30 e 31 marzo, il numero degli infetti ha subito un crollo rispetto al trend precedente dovuto proprio a questa problematica, tanto che in molti sosteniamo che quel dato non può essere ritenuto affidabile.
Ironia della sorte, proprio quello è il periodo in cui il modello del governo ha una predizione migliore. Sembra davvero di vedere all’opera il famoso principio di Lewis Carroll, per cui anche gli orologi rotti segnano l’ora giusta due volte al giorno. Peccato che, anche in questo caso, l’ora giusta (la corrispondenza del modello governativo con l’incremento degli infetti giornalieri comunicato dalla protezione civile) non sia proprio così esatta.