Mentre la Lombardia si prepara a passare dall’arancione all’arancione scuro, scoppia un nuovo caso sui dati che ogni settimana la Regione trasmette all’Istituto Superiore di Sanità. Dati utilizzati per il calcolo dei parametri su cui si basa la classificazione a colori, che ancora una volta potrebbero essere stati viziati da gravi imprecisioni. Tanto che la Lombardia potrebbe essere rimasta troppo a lungo in giallo, fascia da cui è uscita solo lunedì scorso, e questo avrebbe contribuito all’aggravarsi dei contagi registrato negli ultimi giorni. Secondo Vittorio Nicoletta, dottorando di Analisi dei dati e statistica all’università Laval del Quebec in Canada, la regione è rimasta in giallo almeno una settimana in più del dovuto: avrebbe dovuto finire in zona arancione non dall’1 marzo ma già dal 22 febbraio.
L’analisi di Nicoletta, che ha pubblicato alcuni grafici su Twitter, si basa sui dati che la stessa Regione ha reso open source dopo lo scontro col governo sugli errori che a gennaio avevano causato la classificazione in zona rossa anziché arancione. Il dottorando ha calcolato, con lo stesso algoritmo utilizzato dall’Iss, l’Rt delle scorse settimane in base ai dati disponibili il 3 marzo: l’Rt del 3 febbraio (preso in considerazione nel report dell’Iss aggiornato al 17 febbraio) risulta così pari a 1,07, anziché lo 0,95 (valore riportato a pag. 2 del report) calcolato coi dati disponibili due settimane fa che ha consentito alla Lombardia di rimanere in giallo il 22 febbraio. Cosa è cambiato nel frattempo? “Che i dati sono stati consolidati – spiega Nicoletta a ilfattoquotidiano.it – È normale che i dati riferiti alle settimane passate diventino più precisi man mano che passa il tempo. E infatti la fondazione Bruno Kessler che calcola l’Rt per l’Iss ritiene che ci vogliano due settimane perché i dati necessari al calcolo dell’Rt si stabilizzino. Per questo l’Rt è sempre calcolato con due settimane di ritardo”.
Ma Nicoletta ha notato che dopo due settimane i dati della Lombardia non sono ancora consolidati: così calcolando a quattro settimane di distanza l’Rt del 3 febbraio, si scopre che questo è stato sottostimato. “Regione Lombardia è particolarmente lenta a raccogliere con precisione i dati”. L’osservazione di Nicoletta trova riscontro nello stesso report dell’Iss, dove alla Lombardia, rispetto alle altre regioni, viene attribuito il più basso valore per uno degli “indicatori di processo sulla capacità di monitoraggio”, l’indicatore “1.1 settimana di riferimento”: per la Lombardia è pari a 75,3% (pag. 5 del report). Come spiegato a pag. 4, questo significa che solo il 75,3% dei casi sintomatici notificati dalla Regione all’Iss è stato notificato indicando la data inizio sintomi.
In un caso su quattro, dunque, la Regione non ha comunicato la data di inizio sintomi rendendo tale caso sintomatico da scartare per il calcolo dell’Rt. Questo parametro viene infatti calcolato per definizione considerando i casi sintomatici di cui si conosce la data di inizio sintomi. Informazione che in molti casi la Regione è riuscita a recuperare, pubblicandolo nel suo data sheet open source, solo in un secondo momento. Da qui la discrepanza tra l’Rt del 3 febbraio calcolato coi dati disponibili il 3 marzo e quello calcolato coi dati disponibili il 17 febbraio. Problema denunciato su Twitter anche da Lorenzo Ruffino e Fabio Riccardo Colombo. La storia, insomma, si ripete. A gennaio la Lombardia era finita in zona rossa per un problema ai dati di natura opposta: per molti casi di positività al Covid non veniva indicato lo “stato clinico”, causando una sovrastima dell’Rt.