L’uso di Excel ha causato una perdita dei dati inglesi di contagio da COVID-19

by Marco Giannini on

Via Twitter


Gli esperti di informatica, ma anche i semplici utenti smanettoni, sanno che la scelta del giusto formato per il salvataggio dei dati è una delle cose più importanti quando si deve lavorare con altri utenti.

Questa cosa però è sfuggita di mente ai responsabili della Public Health England (PHE), una agenzia esecutiva del Department of Health and Social Care del Regno Unito che, per un uso sbagliato di Microsoft Excel, ha causato la mancata segnalazione di quasi 16.000 casi di positivi al COVID-19.


Cosa è accaduto

La PHE aveva la necessità di riunire ed analizzare i registri dei tamponi positivi al COVID-19 prodotti da società terze.
I dati sono stati archiviati nel formato CSV, un formato di file basato su file di testo che normalmente viene utilizzato per l'importazione e l'esportazione (ad esempio da fogli elettronici o database) di una tabella di dati. Fin qui nulla di problematico.
PHE ha poi impostato un processo automatizzato per riunire questi dati in modelli Excel in modo da poterli caricare su di un sistema centralizzato al fine di renderli pubblici a fini di indagine e governativi.

Il problema nasce al momento del salvataggio del file. I file di Excel sono stati salvati nel formato XLS, un vecchio formato proprietario Microsoft, lanciato nel 1987, che può gestire solo circa 65.000 righe di dati. Poiché ogni risultato dei test contiene diverse righe di dati, in pratica ogni modello era limitato a 1.400 casi.
Superato questo limite gli ulteriori casi sono stati semplicemente esclusi dal salvataggio finale.

La soluzione più semplice, da parte del PHE, sarebbe stata quella di utilizzare il nuovo formato XLSX, lanciato nel 2007, che è in grado di gestire oltre un milione di righe. Questo avrebbe impedito, almeno con i numeri attuali di test, il verificarsi di questo problema.

Bastava usare alternative migliori

Un qualsiasi esperto di informatica avrebbe comunque suggerito l'utilizzo di soluzioni alternative per l'esportazione dei dati. 
Tutti noi che abbiamo a che fare con l'informatica sappiamo a nostre spese quanto Excel sia abusato a livello informatico nelle medie/grandi realtà lavorative.

La soluzione del PHE

Il PHE, per evitare ulteriori problemi, anziché scegliere un sistema differente, ha iniziato ora a suddividere i dati dei risultati in batch più piccoli (evitando di raggiungere il limite) creando così un numero maggiore di modelli Excel.



Leggi il contenuto originale su Marco's Box

Written by: Marco Giannini