Au Royaume-Uni, 16 000 malades atteints de la Covid-19 oubliés
Cette « affaire » ne date pas d’hier, mais elle vient d’apparaitre dans mon fil d’actu et j’ai trouvé intéressant d’en parler et d’aborder la place de Microsoft Excel dans les entreprises.
C’est un scoop pour personne, depuis 1985, Excel est l’instrument de calcul privilégié de presque tous les métiers : contrôle de gestion, ressources humaines, marketing, qualité… mais à l’ère du Big Data, le roi des tableurs montre peut-être ses limites.
En effet, en pleine crise du Covid (octobre 2020 – je vous avais prévenu cette actu n’est pas nouvelle), 15 841 cas confirmés de coronavirus n’ont pas été comptabilité dans le système national anglais de suivi et de traçabilité à cause d’une limitation d’Excel. Un certain nombre de rapports, (The Guardian , Sky News, et le Daily Mail ) se sont ainsi retrouvé erronés.
Pourquoi me direz-vous ?
L'agence de santé Public Health England (PHE) a recensé 50 789 personnes malades entre le 25 septembre et le 2 octobre. Or, 15 841 cas n'ont pas été pris en compte dans les chiffres du Royaume-Uni pendant toute cette période car certains fichiers contenant des résultats de test positifs dépassaient la taille de fichier maximale....
Excel n'autorise « que » 1 048 576 lignes par feuille et lorsque le fichier atteint sa taille maximale, les dernières données du bas de page sautent et ne sont donc plus prise en compte. Dans la version 32 bits d’Office, la taille maximale des fichiers pour un classeur contenant un modèle de données est de 2 Go et la quantité maximale de mémoire qui peut être utilisée par un classeur est de 4 Go.
Si vous dépassez l’une de ces limites, le classeur ne peut pas être enregistré.
Vous me direz 2go et 1 048 576 permet de stocker beaucoup d’informations et , à mon avis, doit suffire pour tracer 50 000 personnes, mais la version d'Excel utilisée par la PHE n'est pas claire. Ce problème donne quand même a penser que la PHE utilisait une ancienne version d’Excel. Le nombre de lignes max est passé de 65 536 à 1 048 576 avec Excel 2007. Alors que les analystes de la PHE tentaient de charger davantage de cas dans la base de données nationale, ils ont été rejetés. La PHE pense que les problèmes sont survenus lorsque les laboratoires ont envoyé leurs résultats à l'aide de fichiers CSV, qui n'ont aucune limite de taille. Mais PHE a ensuite importé les résultats dans Excel, où les documents ont une limite d'un peu plus d'un million de lignes.
Bien sûr, La PHE n'a pas rentré plus dans les détails, mais tout est vite rentré dans l’ordre. Le problème technique semble avoir été résolu en divisant les fichiers Excel en lots.
Toutefois rejeter la faute sur Excel me semble un peu facile… Un minimum de contrôle aurait pu permettre d'éviter ce genre de mésaventure.
Cette mésaventure justement pose une question simple : Excel est utilisé partout , mais est-il toujours adapté ?
(Non ce n'est pas le sujet du bac de philo 2021...)
Une chose est sûre, Excel n’est pas près disparaitre. N’oublions pas qu’il est aujourd’hui encore utilisé par plus d’un milliard de personnes dans le monde. Et on ne compte même pas les entreprises qui stockent dans Excel les informations collectées puis les analysent, réalisant ainsi des reportings mettant en relief l’information essentielle dont elles ont besoin. J’en veux pour preuve cette étude publie par Deloitte en 2019 montre que plus de 60% des patrons des grandes sociétés préfèrent les bonnes vieilles présentations PowerPoint associées aux feuilles Excel. (Même si presque 70% des entreprises interrogées utilisent également au moins un outil avancé tel que SAS, un outil open source tel que R, un langage de programmation tel que Python ou un outil d'IA.)
Alors, de mon point de vue et même si la révolution actuelle du Big Data change les habitudes de la société et participe à l’explosion exponentielle du volume de données collectées, Excel reste encore l'outil privilégié pour effectuer la collecte des données et l'analyse.
Excel est très accessible et il sait à peu près tout faire, mais peu de gens savent exploiter ses fonctionnalités avancées, surtout lorsqu'on traite avec des volumes de données conséquents.
Je pense qu'Excel tient toujours la route si une partie des traitements Analytics sont réalisés en amont et que les analystes vérifient que des données ne sont pas manquantes.
Car comme le disait Lénine, dans d’autres circonstance : « La confiance n'exclut pas le contrôle »