EN octubre saltaba una noticia sorprendente en Reino Unido: de la noche a la mañana sumaban 16.000 casos positivos de coronavirus. La serie estaba estabilizada en torno a los 7.000 casos diarios, por lo que ese incremento era realmente importante. No hubo muchas explicaciones, mientras que muchos y muchas levantaban sus cejas con asombro.

La explicación fue sencilla. El Sistema Público de Sanidad británico reconoció que no había contabilizado esos casos entre el 25 de septiembre y el 2 de octubre. El motivo fue técnico: la hoja de cálculo Excel que se estaba empleando para llevar la contabilidad había llegado a sus límites. En un inicio se pensó que habría llegado a su límite de columnas; pero luego supimos que en realidad había llegado a su límite de 65.000 filas, valor máximo en las hojas Excel antiguas (las xls, de 1987), y no el más de un millón que ahora permite (desde 2007 con el formato xlsx). En medio de la peor pandemia del último siglo, analistas de datos volvían a arquear sus cejas al darse cuenta que las administraciones responsables de la gestión de la pandemia empleaban herramientas como Excel para registrar el principal indicador de la evolución de la situación. Esto evidenció que la pandemia había llegado en un momento en el que la gestión pública está en manos de unos programas de gestión y ofimática que fueron pensados y diseñados para soluciones más básicas que las que requiere esta era de los grandes volúmenes de datos.

Excel es un programa muy adecuado para hacer análisis iniciales, tareas cortas y rápidas, para maquetar tablas o hacer operaciones ágiles en la toma de decisión. Precisamente la flexibilidad de Excel encaja muy bien para estos cometidos. Pero, si se precisa una infraestructura para la gestión y almacenamiento de grandes volúmenes de datos (como puede ser la pandemia del COVID-19), no suena muy recomendable. Ni siquiera su fabricante la ha recomendado para las necesidades de esta pandemia. No obstante, es raro no ver informes o tablas hechos por ministerios de sanidad en Excel. Supongo que será una mezcla de inercia (llevo usándolo muchos años), dependencia (es el software que tengo) y comodidad (es lo que sé usar) lo que lleva a estar gestionando el impacto del virus en la sociedad con un programa que no sirve para sus necesidades.

En 2013, dos grandes economistas como Carmen Reinhart y Kenneth Rogoff reconocieron un error que se bautizó como "la depresión del Excel". En 2010 habían publicado un artículo con el punto de inflexión de la deuda pública a partir del cual la economía desacelera. Se tomaron decisiones políticas de austeridad por ello. Posteriormente reconocieron que se les habían olvidado algunas celdas para su cálculo. En 2016 se publicó un análisis en el que se observó cómo en uno de cada cinco artículos científicos de Genética había errores derivados del uso de Microsoft Excel. Hace unos días los investigadores Thiemo Fetzer y Thomas Graeber publicaban un artículo sobre el impacto que el error en la gestión de datos en Excel habría supuesto en Reino Unido: un total de 120.000 nuevos casos no se pudieron evitar, lo que habría supuesto cerca de 1.500 fallecidos. El Ministerio de Sanidad, en plena pandemia en España, publicó algunas tablas en las que se podía ver el valor "#¡DIV/0!", que suele devolver Excel cuando divides entre cero una magnitud. Una prueba más de estar gestionando bases de datos con una hoja para cálculos ágiles.

¿Y qué alternativas tendríamos? Desde sistemas de gestión de datos como SAS o SPSS, hasta lenguajes de programación como R o Python, que acompañados de SQL, son tecnologías preparadas explícitamente para lidiar con grandes volúmenes de datos. Pero, claro, esto implica formación y acompañamiento al usuario, dado que las lógicas y esquemas mentales que estos programas requieren son realmente diferentes a las de Excel. Y, sobre todo, necesitamos abrirnos al cambio, que la pandemia y la gestión pública son asuntos serios.