UPDATED TODAY! Enfoque “Open data” para la toma de decisiones en tiempos de Coronavirus COVID-19

Decenas de medios y redes sociales, algunos poco fiables por incapaces o partidistas (o las dos cosas), muchos datos, no necesariamente bien extraídos y analizados, varios criterios no armonizados y cambiantes (en los últimos días dos veces han cambiado los criterios del Ministerio de Sanidad español!) me convencieron para hacer los análisis yo mismo pero esto, claro, requiere un poco de desarrollo y tiempo. Los periodistas no tienen por qué tener nociones de estadística o de análisis espacial pero yo sí. Tengo acceso a OPEN DATA (Datos Abiertos) y ganas de análisis? Vamos a ver qué sale de esto…

De momento accedo a diario al boletín o update del Ministerio de Sanidad https://www.mscbs.gob.es/en/profesionales/saludPublica/ccayes/alertasActual/nCov-China/situacionActual.htm de donde me descargo el PDF con los sumarios actualizados desde que contaron las diez primera muertes, si no estoy equivocado (por favor corregidme si es así). Luego es necesaria un poco de ingeniería inversa porque el PDF no permite muchas oportunidades para los análisis personales y el copia pega directo no fuciona (qué pena!) Muchos otros diagramas y muchas gráficas estándar, sí. Pero un PDF no te permite mucha capacidad para hacerlo tú mismo, no.

Una vez que copias y pegas los datos en un excel te das cuenta la gran cantidad de edición que tienes que hacer para poder empezar a ver cosas. De momento geocodifiqué las capitales de las CCAA dado que no los datos no estaban desagregados por provincias, lo que hubiera sido ideal. Bueno en estas cosas nada es ideal en el sentido de que a nadie en su sano juicio se le ocurre hacer un seguimiento de estas características con un criterio cambiante y no aunado por cada uno de los límites administrativos. Pero bueno la cuestión es que empecé con una tabla más o menos legible en el update 51 (21.03.2020 (datos consolidados a las 21:00 horas del 20.03.2020)).

Mi idea era salirme un poco del catastrofismo que tenían todos los medios en esas fechas, donde todo eran muertos por todos lados y UCIs a punto de colapsar así que me decidí por analizar los incrementos a la baja de las UCIs y los Fallecidos. Mientras todo subía, me di cuenta de que esto bajaba. Poco a poco, eso sí, pero bajaba.

Luego pasaron los días y añadí los incrementos a la baja de las hospitalizaciones. Ahí estaban mis tres parámetros a la vez, bajando cual llaneros solitarios rodeados de muerte y abatimiento por todas partes. ¿Para qué vale esto? alguien dirá, pues para no perder el norte y darse cuenta que como decía Mark Twain “Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas.”. Ahora en serio, bueno, yo quería creer que las cosas se iban a arreglar. Basta. :-).

Otra cosa, particularicé el análisis en Madrid, es decir, además de fusilar los datos de todo el país, copiaba una línea extra donde analizaba específicamente el trascurrir del corona virus o COVID-19 en la capital, por cierto, el centro neurálgico del desastre en España.

Fui añadiendo parámetros a analizar y métodos de control visual, cosas sencillas como el formato condicional, colores que dependen de las cifras o tipos combinados de tablas. De curvas o de columnas, ejes secundarios a casco porro, todo para ver cómo combinaban unos atributos con otros y si había algo que cambiaba en el tiempo…

Pero los muertos seguían subiendo. Una cosa buena es que tenía datos de capacidad máximas de estructuras, por ejemplo, en Madrid había en principio 1500 camas de UCI, cifras que fueron subiendo a medida que se iban inaugurando los centros de apoyo como los de IFEMA. El día 4 de Abril se llegó a una ocupación UCI de 1499. Qué miedo. Afortunadamente, todo bajó desde entonces.

En fin, este fue mi trascurrir conforme pasaban los días y lo cierto es que aunque no comunicaba estos resulltados más que con mi grupo familiar de Whatsapp y a mis 90 (o menos) seguidores de Instagram (que como solo publico cosas de running, estaba semi-abandonado), esto, de verdad me hacía sentirme útil en el sentido de que eran datos esperanzadores y no eran mentira. Ya sé que Mark Twain no diría lo mismo pero Gauss decía algo todavía más gracioso, “Tengo mis resultados hace tiempo, pero no sé cómo llegar a ellos“. Esto es exactamente lo que pasaba por mi cabeza (Gracias Karl Friederich!).

Bajan los hospitalizados en el eje secundario y también las UCIs en el primario… muy lentamente sí, pero bajan!

Este diagrama de arriba muestra que el pico ha pasado y que en el trascurso de diez días las cosas habían cambiado bastante. En casa ya llevábamos 30 días de confinamiento aproximadamente y los ánimos no eran muchos porque mis niños (dos) por muy majos que sean, son niños y los análisis no salen cuando hay marejada y en confinamiento no hay marejada en mi casa, hay maremoto. Así que vamos a por más estadística. O mejor, “Más madera!!!!!” (Esta es de Groucho). Fin de las citas, lo prometo.

Quizá mi querido Fernando Simón averiguó que estaba haciendo estas estadísticas y prefirió cambiar el método de contabilización… Se pasó de medir 8 atributos a el doble, incluyendo por ejemplo Positivos por test de anticuerpos, PCRs, tests rápidos, etc, datos que aparecen solo en algunas de las provincias, excepciones por todos lados, asteriscos explicativos… plofffff.

Entre tanto averigué que los de Blue Marble Geographics (Global Mapper) habían añadido una capa de datos online, una conexión WMS con datos georreferenciados de todos los países del mundo, con actualizaciones diarias. Oh yeah! (Gracias al Professor Lauren Gardner, un Ingeniero Civil y de Sistemas de la Universidad Johns Hopkins).

Esto al menos para los datos internacionales.

https://coronavirus.jhu.edu/map-faq

Por otro lado, a una escala más local, mis tablas y mis geocodificaciones de capitales de CCAA (previo paso por ArcGIS para transformar las coordenadas en puntos, darle proyección y luego añadirles los datos mediante un SPATIAL JOIN) me permitían una visualización del análisis con un enfoque particular en España (que me perdonen mis buenos amigos Canarios, en este caso no incluyo las islas por temas de diseño).

En resumidas cuentas, de momento ahí sigo, traduciendo los PDF del Ministerio en hojas de excel legibles por mí mismo y que me permiten tocar los datos desde diferentes enfoques, no necesariamente bien ponderados pero sí frescos y liberados de toda atadura. Podrían parecer unos análisis sencillos (que lo son) pero requieren la alineación de muchas cosas, entre ellas el conocimiento de las herramientas GIS, las proyecciones, distribuciones estadísticas, pero la más importante, la curiosidad por extraer datos para posteriormente tomar decisiones acertadas.

PD: Puedes descargar el EXCEL (en bruto) con todos los datos que se han podido “comprender” después de todos los cambios en los modelos de contabilización de variables desde aquí (última actualización, 108, 20200517):
https://www.dropbox.com/s/h2hebz66btpied0/analisis%20corona.xls?dl=0

Fuentes:
*https://cnecovid.isciii.es/covid19/#documentaci%C3%B3n-y-datos
*https://www.mscbs.gob.es/en/profesionales/saludPublica/ccayes/alertasActual/nCov-China/situacionActual.htm
*https://www.datoscovid.es/
*https://datos.comunidad.madrid/catalogo/dataset/covid19_tia_muni_y_distritos


Alberto CONCEJAL
Geógrafo / MSc GIS y Teledetección

Advertisement

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: