En busca del dato perdido: gráficas útiles pero imprecisas

Las gráficas son herramientas muy útiles para mostrar datos numéricos de manera visual y, con ello, comunicar ideas o resultados. Por eso es habitual encontrar gráficas en la prensa, en la televisión, en revistas científicas, en blogs, en presentaciones e informes... Allí donde haya datos numéricos y posibilidad de mostrar una imagen, pueden usarse gráficas. Eso sí, en su elaboración debe estar claro el objetivo que se persigue, el mensaje o ideas que se quieren transmitir. Una gráfica en la que los datos no se muestran con precisión y claridad no es una buena gráfica. Una gráfica que hay que descifrar no es una buena gráfica. Una gráfica que complica la lectura en lugar de facilitar la comprensión e interpretación de los datos no es una buena gráfica. 

Como leemos en el libro Gramática de las gráficas, de Joaquín Sevilla Moróder, en la elaboración de una gráfica "un emisor codifica un mensaje soportado por unos datos en un formato gráfico para que sea percibido por un receptor". Así, para decidir la conveniencia o adecuación de una representación gráfica a un caso particular, se tendrá en cuenta "su efectividad como vehículo del mensaje que se pretende transmitir". Esta eficacia comunicativa "se puede limitar a una percepción intuitiva instantánea, o ser objeto de un estudio de mucho detalle".

Lo veremos ahora con un par de ejemplos. Se trata de dos gráficas publicadas dentro de reportajes de El País este enero. La primera, en 'Las superbacterias ya matan más que el sida, la malaria y algunos cánceres'. La segunda, en 'El sistema eléctrico español marca en 2021 un nuevo mínimo histórico de emisiones'. 

1. 


2. 



No diría que son malas gráficas, porque sí que logran comunicar el mensaje deseado de forma bastante clara, pero en los dos casos hay aspectos que mejorar en la presentación de los datos. Es decir, considero que ambas gráficas son 'mejorables'. 

La gráfica 1 nos informa de las 10 bacterias que más muertes causan y del número de defunciones a causa de cada una de ellas. Además, mediante el uso de colores se diferencia entre 'muertes por infección' y 'muertes con infección'. Todo bien hasta ahí. ¿Pero en cuánto tiempo se han producido esos fallecimientos? ¿Es una media anual? ¿Es desde que se tiene registro? Solo si leemos el reportaje encontramos la respuesta ("Estas infecciones por y con bacterias resistentes a antibióticos hubieran sido la tercera causa de muerte a nivel global en 2019, año analizado"). Por lo tanto, sería mejor si en el título de la gráfica pusiera algo como 'Las 10 bacterias que más muertes causaron en 2019'. 

Además, se puede calcular 'a ojo' el número de muertes causadas por cada bacteria, pero de la gráfica no se puede extraer el dato concreto, ya que no aparece indicado en las barras, y cada intervalo del eje horizontal son 300.000 defunciones (imposible la precisión con estos intervalos). Estos datos no los encontramos tampoco dentro del reportaje.

Por lo tanto, la gráfica 1 cumple la función de mostrar de forma sencilla y ordenada las 10 superbacterias más peligrosas y comparar en concreto las muertes por infecciones resistentes, o en general personas que murieron con una infección de este tipo aunque no fuera la causa principal de la defunción. Pero no nos sirve para saber cuántas muertes causó cada una y no tenemos la referencia temporal si no leemos el reportaje.

En cuanto a la gráfica 2, por el título sabemos que el objetivo es mostrar en qué porcentaje contribuyó cada fuente de energía al mix energético español en 2021. Además, gracias al uso de dos colores (verde/gris) se diferencia entre renovables y no renovables. Justo debajo de esa barra se muestra otra, con la misma información pero de 2011. Por lo tanto, no solo se nos informa de la situación de 2021, sino que se compara con la de una década antes.

Podríamos considerar esto como un 'párrafo gráfico', con dos gráficas que forman parte de un conjunto. En ese caso, sería mejor presentarlo con un título de conjunto y un título a cada una de las gráficas (2021 y 2011). La diferencia de altura entre una y otra barra también debería estar justificada (es decir, ¿se generó en 2021 el triple de energía que en 2011? Si no es así, no tiene sentido esa diferencia de alturas entre una y otra barra). 

Otro inconveniente que encuentro en esta gráfica o conjunto de gráficas es que en todo momento se nos obliga a leerlas en paralelo. O, mejor dicho, que la de 2011 no se puede leer sin la del 2021. Un total de tres fuentes de energía no están identificadas en esa barra o, al revés, un total de tres segmentos no están asignados a ninguna fuente. Tenemos que mirar arriba y seguir el orden para 'descubrir' de qué fuente se trata. En los mismos tres casos se da otro problema, más complicado de resolver: no sabemos los porcentajes.

En resumen, la gráfica 2 nos permite identificar tanto para 2011 como para 2021 las fuentes que más y que menos contribuyeron al mix energético español, diferenciadas además entre renovables y no renovables, y compararlo entre uno y otro año, pero se omiten tres datos que no se pueden recuperar si no se recurre al cálculo por parte del lector o lectora. Además, puede provocar confusión la diferencia de altura (pero no de longitud) entre una y otra barra.

Imagen de cabecera: de Jason Coudriet en Unsplash


Comentarios

  1. Poco más que añadir. Coincido plenamente. No son malas, pero podrían ser muy buenas con poquito más y les ha faltado.

    ResponderEliminar

Publicar un comentario