Visualización de datos en categorías anidadas

Visualización de datos en categorías anidadas

Cuando se tienen datos en categorías anidadas, como es el caso del conjunto de datos de la canasta básica de Nicaragua, el treemap es una de las visualizaciones más apropiadas. Para constatar esta afirmación puede leer las recomendaciones de Claus O. Wilke. El treemap o diagrama de árbol es una visualización que permite mostrar datos disponibles de manera jerárquica o en categorías anidadas.

Los datos de la canasta básica son publicados por el Instituto Nacional de Información de Desarrollo (INIDE). Los datos para este ejercicio corresponden al valor de la canasta a noviembre 2022.

A continuación, se presentan algunas alternativas de cómo presentar distintos tipos de treemaps en R (R Core Team, 2022). Si bien, cada una de ellas es la presentación del mismo conjunto de datos, las especificaciones de sus capas resaltan elementos que pueden ser más apropiados en función de la categoría, subcateoría o valor que se quiera remarcar.

Opción 1: versión estática

Opción 2: con un poco de interacción, ubique el cursos sobre cualquier producto para ver su valor.

Opción 3: interacción completa. Haga clic sobre alguna categoría para ver detalles, otro clic para volver a la categoría anterior y clic sobre el nombre de la categoría para volver al plot inicial.

En resumen

Se ha presentado un conjunto de visualizaciones, que si bien, son iguales, realzan atributos diferentes del mismo conjunto de datos:

  • La Opción 1 basada en el paquete treemap (Tennekes, 2021), carece de cualquier tipo de interactividad, es un gráfico estático, apropiado para presentación de informes en word, pdf, email o cualquier formato que no interprete código de JavaScript. Esto no es limitante de su poder de transmisión de información.

  • En la misma Opción 1 se observa que cada producto de la canasta básica está pintado en función de una escala de colores que hace referencia a su valor, en Córdobas, lo cual conduce una comparación relativamente rápida para determinar los ítems más caros de la canasta. En este sentido, llama la atención que Tortillas, dentro de la categoría CEREALES, tiene mayor valor que alquiler, de la categoría USOS DEL HOGAR.

  • La Opción 2, en tanto, agrupa por color la categoría y distribuye cada producto dentro de cada color, las etiquetas con el valor, en Córdobas, son mostradas en la medida que el usuario pasa el puntuero del mouse sobre cada caja del gráfico. En términos de transmisión de información, esta es más limitada que la anterior. Sin embargo, es indicada, cuando se va a usar en presentaciones en formato html y se quiere abordar la relevancia de unos cuantos productos, por cuanto, lo indicado sería no llenar las cajas con tanta información para no distraer la atención de la audiencia. Este gráfico se basa en el paquete highcharter (Kunst, 2022).

  • La Opción 3, basada en plotly de Sievert (2020), brinda completa interacción con los datos. Esto permite enfocarse en alguna categoría en concreto, adicionalmente, ésta presenta el valor de cada producto (en Córdobas) y su respectiva participación porcentual dentro de la canasta.

Finalmente, el usuario debe determinar el tipo de visualización en función del alcance, herramientas y nivel de detalle que quiera ofrecer a la audiencia. Todos los gráficos fueron realizado en R (R Core Team, 2022).

Referencias

C. Sievert. Interactive Web-Based Data Visualization with R, plotly, and shiny. Chapman and Hall/CRC Florida, 2020.

Kunst J (2022). highcharter: A Wrapper for the ‘Highcharts’ Library. R package version 0.9.4, https://CRAN.R-project.org/package=highcharter.

R Core Team (2022). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

Tennekes M (2021). treemap: Treemap Visualization. R package version 2.4-3, https://CRAN.R-project.org/package=treemap.

No hay comentarios:

Publicar un comentario