Sign In

Blog

Latest News
Herramientas adicionales para análisis de datos

El Catálogo de Información sobre la Corrupción en México utiliza, en su producto de descarga, un formato de datos que sirve a su propósito principal: facilitar al usuario la identificación de la información relevante de un dato a simple vista. Este formato, llamado long, o “largo”, es ideal para esto: los valores de las primeras columnas se repiten a lo largo de la tabla, mostrando de manera explícita la relación entre un dato, la unidad geográfica a la que pertenece y la institución que realizó la medición, además de otros datos relevantes, como la alineación de la variable con la Política Nacional Anticorrupción a nivel de eje y tema.

En otros contextos, sin embargo, es importante establecer un formato de datos en donde resalte la manera en la que estos se relacionan los unos con los otros. Los programas de análisis estadístico, por ejemplo, procesan los datos de mejor manera cuando no existe repetición en el nombre de las unidades geográficas, salvo en contadas excepciones. Este formato, llamado wide, o “ancho”, agrupa todos los datos pertenecientes a una unidad geográfica en la misma fila, y todos los pertenecientes a una misma variable en una columna.

herramienta de analisis cicm_Mesa de trabajo 1 copia

Tomando en cuenta la necesidad de trabajar con estos distintos formatos de datos, en la SESNA desarrollamos una herramienta para hacer más fácil el uso de la información descargada desde el CICM en cualquier tipo de software estadístico. La herramienta, disponible en https://sesna.shinyapps.io/procesamiento-cicm/, permite al usuario subir un reporte de variables descargado a través del Catálogo, procesa el mismo, y arroja un archivo de tipo CSV y con un formato de datos “ancho”. La descarga de los metadatos de las variables incluidas en el archivo original también está disponible en un archivo separado. La herramienta permite procesar datos estatales y municipales, así como incluir los códigos geográficos de las entidades o municipios.

A mediano plazo esperamos poder integrar estas funciones en el buscador del catálogo, pero mientras tanto esperamos que esta herramienta sea útil para las necesidades estadísticas de nuestros usuarios.

Publicaciones relacionadas