Un Evento Decenal de Datos Abiertos

Ayer el INEGI (Oficina Nacional de Estadística de México) publicó los datos del Censo de Población y Vivienda 2020. Dichos datos son gratuitos y abiertos. Lo anterior significa que además de no tener un costo también son de libre uso, lo cual también permite su aprovechamiento en productos comerciales, como se indica en la norma publicada en el boletín oficial:

El nivel de detalle con el que se publicaron estos datos es a nivel de manzana, respetando en todo momento la confidencialidad, por lo que es posible conocer el total de personas que la habitan, o el número de viviendas que cuentan con luz, agua corriente, o drenaje. Uno de los aspector innovadores de este evento censal es que también es posible saber cuántos hogares tienen contratado un servicio de video por demanda o una consola de videojuegos. En total, existen 220 variables para cada manzana de México. Los detalles de las variables publicadas hoy se pueden encontrar en el sitio web oficial del INEGI:

https://www.inegi.org.mx/programas/ccpv/2020/default.html#Documentacion

Un aspecto relevante es que los datos geográficos de las manzanas (polígonos georeferenciados) también se publican a nivel nacional. Estos polígonos georreferenciados se agrupan en un archivo shapefile para cada estado de la República Mexicana (32 Shapefiles).

Es posible descargar los datos actualizados de todos los polígonos de las manzanas de cada entidad federativa.

Cada manzana tiene un código único (CVEGEO) a lo largo de todo el país y eso es útil para unir esos datos con las tablas de datos estadísticos.

Acercamiento a un conjunto de manzanas del Estado de Aguascalientes.

Las tablas de datos estadísticos se encuentran en https://www.inegi.org.mx/servicios/datosabiertos.html

Los datos estadísticos se encuentran por el momento en formato CSV.

Es posible unir los datos geográficos con los datos estadísticos mediante una concatenación de los campos ENTIDAD + MUN + LOC + AGEB + MZA.

CVEGEO es la concatenación de varios campos del archivo con datos estadísticos.

Con el nuevo campo creado es posible vincular los datos estadisticos con los datos geográficos, dando como resultado datos estadísticos geo-referenciados. Como se puede ver en la imagen, el bloque seleccionado tiene 198 habitantes.

Capa geográfica con datos estadísticos resultantes de la unión de datos.

De momento eso es todo, espero que les sea de utilidad, en futuros artículos utilizaré los principios básicos mostrados en éste pequeño artículo para integrar una Base de Datos Nacional.

¡Gracias por Leerme!

Abel Coronado

--

--

Abel Alejandro Coronado Iruegas, Ph.D.

Father-Husband-Data Scientist-Philosopher-Entrepreneur-Professor in Data Science-MSc Stats #Scala #SatelliteImagery #Python https://www.a2bigdata.com.mx/