Integración de los Datos del Censo 2020 a nivel AGEB con Python (Paso a Paso)

En este tutorial paso a paso usaremos Python para descargar e integrar los datos del Censo de Población y Vivienda 2020 con los polígonos geográficos de AGEB.

Precondición: Contar con Docker Instalado

En este tutorial será necesario tener instalado el software llamado Docker en tu equipo. Existen versiones para los principales sistemas operativos (Windows, macOS y Linux).

No te desanimes 😜 aunque te parezca un requerimiento algo misterioso te aseguro que vale cada bit ocupado en tu equipo, este software simplificará horas de instalación y configuraciones de todo lo que usaremos aquí y lo convertirá en UNA SOLA LINEA DE CÓDIGO en la terminal de tu equipo. Por lo cual vale la pena dedicarle tiempo al proceso de instalación el cual sobra decir es muy sencillo.

Ahora bien, si quieres una referencia rápida, en un artículo anterior puse los pasos para instalar Docker en Windows: Geo Big Data con Datos Censales.

Iniciar JupyterLab en una sola linea de código

Jupyter es una herramienta práctica para el trabajo con datos, debido a que evita trabajar en la consola directamente y puedes ir ejecutando código paso a paso y ver el resultado.

Para iniciar Jupyter Lab utilizaremos un contenedor de Docker preparado para la ocasión, es decir para simplificar el trabajo de instalación de todas las dependencias usadas aquí y útiles para otros tutoriales como: ¿Dónde están los Gamers? GeoBigData + KMedias.

Antes de iniciar ¡RECUERDA!

Debes estar en el directorio donde vas a trabajar, ubicandote en el directorio correcto usando tu terminal, antes de correr Docker.

Estando en el directorio principal del tutorial, como se muestra en la animación anterior ejecuta la siguiente linea:

  • Para Windows 10 (PowerShell):
  • Para macOS
  • Para linux

¡¡¡Una vez ejecutada la linea anterior la magia comienza!!!!

Descarga de Datos Estadísticos y Geográficos

Una vez que se tiene Jupyter corriendo en tu navegador podremos ejecutar los siguientes pasos para descargar e integrar los datos.

El primer paso es entrar al subdirectorio de trabajo (work) y crear un cuaderno de Python:

Posteriormente copiamos y pegamos el siguiente código para cargar las bibliotecas necesarias:

Abajo puedes ver cómo se ejecuta el código anterior:

Ahora ejecutaremos el código de apoyo representado en un par de funciones que nos ayudaran en el proceso de descarga y extacción de datos:

Ahora crearemos los directorios necesarios para guardar los datos que vamos a descargar y tambien dónde vamos a poner el resultado de la integración, ¡ya sabes! copia -> pega en jupyter -> ejecuta la celda

Gráficamente se ve así:

Descarga todos los datos:

Una vez que ejecutas el código anterior se descargará toda la información desde el INEGI:

Una vez que termina de descargarse la información veras algo asi:

Felicidades acabas de descargar todos los datos necesarios para realizar la integración de datos.

Extracción de los datos estadísticos y geográficos

Hasta el momento ya tienes descargados los archivos necesarios para realizar la integración, ahora realizaremos el proceso de extracción de datos, es decir extraeremos los archivos CSV y SHAPEFILE que usaremos para la union:

La ejecución del código anterior luce así:

El resultado nos deja 32 archivos CSV en la ruta :

con los datos a nivel AGEB y Manzana.

Y todos los shapefiles de los AGEBS Rurales y Urbanos en :

Integración de datos estadísticos y geográficos a nivel AGEB

Ahora realizaremos la integración de los datos geográficos con los estadísticos usando la Clave Geoeestadística.

Al finalizar la ejecución del script anterior contaremos con 32 archivos vectoriales Geopackage que trabajaremos en QGis.

Conteo de AGEBS Rurales y Urbanos

Ahora realizaremos una tabla de comparación para identificar la cantidad de AGEBS Rurales y Urbanos. Para eso ejecuta el siguiente código:

Al ejecutar el código pudes abrir el dataframe resultante:

Creación de un mapa nacional con QGis

Ahora utilizaremos la herramienta llamada QGis para integrar los datos resultantes del proceso anterior. Para lo cual es necesario instalar la dicha herramienta en tu equipo, la puedes descargar de aquí : https://www.qgis.org/es/site/

Ya que la descargaste e instalaste puedes abrirla y cargar todos los archivos de la siguiente manera:

Primero ubica en tu computadora los archivos recientemente generados, estos se encuentran en el directorio que generaste al principio de este tutorial, dirigete a la ruta: /inegi/mgccpv/gpkg

Abre QGIS y arrastra todos los archivos de la siguiente manera:

Ahora generaremos una sola capa de información con todos los AGEBS a niven nacional:

Una vez que concluya veras la siguiente pantalla:

Apareceran las siguientes capas, incluida la recientemente creada llamada agebs:

Creamos un nuevo proyecto sin guardar el proyecto actual, como ya hemos generado el archivo nacional no necesitamos guardar el mapa actual. Una vez teniendo el lienzo en blanco procederemos a abrir exclusivamente el archivo nacional.

Finalmente generamos una representación que nos permita visualizar el resultado final diferenciando los AGEBs Rurales de los AGEBs Urbanos ademas de tener todas las variables del Censo.

¡Listo!

Ahora tienes un procedimiento para integrar los datos estadísticos y geográficos liberados recientemente.

¡Gracias por leerme!

Sígueme en Twitter @abxda

Abel Coronado

Father-Husband-Data Scientist-Philosopher-Entrepreneur-Professor PhD c. in Data Science-MSc Stats #R #Scala #Spark #SatelliteImagery #Python #BigData #Nerd

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store