Geo Big Data Desde Cero (Parte 2)

Photo by Ethan Ou on Unsplash

En esta segunda parte vamos a construir tres conjuntos de datos nacionales con toda la información descargada y dejaremos todo listo para poder realizar análisis de Big Data utilizando el lenguaje de programación SQL con sus extensiones Geográficas gracias a Apache Sedona (https://sedona.apache.org/).

En el articulo: Geo Big Data Desde Cero (Parte 1) logramos instalar todas las herramientas y descargar todos los datos necesarios para este tutorial. Si no tienes todo eso descargado y funcionando en tu equipo, te recomiendo que vayas a realizar lo indicado en la Parte 1 de esta serie.

En el siguiente artículo: Geo Big Data Desde Cero (Parte 3) cosecharemos todo lo hecho, porque realizaremos análisis nacionales usando los datos sociodemográficos a nivel manzana (1.5 Millones) en conjunto con los 5.5 Millones de datos del Directorio Estadístico Nacional de Unidades Económicas (DENUE).

Abriendo Jupyter Lab

La herramienta principal será Jupyter Lab (https://jupyter.org/) y realizaremos el código en lenguaje Python.

Para abrir Jupyer Lab vamos a abrir la consola PowerShell de miniconda y activaremos el ambiente (bigdata).

En esta ocasión lo haremos en C:\ para poder tener acceso a toda la información.

--

--

Abel Alejandro Coronado Iruegas, Ph.D.

Father-Husband-Data Scientist-Philosopher-Entrepreneur-Professor in Data Science-MSc Stats #Scala #SatelliteImagery #Python https://www.a2bigdata.com.mx/