Geo Big Data Desde Cero (Parte 2)
En esta segunda parte vamos a construir tres conjuntos de datos nacionales con toda la información descargada y dejaremos todo listo para poder realizar análisis de Big Data utilizando el lenguaje de programación SQL con sus extensiones Geográficas gracias a Apache Sedona (https://sedona.apache.org/).
En el articulo: Geo Big Data Desde Cero (Parte 1) logramos instalar todas las herramientas y descargar todos los datos necesarios para este tutorial. Si no tienes todo eso descargado y funcionando en tu equipo, te recomiendo que vayas a realizar lo indicado en la Parte 1 de esta serie.
En el siguiente artículo: Geo Big Data Desde Cero (Parte 3) cosecharemos todo lo hecho, porque realizaremos análisis nacionales usando los datos sociodemográficos a nivel manzana (1.5 Millones) en conjunto con los 5.5 Millones de datos del Directorio Estadístico Nacional de Unidades Económicas (DENUE).
Abriendo Jupyter Lab
La herramienta principal será Jupyter Lab (https://jupyter.org/) y realizaremos el código en lenguaje Python.
Para abrir Jupyer Lab vamos a abrir la consola PowerShell de miniconda y activaremos el ambiente (bigdata).
En esta ocasión lo haremos en C:\ para poder tener acceso a toda la información.