Geo Big Data Desde Cero (Parte 2)

Photo by Ethan Ou on Unsplash

En esta segunda parte vamos a construir tres conjuntos de datos nacionales con toda la información descargada y dejaremos todo listo para poder realizar análisis de Big Data utilizando el lenguaje de programación SQL con sus extensiones Geográficas gracias a Apache Sedona (https://sedona.apache.org/).

En el articulo: Geo Big Data Desde Cero (Parte 1) logramos instalar todas las herramientas y descargar todos los datos necesarios para este tutorial. Si no tienes todo eso descargado y funcionando en tu equipo, te recomiendo que vayas a realizar lo indicado en la Parte 1 de esta serie.

En el siguiente artículo: Geo Big Data Desde Cero (Parte 3) cosecharemos todo lo hecho, porque realizaremos análisis nacionales usando los datos sociodemográficos a nivel manzana (1.5 Millones) en conjunto con los 5.5 Millones de datos del Directorio Estadístico Nacional de Unidades Económicas (DENUE).

Abriendo Jupyter Lab

La herramienta principal será Jupyter Lab (https://jupyter.org/) y realizaremos el código en lenguaje Python.

Para abrir Jupyer Lab vamos a abrir la consola PowerShell de miniconda y activaremos el ambiente (bigdata).

En esta ocasión lo haremos en C:\ para poder tener acceso a toda la información.

Aprovechare para crear un directorio para todos los cuadernos que crearemos a lo largo de este tutorial.

Recuerda que el comando para activar el ambiente (bigdata) de Python es:

conda activate bigdata
Observa que me dirigí directamente a C:\ con los comandos cd ..

Ahora podemos ejecutar Jupyter Lab:

jupyter lab
Iniciando Jupyter Lab desde C:\

Como iniciamos Jupyter Lab desde el directorio raiz C:\ tenemos acceso a todos los directorios del Equipo. Esto lo puedes cambiar de acuerdo a tus necesidades, lo hago por ser extremadamente práctico. Lo que debes recordar es que: El directorio donde inicies será el directorio raiz de tus cuadernos de

--

--

Abel Alejandro Coronado Iruegas, Ph.D.

Father-Husband-Data Scientist-Philosopher-Entrepreneur-Professor in Data Science-MSc Stats #Scala #SatelliteImagery #Python https://www.a2bigdata.com.mx/