Geo Big Data Desde Cero (Parte 1)

Photo by Arto Marttinen on Unsplash

En este artículo te enseñare paso a paso como instalar las tecnologías básicas para usar TODOS los datos del Censo de Población y Vivienda 2020 en su distribución SCINCE. Y TODOS los datos del Directorio Estadístico Nacional de Unidades Económicas (DENUE). También te mostrare como descargar dichos datos para tener todo listo y poder realizar análisis nacionales usando técnicas de Big Data con dichos datos.

Te mostrare cómo instalar todo lo necesario para analizar y procesar los datos desde Windows 10 Profesional. Aunque debería ser sencillo hacerlo en otros sistemas operativos.

Aquí utilizaremos la tecnología Apache Spark (https://spark.apache.org/) con conjunto con otras para aprovechar el máximo potencial del equipo donde nos encontremos trabajando. Por lo que sugiero que el equipo dónde correrás estos análisis tenga al menos 4 Cores/8 Hilos y 16 GB RAM como mínimo.

Debido a la extensión de éste material se escribirá en varias partes las cuales son hasta el momento:

Instalación de Herramientas en Windows 10

En esta sección instalaremos todo lo necesario para poder trabajar con múltiples herramientas de Ciencia de Datos y Big Data.

  • Java
  • Herramientas de Construcción (Visual Studio Build Tools)
  • Miniconda y Jupyter Lab (Python)
  • Apache Spark y PySpark (Big Data)
  • SCINCE de Escritorio para exploración de los datos.
  • QGIS Para visualización de los resultados y exploración de los datos descargados

Instalación de Java

Para verificar si Java está instalado haremos lo siguiente usando la consola de PowerShell:

--

--

Abel Alejandro Coronado Iruegas, Ph.D.

Father-Husband-Data Scientist-Philosopher-Entrepreneur-Professor in Data Science-MSc Stats #Scala #SatelliteImagery #Python https://www.a2bigdata.com.mx/