Geo Big Data Desde Cero (Parte 1)
En este artículo te enseñare paso a paso como instalar las tecnologías básicas para usar TODOS los datos del Censo de Población y Vivienda 2020 en su distribución SCINCE. Y TODOS los datos del Directorio Estadístico Nacional de Unidades Económicas (DENUE). También te mostrare como descargar dichos datos para tener todo listo y poder realizar análisis nacionales usando técnicas de Big Data con dichos datos.
Te mostrare cómo instalar todo lo necesario para analizar y procesar los datos desde Windows 10 Profesional. Aunque debería ser sencillo hacerlo en otros sistemas operativos.
Aquí utilizaremos la tecnología Apache Spark (https://spark.apache.org/) con conjunto con otras para aprovechar el máximo potencial del equipo donde nos encontremos trabajando. Por lo que sugiero que el equipo dónde correrás estos análisis tenga al menos 4 Cores/8 Hilos y 16 GB RAM como mínimo.
Debido a la extensión de éste material se escribirá en varias partes las cuales son hasta el momento:
- Parte 1 (Actual) Instalación y descarga de datos
- Parte 2 Construcción de bases de datos geográficas con Apache Spark y Apache Sedona: Consulta la parte 2 aquí: https://abxda.medium.com/geo-big-data-desde-cero-parte-2-85121f5d654d
- Parte 3 Realización de varios análisis con datos nacionales…