Geo Big Data Desde Cero (Parte 3)
En este tutorial veremos la aplicación de Apache Spark para realizar una técnica de estratificación multivariada donde usaremos todos los datos sociodemográficos de México a nivel manzana y todos los Negocios registrados en el DENUE.
Recuerda que para llegar aquí debiste realizar las instrucciones indicadas en la Parte 1 y 2 de esta serie de tutoriales:
- Parte 1: https://abxda.medium.com/geo-big-data-desde-cero-parte-1-e48d7ac2c7eb
- Parte 2: https://abxda.medium.com/geo-big-data-desde-cero-parte-2-85121f5d654d
Estratificación Multivariada de Manzanas a Nivel Nacional
Usaremos las siguientes variables para realizar la estratificación de Manzanas.
Es importante aclarar que cada investigador puede definir su propio conjunto de variables, recuerda que puedes consultar el diccionario de datos del SCINCE 2020 en https://bit.ly/3mtot15.