Exploración datos Censo México 2020
2021-11-09
Capítulo 1 Importación de datos cartográficos
- **Marco Geoestadístico
El Marco Geoestadístico es un sistema único y de carácter nacional diseñado por el INEGI, el cual presenta la división del territorio nacional en diferentes niveles de desagregación para referir geográficamente la información estadística de los censos y encuestas institucionales y de las Unidades del Estado, que se integra al Sistema Nacional de Información Estadística y Geográfica (SNIEG).
https://inegi.org.mx/temas/mg/#Descargas
Contenido
Mapa con las coordenadas estatles. Marco Geoestadístico, septiembre 2019 2019 3.11 GB https://inegi.org.mx/contenidos/productos//prod_serv/contenidos/espanol/bvinegi/productos/geografia/marcogeo/889463776079_s.zip
Ficha de información.
https://inegi.org.mx/app/biblioteca/ficha.html?upc=889463776079
Los nombres de archivos se conforman con las claves 00 y la capa con sufijos descriptivos del contenido del archivo: Donde:
- 00ent Polígonos de Áreas Geoestadísticas Estatales
- 00mun Polígonos de Áreas Municipales
- 00a Polígonos de Áreas Geoestadísticas Básicas Urbanas y Rurales
- 00l Polígonos de Localidades Urbanas y Rurales amanzanadas
- 00lpr Puntos de Localidades Rurales amanzanadas y no amanzanadas
Marco Geoestadístico. Censo de Población y Vivienda 2020 2020 2.65 GB https://inegi.org.mx/contenidos/productos//prod_serv/contenidos/espanol/bvinegi/productos/geografia/marcogeo/889463807469_s.zip
1.1 Cambio de acceso estatal en:
https://www.inegi.org.mx/programas/ccpv/2020/default.html#Datos_abiertos
Ficha de información https://inegi.org.mx/app/biblioteca/ficha.html?upc=889463807469
Se descarga y se descomprime localmente Se crea una carpeta para los datos geográficos
#La ruta para el mapa de México se toma del Marcogeostadístico nacional
<-"D:/Documents/Claudia/Midropbox/Investigacion y escritos/Marcogeoestadisticonacional/mg_sep2019_integrado/conjunto_de_datos"
rutam
#Lectura del mapa a nivel de entidades
<- readOGR(rutam,"00ent", use_iconv = TRUE, encoding = "latin1") basemapan
## OGR data source with driver: ESRI Shapefile
## Source: "D:\Documents\Claudia\Midropbox\Investigacion y escritos\Marcogeoestadisticonacional\mg_sep2019_integrado\conjunto_de_datos", layer: "00ent"
## with 32 features
## It has 3 fields
#presentación de la información de las entidades
tm_shape(basemapan) +
tm_polygons(col = "MAP_COLORS",
minimize = TRUE)
1.2 Para determinar las variables e indicadores
En el sitio https://www.inegi.org.mx/programas/ccpv/2020/default.html#Datos_abiertos
Se descarga de los “Principales resultados por localidad (ITER)” el de los Estados Unidos Mexicanos 2020" que es un archivo comprimido con el nombre de iter_00_cpv2020_csv.zip
Cuando se descomprime en la carpeta del diccionario_datos se encuentra el archivo con el nombre de diccionario_datos_iter_00CSV20.csv
Se creó un archivo con las variable para poderlas parametrizar en un archivo que lleva el nombre de variablescensales.csv
#La ruta para el archivo que tiene las variables censales y su descripción
<-"D:/Documents/Claudia/Midropbox/Investigacion y escritos"
rutvar
<-read.csv(paste0(rutvar,"/Censo2020/","variablescensales.csv"),header=TRUE, sep=",",encoding="UTF-8")
variablescensales
str(variablescensales)
## 'data.frame': 5 obs. of 6 variables:
## $ X.U.FEFF.numero: int 1 2 3 4 41
## $ indicador : chr "Población total" "Población femenina" "Población masculina" "Población de 0 a 2 años" ...
## $ descripcion : chr "Total de personas que residen habitualmente en el país, la entidad federativa, el municipio o la demarcación te"| __truncated__ "Total de mujeres que residen habitualmente en el país, la entidad federativa, el municipio o la demarcación ter"| __truncated__ "Total de hombres que residen habitualmente en el país, la entidad federativa, el municipio o la demarcación ter"| __truncated__ "Personas de 0 a 2 años de edad." ...
## $ mnemonico : chr "POBTOT" "POBFEM" "POBMAS" "P_0A2" ...
## $ rangos : chr "0...999999999" "0...999999999" "0...999999999" "0...999999999" ...
## $ longitud : int 9 9 9 9 9
1.3 Importación de datos censales
En el sitio del INEGI se encuentran los resultados del CENSO 2020 para cada una de las entidades de la población https://www.inegi.org.mx/programas/ccpv/2020/default.html#Datos_abiertos
Principales resultados por localidad (ITER)
Estados Unidos Mexicanos 2020
https://www.inegi.org.mx/contenidos/programas/ccpv/2020/datosabiertos/iter/iter_00_cpv2020_csv.zip
Para recuperar los datos censales a nivel estatal:
En el archivo se registra la población total de la entidad cuando en el nombre de la localidad aparece la leyenda “Total de la Entidad” esto se puede observar al descomprimirlo.
<-paste0("https://www.inegi.org.mx/contenidos/programas/ccpv/2020/datosabiertos/iter/iter_00_cpv2020_csv.zip")
url<- tempfile()
temp <- tempfile()
temp2 download.file(url, temp)
unzip(zipfile = temp, exdir = temp2)
<-file.path(temp2)
rut
<- read.csv(paste0(rut,"/","conjunto_de_datos/conjunto_de_datos_iter_00CSV20.csv"),header=TRUE, sep=",",encoding="UTF-8")
censonal<-censonal
censonalo#Datos de toda la entidad uso del campo nom_loc para identificar los valores de las variables a nivel estatal
<-subset(censonal,censonal$NOM_LOC %in% c("Total de la Entidad"))
censonal
#Se le da nombre de CVE_ENT al primer atributo de la tabla censonal
names(censonal)[1] <- "CVE_ENT"
#Ahora el mapa tiene el dato de las 198 variables del censo
#Conversión a número
#Se obtiene el mismo atributo CVE_ENT del marco geoestadístico
<-substr(basemapan$CVE_ENT,1,2)
codent
# Se convierte en un dato alfanumérico de dos digito como "01", "02",..."32"
="México"
latmx<-sprintf("%02d%s", as.numeric(gsub("[^0-9]+", "", codent)), gsub("[0-9]+", "", codent))
codent
#Se agrega el campo CVE_ENT al censo
$CVE_ENT<-codent
censonal
#Se extraen las columnas que contienen las variables censales para convertirlas a valores numéricas de tipo entero.
= c(11:231)
cols %<>% lapply(function(x) as.integer(as.character(x)))
censonal[,cols]
#Se integra el valor censal con el marco geoestadísto a través de la llave de la entidad CVE_ENT
<-merge(basemapan,censonal, by="CVE_ENT", all.x =TRUE) basemapa
1.4 Graficación de todas las variables
En el archivo "mplotVariableparametrizadanacional.R se encuentran las instucciones para graficar, y se ejecuta el proceso para las variables que se encuentran el el archivo variablescensales.csv
source("mplotVariableparametrizadanacional.R")
%>%
variablescensales pull(mnemonico) %>%
as.character()%>%
walk(mplotVariableparametrizadanacional)
1.5 POBTOT
Total de personas que residen habitualmente en el país, la entidad federativa, el municipio o la demarcación territorial y la localidad. Incluye la estimación del número de personas en viviendas particulares sin información de ocupantes. Incluye a la población que no especificó su edad.
## POBFEM
Total de mujeres que residen habitualmente en el país, la entidad federativa, el municipio o la demarcación territorial y la localidad. Incluye la estimación del número de mujeres en viviendas particulares sin información de ocupantes. Incluye a la población que no especificó su edad.
## POBMAS
Total de hombres que residen habitualmente en el país, la entidad federativa, el municipio o la demarcación territorial y la localidad. Incluye la estimación del número de hombres en viviendas particulares sin información de ocupantes. Incluye a la población que no especificó su edad.
## P_0A2
Personas de 0 a 2 años de edad.
## P_60YMAS
Personas de 60 a 130 años de edad.
1.5.1 Video
Este proceso se detalla en el siguiente video
Y este es el código del script. “mplotVariableparametrizadanacional.R”
mplotVariableparametrizadanacional <-function(varname){
glue(" ## {varname} ") %>% cat()
varindi<-variablescensales[variablescensales$mnemonico == {varname}, “descripcion”]
glue::glue (" {varindi} ") %>% cat()
mapa<-tm_shape(basemapa) +
tm_polygons({varname},
fill=as.numeric({varname}),
style=“jenks”,
palette=“YlOrBr”,
title= paste0({varname}," “,latmx),
alpha = 0.5) +
tm_scale_bar(position = c(”right“,”bottom“)) +
tm_layout(legend.position = c(”right“,”top"),asp=1 ,scale=0.5)
print(mapa)
cat(“”) }