MyNixOS website logo
Description

Extraction and Analysis of 2022 Argentina Census Microdata from REDATAM Databases.

Provides tools to extract, label, and read microdata from the 2022 National Census of Population, Households and Dwellings of Argentina stored in REDATAM databases officially distributed by INDEC. Implements a complete province-by-province extraction pipeline with efficient memory management, reconstruction of hierarchical identifiers, automatic variable labeling from official INDEC dictionaries, and integrity verification against published totals. Allows working with census data directly in R without knowledge of REDATAM syntax, and supports export to multiple formats including Parquet, CSV, SPSS and SAS. Census data must be downloaded directly from the official INDEC portal (<https://www.indec.gob.ar>). This package does not distribute census data. Duran (2026) <doi:10.5281/zenodo.19560728>.

censo2022arg

R-CMD-check License: GPL v3 DOI

censo2022arg permite extraer, etiquetar y leer los microdatos del Censo Nacional de Poblacion, Hogares y Viviendas 2022 de Argentina desde las bases REDATAM distribuidas oficialmente por el INDEC.

Caracteristicas principales

  • Extraccion completa de microdatos provincia por provincia
  • Reconstruccion de identificadores jerarquicos (vivienda, hogar, persona)
  • Etiquetado automatico de variables desde los diccionarios oficiales del INDEC
  • Verificacion de integridad contra los totales publicados por el INDEC
  • Gestion eficiente de memoria mediante subprocesos independientes
  • Salida en formato Parquet (default), CSV, SPSS o SAS
  • Compatible con cualquier base RedatamX (.rxdb)

Instalacion

Este paquete se apoya en redatamx de Jaime Salvador para la comunicacion con el motor REDATAM desarrollado por CELADE (CEPAL). Ambos se instalan automaticamente como dependencias.

# Version de desarrollo desde GitHub
# install.packages("remotes")
remotes::install_github("RodriDuran/censo2022arg")

Uso basico

library(censo2022arg)

# Ver el estado actual de la configuracion
censo_info()

# 1. Configurar el directorio de datos (solo la primera vez)
censo_configurar("/ruta/a/mis/datos/censo2022", persistent = TRUE)

# 2. Verificar el motor de extraccion y seguir las instrucciones
censo_verificar_engine()

# 3. Descargar las bases desde el INDEC (~500 MB)
censo_descargar()

# 4. Extraer los microdatos
extraer_redatam()                            # todas las provincias
extraer_redatam(provincias = 66)             # solo Salta (prueba rapida)
extraer_redatam(provincias = c(66, 38, 34)) # varias provincias

# 5. Etiquetar las variables con los diccionarios oficiales
censo_etiquetar()

# 6. Leer y analizar los datos

# Personas de Salta
personas <- censo_leer(base = "Personas", provincias = 66)

# Hogares de Salta y Jujuy, solo algunas variables
hogares <- censo_leer(
  base       = "Hogares",
  provincias = c(66, 38),
  columnas   = c("NBI_1", "NBI_2", "TIPHOGAR")
)

# Personas mayores de 18 con filtro aplicado antes de cargar en RAM
mayores <- censo_leer(
  base       = "Personas",
  provincias = 66,
  columnas   = c("EDAD", "CONDACT", "IDRADIO"),
  filtro     = quote(EDAD >= 18)
)

# Hogares de todo el pais como data.table
hogares_arg <- censo_leer(base = "Hogares", formato = "data.table")

# Extraer microdatos de cualquier base RedatamX generica
extraer_rxdb(dic_path = "/ruta/a/base.rxdb")

Bases disponibles

El INDEC distribuye tres bases complementarias del Censo 2022:

BaseArchivoContenido
VPcpv2022.rxdbViviendas particulares -- variables de persona, hogar y vivienda
POcpv2022.rxdbPueblos originarios, afrodescendientes e identidad de genero
VCcpv2022col.rxdbViviendas colectivas

El pipeline combina VP y PO automaticamente, obteniendo el radio censal de VP y las variables adicionales de PO.

Nota sobre los datos

Este paquete no distribuye datos del censo. Los datos deben descargarse directamente desde el portal oficial del INDEC: https://www.indec.gob.ar/indec/web/Institucional-Indec-BasesDeDatos

Los datos del Censo 2022 estan protegidos por la Ley N 17.622 de secreto estadistico. Su uso esta permitido exclusivamente con fines estadisticos y de investigacion.

Citacion

Si utilizas este paquete en tu investigacion, por favor citalo:

Durán, R. J. (2026). *censo2022arg: Extraccion y Procesamiento de Microdatos
del Censo Nacional 2022 de Argentina* (Version 1.0.0) [Software]. Zenodo.
https://doi.org/10.5281/zenodo.19560728

Licencia

GPL (>= 3). Ver LICENSE para mas detalles.

Metadata

Version

1.0.1

License

Unknown

Platforms (80)

    Darwin
    FreeBSD
    Genode
    GHCJS
    Linux
    MMIXware
    NetBSD
    none
    OpenBSD
    Redox
    Solaris
    uefi
    WASI
    Windows
Show all
  • aarch64-darwin
  • aarch64-freebsd
  • aarch64-genode
  • aarch64-linux
  • aarch64-netbsd
  • aarch64-none
  • aarch64-uefi
  • aarch64-windows
  • aarch64_be-none
  • arc-linux
  • arm-none
  • armv5tel-linux
  • armv6l-linux
  • armv6l-netbsd
  • armv6l-none
  • armv7a-linux
  • armv7a-netbsd
  • armv7l-linux
  • armv7l-netbsd
  • avr-none
  • i686-cygwin
  • i686-freebsd
  • i686-genode
  • i686-linux
  • i686-netbsd
  • i686-none
  • i686-openbsd
  • i686-windows
  • javascript-ghcjs
  • loongarch64-linux
  • m68k-linux
  • m68k-netbsd
  • m68k-none
  • microblaze-linux
  • microblaze-none
  • microblazeel-linux
  • microblazeel-none
  • mips-linux
  • mips-none
  • mips64-linux
  • mips64-none
  • mips64el-linux
  • mipsel-linux
  • mipsel-netbsd
  • mmix-mmixware
  • msp430-none
  • or1k-none
  • powerpc-linux
  • powerpc-netbsd
  • powerpc-none
  • powerpc64-linux
  • powerpc64le-linux
  • powerpcle-none
  • riscv32-linux
  • riscv32-netbsd
  • riscv32-none
  • riscv64-linux
  • riscv64-netbsd
  • riscv64-none
  • rx-none
  • s390-linux
  • s390-none
  • s390x-linux
  • s390x-none
  • sh4-linux
  • vc4-none
  • wasm32-wasi
  • wasm64-wasi
  • x86_64-cygwin
  • x86_64-darwin
  • x86_64-freebsd
  • x86_64-genode
  • x86_64-linux
  • x86_64-netbsd
  • x86_64-none
  • x86_64-openbsd
  • x86_64-redox
  • x86_64-solaris
  • x86_64-uefi
  • x86_64-windows