{arcenso}
⭐⭐⭐

Data from Argentina’s Population Census

Andrea Gomez Vargas & Emanuel Ciardullo

R-Ladies & R en Buenos Aires

2024-12-20

Un poco de historia

Crecer en comunidad

arcenso



Es un proyecto apoyado por el Programa de Campeones y Campeonas de rOpenSci cohorte 2023-2024, con Andrea Gómez Vargas como desarrolladora principal, Emanuel Ciardullo como co-desarrollador y Luis D. Verde como mentor.

Equipo

Andre

Luis

Ema

Tami



Fito - supervisor

rOpenSci Champions Program ⭐⭐⭐

Objetivo

El programa se diseña para identificar, reconocer y premiar a miembros apasionados de las comunidades.

Con una duración de 12 meses que incluye formación basada en cohortes, desarrollo de un proyecto y mentorias 1:1. Y un estipendio de $1.000 USD al completar el programa




logo rOpenSci

¿Cuál fue la propuesta?


Generar un paquete que permita disponer de los datos oficiales de los censos nacionales de población en Argentina provenientes del INDEC desde 1970 hasta 2022, homogeneizados, ordenados y listos para usar.

Propuesta

De cuadros de excel a tablas ordenadas en R

cuadro de excel descargado

tabla ordenada en R

¿Por qué?


Actualmente los resultados históricos censales de 1970, 1980, 1991, 2001, 2010 y 2022 están disponibles en distintos formatos a través de libros físicos, PDFs, archivos en formato excel o en REDATAM, sin contar con un sistema o formato unificado que permita trabajar con los datos de estos seis periodos censales como base de datos.

Proceso de trabajo

pregunta - problema

¿Cómo empezar?

Antes de las funciones: diseño conceptual

Problema

Lluvia de excels y formatos no estandarizados

Fabrica de excels



Año censal Alcance nacional Alcance jurisdiccional Total
1970 21 312 333
1980 60 1176 1236


+1500 excels por los censos de 1970 y 1980

¿Cómo nos organizamos?

Etapas censales

Manos a la obra 🛠️



  • webscraping para descarga de cuadros censales

  • listar los archivos descargados extrayendo su información

  • para la conversión de los cuadros de excel en formato tidy en Rbase

Armar {arcenso} 📦

Paquetes

hex de paquetes de trabajo

¿Cómo usarlo?


Instalación

# install.packages("remotes")
remotes::install_github("SoyAndrea/arcenso")



Activación del paquete

library(arcenso)

Principales funciones

get_census()

get_census(year = 1970, 
           topic = "CONDICIONES HABITACIONALES", 
           geolvl = "Total del país")


check_repository()

check_repository(year = 1970, 
                 topic = "CONDICIONES HABITACIONALES", 
                 geolvl = "Total del país")


arcenso()

arcenso() # shinyapp consulta

Veamos un ejemplo práctico

Próximos pasos y metas 💫

👣

  • mejorar la documentación
  • continuar con el roadmap por etapas y el proceso de clasificación, revisión y formateo.
  • lograr los estandares óptimos para llegar al peer-review
  • sumar a mas usuarios a utilizar el paquete

2025

Sumate a las actividades



  • rOpenSci Champions Program 2025

  • Software Peer Review

  • Community Calls

  • Coworking

Preguntas 😁

Gracias 😁