{arcenso}: primeros pasos desarrollando un paquete en comunidad con rOpenSci

Andrea Gomez Vargas & Emanuel Ciardullo

arcenso


hex arcenso

Es un proyecto apoyado por el programa de Campeones y Campeonas de rOpenSci cohorte 2023-20241, con Andrea Gómez Vargas como desarrolladora principal, Emanuel Ciardullo como co-desarrollador y Luis D. Verde como mentor.

rOpenSci Champions Program

Objetivo


El programa se diseña para identificar, reconocer y premiar a miembros apasionados de las comunidades.1

Con una duración de 12 meses que incluye formación basada en cohortes, desarrollo de un proyecto y mentorias 1:1.



logo rOpenSci

Enfoque - cohorte 2023-2024

cohorte ropensci champios



El programa está enfocado y pensando para que participen personas que pertenecen a grupos histórica y sistemáticamente excluidos de las comunidades de software abierto y de software de investigación y que están interesadas en contribuir a rOpenSci y al ecosistema más amplio de comunidades de software de código abierto y de investigación.

¿Cuál fue(es) mi proyecto?


Generar un paquete que permita disponer de los datos oficiales de los censos nacionales de población en Argentina provenientes del INDEC desde 1970 hasta 2022, homogeneizados, ordenados y listos para usar.

¿Por qué?


Actualmente los resultados históricos censales de 1970, 1980, 1991, 2001, 2010 y 2022 están disponibles en distintos formatos a través de libros físicos, PDFs, archivos en formato excel o en REDATAM, sin contar con un sistema o formato unificado que permita trabajar con los datos de estos seis periodos censales como base de datos.

Propuesta

De cuadros de excel a tablas ordenadas en R

cuadro de excel descargado

tabla ordenada en R

¿Por qué son importante los datos censales?

  • Es una herramienta clave para entender las caracteristicas y necesidades de la población.

  • Proporcionan datos esenciales para la planificación y el desarrollo de las políticas públicas.

  • Planificación social y económica

  • Investigación académica y estudios sociales

  • Investigaciones de mercado y mucho más…

Proceso de trabajo

pregunta - problema

¿Cómo empezar?

logos censales de argentina

meme

Trainings


rOpenSci image


Participación en capacitaciones que incluyeron temáticas sobre conocimientos técnicos en desarrollo y revisión de software, contribuciones a los proyectos de rOpenSci y de R, entre otros.

Mentorias & encuentros

Seguimiento personalizado del proyecto con mi mentor, participantes del programa y community manager de rOpenSci para compartir avances, experiencias y sugerencias colectivamente. Y tuve la fortuna de conocer a algunos en persona en la posit::conf de este año.

Antes de las funciones: diseño conceptual

Manos a la obra 🛠️


  • webscraping para descarga de cuadros censales

  • listar los archivos descargados extrayendo su información

  • para la conversión de los cuadros de excel en formato tidy en Rbase

Problemas: lluvia de excels y formatos no estandarizados

¿Cómo nos organizamos?

Etapas censales

Github projects - status del proyecto

issues en github para seguimiento

{arcenso} 📦

¿Cómo funciona?


Instalación

# install.packages("remotes")
remotes::install_github("SoyAndrea/arcenso")



Activación del paquete

library(arcenso)

get_census() - obtener tablas

get_census( year = 1970, topic = "CONDICIONES HABITACIONALES", geolvl = "Total del país")
#> $c70_total_del_pais_poblacion_c18
#>                   regimen_de_tenencia hogares personas  cuartos
#> 1                         Propietario 3553250 13778700 11197900
#> 2            Inquilino o arrendatario 1380950  4692800  3305350
#> 3 Ocupante en relación de dependencia  353300  1402500   880050
#> 4                   Ocupante gratuito  575650  2271150  1196500
#> 5                    En otro carácter  192950   816350   419800
#> 
#> $c70_total_del_pais_poblacion_c20
#>     tama?o_hogar                     regimen_tenencia hogares
#> 1   De 1 persona                                Total  615900
#> 2   De 1 persona                          Propietario  255900
#> 3   De 1 persona             Inquilino o arrendatario  199350
#> 4   De 1 persona Ocupante con relación de dependencia   52600
#> 5   De 1 persona                    Ocupante gratuito   82100
#> 6   De 1 persona                                 Otro   25950
#> 7  De 2 personas                                Total 1125250
#> 8  De 2 personas                          Propietario  652950
#> 9  De 2 personas             Inquilino o arrendatario  302400
#> 10 De 2 personas Ocupante con relación de dependencia   49250
#> 11 De 2 personas                    Ocupante gratuito   91300
#> 12 De 2 personas                                 Otro   29350
#> 13 De 3 personas                                Total 1230600
#> 14 De 3 personas                          Propietario  744800
#> 15 De 3 personas             Inquilino o arrendatario  290650
#> 16 De 3 personas Ocupante con relación de dependencia   62150
#> 17 De 3 personas                    Ocupante gratuito  103200
#> 18 De 3 personas                                 Otro   29800
#> 19 De 4 personas                                Total 1255000
#> 20 De 4 personas                          Propietario  787900
#> 21 De 4 personas             Inquilino o arrendatario  266000
#> 22 De 4 personas Ocupante con relación de dependencia   65650
#> 23 De 4 personas                    Ocupante gratuito  102850
#> 24 De 4 personas                                 Otro   32600
#> 25 De 5 personas                                Total  818550
#> 26 De 5 personas                          Propietario  516100
#> 27 De 5 personas             Inquilino o arrendatario  157500
#> 28 De 5 personas Ocupante con relación de dependencia   48200
#> 29 De 5 personas                    Ocupante gratuito   71550
#> 30 De 5 personas                                 Otro   25200
#> 31 De 6 personas                                Total  443250
#> 32 De 6 personas                          Propietario  272000
#> 33 De 6 personas             Inquilino o arrendatario   80000
#> 34 De 6 personas Ocupante con relación de dependencia   29000
#> 35 De 6 personas                    Ocupante gratuito   45750
#> 36 De 6 personas                                 Otro   16500
#> 37 De 7 personas                                Total  276750
#> 38 De 7 personas                          Propietario  163400
#> 39 De 7 personas             Inquilino o arrendatario   44950
#> 40 De 7 personas Ocupante con relación de dependencia   19950
#> 41 De 7 personas                    Ocupante gratuito   35200
#> 42 De 7 personas                                 Otro   13250
#> 43 De 8 personas                                Total  121450
#> 44 De 8 personas                          Propietario   70600
#> 45 De 8 personas             Inquilino o arrendatario   18250
#> 46 De 8 personas Ocupante con relación de dependencia   10050
#> 47 De 8 personas                    Ocupante gratuito   16250
#> 48 De 8 personas                                 Otro    6300
#> 49 De 9 personas                                Total   76000
#> 50 De 9 personas                          Propietario   40950
#> 51 De 9 personas             Inquilino o arrendatario    9400
#> 52 De 9 personas Ocupante con relación de dependencia    7150
#> 53 De 9 personas                    Ocupante gratuito   12900
#> 54 De 9 personas                                 Otro    5600
#> 55   De 10 y más                                Total   93350
#> 56   De 10 y más                          Propietario   48650
#> 57   De 10 y más             Inquilino o arrendatario   12450
#> 58   De 10 y más Ocupante con relación de dependencia    9300
#> 59   De 10 y más                    Ocupante gratuito   14550
#> 60   De 10 y más                                 Otro    8400

check_repository() - reporte de tablas disponibles


check_repository( year = 1970, topic = "CONDICIONES HABITACIONALES", geolvl = "Total del país")
#>                            Archivo
#> 1 c70_total_del_pais_poblacion_c18
#> 2 c70_total_del_pais_poblacion_c20
#>                                                                                                      Titulo
#> 1    Cuadro 18. Total del país. Hogares particulares, personas y cuartos, por régimen de tenencia. Año 1970
#> 2 Cuadro 20. Total del país. Hogares particulares, por tamaño del hogar según régimen de tenencia. Año 1970

arcenso() - shinyapp de consulta

arcenso()

Documentación

Próximos pasos y metas 💫

👣

  • mejorar la documentación
  • continuar con el roadmap por etapas y el proceso de clasificación, revisión y formateo.
  • lograr los estandares óptimos para llegar al peer-review
  • sumar a mas usuarios a utilizar el paquete

Lo más importante

Gracias 😁

Andrea

rOpenSci Champion

Socióloga

Emanuel

Estadístico

Fito

Supervisor