R aplicado a la ECH

Setiembre 2020
Gabriela Mathieu

Creative Commons Attribution 4.0 International License

¿Qué haremos hoy?Repaso del segundo taller

¿Qué haremos hoy?Repaso del segundo taller

Importar archivos sav y dta (haven)

¿Qué haremos hoy?Repaso del segundo taller

Importar archivos sav y dta (haven)

Usar etiquetas en variables categóricas (labelled)

¿Qué haremos hoy?Repaso del segundo taller

Importar archivos sav y dta (haven)

Usar etiquetas en variables categóricas (labelled)

Encadenar funciones: operador %>%

¿Qué haremos hoy?Repaso del segundo taller

Importar archivos sav y dta (haven)

Usar etiquetas en variables categóricas (labelled)

Encadenar funciones: operador %>%

Ejercicios

TidyveRse

tidyverse

Conjunto de paquetes para:

Importar

Limpiar y transformar

Procesar y analizar

Visualizar

Proporciona una forma unificada, armoniosa y más poderosa de trabajar con datos que la que ofrece el paquete base.

Importación/Exportación de archivos

Archivos de texto plano (txt, csv, tsv)

Formatos propietarios (dta, sav)

Archivos Excel (xls, xlsx)

Paquete jsolite, archivos JSON (JavaScript Object Notation)

Manipulación de datos

Trasformar estructura de datos

Manipular texto

Manipular fechas

Manipular data frame

Análisis y Visualización de datos

Gráficos y mapas

Modelización

haven

Importar datos Stata y SPSS

Si usamos get_microdata() solo para descargar los archivos del INE y no exportamos el objeto generado a RData sino a formatos externos a R, es necesario, para leer esos archivos usar el paquete haven.

Importar datos Stata y SPSS

install.packages("haven") # se instala desde el CRAN
library(haven) # lo cargo al entorno de trabajo

El paquete haven es parte de tidyverse y mejora las prestaciones de su antecesor foreign.

Importar datos Stata y SPSS

install.packages("haven") # se instala desde el CRAN
library(haven) # lo cargo al entorno de trabajo

El paquete haven es parte de tidyverse y mejora las prestaciones de su antecesor foreign.
Permite mantener las etiquetas de las variables y sus valores al usar la clase double y haven-labelled, haciendo referencia a los números y etiquetas respectivamente.

haven::read_spss()

Importar un archivo sav

La función read_spss() permite importar un archivo de SPSS en R. Mantiene las etiquetas de las variables y valores, creando la clase de doble condición haven_labelled y double.

Importar un archivo sav

La función read_spss() permite importar un archivo de SPSS en R. Mantiene las etiquetas de las variables y valores, creando la clase de doble condición haven_labelled y double.

También podemos usar la función read_sav(), que es un alias de la anterior.

Importar un archivo sav

# Leemos el archivo descargado con la función get_microdata() que contiene la base hogares.
h19 <- read_spss("data/H_2019_Terceros.sav")

# Exportamos a dta
write_dta(data = h19, path = "data/hogares_2019.dta")

Ejercicio

Importa el archivo de la base de hogares y personas en formato dta, y guarda en un objeto llamado ech2019. Usar la función read_dta().
Exporta el objeto en un archivo SPSS. Usar la función write_sav().

%>%

Encadenamiento de funciones en lugar de anidación