-
Notifications
You must be signed in to change notification settings - Fork 0
/
RelatórioFinal.R
180 lines (144 loc) · 8.6 KB
/
RelatórioFinal.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
---
title: "O que brasileiros e brasileiras casados pensam sobre os trabalhos
doméstico e de cuidado não remunerado? Uma análise
feita a partir de dados do Changing Family
and Gender Values (ISSP)
de 2002"
author: "Maria Elisa Rocha Couto Gomes"
date: "26 de outubro de 2021"
output:
prettydoc::html_pretty:
theme: cayman
---
# Changing Family and Gender Values 2002 ----------------------------------
# Relatório final
# R para Ciência de Dados I
# Extração dos dados ------------------------------------------------------
# 1º - ativando os principais pacotes cujas funções serão utilizadas:
library(haven)
library(tidyverse)
library(foreign)
library(ggplot2)
library(patchwork)
library(dplyr)
# 2º - extraindo os dados do arquivo .dta original (mantendo os valores das
# labels):
ZA3880_v1_1_0 <-
foreign::read.dta("C:/Users/elisa/Downloads/changing.dta",
convert.dates = TRUE,
convert.factors = TRUE,
missing.type = FALSE,
convert.underscore = FALSE,
warn.missing.labels = TRUE)
# Não procurar outro pacote, trocar manualmente. naif dplyr
# Organizando a base de dados ---------------------------------------------
# 1º - filtrando a base para manter apenas os casos de entrevistados brasileiros
# que estavam na amostra da pesquisa em 2002:
brasil <- ZA3880_v1_1_0 %>%
group_by(COUNTRY) %>%
filter(COUNTRY == "Brazil (BR)")
# 2º - selecionando as variáveis de interesse para minha análise. Isto é, todas
# as que estão relacionadas com trabalho doméstico e de cuidado não remunerado
# e algumas referentes às características sociodemográficas dos respondentes:
brasil_vs <- brasil %>%
select(v3, COUNTRY, v7, v8, v11, v12, v13, v18,
v19, v20, v24, v25, v26, v27, v28, v30,
v31, v32, v33, v34, v35, v36, v37, v38,
v39, v40, v44, v45, v48, v50, v51, v54,
v66, v67, v69, v70, v71, v201, v200,
v202, v204, v239, v240, v246,
v249, v250, v359, v361) %>%
mutate(v200teste = na_if(v200, "Na, refused"))
count(brasil_vs, v200, v200teste)
# 3º - filtrando os casos para que apenas os respondentes casados ou que
# coabitam com seus parceiros permaneçam em minha amostra.
brasil_casados_vs <- brasil_vs %>%
group_by(v202) %>%
filter(v202 == "Marr,liv as mar")
# Organizando as variáveis: renomeando e traduzindo as labels -------------
# 1º - Renomenando as variáveis:
names(brasil_casados_vs)[names(brasil_casados_vs) == "v3"] <- "identificador"
names(brasil_casados_vs)[names(brasil_casados_vs) == "COUNTRY"] <- "país"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v7"] <- "mulher_casa_filhos"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v8"] <- "casa_realização"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v11"] <- "trab_homem_mulher"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v12"] <- "homem_domésticas"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v13"] <- "homem_cuidado"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v18"] <- "casamento_feliz"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v19"] <- "casamento_ruim"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v20"] <- "casamento_filhos"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v24"] <- "divórcio"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v25"] <- "filhos_felicidade"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v26"] <- "filhos_vazio"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v27"] <- "licença_maternidade"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v28"] <- "pais_benefícios"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v30"] <- "lavar_roupa"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v31"] <- "pequenos_reparos"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v32"] <- "doença_parentes"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v33"] <- "compras"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v34"] <- "limpeza"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v35"] <- "comida"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v36"] <- "horas_trab_dom"
names(brasil_casados_vs)[names(brasil_casados_vs) =="v37"] <- "horas_dom_parceiro"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v38"] <- "divisão_tar_dom"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v39"] <- "conflito_tar_dom"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v40"] <- "decisões_crianças"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v44"] <- "sobrecarga_tar_dom"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v45"] <- "stress_casa"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v48"] <- "cansaço_tar_dom"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v50"] <- "cansaço_dom_trab"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v51"] <- "concentração_trab"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v54"] <- "familia_satisfação"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v66"] <- "crianças_adolescentes"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v67"] <- "crianças_pequenas"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v69"] <- "total_crianças_adolescentes"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v70"] <- "edu_parceiro"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v71"] <- "horas_trab_parceiro"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v201"] <- "idade"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v200"] <- "sexo"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v202"] <- "status_marital"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v204"] <- "anos_escolaridade"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v239"] <- "emprego_status"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v240"] <- "horas_trab"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v246"] <- "emprego_status_parceiro"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v249"] <- "rendimento"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v250"] <- "renda_familiar"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v359"] <- "identidade_etnica"
names(brasil_casados_vs)[names(brasil_casados_vs) == "v361"] <- "peso"
# Estatísticas descritivas ------------------------------------------------
# Não usar acento no nome das variaveis
#1º gráfico - Número de homens e mulheres entrevistados na amostra brasileira
sexo_gráfico <- brasil_casados_vs %>%
group_by(sexo) %>%
summarise(num_sexo = n()) %>%
ungroup() %>%
ggplot() +
geom_col(aes(x = sexo, y = num_sexo, fill = sexo), show.legend = TRUE) +
scale_fill_viridis_d(labels = c("Masculino", "Femino")) +
labs(y = "Número de entrevistados", fill = "Sexo",
title = "Número de entrevistados de acordo com seu sexo",
caption = "Changing Family and Gender Values, 2002, International
Social Programme (ISSP)") +
theme_minimal()
sexo_gráfico <- sexo_gráfico + theme(axis.title.x = element_blank(),
axis.ticks.x = element_blank(),
axis.text.x = element_blank())
print(sexo_gráfico)
# 2º gráfico - Rendimento médio por sexo dos entrevistados
rendimento_médio_gráfico <- brasil_casados_vs %>%
group_by(sexo) %>%
summarize(rendimento_medio = mean(rendimento, na.rm = TRUE)) %>%
ggplot() +
geom_col(aes(x = sexo, y = rendimento_medio, fill = sexo), show.legend = TRUE) +
scale_fill_viridis_d(labels = c("Masculino", "Femino")) +
labs(y = "Rendimento médio em R$", fill = "Sexo",
title = "Rendimento médio em R$ por sexo dos entrevistados",
caption = "Changing Family and Gender Values, 2002, Internacional
Social Survey Programme (ISSP)")+
theme_minimal()
rendimento_médio_gráfico <- rendimento_médio_gráfico +
theme(axis.title.x = element_blank(),
axis.ticks.x = element_blank(),
axis.text.x = element_blank())
print(rendimento_médio_gráfico)
sexo_gráfico + rendimento_médio_gráfico