-
Notifications
You must be signed in to change notification settings - Fork 2
/
Copy pathRelatorio_penguin_Semabio.Rmd
183 lines (144 loc) · 4.96 KB
/
Relatorio_penguin_Semabio.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
---
title: "Gráficos com dados de Pinguins"
author: "Carolina Musso"
date: "2023-11-29"
output:
html_document:
self-contained: true
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = F)
```
## Introdução
Este relatório apresenta uma análise a da base de dados 'Palmer Penguins', um recurso emergente e instrutivo no domínio da ciência de dados e estatística. A base de dados foi coletada pela Dra. Kristen Gorman com o Programa de Pesquisa Polar Palmer Station, Antártica. Os dados abrangem três espécies de pinguins encontradas nas ilhas próximas à Estação Palmer: Adelie, Chinstrap e Gentoo.
Com 344 observações, esta base de dados inclui medidas como o tamanho do bico, a profundidade do bico, o comprimento das nadadeiras, a massa corporal dos pinguins, além de informações sobre a espécie, sexo e local de coleta.
Este relatório não apenas serve como uma exploração aprofundada da base de dados biológicos realista e relevante, mas também como um exemplo prático da utilização do relatorios automatizados em Rmarkdown.
# Material e métodos
Neste relatório, utilizaremos métodos de análise exploratória de dados para explorar as características físicas dos pinguins e as diferenças entre as espécies. Nosso foco será em destacar padrões interessantes, identificar correlações potenciais e proporcionar insights visuais por meio de gráficos e análises estatísticas.
```{r}
# Carregando os pacotes necessários
if (!require(pacman)) install.packages("pacman")
pacman::p_load(palmerpenguins, tidyverse,
ggstatsplot,gtsummary, ggpubr)
# Carregando os dados
data("penguins")
penguins <- na.omit(penguins) # Removendo observações com valores ausentes
```
```{r}
ggplot(penguins, aes(x = bill_length_mm, y = bill_depth_mm, color = species)) +
geom_point() +
labs(title = "Comprimento x Profundidade do Bico por Espécie",
x = "Comprimento do Bico (mm)",
y = "Profundidade do Bico (mm)")
```
```{r}
# Carregar o pacote ggpubr
ggscatter(penguins,
x = "bill_length_mm",
y = "bill_depth_mm",
add = "reg.line", # Add regression line
conf.int = TRUE, # Add confidence interval
color = "species", palette = "jco", # Color by groups "cyl"
shape = "species"
)+
stat_cor(aes(color = species), label.x = 3)
library(ggpubr)
ggscatter(penguins,
x = "bill_length_mm",
y = "bill_depth_mm",
add = "reg.line", # Adicionar linha de regressão
conf.int = TRUE, # Adicionar intervalo de confiança
color = "species",
palette = "Set1"
) +
stat_cor(aes(color = species),
label.x = c(30, 40, 50),label.y=22) +
labs(x="Comprimento do Bico (mm)",
y= "Profundidade do Bico (mm)") # Ajustar posição dos labels
ggscatter(
data = penguins,
x = "bill_length_mm",
y = "bill_depth_mm",
color = "species",
palette = "jco",
add = "reg.line",
conf.int = TRUE,
cor.coef = TRUE,
cor.method = "pearson",
xlab = "Comprimento do Bico (mm)",
ylab = "Profundidade do Bico (mm)",
ggtheme = theme_pubr()
) +
theme(
plot.title = element_text(size = 14)
) +
labs(
title = "Dispersão do Tamanho do Bico por Espécie"
)
```
```{r}
# Tabela resumo com gtsummary
table1 <- penguins %>%
select(-year) %>%
tbl_summary(
by = species,
type = list(
where(is.numeric) ~ "continuous",
where(is.factor) ~ "categorical"
),
statistic = list(
all_continuous() ~ "{mean} ({sd})",
all_categorical() ~ "{n} / {N} ({p}%)"
)
)
# Adicionar testes estatísticos
table1 <- table1 %>%
add_p(test = list(
where(is.numeric) ~ "kruskal.test",
where(is.factor) ~ "chisq.test"
))
# Mostrar a tabela
table1
```
```{r}
# Carregar pacote necessário
library(ggpubr)
library(dplyr)
# Função para criar um gráfico para uma espécie específica
create_species_plot <- function(species_name) {
penguins %>%
filter(species == species_name) %>%
ggscatter(
x = "bill_length_mm",
y = "bill_depth_mm",
add = "reg.line",
conf.int = TRUE,
cor.coef = TRUE,
cor.method = "pearson",
xlab = "Comprimento do Bico (mm)",
ylab = "Profundidade do Bico (mm)",
ggtheme = theme_pubr()
) +
labs(
title = paste("Dispersão do Tamanho do Bico para", species_name)
)
}
# Criar gráficos separados para cada espécie
plot_adelie <- create_species_plot("Adelie")
plot_chinstrap <- create_species_plot("Chinstrap")
plot_gentoo <- create_species_plot("Gentoo")
# Combinar os gráficos
ggarrange(plot_adelie, plot_chinstrap, plot_gentoo, ncol = 3, nrow = 1)
```
# Bonus
## Testes bayesianos
```{r}
ggbetweenstats(
data = penguins,
x = species,
y = body_mass_g,
title = "Comparação da Massa Corporal entre Espécies",
xlab = "Espécie",
ylab = "Massa Corporal (g)"
)
```