---
title: "Inferência estatística"
subtitle: "Aula 5"
author: "Bruno Montezano"
institute: "Grupo Alliance
Programa de Pós-Graduação em Psiquiatria e Ciências do Comportamento
Universidade Federal do Rio Grande do Sul"
date: last-modified
date-format: long
lang: pt-br
execute:
echo: true
format:
revealjs:
incremental: true
smaller: true
theme: [default, ../assets/custom.scss]
logo: "../assets/logo_ufrgs.png"
bibliography: references.bib
---
## Conteúdo de hoje
- Introdução
- População e amostra
- Testes de hipótese
- Hipótese nula e alternativa
- Interpretação de resultados
- Teste $\chi^2$
- Teste t
- ANOVA de uma via e teste de Tukey
- Correlação
## O que é estatística inferencial?
* Um dos principais objetivos ao fazer pesquisa é *generalizar as descobertas* para
toda a população
- Amostra $\rightarrow$ População
* Um **modelo estatístico** é uma *representação* de um fenômeno complexo que gerou
os dados
- Por vezes, assume pressupostos sobre as variáveis
* Quando pesquisamos, estamos interessados em testar hipóteses
- Suposição sobre o estado das coisas
- Podem ser substantivas (formulação textual ou semântica)
ou estatísticas (operacionalização da hipótese substantiva)
## George Box sobre os modelos estatísticos
*"All models are wrong, but some are useful"* [@box_1976].
![](../assets/george_box_photo.jpg){fig-align="center" width=50%}
## Hipóteses estatísticas
* Hipótese nula ($H_0$): a mais conservadora, advoga pela ausência de padrões ou associações, em geral o pesquisador não acredita
* Hipótese alternativa ($H_a$): apoia relação ou diferença entre as variáveis,
comumente a hipótese que motivou o pesquisador a coletar seus dados
* Em estatística frequentista, os testes testarão a adequação dos dados à
hipótese nula
. . .
$$\underbrace{O \,grupo \,que \,tomou \,antidepressivo \,apresenta \,menos \,sintomas \,depressivos}_\text{Hipótese substantiva}$$
$$H_0: \mu_{tomou} = \mu_{não \,tomou}$$
$$\underbrace{H_a: \mu_{tomou} < \mu_{não \,tomou}}_\text{Hipóteses estatísticas}$$
## $p$-valor
* O $p$-valor representa a probabilidade de obter um resultado tão extremo
ou mais extremo do que o observado, assumindo que a hipótese nula ($H_0$)
é verdadeira
* Se o $p$-valor for pequeno (geralmente <0,05), há evidências estatísticas
para rejeitar a hipótese nula ($H_0$) em favor da hipótese alternativa ($H_a$)
* O **$p$-valor não mede a magnitude da diferença ou efeito observado**,
apenas indica sua significância estatística
* Dentro da psiquiatria e da psicologia, **adotamos por convenção o nível
de significância de 0,05**
## Vamos ver alguns testes estatísticos!
![](../assets/meme_hipotese.jpg){fig-align="center" width=75%}
## Teste qui-quadrado de independência
* Usado para verificar se duas variáveis categóricas são independentes
* Pressupostos:
- Os dados são aleatórios e representativos da população
- As variáveis analisadas são categóricas
* Algumas hipóteses de pesquisa a serem respondidas pelo teste $\chi^2$:
- Verificar se sexo e escolha do curso de graduação são independentes
- Testar se classe social e reprovação na escola são independentes
- Avaliar se obesidade e morte por COVID-19 são independentes
## Exemplo de teste $\chi^2$ no R
```{r grafico-ilha-especie}
#| echo: false
#| out-width: "90%"
#| fig-align: "center"
library(dados)
library(ggplot2)
ggplot(pinguins,
aes(x = especie, fill = ilha)) +
geom_bar(position = "fill") +
labs(x = "Espécie",
y = "Proporção",
fill = "Ilha") +
ghibli::scale_fill_ghibli_d("PonyoMedium") +
scale_y_continuous(labels = scales::percent) +
theme_minimal(base_size = 21,
base_family = "Charter")
```
::: columns
::: {.column width="50%"}
```{r qui-quadrado-especie-ilha}
library(janitor)
# Criar tabela 3x3 com espécie e ilha
pinguins |>
tabyl(especie, ilha)
```
:::
::: {.column width="50%"}
```{r}
# Rodar um teste qui-quadrado de independência
chisq.test(pinguins$especie, pinguins$ilha)
```
:::
:::
## $V$ de Cramer
* Os $p$-valores quase nunca são informativos sobre a relevância dos resultados
* O **tamanho do efeito** é uma medida objetiva e padronizada sobre um efeito
observado
* O tamanho do efeito mais utilizado no teste $\chi^2$ é
o $V$ de Cramer
- Esta estatística gera valores entre 0 e 1
- A interpretação se baseia nos graus de liberdade
. . .
::: columns
::: {.column width="50%"}
| Graus de liberdade | Pequeno | Médio | Grande |
|--------------------|---------|-------|--------|
| 1 | 0,1 | 0,3 | 0,5 |
| 2 | 0,07 | 0,21 | 0,35 |
| 3 | 0,06 | 0,17 | 0,29 |
| 4 | 0,05 | 0,15 | 0,25 |
:::
::: {.column width="50%"}
```{r v-de-cramer-pinguins}
library(effectsize)
cramers_v(pinguins$especie,
pinguins$ilha,
alternative = "two.sided",
ci = 0.95)
```
:::
:::
## Teste t
* Frequentemente usado para testar hipóteses sobre diferenças entre até duas médias
* Pressupostos:
- Dados aleatórios e representativos da população
- Variável dependente contínua
- Resíduos do modelo são normalmente distribuídos
* Exemplos de uso do teste t:
- Verificar se o peso médio dos bebês da maternidade do HCPA é similar ao
esperado na população
- Verificar se as notas do ENEM diferem em estudantes da rede pública e privada
de ensino
- Verificar se o uso de uma medicação diminuiu os sintomas ansiosos dos pacientes
psiquiátricos após um mês
## Exemplo de teste t de duas amostras
Vamos supor que queremos verificar se há diferença na massa corporal dos pinguins
machos e fêmeas nos dados `pinguins` do pacote `dados`.
$$
H_0: \mu_{machos} - \mu_{fêmeas} = 0
$$
$$
H_a: \mu_{machos} - \mu_{fêmeas} \ne 0
$$
$$
\alpha = 0,05
$$
```{r histograma-massa-sexo}
#| echo: false
#| out-width: 100%
#| fig-align: "center"
library(dplyr)
pinguins |>
filter(!is.na(sexo)) |>
group_by(sexo) |>
mutate(sexo = if_else(sexo == "macho", "Macho", "Fêmea"),
media_massa = mean(massa_corporal)) |>
ggplot(
aes(
x = massa_corporal,
fill = sexo
)) +
geom_histogram(alpha = 0.65) +
labs(x = "Massa corporal",
y = "# de pinguins",
fill = "Sexo") +
ghibli::scale_fill_ghibli_d("YesterdayMedium", -1) +
theme_minimal(base_size = 16,
base_family = "Charter") +
geom_vline(aes(xintercept = media_massa, color = sexo), size = 2,
show.legend = FALSE) +
ghibli::scale_colour_ghibli_d("YesterdayMedium", -1)
```
## Teste t no R
```{r teste-t-massa-pinguins}
pinguins |>
filter(!is.na(sexo)) |>
group_by(sexo) |>
summarise(
media_massa = mean(massa_corporal, na.rm = TRUE),
dp_massa = sd(massa_corporal, na.rm = TRUE)
)
t.test(formula = massa_corporal ~ sexo,
data = pinguins,
paired = FALSE,
conf.level = 0.95)
```
## $d$ de Cohen
* O tamanho do efeito pode ser considerado um indicador da
relevância clínica dos grupos
* O $d$ de Cohen é usado para calcular a distância entre as médias das
distribuições sobrepostas
. . .
::: columns
::: {.column width="50%"}
| $d$ de Cohen | Interpretação |
|--------------|-------------|
| $d < 0,2$ | Irrelevante |
| $d \ge 0,2$ | Pequeno |
| $d \ge 0,5$ | Moderado |
| $d \ge 0,8$ | Grande |
:::
::: {.column width="50%"}
```{r d-cohen-pinguins}
cohens_d(
massa_corporal ~ sexo,
data = pinguins,
pooled_sd = FALSE,
paired = FALSE,
ci = 0.95
)
```
:::
:::
## ANOVA de uma via
* A ANOVA (análise da variância) representa um conjunto de procedimentos para verificar
diferenças médias entre vários grupos
- Basicamente um super teste t
- Também pode ser entendido como um caso especial de um modelo de regressão
- Uma das análises mais usadas em Psicologia [@chartier_2008]
* Possíveis perguntas de pesquisa:
- Qual é a diferença de três medicamentos diferentes na redução dos sintomas
de depressão em pacientes diagnosticados com transtorno depressivo maior?
- Há diferenças significativas nas medidas de ansiedade entre grupos de
diferentes faixas etárias?
- Existe uma diferença nos níveis de estresse percebido entre pessoas
que vivem em diferentes países?
## Exemplo de ANOVA no R
Vamos novamente verificar a diferença na massa corporal, porém agora
entre as ilhas do Arquipélago Palmer.
::: columns
::: {.column width="40%"}
```{r bar-plot-ilha-massa}
#| out-width: 100%
#| fig-align: "center"
#| echo: false
pinguins |>
ggplot(aes(x = ilha,
y = massa_corporal,
fill = ilha)) +
geom_boxplot() +
labs(y = "Massa corporal",
x = "Ilha") +
ghibli::scale_fill_ghibli_d(name = "MononokeLight") +
scale_y_continuous(labels = \(x) paste0(as.character(x), "g")) +
theme_minimal(base_size = 24,
base_family = "Charter") +
theme(legend.position = "none")
```
Visualmente, parece que os pinguins da `ilha` Biscoe apresentam uma média maior
de `massa_corporal` em relação às outras ilhas.
:::
::: {.column width="60%"}
```{r anova-uma-via-ilha-massa}
anova_massa_ilha <- aov(massa_corporal ~ ilha,
data = pinguins)
summary(anova_massa_ilha)
TukeyHSD(anova_massa_ilha)
```
:::
:::
## Correlação
* Procedimento usado para verificar relação entre duas variáveis
* Qual coeficiente escolher? Dica de leitura: @khamis_2008
. . .
| Nível de medida | Correlação |
|--------------|-------------|
| Variáveis são normais | Produto momento de Pearson |
| Variáveis não são normais | $\rho$ de Spearman ou $\tau$ de Kendall |
* Na psicometria, correlações tetracóricas ou policóricas são muito comuns
* Como interpretar?
- Varia de -1 a 1
. . .
| Valor | Sinal positivo (+) | Sinal negativo (-) |
|-------|--------------------|--------------------|
| 0,1 | Fraca positiva | Fraca negativa |
| 0,3 | Moderada positiva | Moderada negativa |
| 0,5 | Forte positiva | Forte negativa |
## Propriedades da correlação de Pearson
1. Limitado entre -1 e 1, com 0 sendo a ausência de correlação
2. O sinal indica a natureza, e o número, a força
3. A correlação de uma variável com ela mesma é 1
4. É simétrica, ou seja, $r(x, y) = r(y, x)$
5. Adimensional e invariante em transformações lineares
6. Sensível aos *outliers*
7. Não indica causalidade
## Exemplo de correlação em R
::: columns
::: {.column width="50%"}
```{r dispersao-massa-comprimento-bico}
#| echo: false
#| out-width: 100%
#| fig-align: "center"
pinguins |>
ggplot(aes(x = massa_corporal,
y = comprimento_bico)) +
geom_point(color = "#00468b99",
alpha = 0.7,
size = 2) +
labs(x = "Massa corporal (em gramas)",
y = "Comprimento do bico (em mm)") +
theme_minimal(base_size = 21,
base_family = "Charter")
```
:::
::: {.column width="50%"}
```{r correlacao-massa-comprimento-bico}
cor.test(pinguins$massa_corporal,
pinguins$comprimento_bico,
method = "pearson",
conf.level = 0.95)
```
:::
:::
. . .
Parece que nós temos uma correlação forte e positiva entre massa corporal e
comprimento do bico nos pinguins (*r* = 0,59; *p*<0,001).
. . .
Dica de um site divertido: [Guess the Correlation](https://www.guessthecorrelation.com/)
## Alternativas não-paramétricas
* Eventualmente, quando os pressupostos do modelo são violados, a literatura tradicional
indica o uso de testes não-paramétricos com propostas semelhantes
* Outros autores sugerem que sempre testes não-paramétricos sejam usados em resultados
obtidos por processo de avaliação psicológica, com argumento de que os dados têm
nível de medida ordinal
. . .
| Teste paramétrico | Teste não-paramétrico | Função no R |
|--------------------------|-------------------------|------------------|
| Teste t de duas amostras | Teste U de Mann-Whitney | `wilcox.test()` |
| ANOVA de uma via | Teste de Kruskal-Wallis | `kruskal.test()` |
## Referências
::: {#refs}
:::
## Tarefa de casa
A partir da base dos `pinguins` do pacote `dados`:
1. Calcule a correlação produto momento de Pearson entre o comprimento
do bico e a profundidade do bico dos pinguins. Crie um gráfico de pontos
(dispersão) com `ggplot2` para acompanhar sua análise exploratória.
2. Rode um teste t para verificar a diferença na média do comprimento da
nadadeira entre os pinguins macho e fêmea. Usando as funções `group_by()` e
`summarise()` do pacote `dplyr`, faça um resumo da média e da mediana dos
comprimentos das nadadeiras estratificando pelos grupos.
- Lembre-se que a base `pinguins` possui onze valores ausentes (`NA`) na coluna
do `sexo`.
3. Crie um modelo de ANOVA de uma via para verificar se há diferenças na massa
corporal dos pinguins baseado em sua espécie. Caso sim, rode um teste de Tukey
para analisar quais grupos diferenciam entre si.