Inferência estatística pode ser feita de 3 formas:
Estimativa pontual
Amostra
Inferências sobre médias – uma
amostra
1
• 1º passo: Escolha do teste a usar;
• 2º passo: Definição de hipóteses;
• 3º passo: Indicação do nível de significância;
• 4º passo: Valor observado;
• 5º passo: Valor tabelado;
• 6º passo: Conclusões;
2
• Muitas vezes é também usado o valor prova (valor -
p) para concluir num teste de hipóteses;
• Este valor- p é uma probabilidade;
– Probabilidade de obter um valor tão ou mais extremo do
que o valor observado sob a hipótese nula verdadeira;
– probabilidade de os dados concordarem com H0, sendo
H0 verdadeira;
3
• 1º passo: Escolha do teste a usar;
• 2º passo: Definição de hipóteses;
• 3º passo: Indicação do nível de significância;
• 4º passo: Valor p;
• 5º passo: Conclusões;
4
• Se valor p < α Rejeitar H0
• Se valor p ≥ α Não rejeitar H0
5
• A escolha do teste a usar, depende entre outros:
– Da natureza da variável em estudo;
– Da natureza da amostra.
6
• Uma amostra:
– Exemplo: Através de um relatório europeu supõe-se
que a média de idades dos técnicos de saúde a
desempenhar funções em locais públicos seja 35
anos. Será que o mesmo se verifica em Portugal?
7
• Duas amostras emparelhadas:
– Exemplo: Será que a quantidade de oxigénio no
sangue difere antes e após um treino cardio-
respiratório?
8
• Duas amostras independentes:
– Exemplo: Será que a idade de diagnóstico de tumor
gástrico é diferente entre indivíduos do sexo
masculino e indivíduos do sexo feminino?
9
• Muitos dos métodos de Inferência Paramétrica
pressupõem a normalidade dos dados (i.e., que os
dados têm uma distribuição Normal), o que pode ser
verificado através de testes de hipóteses, tais como:
– Shapiro-Wilk;
– Kolmogorov-Smirnov;
10
• Objectivo - testar as seguintes hipóteses:
H0: A variável segue uma distribuição normal
versus
H1: A variável não segue uma distribuição normal
11
Se a dimensão amostral for pequena (n<30), a
utilização não adequada do teste t pode dar
origem a valores de prova inferiores ao valor
correcto ou intervalos de confiança mais
pequenos.
12
Iremos rejeitar mais vezes a hipótese nula e
concluir erradamente que existe diferença
mais frequentemente do que é explicitamente
suposto por α.
13
• Quando temos menos de 30 casos!
• Comandos: Analyze -> Descriptive Statistics ->
Explore
– Dependent list: Variável a testar
– Botão Plots: Normality Plots with tests
14
• Teste de Kolmogorov –Shapiro
– Hipóteses:
H0: A variável idade segue uma distribuição normal
H1: A variável idade não segue uma distribuição normal
• Conclusão: Como p ≈ 0,2 > 0,05 não rejeitamos H0. Não existem evidências
estatísticas para afirmar que a variável idade não segue uma distribuição normal.
• Vamos assumir que a variável idade segue uma distribuição normal na população.
15
Processo inferencial sobre a média da população
μ (desconhecida) a partir de uma amostra (quando
a população segue uma distribuição normal).
16
• Baseia-se na distribuição Normal N(0,1), quando o
desvio padrão da população, σ, é conhecido;
• Baseia-se na distribuição t de Student, quando o
desvio padrão da população, σ, não é conhecido,
mas apenas é conhecida a sua estimativa, s,
calculada a partir da amostra.
17
Se a distribuição das médias amostrais seguir a
distribuição normal e se σ for conhecido o cálculo de
intervalos de confiança e os testes de significância para μ
são calculados a partir de:
X
z
n
A estatística z segue a distribuição N(0,1).
18
Na prática desconhecemos σ e estimamo-lo a partir
do desvio padrão da amostra, s.
Ou seja, estimamos o erro padrão da média X n
s
a partir de n . s
s
n n
19
Mas agora a estatística
X
t
s
n
segue a distribuição t de Student.
20
A distribuição t é semelhante à distribuição normal:
• simétrica em relação à média (0), mas com um
desvio padrão dependente de um parâmetro
denominado graus de liberdade (gl).
gl=f(n), onde n é a dimensão amostral.
21
Existe uma distribuição t Student diferente para cada
valor da dimensão amostral.
22
Exemplo:
Supõe-se que o peso médio de indivíduos com tumor
gástrico é 60 Kg. Será que podemos afirmar que a
nossa amostra provém de uma população com a
mesma média de peso?
23
− Como o número de observações é 35, não é necessário fazer o
teste à normalidade - usamos o Teorema do Limite Central
(TLC).
24
• Hipóteses:
H0: μ = 60
H1: μ ≠ 60
• Nível de significância: 0,05
25
• Comandos SPSS: Analyze -> Compare Means ->
One Sample t test
26
• O valor t da tabela do output do SPSS
corresponde ao valor observado da estatística;
• O valor de Sig. (2-tailed) é o valor prova, ou
seja, valor – p ou p-value.
27
• O valor de “95% Confidence Interval of the
Difference” é o intervalo de confiança a 95%
para a diferença entre a média da população
e a média a testar.
• O valor de “Std. Error Mean” é o valor do erro
padrão médio.
28
• Conclusões:
– Como o valor de p ≈ 0,010 < 0,05 (nível de
significância), rejeita-se H0. Logo existem evidências
estatísticas, ao nível de significância de 0,05,para
afirmar que a média de peso da população de onde
provém a amostra é significativamente diferente de
60 kg.
29
Note que:
Estas conclusões podiam ser obtidas a partir da
construção do intervalo de confiança, usando a
mesma distribuição, o mesmo número de graus
de liberdade e assumindo o mesmo valor de α.
30
A fórmula geral para os limites de confiança a (1-
α)100% para a média da população, μ, usando a
média de uma amostra de dimensão n é:
• Se σ conhecido
• Se σ desconhecido
31
“95% Confidence Interval of the Difference“
Intervalo de confiança a 95% para a diferença µ - 60 (valor a
testar)
]0,752; 5,243[
Intervalo de confiança a 95% a média da população
]0,752+60; 5,243 + 60 [
32
] 0,752+60; 5,243 + 60 [
]60,752 ; 65,243[
Alternativa: Analyze -> Descriptive Statistics ->
Explore
33
34
• Estamos 95% confiantes que o intervalo de 60,752 a
65,243 contem a verdadeira média de peso da população
de onde retiramos a amostra.
• Assim podemos afirmar, com 95% de confiança, que esta
é significativamente diferente de 60 Kg (uma vez que o
valor 60 não pertence ao IC).
35
• Média da amostra: X 62,997
I.C. = ]60,752; 65,243[
H0: µ ≤ 60
• Valor a testar: 60 Kg
H1: µ > 60
36