0% acharam este documento útil (0 voto)

23 visualizações36 páginas

Médias 1

Enviado por

seavidafosse

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

23 visualizações36 páginas

Médias 1

Enviado por

seavidafosse

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 36

Inferência estatística pode ser feita de 3 formas:

Estimativa pontual
Amostra

Inferências sobre médias – uma

amostra

1
• 1º passo: Escolha do teste a usar;
• 2º passo: Definição de hipóteses;
• 3º passo: Indicação do nível de significância;
• 4º passo: Valor observado;
• 5º passo: Valor tabelado;
• 6º passo: Conclusões;

2
• Muitas vezes é também usado o valor prova (valor -
p) para concluir num teste de hipóteses;
• Este valor- p é uma probabilidade;
– Probabilidade de obter um valor tão ou mais extremo do
que o valor observado sob a hipótese nula verdadeira;
– probabilidade de os dados concordarem com H0, sendo
H0 verdadeira;

3
• 1º passo: Escolha do teste a usar;
• 2º passo: Definição de hipóteses;
• 3º passo: Indicação do nível de significância;
• 4º passo: Valor p;
• 5º passo: Conclusões;

4
• Se valor p < α Rejeitar H0

• Se valor p ≥ α Não rejeitar H0

5
• A escolha do teste a usar, depende entre outros:
– Da natureza da variável em estudo;

– Da natureza da amostra.

6
• Uma amostra:
– Exemplo: Através de um relatório europeu supõe-se
que a média de idades dos técnicos de saúde a
desempenhar funções em locais públicos seja 35
anos. Será que o mesmo se verifica em Portugal?

7
• Duas amostras emparelhadas:
– Exemplo: Será que a quantidade de oxigénio no
sangue difere antes e após um treino cardio-
respiratório?

8
• Duas amostras independentes:
– Exemplo: Será que a idade de diagnóstico de tumor
gástrico é diferente entre indivíduos do sexo
masculino e indivíduos do sexo feminino?

9
• Muitos dos métodos de Inferência Paramétrica
pressupõem a normalidade dos dados (i.e., que os
dados têm uma distribuição Normal), o que pode ser
verificado através de testes de hipóteses, tais como:
– Shapiro-Wilk;
– Kolmogorov-Smirnov;

10
• Objectivo - testar as seguintes hipóteses:

H0: A variável segue uma distribuição normal

versus

H1: A variável não segue uma distribuição normal

11
Se a dimensão amostral for pequena (n<30), a
utilização não adequada do teste t pode dar
origem a valores de prova inferiores ao valor
correcto ou intervalos de confiança mais
pequenos.

12
Iremos rejeitar mais vezes a hipótese nula e
concluir erradamente que existe diferença
mais frequentemente do que é explicitamente
suposto por α.

13
• Quando temos menos de 30 casos!

• Comandos: Analyze -> Descriptive Statistics ->

Explore
– Dependent list: Variável a testar

– Botão Plots: Normality Plots with tests

14
• Teste de Kolmogorov –Shapiro
– Hipóteses:
H0: A variável idade segue uma distribuição normal
H1: A variável idade não segue uma distribuição normal

• Conclusão: Como p ≈ 0,2 > 0,05 não rejeitamos H0. Não existem evidências
estatísticas para afirmar que a variável idade não segue uma distribuição normal.

• Vamos assumir que a variável idade segue uma distribuição normal na população.

15
Processo inferencial sobre a média da população
μ (desconhecida) a partir de uma amostra (quando
a população segue uma distribuição normal).

16
• Baseia-se na distribuição Normal N(0,1), quando o
desvio padrão da população, σ, é conhecido;
• Baseia-se na distribuição t de Student, quando o
desvio padrão da população, σ, não é conhecido,
mas apenas é conhecida a sua estimativa, s,
calculada a partir da amostra.

17
Se a distribuição das médias amostrais seguir a
distribuição normal e se σ for conhecido o cálculo de
intervalos de confiança e os testes de significância para μ
são calculados a partir de:
X 
z

n

A estatística z segue a distribuição N(0,1).

18
Na prática desconhecemos σ e estimamo-lo a partir
do desvio padrão da amostra, s.

Ou seja, estimamos o erro padrão da média  X   n

s
a partir de n . s  
s 

n n
19
Mas agora a estatística

X 
t
s
n

segue a distribuição t de Student.

20
A distribuição t é semelhante à distribuição normal:

• simétrica em relação à média (0), mas com um

desvio padrão dependente de um parâmetro
denominado graus de liberdade (gl).

gl=f(n), onde n é a dimensão amostral.

21
 Existe uma distribuição t Student diferente para cada
valor da dimensão amostral.
22
Exemplo:

Supõe-se que o peso médio de indivíduos com tumor

gástrico é 60 Kg. Será que podemos afirmar que a
nossa amostra provém de uma população com a
mesma média de peso?

23
− Como o número de observações é 35, não é necessário fazer o
teste à normalidade - usamos o Teorema do Limite Central
(TLC).

24
• Hipóteses:
H0: μ = 60
H1: μ ≠ 60

• Nível de significância: 0,05

25
• Comandos SPSS: Analyze -> Compare Means ->
One Sample t test

26
• O valor t da tabela do output do SPSS
corresponde ao valor observado da estatística;

• O valor de Sig. (2-tailed) é o valor prova, ou

seja, valor – p ou p-value.

27
• O valor de “95% Confidence Interval of the
Difference” é o intervalo de confiança a 95%
para a diferença entre a média da população
e a média a testar.
• O valor de “Std. Error Mean” é o valor do erro
padrão médio.

28
• Conclusões:
– Como o valor de p ≈ 0,010 < 0,05 (nível de
significância), rejeita-se H0. Logo existem evidências
estatísticas, ao nível de significância de 0,05,para
afirmar que a média de peso da população de onde
provém a amostra é significativamente diferente de
60 kg.

29
Note que:

Estas conclusões podiam ser obtidas a partir da

construção do intervalo de confiança, usando a
mesma distribuição, o mesmo número de graus
de liberdade e assumindo o mesmo valor de α.

30
A fórmula geral para os limites de confiança a (1-
α)100% para a média da população, μ, usando a
média de uma amostra de dimensão n é:

• Se σ conhecido

• Se σ desconhecido

31
“95% Confidence Interval of the Difference“
Intervalo de confiança a 95% para a diferença µ - 60 (valor a
testar)
]0,752; 5,243[

Intervalo de confiança a 95% a média da população

]0,752+60; 5,243 + 60 [

32
] 0,752+60; 5,243 + 60 [

]60,752 ; 65,243[

Alternativa: Analyze -> Descriptive Statistics ->

Explore

33
34
• Estamos 95% confiantes que o intervalo de 60,752 a
65,243 contem a verdadeira média de peso da população
de onde retiramos a amostra.

• Assim podemos afirmar, com 95% de confiança, que esta

é significativamente diferente de 60 Kg (uma vez que o
valor 60 não pertence ao IC).

35
• Média da amostra: X  62,997

I.C. = ]60,752; 65,243[

H0: µ ≤ 60
• Valor a testar: 60 Kg
H1: µ > 60

Médias 1

Enviado por

Médias 1

Enviado por

Inferência estatística pode ser feita de 3 formas:

Inferências sobre médias – uma

• Se valor p ≥ α Não rejeitar H0

H0: A variável segue uma distribuição normal

H1: A variável não segue uma distribuição normal

• Comandos: Analyze -> Descriptive Statistics ->

– Botão Plots: Normality Plots with tests

A estatística z segue a distribuição N(0,1).

Ou seja, estimamos o erro padrão da média  X   n

segue a distribuição t de Student.

• simétrica em relação à média (0), mas com um

gl=f(n), onde n é a dimensão amostral.

Supõe-se que o peso médio de indivíduos com tumor

• Nível de significância: 0,05

• O valor de Sig. (2-tailed) é o valor prova, ou

Estas conclusões podiam ser obtidas a partir da

Intervalo de confiança a 95% a média da população

Alternativa: Analyze -> Descriptive Statistics ->

• Assim podemos afirmar, com 95% de confiança, que esta

I.C. = ]60,752; 65,243[

Você também pode gostar