Estatistica - Resumo Importante
Estatistica - Resumo Importante
Inferência Estatística
Inferência Estatística é o uso da informção (ou experiência ou história) para a
redução
da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente
de um experimento previamente planejado, pode ser um conjunto de dados ou não.
1
σ ! 5 =
!
89#& − #$)!
(−1
Não viciado e
&'
consistente
σ ! :! = 1 89#& − #$)!
σ
(
Viciado e
&'
consistente
Seja uma população identificada pela variável aleatória X, cujos parâmetros média
populacional < = 9#) e variância populacional = ! = 9#) são supostamente
conhecidos. Retira-se todas as amostras possíveis de tamanho ( dessa população
>.
e para cada uma delas, calcular a média X
Supõe-se a seguinte população ?2, 3, 4, 5E com média < = 3,5 e variância = ! = 1,25.
Vamos relacionar todas as amostras possíveis de tamanho 2, com reposição, desta
população.
1
9#$) = [92,0 − 3,5)! + 92,5 − 3,5)! + ⋯ + 95,0 − 3,5)! ]
(
9#$) = 0,625
9#) 1,25
9#$) = = = 0,625
( 2
#& ~P1Q9<, = ! ), = 1, ⋯ , (;
#& é (,-)-(,-(3- ,- #S , ) 31,1 ≠ U.
1 1 1 1 1
σN!$ = [#$] = X 8 #& Y = ! X8 #& Y = ! 8 [#& ] = ! 8 σ! = ! (σ!
( ( ( ( (
&' &' &' &'
1 !
= σ .
(
Conclui-se que para uma coleção de variáveis aleatórias independentes com uma
mesma distribuição de probabilidade, dada por um modelo Normal com média < e
variância = ! , a média amostral #$ também terá distribuição Normal, com média < e
Z[
variância . Ou seja:
=! #$ − <
#$~P1Q \<, ] ⟹ _ = = ~P1Q90, 1).
(
√(
= P−(
σN!$ = a .
√( P − 1
Exemplo: Seja # , #! , ⋯ , #!e uma amostra aleatória de uma variável aleatória # tal
que #~P1Q980, 26). Calcule:
a. g9#$ > 83) = g i_ > [m o = g9_ > 2,94) = 0,001641;
jkdjl
b
[n
b
[n
77,96 − 80 82,04 − 80
⟹ g977,96 < #$ < 82,04) = g t <_< v
b26 b26
s 25 25 u
Exercício: Seja # , #! , ⋯ , #!l uma amostra aleatória de uma variável aleatória # tal
que #~P1Q9100, 85). Calcule:
=! #$ − <
#$~P1Q \<, ] ⟹ _ = = ~P1Q90, 1).
(
√(
Exercício: Um fabricante afirma que produz em média 75 componentes por dia com
desvio padrão de 10 componentes por dia. Para uma amostra de 1 mês (25 dias
úteis), qual a probabilidade de a média amostral ficar entre 70 e 80 componentes
dia? Se o fabricante estabelecer uma meta média mensal de 80 componentes por
dia, qual a probabilidade de ser alcançada?
} + }! + ⋯ + } ∑&' }&
)̂ = = = }$.
( (
1 )91 − ))
= ()91 − )) = ;
( ! (
Portanto, μ
= ), σ!
= , σ
= b
9 d) 9 d)
. Desta forma, pelo TCL:
)91 − )) )̂ − )
)̂ ~P1Q \), ]⟹_= ~P1Q90, 1).
(
b)91 − ))
(
determina-se )̂ = e σ
≈ b
9 d
)
. Para alguns autores e estatísticos, uma amostra
#$ − <
2 ~3d
√(
)F1
w 2 { 1 1
93 ) , 7∞ 3 " ∞.
w2{ 9)
⁄! 91 F 3 ! ⁄)9 ⁄!
Exemplo: Seja # , #! , ⋯ , #!e uma amostra aleatória de uma variável aleatória # tal
que #~P1Q980, σ! ). Dada a variância amostral 5 ! = 26 e por meio da
distribuição 3 − 530,-(3 pode-se calcular:
a. g9#$ > 83) = g i3! > [m o = g93! > 2,94) = 0,003577 94-Q);
jkdjl
b
[n
b. g9#$ < 82) = g i3! < [m o = g93! < 1,96) = 0,969147 94-Q);
j!djl
b
[n
Exercício: Seja # , #! , ⋯ , #!l uma amostra aleatória de uma variável aleatória # tal
que #~P1Q9100, σ! ). Dada a variância amostral 5 ! = 85, calcule:
Estimação Pontual
É pontual quando a estimativa do parâmetro é representada apenas por um valor. A
principal desvantagem é que a estimativa pontual é pouco informativa. Esta
estimação não fornece nenhuma idéia do erro que se comete ao assumir o valor da
estimativa como igual ao verdadeiro valor do parâmetro desconhecido.
Estimação Intervalar
É intervalar quando estabelece-se um intervalo que contém, com uma determinada
probabilidade pré-estabelecida, o verdadeiro valor do parâmetro desconhecido.
gV7¤y⁄! _ F¤y⁄! W 1 7
#$ 7 <
g \7¤y⁄! F¤y⁄! ] 1 7
=⁄√(
= =
g ¥7¤y⁄! 7 #$ 7< F¤y⁄! 7 #$¦
√( √(
17
= =
g ¥#$ 7 ¤y⁄! < #$F¤y⁄! ¦ 1 7
√( √(
Sendo assim, o intervalo com 91 7 α 10091 7 α% de confiança para < com = !
conhecida é:
= =
§¨9 dy 9< ©#$ 7 ¤yz! ; #$ F ¤yz! ª.
√( √(
Observação:
1. Denota-se #$ 7 < ¤yz!
Z
√
por erro padrão ou erro de estimação;
= P − ( √400 1000 − 25
σN$ = a = a = 3,95
√( P − 1 √25 1000 − 1
¤!,e% = ±1,96
= =
g ¥#$ − ¤y⁄! ≤ < ≤ #$+¤y⁄! ¦=1−
√( √(
g9150 − 1,96 × 3,95 ≤ < ≤ 150 + 1,96 × 3,95 = 0,95
g9142,25 ≤ < ≤ 157,75 = 0,95
§¨e% 9< = I142,25; 157,75J
= P−(
1 ),ã1 = ¤y⁄! a = 1,96 × 3,95 = 7,742.
√( P − 1
Exercício: Obtenha os intervalos de confiança de 90% e 99% para a média
populacional e o erro de estimação dos dados do exemplo anterior.
< é:
5 5
§¨9 dy 9< ©#$ 7 3d ; yz! ; #$ F 3d ; yz! ª.
√( √(
Onde 5 é o desvio padrão amostral e 3d ; yz! é o valor tabelado da distribuição
3 7 530,-(3.
Observação:
1. Denota-se - #$ 7 < 3d
Z
; yz! √ por erro padrão ou erro de estimação;
Exemplo: A amostra ?9, 8, 12, 7, 9, 6, 11, 6, 10, 9E foi extraída de uma população
aproximadamente normal. Deseja-se construir um intervalo de confiança para < com
um nível de 95% de confiança.
∑&' &
#$ 8,7
(
∑&' 9& − #$)!
5! = ≅4⟹5≅2
(−1
02 ,- Q-,,- = ( − 1 = 10 − 1 = 9
3d ; y⁄! = 3; !,e% «2,262
5 5
§¨9 dy) 9<) = ©#$ − 3d ; yz! ª; #$ + 3d ; yz!
√( √(
2 2
§¨e% 9< ©8,7 − 2,262 ; 8,7 + 2,262 ª
√10 √10
§¨e% 9< I7,27; 10,13]
5 2
1 ),ã1 = 3d = 2,262 × = 1,43.
√(
; y⁄!
√10
)̂ 91 − )̂ )̂ 91 − )̂
§¨9 dy 9) = ²)̂ − ¤yz! a ; )̂ + ¤yz! a ³.
( (
Observação:
1. Denota-se - = )̂ − ) = ¤yz! b
9 d
por erro padrão ou erro de estimação;
2. Tem-se que )̂ e para ( suficientemente grande σ
≈ b
9 d
. Para alguns
variância populacional.
)̂ 91 − )̂ ) )̂ 91 − )̂ )
§¨9 dy) 9)) = ²)̂ − ¤yz! a ; )̂ + ¤yz! a ³
( (
)̂ 91 − )̂ ) 0,891 − 0,8)
1 ),ã1 = ¤yz! a = 1,96 × a = 0,055.
( 200
Uma variável aleatória obtida por ! = é definida como ·0 − ·0,,1 com
9d )¶ [
Z[
9( − 1)5 ! 9( − 1)5 !
§¨9 dy) 9= ) = ² ; ³.
!
Vd
!
; yz!W
Vd
!
; yz!W
¸ ¹
Vd
!
; yz!W = ! ; ,e% = 25,215
¹
9( − 1)5 ! 9( − 1)5 !
§¨9 dy) 9= ! ) = ² ; ³
Vd
!
; yz!W
Vd
!
; yz!W
¸ ¹
41 × 0,45 41 × 0,45
§¨e% 9= ! ) = © ; ª
60,561 25,215
§¨e% 9= ! ) = [30,42%; 73,17%]
Exercício: Obtenha os intervalos de confiança de 98% e 99% para a variância
populacional dos dados do exemplo anterior.
(5 ! (5 !
§¨9 dy) 9= ) = ² ; ³.
!
V;
!
yz V;
!
yz
!W¸ !W¹
PV¤y⁄! =W
!
(= !.
9P − 1) ! + V¤y⁄! =W
1.5.2. Cálculo de tamanho de amostra para a estimação da proporção
populacional
Pelo TCL tem-se que )̂ ~P1Q w), {⟹_= ~P1Q90, 1), então:
9 d)
d
b¯9°±¯)
)̂ − ) )̂ 91 − )̂ ) ¤y⁄! º)̂ 91 − )̂ )
_= ⟹ )̂ − ) = ¤y⁄! a ⟹ √( =
( )̂ − )
b)̂ 91 − )̂ )
(
!
¤y⁄! º)̂ 91 − )̂ ) V¤y⁄! W )̂ 91 − )̂ )
!
⟹(=» ¼ ⟹(= .
)̂ − ) !
PV¤y⁄! W )̂ 91 − )̂ )
!
(= .
9P − 1) ! + V¤y⁄! W )̂ 91 − )̂ )
!
220
)̂ = = = 44%
( 500
¤y⁄! = 2,576
= 3%
PV¤y⁄! W )̂ 91 − )̂ )
!
g P (31 ⟹ ( =
9P − 1) ! + V¤y⁄! W )̂ 91 − )̂ )
!
V¤y⁄! W )̂ 91 − )̂ )
!
g P ((31 ⟹ ( =
!
92,576)! 0,4491 − 0,44)
g P ((31 ⟹ ( = ≈ 1817 )-2212.
0,03!
= ! =!! = ! =!!
§¨9 dy) 9< ) $ $ )
− <! = ²9# − #! − ¤y⁄! a + ; $
9# $ )
− #! + ¤y⁄! a + ³.
( (! ( (!
= ! =!! = ! =!!
§¨9 9< − < ) = $
²9# − $
# ) − ¤ a + ; $
9# − $
# ) + ¤ a + ³.
( (! ( (!
dy) ! ! ⁄
y ! ! ⁄
y !
1 1 1 1
§¨9 dy 9< − <! = ²9#$ − #$! − 3w a5! ¥ + ¦ ; 9#$ − #$! + 3w d!; z { a5! ¥ + ¦³.
° [ d!; z {
2 ( (! ° [ 2 ( (!
2 ! 2!! 2 ! 2!!
§¨9 dy 9< − <! = ²9#$ − #$! − 3w¾; z { a\ + ] ; 9#$ − #$! − 3w¾; z { × a\ + ]³
2 ( (! 2 ( (!
Onde os graus de liberdade são dados pela fórmula de Satterthwaite 91946):
2! 2!
!
©( + (! ª
¿= !
.
 ¥2 ¦ Å Â ¥2! ¦ Å
! ! ! !
Á ( Ä + Á (! Ä
Á ( − 1Ä Á(! − 1Ä
À Ã À Ã
Exercício: Seja as vendas (em µ$100000) durante e após a crise de 2008 duas
variáveis aleatórias Gaussianas # e #! com variâncias populacionais
desconhecidas. Construia dois intervalos de 95% de confiança para a diferença das
vendas (médias populacionais), um intervalo para o caso em que = ! = =!! e um
intervalo para o caso em que = ! ≠ =!! , considerando as amostras obtidas
apresentadas na tabela abaixo:
( = 30 #$ = 20,20 5 ! = 3,50
(! = 42 #$! = 28,50 5!! = 4,50
VENDAS DURANTE A CRISE
VENDAS DEPOIS DA CRISE