Livro Probabilidade Estatistica
Livro Probabilidade Estatistica
2ª Edição
Reitor
Prof. Pe. Geraldo Magela Teixeira
Coordenação Acadêmico-pedagógica
Stela Beatris Tôrres Arnold (coordenadora)
Agnela da Silva Giusta Design Gráfico e diagramação:
Liana Portilho Mattos Simone Nogueira / Sílvia Fonseca (Trainee
Maria Cecília de Ruiz Combat Stortini I) Revisão:
Mercia Moreira PUC Minas Virtual
Wilba Lúcia Maia Bernardes
Reprodução proibida. Art. 184 do Código
Coordenação Tecnológica Penal e Lei 9.610 de 19 de fevereiro de
Luiz Flávio F. B. Oliveira (coordenador) 1998.
Antônio Bosco de Oliveira Júnior Todos os direitos reservados
Eduardo Marques Duarte PONTIFÍCIA UNIVERSIDADE
Guilherme C. V. Costa CATÓLICA DE MINAS GERAIS
Márcio Túlio Morato
DIRETORIA DE ENSINO A DISTÂNCIA
Rosiane C. M. Oliveira
R. Espírito Santo, 1.059 - 12º andar – Centro
Simone Nogueira CEP 30160-922 - Belo Horizonte - MG
Túlio Nogueira Telefone: (0xx31) 3273-7898 - Fax: 3274-2805
http://www.virtual.pucminas.br
Coordenação da Área de Televisão e-mail: [email protected]
Iara Cordeiro de Melo Franco (coordenadora)
Bibliografia
CDU: 519.2
Bibliotecária - Eunice dos Santos - CRB 6/1515
Impresso no Brasil
sumário
Unidade 1 – Natureza e Fundamentos do Método Estatístico........................ 07
Unidade 2 – Amostragem......................................................................................................................28
3.1 – Conceitos.........................................................................................................................................37
3.2 - Elementos de uma distribuição de freqüência: amplitude total, limites de classe, amplitude
do intervalo de classe, ponto médio da classe, freqüência absoluta, relativa e acumulada. . .40
4.1. Introdução........................................................................................................................................48
5.1 – Dispersão.........................................................................................................................................59
5.2 – Assimetria........................................................................................................................................61
5.3 – Curtose.............................................................................................................................................63
Unidade 6 – Probabilidade...................................................................................................................65
8
PUC Minas Virtual Probabilidade e Estatística
sendo fundamental na análise de dados provenientes de quaisquer processos onde
exista variabilidade.
7
PUC Minas Virtual Probabilidade e Estatística
crescimento em relação a outras empresas e fornece-lhe condições de planejar
ações futuras. A análise dos dados é muito importante para se fazer um
planejamento adequado.
8
PUC Minas Virtual Probabilidade e Estatística
• Estatística: é uma medida numérica que descreve uma característica
de uma amostra.
Amostragem
População e amostra
7
PUC Minas Virtual Probabilidade e Estatística
É sobre os dados da amostra que se desenvolvem os estudos, visando a fazer
inferências sobre a população.
Estatística Descritiva
8
PUC Minas Virtual Probabilidade e Estatística
Exemplo 1.6. Anuário Estatístico da Embratur
Probabilidade
7
PUC Minas Virtual Probabilidade e Estatística
1.4. Fases do Método Estatístico
• Definição do problema
• Planejamento
• Coleta de dados
Definição do problema
Planejamento
Outros elementos importantes que devem ser tratados nesta mesma fase são:
8
PUC Minas Virtual Probabilidade e Estatística
• Cronograma das atividades, através do qual são fixados os prazos para as várias
fases;
• Custos envolvidos;
Antes de começar a analisar os dados, é conveniente que lhes seja dado algum
tratamento prévio, a fim de torná-los mais expressivos. A quarta etapa do processo
é, então, a da apuração ou sumarização, que consiste em resumir os dados através
de sua contagem e agrupamento. Pode ser manual, eletromecânica ou eletrônica.
7
PUC Minas Virtual Probabilidade e Estatística
Apresentação dos dados
Por mais diversa que seja a finalidade, os dados devem ser apresentados sob forma
adequada, tornando mais fácil o exame do fenômeno que está sendo objeto de
tratamento estatístico.
Nesta última etapa, o interesse maior reside em tirar conclusões que auxiliem o
pesquisador a resolver seu problema. A análise dos estatísticos está ligada
essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o
fenômeno. Assim, o conjunto de dados a ser analisado pode ser expresso por
númerosresumo, as estatísticas que evidenciam as características particulares
desse conjunto. O significado exato de cada um dos valores obtidos através do
cálculo das várias medidas estatísticas disponíveis deve ser bem interpretado. É
possível mesmo, nesta fase, arriscar algumas generalizações, as quais envolverão,
como mencionado anteriormente, algum grau de incerteza, porque não se pode
estar seguro de que o que foi constatado para aquele conjunto de dados (a
amostra) se verificará igualmente para a população.
8
PUC Minas Virtual Probabilidade e Estatística
1.5. Séries Estatísticas
Em sentido mais restrito, pode-se dizer que uma série estatística é uma sucessão
de dados estatísticos referidos a caracteres qualitativos, ao passo que uma
sucessão de dados estatísticos referidos a caracteres quantitativos configurará uma
Distribuição de Freqüência.
7
PUC Minas Virtual Probabilidade e Estatística
• Cronológicas - Tempo (fator temporal ou cronológico) – a que época refere-se o
fenômeno analisado;
8
PUC Minas Virtual Probabilidade e Estatística
Série Cronológica
Exemplo:
Janeiro 2300
Fevereiro 1800
Março 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510
Fonte: Departamento de Análise de Mercado
Série Geográfica
7
PUC Minas Virtual Probabilidade e Estatística
Tabela 1.2 – Operadora WKX - Vendas por Unidade da Federação – 1995
Paraná 2230
Outros 420
Série Específica
Exemplos:
Linha A 6450
Linha B 9310
Linha C 15750
8
PUC Minas Virtual Probabilidade e Estatística
Classes de Salários (R$) Número de Empregados
Até 80 41 326
Exemplos:
A) Série específico-temporal
B) Série geográfico-temporal
7
PUC Minas Virtual Probabilidade e Estatística
Primário 8 968 10 255 12 163
Unidade de Produção
Observação:
Nem sempre uma tabela representa uma série estatística. Por vezes, os dados
reunidos não revelam uniformidade, sendo meramente um aglomerado de
informações gerais sobre determinado assunto, as quais, embora úteis, não
apresentam a consistência necessária para se configurar uma série estatística.
Exemplo: Tabela com resumos de dados, mas que não representa uma
série estatística.
8
PUC Minas Virtual Probabilidade e Estatística
Sessões por dia 3 933
O título do gráfico deve ser o mais claro e completo possível. Quando necessário,
deve-se acrescentar subtítulos;
A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo
para cima;
7
PUC Minas Virtual Probabilidade e Estatística
Os títulos e marcações do gráfico devem ser dispostos de maneira que sejam
facilmente lidos, partindo da margem horizontal inferior ou da margem
esquerda.
Gráfico em Linhas
8
PUC Minas Virtual Probabilidade e Estatística
Vendas em Cr$ 1000,00
500
400
vendas
300
200
100
0
1971 1972 1973 1974 1975 1976 1977
anos
Gráfico em Colunas
População
100
80
60
40
População
20
0
1940 1950 1960 1970
Gráfico em Barras
7
PUC Minas Virtual Probabilidade e Estatística
População do Brasil
1970
1960
População do
1950 Brasil
1940
0 20 40 60 80 100
Gráfico em Setores
1975 90
1976 120
1977
Total
Fonte: Departamento da Fazenda, Município X.
O total é representado pelo círculo, que fica dividido em tantos setores quantas são
as partes. Os setores são tais que suas áreas são respectivamente proporcionais
aos dados da série.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que
o total da série corresponde a 360º.
Total __________360º
8
PUC Minas Virtual Probabilidade e Estatística
Parte___________ xº
Para 1975: 360 - 360º Para 1976: 360 - 360º Para 1977: 360 - 360º
90 - xº 120 - xº 150 - xº
Receita do Municipio X
1975
1976
1977
Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries que
apresentam em seu desenvolvimento determinada periodicidade, como, por
exemplo, a variação da precipitação pluviométrica ao longo do ano, ou da
temperatura ao longo do dia, o consumo de energia elétrica durante o mês ou o
ano, etc.
Exemplo:
Janeiro 12
Fevereiro 13
Março 14
7
PUC Minas Virtual Probabilidade e Estatística
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Jan
20
Dez Fev
15
Nov 10 Mar
5
Out 0 Abr
Set Mai
Ago Jun
Jul
UNIDADE 2
Amostragem
2.1. Importância da Amostragem
2.2. Conceitos Fundamentais
2.3. Amostragem Aleatória Simples
2.4. Amostragem Aleatória Estratificada
2.5. Amostragem por Conglomerado
2.6. Amostragem Sistemática
8
PUC Minas Virtual Probabilidade e Estatística
Nesta unidade, veremos quais as técnicas que podemos
utilizar para compor uma amostra. São objetivos específicos desta
unidade:
Dados coletados de forma descuidada podem ser tão inúteis que nenhum
processamento estatístico consegue salvá-los.
7
PUC Minas Virtual Probabilidade e Estatística
2.2. Conceitos Fundamentais
Para que possamos fazer inferências válidas sobre a população a partir de uma
amostra, é preciso que essa seja representativa. Uma das formas de se conseguir
representatividade é fazer com que o processo de escolha da amostra seja, de
alguma forma, aleatório. Além disso, a aleatoriedade permite o cálculo de
estimativas dos erros envolvidos no processo de inferência.
8
PUC Minas Virtual Probabilidade e Estatística
• Amostragem Sistemática;
• Amostragem Acidental;
• Amostragem Intencional;
Amostragem Acidental - É formada por elementos que vão aparecendo, que são
possíveis de se obter até completar o número de elementos da amostra.
7
PUC Minas Virtual Probabilidade e Estatística
simples é escolhida unidade por unidade. As unidades da população são numeradas
de 1 a N. Em seguida, escolhe-se, na tabela de números aleatórios (TNA), (ou por
computador) n números compreendidos entre 1 e N. Esse processo é equivalente a
um sorteio no qual se colocam todos os números misturados dentro de uma urna.
As unidades correspondentes aos números escolhidos formarão a amostra.
Observação:
8
PUC Minas Virtual Probabilidade e Estatística
Outras técnicas de amostragem são preferíveis à aleatória simples, pois levam
em consideração a composição da população, facilitando o trabalho de seleção
de amostras e aumentando a precisão.
Exemplo:
Resolução:
• De igual tamanho;
• Proporcional.
→
N Nº de unidades da população n a a →→ Nº de unidades das amostras
7
PUC Minas Virtual Probabilidade e Estatística
N
→
n Nº de amostras de A
Exemplo:
Resolução:
M 54 5,4 5
F 36 3,6 4
Total 90 9,0 9
Uma amostra por conglomerado é uma amostra aleatória simples na qual cada
unidade de amostragem é um grupo, ou um conglomerado de elementos.
8
PUC Minas Virtual Probabilidade e Estatística
ser pequeno em relação ao tamanho da população e o número de conglomerados
deverá ser razoavelmente grande.
Exemplo:
7
PUC Minas Virtual Probabilidade e Estatística
• a amostragem sistemática freqüentemente proporciona mais informações por
custo unitário do que a aleatória simples.
K=N
n
OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.
OBS: 0<b≤K
3º - Composição da Amostra:
1º item →b
2º item →b + K
3º item →b + 2k
Exemplo:
Solução:
1º item → 12
2º item → 12 + 25 = 37
3º item → 12 + 2*25 = 62
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49
LINHA
1 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735
2 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709
3 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522
4 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
5 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359
6 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030
7 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669
8 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678
9 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204
5318 8337
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
1432 0995
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569
5800 7249
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827
7176 8703
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181
7
PUC Minas Virtual Probabilidade e Estatística
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969
UNIDADE 3
Distribuição de Freqüência
3.1. Conceitos
3.2. Elementos de uma distribuição de freqüência: amplitude total,
limites de classe, amplitude do intervalo de classe, ponto
médio da classe, freqüência absoluta, relativa e acumulada
3.3. Regras Gerais para a elaboração de uma distribuição de
freqüência 3.4. Gráficos representativos de uma distribuição de
freqüência:
histograma, polígono de freqüência e ogiva
3.1. Conceitos
8
PUC Minas Virtual Probabilidade e Estatística
das distribuições de freqüências e dos histogramas. Freqüência de uma
observação é o número de repetições dessa observação, ou seja, quantas vezes
determinado fenômeno acontece.
• Dados brutos – são os dados originais, que ainda não se encontram prontos
para análise, por não estarem numericamente organizados. (Também são
conhecidos como Tabela Primitiva).
J F M A M J J A S O N D
1995 6 2 5 1 0 3 2 1 3 5 5 3
1996 5 4 2 1 3 4 1 4 5 4 0 1
1997 3 1 2 4 3 1 4 1 0 3 0 2
1998 2 2 0 3 1 4 2 0 1 1 5 2
0 0 0 0 0 0 1 1 1 1 1 1
1 1 1 1 1 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 4 4
4 4 4 4 4 5 5 5 5 5 5 6
7
PUC Minas Virtual Probabilidade e Estatística
Exemplo: número de erros em um livro: 0,1,2,3,4,.... número
Exemplo: peso de alunos: 55,5 kg; 61,0kg; 63,4 kg; 68,1 kg.......
distância entre cidades: 35,5 km; 48,6 km; 100,10 km; ....
Nº de aparelhos
com defeitos Nº de meses
0 06
1 11
2 09
3 08
4 08
5 05
6 01
Total 48
8
PUC Minas Virtual Probabilidade e Estatística
Notas Nº de alunos
0 |--- 20 020
20 |--- 40 065
40 |--- 60 230
60 |--- 80 160
Total 580
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
A = 173 – 150 = 23
3.2.2. Número de classes (K) e Classe (i) – não existe regra fixa para se
determinar o número de classes. Podemos utilizar:
7
PUC Minas Virtual Probabilidade e Estatística
• A Regra de Sturges, que nos dá o número de classes em função do número de
valores da variável:
• Ou
h=A/K
H = 23/ 6 = 3,83 → h = 4
8
PUC Minas Virtual Probabilidade e Estatística
i Classes n
1 150 | 154 4
2 154 | 158 9
3 158 | 162 11
4 162 | 166 8
5 166 | 170 5
6
170 | 174 3
Σ 40
• L2=158
• l2 = 154
xi = inf +2Lsup l
x2 = =156 → x2 =156
3.2.6. Freqüências
7
PUC Minas Virtual Probabilidade e Estatística
f = ni i
n
Exemplo: considerando a segunda classe do exemplo anterior, temos: f 2
= 9/40=0,225 .
8
PUC Minas Virtual Probabilidade e Estatística
1. Encontrar a amplitude total do conjunto de valores observados;
K=1+3,3logn ou k = n
3. Determinar a amplitude do intervalo de classe;
h= A
k
4. Determinar os limites de classe;
Exemplo:
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
= ≅
Número de Classes :K 50 7
Intervalo de classe : h =64/7 »10
i Classes n Ni fi Fi xj
1 30 | 40 4 4 0,08 0,08 35
2 40 | 50 6 10 0,12 0,20 45
50 | 60 8 18 0,16 0,36
60 | 70 13 31 0,26 0,62
7
70 | 80PUC Minas Virtual
9 Probabilidade e Estatística
40 0,18 0,80
80 | 90 7 47 0,14 0,94
Σ 50 1
Histograma
ni
12
30 40 50 60 70 80 90 100
Polígono de freqüência – é um gráfico em linha, sendo as freqüências marcadas
sobre perpendiculares ao eixo horizontal, levantada pelos pontos médios dos
intervalos de classe.
8
PUC Minas Virtual Probabilidade e Estatística
Para realmente obtermos um polígono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira
e da posterior à última, da distribuição.
Polígono de Freqüência
ni
12
35 45 55 65 75 85 95 Ponto médio
50
47
40
31
18
10
classes
30 40 50 60 70 80 90 100
7
PUC Minas Virtual Probabilidade e Estatística
representado por um segmento de reta vertical e de comprimento proporcional à
respectiva freqüência.
ni
12
1 2 3 4 5 6 xi
8
PUC Minas Virtual Probabilidade e Estatística
UNIDADE 4 Medidas de Posição
4.1. Introdução
4.2. Média aritmética simples e ponderada e suas propriedades
4.3. Moda: Dados agrupados e não agrupados em classes
4.4. Mediana: Dados agrupados e não agrupados em classes
4.5. Média Geométrica: Dados agrupados e
não agrupados em classes
4.6. Média Harmônica: Dados agrupados e
não agrupados em classes
4.7. Separatrizes: Quartis, Decis e Percentis
4.1. Introdução
Nas seções anteriores, vimos a sintetização dos dados sob a forma de tabelas,
gráficos e distribuições de freqüências. Agora, vamos destacar o cálculo das
medidas que possibilitam localizar a maior concentração de valores de uma dada
distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há
uma distribuição por igual. Tais medidas possibilitam comparações de séries de
dados entre si pelo confronto desses números.
• Medidas de posição;
• Medidas de curtose.
7
PUC Minas Virtual Probabilidade e Estatística
As medidas de posição mais importantes são as medidas de tendência central, que
destacamos:
• A moda.
• A mediana;
• Os quartis;
• Os decis;
• Os percentis.
∑x
xi : valor observado n : número total de
observações i
x= i=1 n
Exemplo: Suponha que o tempo de vida útil de 10 aparelhos de
telefone são:
10 29 26 28 15 23 17 25 0 20. Qual a média de
vida útil destes aparelhos?
8
PUC Minas Virtual Probabilidade e Estatística
portanto média de vida útil dos aparelhos são 19,3 anos.
Dados Tabelados
n
Xi : valor observado
ni : n° de ∑x ×n i i
observações por classe
n : nº de observações totais
= i=1
x n
• Com intervalo de Classe
n
xi : ponto ∑
i =1
x i × ni médio da classe
X =
n ni : n° de observações
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Solução: Mo= 9
Dados tabelados
Exemplo:
Classes 0 1 2 3 4 5 6 Σ
7
PUC Minas Virtual Probabilidade e Estatística
N 06 11 09 08 08 05 01 48
Solução: o valor predominante é o número 1, que ocorreu 11 vezes.
Temos, portanto, Mo=1.
Mo = l +h nmo −nant
inf Mo (nmo −nant )+(nmo −npost )
onde constatamos:
classe modal
Mo =3Md−2X
onde constatamos:
Md = Mediana
X = Média
Σ
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5
ni 3 10 17 8 5 43
8
PUC Minas Virtual Probabilidade e Estatística
Solução: Utilizando a fórmula de Czuber
• linf = 2
• hMo = 1
• nMo = 17
• nant = 10
• npost =8
• Para uma série com número ímpar de itens: a mediana corresponde ao valor
central.
n ímpar Md = X(EMd
)
EMd = (n+1)/2
A mediana será o termo de ordem (n+1)/2.
• Para uma série com número par de itens: não há termo central único, mas,
sim, dois termos centrais. A mediana será dada por:
n par X +
EMd = n/2
Md = (E ) X(E
Md Md +1)
2
A mediana será a média aritmética entre os termos centrais.
Dados tabelados:
7
PUC Minas Virtual Probabilidade e Estatística
Neste caso, o problema consiste em determinar o ponto do intervalo em que está
compreendida a mediana.
EMD = n2
∑2n −Nant
Md= linf + hMd nMd
onde temos:
MG = N x1.x2. x3.....xn
8
PUC Minas Virtual Probabilidade e Estatística
Dados agrupados
∑ i=n1 nnxii x1 x2 x3
Qi = quartil i=1,2,3
7
PUC Minas Virtual Probabilidade e Estatística
• Q1 = 1º quartil, valor situado de tal modo na série que uma quarta parte (25%)
dos dados é menor que ele e as três quartas partes restantes (75%) são
maiores.
• Q3 = 3º quartil, valor situado de tal modo que as três quartas partes (75 %) dos
termos são menores que ele e uma quarta parte 25 % é maior.
33n − Nant
.h
Q1 = lQ1 +
Q3 =lQ + 4 nQ3
Onde temos:
Di = decil i=1,2,3, …, 9
Pi = centil i=1,2,3, …, 99
8
PUC Minas Virtual Probabilidade e Estatística
2º Passo: Pela Nac identifica-se a classe Pi
100
PK = lP + nPK
Exemplo:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
frequencia 6 12 16 13 7
Calcule:
a) O 1º Quartil (Q1);
7
PUC Minas Virtual Probabilidade e Estatística
Total 54
a) Calculo de Q1,
Para calcular Q1, temos que primeiro identificar a classe que esta o valor, para
isto consideramos :
= =
N 54 13,5, que vamos neste momento arredondar para 14, pela frequencia
4 4
acumulada procuramos a classe que encontra o 14º elemento, que é a 2ª classe
com limites de 128 |--- 136.
Q1 =128+ *8 =133
b) Calculo de D4
= = =
KN 4x54 21,6 27, através da freqüência acumulada identificamos a clas-
10 10
se que encontra o 27º , que é a 3ª classe com limites de 136 |--- 144
Agora usamos a fórmula
K KN − N(ant)
8
PUC Minas Virtual Probabilidade e Estatística
h
10
DK =lD + nDK
onde:
D4 =136 + *8 =137,8
7
PUC Minas Virtual Probabilidade e Estatística
UNIDADE 5
Medidas de Dispersão
5.1. Dispersão
5.2. Assimetria
5.3. Curtose
5.1. Dispersão
Absoluta
• Amplitude (A)
• Variância (S2)
• Desvio padrão (S)
Relativa
8
PUC Minas Virtual Probabilidade e Estatística
medida que depende apenas dos valores externos, é instável, não sendo afetada
pela dispersão dos valores internos.
Variância (S2)
∑x−i21ni
n
S2 =
_
S
−∑nx−i1ni
n− 2
n
Onde temos que:
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número
em unidade quadrada em relação à variável em questão, o que, sob o ponto de
vista prático, é um inconveniente; por isso, tem pouca utilidade na estatística
descritiva, mas é extremamente importante na inferência estatística e em
combinações de amostras.
7
PUC Minas Virtual Probabilidade e Estatística
S= S2
C
V
=
S
x
5.2. Assimetria
8
PUC Minas Virtual Probabilidade e Estatística
Simetria
X = Mo = Md
Mo<Md<X
Mo Md X
X < Md <
Mo
X MdMo
7
PUC Minas Virtual Probabilidade e Estatística
• 1º Coeficiente de Pearson
• 2º coeficiente de Pearson
Q1 : valor do 1º Quartil
Q3 : valor do 3º Quartil
Md : valor da Mediana
AS = Q1 +QQ3 3−−Q21Md
AS = 0, diz-se que a distribuição é simétrica.
5.3. Curtose
• Mesocúrtica: é uma curva básica de referência chamada curva padrão ou curva normal;
• Platicúrtica: é uma curva mais achatada (ou mais aberta) que a curva normal;
8
PUC Minas Virtual Probabilidade e Estatística
• Leptocúrtica: é uma curva mais afilada que a curva normal;
UNIDADE 6
Probabilidade
7
PUC Minas Virtual Probabilidade e Estatística
ocorrência dos resultados de um fenômeno. São
objetivos desta unidade:
Introdução
8
PUC Minas Virtual Probabilidade e Estatística
Os fenômenos aleatórios podem conduzir a diferentes resultados e
mesmo quando as condições iniciais são as mesmas, existe a
imprevisibilidade do resultado. Ex: lançamento de um dado.
• Lançamento de um dado;
Espaço Amostral
7
PUC Minas Virtual Probabilidade e Estatística
A probabilidade só tem sentido no contexto de um espaço
amostral, que é o conjunto de todos os resultados possíveis de um
“experimento”. O termo “experimento” sugere a incerteza do
resultado antes de fazermos as observações. Os resultados de um
experimento (ex: a ocorrência de um raio, uma viagem etc.)
chamamse eventos.
• S = { c, r } (é composto de 2 eventos)
• S = { 1, 2, 3, 4, 5, 6 } (é composto de 6 eventos)
• S = { (c, r), (c, c), (r, c), (r, r)} (é composto de 8 eventos)
Exemplo:
8
PUC Minas Virtual Probabilidade e Estatística
excludentes, porque uma carta não pode ser ao mesmo
tempo de copas e de ouros.
A ’
Os eventos A e A’ são complementares. A
em comum. S
S = {∈ ,∈ ,∈ .... ∈ n}
1 2 3
Sejam A e B dois eventos de S, as seguintes operações são definidas:
7
PUC Minas Virtual Probabilidade e Estatística
É o evento que ocorre
se A ocorre ou B
ocorre, ou am-
bos ocorrem
É
{ i ∈A e ∈i ∈B
A∩B= ∈i ∈S∈ } o evento que
ocorre se A e
B ocorrem
8
PUC Minas Virtual Probabilidade e Estatística
AC
A Ac = ∈i∈S∈i∉A
S
{
}
6.2. Probabilidade: Definição Clássica; Probabilidade e freqüência relativa
• P(S) = 1
P (A ∪ B)=P(A)+P(B)
7
PUC Minas Virtual Probabilidade e Estatística
Se E ⊂ S e E é um conjunto unitário, E é chamado evento elementar.
Eventos Equiprováveis
1 r
P (A) = r ∴ P(A) =
n n
Exemplo:
Solução:
P(A∪B) = P(A)+P(B)−P(A∩B)
8
PUC Minas Virtual Probabilidade e Estatística
Exemplo:
S ={1,2,3,4,5,6}
Então, A e B são mutuamente exclusivos, pois a
ocorrência de um número par e ímpar não pode ser
verificada em decorrência da mesma experiência.
P(Ac) = 1 – P(A)
Teoria da Contagem
7
PUC Minas Virtual Probabilidade e Estatística
Combinação
Cr,p =pr =
p!(rr−! p)!
Notação: O Símbolo fatorial ! denota o produto dos inteiros positivos em ordem
decrescente. Por exemplo, 6! = 6.5.4.3.2.1= 720. Por definição , 0! = 1.
C10,3
=
103
=
103..9
2..87.!
7!
=120
Podemos ter 120 comissões diferentes compostos com 3 pessoas.
Arranjos
8
PUC Minas Virtual Probabilidade e Estatística
A10,3 = (1010−!3)! = =
= 720
Probabilidade Condicional
P( AB)=P(A∩
B)
P(B)
Isso significa que a probabilidade de A ocorrer, dado que B
ocorreu, é igual à probabilidade de ocorrência simultânea de A e B
dividida pela probabilidade de ocorrência de B. (Note-se que essa
definição não se aplica quando P(B)=0, porque então estaríamos
dividindo por zero).
Exemplo:
Solução:
7
PUC Minas Virtual Probabilidade e Estatística
P(A/B)=1/15
P(B/A)=1/3
Teorema do Produto
P( AB P( BA)=P(A∩
P( A∩ B)
P(B) P(A)
Independência Estatística
A={a 1ª
peça é
boa}
B={a 2ª
peça é
boa}
8
PUC Minas Virtual Probabilidade e Estatística
P(B)=P(B/A). Se A e B são independentes, então temos
que
P(A ∩ B)=P(A).P(B)
Regra de Bayes
P(Ai / B) =
P(A1).P(B/ A1)+P(AP2).(APi().BP/(BA2/)A+i )......+P(An
).P(B/ An )
OBS: O Teorema de Bayes é também chamado de Teorema da
Probabilidade a Posteriori. Ele relaciona uma das parcelas da
probabilidade total com a própria probabilidade total.
É uma generalização da probabilidade condicional ao caso de mais de dois eventos.
Exemplos:
Solução:
¾ - P(A ∩ B)
7
PUC Minas Virtual Probabilidade e Estatística
2. Em certo colégio, 5% dos homens e 2% das mulheres têm
mais do que 1,80 m de altura. Por outro lado, 60% dos
estudantes são homens. Se um estudante é selecionado
aleatoriamente e tem mais de 1,80m de altura, qual a
probabilidade de que o estudante seja mulher?
Solução:
Temos que :
P(M/Ma)= ? (Probabilidade de ser mulher dado que tem mais que 1,80 m)
Utilizando a Regra de Bayes temos:
P(M / Ma) =
= 0,21= 21%
8
PUC Minas Virtual Probabilidade e Estatística
Solução
Temos que :
P(A) = 0,4
P(B) = 0,5
P(C)= 0,10
P(D/A) = 0,03
P(D/
B) =
0,05
P(D/
C) =
0,02
P(B/
D) =
P(B/ D) =
7
PUC Minas Virtual Probabilidade e Estatística
P(B/ D) = = 0,641= 64,1%
UNIDADE 7
Variáveis Aleatórias
Simetr
7.3. Função de densidade de probabilidade
7.4. Esperança matemática, variância e desvio
padrão: propriedades
7.5. Distribuições discretas: Bernoulli, Binomial e Poisson
7.6. Distribuição contínua: Normal - propriedades,
distribuição normal padrão, a Normal como
aproximação da Binomial
8
PUC Minas Virtual Probabilidade e Estatística
S X
R
s
Variável
Aleatória X(s)
Exemplo:
Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das
probabilidades correspondentes.
7
PUC Minas Virtual Probabilidade e Estatística
{(xi,p(xi), I=1,2,….n}
8
PUC Minas Virtual Probabilidade e Estatística
p(x) = P(X = x)
E(X) = ∑x ⋅ p(x)
Chamamos variância de X ao valor:
Var(X) = E(X
2
) −[E(X)]2
onde
E de desvio padrão de X a
DP(X) = Var(X)
1. Distribuição de Bernoulli
X → x1 =1 (sucesso) ou x 2 = 0 (fracasso)
P(X) → p(x1 ) = p p(x 2 )
=1− p = q P(x = 0) = q
e P(x =1) = p
7
PUC Minas Virtual Probabilidade e Estatística
P(X = x) = p x.q1−x
Principais características
1
=0
• Variância:
p
i=0
Var(X) = p − p2 = p(1− p) =
pq
2. Distribuição Binomial
0) =q.q.q.q.q.....q=qn
8
PUC Minas Virtual Probabilidade e Estatística
• Para X = 1, uma seqüência do tipo: 1000....0; 01000....0;
001000...0; serão n seqüências, cada uma com um único
Principais características:
a) dar 5 caras;
b) pelo menos uma cara;
c) no máximo 2 caras.
Solução:
a) x = sair cara, p=0,5 ( probabilidade do sucesso de X), q= 0,5 (
pro-babilidade do fracasso de X0, n = 8 ( número de
repetições do evento).
P(X = 5) = .0,55.0,58−5 =
7
PUC Minas Virtual Probabilidade e Estatística
c) P(X≤2) = P(X=0)+ P(x=1) + P(X=2) , utilizando as fórmulas
dos itens anteriores calcula-se as probabilidades.
3. Distribuição de Poisson
• Carros que passam por um cruzamento por minuto, durante uma certa hora do
dia;
Principais características:
• Média: E(X) = λ
• Variância: Var(X) = λ
8
PUC Minas Virtual Probabilidade e Estatística
aproximação de binomial pela distribuição de Poisson, da seguinte
forma: λ= np
Solução: λ = 2
por hora, para 2
horas λ= 4
P(X≤3)= P(X=0)+P(X=1)+P(X=2)+P(X=3)∴
P(X
P(X≤3) =e−4 + 4e−4 +8e−4 +10,666e−4 = 23,66e 4 = 0,4334 = 43,34%
Uma variável aleatória, cujos valores são expressos em uma escala contínua,
é chamada de variável aleatória contínua.
7
PUC Minas Virtual Probabilidade e Estatística
Assim, a área sob a f.d.p. entre dois pontos a e b nos dá a probabilidade da
variável assumir valores entre a e b, conforme ilustrado na figura 1,
apresentada a seguir.
P(a<X<b)
a b
P(a < X <b) = P(a ≤ X <b) = P(a < X ≤b) = P(a ≤ X ≤b)
Teoricamente, qualquer função f(x) que seja não negativa e cuja área
total sob a curva seja igual à unidade, isto é,
∫ f (x)dx =1
caracterizará uma v.a. contínua.
E(X) = ∫ x ⋅ f (x)dx
a
8
PUC Minas Virtual Probabilidade e Estatística
Var(X) = E(X
2
) −[E(X)]2
onde
b
E(X 2) = ∫ x2 ⋅ f (x)dx
a
e de desvio padrão de X a
DP(X) = Var(X)
dt
1 - Distribuição Normal
7
PUC Minas Virtual Probabilidade e Estatística
A observação cuidadosa subseqüente mostrou, entretanto, que
essa pretensa universalidade da curva, ou distribuição normal, não
correspondia à realidade. De fato, não são poucos os exemplos de
fenômenos da vida real representados por distribuições não
normais, curvas assimétricas, por exemplo. Mesmo assim, a
distribuição normal desempenha papel preponderante na
estatística, e os processos de inferência nela baseados têm larga
aplicação.
µ σ
normal inclui os parâmetros e , os quais possuem os seguintes
µ σ
significados: : posição central da distribuição (média, µx) :
µ
Se uma variável aleatória X tem distribuição normal com média e variância σ2,
escrevemos: X ∼ N(µ ,σ2).
A figura 2 ilustra uma curva normal típica, com seus parâmetros descritos
graficamente.
f(x)
σ
µ: média
σ : desvio padrão
µ x
8
PUC Minas Virtual Probabilidade e Estatística
Figura 2 - Curva normal típica
µ σ
Para uma mesma média e diferentes desvios padrão , a
distribuição que tem maior desvio padrão se apresenta mais
achatada, acusando maior dispersão em torno da média. A que
tem menor desvio padrão apresenta “pico” mais acentuado e maior
concentração em torno da média. A figura 3 compara três curvas
normais, com a mesma média, porém, com desvios padrão
diferentes. A curva A se apresenta mais dispersa que a curva B,
que por sua vez se apresenta mais dispersa que a curva C. Nesse
σ σ σ
caso, A > B > .
C
B
A
µ
Figura 3 - Distribuições normais com mesma média e desvios padrão
diferentes
7
PUC Minas Virtual Probabilidade e Estatística
B A
µB µA
µ σ −
pontos a e b, função da média e do desvio padrão são
bastante difundidas e estão representadas na figura 5:
99.73 %
95.46 %
68.26 %
8
PUC Minas Virtual Probabilidade e Estatística
Figura 5 - Probabilidades da distribuição normal
∼ µ
Se X N( ,σ2), então, a variável aleatória definida por
Z = Xσ−µ
X
µ-3σ µ-σ µ µ+σ µ+3σ
µ-2σ µ+2σ
X-µ
σ
Z
-3 -2 -1 0 1 2 3
µ
Figura 6 - Transformação de uma N( ,σ2) para uma N(0,1)
Exemplo:
7
PUC Minas Virtual Probabilidade e Estatística
Extrudados tubulares possuem tensão de escoamento (tensão a
partir da qual o material se deforma plasticamente), que segue
uma distribuição normal com média de 210 MPa com desvio padrão
de 5 MPa. Em notação estatística, X ∼ N(210 ,52). É desejado que
tais extrudados tenham tensão de escoamento de pelo menos 200
MPa. Portanto, a probabilidade do extrudado não atingir a
especificação desejada é:
Solução:
P(X<200)
X
180 190 200 210 220 230 240
P(Z<-2)
Z
-6 -4 -2 0 2 4 6
8
PUC Minas Virtual Probabilidade e Estatística
podem ser deduzidas a partir da simetria da densidade em relação
à média 0, e são úteis na obtenção de outras áreas não tabuladas.
• P(Z>z) = 1 - P(Z<z)
• P(Z<-z) = P(Z>z)
• P(Z>-z) = P(Z<z)
-z z
P(X < 200) = P(Z < -2) = P(Z > 2) = 1 - P(Z < 2)
= 2,275%
7
PUC Minas Virtual Probabilidade e Estatística
UNIDADE 8 Inferência Estatística
8.1. População e amostra; Estatísticas e parâmetros;
8
PUC Minas Virtual Probabilidade e Estatística
Distribuições amostrais
Definições
POPULAÇÃO PARÂMETROS: θ
AMOSTRAS ESTIMADORES: θ’
Distribuição Amostral
7
PUC Minas Virtual Probabilidade e Estatística
aleatória, pode-se determinar suas características, isto é,
encontrar sua média, variância, desvio-padrão.
E (x’) = µ(x’) = µ
Assim, é provado que a média das médias amostrais é igual à média populacional.
8
PUC Minas Virtual Probabilidade e Estatística
Sendo que: µ (x’) = µ
σ2 N −n
ções infinitas, assim como
n N −1 para populações finitas. Ou, ainda:
σ2 σ2 n
ou x'≈ Nµ; n
x'≈ Nµ;
N −
N
com distribuições
padronizadas dadas n por:
−1
xi − µ Z i=
Z =
x i −µ i σ
n
ou
σN
− n
n N −1
Exemplo:
7
PUC Minas Virtual Probabilidade e Estatística
Temos uma população de 5000 alunos de uma
faculdade. Sabemos que a altura média dos alunos é de
175 cm e o desvio padrão, de 5 cm. Retiramos uma
amostra sem reposição, de tamanho n = 100. Qual o
valor do desvio padrão amostral?
Solução:
µ=175cm
X : N (175 , 25 cm) σ= 5cm
Então ()
µx = E x =175
8.2. Estimação
Estimação pontual
8
PUC Minas Virtual Probabilidade e Estatística
17 13 18 19 17 21 29 22 16 28
21 15 26 23 24 20 8 17 17 21
32 18 25 22 16 10 20 22 19 14
30 22 12 24 28 11
7
PUC Minas Virtual Probabilidade e Estatística
Portanto, α nos dá a medida da incerteza desta inferência (nível de significância).
Logo, a partir das informações de amostra, devemos calcular os limites de um
intervalo, valores críticos que em (1 - α)% dos casos inclua o valor do parâmetro a
estimar e em α% dos casos não inclua o valor do parâmetro.
σ2
para as x'≈ Nµ; n populações infinitas,
σ2 n
para as populações finitas.
x'≈ Nµ;
N −
Assim, para o
N caso de populações infinitas, a variável
padronizada n de x’ será:
−1
Z = x ' −µ
σn
Fixando-se um nível de confiança 1 - α, tem-se:
8
PUC Minas Virtual Probabilidade e Estatística
α
P−Z ≤ Z ≤
α
Z =1−α Ou seja:
2 2
Substituindo-se o valor de Z, tem-se:
α x '− µ α
P−Z 2 ≤ σ ≤ Z 2 = 1−α
n
ασ ασ
Px'−Z≤ µ≤ x'+Z= 1 −α
2n 2n
Como poderá ser verificado, a aplicação da fórmula é
extremamente simples. Fixase o valor de 1 - α , ou (1 - α)100= %,
e observa-se na tabela de distribuição normal padrão o valor das
abscissas que deixam α/2 em cada uma das caudas. Com os
valores de x’ (média amostral), σ=desvio padrão da população, que
neste caso é conhecido, e n (tamanho da amostra), constrói-se o
intervalo.
N −n ≤ µ≤ x'+Z α N −n =
n 1−α N −1
Px'− σ
n
N −1 2
α σ
Z 2
7
PUC Minas Virtual Probabilidade e Estatística
Exemplo:
Solução:
2,5% 2,5%
-1,96 1,96
95%
Substituindo na formula :
ασ ασ
Px'−Z ≤ µ≤ x'+Z= 1 −α
8
PUC Minas Virtual Probabilidade e Estatística
2n 2n
P
5 5
500 −1,96 ≤ µ ≤ 500 +1,96 = 95%
100 100
Principais conceitos
7
PUC Minas Virtual Probabilidade e Estatística
Ho: hipótese nula ou
da existência; H 1:
hipótese alternativa.
Exemplo:
µ
HH10 ::µ ≠=11,,6565mm para testes bilaterais (dá origem a um teste
bicaudal)
µ
H0 :µ >=11,,6565mm para testes unilaterais à direita (dá origem a um
µ
H0 :µ <=11,,6565mm para testes unilaterais à esquerda (dá origem a um
8
PUC Minas Virtual Probabilidade e Estatística
• Calcula-se com o valor do parâmetro θ0, dado por H0, o valor crítico,
valor observado na amostra ou valor calculado (Vcalc);
P(|Vcalc| ⊇ Vα)= α → RC
Testes Bilaterais
De uma população normal com variância 36, toma-se uma amostra casual
de tamanho 16, obtendo-se x’=43. Ao nível de 10%, testar as hipóteses:
H0 :µ= 45
H1 :µ≠ 45
7
PUC Minas Virtual Probabilidade e Estatística
Z = x'−µ
σ
x ´
σ
x'
=
n
Zα=Z5%=1,64
Como
Zcalc=-
1,33
Temos
que Zcalc
∈ RNR
8
PUC Minas Virtual Probabilidade e Estatística
Logo, a decisão é não rejeitarmos H 0, isto é, a média é de 45, com 10%
de risco de não rejeitarmos uma hipótese falsa.
H0 :µ= 26
H1 :µ< 26
∴Zcalc ∈ RNR
7
PUC Minas Virtual Probabilidade e Estatística
obtendo-se X’ =210 kg. Ao nível de 10%, pode o fabricante aceitar
que a resistência média de suas lajotas tenha aumentado?
HH10 ::µµ>= 206206
∴RNR=(-∞ ; 1,28)
∴Zcalc ∈ RC
Como Zcalc > Zα, rejeita-se H0, isto é, ao nível de 10% o fabricante pode
concluir que a resistência média de suas lajotas aumentou.
Erros de Decisão
Resumindo:
8
PUC Minas Virtual Probabilidade e Estatística
Realidade
H0 verdadeira H0 falsa
UNIDADE 9
Simetr
9.2. Correlação Linear
9.3. Coeficiente de Correlação Linear
9.4. Regressão – Reta de regressão
(ou reta de mínimos quadrados ou reta de ajuste)
7
PUC Minas Virtual Probabilidade e Estatística
Relações Funcionais
8
PUC Minas Virtual Probabilidade e Estatística
100 18
90 16
80 14
70
12
60
10
50
8
40
30 6
20 4
10 2
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5
25 100
90
20 80
70
15 60
50
10 40
30
5 20
10
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5 6
8,5 18
8 16
14
7,5
12
7 10
6,5 8
6
6
4
5,5 2
5 0
0 2 4 6 8 10 12 14 0 1 2 3 4 5
7
PUC Minas Virtual Probabilidade e Estatística
Figura 9.2. Diagramas de dispersão de diversos tipos de correlação.
e Pearson (r): ()
r= n ∑x i y i − ∑x i ( y i )
Temos
[n ∑ ∑x i
2
][
−( xi )2 * n∑ ∑yi2 −(
r = o y)]
i
2
coeficiente de
Pearson n =
8
PUC Minas Virtual Probabilidade e Estatística
o número de
observações
xi = variável
independente
yi =variável
dependente
Exemplo:
7
PUC Minas Virtual Probabilidade e Estatística
Uma pesquisa pretende verificar se há correlação
significativa entre o peso total do lixo descartado, por
dia, numa empresa com o peso do papel contido nesse
lixo.
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Peso 10,4 19,85 21,2 24,3 27,38 58,09 33,6 35,75 38,33 49,14
total 7 5 6 1
Peso do 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
papel
De acordo com os dados, fazemos a representação gráfica. Os pares
ordenados formam o diagrama de dispersão.
14
12
10
Peso do papel
0
10 20 30 40 50 60 70
Peso total do lixo
∑
r= [ n ∑x i y i − ]( [ x )(y ) i i ]
8
PUC Minas Virtual Probabilidade e Estatística
n∑ ∑xi2 −( xi )2 * n∑ ∑yi2 −( yi )2
( )( )
r= [ i yii−2]∑[x∑ ∑i ∑i2y−i ( yi )2]
n∑x n∑ ∑x − ( x ) * n y
i
2
r=
[10*9377,1052*− 2396(288,,6
2281,83
821)−2288]*[10,21**62375,,2447 −(75,24)2] 2478 ,57
7
PUC Minas Virtual Probabilidade e Estatística
r = 0,921 ou r = 92,1%
Y= aX + b → Y’ = aX + b
X é a variável independente
8
PUC Minas Virtual Probabilidade e Estatística
n∑ ∑ ∑x
y −
2 − (∑ x )2
x * y
a= i i
i
i
i
i
b = y−ax
n∑x
Sendo:
Exemplo:
∑ ∑
a = i yi 2−− ( xi x*i )2 yi = 1010**23969377,68,52−−288(288*,7521,)242 =
23996,893775,2--21684,983065 n∑x
n∑ ∑x i
a= = 0,213
75,24 288,21
y= = 7,52 e x= = 28,82
10 10
7
PUC Minas Virtual Probabilidade e Estatística
b = y−ax = 7,52 - 0,213 * 28,82 = 7,52 - 6,14 =
1,38
Uma vez calculados os parâmetros a e b, pode-se escrever a equação da reta:
Y’ = 0,213 X + 1,38
Para o traçado de uma reta, basta que se conheça dois de seus pontos.
Assim, com base na equação da reta acima, pode-se estabelecer dois
pontos para X e Y’.
14
y = 0,2131x + 1,3836
12
10
0
0 10 20 30 40 50 60
8
PUC Minas Virtual Probabilidade e Estatística
Supondo-se o valor 15 kg para o peso total do lixo descartado,
pode-se estimar o peso de papel contido nesse lixo. Uma vez que
15 kg não é um dado coletado e, conseqüentemente, não pertence
à tabela de dados, utiliza-se a equação da reta para determinar o
valor correspondente ao peso do papel.
7
PUC Minas Virtual Probabilidade e Estatística
Referências Bibliográficas
BUSSAB, W.O. e Morettin, P.A. Estatística Básica. São Paulo: Atual, 1987.
FONSECA, J.S. e Martins, G.A. Curso de Estatística. São Paulo: Atlas, 1993.
TIBONI,C.G. R. Estatística Básica para o curso de Turismo. São Paulo: Atlas, 2002.
8
PUC Minas Virtual Probabilidade e Estatística