Probabilidade e Estatística Aplicada à Computação UNAMA - Universidade da Amazônia
AULA 4
1.8 MEDIDAS SEPARATRIZES
São valores que separam o rol (os dados ordenados) em quatro (quartis), dez (decis)
ou em cem (percentis) partes iguais. Note que para a sua correta aplicação, exige-se que
os dados estejam organizados num rol.
QUARTIS ( Qi )
DECIS ( Di )
PERCENTIS OU CENTIS ( Ci )
1.8.1 Quartis ( Qi )
São valores que dividem o conjunto de dados ordenados (rol) em 4(quatro) partes
iguais.
Primeiro Quartil ( Q1 ) - valor situado de tal modo na série de dados que 25% das
observações são menores que ele e 75% são maiores.
Segundo Quartil ( Q2 ) - valor situado de tal modo na série de dados que 50% das
observações são menores que ele e 50% são maiores.
Terceiro Quartil (Q3 ) - valor situado de tal modo na série de dados que 75% das
observações são menores que ele e 25% são maiores.
25 25 25 25
Q1 Q2 Q3
1.8.2 Decis ( Di )
São valores que dividem o conjunto de dados ordenados (rol) em 10(dez) partes
iguais.
Primeiro Decil ( D1 ) - valor situado de tal modo na série de dados que 10% das
observações são menores que ele e 90% são maiores.
Segundo Decil ( D2 ) - valor situado de tal modo na série de dados que 20% das
observações são menores que ele e 80% são maiores.
Nono Decil ( D9 ) - valor situado de tal modo na série de dados que 90% das
observações são menores que ele e 10% são maiores.
1.8.3 Percentis ou Centis ( Ci )
São valores que dividem o conjunto de dados ordenados (rol) em 100(cem) partes
iguais.
Primeiro Percentil ( C1 ) - valor situado de tal modo na série de dados que 1% das
observações são menores que ele e 99% são maiores.
Segundo Percentil ( C2 ) - valor situado de tal modo na série de dados que 2% das
observações são menores que ele e 98% são maiores.
Segundo Percentil ( C3 ) - valor situado de tal modo na série de dados que 2% das
observações são menores que ele e 98% são maiores.
. . . . . . . . . . . .
Nonagésimo Nono Percentil ( C99 ) - valor situado de tal modo na série de dados
que 99% das observações são menores que ele e 1% são maiores.
Cálculo dos Quartis, Decis e Percentis
Roteiro para o cálculo:
1º (Passo) Determinar as freqüências acumuladas (fac) da distribuição.
2º (Passo) Calcular a posição do Quartil, Decil ou Percentil desejado, por uma das
fórmulas.
Pi = ∑ i
i. f
(i= 1,2,3) g Quartil
4
i .∑ f i
Pi = (i = 1, 2, 3,..., 9) g Decil
10
i .∑ f i
Pi = (i = 1, 2, 3,..., 99) g Percentil
100
3º (Passo) Identificar a que classe que contém o Quartil, Decil ou Percentil desejado
por meio da freqüência acumulada simples (fac ).
4º (Passo) Calcular o Quartil, Decil ou Percentil desejado por meio de uma das
fórmulas:
• Para o Quartil:
li → limite inferior da classe do quartil
P − fant
f ant → frequência acumulada anterior a classe do quartil
Qi = li + . h onde:
fQ
f Q → frequência simples da classe do quartil
h → amplitude de classe do quartil
• Para o Decil:
li → limite inferior da classe do decil
f → frequência acumulada anterior a classe do decil
P − fant ant
Di = li + .h onde: f D → frequência simples da classe do decil
fD h → amplitude de classe do decil
• Para o Percentil:
li → limite inferior da classe do percentil
f → frequência acumulada anterior a classe do percentil
P − fant ant
Ci = li + onde: f C → frequência simples da classe do percentil
.h
C
f
h → amplitude de classe do percentil
Exemplo: os salários (em salário mínimo) de 160 professores de uma escola estão
distribuídos conforme a tabela a seguir. Calcule o Q1, D4 e o C85 e interprete os resultados.
Salário N. º de prof. fac
(fi)
01 |--- 03 20 20
03 |--- 05 40 60
05 |--- 07 60 120
07 |--- 09 30 150
09 |--- 11 10 160
Total 160 -----
Solução:
1º (Passo) Determinar as freqüências acumuladas (fac) da distribuição.
2º (Passo) Calcular a posição do Quartil, Decil ou Percentil desejado, por uma das
fórmulas.
i.∑ fi 1.160
P1 = = = 400 elemento.
4 4 g Quartil
P4 = ∑ i =
i. f 4.160
= 64 0 elemento. g Decil
10
10
i.∑ fi 85.160
P85 = = = 1360 elemento g Percentil
100 100
3º (Passo) Identificar a que classe que contém o Quartil, Decil ou Percentil desejado
por meio da freqüência acumulada simples (fac ). Quartil (segunda classe); Decil (terceira
Classe); Percentil (Quarta classe).
4º (Passo) Calcular o Quartil, Decil ou Percentil desejado por meio de uma das
fórmulas:
• Quartil:
40− 20
Q1 = 3+ .2 = 4 Salários mínimos
40
• Decil:
64−60
D4 =5+ .2 =5,13 Salários mínimos
60
• Percentil:
136−120
C85 = 7 + .2 =8,07 Salários mínimos
30
• Interpretação: 25% dos professores da escola ganham até 4 salários mínimos
ou 75% dos professores ganham mais de 4 salários mínimos.
• Interpretação: 40% dos professores da escola ganham até 5,13 salários
mínimos ou 60% dos professores ganham mais de 5,13 salários mínimos.
• Interpretação: 85% dos professores da escola ganham até 8,07 salários
mínimos ou 15% dos professores ganham mais de 8,07 salários mínimos.
1.9 MEDIDAS DE DISPERSÃO
São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão
dos valores em torno de um valor central; geralmente as médias. Servem para medir a
representatividade das medidas de tendência central.
Chamamos de dispersão ou variabilidade a maior ou menor diversificação dos
valores de uma variável em torno de um valor de tendência central, tomado como ponto de
comparação.
Consideremos os seguintes conjuntos de valores como sendo as notas de três
turmas de alunos X, Y e Z.
___
Turma “X” = { 6,0; 6,0; 6,0; 6,0; 6,0} X = 6,0
Turma “Y” = { 5,8; 5,9; 6,0; 6,1; 6,2}
Turma “Z” = { 1,0; 4,0; 6,0; 9,0; 10,0}
Embora as tumas X, Y e Z, apresentem a mesma média aritmética, é fácil notar
que o grupo X é mais homogêneo em relação as notas, que os grupos Y e Z, já que todas
as notas são iguais a média.
O grupo Y, por sua vez, é mais homogêneo que o grupo Z, pois há menor
diversificação entre cada um dos seus valores.
Podemos dizer que a grupo X apresenta dispersão ou variabilidade nula e que o
grupo Y apresenta uma dispersão ou variabilidade maior que o grupo Z.
Portanto, para qualificar os valores de uma dada variável, resultando a maior ou
menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a
Estatística recorre às medidas de dispersão ou de variabilidade. A seguir vamos apresentar
algumas medidas de dispersão mais usuais.
1.9.1 Variância e Desvio Padrão
Cálculo da Variância para dados não tabulados
n
2
n ∑ xi
. ∑ x i2 −
1 i= 1
S 2
=
n − 1 i= 1 n Variância
S = S 2 Desvio padrão
Consideremos os seguintes conjuntos de valores como sendo amostras de
rendimentos de três grupos de trabalhadores.
Grupo “X” = { 6,0; 6,0; 6,0; 6,0; 6,0}
Grupo “Y” = { 5,8; 5,9; 6,0; 6,1; 6,2}
Grupo “Z” = {1,0; 4,0; 6,0; 9,0; 10,0}
Exemplo: determine a variância e o desvio padrão para as amostras dos grupos
relacionadas anteriormente.
• Para o Grupo “X” = {6,0; 6,0; 6,0; 6,0; 6,0}
5
xi (rendimentos) 6,0 6,0 6,0 6,0 6,0 ∑X
i =1
i = 30,0
5
xi2 36,0 36,0 36,0 36,0 36,0 ∑X
i =1
i
2
= 180,0
5
2
∑i 1
x
1 5 2 i =1 ( 30 ) 1
2
1
S2 = . ∑ xi − = . 180 − [ − 180] = 4 .0 = 0
= .180
n − 1 i =1 n 5 −1 5 4
S = S2 = 0 =0
• Para a Grupo “Y” = { 5,8; 5,9; 6,0; 6,1; 6,2}
5
xi (rendimentos) 5,8 5,9 6,0 6,1 6,2 ∑X
i =1
i = 30,0
5
xi2 33,64 34,81 36,00 37,21 38,44 ∑X
i =1
2
i = 180,10
5
2
∑ xi 1
1 5 2 i =1 ( 30 ) 1
2
1 0,10
S =
2
. ∑ xi − = . 180,10 − [
= .180,10 − 180 ] = .0,10 = = 0,02
n − 1 i =1 n 5 −1 5 4 4 4
S = S 2 = 0,02 = 0,1
• Grupo “Z” = {1,0; 4,0; 6,0; 9,0; 10,0}
5
xi (rendimentos) 1,0 4,0 6,0 9,0 10,0 ∑X
i =1
i = 30,0
5
xi2 1,0 16,0 36,0 81,0 100,0 ∑X
i =1
2
i = 234,0
5
2
5 ∑ x i
1 ( 30) 1
2
. ∑ xi2 − i =1 =
1
= . [234 − 180] = .54 =
1 54
S2 = . 234 − = 13,5
n − 1 i =1 n 5 −1 5 4 4 4
S = S 2 = 13,5 = 3, 7
Resumo
Grupo Variância Desvio padrão
X 0,0 0,0
Y 0,2 0,1
Z 13,5 3,7
Analisando os resultados obtidos com o cálculo das variâncias e dos desvios
padrões, observa-se que o grupo X apresenta menor dispersão dos valores em torno da
média e o grupo Z foi o que apresentou maior variabilidade em torno da média
Cálculo da Variância e do Desvio padrão para dados tabulados
k
2
k ∑ f i xi
. ∑ f i x i − i = 1k
1
S2 = 2
k i =1 Variância
∑ fi − 1 ∑ fi
i =1
i =1
S = S 2 Desvio padrão
Exemplo: os salários (em salário mínimo) de 160 funcionários de uma empresa
estão distribuídos conforme a tabela a seguir. Calcule a variância e o desvio padrão dos
salários dos funcionários.
Salários N.º de func. (fi) Xi Xi.fi Xi 2.fi
01 |--- 03 20 2 40 80
03 |--- 05 40 4 160 640
05 |--- 07 60 6 360 2160
07 |--- 09 30 8 240 1920
09 |--- 11 10 10 100 1000
Total 160 ---- 900 5800
k
2
k ∑ i i f x (9 0 0 )
2
. ∑ f i xi2 − i =1 k =
1 1
S2 = 5800 − =
k i=1 160 − 1
∑ ∑ fi 160
fi − 1
i =1
i=1
1 1 737,50
S2 = . [5 8 0 0 − 5 0 6 2 , 5 0 ] = .737,50 = = 4,64Salarios minimos 2
159 159 159
S = S 2 = 4,64 = 2,15 Salários mínimos
1.9.2 Coeficiente de Variação de Pearson (CV p )
O coeficiente de variação de Pearson mede percentualmente a variação ocorrida
da medida de dispersão absoluta (S) relativo a média aritmética (x), indica a magnitude
relativa do desvio padrão quando comparado com a média da distribuição das medidas.
S
CV p = x100%
X
Exemplo: determine o coeficiente de variação para as amostras dos grupos
relacionadas anteriormente.
• Para o Grupo “X”:
_ __
X =
∑X i
=
30
= 6 pts
n 5
S 0 0
CV p = __
x100 = x100 = = 0 ,0 %
X 6 6
• Para o Grupo “Y”:
_ __
X =
∑X i
=
30
= 6 pts
n 5
S 0 ,1 10
CV p = __
x100 = x100 = = 1 .7 %
X 6 6
• Para o Grupo “Z” :
_ __
X =
∑X i
=
30
= 6 pts
n 5
S 3,6 360
CV p = __
x100 = x100 = = 60,0%
6 6
X
• Observações: alguns analistas sugerem a seguinte classificação do
coeficiente de variação.
· Baixa variabilidade: CV p < 15%
· Média variabilidade: 15% ≤ CV p < 30%
· Alta variabilidade: CV p ≥ 30%
Observando o coeficiente de variação das amostras, percebemos que os grupos
“X” e “Y” apresentaram uma baixa variabilidade, enquanto que a grupo “Z” apresentou uma
alta variabilidade, portanto, o grupo “Z” é o grupo mais heterogêneo.
1.10 MEDIDAS DE NORMALIDADE
1.10.1 Assimetria ( As )
Para conceituar assimetria, obviamente precisamos conceituar simetria. Diremos
que existe simetria quando a maioria dos valores da variável se concentra no meio da
distribuição de forma simétrica.
Exemplo 1: salários (em salário mínimo) dos funcionários da empresa “Alfa” - 2004.
Salários N.º de funcionários
01 |--- 03 10
03 |--- 05 30
05 |--- 07 50
07 |--- 09 30
09 |--- 11 10
Total 130
Quando os valores da variável se concentrarem em uma das extremidades da
distribuição, diremos que existe assimetria.
Exemplo 2: salários (em salário mínimo) dos funcionários da empresa “Alfa” - 2004.
Salários N.º de funcionários
01 |--- 03 50
03 |--- 05 40
05 |--- 07 30
07 |--- 09 20
09 |--- 11 10
Total 150
Exemplo 3: salários (em salário mínimo) dos funcionários da empresa “Alfa” - 2004.
Salários N.º de funcionários
01 |--- 03 10
03 |--- 05 20
05 |--- 07 30
07 |--- 09 40
09 |--- 11 50
Total 150
1.10.2 Tipos de curva ou distribuição de freqüência
(a) Curva ou Distribuição Simétrica
Uma distribuição é considerada Simétrica quando o valor da média for igual ao da
__
mediana e moda ( X = M d = M 0 ), isto significa que a maioria dos valores se concentra no
meio da distribuição.
fi
__ Xi
X = Md = M0
(a) Curva ou Distribuição Assimétrica Positiva:
Uma distribuição é considerada assimétrica positiva quando a o valor da moda(Mo)
__
for menor que o da mediana(Md) e o da mediana menor que o da média(X) ( M 0 < M d < X ),
isto significa que a maioria dos valores se concentram á esquerda.
fi
Mo Md __ Xi
X
(a) Curva ou Distribuição Assimétrica Negativa:
Uma distribuição é considerada assimétrica negativa quando a o valor da média(X)
for menor que o da mediana (Md) e o da mediana menor que o da moda(Mo) ou
__
( X < M d < M 0 ), isto significa que a maioria dos valores se concentram à direita.
fi
__
Md Mo Xi
X
1.10.3 Coeficiente de Assimetria
___
X − Mo
As =
S
· Classificação da distribuição por meio do coeficiente da assimetria:
Se As £ -1,00 g então a distribuição é assimétrica negativa forte.
Se –1,00 < As < -0,15 g então a distribuição é assimétrica negativa fraca.
Se –0,15 £ As £ 0,15 g então a distribuição é simétrica.
Se 0,15 < As < 1,00 g então a distribuição é assimétrica positiva fraca.
Se As ³ 1 g então a distribuição é assimétrica positiva forte.
Exemplo: um estudo sobre as distribuição dos pesos dos alunos da escola “FKS”,
onde já calculamos os valores de −X−− (59,3 kg), Mo (56,8 kg) e S (9,0 kg). Calcule o coeficiente
de assimetria da distribuição e classifique a distribuição.
___
X − Mo 59,3 − 56,8 2,5
As = = = = 0,28
S 9 9
Portanto, a distribuição apresenta uma assimetria positiva moderada.