0% acharam este documento útil (0 voto)
94 visualizações13 páginas

Medidas Separatrizes e Dispersão

1) O documento discute medidas estatísticas utilizadas para avaliar a variabilidade ou dispersão de valores em torno de uma medida central. 2) São apresentadas medidas separatrizes como quartis, decís e percentis, que dividem um conjunto de dados em partes iguais. 3) São também definidas variância e desvio padrão como medidas de dispersão que quantificam a diversificação dos valores em relação à média.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
94 visualizações13 páginas

Medidas Separatrizes e Dispersão

1) O documento discute medidas estatísticas utilizadas para avaliar a variabilidade ou dispersão de valores em torno de uma medida central. 2) São apresentadas medidas separatrizes como quartis, decís e percentis, que dividem um conjunto de dados em partes iguais. 3) São também definidas variância e desvio padrão como medidas de dispersão que quantificam a diversificação dos valores em relação à média.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 13

Probabilidade e Estatística Aplicada à Computação UNAMA - Universidade da Amazônia

AULA 4

1.8 MEDIDAS SEPARATRIZES


São valores que separam o rol (os dados ordenados) em quatro (quartis), dez (decis)
ou em cem (percentis) partes iguais. Note que para a sua correta aplicação, exige-se que
os dados estejam organizados num rol.

QUARTIS ( Qi )

DECIS ( Di )

PERCENTIS OU CENTIS ( Ci )

1.8.1 Quartis ( Qi )

São valores que dividem o conjunto de dados ordenados (rol) em 4(quatro) partes
iguais.

Primeiro Quartil ( Q1 ) - valor situado de tal modo na série de dados que 25% das
observações são menores que ele e 75% são maiores.

Segundo Quartil ( Q2 ) - valor situado de tal modo na série de dados que 50% das
observações são menores que ele e 50% são maiores.

Terceiro Quartil (Q3 ) - valor situado de tal modo na série de dados que 75% das
observações são menores que ele e 25% são maiores.

25 25 25 25
Q1 Q2 Q3

1.8.2 Decis ( Di )

São valores que dividem o conjunto de dados ordenados (rol) em 10(dez) partes
iguais.

Primeiro Decil ( D1 ) - valor situado de tal modo na série de dados que 10% das
observações são menores que ele e 90% são maiores.

Segundo Decil ( D2 ) - valor situado de tal modo na série de dados que 20% das
observações são menores que ele e 80% são maiores.

Nono Decil ( D9 ) - valor situado de tal modo na série de dados que 90% das
observações são menores que ele e 10% são maiores.
1.8.3 Percentis ou Centis ( Ci )

São valores que dividem o conjunto de dados ordenados (rol) em 100(cem) partes
iguais.

Primeiro Percentil ( C1 ) - valor situado de tal modo na série de dados que 1% das
observações são menores que ele e 99% são maiores.

Segundo Percentil ( C2 ) - valor situado de tal modo na série de dados que 2% das
observações são menores que ele e 98% são maiores.

Segundo Percentil ( C3 ) - valor situado de tal modo na série de dados que 2% das
observações são menores que ele e 98% são maiores.

. . . . . . . . . . . .

Nonagésimo Nono Percentil ( C99 ) - valor situado de tal modo na série de dados
que 99% das observações são menores que ele e 1% são maiores.

Cálculo dos Quartis, Decis e Percentis

Roteiro para o cálculo:

1º (Passo) Determinar as freqüências acumuladas (fac) da distribuição.

2º (Passo) Calcular a posição do Quartil, Decil ou Percentil desejado, por uma das
fórmulas.

Pi =  ∑ i
 i. f 
 (i= 1,2,3) g Quartil
 4 

 i .∑ f i 
Pi =   (i = 1, 2, 3,..., 9) g Decil
 10 

 i .∑ f i 
Pi =   (i = 1, 2, 3,..., 99) g Percentil
 100 

3º (Passo) Identificar a que classe que contém o Quartil, Decil ou Percentil desejado
por meio da freqüência acumulada simples (fac ).
4º (Passo) Calcular o Quartil, Decil ou Percentil desejado por meio de uma das
fórmulas:

• Para o Quartil:

 li → limite inferior da classe do quartil


 P − fant  
 f ant → frequência acumulada anterior a classe do quartil
Qi = li +  . h onde: 
 fQ 
   f Q → frequência simples da classe do quartil
 h → amplitude de classe do quartil

• Para o Decil:

li → limite inferior da classe do decil


 f → frequência acumulada anterior a classe do decil
 P − fant   ant
Di = li +  .h onde:  f D → frequência simples da classe do decil
 fD   h → amplitude de classe do decil

• Para o Percentil:

li → limite inferior da classe do percentil


 f → frequência acumulada anterior a classe do percentil
 P − fant   ant
Ci = li +   onde:  f C → frequência simples da classe do percentil
.h
 C 
f
 h → amplitude de classe do percentil

Exemplo: os salários (em salário mínimo) de 160 professores de uma escola estão
distribuídos conforme a tabela a seguir. Calcule o Q1, D4 e o C85 e interprete os resultados.

Salário N. º de prof. fac


(fi)
01 |--- 03 20 20
03 |--- 05 40 60
05 |--- 07 60 120
07 |--- 09 30 150
09 |--- 11 10 160
Total 160 -----
Solução:

1º (Passo) Determinar as freqüências acumuladas (fac) da distribuição.

2º (Passo) Calcular a posição do Quartil, Decil ou Percentil desejado, por uma das
fórmulas.
 i.∑ fi  1.160
P1 =  = = 400 elemento.
 4  4 g Quartil
 

P4 =  ∑ i  =
 i. f  4.160
= 64 0 elemento. g Decil
 10 
  10

 i.∑ fi  85.160
P85 =   = = 1360 elemento g Percentil
 100 100
 
3º (Passo) Identificar a que classe que contém o Quartil, Decil ou Percentil desejado
por meio da freqüência acumulada simples (fac ). Quartil (segunda classe); Decil (terceira
Classe); Percentil (Quarta classe).

4º (Passo) Calcular o Quartil, Decil ou Percentil desejado por meio de uma das
fórmulas:

• Quartil:

 40− 20 
Q1 = 3+  .2 = 4 Salários mínimos
 40 
• Decil:

 64−60
D4 =5+ .2 =5,13 Salários mínimos
 60 

• Percentil:

136−120
C85 = 7 + .2 =8,07 Salários mínimos
 30 

• Interpretação: 25% dos professores da escola ganham até 4 salários mínimos


ou 75% dos professores ganham mais de 4 salários mínimos.
• Interpretação: 40% dos professores da escola ganham até 5,13 salários
mínimos ou 60% dos professores ganham mais de 5,13 salários mínimos.

• Interpretação: 85% dos professores da escola ganham até 8,07 salários


mínimos ou 15% dos professores ganham mais de 8,07 salários mínimos.

1.9 MEDIDAS DE DISPERSÃO


São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão
dos valores em torno de um valor central; geralmente as médias. Servem para medir a
representatividade das medidas de tendência central.

Chamamos de dispersão ou variabilidade a maior ou menor diversificação dos


valores de uma variável em torno de um valor de tendência central, tomado como ponto de
comparação.

Consideremos os seguintes conjuntos de valores como sendo as notas de três


turmas de alunos X, Y e Z.
___
Turma “X” = { 6,0; 6,0; 6,0; 6,0; 6,0} X = 6,0

Turma “Y” = { 5,8; 5,9; 6,0; 6,1; 6,2}

Turma “Z” = { 1,0; 4,0; 6,0; 9,0; 10,0}

Embora as tumas X, Y e Z, apresentem a mesma média aritmética, é fácil notar


que o grupo X é mais homogêneo em relação as notas, que os grupos Y e Z, já que todas
as notas são iguais a média.

O grupo Y, por sua vez, é mais homogêneo que o grupo Z, pois há menor
diversificação entre cada um dos seus valores.

Podemos dizer que a grupo X apresenta dispersão ou variabilidade nula e que o


grupo Y apresenta uma dispersão ou variabilidade maior que o grupo Z.

Portanto, para qualificar os valores de uma dada variável, resultando a maior ou


menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a
Estatística recorre às medidas de dispersão ou de variabilidade. A seguir vamos apresentar
algumas medidas de dispersão mais usuais.
1.9.1 Variância e Desvio Padrão

Cálculo da Variância para dados não tabulados

  n

2

 n  ∑ xi  
.  ∑ x i2 −   
1 i= 1
S 2
=
n − 1  i= 1 n  Variância
 
 

S = S 2 Desvio padrão

Consideremos os seguintes conjuntos de valores como sendo amostras de


rendimentos de três grupos de trabalhadores.

Grupo “X” = { 6,0; 6,0; 6,0; 6,0; 6,0}

Grupo “Y” = { 5,8; 5,9; 6,0; 6,1; 6,2}

Grupo “Z” = {1,0; 4,0; 6,0; 9,0; 10,0}

Exemplo: determine a variância e o desvio padrão para as amostras dos grupos


relacionadas anteriormente.

• Para o Grupo “X” = {6,0; 6,0; 6,0; 6,0; 6,0}

5
xi (rendimentos) 6,0 6,0 6,0 6,0 6,0 ∑X
i =1
i = 30,0

5
xi2 36,0 36,0 36,0 36,0 36,0 ∑X
i =1
i
2
= 180,0

  5  
2

 ∑i  1 
x
1  5 2  i =1   ( 30 )  1
2
1
S2 = . ∑ xi − = . 180 − [ − 180] = 4 .0 = 0
 = .180
n − 1  i =1 n  5 −1  5  4
   
 

S = S2 = 0 =0
• Para a Grupo “Y” = { 5,8; 5,9; 6,0; 6,1; 6,2}

5
xi (rendimentos) 5,8 5,9 6,0 6,1 6,2 ∑X
i =1
i = 30,0

5
xi2 33,64 34,81 36,00 37,21 38,44 ∑X
i =1
2
i = 180,10

  5  
2

 ∑ xi  1 
1  5 2  i =1   ( 30 )  1
2
1 0,10
S =
2
. ∑ xi − = . 180,10 − [
 = .180,10 − 180 ] = .0,10 = = 0,02

n − 1 i =1 n  5 −1  5  4 4 4
   
 

S = S 2 = 0,02 = 0,1

• Grupo “Z” = {1,0; 4,0; 6,0; 9,0; 10,0}

5
xi (rendimentos) 1,0 4,0 6,0 9,0 10,0 ∑X
i =1
i = 30,0

5
xi2 1,0 16,0 36,0 81,0 100,0 ∑X
i =1
2
i = 234,0

  5  
2

 5  ∑ x i 
1  ( 30)  1
2

. ∑ xi2 −  i =1   =
1 
 = . [234 − 180] = .54 =
1 54
S2 = .  234 − = 13,5
n − 1  i =1 n  5 −1  5  4 4 4
   
 

S = S 2 = 13,5 = 3, 7

Resumo

Grupo Variância Desvio padrão


X 0,0 0,0
Y 0,2 0,1
Z 13,5 3,7
Analisando os resultados obtidos com o cálculo das variâncias e dos desvios
padrões, observa-se que o grupo X apresenta menor dispersão dos valores em torno da
média e o grupo Z foi o que apresentou maior variabilidade em torno da média

Cálculo da Variância e do Desvio padrão para dados tabulados

  k  
2

 k  ∑ f i xi  
. ∑ f i x i −  i = 1k
  
1
S2 = 2
k  i =1  Variância
∑ fi − 1  ∑ fi 
i =1
 i =1 

S = S 2 Desvio padrão

Exemplo: os salários (em salário mínimo) de 160 funcionários de uma empresa


estão distribuídos conforme a tabela a seguir. Calcule a variância e o desvio padrão dos
salários dos funcionários.

Salários N.º de func. (fi) Xi Xi.fi Xi 2.fi


01 |--- 03 20 2 40 80
03 |--- 05 40 4 160 640
05 |--- 07 60 6 360 2160
07 |--- 09 30 8 240 1920
09 |--- 11 10 10 100 1000
Total 160 ---- 900 5800

  k 
2

 k ∑ i i  f x   (9 0 0 )
2

.  ∑ f i xi2 −  i =1 k   =
1 1
S2 = 5800 −  =
k  i=1  160 − 1  
∑ ∑ fi  160
fi − 1  
i =1
 i=1

1 1 737,50
S2 = . [5 8 0 0 − 5 0 6 2 , 5 0 ] = .737,50 = = 4,64Salarios minimos 2
159 159 159

S = S 2 = 4,64 = 2,15 Salários mínimos


1.9.2 Coeficiente de Variação de Pearson (CV p )

O coeficiente de variação de Pearson mede percentualmente a variação ocorrida


da medida de dispersão absoluta (S) relativo a média aritmética (x), indica a magnitude
relativa do desvio padrão quando comparado com a média da distribuição das medidas.
S
CV p = x100%
X
Exemplo: determine o coeficiente de variação para as amostras dos grupos
relacionadas anteriormente.

• Para o Grupo “X”:

_ __
X =
∑X i
=
30
= 6 pts
n 5

S 0 0
CV p = __
x100 = x100 = = 0 ,0 %
X 6 6

• Para o Grupo “Y”:

_ __
X =
∑X i
=
30
= 6 pts
n 5

S 0 ,1 10
CV p = __
x100 = x100 = = 1 .7 %
X 6 6

• Para o Grupo “Z” :

_ __
X =
∑X i
=
30
= 6 pts
n 5

S 3,6 360
CV p = __
x100 = x100 = = 60,0%
6 6
X
• Observações: alguns analistas sugerem a seguinte classificação do
coeficiente de variação.

· Baixa variabilidade: CV p < 15%

· Média variabilidade: 15% ≤ CV p < 30%

· Alta variabilidade: CV p ≥ 30%

Observando o coeficiente de variação das amostras, percebemos que os grupos


“X” e “Y” apresentaram uma baixa variabilidade, enquanto que a grupo “Z” apresentou uma
alta variabilidade, portanto, o grupo “Z” é o grupo mais heterogêneo.

1.10 MEDIDAS DE NORMALIDADE


1.10.1 Assimetria ( As )

Para conceituar assimetria, obviamente precisamos conceituar simetria. Diremos


que existe simetria quando a maioria dos valores da variável se concentra no meio da
distribuição de forma simétrica.

Exemplo 1: salários (em salário mínimo) dos funcionários da empresa “Alfa” - 2004.

Salários N.º de funcionários


01 |--- 03 10
03 |--- 05 30
05 |--- 07 50
07 |--- 09 30
09 |--- 11 10
Total 130

Quando os valores da variável se concentrarem em uma das extremidades da


distribuição, diremos que existe assimetria.
Exemplo 2: salários (em salário mínimo) dos funcionários da empresa “Alfa” - 2004.

Salários N.º de funcionários


01 |--- 03 50
03 |--- 05 40
05 |--- 07 30
07 |--- 09 20
09 |--- 11 10
Total 150

Exemplo 3: salários (em salário mínimo) dos funcionários da empresa “Alfa” - 2004.

Salários N.º de funcionários


01 |--- 03 10
03 |--- 05 20
05 |--- 07 30
07 |--- 09 40
09 |--- 11 50
Total 150

1.10.2 Tipos de curva ou distribuição de freqüência


(a) Curva ou Distribuição Simétrica

Uma distribuição é considerada Simétrica quando o valor da média for igual ao da


__
mediana e moda ( X = M d = M 0 ), isto significa que a maioria dos valores se concentra no
meio da distribuição.

fi

__ Xi
X = Md = M0
(a) Curva ou Distribuição Assimétrica Positiva:

Uma distribuição é considerada assimétrica positiva quando a o valor da moda(Mo)


__
for menor que o da mediana(Md) e o da mediana menor que o da média(X) ( M 0 < M d < X ),
isto significa que a maioria dos valores se concentram á esquerda.

fi

Mo Md __ Xi
X

(a) Curva ou Distribuição Assimétrica Negativa:

Uma distribuição é considerada assimétrica negativa quando a o valor da média(X)


for menor que o da mediana (Md) e o da mediana menor que o da moda(Mo) ou
__
( X < M d < M 0 ), isto significa que a maioria dos valores se concentram à direita.

fi

__
Md Mo Xi
X

1.10.3 Coeficiente de Assimetria

___
X − Mo
As =
S
· Classificação da distribuição por meio do coeficiente da assimetria:

Se As £ -1,00 g então a distribuição é assimétrica negativa forte.

Se –1,00 < As < -0,15 g então a distribuição é assimétrica negativa fraca.

Se –0,15 £ As £ 0,15 g então a distribuição é simétrica.

Se 0,15 < As < 1,00 g então a distribuição é assimétrica positiva fraca.

Se As ³ 1 g então a distribuição é assimétrica positiva forte.


Exemplo: um estudo sobre as distribuição dos pesos dos alunos da escola “FKS”,
onde já calculamos os valores de −X−− (59,3 kg), Mo (56,8 kg) e S (9,0 kg). Calcule o coeficiente
de assimetria da distribuição e classifique a distribuição.

___
X − Mo 59,3 − 56,8 2,5
As = = = = 0,28
S 9 9

Portanto, a distribuição apresenta uma assimetria positiva moderada.

Você também pode gostar