Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
Medidas de Variabilidad o Dispersión
Rango:
El rango en una distribución de frecuencias nos permite determinar la amplitud
de los datos que se han agrupado, determinando la diferencia entre el limite real
superior de la clase mayor y el límite inferior de la clase menor. Es importante
resaltar que es un valor inestable al incrementarse el tamaño de la muestra, ya
que es posible que valores extremos aislados ocurran.
R=Límite real superior mayor−Límite real inferior menor
R=32.85−6.95=25.90 pies
Amplitud entre el 80% de los datos
Este valor se calcula utilizando el Percentil 90y el percentil 10
D9−D 1=26.1900−12.2780=13.9120 pies
Amplitud entre el 50% de los datos
Este valor se calcula utilizando el Percentil 75y el percentil 25
Q3−Q1 =20.5727−14.7705=5.8022 pies
Variancia o varianza
La varianza es el promedio de las diferencias al cuadrado entre los valores
observados y el promedio aritmético, se le conoce también como el momento de
orden 2, utilizado en el cálculo del grado de asimetría y del grado de agudez. La
raíz cuadrada nos proporciona la desviación estándar.
En datos sin agrupar se calcula como:
2
s=
∑ ( X i−X )
2
En datos agrupados se tienen varios métodos a igual que los utilizados para el
cálculo del promedio aritmético:
1
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
Los más utilizados son los siguientes:
2
s=
∑ 2
( X i−X ) ∗f i
∑ fi
[ ( )]
2
s=
2 ∑ X 2i ∗f i − ∑ X i∗f i
∑ fi ∑fi
Xi fi Xi*fi Xi^2*fi (Xi-media) (Xi-media)*fi (Xi-media)^2*fi
8.8 1 8.8 77.4400 -9.3185 -9.3185 86.8348
12.5 10 125 1562.5000 -5.6185 -56.1852 315.6775
16.2 22 356.4 5773.6800 -1.9185 -42.2074 80.9757
19.9 11 218.9 4356.1100 1.7815 19.5963 34.9104
23.6 4 94.4 2227.8400 5.4815 21.9259 120.1866
27.3 3 81.9 2235.8700 9.1815 27.5444 252.8988
31.0 3 93 2883.0000 12.8815 38.6444 497.7977
54 978.4000 19116.4400 0.0000 1389.2815
2
s=
∑ 2
( X i−X ) ∗f i 1389.2815
= =25.7274 pies
2
∑ fi 54
[ ( )]
2
∑ X 2i ∗f i − ∑ X i∗f i
2
s=
∑ fi ∑fi
=
19116.4400 978.4 2
54
−
54 ( )
=25.7274 pies
2
Utilizando los métodos cortos se tienen:
[ ( )]
2
s=
2 ∑ d 2i ∗f i − ∑ d i∗f i
∑ fi ∑ fi
[ ∑ ( ∑ )]
2
2
s =i
2 ∑ ∑ ´2
d i ∗f i
−
´
d i∗f i
fi fi
Xi fi di di*fi di^2*fi di´ di´*fi di´^2*fi
8.8 1 -7.4 -7.4 54.76 -2 -2 4
12.5 10 -3.7 -37 136.90 -1 -10 10
16.2 22 0 0 0.00 0 0 0
19.9 11 3.7 40.7 150.59 1 11 11
23.6 4 7.4 29.6 219.04 2 8 16
2
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
27.3 3 11.1 33.3 369.63 3 9 27
31.0 3 14.8 44.4 657.12 4 12 48
54 103.60 1588.04 28.0000 116.00
[ ( )]
2
∑ d 2i ∗f i − ∑ d i∗f i
2
s=
∑ fi ∑ fi
=
54
−
54 (
1588.04 103.6 2
)
=25.7274 pies
2
[ ( )] [ ( )]
2
2
s =i
2 ∑ d ´i 2∗f i − ∑ d ´i∗f i =3.7
2 116 28
−
2
=25.7274 pies
2
∑ fi ∑ fi 54 54
Desviación estándar
La desviación estándar es la medida de la dispersión de los datos respecto de la
media aritmética. Corresponde a la raíz cuadrada de la varianza.
s= √ s2
para nuestro ejemplo:
s= √ 25.7274=5.0722 pies
Coeficiente de variación relativa de Pearson
Es el cociente entre la desviación estándar y el promedio aritmético, expresado en
porcentaje. Su utilidad se pone de manifiesto cuando necesitamos realizar una
comparación significativa entre dos variables, las cuales pueden estar en
unidades diferentes , o bien, están en las mismas unidades, pero los promedios se
encuentran muy alejados. Se considera en la práctica que si su valor es menor o
igual a 15%, la distribución es homogenea.
s
V= ∗100
X
En nuestro ejemplo:
5.0722
V= ∗100=27.9947 %
18.1185
3
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
lo que indica que la distribución no es homogenea, se tiene alta dispersión.
Un ejemplo ilustrativo de la utilidad del coeficiente de variación, podría ser el
siguiente:
Un estudio de las calificaciones en un curso interno sobre principios de
administración y los años de servicio de los empleados inscritos en el curso, dio
como resultado estas estadísticas: la calificación media fue 200, la desviación
estándar 40. La media del número de años de servicio fue 20 años, la desviación
estándar, de dos años. ¿Cuál de las variables tiene mayor dispersión?
Para las calificaciones tenemos que:
40
V= ∗100=20 %
200
Para el tiempo de servicio tenemos que:
2
V= ∗100=10 %
20
Como conclusión observamos que existe mayor dispersión relativa en las
calificaciones que en el tiempo de servicio.
Otro ejemplo de interés sería el siguiente:
Se va a comparar la variación de los ingresos anuales de ejecutivos con la
variación de los ingresos anuales de trabajadores no calificados. Para una
muestra de ejecutivos X =500000 y s=50000. Para una muestra de trabajadores no
calificados X =12000 s=1200. Se tendría la impresión de que la dispersión de los
ingresos anuales de los ejecutivos es mayor que la de los trabajadores no
calificados, pero en términos relativos se tiene:
Para los ingresos anuales de los ejecutivos tenemos que:
50,000
V= ∗100=10 %
500,000
Para los ingresos anuales de los trabajadores no calificados tenemos que:
1,200
V= ∗100=10 %
12,000
4
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
Como conclusión no existe diferencia en la dispersión relativa de los dos grupos
de ingresos.
5
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
Medidas de asimetría o sesgo
Debemos entender la asimetría o sesgo como el corrimiento que tiene el promedio
aritmético respecto de las medidas de tendencia central moda y mediana, o bien,
el corrimiento entre los cuartiles 1 y 3 respecto de la mediana.
Las relaciones de asimetría o sesgo se observan desde la construcción de la
distribución de frecuencias y en los gráficas histograma, polígono y curva de
frecuencias de la siguiente forma:
a) Si X =M e =M O existe simetría en la distribución de frecuencias y los coeficientes
de asimetría serán iguales a cero.
b) Si X < M e < M O existe asimetría o sesgo negativo en la distribución de frecuencias,
lo que significa que los coeficientes de asimetría serán valores negativos. Esto
debido a la influencia de valores pequeños en la distribución.
c) Si X > M e > M Oexiste asimetría o sesgo positivo en la distribución de frecuencias,
lo que significa que los coeficientes de asimetría serán valores positivos. Esto
debido a la influencia de valores grandes en la distribución.
Como referencia de comparación se puede considerar que los coeficientes de
asimetría pueden variar dentro del intervalo (-3, 3).
Para determinar los coeficientes de asimetría se pueden utilizar las
siguientes expresiones:
( X−M O )
Sk 1=
s
3∗( X−M e )
Sk 2=
s
( Q3−M e )−( M e −Q1 )
Sk 3=
Q3−Q1
En el ejemplo:
( 18.1185−16.2804 )
Sk 1= =0.3624
5.0722
3∗( 18.1185−17.0409 )
Sk 2= =0.6374
5.0722
6
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
( 20.5727−17.0409 )−( 17.0409−14.7705 )
Sk 3= =0.2174
20.5727−14.7705
De acuerdo a los resultados obtenidos, todos coeficientes de asimetría son
positivos, lo que confirma que la distribución se ve afectada por los valores
mayores
Medidas de agudez o curtosis
La agudez o curtosis mide el grado de apuntamiento de una distribución, de igual
manera que el sesgo la agudez puede variar dentro del intervalo (-3,3).
Para efectos de cálculo de la curtosis, generalmente se utilizan los llamados
momentos de orden r:
m=
∑ ( X i−X )
r
r
n
Orde Datos sin agrupar Datos agrupados Uso como
n
r =0
m=
∑ ( X i−X )
0
=1
∑ [ ( X i−X )0∗f i ]
0 m 0= =1
n ∑ fi
r =1
m 1=
∑ ( X i −X )1 =0 [ ∑ ( X i−X )1∗f i ]
m 1= =0
n ∑ fi
r =2 ∑ ( X i −X )
2
∑ [ ( X i−X ) 2∗f i ] Varianza
m= 2 m 2=
n ∑ fi
Medida de
asimetría
r =3
m=
∑ ( X i−X )
3
∑ [ ( X i−X ) 3∗f i ]
3 m 3=
n ∑ fi
Medida de
agudez
r =4
m =
∑ ( X i− X )
4
∑ [ ( X i− X )4∗f i ]
4 m4 =
n ∑ fi
Otra forma de calcular los momentos:
[ ( )]
2
m2=i ∗
∑ d´i 2∗f i − ∑ d´i ∗f i
2
∑fi ∑ fi
[ ( )( ) ( )]
3
3
m3=i ∗
∑ ´3
d i ∗f i
−3∗
∑ di ∗f i ∑ di ∗f i
´2 ´
+ 2∗
∑ ´
d i∗f i
∑ fi ∑fi ∑ fi ∑ fi
7
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
[ ( )( ) ( )( ) ( )]
2 4
4
m4 =i ∗
∑ d ´i 4∗f i −4∗ ∑ d ´3i ∗f i ∑ d ´i∗f i +6∗
∑ d ´i 2∗f i ∑ d ´i ∗f i −3 ¿
∑ d ´i∗f i
∑ fi ∑ fi ∑ fi ∑ fi ∑fi ∑ fi
Para determinar los índices de asimetría se hace la siguiente relación entre los
momentos:
√
2
m3
α 1= 3
m2
Para determinar la medida de la curtosis o agudez se hace La siguiente relación
entre los momentos:
m4
α 2= 2
−3
m2
Si α 2 <0se dice que la distribución es Platicúrtica (de menor agudez)
Siα 2=0 sedice que la distribución es Mesocúrtica (agudez media, normal)
Si α 2 >0se dice que la distribución es Leptocúrtica (de mayor agudez)
En nuestro ejemplo se obtienen los siguientes resultados:
Xi fi (Xi-media) (Xi-media)*fi (Xi-media)2*fi (Xi-media)3*fi (Xi-media)4*fi
8.8 1 -9.3185 -9.3185 86.8348 -809.1716 7540.2803
12.5 10 -5.6185 -56.1852 315.6775 -1773.6399 9965.2286
16.2 22 -1.9185 -42.2074 80.9757 -155.3534 298.0483
19.9 11 1.7815 19.5963 34.9104 62.1923 110.7944
23.6 4 5.4815 21.9259 120.1866 658.8004 3611.2021
27.3 3 9.1815 27.5444 252.8988 2321.9857 21319.2688
31.0 3 12.8815 38.6444 497.7977 6412.3718 82600.8485
54 0.0000 1389.2815 6717.1854 125445.6711
1389.2815 2
m 2= =25.7274 pies
54
6717.1854 3
m 3= =124.3923 pies
54
8
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
125445.6711 4
m4 = =2323.0680 pies
54
Cálculo de la Asimetría
m23
√ √
2
124.3923
α 1= 3 = = √0.9087=0.9532
m2 25.7274 3
asimetría hacia los valores superiores
Cálculo de la agudez
m4 2323.0680
α 2= 2
−3= 2
−3=3.5097−3=0.5097
m 2 25.7274
Por ser mayor que cero se tiene una distribución leptocúrtica, con mayor agudez,
lo cual se observaba en las gráficas.
Utilizando el método de d´
Xi fi di´ di´*fi di´2*fi di´3*fi di´4*fi
8.8 1 -2 -2 4 -8 16
12.5 10 -1 -10 10 -10 10
16.2 22 0 0 0 0 0
19.9 11 1 11 11 11 11
23.6 4 2 8 16 32 64
27.3 3 3 9 27 81 243
31.0 3 4 12 48 192 768
54 28.0000 116.0000 298 1112
[ ( )] [ ( )]
2
2
m2=i ∗
∑ di ∗f i ∑ di ∗f i
´2
−
´
=3.7
2 116 28
−
2
=25.7274 pies
2
∑fi ∑ fi 54 54
[ ( )( ) ( )]
3
m3=i ∗
∑ d ´3i ∗f i −3∗ ∑ d´i 2∗f i ∑ d´i ∗f i
3
+ 2∗
∑ d ´i∗f i
∑ fi ∑fi ∑ fi ∑ fi
[ ( )( ) ( ) ]=124.3923 pies
3
3 298 116 28 28 3
m3=3.7 ∗ −3∗ + 2∗
54 54 54 54
[ ( )( ) ( )( ) ( )]
2 4
4
m4 =i ∗
∑ ´4
d i ∗f i
−4∗
∑ d i ∗f i ∑ d i∗f i
´3 ´
+6∗
∑ d i ∗f i ∑ d i ∗f i
´2 ´
−3 ¿
∑ d ´i∗f i
∑ fi ∑ fi ∑ fi ∑ fi ∑fi ∑ fi
9
Material de Apoyo Estadística Descriptiva
Ing. Edwin Adalberto Bracamonte Orozco
[ ( )( ) ( )( ) ( ) ]=2323.0680 pies
2 4
4 1112 298 28 116 28 28 4
m4 =3.7 ∗ −4∗ + 6∗ −3 ¿
54 54 54 54 54 54
Como era de esperarse los valores obtenidos son equivalentes a los anteriores.
10