MEDIDAS DE DISPERCIÓN
El conocimiento de la forma de la distribución y del respectivo promedio de una colección
de valores de una variable, puede servir para tener una idea bastante clara de la conformación, pero
no de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central
aplicada.
En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida
de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o
variabilidad existente en el grupo de variantes en estudio.
A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a
la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o
dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las medidas de
la estadística descriptiva.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de
tendencia central son representativas como síntesis de la información. Las medidas de dispersión
cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al
valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre
diferentes muestras y las relativas que nos permitirán comparar varias muestras.
LA DISPERSIÓN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos
revelan una parte de la información que necesitamos acerca de las características de los datos. Para
aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión,
extensión o variabilidad.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es
menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una
amplia dispersión de valores con respecto al centro de distribución o esto
presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger
distribuciones que tengan las dispersiones más grandes.
Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya
que la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos
la variabilidad de una distribución empírica? Vamos a considerar sólo algunas medidas de
dispersión absolutas: el rango, la varianza, la desviación estándar y el coeficiente de variación.
EL RANGO O RECORRIDO (R):
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se
define como la diferencia entre el valor más alto (Xn ó Xmax.) y el más bajo (X1 ó Xmin) en un
conjunto de datos.
Rango para datos no agrupados;
R = Xmáx. -Xmín = Xn-X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ir año, a saber: 18,23, 27,34 y 25., para
calcular la media aritmética (promedio de las edades, se tiene que:
R = Xn-X1) = 34-18 = 16 años
Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de clases
abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se aproxima el rango
tomando el límite superior de la última clase menos el límite inferior de la primera clase.
Rango para datos agrupados;
R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)
Ejemplo:
Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de frecuencia de
las cuentas por cobrar de Cabrera’s y Asociados que fueron los siguientes:
Clases P.M. fi fr fa↓ fa↑ fra↓ fra↑
Xi
7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00
21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67
36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54
50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37
65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27
79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17
Total XXX 30 1.00 XXX XXX XXX XXX
Propiedades del Rango o Recorrido:
El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que
simplemente es la distancia entre los valores extremos (máximo y mínimo) en una
distribución
Puesto que el recorrido se basa en los valores extremos éste tiende s ser errático. No es
extraño que en una distribución de datos económicos o comerciales incluya a unos pocos
valores en extremo pequeños o grandes. Cuando tal cosa sucede, entonces el recorrido
solamente mide la dispersión con respecto a esos valores anormales, ignorando a los demás
valores de la variable.
LA VARIANZA (S2 ó δ2):
La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de
referencia es la media aritmética de la distribución. Más específicamente, la varianza es una medida
de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. Cuando
más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén
las Xi a su media menos es la varianza. Y se define y expresa matemáticamente de la siguiente
manera:
La varianza para datos no agrupados
Dado un conjunto de observaciones, tales como X1, X2, …, Xn, la varianza denotada usualmente
por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2) y en otros casos S2 según otros
analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media
aritmética"
Matemáticamente, se expresa como:
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ir año, a saber: 18,23, 25, 27, y 34. Al
calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años, encontrar la varianza de
las edades de estos estudiantes:
Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:
( Xi - )2
Xi ( Xi - )
18 (18 – 25.5)=-7.4 (-7.4)2=54.76
23 (23 – 25.5)=-2.4 (-2.4)2= 5.76
25 (25 – 25.5)=-0.4 (-0.4)2= 0.16
27 (27 – 25.5)= 1.6 ( 1.64)2= 2.16
34 (34 – 25.5)= 8.6 ( 8.6)2 =73.96
Total Xxxx 137.20
Propiedades de la varianza:
s siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente
cuando Xi=
La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
LA DESVIACIÓN ESTÁNDAR (S ó δ)
Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la
media. Es la medida de dispersión más utilizada, se le llama también desviación típica. La
desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima
con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de
esta. A la desviación se le representa por la letra minúscula griega "sigma" (δ ) ó por la letra S
mayúscula, según otros analistas.
Cálculo de la Desviación Estándar
δ = √δ2 ó S = √S2
Ejemplo:
Del cálculo de la varianza de las edades de cinco estudiantes universitarios de primer año se obtuvo
δ2=27.44, como la desviación estándar es la raíz cuadrada positiva, entonces δ = √27.44 = 5.29
años.
Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por cobrar de la
Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces
la desviación estándar es igual a δ =√721.645 = 26.86 balboas.
Propiedades de la Desviación Estándar
A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente
de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):
La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por definición.
Cuando S = 0 è X = xi (para todo i).
Es la medida de dispersión óptima por ser la más pequeña.
La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable
Si a todos los valores de la variable se le suma una misma constante la desviación estándar
no varía.
El Coeficiente de Variación de Pearson (C.V.)
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta qué punto estas medidas de tendencia
central son representativas como síntesis de la información. Las medidas de dispersión cuantifican
la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central.
Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirán comparar varias muestras.
El problema de las medidas de dispersión absolutas es que normalmente son un indicador que nos
da problemas a la hora de comparar. Comparar muestras de variables que entre sí no tienen
cantidades en las mismas unidades, de ahí que en ocasiones se recurra a medidas de dispersión
relativas.
Un problema que se plantea, tanto la varianza como la desviación estándar, especialmente a efectos
de comparaciones entre distribuciones, es el de la dependencia respecto a las unidades de medida de
la variable. Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen
dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de
Variación de Pearson", del que se demuestra que nos da un número independiente de las unidades
de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor
dispersión aquella cuyo coeficiente de variación sea menor., y que se define como la relación por
cociente entre la desviación estándar y la media aritmética; o en otras palabras es la desviación
estándar expresada como porcentaje de la media aritmética.
Definición del Coeficiente de Variación
Dónde: C.V. representa el número de veces que la desviación típica contiene a la media aritmética y
por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.
Propiedades del Coeficiente de Variación:
Si a todos los valores de la variable se le suma una misma constante el coeficiente de
variación queda alterado.
REFERENCIAS BIBLIOGRAFÍCAS
https://www.monografias.com/trabajos43/medidas-dispersion/medidas-
dispersion2.shtml