MEDIDAS DE FORMA
Medidas de forma permiten comprobar si una distribución de frecuencia tiene
características especiales como simetría, asimetría, nivel de concentración de datos y nivel
de apuntamiento que la clasifiquen en un tipo particular de distribución.
Las medidas de forma son necesarias para determinar el comportamiento de los datos y así,
poder adaptar herramientas para el análisis probabilístico.
Medidas de forma: Son indicadores estadísticos que permiten identificar si una
distribución de frecuencia presenta uniformidad.
En este capítulo analizaremos dos medidas de forma:
Coeficiente de asimetría
Curtosis
Antes de empezar con cada uno de estos indicadores, analizaremos los tipos más comunes
de distribución de frecuencia y la relación media, mediana y moda como primera medida
para identificar el grado de asimetría en una distribución de frecuencia.
Un sesgo es un error que aparece en los resultados de un estudio debido a factores que
dependen de la recolección, análisis, interpretación, publicación o revisión de los datos que
pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o
incorrectas
la curtosis es el coeficiente de apuntamiento (concentrado en torno al pico máximo) de
la distribución de probabilidad de una variable aleatoria de número real.
El cuarto momento estándar se define como , donde μ4 es el 4º momento
centrado sobre la media y σ es la desviación estándar. Esta es la definición de curtosis que
se suele emplear en libros antiguos, pero no es la que se expondrá aquí.
Comúnmente se define la curtosis como
También conocida como exceso de Andre. La sustracción del 3 al final de la fórmula se
explica generalmente como una corrección que se hace a la curtosis de una distribución
normal igual a cero. Otra razón se obtiene examinando la fórmula de la curtosis de la suma
de variables aleatorias. Si Y es la suma de n variables aleatorias estadísticamente
independientes, todas con igual distribución X, entonces
, complicándose la fórmula si la curtosis se hubiese definido como:
leptocúrtica, cuando y: más apuntada y con colas más gruesas que la
normal.
Platicúrtica y: menos apuntada y con colas menos gruesas que la normal.
Mesocúrtica y : cuando tiene una distribución normal
.
MÁS ACERCA DE ASIMETRÍA Y CURTOSIS
La asimetría y curtosis informan sobre la forma de la distribución de
una variable. Estas medidas permiten saber las características de su asimetría y
homogeneidad sin necesidad de representarlos gráficamente.
Asimetría
La asimetría es la medida que indica la simetría de la distribución de
una variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el mismo
número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
Asimetría negativa: la cola de la distribución se alarga para valores inferiores a
la media.
Simétrica: hay el mismo número de elementos a izquierda y derecha de
la media. En este caso, coinciden la media, la mediana y la moda. La
distribución se adapta a la forma de la campana de Gauss, o distribución
normal.
Asimetría positiva: la cola de la distribución se alarga (a la derecha) para
valores superiores a la media.
Existen tres coeficientes de asimetría:
Coeficiente de asimetría de Fisher
El coeficiente de asimetría de Fisher CAF evalúa la proximidad de los datos a
su media x. Cuanto mayor sea la suma ∑(xi–x)3, mayor será la asimetría. Sea el
conjunto X=(x1, x2,…, xN), entonces la fórmula de la asimetría de Fisher es:
Cuando los datos están agrupados o agrupados en intervalos, la fórmula
del coeficiente de asimetría de Fisher se convierte en:
Si CAF<0: la distribución tiene una asimetría negativa y se alarga a valores
menores que la media.
Si CAF=0: la distribución es simétrica.
Si CAF>0: la distribución tiene una asimetría positiva y se alarga a valores
mayores que la media.
Coeficiente de asimetría de Pearson
El coeficiente de asimetría de Pearson CAP mide la diferencia entre la media y
la moda respecto a la dispersión del conjunto X=(x1, x2,…, xN).
Este procedimiento, menos usado, lo emplearemos solamente en
distribuciones unimodales y poco asimétricas.
Si CAP<0: la distribución tiene una asimetría negativa, puesto que la media es
menor que la moda.
Si CAP=0: la distribución es simétrica.
Si CAP>0: la distribución tiene una asimetría positiva, ya que la media es mayor
que la moda.
Coeficiente de asimetría de Bowley
El coeficiente de asimetría de Bowley CAB toma como referencia
los cuartiles para determinar si la distribución es simétrica o no. Para aplicar este
coeficiente, se supone que el comportamiento de la distribución en los extremos
es similar. Sea el conjunto X=(x1, x2,…, xN), la asimetría de Bowley es:
Esta fórmula viene de:
Recordemos que la mediana (Me) es lo mismo que el segundo cuartil (Q2).
Por lo que la fórmula del coeficiente de asimetría de Bowley también se puede
escribir así:
Si CAB<0: la distribución tiene una asimetría negativa, puesto que la distancia de
la mediana al primer cuartil es mayor que al tercero.
Si CAB=0: la distribución es simétrica, ya que el primer y tercer cuartil están a la
misma distancia de la mediana.
Si CAB>0: la distribución tiene una asimetría positiva, ya que la distancia de
la mediana al tercer cuartil es mayor que al primero.
Curtosis
La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada
o achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de
manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de
la curva.
La curtosis se mide promediando la cuarta potencia de la diferencia entre cada
elemento del conjunto y la media, dividido entre la desviación típica elevado
también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el
coeficiente de curtosis será:
En la fórmula se resta 3 porque es la curtosis de una distribución Normal.
Entonces la curtosis valdrá 0 para la Normal, tomándose a ésta como referencia.
Cuando los datos están agrupados o agrupados en intervalos, la fórmula
del coeficiente de curtosis se convierte en:
1) ASIMETRÍA
Es una medida de forma de una distribución que permite identificar y describir la
manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se
hallen dentro de la distribución. Permite identificar las características de la
distribución de datos sin necesidad de generar el gráfico.
1.1) TIPOS DE ASIMETRÍA
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la
minoría de los datos está en la parte izquierda de la media. Este tipo de
distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la
distribución de los datos tiene a la izquierda una cola más larga que a la derecha.
También se dice que una distribución es simétrica a la izquierda o tiene sesgo
negativo cuando el valor de la media aritmética es menor que la mediana y éste
valor de la mediana a su vez es menor que la moda, en símbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta
de la simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la
misma cantidad de los datos a ambos lados de la media aritmética. No tiene
alargamiento o sesgo. Se representa por una curva normal en forma de campana
llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida
como de Laplace (1749-1827).También se dice que una distribución es simétrica
cuando su media aritmética, su mediana y su moda son iguales, en símbolos
Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la
minoría de los datos está en la parte derecha de la media aritmética. Este tipo de
distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la
distribución de los datos tiene a la derecha una cola más larga que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo
positivo cuando el valor de la media aritmética es mayor que la mediana y éste a
valor de la mediana a su vez es mayor que la moda, en símbolos
1.2) MEDIDAS DE ASIMETRÍA
Coeficiente de Karl Pearson
Donde:
= media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Medida de Yule Bowley o Medida Cuartílica
Donde:
= Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres.
Nota:
La Medida de Bowley varía entre -1 y 1
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
Para datos agrupados en intervalos se emplea la siguiente fórmula:
Donde:
= cada uno de los valores; n = número de datos; = media aritmética; f =
frecuencia absoluta
= cubo de la desviación estándar poblacional; xm = marca de clase
Nota:
Si As < 0 ?Indica que existe presencia de la minoría de datos en la parte izquierda
de la media, aunque en algunos casos no necesariamente indicará que la
distribución sea asimétrica negativa
Si As = 0 ? la distribución será simétrica
Si As > 0 ? Indica que existe presencia de la minoría de datos en la parte derecha de
la media, aunque en algunos casos no necesariamente indicará que la distribución
sea asimétrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisher dada la
siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17
Solución:
Calculando la media aritmética se obtiene:
Para calcular los cuartiles se ordena los datos de menor a mayor
6 9 9 12 12 12 15 17
Calculando el cuartil uno se obtiene:
Calculando el cuartil dos se obtiene:
Calculando el cuartil tres se obtiene:
Calculando la desviación estándar muestral se obtiene:
Calculando el Coeficiente de Pearson se obtiene:
Calculando la Medida de Bowley se obtiene
Calculando la desviación estándar poblacional se obtiene:
Calculando la Medida de Fisher se obtiene
Datos
6 -166,375
9 -15,625
9 -15,625
12 0,125
12 0,125
12 0,125
15 42,875
17 166,375
Total 12
Los cálculos en Excel se muestran en la siguiente figura:
Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones
semejantes a la Medida de Fisher
2) CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribución con
relación a la distribución normal, es decir, mide cuán puntiaguda es una
distribución.
2.1) TIPOS DE CURTOSIS
La curtosis determina el grado de concentración que presentan los valores en la
región central de la distribución. Así puede ser:
Leptocúrtica.- Existe una gran concentración.
Mesocúrtica.- Existe una concentración normal.
Platicúrtica.- Existe una baja concentración.
2.2) MEDIDAS DE CURTOSIS
Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
Para datos agrupados en intervalos se emplea la siguiente fórmula:
Donde: = cada uno de los valores; n = número de datos; = media
aritmética; = Cuádruplo de la desviación estándar poblacional; f = frecuencia
absoluta; xm = marca de clase
Nota:
Si a < 3 ? la distribución es platicútica
Si a = 3 ? la distribución es normal o mesocúrtica
Si a > 3 ? la distribución es leptocúrtica
Medida basada en Cuartiles y Percentiles
(letra griega minúscula kappa) = Coeficiente percentil de curtosis
Nota:
Si < 0,263 ? la distribución es platicúrtica
Si = 0,263 ? la distribución es normal o mesocúrtica
Si > 0,263 ? la distribución es leptocúrtica
Esta medida no es muy utilizada.
Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución:
6, 9, 9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de
curtosis.
Solución: Calculando la media aritmética se obtiene
Calculando la desviación estándar poblacional se obtiene:
Calculando la Medida de Fisher se obtiene:
Datos
6 915,0625
9 39,0625
9 39,0625
12 0,0625
12 0,0625
12 0,0625
15 150,0625
17 915,0625
Total 2058,5
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6 9 9 12 12 12 15 17
x1
X
2
Calculando el cuartil uno se obtiene:
Calculando el cuartil tres se obtiene:
Calculando el percentil 90 se tiene:
Calculando el percentil 10 se tiene:
Calculando el coeficiente percentil de curtosis se obtiene:
Como a= 2,23 y la distribución es platicúrtica
Los cálculos en Excel se muestran en la siguiente figura: