TEMA IV Medidas de Localización
4.1 Medidas de localización concepto e importancia.
Las medidas de localización dividen la distribución en partes iguales, sirven para
clasificar a un individuo o elemento dentro de una determinada población o muestra.
Así en psicología los resultados de los test o pruebas que realizan a un determinado
individuo, sirve para clasificar a dicho sujeto en una determinada categoria en
función de la 53-1-u-puntuacióMn obtenida.
Las medidas de localización (posición) son promedios y pueden ser de tendencia
central o no, resumidamente son la media, la mediana, la moda y los cuantiles.
En estos temas se van a obtener valores que cuantifican las propiedades
fundamentales de la distribución de frecuencia, por lo tanto son coeficientes de tipo
promedio que tratan de representar una determinada distribución.
4.2 Media o valor promedio
La media aritmética o promedio es un valor representativo de un conjunto de datos
numéricos.
Es una de las medidas que indica un valor central del conjunto de datos.
Si reemplazáramos todos los datos numéricos de mi conjunto por el valor de la
media aritmética, la suma total de todos los datos no cambia.
Ejemplo:
Supongamos que tenemos las siguientes notas en el curso de Lengua, 6, 9
y 9. La suma de todos los datos es
Si reemplazamos todas las notas por 8, la suma nos daría también 24, es
decir, 8 es el promedio o media aritmética de las tres notas.
4.3 Mediana.
Es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de medidas la mediana es la puntuación
central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5
3. Si la serie tiene un número par de puntuaciones la mediana es la media entre
las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me = 9.5
4.4 Moda.
En estadística, la moda es el valor con una mayor frecuencia en una distribución de
datos.
Hablaremos de una distribución bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que
encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos
que no hay moda.
4.5 Otras medidas de localización:
• Media ponderada
La media ponderada es una medida de tendencia central, que es apropiada cuando
en un conjunto de datos cada uno de ellos tiene una importancia relativa (o peso)
respecto de los demás datos. Se obtiene multiplicando cada uno de los datos por
su ponderación (peso) para luego sumarlos, obteniendo así una suma ponderada;
después se divide ésta entre la suma de los pesos, dando como resultado la media
ponderada
• Media geométrica
En matemáticas y estadística, la media geométrica de una cantidad arbitraria de
números (por decir n números) es la raíz n-ésima del producto de todos los números,
es recomendada para datos de progresión geométrica, para promediar razones,
interés compuesto y números índices.
Por ejemplo, la media geométrica de 2 y 18 es
Otro ejemplo, la media de 1, 3 y 9 sería
TEMA V Medidas de Variabilidad
5.1 Concepto e importancia.
Una medida de dispersión o variabilidad nos determina el grado de acercamiento o
distanciamiento de los valores de una distribución frente a su promedio de
localización, sobre la base de que entre más grande sea el grado de variación menor
uniformidad tendrán los datos (sinónimo de heterogeneidad) y por lo tanto menor
representatividad o confiabilidad del promedio de tendencia central o localización
por haber sido obtenido de datos dispersos.
Las medidas de variabilidad nos informan sobre el grado de concentración o
dispersión que presentan los datos respecto a su promedio. Llamaremos
homogénea, concentrada o poco dispersa a aquella distribución en la que todos los
datos están cercanos al centro, como 4 4 5 5 5 5 6 6 6 6 7, y heterogénea o dispersa
a la distribución con datos más separados del centro, como 1 3 5 8 10 16 20.
5.2 Rango.
También llamado Recorrido o Amplitud total, es la diferencia entre el máximo valor
del conjunto de datos y el mínimo de ellos. A mayor rango, mayor dispersión.
El rango del conjunto 4 6 4 7 8 6 5 3 4 7 7 9 6 5 es 6, la diferencia entre el máximo
9 y el mínimo 3.
A veces se usa el Rango verdadero que consiste en considerar cada dato rodeado
de una unidad, por efecto de los redondeos, con lo que en el ejemplo anterior el
mínimo sería 2,5 y el máximo 9,5. Con ello el rango se convertiría en 7.
No es una medida buena, pues ignora todo lo que ocurre dentro de ese rango.
5.3 Varianza (Muestral y poblacional).
Es una medida muy sensible de la variabilidad y base de muchas técnicas
estadísticas.
Junto con la media forma el conjunto más importante de medidas.
Es propia de las medidas de intervalo o razón. Su inconveniente es que no usa la
misma unidad que los datos, sino su cuadrado.
No se deben comparar varianzas en conjuntos de unidades muy distintas, como
estatura e inteligencia.
En teoría del muestreo se sustituye por la cuasi-varianza, de idéntica fórmula, pero
con cociente N-1 en lugar de N. En este caso no sería válida la segunda fórmula.
5.4 Desviación estándar (muestral y poblacional).
La desviación estándar o desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de
desviación.
La desviación estándar se representa por σ.
Desviación estándar
La desviación estándar (σ) mide cuánto se separan los datos.
La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la
varianza?"
Varianza
la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
En otras palabras, sigue estos pasos:
1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la
diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado
5. 5 Coeficiente de variación.
Es una medida que se emplea fundamentalmente para:
1. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de
unidades de medida. Por ejemplo, kilogramos y centímetros.
2. Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más
personas distintas.
3. Comparar dos grupos de datos que tienen distinta media.
4. Determinar si cierta media es consistente con cierta varianza. end(enumerate)
El Coeficiente de Variación muestral se denota y se define como:
( )
Ejemplo
Con un micrómetro, se realizan mediciones del diámetro de un balero, que tienen una
media de 4.03 mm y una desviación estándar de 0.012 mm; con otro micrómetro se toman
mediciones de la longitud de un tornillo que tiene una media de 1.76 pulgadas y una
desviación estándar de 0.0075 pulgadas. ¿ Cuál de los dos micrómetros presenta una
variabilidad relativamente menor?. Los coeficientes de variación son:
CV = y CV =