0% encontró este documento útil (0 votos)
179 vistas32 páginas

Unidad II - Analisis de Datos

Este documento presenta la unidad II de un material instructivo sobre estadística aplicada a la educación. La unidad se enfoca en el análisis de datos y describe medidas de tendencia central como la media, mediana y moda, medidas de posición como percentiles y cuartiles, y medidas de dispersión. Explica cómo calcular e interpretar cada medida y sus propiedades.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
179 vistas32 páginas

Unidad II - Analisis de Datos

Este documento presenta la unidad II de un material instructivo sobre estadística aplicada a la educación. La unidad se enfoca en el análisis de datos y describe medidas de tendencia central como la media, mediana y moda, medidas de posición como percentiles y cuartiles, y medidas de dispersión. Explica cómo calcular e interpretar cada medida y sus propiedades.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 32

UNIVERSIDAD PEDAGÓGICA EXPERIMENTAL LIBERTADOR

INSTITUTO PEDAGÓGICO “RAFAEL ALBERTO ESCOBAR LARA”


DEPARTAMENTO DE MATEMÁTICA

MATERIAL INSTRUCCIONAL
DE
ESTADÍSTICA APLICADA
A LA EDUCACIÓN

UNIDAD II
ANÁLISIS DE DATOS

Elaborado por
Ing. Julia Elena Sanoja de Ramírez
UNIDAD II
ANÁLISIS DE DATOS

OBJETIVO GENERAL
 Caracterizar el comportamiento de los datos

OBJETIVOS ESPECIFICOS

 Calcular e interpretar las medidas de tendencia central.


 Calcular e interpretar las medidas de posición.
 Construir e interpretar el gráfico de caja
 Calcular e interpretar las medidas de dispersión.

CONTENIDO PROGRAMATICO

TEMA 1:

Medidas de Tendencia Central: La Media Aritmética, Mediana, Moda, Relación


entre Media Aritmética, Mediana y Moda. Medidas de Posición (Cuantiles):
Percentiles, Deciles, Quintiles y Cuartiles. Usos e Interpretación. Gráfico de caja

TEMA 2:

Medidas de Dispersión: Rango intercuartílico, Rango semiintercuartílico,


Desviación Media, Varianza, Desviación Estándar, Coeficiente de Variación. Usos e
Interpretación.

Estadística aplicada a la Educación 2015 UPEL- Maracay 2


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
ANÁLISIS DE DATOS

Una vez recogidos y organizados los datos, se procede a la reducción de los


mismos, a través del cálculo de valores que permiten caracterizar el
comportamiento de los datos, estos valores son los llamados parámetros, si el
cálculo se hace con toda la población o estadísticos si el cálculo se hace a partir
de muestras. Estos valores característicos (parámetros o estadísticos) se
clasifican de la siguiente forma:
a) Medidas de tendencia central: Son aquellas mediciones hacia las que tienden
a agruparse los datos (media aritmética, mediana, moda).
b) Medidas de Posición: Conocidas en general como los cuantiles, permiten
dividir los datos en forma proporcionada (percentiles, deciles, quintiles,
cuartiles)
c) Medidas de dispersión: indica la desviación de los datos con respecto a las
medidas de tendencia central. (rango, desviación cuartil, varianza,
desviación estándar,..)

TEMA 1

MEDIDAS DE TENDENCIA CENTRAL

Son aquellas mediciones hacia las que tienden a agruparse los datos. Provee
información con referente la distribución central de las puntuaciones de una
prueba. Las medidas de tendencia central son Estadísticos que procuran aportar
información sobre la localización central de la distribución de datos.
Las medidas de tendencia central que le dedicaremos nuestra atención: media
aritmética, mediana y moda y se emplean de acuerdo al objetivo del estudio y al
tipo de dato que se tenga.
Propósito:
• Para mostrar donde la puntuación del elemento típico o central se ubica
dentro del grupo
• Para servir como un método para comparar o interpretar cualquier
puntuación en relación a una puntuación típica o central

Propiedades a estudiar de una medida de posición:

 ¿Intervienen todos los elementos?


 ¿Con qué tipo de datos se puede calcular?
 ¿Es única?
 ¿Es robusta?
 ¿En qué sentido es representativa?
 ¿Cómo se interpreta?
Estadística aplicada a la Educación 2015 UPEL- Maracay 3
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 ¿Cómo se comporta bajo transformaciones? (en particular bajo cambios de
origen y escala)
 ¿Cuándo conviene utilizarla?

Media Aritmética

La media es el centro de gravedad de la distribución. Es aquella que representa


el promedio aritmético de un conjunto de observaciones, la misma actúa como
punto de equilibrio, de manera que las observaciones menores equilibran a las
mayores. Esta se obtiene por medio de la suma de todos los valores de la serie de
datos, dividido por la cantidad de casos.
Notación:
 referido a la media de una población
X referido a la media de una muestra

Propiedades de la media aritmetica

 Es única
 Utiliza todos los valores de la distribución
 Sólo se puede calcular con variables cuantitativas
 No se puede calcular con distribuciones agrupadas que tengan intervalos de
clase infinitos
 Es el centro de gravedad de la distribución en un sentido aditivo
 Minimiza el error cuadrático medio
 No es robusta
 No es invariante por cambios de origen y escala
 Es descomponible

¿Cómo se calcula?

Fórmula
n

Media para datos no agrupados x i


X  i 1

n
nc

Media para datos agrupados f i * Xci


X i 1

Para los datos agrupados, lo que se calcula es una estimación del valor de la
media ya que al agrupar por clases no conocemos los valores individuales de cada
observación, sólo que para facilitar los cálculos se ha de renunciar a la exactitud.

Estadística aplicada a la Educación 2015 UPEL- Maracay 4


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Mediana

La mediana es el valor que divide una serie de datos ordenada en dos mitades,
con una mitad de las observaciones mayores que ésta y la otra mitad menores a la
mediana.
Valor por encima y por debajo del cual se encuentran el 50% de los casos. Es
especialmente útil cuando los datos están sesgados.

Propiedades de la mediana

 Es única
 No utiliza todos los elementos
 Siempre es un valor observable de la variable
 Es más robusta que la media aritmética
 Minimiza el error absoluto medio
 No es invariante por cambios de origen y escala
 No es descomponible

¿Cómo se calcula?

Fórmula
Dato que divide en dos
Mediana para datos no agrupados partes iguales a un
conjunto ordenado de
valores
 50 * n 
  Faa 
Mediana para datos agrupados Md  LI   100 * A
 fi 
 
 

Siendo:
LI = límite inferior de la clase mediana
n = tamaño de la muestra
Faa = Frecuencia absoluta acumulada de la clase inmediata inferior a la clase
mediana
fi = frecuencia absoluta de la clase mediana

Moda

Indica el valor más típico de la distribución. La moda es el valor que se repite


más veces en la serie de datos. Puntuación o valor que se observa con más
frecuencia en una distribución.

Estadística aplicada a la Educación 2015 UPEL- Maracay 5


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Si se encuentra que cada valor ocurre solo una vez, entonces ésta distribución
carece de moda, o si se advierte que 2 o más valores son los más comunes,
entonces tiene más de una moda.

Propiedades de la moda

 No es única pudiendo existir modas absolutas y relativas


 Si existen varias modas esto es un síntoma de heterogeneidad en los datos
 En su cálculo no intervienen todos los elementos
 Se puede calcular con datos nominales
 Siempre es un valor observable de la variable
 Es robusta
 No es invariante por cambios de origen y escala
 No es descomponible

¿Cómo se calcula?

Fórmula
Moda para datos no agrupados Dato que presenta
mayor frecuencia
Moda para datos agrupados  d1 
Mo  LI    * A
 1
d  d 2 

Siendo:
LI= límite inferior de la clase modal
d1 = diferencia absoluta de las frecuencias absolutas de la clase modal y la de la
clase inmediata inferior a la clase modal
d 2 = diferencia absoluta de las frecuencias absolutas de la clase modal y la de la
clase inmediata superior a la clase modal

Cuantiles

Si una serie de datos se colocan en orden de magnitud, el valor medio que


divide al conjunto de datos en dos partes iguales es la mediana, por extensión de
esta idea se puede pensar en aquellos valores que dividen a los datos en cuatro
partes iguales, en cien partes iguales, etc. El nombre genérico es el de cuantil y el
mismo se define como el valor bajo el cual se encuentra una determinada
proporción de los valores de una distribución.

Propiedades de los cuantiles

 Son únicos
Estadística aplicada a la Educación 2015 UPEL- Maracay 6
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 No utilizan en su cálculo todos los elementos
 Se pueden calcular con datos ordinales
 Siempre es un valor observable de la variable
 Su robustez depende del valor de p: cuanto más cercano a 0 o a 1, menos
robusto es; cuanto más cercano a 0.5, más robusto es
 Se utilizan para situar a la distribución y para dar una idea de su dispersión
 No son invariantes por cambios de origen y escala
 No son descomponibles

Dentro de las medidas de los cuantiles tenemos:

Deciles(D)

Son aquellos valores que dividen en diez partes iguales a un conjunto de datos
ordenados. Se representan por D1 , D2 , D3 , ....D9. De esta manera tenemos que:
 D1 (primer decil) es el valor por debajo del cual se encuentran como máximo el
10% de las observaciones, mientras que el 90% restante se sitúan por encima
de él.
 D2 (segundo decil) es el valor por debajo del cual se encuentran como máximo
el 20% de las observaciones, mientras que el 80% restante se sitúan por
encima de él.
Y así sucesivamente, hasta llegar al
 D9 (noveno decil) es el valor por debajo del cual se encuentran como máximo el
90% de las observaciones, mientras que el 10% restante se sitúan por encima
de él.

Quintiles(K)

Son aquellos valores que dividen en cinco partes iguales a un conjunto de


datos ordenados. Se representan por K1, K2, K3y K4. De esta manera tenemos
que:
 K1 (primer quintil) es el valor por debajo del cual se sitúan a lo sumo el 20% de
las observaciones y por encima de éste el 80% restante.
 K2 (segundo quintil) es el valor por debajo de cual se sitúan a lo sumo el 40%
de las observaciones y por encima de éste el 60% restante.
 K3 (tercer quintil) es el valor por debajo del cual se sitúan a lo sumo el 60% de
las observaciones y por encima de éste el 40% restante.
 K4 (cuarto quintil) es el valor por debajo del cual se sitúan a lo sumo el 80%
de las observaciones y por encima de éste el 20% restante.

Cuartiles(Q)

Son aquellos valores que dividen en cuatro partes iguales a un conjunto de


datos ordenados. Se representan por Q1, Q2, y Q3. De esta manera tenemos que:
Estadística aplicada a la Educación 2015 UPEL- Maracay 7
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 Q1 (primer cuartil) es el valor por debajo del cual se sitúan a lo sumo el 25% de
las observaciones y por encima de éste el 75% restante.
 Q2 (segundo cuartil) es el valor por debajo de cual se sitúan a lo sumo el 50%
de las observaciones y por encima de éste el 50% restante. Está justo en el
centro y corresponde a la mediana
 Q3 (tercer cuartil) es el valor por debajo del cual se sitúan a lo sumo el 75% de
las observaciones y por encima de éste el 25% restante

Percentiles(P)

Son aquellos valores que dividen a un conjunto de datos ordenados en cien


partes iguales. Se representan por P1, P2 .... , P99. De esta manera tenemos que:
 P1 es el valor por debajo del cual se sitúan a lo sumo el 1% de los datos y por
encima de él tenemos el 99% restante.
 P2 es el valor por debajo del cual se sitúan a lo sumo el 2% de los datos y por
encima de él tenemos el 98% restante.
Y así sucesivamente. Hasta llegar al
 P99 es el valor por debajo del cual se sitúan a lo sumo el 99% de los datos y por
encima de él tenemos el 1% restante.
En forma genérica el p-ésimo percentil es un valor tal que por lo menos un “ p”
por ciento de los elementos tiene dicho valor o menos y, al menos, un (100-p)
por ciento de los elementos tiene ese valor o más.

¿Cómo se calculan?

El cálculo de cualesquiera de los cuantiles: deciles, quintiles o cuartiles, se realiza


a partir de la fórmula de Percentiles, y conociendo la relación existentes entre
deciles, quintiles o cuartiles y los percentiles

 p*n 
  Faa 
Pp  LI   100 * A
 fi 
 
 
Siendo:
Pp = Percentil p-èsimo
LI = límite inferior de la clase percentílica
n = tamaño de la muestra
Faa = Frecuencia absoluta acumulada de la clase inmediata inferior a la clase
percentílica
fi = frecuencia absoluta de la clase percentílica

Estadística aplicada a la Educación 2015 UPEL- Maracay 8


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Relación entre cuantiles

Esta relación permite el cálculo de cualquier cuantil (gráfico 1), a través de la


utilización de la fórmula de percentiles.

Q1 Q2 Q3
K1 K2 K3 K4

D1 D2 D3 D4 D5 D6 D7 D8 D9

P10 P20 P25 P30 P40 P50 P60 P70 P75 P80 P90

Gráfico 1. Relación entre cuantiles

Comparación de las Medidas de Tendencia Central

Las ventajas y limitaciones de usar la media, la moda y la mediana para


describir un conjunto de datos depende estrictamente de la forma (tipo) de la
distribución de datos. Siempre que se pueda usar, en general se prefiere la media
para describir la tendencia central, aunque algunas distribuciones se describen
mejor por medio de la moda y la mediana. A continuación evaluaremos la
aplicabilidad de nuestros tres „promedios‟ a diferentes tipos de distribuciones.

En una distribución simétrica (normal), la media, moda y mediana tienen un


valor idéntico (gráfico 2). Esto en realidad es evidente, dado que una distribución
normal es perfectamente simétrica, y la curva tiene un sólo punto máximo
(moda) que también se encuentra en el centro. Así, la media debe ser nuestra
medida preferida de tendencia central para los conjuntos de datos que se
distribuyen normalmente, puesto que es más fácil de calcular y de usar en forma
matemática.
Media,
Mediana y
Moda

  Md  Mo

fi

dato
Gráfico 2. Distribución simétrica

Estadística aplicada a la Educación 2015 UPEL- Maracay 9


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Cuando se describen distribuciones asimétricas (sesgadas) positivas o
negativas, la media no es la mejor medida de tendencia central disponible.
Mientras mayor sea la asimetría o sesgo de los datos, mayor utilidad tendrá la
mediana (y más engañosa será la media), porque la mediana estará más cerca
del „valor promedio‟ real de las observaciones. En el caso de una distribución
asimétrica positiva (gráfico 3), la media se encuentra „inflada‟ por la minoría de
las observaciones que tienen un valor mayor. Observe que cuando la distribución
es asimétrica positiva, (es decir, el extremo más largo de la distribución apunta
hacia el este o hacia su derecha), la mediana está a la izquierda del promedio y la
moda está a la izquierda de la mediana. Sucede lo contrario cuando la
distribución es asimétrica negativa o sesgada negativamente. Esto nos lleva a
una consideración final: si una distribución es asimétrica, es decir, notoriamente
sesgada, la mediana será mejor que la media (promedio aritmético) para
describir la tendencia central de la distribución de los datos. En todas las
distribuciones asimétricas, la mediana efectivamente se acerca más que la media
al valor „promedio o „normal‟ de las observaciones o, en otras palabras, refleja
mejor la existencia de un sesgo en los datos.

fi
fi

dato dato
Gráfico 3. Distribución Asimétrica
Positiva Gráfico 4. Distrbución Asimétrica
Negativa
  Md  Mo
  Md  Mo

Ejemplo
Un profesor aplica una prueba de 100 puntos a un grupo de 52 estudiantes. Las
puntuaciones son las siguientes:

85 96 45 75 55 70 80 93 35 53 59 71 87

63 43 78 84 38 62 70 79 77 65 71 95 84

44 33 42 85 70 62 54 74 63 65 71 89 78

38 94 99 63 32 87 74 71 68 79 98 83 46
Se necesita conocer:
 Para los datos no agrupados media, mediana, moda.
Estadística aplicada a la Educación 2015 UPEL- Maracay 10
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 Para los datos no agrupados media, mediana, moda, P67, Q1, K3.

SOLUCIÓN:
 Para los datos no agrupados media, mediana, moda.

Para el cálculo de la moda y de la mediana se procede a ordenar los datos:

32 33 35 38 38 42 43 44 45 46 53 54 55 59 62 62 63 63
63 65 65 68 69 70 70 70 71 71 71 71 74 74 75 78 78 79
79 80 83 84 84 85 85 87 87 89 93 94 95 96 98 99

 Moda
Mo=71

 La mediana por ser valor por encima y por debajo del cual se encuentran el
50% de los casos, en nuestro ejemplo tenemos que la mediana se encuentra
entre las posiciones 26 y 27, esto es, la mediana se encuentre entre entre los
valores 70 y 71 (valores sombreados), y para la obtención del valor que
representa la mediana se debe:

70  71
Md   70,5
2
 La media:

32  33  35  38  38  42  .......... .......... ....... 93  94  95  96  98  99 3577


X    68.79
52 52

 Para los datos no agrupados media, mediana, moda, P67, Q1, K3.

Se tiene la distribución de frecuencia de los datos

Clases frel Frela


fi Fa
LI Xc LS (%) (%)
32 39 46 9 9 17,31 17,31
46 53 60 5 14 9,62 26,93
60 67 74 16 30 30,77 57,70
74 81 88 15 45 28,84 86,54
88 95 102 7 52 13,46 100,00

 Cálculo de la moda: una vez ubicada la clase modal, según lo que expresa el
concepto de moda, que para este ejemplo es la tercera clase, se procede a
aplicar la fórmula:

Estadística aplicada a la Educación 2015 UPEL- Maracay 11


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 d1 
Mo  LI  

 * A  60  
16  5   11 
 *14  60    *14
 d1  d 2   16  5  16  15   11  1 
 11 
Mo  60    *14  60  12,83  72,83
 12 

 Cálculo de la mediana: en una tabla de frecuencia la mediana se ubica en


aquella clase que contenga una frecuencia relativa acumulada (Frela) superior
o igual a 50%, o en la que contenga una frecuencia acumulada (Fa) superior o
n
igual a , por lo que la clase mediana, para este ejemplo es la tercera clase,
2
aplicando la fórmula:

 50 * n   50 * 52 
  Faa    14 
Md  LI   100  * A  60   100  *14  60   26  14  *14
 fi   16   16 
   
   
 12 
Md  60    *14  60  10,50  70,50
 16 

 Cálculo de P67.
En una tabla de frecuencia el percentil 67 se ubica en aquella clase que contenga
una frecuencia relativa acumulada (Frela) superior o igual a 67%, por lo que la
clase percentílica, para este ejemplo es la cuarta clase, aplicando la fórmula:

 67 * 52 
  30 
P67  74   100  *14  74   34,84  30  *14  74   4,84  *14  74  4,52  78,51
 15   15   15 
 
 

 Cálculo de Q1.
En primer lugar y haciendo referencia a la relación entre cuantiles (gráfico 1),
tenemos que : Q1=P25, por lo tanto procederemos a calcular el percentil 25, el
cual está ubicado en aquella clase que contenga una frecuencia relativa
acumulada (Frela) superior o igual a 25%, por lo que la clase percentílica, para
este ejemplo es la segunda clase, aplicando la fórmula:

 25 * 52 
 9
Q1  P25  46   100  *14  46   13  9  *14  46   4  *14  46  11,2  57,2
 5   5  5
 
 

Estadística aplicada a la Educación 2015 UPEL- Maracay 12


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 Cálculo de K3.
En primer lugar y haciendo referencia a la relación entre cuantiles (gráfico 1),
tenemos que : K3=P60, por lo tanto procederemos a calcular el percentil 60, el
cual está ubicado en aquella clase que contenga una frecuencia relativa
acumulada (Frela) superior o igual a 60%, por lo que la clase percentílica, para
este ejemplo es la cuarta clase, aplicando la fórmula:

 60 * 52 
  30 
K 3  P60  74   100  *14  74   31,2  30  *14  74   1,2  *14  74  1,12  75,12
 15   15   15 
 
 

Gráfico de Caja y Bigote (Boxplot)

El nombre original del gráfico introducido por Jhon Tukey en 1977 es Box and
whiskers plot, es decir, diagrama de caja y bigote. En efecto, el gráfico consiste
en un rectángulo (caja) de cuyos lados superior e inferior se derivan
respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes).
El gráfico de caja y bigote es un instrumento excelente para comunicar la
posición y la información de variación en un conjunto de datos, en particular para
detectar e ilustrar posición y cambios de variación entre grupos diferentes de
datos. Permite ver de forma clara sus principales características, como son la
tendencia central, dispersión, asimetría. Además, permite identificar con claridad
y de forma individual, observaciones que se alejan de manera poco usual del
resto de los datos. A estas observaciones se les conoce como valores atípicos.
Es un gráfico representativo de las distribuciones de un conjunto de datos.
Para su construcción se utilizan cinco estadísticos de la distribución de
frecuencias: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el
valor máximo; también se indica la posición de la media.
Por su facilidad de construcción e interpretación, permite también comparar a
la vez varios grupos de datos sin perder información ni saturarse de ella. Esto ha
sido particularmente importante a la hora de escoger esta representación para
mostrar la opinión de los estudiantes respecto a la actuación docente a través de
las diversas preguntas del instrumento utilizado.

Estadística aplicada a la Educación 2015 UPEL- Maracay 13


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Partes del Gráfico de Caja y Bigote

7 4 3 2 1
5 6

 * *

Cuerpo principal del gráfico

Gráfico 5. Partes del Gráfico de caja

En el gráfico 5 se muestran las partes del gráfico de caja:


1. Límite superior: Es el extremo superior del bigote. Los datos por encima de este
límite se consideran valores atípicos.
2. Tercer cuartil (Q3): Por debajo de este valor se encuentran como máximo el
75% de los datos.
3. Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos partes
iguales. De este modo, 50% de los datos están por debajo de la mediana y
50% está por encima.
4. Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo el
25% de los datos
5. Límite inferior: Es el extremo inferior del bigote. Los datos por debajo de este
valor se consideran valores atípicos.
6. Valores atípicos: Datos que están apartados del cuerpo principal del gráfico.
Pueden representar efectos de causas extrañas, factores no controlados o en el
caso de la tabulación manual, errores de medición o registro. Se colocan en la
gráfica con asteriscos (*) o cuadrados ( ) según se alejan menos o más del
conjunto de datos. Se utiliza un superíndice numérico para indicar el número
de veces que aparece ese dato como atípico.
7. Media aritmética

Construcción del diagrama de caja

1. Es necesario conocer o calcular los siguientes valores: valor mínimo (Vmín);


valor máximo (Vmáx); primer cuartil (Q1); mediana (md); tercel cuartil (Q3);
Límite exterior inferior (LEI); Límite interior inferior (LII); Límite interior
superior (LIS); Límite exterior superior (LES). (Gráfico 5)
Estadística aplicada a la Educación 2015 UPEL- Maracay 14
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Tukey (1997) sugiere una regla sencilla para determinar los límites de los
bigotes. Tomando en cuenta que el Rango Intercuartílico (RI) es:
RI = Q3 -Q1
tenemos que existen límites interiores y límites exteriores. Los primeros son
barreras hasta las cuales se “permiten” datos de la muestra, por estar muy
cerca del resto. Estos son los límites que definen los extremos de los bigotes.
De sobrepasar esta barrera se le considera valor atípico. Los segundos límites
indican cuándo un dato se aleja en exceso del resto y, siendo también atípico,
se le considera fuera del límite exterior permitido y se dice que es aún más
atípico.

Se construyen así:

Límite interior inferior (LII) = Q1 - 1,5RI


Límite interior superior (LIS) = Q3 + 1,5RI
Límite exterior inferior (LEI) = Q1 - 3RI
Límite exterior superior (LES)= Q3 + 3RI

2. Se traza una línea horizontal de longitud proporcional al recorrido de la


variable, que llamaremos eje. Los extremos del eje serán el valor mínimo
(Vmín) y el valor máximo (Vmáx) de la distribución. El eje se gradúa según la
escala conveniente y se señalan los valores referenciales LEI, LII, LIS y LES (en
realidad estas marcas referenciales no aparecerán en el gráfico final).
3. Paralelamente al eje se construye una caja rectangular con altura arbitraria y
cuya base abarca desde el primer cuartil hasta el tercer cuartil. Como vemos,
esta caja indica gráficamente el intervalo de variación del 50% de valores
centrales de la distribución.
4. La caja se divide en dos partes, trazando una línea en la posición de la
mediana. Así, cada una de las partes en que ha quedado dividida la caja
encierra una cuarta (25%) parte de las observaciones.
5. Una vez dibujada la caja, se añaden dos líneas paralelas al eje, que llamaremos
bigotes o extensiones, una de cada lado:
 Si Vmín  LII , el bigote se prolonga desde el Q1 hasta el Vmín, pero Si
Vmín  LII , el bigote se prolonga hasta el dato inmediato mayor o igual que
LII.
 Si Vmáx  LIS , el bigote se prolonga desde el Q3 hasta el Vmáx, pero Si el
Vmáx  LIS , el bigote se prolonga hasta el dato inmediato menor o igual
que la LIS.
6. Si hay datos que quedan por debajo de la LII o por encima de la LIS, se
señalan en el gráfico de modo particular, por ejemplo, con un cuadrado o
cualquier otro símbolo que lo represente. A estos datos, genéricamente, los
denominamos datos apartados o valores extremos del conjunto al cual
pertenecen. En ocasiones se hace distinción entre los datos apartados atípicos
y anómalos. Los valores atípicos son los que quedan comprendidos entre la LEI
Estadística aplicada a la Educación 2015 UPEL- Maracay 15
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
y la LII, y los que quedan comprendidos entre la LIS y la LES. Los valores
anómalos son los que quedan por debajo de la LEI y también los que quedan
por encima de la LES. Para diferenciarlos se utilizan marcas diferentes, por
ejemplo, utiliza un triángulo para los atípicos y un círculo para los anómalos.
7. Finalmente, se indica con otro signo la posición de la media aritmética, por
ejemplo, utiliza el signo +.

¿Cómo se interpreta el gráfico de caja?

Tenga en cuenta las siguientes consideraciones a la hora de interpretar el


gráfico de caja:
 Mientras más larga la caja y los bigotes, más dispersa es la distribución de
datos.
 La distancia entre las cinco medidas descritas en el boxplot (sin incluir la
media aritmética) puede variar, sin embargo, recuerde que la cantidad de
elementos entre una y otra es aproximadamente la misma. Entre el límite
inferior y Q1 hay igual cantidad de opiniones que de Q1 a la mediana, de
ésta a Q3 y de Q3 al límite superior. Se considera aproximado porque
pudiera haber valores atípicos, en cuyo caso la cantidad de elementos se ve
levemente modificada.
 La línea que representa la mediana indica la simetría. Si está relativamente
en el centro de la caja la distribución es simétrica. Si por el contrario se
acerca al primer o tercer cuartil, la distribución pudiera ser sesgada a la
derecha (asimétrica positiva) o sesgada a la izquierda (asimétrica negativa
respectivamente.
 La mediana puede inclusive coincidir con los cuartiles o con los límites de
los bigotes. Esto sucede cuando se concentran muchos datos en un mismo
punto. Pudiera ser este un caso particular de una distribución sesgada o el
caso de una distribución muy homogénea.
 En el caso de un tamaño de muestra muy pequeño, debe ser cauteloso a la
hora de interpretar. En estos casos se sugiere remitirse al reporte
numérico.
 En términos comparativos, procure identificar aquellas preguntas cuyos
gráficos de caja parecen diferir del resto. Pudiera con esto encontrar
fortalezas o debilidades.

¿cómo interpreta la simetría en el gráfico de caja?

Simetría: Indica la forma del conjunto de datos, lo cual implica observar dónde se
concentra la información. Para el estudio de la forma de una distribución, también
se usan los términos sesgo o asimetría. Una distribución puede ser:

Simétrica: en este tipo de distribuciones la media, la moda y


 la mediana coinciden y los datos se distribuyen de igual forma
Estadística aplicada a la Educación 2015 UPEL- Maracay 16
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
a ambos lados de estas medidas. En el contexto, hay igual número de opiniones
por encima que por debajo de la mediana.

 Asimétrica positiva o sesgada a la derecha: los datos tienden


a concentrarse hacia la parte inferior de la distribución y se
extienden más hacia la derecha. La media suele ser mayor que la mediana en
estos casos. En el contexto, las opiniones se concentran en un puntaje menor y
las de mayor puntaje están más dispersas.

 Asimétrica negativa o sesgada a la izquierda: los datos tienden


a concentrarse hacia la parte superior de la distribución y se
extienden más hacia la izquierda. La media suele ser menor que la mediana
en estos casos. En el contexto, las opiniones se concentran en un puntaje
mayor y las de menor puntaje están más dispersas.

EJEMPLOS

Construya el gráfico de caja, indique cómo se comporta la distribución de la


variable, ¿Existen valores atípicos?.

1) Un profesor aplica una prueba de 100 puntos a un grupo de 52 estudiantes.


Las puntuaciones son las siguientes:

85 96 45 75 55 70 80 93 35 53 59 71 87

63 43 78 84 38 62 70 79 77 65 71 95 84

44 33 42 85 70 62 54 74 63 65 71 89 78

38 94 99 63 32 87 74 71 68 79 98 83 46

SOLUCIÓN 1:
La distribución de frecuencia de los datos

Clases frel Frela


fi Fa
LI Xc LS (%) (%)
32 39 46 9 9 17,31 17,31
46 53 60 5 14 9,62 26,93
60 67 74 16 30 30,77 57,70
74 81 88 15 45 28,84 86,54
88 95 102 7 52 13,46 100,00
Estadística aplicada a la Educación 2015 UPEL- Maracay 17
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Para la construcción del gráfico de caja, necesitamos conocer los valores de: Q 1,
Md, Q3, RI, LII, LIS, LEI, LES, procedamos a su cálculo:

Siendo
Vmín  32
Vmáx  99
 25 * 52 
 9
Q1  P25  46   100  *14  46   13  9  *14  46   4  *14  46  11,2  57,2
 5   5  5
 
 
 50 * 52 
  14 
Q2  60   100  *14  60   26  14  *14  60   12  *14  60  13,71  73,71
 16   16   16 
 
 
 75 * 52 
  30 
Q3  P75  74   100  *14  74   39  30  *14  74   9  *14  74  8,4  82,4
 15   15   15 
 
 
RI  82,4  57,2  25,2
LII  57,2  1,5 * 25,2  19,4
LIS  82,4  1,5 * 25,2  120,2
LEI  57,2  3 * 25,2  18,4
LES  82,4  3 * 25,2  158
32  33  35  38  38  42  .......... .......... ....... 93  94  95  96  98  99 3577
X    68.79
52 52
Como Vmín  LII, el bigote va desde Q1 hastaVmín
Como Vmáx  LIS, el bigote va desde Q3 hastaVmáx
resultando el gráfico:

Vmín=32
Vmáx=99

Q1  57,2 X  68,79 Q3  82,4

Estadística aplicada a la Educación 2015 UPEL- Maracay 18


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Interpretación:
1) Se observa que la mediana no se encuentra en el centro de la caja, y que la
media aritmética se encuentra a la izquierda de la mediana, por lo que la
distribución presenta una asimetría negativa.
2) No se presentan valores atípicos, 32 es la menor calificación que obtuvo un
estudiante y la calificación más alta obtenida es de 99.
3) Aún cuando no hay valores atípicos, la longitud del bigote de la izquierda debe
llamar a la reflexión sobre los resultados obtenidos en la evaluación.

2) Un profesor aplica una prueba de 100 puntos a un grupo de 52 estudiantes.


Las puntuaciones son las siguientes:

1 4 35 43 45 54 55 57 59 63 67 71 83
1 5 39 43 45 55 55 57 62 65 67 71 98
2 33 42 44 46 55 56 58 62 65 68 71 99
3 33 42 44 53 55 57 58 63 66 69 75 100

SOLUCIÓN 2:

Para la construcción del gráfico de caja, necesitamos conocer los valores de: Q1,
Md, Q3, RI, LII, LIS, LEI, LES, procedamos a su cálculo:

Siendo
Vmín  1
Vmáx  100
Q1  43
Q2  55,5
Q3  65
RI  65  43  22
LII  43  1,5 * 22  10
LIS  65  1,5 * 22  98
LEI  43  3 * 22  23
LES  65  3 * 22  131
2719
X   52,29
52
Como Vmín  LII, el bigote va desde Q1 hasta 33, por ser 33 el valor inmediato mayor o igual que LII
Como Vmáx  LIS, el bigote va desde Q3 hasta 98, por ser el valor inmediato menor o igual a LIS

resultando el gráfico

Estadística aplicada a la Educación 2015 UPEL- Maracay 19


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Valor=98
Valor=33

Valor Atípico
Valores Atípicos Q1  43 X  52,29 Q3  65

Interpretación:
1) Se puede apreciar que la mediana no se encuentra en el centro de la caja sino
más bien hacia el tercer cuartil, lo cual indica asimetría negativa.
2) Se presentan valores atípicos tanto por la izquierda como por la derecha, en
este caso los valores atípicos de la izquierda, son valores a considerar de gran
importancia para revisar el proceso de enseñanza-aprendizaje.

Estadística aplicada a la Educación 2015 UPEL- Maracay 20


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
TEMA 2

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión o estadísticos de dispersión o variabilidad nos


indican la distancia promedio de los datos respecto a las medidas de tendencia
central. Así podremos diferenciar dos conjuntos de datos que poseen iguales
medias, siendo los datos de uno más dispersos del otro.
Los estadísticos de variabilidad muestran si los valores de las observaciones
están próximos entre sí o están muy separados. Dos conjuntos de datos pueden
tener la misma localización central y no obstante, ser muy distintos si uno se
halla más disperso que el otro.
No solo basta con determinar las medidas de tendencia central para
comprender el comportamiento de una serie de datos, es importante además,
conocer que tan alejados están esos datos respecto a ese punto de concentración.
Es por ello que los estadísticos de variabilidad proporcionan una medida del
mayor o menos agrupamiento de los datos respecto a los estadísticos de
tendencia central (Ej.:media, mediana)
Por ejemplo, supongamos que una comunidad educativa realiza compras para
la papelería necesaria para el funcionamiento del liceo, y con regularidad coloca
pedidos con dos proveedores distintos. Ambos le indican que necesitan alrededor
de 10 días hábiles para surtir sus pedidos. Después de varios meses de trabajar
así encuentra usted que el promedio de días necesarios para surtir los pedidos es,
realmente, unos 10 días para cada proveedor. Los histogramas que resumen la
cantidad de días hábiles requeridos para surtir los pedidos se ven en la figura.
Aunque la cantidad promedio es, más o menos, de 10 días en ambos casos.
¿Tienen éstos el mismo grado de confiabilidad para entregar a tiempo?. Observe
la dispersión, o variabilidad, en los histogramas. ¿Qué proveedor prefiere usted?

Proveedor A Proveedor B

Para la mayoría de las empresas es importante recibir materiales y suministros


tiempo. Las entregas a los siete u ocho días del Proveedor B pueden considerarse
favorables; sin embargo, algunas de las entregas a los 13 o 15 días podrían ser
Estadística aplicada a la Educación 2015 UPEL- Maracay 21
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
desastrosas en términos de la utilización de la mano de obra y del cumplimiento
de los programas de producción. Este ejemplo ilustra un caso en el que la
dispersión, o variedad, en los tiempos de entrega puede ser la consideración más
importante para seleccionar un proveedor. Para la mayoría de las comunidades,
la menor dispersión que muestra Proveedor A. haría que fuera el proveedor más
consistente y preferido.

�Dispersión

Es el grado en que los datos numéricos tienden a extenderse alrededor de un


valor medio. La dispersión de la distribución suministra información
complementaria que permite juzgar la confiabilidad de nuestra medida de
tendencia central. Si los datos están ampliamente dispersos, la localización
central será menos representativa de los datos en su conjunto de lo que sería en
el caso de datos que se acumulasen más alrededor de la media. Además, si no
conviene tener una amplia dispersión de valores respecto al centro o si esa
dispersión implica un riesgo inaceptable, deberemos ser capaces de reconocerlo y
no escoger las distribuciones que presentan la máxima dispersión.

Las medidas de dispersión se dividen en dos grandes grupos:


1. Las medidas de dispersión absolutas: son aquellas que vienen expresadas en
las mismas medidas que identifican a la serie de datos.
2. Las medidas de dispersión relativas: son relaciones entre medidas de dispersión
absolutas y medidas de tendencia central, son adimensionales.

Medidas de dispersión absoluta

Rango intercuartílico o rango intercuartil

Es la diferencia entre el Tercer cuartil (Q3) y el primer cuartil (Q1), esta


diferencia refleja la variabilidad de las observaciones del 50% intermedio de los
datos y tiene la ventaja de no verse influenciado por valores extremos.
Notación: RI

Gráficamente:

¿Cómo se calcula?

Estadística aplicada a la Educación 2015 UPEL- Maracay 22


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Fórmula
RI  Q3  Q1

El rango intercuartil permite apreciar (aproximadamente) qué tan lejos de la


mediana tenemos que ir en cualquiera de las dos direcciones antes de que
podamos recorrer una mitad de los valores del conjunto de datos.

Rango semi-intercuartílico o rango semi-intercuartil

Es la semidiferencia entre el Tercer cuartil (Q3) y el primer cuartil (Q1), al igual


que el rango intercuartílico tiene la ventaja de no verse influenciado por valores
extremos.
Notación : RSI

¿Cómo se calcula?

Fórmula
Q3  Q1
RSI 
2

Varianza

Es el promedio de las diferencias cuadráticas de cada dato respecto a la media.

Notación:
 2 cuando sea para una población
S 2 cuando sea para una muestra

Nota: La teoría matemática establece que si pretendemos estimar la varianza de


una población a partir de la varianza una de sus muestras, resulta que el error
cometido es generalmente menor, cuando para la varianza de la muestra se
divide por n –1 y no por n, porque el valor resultante da una mejor estimación de
la varianza de la población.
Sin embargo, para grandes valores de n (n >30) no hay prácticamente diferencia
entre dividir por n o por n-1.

propiedades de la varianza

 La varianza de una constante (C ) es cero, V (C )  0


 La varianza siempre es una cantidad positiva.

Estadística aplicada a la Educación 2015 UPEL- Maracay 23


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 La varianza del producto de una constante (C ) por una variable (X)es
igual al producto de la constante al cuadrado por la varianza de la variable,
V (CX )  CV ( X )

Observaciones sobre la varianza


 Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.
 Las unidades de la varianza son los cuadrados de las unidades de los datos
y en muchas ocasiones no son fáciles de interpretar. Por ejemplo, si unidad
trabajada en los datos es centímetros, la varianza da como resultados
centímetros al cuadrado.

¿Cómo se calcula?

Fórmula
2
 N 
  f i * xi 
f i * x 2i  

N
Poblacional
 i 1

N
Varianza para datos  
2 i 1

N
no agrupados 2
 n 
  xi 
x 2i  

n
Muestral
 i 1

n
S 2  i 1
n 1
2
 nc 
  f i * xi 
f i * x 2i  

nc
Poblacional
 i 1

N
Varianza para datos  
2 i 1

N
agrupados 2
 nc 
  f i * xi 
f i * x 2i   
nc
Muestral

i 1
i 1

n
S 
2

n 1
Desviación típica o estándar

La desviación típica permite medir la intensidad con que los datos se desvías o
distancian respecto a la mediaSe define como la raíz cuadrada positiva de la
varianza.

Estadística aplicada a la Educación 2015 UPEL- Maracay 24


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Notación:
 cuando sea para una población
S cuando sea para una muestra

propiedades de la desviación típica


 La desviación típica de una constante es cero.
 Siempre es una cantidad positiva.
 La desviación típica del producto de una constante por una variable es igual
al producto de la constante por la desviación típica de la variable.
Observaciones sobre la desviación típica:
 Nos permite determinar con mayor grado de precisión dónde se sitúan los
valores de una distribución de frecuencia en relación con la media.
 Las unidades de la desviación típica se expresan en las mismas unidades
de los datos.
 Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.

¿Cómo se calcula?

Fórmula
Poblacional   2
Muestral S  S2

EJEMPLO 1

Un profesor aplica una prueba de 100 puntos a un grupo de 52 estudiantes. Las


puntuaciones son las siguientes:

85 96 45 75 55 70 80 93 35 53 59 71 87

63 43 78 84 38 62 70 79 77 65 71 95 84

44 33 42 85 70 62 54 74 63 65 71 89 78

38 94 99 63 32 87 74 71 68 79 98 83 46

Se necesita conocer rango, rango intercuartíl, rango semiintercuartíl, varianza,


desviación estándar:

 Para los datos no agrupados.


 Para los datos no agrupados

Estadística aplicada a la Educación 2015 UPEL- Maracay 25


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
SOLUCIÓN 1:

 Para los datos no agrupados rango intercuartíl, rango semiintercuartíl,


varianza, desviación estándar.

 Rango intercuartíl:

Para su cálculo se procede a ordenar los datos:

32 33 35 38 38 42 43 44 45 46 53 54 55 59 62 62 63 63
63 65 65 68 69 70 70 70 71 71 71 71 74 74 75 78 78 79
79 80 83 84 84 85 85 87 87 89 93 94 95 96 98 99

siendo:
Q1  55
Q3  83
RI  83  55  28

 Rango semiintercuaríl:

83  55 28
RSI    14
2 2

 Varianza:

32  32  33  35  3852 38  ....98  99


2
 332  352  382  382  422  ....  962  982  992 
S1 
52  1 L
262877
3575 2

52 262877 245781,25 17095.75


    335,21
52  1 51 51

 Desviación estándar:

S  335021 18,31

Estadística aplicada a la Educación 2015 UPEL- Maracay 26


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
 Para los datos no agrupados rango intercuartíl, rango semiintercuartíl,
varianza, desviación estándar.

Se tiene la distribución de frecuencia de los datos

Clases frel Frela


fi Fa
LI Xc LS (%) (%)
32 39 46 9 9 17,31 17,31
46 53 60 5 14 9,62 26,93
60 67 74 16 30 30,77 57,70
74 81 88 15 45 28,84 86,54
88 95 102 7 52 13,46 100,00

 Cálculo del rango intercuartl:

 25 * 52 
  9
Q1  46  
100  *14  46  13  9 *14  46  4 *14  46  11,2  57,2
5 5 5
 75 * 52 
  30 
Q3  74  
100  *14  74  39  30 *14  74  9 *14  74  8,4  82,4
15 15 15

RI  82,4  57,2  25,20

 Rango semiintercuaríl:

82,4  57,2 25,20


RSI    12,60
2 2

 Varianza

Clases
fi f i * xc fi * xc2
LI Xc LS
32 39 46 9 9 * 39  351 9 * 392  13689
46 53 60 5 5 * 53  265 5 * 532  14045
60 67 74 16 16 * 67  1072 16 * 672  71824
74 81 88 15 15 * 81  1215 15 * 812  98415
88 95 102 7 7 * 95  665 7 * 952  63175
 3568 261148
Estadística aplicada a la Educación 2015 UPEL- Maracay 27
Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
261148
35682
52 261148 244819,69 16328,31
S1     320,16
52  1 51 51

 Desviación Estándar

S  320,16  17,89

Medidas de dispersión relativa

Coeficiente de variación

El coeficiente de variación permite comparar la dispersión entre dos poblaciones


distintqs e incluso, comparar la variación producto de dos variables diferentes
(que pueden provenir de una misma población).
Es un estadístico de dispersión relativo, tiene como función determinar entre
varias distribuciones la de mayor o menor dispersión, en términos de
homogeneidad, al comparar grupos o poblaciones, mientras más bajo sea el
coeficiente de variación, el grupo o población que lo presente se considera más
homogéneo.
Por ser un estadístico adimensional tiene como ventaja que nos permite
comparar variables donde las unidades pueden ser diferentes, ya que este
estadístico es independiente de las unidades utilizadas por las variables. Estas
variables podrían tener unidades diferentes, por ejemplo, podremos determinar si
los datos tomados al medir el volúmen de llenado de un embase de cierto líquido
varían más que los datos tomados al medir la temperatura de el líquido contenido
en el embase. El volúmen lo mediremos en centímetros cúbicos y la temperatura
en grados centígrados.
Además, varias distribuciones pueden tener un mismo valor para determinada
medida de dispersión y ser la variabilidad de sus datos, en relación con la media,
diferente. Es importante destacar que el coeficiente de variación sirve para
comparar las variabilidades de dos conjuntos de valores (poblaciones o
muestras), mientras que si deseamos comparar a dos individuos de cada uno de
esos conjuntos, es mejor usar valores tipificados.

Estadística aplicada a la Educación 2015 UPEL- Maracay 28


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
¿Cómo se calcula?

Fórmula

Poblacional CV  * 100

S
Muestral CV  * 100
X

EJEMPLO 2

Un profesor aplica una prueba de 100 puntos a un grupo de 52 estudiantes. Las


puntuaciones son las siguientes:

85 96 45 75 55 70 80 93 35 53 59 71 87

63 43 78 84 38 62 70 79 77 65 71 95 84

44 33 42 85 70 62 54 74 63 65 71 89 78

38 94 99 63 32 87 74 71 68 79 98 83 46
¿Cómo es la dispersión respecto a la media?

SOLUCIÓN 2:

Procederemos a calcular la media, la desviación estándar para el cálculo del


coeficiente de variación
 La media:

3577
X   68.79
52

 Varianza:

262877 
3575
2

52 262877  245781,25 17095.75


S1     335,21
52  1 51 51

 Desviación estándar:

S  335021 18,31

 Coeficiente de variación:

Estadística aplicada a la Educación 2015 UPEL- Maracay 29


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
18,31
CV  *100  26,62%
68,79

Interpretación: la desviación típica de la muestra es el 26,62% del valor de la


media de la muestra. También se puede expresar que la variable nota presenta
una dispersión de 26,62 de sus puntuaciones respecto a la media

EJEMPLO 3

Un profesor de matemática, tiene a su cargo dos secciones de séptimo grado (A y


B). El profesor conoce que ambas secciones presentan rendimientos académicos
similares, alumnos que cursan por primera vez el grado. Se encuentra enseñando
los tópicos de probabilidades a ambos cursos, decide emplear el juego como
estrategia didáctica a la sección A y enseñanza tradicional a la sección B. A
ambos cursos les aplica la misma prueba de probabilidades. ¿Podría afirmarse
que la enseñanza a través del juego como estrategia didáctica es más efectiva?,
justifique. Las notas obtenidas para cada sección son:

Sección Calificaciones obtenidas


A 16 11 13 17 18 14 20 18 15 16 15 08 14 11 11 13 14 11 16 16
B 10 10 04 19 15 17 13 12 11 10 14 10 17 17 12 03 08 11 12 15
SOLUCIÓN 3:

Cálculos para la sección A:

 La media:

287
XA   14,35
20

 Varianza:

4285 
287
2

20 4285  4118,45 166,55


S A2     8,77
20  1 19 19

 Desviación estándar:

S A  8,77  2,96

 Coeficiente de variación:

Estadística aplicada a la Educación 2015 UPEL- Maracay 30


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
2,96
CV A  * 100  20,63%
14,35

Cálculos para la sección B:

 La media:

240
XB   12
20

 Varianza:

3206 
240
2

20 3206  2880 326


S B2     17,16
20  1 19 19

 Desviación estándar:

S B  17,16  4,14

 Coeficiente de variación:

4,14
CVB  * 100  34,50%
12

Interpretación:

Al comparar los coeficientes de variación de cada sección, notamos que el


coeficiente de variación de la sección A (20,63%) es inferior al coeficiente de
variación de la sección B (34,50%), por lo que podríamos expresar que la sección
A presenta menor dispersión con respecto a la media y por lo tanto es más
homogénea, esto nos llevaría a expresar que se recomendaría la estrategia del
juego para la enseñanza de la probabilidades.

Estadística aplicada a la Educación 2015 UPEL- Maracay 31


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática
Referencias

Glass, G. y Stanley, J. (1974). Métodos Estadísticos Aplicados a las Ciencias


Sociales. España: Prentice Hall.
Johnson, R.(1990). Estadística Elemental. México: Iberoamericana.
Hamdan, N.(1994). Métodos Estadísticos en Educación. Caracas: EBUC.
Levin, R. (1988). Estadística para Administradores. México: Prentice Hall
Minnaard, C. (2005) Los Gráficos de Caja: Un Recurso Innovador. Revista
Iberoamericana de Educación [Revista en línea], (Número 35/8). Disponible:
http://www.rieoei.org/experiencias93.htm [Consulta: 2006, junio 23]
Runyon, R. y Haber, A. (1992). Estadística para las Ciencias Sociales. Delaware:
Addison-Wesley Iberoamericana.
Tukey, J. (1977) Exploratory Data Analysis. Addison-Wesley Publishing Company.
Weisstein, E. (2008). Probability and Statistics. [Libro en línea], Disponible:
http://mathworld.wolfram.com/Box-and-WhiskerPlot.html [Consulta: 2007,
agosto 13]
Zaera, F. (1985) Estadística Deductiva. Caracas: Ediciones Vega.

Estadística aplicada a la Educación 2015 UPEL- Maracay 32


Ing.. Julia Elena Sanoja de Ramírez Dpto. de Matemática

También podría gustarte