PROCESO
ESTADÍSTICO
PRÁCTICA DOCENTE
QUÉ ES PROCESO ESTADÍSTICO?
• Cuando hablamos de proceso
estadístico, estamos hablando de una
serie de pasos que es recomendable
realizar para obtener unos resultados
fieles a la realidad que estudiamos en
el estudio estadístico que se pretenda
realizar.
Otra definición….
• El análisis de un conjunto de datos
para comprender su significado como
resultado de un proceso, la estadística
descriptiva es un recurso muy valioso
para explicar y para tomar decisiones.
• A continuación se detallan los pasos a
seguir de una manera sencilla.
Pasos ……
Paso 1. Para iniciar, se recolectan los datos que interesan, por ejemplo:
en un proceso educativo se obtuvieron los siguientes resultados:
DATOS DESORDENADOS
76 78 89 89 66 90
50 40 62 75 89 90
77 94 98 100 66 70
85 99 69 52 68 74
Paso 2. Ordenar los datos siguiendo un criterio que puede ser de menor a
mayor (ascendente) o de Mayor a menor (descendente). Es muy usual
hacerlo de manera ascendente así:
DATOS ORDENADOS
40 50 52 62 66 66
68 69 70 74 75 76
77 78 85 89 89 89
90 90 94 98 99 100
Paso 3. Se procede a contar la cantidad de datos que se tienen
(N = número de casos), se identifica el valor menor (Xm) y valor
máximo o mayor (XM) y con ellos se calcula la Amplitud de la
serie o grupo de datos (A = número de unidades desde el valor
menor al mayor incluidos ellos, se calcula así:
A = (XM –Xm) + 1.
En el grupo dado, estos son los datos correspondientes:
N = 24 Xm = 40 XM = 100 A = (100-40) + 1 = 61
El cálculo de la Amplitud me indica (en este caso) que desde el
valor menor hasta el valor mayor incluido existen 61 unidades
(espacios en los cuales se pueden colocar los datos obtenidos en
el inicio) Si a partir de esta información quisiera hacer un tabular
(cuadro) este tendría 61 renglones.
Paso 4. Determinar frecuencias (f). La frecuencia es el
número de veces que aparece un valor, en la serie de
este caso la situación es la siguiente:
Datos Recuento f
40 / 1
50 / 1
52 / 1
62 / 1
66 // 2
68 / 1
69 / 1
70 / 1
74 / 1
75 / 1
76 / 1
77 / 1
78 / 1
85 / 1
89 /// 3
90 // 2
94 / 1
98 / 1
99 / 1
100 / 1
N = 24
Entonces, así como en este caso se procede a agrupar en Intervalos (I)
(subconjuntos de datos). Un intervalo es un subconjunto de datos de la serie
cuyo tamaño se busca que corresponda a 3, 5, 7, 9…etc. unidades. La
elección del tamaño es decisión del analista acorde a la Amplitud de la serie y
el criterio de más o menos 10. En este caso, la amplitud es 61, si se quieren
10 intervalo se dividiría 61/10 = 6.1
Esto no es apropiado porque se requiere que el tamaño sea de unidades
enteras, entonces, a priori se decide el tamaño de los intervalos, así: si se
decide que sean de 3 unidades se tendría 61/3 = 20.33; si se dispone que
sean de 5 unidades, sería 61/5 unidades = 12.2 pero por manejar menos
grupos diremos 61/7(7 unidades, números, dígitos) = 8.71 (aproximar a 9
grupos) Los dos resultados ( 12.2 y 8.71) son adecuados para hacer
el tabular. Optaremos por el de 8.71 = 9 .
Cada intervalo abarcará 7 unidades, el punto medio se le llamará marca de
clase y se obtiene de dividir entre dos la suma de los dos extremos del
intervalo.
Paso 5. Elaborar el tabular con ordenamiento en
intervalos de amplitud (n) = 7.
fa
I mc f (frecuencia
(intervalos) (marca de clase) (frecuencia) acumulada)
40 – 46 43 1 1
47 – 53 50 2 3
54 – 60 57 0 3
61 – 67 64 3 6
68 – 74 71 4 10
75 – 81 78 4 14
82 – 88 85 1 15
89 – 95 92 6 21
96 – 102 99 3 24
N = 24
Paso 6. Se agregara una quinta columna que será la marca de clase
por la frecuencia mc* f la cual nos ayudará a encontrar una de las
medidas de tendencia central más adelante en dicho proceso
estadístico.
mc * f
(marca de clase
I mc f fa por frecuencia)
40 – 46 43 1 1 43
47 – 53 50 2 3 100
54 – 60 57 0 3 0
61 – 67 64 3 6 192
68 – 74 71 4 10 284
75 – 81 78 Md X 4 14 312
82 – 88 85 1 15 85
89 – 95 92 Mo 6 21 552
96 – 102 99 3 24 297
N = 24 ∑ = 1,865
Paso 7. Luego de los cálculos respectivos en el tabular o cuadro procedemos a calcular cada una
de las medidas de
tendencia central (moda, mediana y media aritmética).
MODA: cuando los valores están agrupados en
intervalos, puede tomarse como moda el punto medio
o marca de clase del intervalo, que tiene la mayor
frecuencia, al observar la columna de frecuencias
absolutas se ve que la mayor frecuencia es 6
que corresponde al intervalo 89 -95 y según lo
dicho, la moda será la marca de clase del intervalo o
sea Mo = 92 .
MEDIANA: observamos la columna de frecuencias
acumulada (fa) y se observa el número total de datos
N = 24 más 1 el cual se divide entre 2 fórmula que
nos permitirá ubicar dentro de dicha columna de
frecuencias acumuladas el punto central y la formula
sería Md = N + 1 / 2, entonces el resultado sería
Md = 24 + 1 / 2 = 12.5 , el
valor inmediato que lo supera es 14 que
corresponde al intervalo 75-81 cuya
marca de clase es 78 , entonces la mediana
es Md = 78 .
MEDIA ARITMÉTICA: (X) consiste en el promedio de
los valores que se trabajan, es decir, la suma (∑) de
todos los valores dividido entre el número de casos
(N).
La fórmula para este proceso sería X = ∑mc.f/N =
1,865 /24 = 77.70 , el
promedio de la serie es entonces 78
, por lo tanto la X = 78 .