1
Probabilidad y Estadística 0834403T Sección: 02 2021-3
DATOS AGRUPADOS:
Paso 1. Ordenar los datos de forma creciente (sean discretos (valores enteros) o continuos
(decimales)). (lo puede realizar rápido en una hoja de excel) o simplemente toma los datos y
realiza la forma de conteo e ir marcando o colocando una raya en la celda correspondiente.
Paso 2. Se determina la cantidad de intervalos y la amplitud.
Fórmula para determinar el número de clases o intervalos:
K 1 3.322Logn
Fórmula para determinar la amplitud de clases:
x x
a máx min
K
x es el valor más alto de las observaciones.
max
x es el valor más pequen~ o de las observaciones.
min
Verdaderos límites o límites reales en caso de observaciones decimales (DATOS CONTINUOS):
1 1
L x
ia min 2 d
Li límite inferior ajustado.
a
x menor valor observado.
min
d unidad seguida de tantos ceros como decimales
tenganlos datos.
Observación: cuando los datos son continuos en la primera columna de la tabla de frecuencia se
inicia de una vez con la columna de verdaderos límites, para el primer intervalo en el límite
inferior se escribe el valor obtenido en el límite inferior ajustado.
No es el mismo procedimiento para datos discretos.
Para los datos discretos o enteros para el primer intervalo, el límite inferior se escribe el
dato minímo de los datos.y se contruye la primera columna, luego de las frecuencias se realiza la
columna de verdaderos límites, a continuación se indica como se obtiene los verdaderos límites.
2
Verdaderos límites o límites reales en caso de observaciones de enteros (DATOS DISCRETOS):
L l 0,5 límite real inferior
ri i
L l 0,5 límite real superior
rs s
l límite inferior del intervalosde clase i.
i
l ímite superior del intervalosde clase i
s
Paso 3. Se construye la tabla de frecuencia.
x i 1 x i conteo fi Fi hi Hi % hi %H i
I1 f1 F1 f1 n F1 n f 1 n 100 F1 n 100
I2 f2 F2 f2 n F2 n f 2 n 100 F2 n 100
Ik fn n fn n f n n 100 Fn n 100
1
Total n 1 100 100
x i los datos de la variable que se está midiendo.
Conteo es los palitos de elección que se colocan como indicador que hay de repetición ese
dato, ésta columna no es obligatoria.
f i Frecuencias absolutas (cantidad de veces que se repite el dato).
Fa Frecuencias acumuladas (es la posición del valor acumulado del dato ).
Con éste tipo de tabla se obtiene los porcentajes puntuales, así como hasta que valor de
x i al menos o a lo sumo se conoce un porcentaje.
3
Paso 4. Medidas centrales.
Para el caso de datos agrupados se debe agregar a la tabla la columna de verdaderos
límites y la del punto medio. En ésta siguiente tabla no se colocarán las columnas de frecuencias
realtivas no porcentuales (en caso de que en algún ejercicio indique, que en la tabla se tenga las
columnas de frecuencias relativas o porcentuales la indican y llenan los valores
correspondientes en su celda respectiva).
Para datos continuos o con decimales:
Li real Ls real fi Fi mi mi f i
I1 f1 F1 m1 li ls 2 m1 f 1
I2 f2 F2 m2 li ls 2 m2 f 2
Ik fn n mk li ls 2 mk f k
Total n m f
i 1
i i
Para datos discretos o enteros:
x i 1 x i fi Fi Li real Ls real mi mi f i
I1 f1 F1 Li real Ls real m1 li ls 2 m1 f 1
I2 f2 F2 m2 li ls 2 m2 f 2
Ik fk n Li realk Ls realk mk li ls 2 mk f n
Total n m f
i 1
i i
4
Media Aritmética:
k
m f i i
Li Ls
X i 1
; mi
n 2
mi punto medio
Li límite inferior real
Ls límite Superior real
Mediana Me :
-hallar la posición de la Mediana, según sea el caso.
-ubicar el número o valor de la posición.
-ubicar el intervalo de clase con los límites reales.
-aplicar la fórmula que sigue.
PosMe Fia
Me LiMe a
fiMe
Li Me límite inferior del intervalode clase con los límetes reales
Fia frecuencia absolutaanterior a la clase que contienela mediana.
fiMe frecuencia absolutasimple que corresponde a la clase donde
esta la mediana.
Moda ( Mo ):
Se localiza Mo buscando la frecuencia absoluta simple fi , más alta. Y se tiene el intervalo de
clase con los límites reales.
d1
Mo Li Mo a
d1 d 2
Donde:
Mo = Símbolo para la moda.
LMo = Límite inferior de la clase modal.
d1 diferenciaentre la f i de la clase modal y la f i antecedente a esta clase.
d 2 diferenciaentre la f i de la clase modal y la f i siguiente a esta clase.
a = Es la amplitud de la clase modal.
5
Paso 5. Medidas no centrales.
En el caso de las medidas no centrales se calcula primero la posición pedida, y se busca esa
posición en la columna de frecuencia acumulada Fa .
Cuartiles: Deciles:
n si n es par.
i
n observaciónes n pares.
i Pos Di
PosQi
4 10
Pos Di n 1 si n es impar.
i
Pos Qi n 1 observaciónes n impares.
i
4 10
Pos Qi posición del cuartil buscado. i 1,2,3 ó 4 i decil solicitado1,2,.....,10
-hallar la posición del cuartil. -hallar la posición del decil.
-ubicar el número o valor de la posición. -ubicar el número o valor de la
-ubicar el intervalo de clase con los límites reales. posición.
-aplicar la fórmula que sigue. -ubicar el intervalo de clase con los
i límites reales.
4 Fia -aplicar la fórmula que sigue.
Qi LiQi *a
fiQi Pos Di Fia
Di Li Di * a
Donde: fi Di
Li Qi = Límite real inferior de la clase que contiene Donde:
al cuartil i . Li Di = Límite real inferior de la
Fia = Frecuencia acumulada de la clase que clase que contiene al decil i .
antecede a la clase del cuartil i . Fia = Frecuencia acumulada de la
fiQi frecuencia absoluta simple de la clase que clase que antecede a la clase del
contiene al cuartil i . decil i .
a= amplitud fiDi frecuencia absoluta simple
PosQi posición del cuartil. de la clase que contiene al decil i .
a= amplitud
Pos Di posición del decil.
6
Percentil:
n si n es par.
p
Pp
100
Pp
p
n 1 si n es impar.
100
p percentil solicitado
i 1, 2, 3,..., 98, 99, 100
- Hallar la posición del percentil Pp .
- Ubicar el valor de la posición en la columna de Fi (frecuencia absoluta
acumulada).
- Situar con la posición del Pp , el intervalo de clase con los límites reales. (de éste
intervalo se usa el valor Li P ).
- Y se aplica la siguiente formula.
Formula:
Pos Pp Fi a
Pp Li p a
fiPp
Donde:
Li P = Límite real inferior de la clase que contiene al percentil i .
Fia = Frecuencia acumulada de la clase que antecede a la clase del percentil i .
fiPp frecuencia absoluta simple de la clase que contiene al percentil i .
a= amplitud.
Pos Pp Posición del percentil (recuerde que debe estar pendiente si el número de
muestras es par o impar).
i 1, 2, 3,..., 98, 99, 100
7
Paso 6. Medidas de dispersión.
Para las medidas de dispersión es más sencillo calcular éstas medidas agregando las columnas
necesarias a la tabla de frecuencia.
f i mi X
2
Li real Ls real fi Fi mi mi f i f i mi X
I1 f1
F1
m1
li ls m1 f 1 f 1 m1 X f 1 m1 X
2
2
I2 f2 F2 m2
li ls m2 f 2 f 2 m2 X f 2 m2 X
2
Ik fn n mk
li ls mn f n f k mk X f k mk X
2
2
k
f mi X
k k
Total n m f
i 1
i i f
i 1
i mi X
i 1
i
Rango X max X min S
Coeficiente de Variación: CV 100%
X
n
f i mi X
Rango semi-intercuartílico: Q
Q 3 Q1
Desviación media: DM i 1
2
n
f m
n 2
X
i i
Rango intercuartílico: Q Q3 Q1
Varianza: S 2 i 1
,
n 1
Desviación estándar: S S 2 Rango percentilar: P P90 P10
8
Paso 7. Medidas de forma.
Para las medidas de dispersión es más sencillo calcular éstas medidas agregando las columnas
necesarias a la tabla de frecuencia.
f i mi X
4
Li real Ls real mi f i f i mi X f i mi X
2 3
fi Fi mi
I1 f1
F1
m1
li ls m1 f 1 f 1 m1 X
2
f 1 m1 X
3 f 1 m1 X
4
2
I2 f2 F2 m2
li ls m2 f 2 f 2 m2 X
2
f 2 m2 X
3 f 2 m2 X
4
Ik fn n mk
li ls mn f n f k mk X
2
f k mk X
3 f k mk X
4
2
k
f m X
k k 4
f i mi X
k
mi f i f 1 m1 X
2 3
Total n i 1
i i
i 1 i 1 i 1
9
Coeficiente de sesgo:
CS 0 sesgada a la izquierda.
f m
n 3
i i X CS 0 simétrica
CS i 1
CS 0 sesgada a la derecha.
nS 3
Curva de asimetría Curva de asimetría
negativa o sesgada a positiva o sesgada a la
la izquierda. Curva simétrica. derecha.
X Me Mo
Mo
Me
Mo
Me
X
X
Eje de simetría Eje de simetría Eje de simetría
CS < 0 CS = 0. CS > 0
Coeficiente de curtosis:
K 0 Aplanada o Platicúrtica.
n 4
f i mi X K 0 Normal o Mesocúrtica.
K i 1
3 K 0 Empinada o Leptocúrtica.
nS 4
Aplanada o Normal o Empinada o
Platicúrtica. Mesocúrtica. Leptocúrtica
K<0 K=0 K>0
Observación:
.- Cuando los datos son una muestra, es decir parte de la población.
La media se denota X , y la desviación se denota S .
.- Cuando los datos, son todos los casos posibles o cada elemento de la población.
La media se denota . y la desviación se denota .