Estadistica Descriptiva
Estadistica Descriptiva
BIOESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
Actividad de Investigación.
Equipo:
Flores Zamilpa Alexandra Shendaly
Montes Jáurez Aidé
Vega Ramírez Alondra Montserrat
Grupo: 1OV02.
1. En una clínica infantil se ha ido anotando, durante un mes, el número de
metros que cada niño anda, seguido sin caerse, el primer día que comienza a
caminar, obteniéndose la tabla de información adjunta:
número de metros 1 2 3 4 5 6 7 8
número de niños 2 6 10 5 10 3 2 2
Se pide:
a) Tabla de frecuencias. Diagrama de barras para frecuencias absolutas,
relativas y acumuladas.
b) Mediana, media aritmética, moda y cuartiles.
c) Varianza y desviación típica.
d) ¿Entre qué valores se encuentra como mínimo el 75% de las
observaciones?
a) 1. Tabla de frecuencias.
𝑥𝑖 𝑛𝑖 𝑁𝑖 𝑓𝑖 𝑓𝑖 (%) 𝐹𝑖 𝐹𝑖 (%)
1 2 2 0.050 5.0 0.050 5.0
2 6 8 0.150 15.0 0.200 20.0
3 10 18 0.250 25.0 0.450 45.0
4 5 23 0.125 12.5 0.575 57.5
5 10 33 0.250 25.0 0.825 82.5
6 3 36 0.075 7.5 0.900 90.0
7 2 38 0.050 5.0 0.950 95.0
8 2 40 0.050 5.0 1.000 100.0
12
10
Frecuencias absolutas
0
1 2 3 4 5 6 7 8
Número de metros
3. Diagrama de barras para frecuencias relativas:
0.3
0.25
Frecuencias relativas
0.2
0.15
0.1
0.05
0
1 2 3 4 5 6 7 8
Número de metros
30
Acumuladas
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9
Número de metros
1.2
1
Frecuencias Relativas
0.8
Acumuladas
0.6
0.4
0.2
0
0 1 2 3 4 5 6 7 8 9
Número de metros
b) Mediana, media, moda y cuartiles:
1. Mediana:
𝑁 40
𝑀𝑒 = = = 20
2 2
En la tabla de frecuencias no se encuentra el valor “20” en las frecuencias absolutas
acumuladas 𝑁𝑖 , se tomará el siguiente número, 23, cuya 𝑥𝑖 es 4. ∴ 𝑀𝑒 = 𝟒.
2. Media:
∑𝒌𝒊=𝟏 𝒙𝒊 ∙ 𝒏𝒊
̅=
𝒙
𝑵
(1 ∙ 2) + (2 ∙ 6) + (3 ∙ 10) + (4 ∙ 5) + (5 ∙ 10) + (6 ∙ 3) + (7 ∙ 2) + (8 ∙ 2) 162
𝑥̅ = =
40 40
𝑥̅ = 4.05
3. Moda: al ser una variable bimodal, se obtiene:
𝑴𝒐𝟏 = 𝟑 𝒚 𝑴𝒐𝟐 = 𝟓
4. Cuartiles:
𝑁 40
• 𝑃1⁄ = = = 10 ∴ 𝑷𝟏⁄ = 𝟑
4 4 4 𝟒
𝑁 40
• 𝑃2⁄ = 𝑀𝑒 = = = 20 ∴ 𝑷𝟐⁄ = 𝟒
4 2 2 𝟒
3𝑁 3(40) 120
• 𝑃3⁄ = = = = 30 ∴ 𝑷𝟑⁄ = 𝟓
4 4 4 4 𝟒
∑𝑘𝑖=1 𝑥2𝑖 ∙ 𝑛𝑖
𝜎= √ ̅2
−𝑥
𝑁
𝜎 = √3.10 = 1.76, ∴ 𝝈 = 𝟏. 𝟕𝟔 ~ 𝟏. 𝟖
d) ¿Entre qué valores se encuentra como mínimo el 75% de las observaciones?
1
Empleando el Teorema de Chebyshev que garantiza que como mínimo, el (1 − 𝑘 2 ) ∙
100% de los datos están concentrados en el intervalo (𝑥̅ − 𝑘𝜎; 𝑥̅ + 𝑘𝜎), y, por tanto,
1
fuera de este intervalo habrá a lo más el 𝑘 2 ∙ 100% de los mismos. Con esto, se tiene
1
que: 75 = (1 − 𝑘 2 ) ∙ 100, de donde se despeja k
1 1 1 ∙ 100 2
100 − 75 = 2
∙ 100; 25 = 2 ∙ 100; 𝑘 2 = ; 𝑘 =4
𝑘 𝑘 25
√𝑘 2 = √4; 𝑘 = 2
Entonces, con 𝑘 = 2:
𝑥̅ − 𝑘𝜎 = 4.05 − (2)(1.76) = 𝟎. 𝟓𝟑
𝑥̅ + 𝑘𝜎 = 4.05 + (2)(1.76) = 𝟕. 𝟓𝟕
Y se puede garantizar que, al menos, el 75% de los datos están entre los valores
0.53 y 7.57.
Se pide:
a) Confeccionar la tabla de frecuencias.
b) Calcular la media, mediana, moda y cuartiles.
c) Calcular la desviación típica de la muestra.
d) ̅−
¿Qué porcentaje de observaciones se encuentra en el intervalo (𝒙
̅ + 𝟓𝝈)?
𝟓𝝈, 𝒙
a) Tabla de frecuencias:
𝑥𝑖 𝑛𝑖 𝑁𝑖 𝑓𝑖 𝑓𝑖 (%) 𝐹𝑖 𝐹𝑖 (%)
61 8 8 0.142 14.3 0.142 14.3
61.2 10 18 0.178 17.9 0.321 32.2
65 2 20 0.035 3.6 0.357 35.8
70.2 5 25 0.089 8.9 0.446 44.7
75.9 13 38 0.232 23.3 0.678 67.9
77.3 3 41 0.053 5.4 0.732 73.3
80.0 0 41 0.000 0.0 0.732 73.3
82.4 15 56 0.267 26.8 1.000 100.0
𝑥̅ = 72.0642 ~ 72.1
2. Mediana:
𝑁 56
𝑀𝑒 = = = 28
2 2
Al no haber el valor “28” en las frecuencias absolutas acumuladas, 𝑁𝑖 , se toma el
valor siguiente, cuya 𝑥𝑖 corresponde a 75.9.
∴ 𝑀𝑒 = 75.9
3. Moda:
La moda corresponde al valor 82.4 ya que es el de mayor frecuencia.
𝑀𝑜 = 82.4
4. Cuartiles:
𝑁 56
• 𝑃1⁄ = = = 14 ∴ 𝑷𝟏⁄ = 𝟔𝟏. 𝟐
4 4 4 𝟒
𝑁 56
• 𝑃2⁄ = 𝑀𝑒 = = = 28 ∴ 𝑷𝟐⁄ = 𝟕𝟓. 𝟗
4 2 2 𝟒
3𝑁 3(56) 168
• 𝑃3⁄ = = = = 42 ∴ 𝑷𝟑⁄ = 𝟖𝟐. 𝟒
4 4 4 4 𝟒
c) Varianza y desviación típica:
1. Varianza, 𝜎 2 :
∑𝑘𝑖=1 𝑥𝑖2 ∙ 𝑛𝑖
𝜎2 = − 𝑥̅ 2
𝑁
(612 ∙ 8) + (61.22 ∙ 10) + (652 ∙ 2) + (70.22 ∙ 5) + (75.92 ∙ 13) + (77.32 ∙ 3) + (80.42 ∙ 0) + (82.42 ∙ 15)
𝜎2 =
56
− (72.1)2
294,975.4
𝜎2 = − 5,198.41 = 5,267.1478 − 5,198.41, ∴ 𝝈𝟐 = 𝟔𝟗. 𝟎𝟎𝟕𝟖 ~ 𝟔𝟗. 𝟎
56
2. Desviación típica, 𝜎:
∑𝑘𝑖=1 𝑥2𝑖 ∙ 𝑛𝑖
𝜎= √ ̅2
−𝑥
𝑁
Resolviendo,
1 1 25 − 1 24
( − ) ∙ 100% = ∙ 100% = ∙ 100% = (0.96)(100) = 𝟗𝟔%
1 25 25 25
∴ 𝒆𝒏 𝒆𝒍 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 (𝑥̅ − 5𝜎; 𝑥̅ + 5𝜎) 𝒉𝒂𝒃𝒓á 𝒖𝒏 𝒎í𝒏𝒊𝒎𝒐 𝒅𝒆𝒍 𝟗𝟔% 𝒅𝒆 𝒍𝒂𝒔 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒄𝒊𝒐𝒏𝒆𝒔
Se pide:
a) Agrupar los datos en 5 intervalos de clase.
b) Determinar la media y la desviación típica. Calcular la moda y la
mediana.
c) Hallar el tercer cuartil, el séptimo decil y el centil 25.
4100
𝐼 = 𝑅⁄5 = = 820
5
𝐼 = 821
Por lo que podemos decir que cada intervalo tiene una amplitud de 821.
Intervalos de clase 𝑥𝑖 𝑛𝑖 𝑁𝑖
b) 1. Media:
𝟓
𝟏
̅=
𝒙 ∑ 𝒄𝒊 ⋅ 𝒏𝒊
𝟐𝟒
𝒊=𝟏
𝟏
̅=
𝒙 [(9 ∗ 1910.5) + (1 ∗ 2731.5) + (10 ∗ 3552.5) + (0 ∗ 4373.5) + (4 ∗ 5194.5)]
𝟐𝟒
76229
̅=
𝒙 = 3176.208333
24
̅ = 3176.2
𝒙
2. Varianza:
1
𝝈𝟐 = [(1910.5 − 3176.21)𝟐 ∗ 9 + (2731.5 − 3176.21)𝟐 ∗ 1 + (3552.5 − 3176.21)𝟐 ∗ 10
24
+ (4373.5 − 3176.21)𝟐 ∗ 0 + (5194.5 − 3176.21)𝟐 ∗ 4]
𝝈𝟐 = 1346911.79
3. Desviación típica:
𝝈 = √1346911.79
𝝈 =1160.5652 ~ 1160.60
4. Moda:
El intervalo modal es (3142,3963), pues en él se agrupa el mayor número de observaciones, es decir,
10.
5. Mediana:
Para calcular la mediana hacemos una representación gráfica de las frecuencias absolutas
acumuladas
Como el número total de observaciones es 24, la mediana será aquel valor que
divide a la muestra en dos partes iguales, esto es 12 observaciones. Por lo tanto:
𝑀𝑒 = 3142 + 𝑥,
Entonces:
2 𝑥
=
10 821
2
𝑥= ⋅ 821
10
𝑥 = 164.2
Finalmente sustituimos el valor de x y tenemos que:
3⋅𝑁
𝑃3∕4 =
4
Donde N es el número de observaciones totales por lo tanto N=24
3 ⋅ 24
= 18
4
Después realizamos un procedimiento similar al empleado en el cálculo de la
mediana.
𝑃3∕4 = 3142 + 𝑥,
Obtenemos el valor de x:
8 𝑥
=
10 821
8
𝑥= ⋅ 821
10
𝑥 = 656.8
Y, por tanto,
7⋅𝑁
𝐷7 =
10
N = 24
7 ⋅ 24
𝐷7 = = 16.8
10
Después:
𝐷7 = 3142 + 𝑥,
Entonces:
16.8 − 10 𝑥
=
20 − 10 821
6.8
𝑥= ⋅ 821 = 558.28
10
25 ⋅ 𝑁
𝑃25 =
100
25 ⋅ 24
=6
100
Después:
𝑃25 = 1500 + 𝑥,
Entonces:
6 𝑥 821
𝑥= = 547.33
9
Finalmente obtenemos que:
a) 6 intervalos de clase
Chicos
IC xi ni Ni fi fi (%) Fi Fi (%)
[13.2, 13.7) 13.45 5 5 0.14 14% 0.14 14%
[13.7, 14.2) 13.95 5 10 0.14 14% 0.28 28%
[14.2, 14.7) 14.45 7 17 0.20 20% 0.48 48%
[14.7, 15.2) 14.95 9 26 0.26 26% 0.74 74%
[15.2, 15.7) 15.45 5 31 0.14 14% 0.88 88%
[15.7, 16.2) 15.95 4 35 0.11 11% 0.99 99%
Chicas
IC xi ni Ni fi fi (%) Fi Fi (%)
[14.4, 12.0) 11.7 7 7 0.175 17.5% 0.175 17.5%
[12.0, 12.6) 12.3 11 18 0.275 27.5% 0.450 45%
[12.6, 13.2) 12.9 9 27 0.225 22.5% 0.675 67.5%
[13.2, 13.8) 13.5 10 37 0.250 25.0% 0.925 92.5%
[13.8, 14.4) 14.1 2 39 0.050 5.0% 0.975 97.5%
[14.4, 15.0) 14.7 1 40 0.025 2.5% 1.000 100%
b)
chicos
chicas
c) Media aritmética, moda y mediana
1. Mediana:
chicos
𝑁 35
𝑀𝑒 = = = 17.5
2 2
Chicas
𝑁 40
𝑀𝑒 = = = 20
2 2
Chicas
𝑴𝒐𝟏 = 𝟏𝟐. 𝟑 𝒚 𝑴𝒐𝟐 = 𝟏𝟑. 𝟓
d) Cuartiles
Cuartiles Chicos
𝑁 35
• 𝑃1⁄ = = = 8.75 ∴ 𝑷𝟏⁄ = 𝟏𝟑. 𝟗𝟓
4 4 4 𝟒
𝑁 35
• 𝑃2⁄ = 𝑀𝑒 = = = 17.5 ∴ 𝑷𝟐⁄ = 𝟏𝟒. 𝟒𝟓
4 2 2 𝟒
3𝑁 3(35) 105
• 𝑃3⁄ = = = = 26.25 ∴ 𝑷𝟑⁄ = 𝟏𝟒. 𝟗𝟓
4 4 4 4 𝟒
Cuartiles Chicas
𝑁 40
• 𝑃1⁄ = = = 10 ∴ 𝑷𝟏⁄ = 𝟏𝟐. 𝟑
4 4 4 𝟒
𝑁 40
• 𝑃2⁄ = 𝑀𝑒 = = = 20 ∴ 𝑷𝟐⁄ = 𝟏𝟐. 𝟗
4 2 2 𝟒
3𝑁 3(40) 120
• 𝑃3⁄ = = = = 30 ∴ 𝑷𝟑⁄ = 𝟏𝟑. 𝟓
4 4 4 4 𝟒
e) Desviación típica
∑𝑘𝑖=1 𝑥2𝑖 ∙ 𝑛𝑖
𝜎= √ ̅2
−𝑥
𝑁
Chicos
6667.76
𝜎= √ − (14.45)2 = √190.50 − (14.45)2 = √190.50 − 208.80 = √18.3
35
𝜎 = 4.27 𝑒𝑛 𝑐ℎ𝑖𝑐𝑜𝑠
Chicas
𝜎 = 1.58 𝑒𝑛 𝑐ℎ𝑖𝑐𝑎𝑠
hombres mujeres
intervalos de intervalos de
frecuencia frecuencia
clase (años) clase (años)
[4.5,9.5) 1 [4.5,9.5) 0
[9.5,14.5) 4 [9.5,14.5) 2
[14.5,19.5) 7 [14.5,19.5) 10
[19.5,24.5) 23 [19.5,24.5) 7
[24.5,29.5) 16 [24.5,29.5) 3
[29.5,34.5) 7 [29.5,34.5) 5
[34.5,39.5) 10 [34.5,39.5) 2
a) Tablas de frecuencias
Hombres
IC xi ni Ni fi fi (%) Fi Fi (%)
[4.5, 9.5) 7 1 1 0.015 1.5% 0.015 1.5%
[9.5, 14.5) 12 4 5 0.059 5.9% 0.074 7.4%
[14.5, 19.5) 17 7 12 0.103 10.3% 0.177 17.7%
[19.5, 24.5) 22 23 35 0.338 33.8% 0.515 51.5%
[24.5, 29.5) 27 16 51 0.235 23.5% 0.750 75%
[29.5, 34.5) 32 7 58 0.103 10.3% 0.853 85.3%
[34.5, 39.5) 37 10 68 0.147 14.7% 1.000 100%
Mujeres
IC xi ni Ni fi fi (%) Fi Fi (%)
[4.5, 9.5) 7 0 0 0.000 0% 0.000 0%
[9.5, 14.5) 12 2 2 0.069 6.9% 0.069 6.9%
[14.5, 19.5) 17 10 12 0.345 34.5% 0.414 41.4%
[19.5, 24.5) 22 7 19 0.241 24.1% 0.655 65.5%
[24.5, 29.5) 27 3 22 0.103 10.3% 0.758 75.8%
[29.5, 34.5) 32 5 27 0.172 17.2% 0.930 93%
[34.5, 39.5) 37 2 29 0.069 6.9% 1.000 100%
Hombres
Mujeres
c) Calcular la media, la mediana y la moda.
Hombres
1. Media:
Primero construimos la tabla de frecuencias
∑ 𝑥𝑓
̅=
𝒙
𝑛
Donde
𝑛 𝑒𝑠 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 ℎ𝑜𝑚𝑏𝑟𝑒𝑠 𝑛 = 68
∑ 𝑥𝑓 = 1706
1706
̅=
𝒙 = 25.0882 ~ 25.1
68
̅ = 25.1 𝑎ñ𝑜𝑠
𝒙
2. Mediana:
Primero debemos encontrar cual es la posición del dato del medio; La posición para la
mediana se encuentra dividiendo el número de datos entre dos:
𝑛 68
= = 34
2 2
Como no se encuentra como tal el numero 34 buscamos el número siguiente al 34, el cual
es 35.
Luego entonces el intervalo en el que nos vamos a basar para obtener los datos es
(19.5,24.5)
Donde
Sustituimos en la formula
34−12
𝑀𝑒 = 19.5 + ⋅ 5 = 24.28 ~ 24. 3
23
y obtenemos que:
𝑀𝑒 = 24. 3 𝑎ñ𝑜𝑠
3. Moda:
El intervalo modal es (19.5,24.5) pues en él se agrupa el mayor número de observaciones,
es decir, 23.
Hombres
Primero calculamos la varianza para esto necesitamos la tabla de frecuencias
𝑛
∑𝑖 =1 𝑥𝑖2 ⋅ 𝑓𝑖
𝜎2 = − 𝑥̅ 2
𝑛
Sustituimos en la formula
𝑛 = 68
̅ = 25.1
𝒙
46302
𝝈𝟐 = − 25.12 = 50.9017 ~ 50.1
68
y tenemos que
𝝈𝟐 = 50.1
𝑘𝑛
4
K = número de cuartil
n = número de datos
1⋅ 68
Primer Cuartil = 17
4
𝑘𝑛
− 𝐹𝑖−1
𝑄𝑘 = 𝐿𝑖 + 𝐴 ( 4 )
𝐹𝑖 − 𝐹𝑖−1
Donde,
17−12
𝑄1/4 = 19.5 + 5 (35−12) = 20.5869 ~ 20.6
Segundo Cuartil
2⋅ 68
Frecuencia acumulada = 34
4
Intervalo (19.5,24.5)
Tercer Cuartil
3 ⋅ 68
Frecuencia acumulada = 51
4
𝑄3 = 𝐿𝑠
y entonces tenemos que
𝑄3 = 29.5
Cuarto Cuartil
4 ⋅ 68
Frecuencia acumulada = 68
4
𝑄4 = 𝐿𝑠
𝑄4 = 39.5
Fórmula:
𝑘𝑛
− 𝐹𝑖−1
𝐷𝑘 = 𝐿𝑖 + 𝐴 (10 )
𝐹𝑖 − 𝐹𝑖−1
Donde,
54.4−51
𝐷8 = 29.5 + 5 ( 58−51 ) = 31.9285 ~ 32
Cálculo del centil 49
49 ⋅ 68
Frecuencia acumulada = 33.32
100
33.32−12
𝑃49 = 19.5 + 5 ( ) = 24.13
35−12
Mujeres
1. Media:
Primero construimos la tabla de frecuencias
∑ 𝑥𝑓
̅=
𝒙
𝑛
Donde
663
̅=
𝒙 =22.86 ~ 22.9
29
̅ = 22.9 𝑎ñ𝑜𝑠
𝒙
2. Mediana:
Primero encontrar la posición del dato del medio dividiendo el número de datos entre dos:
Luego entonces el intervalo en el que nos vamos a basar para obtener los datos es
(19.5,24.5)
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ⋅ 𝐴𝑖
𝑓𝑖
Donde
Sustituimos en la fórmula
15−12
𝑀𝑒 = 19.5 + ⋅ 5 = 20.289 ~ 20.3
19
y obtenemos que:
𝑀𝑒 = 20. 3 𝑎ñ𝑜𝑠
3. Moda:
El intervalo modal es (14.5,19.5) pues en él se agrupa el mayor número de observaciones,
es decir, 10.
𝑛
∑𝑖 =1 𝑥𝑖2 ⋅ 𝑓𝑖
𝜎2 = − 𝑥̅ 2
𝑛
Sustituimos en la formula
𝑛 = 29
̅ = 22.9
𝒙
16611
𝝈𝟐 = − 22.92 = 48.38 ~ 48.4
29
y tenemos que
𝝈𝟐 = 48.4
𝝈 = √𝜎 2
𝝈 = √48.4= 6.95 ~ 7
e) Calcular los cuartiles, el decil 8 y el centil 49
Mujeres
1.Calculo de cuartiles
Para esto necesitamos la tabla de frecuencias
Intervalos de 𝑥 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
clase (años) 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎
(4.5,9.5) 7 0 0
(9.5,14.5) 12 2 2
(14.5,19.5) 17 10 12
(19.5,24.5) 22 7 19
(24.5,29.5) 27 3 22
(29.5,34.5) 32 5 27
(34.5,39.5) 37 2 29
Ʃ 29
𝑘𝑛
4
K = número de cuartil
n = número de datos
1⋅ 29
Primer Cuartil = 7.25
4
Después buscamos el intervalo con la frecuencia absoluta acumulada igual o mayor a 7.25
Y tenemos que al que más se aproxima es 12 en el intervalo (14.5,19.5)
Donde,
7.25−2
𝑄1 = 14.5 + 5 ( 12−2 ) = 17.12
Segundo Cuartil
2 ⋅ 29
Frecuencia acumulada = 14.5
4
Intervalo (19.5,24.5)
Formula:
𝑘𝑛
− 𝐹𝑖−1
𝑄𝑘 = 𝐿𝑖 + 𝐴 ( 4 )
𝐹𝑖 − 𝐹𝑖−1
14.5−12
𝑄2 = 19.5 + 5 ( 19−12 ) = 21.285 ~ 21. 3
Tercer Cuartil
3 ⋅ 29
Frecuencia acumulada = 21.75
4
Fórmula:
𝑘𝑛
− 𝐹𝑖−1
𝑄𝑘 = 𝐿𝑖 + 𝐴 ( 4 )
𝐹𝑖 − 𝐹𝑖−1
21.75−19
𝑄3 = 24.5 + 5 ( ) = 29.083 ~ 29.1
22−19
Cuarto Cuartil
4 ⋅ 29
Frecuencia acumulada = 29
4
𝑄4 = 𝐿𝑠
𝑄4 = 39.5
Fórmula:
𝑘𝑛
− 𝐹𝑖−1
𝐷𝑘 = 𝐿𝑖 + 𝐴 (10 )
𝐹𝑖 − 𝐹𝑖−1
Donde,
49 ⋅ 29
Frecuencia acumulada = 14.21
100
14.21 −12
𝑃49 = 19.5 + 5 ( ) = 21.0785 ~ 21.1
19−12