1.- Análisis de datos univariados.
Ejercicio N° 1:
Se tiene la siguiente serie de datos que representan la edad de
un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Determinar:
a) Media Aritmética y mediana
b) Varianza y desviación estándar
c) Resumen de cinco números y boxplot.
1
1.- Análisis de datos univariados.
1.- ORDENAR LOS DATOS
Para calcular los parámetros estadístico, lo primero es ordenar
la distribución, desde el dato de menor valor al de mayor valor:
20 23 24 24 24 25 29 31 31 33
34 36 36 37 39 39 40 40 41 45
2
1.- Análisis de datos univariados.
2.- Calcular la media aritmética
Para calcular la media aritmética se utiliza la siguiente formula:
𝒙𝟏 + 𝒙𝟐 + ....+ 𝒙𝒊 + …+ 𝒙𝒏
𝒙=
𝒏
𝟐𝟎 + 𝟐𝟑 + 𝟐𝟒 + 𝟐𝟒 + 𝟐𝟒 + 𝟐𝟓 + 𝟐𝟗 + 𝟑𝟏 + 𝟑𝟏 + 𝟑𝟑 + 𝟑𝟒 + 𝟑𝟔 + 𝟑𝟔 + 𝟑𝟕 + 𝟑𝟗 + 𝟑𝟗 + 𝟒𝟎 + 𝟒𝟎 + 𝟒𝟏 + 𝟒𝟓
𝒙=
𝟐𝟎
𝟔𝟓𝟏
𝒙= = 𝟑𝟐, 𝟓𝟓
𝟐𝟎
3
1.- Análisis de datos univariados.
3.- Cálculo de la mediana
La posición de la mediana se calcula de acuerdo a la siguiente
expresión:
𝒏+𝟏
𝑷𝑴𝒅 =
𝟐
𝟐𝟎+𝟏 𝟐𝟏
𝑷𝑴𝒅 = = = 𝟏𝟎, 𝟓 (Posición)
𝟐 𝟐
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Posición: 10,5
Valor: (33 +34)/ 2 = 33,5
4
1.- Análisis de datos univariados.
4.- Varianza
Para calcular la varianza debemos utilizar la siguiente formula:
( 𝒙𝒊 − 𝒙 )𝟐
𝝈𝟐 =
𝒏
20 − 32,55 2 + 23 − 32,55 2 + 24 − 32,55 2 + … . + 45 − 32,55 2
𝜎2 =
20
1.008,95
𝜎2 = = 50,45
20
5
1.- Análisis de datos univariados.
5.- Desviación estándar
Para Calcular la desviación estándar utilizaremos la siguiente
formula:
( 𝒙𝒊 − 𝒙 )𝟐
𝝈= 𝝈𝟐 =
𝒏
𝜎= 50,45 = 7,10
6
1.- Análisis de datos univariados.
6.- Cálculo de los cuartiles
Q1, el cuartil Primero es el valor mayor que el 25% de los
valores de la distribución. Como N = 20 resulta que la posición
de Q1 esta dado por: (N+1)/4 = 5,25; el primer cuartil es la
media aritmética de entre dichos valores y es el siguiente:
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Posición 5,25
Valor de Q1: Q1 = (24 + 25) / 2 = 24,5
7
1.- Análisis de datos univariados.
Q2, el Segundo Cuartil es, evidentemente, la mediana de la
distribución, es el valor de la variable que ocupa el lugar
central en un conjunto de datos ordenados. Como (N+1)/2 =
10,5 ; la mediana es la media aritmética de dicho valor y el
siguiente:
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Posición: 10,5
me= Q2 = (33 + 34)/ 2 =33,5
8
1.- Análisis de datos univariados.
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los
valores de la distribución. En nuestro caso, como 3(N+1)/4 =
15,75, resulta
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Posición: 15,75
Valor de Q3=(39 + 39) / 2 = 39
9
1.- Análisis de datos univariados.
7.- Resumen 5 números
Xmín = 20
Q1 = 24,5
Q2 = 33,5
Q3 = 39
Xmáx = 45
10
1.- Análisis de datos univariados.
8.- Diagrama Boxplot
Xmin=20 Q1=24,5 Q2=33,5 Q3=39 Xmax=45
20 25 30 35 40 45
Rango intercuartílico = Q3 – Q1 = 39 – 24,5 = 14,5
Rango o Recorrido = Xmax – Xmin = 45 – 20 = 25
11
1.- Análisis de datos univariados.
Ejercicio N° 2:
Para los siguientes datos, construir una tabla distribución de
frecuencias. Además, determinar media aritmética, su varianza
y desviación estándar.
32, 31, 28, 29, 33, 32, 31, 30, 31, 32, 31,
27, 28, 29, 30, 31, 32, 31, 30, 29, 30, 32,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
12
1.- Análisis de datos univariados.
Ejercicio N° 2:
32, 31, 28, 29, 33, 32, 31, 30, 31, 32, 31,
27, 28, 29, 30, 31, 32, 31, 30, 29, 30, 32,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
Ordenando los datos de menor a mayor:
27, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30,
30, 30, 30, 30, 30, 31, 31, 31, 31, 31, 31,
31, 31, 32, 32, 32, 32, 32, 33, 33, 33, 34
13
1.- Análisis de datos univariados.
Ejercicio N° 2: Tabla de Distribución de Frecuencia
Frecuencia Frec. Absol. Frecuencia Frec. Relat.
Valor
Absoluta Acumulada Relativa Acumulada
27 1 1 0,030 0,030
28 2 2+1=3 0,061 0,091
29 6 6 + 3= 9 0,182 0,273
30 7 7 + 9= 16 0,212 0,485
31 8 8 + 16= 24 0,242 0,727
32 5 5 + 24= 29 0,152 0,879
33 3 3 + 29= 32 0,091 0,970
34 1 1 + 32= 33 0,030 1,000
Total 33 1,000
14
1.- Análisis de datos univariados.
Ejercicio N° 2:
Media aritmética:
𝑿𝒊 𝑿𝒊 ∗ 𝒇𝒊
𝒙= ⇒𝒙=
𝒏 𝒏
𝟐𝟕 ∗ 𝟏 + 𝟐𝟖 ∗ 𝟐 + 𝟐𝟗 ∗ 𝟔 + 𝟑𝟎 ∗ 𝟕 + 𝟑𝟏 ∗ 𝟖 + 𝟑𝟐 ∗ 𝟓 + 𝟑𝟑 ∗ 𝟑 + 𝟑𝟒 ∗ 𝟏
𝒙=
𝟑𝟑
𝟏𝟎𝟎𝟖
𝒙= = 𝟑𝟎, 𝟓𝟓
𝟑𝟑
15
1.- Análisis de datos univariados.
Ejercicio N° 2:
Varianza:
(𝒙𝒊 − 𝒙 )𝟐 (𝒙𝒊 − 𝒙 )𝟐 ∗ 𝒇𝒊
𝑺𝟐 = ⇒ 𝑺𝟐 =
𝒏 𝒏
𝑺𝟐 =
( 𝟐𝟕−𝟑𝟎,𝟓𝟓 )𝟐 ∗𝟏 + 𝟐𝟖−𝟑𝟎,𝟓𝟓 𝟐 ∗𝟐+ 𝟐𝟗−𝟑𝟎,𝟓𝟓 𝟐 ∗𝟔+ .......+ 𝟑𝟒−𝟑𝟎,𝟓𝟓 𝟐 ∗𝟏
𝟑𝟑
𝟐 𝟖𝟒,𝟏𝟖𝟐
𝑺 = ⇒ 𝑺𝟐 = 𝟐, 𝟓𝟓
𝟑𝟑
16
1.- Análisis de datos univariados.
Ejercicio N° 2:
Desviación Estándar:
S= 𝑺𝟐 ⇒ S = 𝟐, 𝟓𝟓 ⇒ S = 1,60
17
1.- Análisis de datos univariados.
Ejercicio N° 3:
En una plantación de choclo, se realizó la medición de la altura
de 30 plantas siendo el siguiente resultado (medición en
metros):
1.87 1.64 1.57 1.55 1.68 1.55 1.57 1.66 1.64 1.66
1.65 1.64 1.64 1.72 1.52 1.58 1.56 1.75 1.70 1.70
1.74 1.58 1.75 1.81 1.57 1.72 1.56 1.64 1.64 1.72
Realizar la tabla de distribución de frecuencia por intervalo.
18
1.- Análisis de datos univariados.
Ejercicio N° 3:
1.87 1.64 1.57 1.55 1.68 1.55 1.57 1.66 1.64 1.66
1.65 1.64 1.64 1.72 1.52 1.58 1.56 1.75 1.70 1.70
1.74 1.58 1.75 1.81 1.57 1.72 1.56 1.64 1.64 1.72
Ordenando de menor a mayor:
1,52 1,55 1,55 1,56 1,56 1,57 1,57 1,57 1,58 1,58
1,64 1,64 1,64 1,64 1,64 1,64 1,65 1,66 1,66 1,68
1,70 1,70 1,72 1,72 1,72 1,74 1,75 1,75 1,81 1,87
19
1.- Análisis de datos univariados.
Ejercicio N° 3:
1,52 1,55 1,55 1,56 1,56 1,57 1,57 1,57 1,58 1,58
1,64 1,64 1,64 1,64 1,64 1,64 1,65 1,66 1,66 1,68
1,70 1,70 1,72 1,72 1,72 1,74 1,75 1,75 1,81 1,87
1. Definir el tamaño de la muestra (n). n = 30
2. Determinar los datos de mayor y menor valor Xmax, Xmin.
Xmax = 1,87 ; Xmin = 1,52
3. Calcular el rango o recorrido R = Xmax – Xmin
R = 1,87 – 1,52 = 0,35
20
1.- Análisis de datos univariados.
Ejercicio N° 3:
4. Determinar el número de intervalos o número de clases
(m):
m = 1 + 3,322* log(n)
m = 1 +3,322*log(30) = 1+3,322*1,477 = 5,9
Por lo tanto m = 5 , o sea son 5 intervalos
5. Determinar la amplitud de los intervalos (A):
R 0,35
A > = = 0,07
m 5
Por la tanto, la amplitud de los intervalos será: A = 0,10
0,10 > 0,09 > 0,08 > 0,07
21
1.- Análisis de datos univariados.
Ejercicio N° 3:
6. Calcular el rango ampliado: Ra = m * A
Ra = 5 * 0,10 = 0,50
La amplitud del nuevo rango es de 0,50
7. Establecer la diferencia de amplitud a = Ra - R
a = 0,50 – 0,35 = 0,15
8. Definir límites superior del último intervalo e inferior del
primer intervalo
𝑎
𝑋𝑚𝑖𝑛 − ≈ 𝐿𝐼 Límite inferior del primer intervalo
2
𝑎
𝑋𝑚𝑎𝑥 + ≈ 𝐿𝑆 Límite superior del último intervalo
2
22
1.- Análisis de datos univariados.
Ejercicio N° 3:
Límite inferior del primer intervalo:
0,15
1,52 − = 1,445 ≈ 1,45
2
Límite superior del último intervalo:
0,15
1,87 + = 1,945 ≈ 1,95
2
9. Construcción intervalos (5 intervalos)
1er. Intervalo: 1,45 ⇒ 1,45+ 0,10 = 1,55 (1,45;1,55)
2do. Intervalo: 1,55 ⇒ 1,55+ 0,10 = 1,65 (1,55;1,65)
3er. Intervalo: 1,65 ⇒ 1,65 + 0,10 = 1,75 (1,65;1,75)
4to. Intervalo: 1,75 ⇒ 1,75 + 0,10 = 1,85 (1,75;1,85)
5to. Intervalo: 1,85 ⇒ 1,85 + 0,10 = 1,95 (1,85;1,95)
23
1.- Análisis de datos univariados.
Ejercicio N° 3:
Intervalos Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Absoluta Relativa Relativa
Acumulada Acumulada
1,45 – 1,55 3 3 0,100 0,100
1,55 – 1,65 14 17 0,467 0,567
1,65 – 1,75 11 28 0,367 0,934
1,75 – 1,85 1 29 0,033 0,967
1,85 – 1,95 1 30 0,033 1,000
30 1,000
24
1.- Análisis de datos univariados.
Ejercicio N° 4
En un grupo de estudiantes, se observó la estatura de 30
alumnos y se obtuvieron los siguientes datos (en metros):
1.58 1.64 1.79 1.58 1.64 1.53 1.64 1.66 1.53 1.52
1.76 1.57 1.70 1.74 1.66 1.52 1.85 1.75 1.60 1.66
1.83 1.50 1.90 1.65 1.78 1.68 1.74 1.59 1.77 1.59
Realizar la tabla de distribución por intervalo.
Determinar el resumen de los 5 números.
25
1.- Análisis de datos univariados.
Ejercicio N° 4:
1.58 1.64 1.79 1.58 1.64 1.53 1.64 1.66 1.53 1.52
1.76 1.57 1.70 1.74 1.66 1.52 1.85 1.75 1.60 1.66
1.83 1.50 1.90 1.65 1.78 1.68 1.74 1.59 1.77 1.59
Ordenando de menor a mayor:
1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90
26
1.- Análisis de datos univariados.
Ejercicio N° 4:
1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90
1. Definir el tamaño de la muestra (n). n = 30
2. Determinar los datos de mayor y menor valor Xmax, Xmin.
Xmax = 1,90 ; Xmin = 1,50
3. Calcular el rango o recorrido R = Xmax – Xmin
R = 1,90 – 1,50 = 0,40
27
1.- Análisis de datos univariados.
Ejercicio N° 4:
4. Determinar el número de intervalos (m):
m = 1 + 3,322* log(n)
m = 1 + 3,322*log(30) = 1 + 3,322*1,477 = 5,9
Por lo tanto m = 5 , o sea son intervalos 5.
5. Determinar la amplitud de los intervalos (A):
R 𝑅 0,40
A > ; = = 0,08
m 𝑚 5
Por la tanto, la amplitud de los intervalos será: A = 0,10
0,10 > 0,09 > 0,08
28
1.- Análisis de datos univariados.
Ejercicio N° 4:
6. Calcular el rango ampliado: Ra = m * A
Ra = 5 * 0,10 = 0,50
La amplitud del nuevo rango es de 0,50
7. Establecer la diferencia de amplitud a = Ra – R
a = 0,50 – 0,40 = 0,1
8. Definir límites superior del último intervalo e inferior del
primer intervalo
𝑎
𝑋𝑚𝑖𝑛 − ≈ 𝐿𝐼 Límite inferior del primer intervalo
2
𝑎
𝑋𝑚𝑎𝑥 + ≈ 𝐿𝑆 Límite superior del último intervalo
2
29
1.- Análisis de datos univariados.
Ejercicio N° 4:
Límite inferior del primer intervalo:
0,10
1,50 − = 1,45
2
Límite superior del último intervalo:
0,10
1,90 + = 1,95
2
9. Construcción intervalos (5 intervalos)
1er. Intervalo: 1,45 ⇒ 1,45 + 0,10= 1,55 (1,45;1,55)
2do. Intervalo: 1,55 ⇒ 1,55 + 0,10 = 1,65 (1,55;1,65)
3er. Intervalo: 1,65 ⇒ 1,65 + 0,10 = 1,75 (1,65;1,75)
4to. Intervalo: 1,75 ⇒ 1,75 + 0,10 = 1,85 (1,75;1,85)
5to. Intervalo: 1,85 ⇒ 1,85 + 0,10 = 1,95 (1,85;1,95)
30
1.- Análisis de datos univariados.
Ejercicio N° 4:
Intervalos Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Absoluta Relativa Relativa
Acumulada Acumulada
1,45 – 1,55 5 5 0,167 0,167
1,55 – 1,65 10 15 0,333 0,500
1,65 – 1,75 8 23 0,267 0,767
1,75 – 1,85 6 29 0,200 0,967
1,85 – 1,95 1 30 0,033 1,000
30 1,000
31
1.- Análisis de datos univariados.
Ejercicio N° 4:
1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90
Resumen 5 números
1 1
Q1: 𝑃𝑄1 = 𝑛 + 1 ∗ = 30 + 1 ∗ = 7,75
4 4
1,58 + 1,58
𝑄1 = = 1,58
2
2 1
Q2: 𝑃𝑄2 = 𝑛 + 1 ∗ = 30 + 1 ∗ = 15,5
4 2
1,65 + 1,66
𝑄2 = = 1 , 655
2
32
1.- Análisis de datos univariados.
Ejercicio N° 4:
1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90
Resumen 5 números
3 3
Q3: 𝑃𝑄3 = 𝑛 + 1 ∗ = 30 + 1 ∗ = 23,25
4 4
1,75 + 1,76
𝑄3 = = 1,755
2
𝑋𝑚𝑖𝑛 = 1,50
𝑋𝑚𝑎𝑥 = 1,90
33
1.- Análisis de datos univariados.
Ejercicio N° 4:
Diagrama Boxplot
Xmin=1,50 Q1=1,58 Q2=1,655 Q2=1,755 Xmax=1,90
1,50 1,60 1,70 1,80 1,90
34
1.- Análisis de datos univariados
Ejercicio N° 5
En una plantación de tabaco, se realizó la medición de
crecimiento de 30 plantas, siendo el siguiente resultado:
1,24 1,25 1,28 1,23 1,22 1,26 1,20 1,21
1,22 1,29 1,26 1,27 1,28 1,29 1,22 1,21
1,25 1,30 1,28 1,27 1,23 1,21 1,22 1,30
1,26 1,21 1,27 1,30 1,29 1,28
Construir tabla de distribución de frecuencia, determinar los
cuartiles de la serie de datos y el resumen de los 5 números.
35
1.- Análisis de datos univariados
Ejercicio N° 6
A continuación se presentan 30 observaciones en orden del
tiempo de falla, en horas, de un material aislante eléctrico:
204 228 252 300 324 444 537 624 720 816
912 1093 1176 1296 1392 1488 1512 1710 1923 2105
2321 2520 2693 2856 2980 3192 3321 3451 3528 3710
Determinar:
a) Media aritmética
b) Varianza y desviación estándar
36
1.- Análisis de datos univariados
Ejercicio N° 7
Se desea estudiar la edad de ingreso de los alumnos de una
universidad. Para esto se toma una muestra de 20 alumnos:
17 22 21 23 18 19 19 18 20 21
18 19 21 23 22 18 24 22 23 20
Determinar:
a) Tabla de distribución
b) Media aritmética y mediana
c) Varianza y desviación estándar
37
1.- Análisis de datos univariados
Ejercicio N° 8
La misma universidad, anteriormente citada, está interesada
en la estatura de los 20 estudiantes. La información obtenida
es la siguiente:
1,70 1,86 1,78 1,72 1,65 1,80 1,75 1,74 1,67 1,68
1,68 1,72 1,74 1,69 1,82 1,61 1,73 1,81 1,83 1,85
Determinar:
a) Tabla de distribución (por intervalo)
b) Media aritmética y mediana
c) Varianza y desviación estándar
38