0% encontró este documento útil (0 votos)
200 vistas38 páginas

Ejercicio Unidad 1

Este documento presenta tres ejercicios sobre análisis univariado de datos. El primer ejercicio calcula estadísticos descriptivos como media, mediana, varianza y desviación estándar para un conjunto de datos. El segundo ejercicio construye una tabla de frecuencias y calcula estadísticos adicionales. El tercer ejercicio inicia el proceso de construir una tabla de frecuencias por intervalos para datos de altura de plantas de choclo.

Cargado por

Dario Espinoza
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
200 vistas38 páginas

Ejercicio Unidad 1

Este documento presenta tres ejercicios sobre análisis univariado de datos. El primer ejercicio calcula estadísticos descriptivos como media, mediana, varianza y desviación estándar para un conjunto de datos. El segundo ejercicio construye una tabla de frecuencias y calcula estadísticos adicionales. El tercer ejercicio inicia el proceso de construir una tabla de frecuencias por intervalos para datos de altura de plantas de choclo.

Cargado por

Dario Espinoza
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 38

1.- Análisis de datos univariados.

Ejercicio N° 1:
Se tiene la siguiente serie de datos que representan la edad de
un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

Determinar:
a) Media Aritmética y mediana
b) Varianza y desviación estándar
c) Resumen de cinco números y boxplot.

1
1.- Análisis de datos univariados.

1.- ORDENAR LOS DATOS

Para calcular los parámetros estadístico, lo primero es ordenar


la distribución, desde el dato de menor valor al de mayor valor:

20 23 24 24 24 25 29 31 31 33

34 36 36 37 39 39 40 40 41 45

2
1.- Análisis de datos univariados.

2.- Calcular la media aritmética

Para calcular la media aritmética se utiliza la siguiente formula:

𝒙𝟏 + 𝒙𝟐 + ....+ 𝒙𝒊 + …+ 𝒙𝒏
𝒙=
𝒏

𝟐𝟎 + 𝟐𝟑 + 𝟐𝟒 + 𝟐𝟒 + 𝟐𝟒 + 𝟐𝟓 + 𝟐𝟗 + 𝟑𝟏 + 𝟑𝟏 + 𝟑𝟑 + 𝟑𝟒 + 𝟑𝟔 + 𝟑𝟔 + 𝟑𝟕 + 𝟑𝟗 + 𝟑𝟗 + 𝟒𝟎 + 𝟒𝟎 + 𝟒𝟏 + 𝟒𝟓
𝒙=
𝟐𝟎

𝟔𝟓𝟏
𝒙= = 𝟑𝟐, 𝟓𝟓
𝟐𝟎

3
1.- Análisis de datos univariados.

3.- Cálculo de la mediana


La posición de la mediana se calcula de acuerdo a la siguiente
expresión:
𝒏+𝟏
𝑷𝑴𝒅 =
𝟐
𝟐𝟎+𝟏 𝟐𝟏
𝑷𝑴𝒅 = = = 𝟏𝟎, 𝟓 (Posición)
𝟐 𝟐

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Posición: 10,5

Valor: (33 +34)/ 2 = 33,5

4
1.- Análisis de datos univariados.

4.- Varianza

Para calcular la varianza debemos utilizar la siguiente formula:


( 𝒙𝒊 − 𝒙 )𝟐
𝝈𝟐 =
𝒏

20 − 32,55 2 + 23 − 32,55 2 + 24 − 32,55 2 + … . + 45 − 32,55 2


𝜎2 =
20

1.008,95
𝜎2 = = 50,45
20

5
1.- Análisis de datos univariados.

5.- Desviación estándar

Para Calcular la desviación estándar utilizaremos la siguiente


formula:

( 𝒙𝒊 − 𝒙 )𝟐
𝝈= 𝝈𝟐 =
𝒏

𝜎= 50,45 = 7,10

6
1.- Análisis de datos univariados.

6.- Cálculo de los cuartiles


Q1, el cuartil Primero es el valor mayor que el 25% de los
valores de la distribución. Como N = 20 resulta que la posición
de Q1 esta dado por: (N+1)/4 = 5,25; el primer cuartil es la
media aritmética de entre dichos valores y es el siguiente:

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Posición 5,25

Valor de Q1: Q1 = (24 + 25) / 2 = 24,5

7
1.- Análisis de datos univariados.

Q2, el Segundo Cuartil es, evidentemente, la mediana de la


distribución, es el valor de la variable que ocupa el lugar
central en un conjunto de datos ordenados. Como (N+1)/2 =
10,5 ; la mediana es la media aritmética de dicho valor y el
siguiente:

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Posición: 10,5

me= Q2 = (33 + 34)/ 2 =33,5

8
1.- Análisis de datos univariados.

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los


valores de la distribución. En nuestro caso, como 3(N+1)/4 =
15,75, resulta

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Posición: 15,75

Valor de Q3=(39 + 39) / 2 = 39

9
1.- Análisis de datos univariados.

7.- Resumen 5 números

Xmín = 20
Q1 = 24,5
Q2 = 33,5
Q3 = 39
Xmáx = 45

10
1.- Análisis de datos univariados.
8.- Diagrama Boxplot

Xmin=20 Q1=24,5 Q2=33,5 Q3=39 Xmax=45

20 25 30 35 40 45

Rango intercuartílico = Q3 – Q1 = 39 – 24,5 = 14,5

Rango o Recorrido = Xmax – Xmin = 45 – 20 = 25

11
1.- Análisis de datos univariados.

Ejercicio N° 2:
Para los siguientes datos, construir una tabla distribución de
frecuencias. Además, determinar media aritmética, su varianza
y desviación estándar.

32, 31, 28, 29, 33, 32, 31, 30, 31, 32, 31,
27, 28, 29, 30, 31, 32, 31, 30, 29, 30, 32,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

12
1.- Análisis de datos univariados.

Ejercicio N° 2:
32, 31, 28, 29, 33, 32, 31, 30, 31, 32, 31,
27, 28, 29, 30, 31, 32, 31, 30, 29, 30, 32,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
Ordenando los datos de menor a mayor:
27, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30,
30, 30, 30, 30, 30, 31, 31, 31, 31, 31, 31,
31, 31, 32, 32, 32, 32, 32, 33, 33, 33, 34

13
1.- Análisis de datos univariados.

Ejercicio N° 2: Tabla de Distribución de Frecuencia


Frecuencia Frec. Absol. Frecuencia Frec. Relat.
Valor
Absoluta Acumulada Relativa Acumulada
27 1 1 0,030 0,030
28 2 2+1=3 0,061 0,091
29 6 6 + 3= 9 0,182 0,273
30 7 7 + 9= 16 0,212 0,485
31 8 8 + 16= 24 0,242 0,727
32 5 5 + 24= 29 0,152 0,879
33 3 3 + 29= 32 0,091 0,970
34 1 1 + 32= 33 0,030 1,000
Total 33 1,000

14
1.- Análisis de datos univariados.

Ejercicio N° 2:
Media aritmética:
𝑿𝒊 𝑿𝒊 ∗ 𝒇𝒊
𝒙= ⇒𝒙=
𝒏 𝒏

𝟐𝟕 ∗ 𝟏 + 𝟐𝟖 ∗ 𝟐 + 𝟐𝟗 ∗ 𝟔 + 𝟑𝟎 ∗ 𝟕 + 𝟑𝟏 ∗ 𝟖 + 𝟑𝟐 ∗ 𝟓 + 𝟑𝟑 ∗ 𝟑 + 𝟑𝟒 ∗ 𝟏
𝒙=
𝟑𝟑

𝟏𝟎𝟎𝟖
𝒙= = 𝟑𝟎, 𝟓𝟓
𝟑𝟑

15
1.- Análisis de datos univariados.

Ejercicio N° 2:
Varianza:
(𝒙𝒊 − 𝒙 )𝟐 (𝒙𝒊 − 𝒙 )𝟐 ∗ 𝒇𝒊
𝑺𝟐 = ⇒ 𝑺𝟐 =
𝒏 𝒏

𝑺𝟐 =
( 𝟐𝟕−𝟑𝟎,𝟓𝟓 )𝟐 ∗𝟏 + 𝟐𝟖−𝟑𝟎,𝟓𝟓 𝟐 ∗𝟐+ 𝟐𝟗−𝟑𝟎,𝟓𝟓 𝟐 ∗𝟔+ .......+ 𝟑𝟒−𝟑𝟎,𝟓𝟓 𝟐 ∗𝟏
𝟑𝟑

𝟐 𝟖𝟒,𝟏𝟖𝟐
𝑺 = ⇒ 𝑺𝟐 = 𝟐, 𝟓𝟓
𝟑𝟑

16
1.- Análisis de datos univariados.

Ejercicio N° 2:
Desviación Estándar:

S= 𝑺𝟐 ⇒ S = 𝟐, 𝟓𝟓 ⇒ S = 1,60

17
1.- Análisis de datos univariados.

Ejercicio N° 3:
En una plantación de choclo, se realizó la medición de la altura
de 30 plantas siendo el siguiente resultado (medición en
metros):
1.87 1.64 1.57 1.55 1.68 1.55 1.57 1.66 1.64 1.66
1.65 1.64 1.64 1.72 1.52 1.58 1.56 1.75 1.70 1.70
1.74 1.58 1.75 1.81 1.57 1.72 1.56 1.64 1.64 1.72

Realizar la tabla de distribución de frecuencia por intervalo.

18
1.- Análisis de datos univariados.

Ejercicio N° 3:
1.87 1.64 1.57 1.55 1.68 1.55 1.57 1.66 1.64 1.66
1.65 1.64 1.64 1.72 1.52 1.58 1.56 1.75 1.70 1.70
1.74 1.58 1.75 1.81 1.57 1.72 1.56 1.64 1.64 1.72

Ordenando de menor a mayor:


1,52 1,55 1,55 1,56 1,56 1,57 1,57 1,57 1,58 1,58
1,64 1,64 1,64 1,64 1,64 1,64 1,65 1,66 1,66 1,68
1,70 1,70 1,72 1,72 1,72 1,74 1,75 1,75 1,81 1,87

19
1.- Análisis de datos univariados.

Ejercicio N° 3:
1,52 1,55 1,55 1,56 1,56 1,57 1,57 1,57 1,58 1,58
1,64 1,64 1,64 1,64 1,64 1,64 1,65 1,66 1,66 1,68
1,70 1,70 1,72 1,72 1,72 1,74 1,75 1,75 1,81 1,87

1. Definir el tamaño de la muestra (n). n = 30

2. Determinar los datos de mayor y menor valor Xmax, Xmin.


Xmax = 1,87 ; Xmin = 1,52

3. Calcular el rango o recorrido R = Xmax – Xmin


R = 1,87 – 1,52 = 0,35

20
1.- Análisis de datos univariados.

Ejercicio N° 3:
4. Determinar el número de intervalos o número de clases
(m):
m = 1 + 3,322* log(n)
m = 1 +3,322*log(30) = 1+3,322*1,477 = 5,9
Por lo tanto m = 5 , o sea son 5 intervalos
5. Determinar la amplitud de los intervalos (A):
R 0,35
A > = = 0,07
m 5
Por la tanto, la amplitud de los intervalos será: A = 0,10
0,10 > 0,09 > 0,08 > 0,07

21
1.- Análisis de datos univariados.

Ejercicio N° 3:
6. Calcular el rango ampliado: Ra = m * A
Ra = 5 * 0,10 = 0,50
La amplitud del nuevo rango es de 0,50
7. Establecer la diferencia de amplitud a = Ra - R
a = 0,50 – 0,35 = 0,15
8. Definir límites superior del último intervalo e inferior del
primer intervalo
𝑎
𝑋𝑚𝑖𝑛 − ≈ 𝐿𝐼 Límite inferior del primer intervalo
2
𝑎
𝑋𝑚𝑎𝑥 + ≈ 𝐿𝑆 Límite superior del último intervalo
2

22
1.- Análisis de datos univariados.

Ejercicio N° 3:
Límite inferior del primer intervalo:
0,15
1,52 − = 1,445 ≈ 1,45
2
Límite superior del último intervalo:
0,15
1,87 + = 1,945 ≈ 1,95
2
9. Construcción intervalos (5 intervalos)
1er. Intervalo: 1,45 ⇒ 1,45+ 0,10 = 1,55 (1,45;1,55)
2do. Intervalo: 1,55 ⇒ 1,55+ 0,10 = 1,65 (1,55;1,65)
3er. Intervalo: 1,65 ⇒ 1,65 + 0,10 = 1,75 (1,65;1,75)
4to. Intervalo: 1,75 ⇒ 1,75 + 0,10 = 1,85 (1,75;1,85)
5to. Intervalo: 1,85 ⇒ 1,85 + 0,10 = 1,95 (1,85;1,95)
23
1.- Análisis de datos univariados.

Ejercicio N° 3:

Intervalos Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta Absoluta Relativa Relativa
Acumulada Acumulada
1,45 – 1,55 3 3 0,100 0,100
1,55 – 1,65 14 17 0,467 0,567
1,65 – 1,75 11 28 0,367 0,934
1,75 – 1,85 1 29 0,033 0,967
1,85 – 1,95 1 30 0,033 1,000
30 1,000

24
1.- Análisis de datos univariados.

Ejercicio N° 4
En un grupo de estudiantes, se observó la estatura de 30
alumnos y se obtuvieron los siguientes datos (en metros):

1.58 1.64 1.79 1.58 1.64 1.53 1.64 1.66 1.53 1.52
1.76 1.57 1.70 1.74 1.66 1.52 1.85 1.75 1.60 1.66
1.83 1.50 1.90 1.65 1.78 1.68 1.74 1.59 1.77 1.59

Realizar la tabla de distribución por intervalo.


Determinar el resumen de los 5 números.

25
1.- Análisis de datos univariados.

Ejercicio N° 4:
1.58 1.64 1.79 1.58 1.64 1.53 1.64 1.66 1.53 1.52
1.76 1.57 1.70 1.74 1.66 1.52 1.85 1.75 1.60 1.66
1.83 1.50 1.90 1.65 1.78 1.68 1.74 1.59 1.77 1.59

Ordenando de menor a mayor:


1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90

26
1.- Análisis de datos univariados.

Ejercicio N° 4:
1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90

1. Definir el tamaño de la muestra (n). n = 30


2. Determinar los datos de mayor y menor valor Xmax, Xmin.
Xmax = 1,90 ; Xmin = 1,50

3. Calcular el rango o recorrido R = Xmax – Xmin


R = 1,90 – 1,50 = 0,40

27
1.- Análisis de datos univariados.

Ejercicio N° 4:
4. Determinar el número de intervalos (m):
m = 1 + 3,322* log(n)
m = 1 + 3,322*log(30) = 1 + 3,322*1,477 = 5,9
Por lo tanto m = 5 , o sea son intervalos 5.
5. Determinar la amplitud de los intervalos (A):
R 𝑅 0,40
A > ; = = 0,08
m 𝑚 5
Por la tanto, la amplitud de los intervalos será: A = 0,10
0,10 > 0,09 > 0,08

28
1.- Análisis de datos univariados.

Ejercicio N° 4:
6. Calcular el rango ampliado: Ra = m * A
Ra = 5 * 0,10 = 0,50
La amplitud del nuevo rango es de 0,50
7. Establecer la diferencia de amplitud a = Ra – R
a = 0,50 – 0,40 = 0,1
8. Definir límites superior del último intervalo e inferior del
primer intervalo
𝑎
𝑋𝑚𝑖𝑛 − ≈ 𝐿𝐼 Límite inferior del primer intervalo
2
𝑎
𝑋𝑚𝑎𝑥 + ≈ 𝐿𝑆 Límite superior del último intervalo
2

29
1.- Análisis de datos univariados.

Ejercicio N° 4:
Límite inferior del primer intervalo:
0,10
1,50 − = 1,45
2
Límite superior del último intervalo:
0,10
1,90 + = 1,95
2
9. Construcción intervalos (5 intervalos)
1er. Intervalo: 1,45 ⇒ 1,45 + 0,10= 1,55 (1,45;1,55)
2do. Intervalo: 1,55 ⇒ 1,55 + 0,10 = 1,65 (1,55;1,65)
3er. Intervalo: 1,65 ⇒ 1,65 + 0,10 = 1,75 (1,65;1,75)
4to. Intervalo: 1,75 ⇒ 1,75 + 0,10 = 1,85 (1,75;1,85)
5to. Intervalo: 1,85 ⇒ 1,85 + 0,10 = 1,95 (1,85;1,95)
30
1.- Análisis de datos univariados.

Ejercicio N° 4:

Intervalos Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta Absoluta Relativa Relativa
Acumulada Acumulada
1,45 – 1,55 5 5 0,167 0,167
1,55 – 1,65 10 15 0,333 0,500
1,65 – 1,75 8 23 0,267 0,767
1,75 – 1,85 6 29 0,200 0,967
1,85 – 1,95 1 30 0,033 1,000
30 1,000

31
1.- Análisis de datos univariados.

Ejercicio N° 4:
1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90
Resumen 5 números
1 1
Q1: 𝑃𝑄1 = 𝑛 + 1 ∗ = 30 + 1 ∗ = 7,75
4 4
1,58 + 1,58
𝑄1 = = 1,58
2
2 1
Q2: 𝑃𝑄2 = 𝑛 + 1 ∗ = 30 + 1 ∗ = 15,5
4 2
1,65 + 1,66
𝑄2 = = 1 , 655
2
32
1.- Análisis de datos univariados.

Ejercicio N° 4:
1,50 1,52 1,52 1,53 1,53 1,57 1,58 1,58 1,59 1,59
1,60 1,64 1,64 1,64 1,65 1,66 1,66 1,66 1,68 1,70
1,74 1,74 1,75 1,76 1,77 1,78 1,79 1,83 1,85 1,90
Resumen 5 números
3 3
Q3: 𝑃𝑄3 = 𝑛 + 1 ∗ = 30 + 1 ∗ = 23,25
4 4
1,75 + 1,76
𝑄3 = = 1,755
2
𝑋𝑚𝑖𝑛 = 1,50
𝑋𝑚𝑎𝑥 = 1,90

33
1.- Análisis de datos univariados.

Ejercicio N° 4:
Diagrama Boxplot

Xmin=1,50 Q1=1,58 Q2=1,655 Q2=1,755 Xmax=1,90

1,50 1,60 1,70 1,80 1,90

34
1.- Análisis de datos univariados

Ejercicio N° 5
En una plantación de tabaco, se realizó la medición de
crecimiento de 30 plantas, siendo el siguiente resultado:

1,24 1,25 1,28 1,23 1,22 1,26 1,20 1,21


1,22 1,29 1,26 1,27 1,28 1,29 1,22 1,21
1,25 1,30 1,28 1,27 1,23 1,21 1,22 1,30
1,26 1,21 1,27 1,30 1,29 1,28

Construir tabla de distribución de frecuencia, determinar los


cuartiles de la serie de datos y el resumen de los 5 números.

35
1.- Análisis de datos univariados

Ejercicio N° 6
A continuación se presentan 30 observaciones en orden del
tiempo de falla, en horas, de un material aislante eléctrico:
204 228 252 300 324 444 537 624 720 816
912 1093 1176 1296 1392 1488 1512 1710 1923 2105
2321 2520 2693 2856 2980 3192 3321 3451 3528 3710

Determinar:
a) Media aritmética
b) Varianza y desviación estándar

36
1.- Análisis de datos univariados

Ejercicio N° 7
Se desea estudiar la edad de ingreso de los alumnos de una
universidad. Para esto se toma una muestra de 20 alumnos:

17 22 21 23 18 19 19 18 20 21
18 19 21 23 22 18 24 22 23 20

Determinar:
a) Tabla de distribución
b) Media aritmética y mediana
c) Varianza y desviación estándar

37
1.- Análisis de datos univariados

Ejercicio N° 8
La misma universidad, anteriormente citada, está interesada
en la estatura de los 20 estudiantes. La información obtenida
es la siguiente:

1,70 1,86 1,78 1,72 1,65 1,80 1,75 1,74 1,67 1,68
1,68 1,72 1,74 1,69 1,82 1,61 1,73 1,81 1,83 1,85

Determinar:
a) Tabla de distribución (por intervalo)
b) Media aritmética y mediana
c) Varianza y desviación estándar

38

También podría gustarte