TALLER #1
ESTADISTICA
John Jairo García Rojas - 201820070006
[email protected]
Leonardo Salamanca Polanco- 201820010012
[email protected]
Deivyd Eduardo Sanchez Ruiz- 201820070001
[email protected]
Ingeniería de sistemas
5 semestre
Bogotá D.C
Corporación Universitaria Republicana
30 de ago. de 2020
1. Dar el dominio de cada una de las variables siguientes e indicar si es una variable discreta o continua.
a) Cantidad anual W de bushels de trigo por acre que se producen en una granja.
b) Cantidad N de individuos en una familia.
c) Estado civil de un individuo.
d) Tiempo T de vuelo de un misil.
e) Número P de pétalos que tiene una flor
Solución:
A) El dominio de la variable es igual a 0 en adelante ya que el valor será el mismo será mínimo para los
agrícolas con esto se establece como variable continua.
B) La variables dentro de este se conforman por 1,2,3,4….. ya que si se quiere formar un grupo se debe
tener dos o más componentes, de igual manera la variable es Discreta.
C) El domino se puede considerar como una de las siguientes variables: casado, soltero, separado, viudo,
unión libre y la variable es de tipo discreta
D) Es dominio es 0 , ya que este se dar tanto por el tipo y modelo de misil de los miles que existen y la
variable es continua
E) El dominio que maneja esta es de 0,1,2,3… hasta 8 o mas dependiendo el tipo de flor y su variable es
de tipo discreta.
2)Una variable Y está determinada por una variable X de acuerdo con la ecuación Y = 10 – 4X.
a) Encontrar el valor de Y para X = −3, −2, −1, 0, 1, 2, 3, 4 y 5 y presentar los resultados en una tabla.
b) Encontrar el valor de Y para X = −2.4, −1.6, −0.8, 1.8, 2.7, 3.5 y 4.6.
c) Si Y = F(X) denota que Y depende de X, hallar F (2.8), F (−5), F (√ 2) y F(−π).
d) Dar el valor de X que corresponde a Y = −2, 6, −10, 1.6, 16, 0 y 10.
e) Expresar X explícitamente como función de Y.
Solución:
a)22, 18, 14, 10, 6, 2, −2, −6 y −10
b)19.6, 16.4, 13.2, 2.8, −0.8, −4 y −8.4;
c) −1.2, 30, 10 – 4 √2 = 4.34 aproximadamente y 10 + 4π= 22.57 aproximadamente
d ) 3, 1, 5, 2.1, −1.5, 2.5 y 0;
e) X=1/4 (10 −Y ).
3. En la tabla se presenta una distribución de frecuencias de la cantidad de minutos por semana que ven
televisión 400 estudiantes. De acuerdo con esta tabla, determinar:
a) El límite superior de la quinta clase.
b) El límite inferior de la octava clase.
c) La marca de clase de la séptima clase.
d) Las fronteras de clase de la última clase.
e) El tamaño del intervalo de clase.
f) La frecuencia de la cuarta clase.
g) La frecuencia relativa de la sexta clase.
h) El porcentaje de estudiantes que no ven televisión más de 600 minutos por semana.
i) El porcentaje de estudiantes que ven televisión 900 o más minutos por semana.
j) El porcentaje de estudiantes que ven televisión por lo menos 500 minutos por semana, pero menos de
1 000 minutos por semana.
k) Elaborar un histograma y un polígono de frecuencias para la distribución de frecuencias.
l) Construir una distribución de frecuencias relativas, un histograma de frecuencias relativas y un
polígono de frecuencias relativas.
m) Construir una distribución de frecuencias acumuladas, una distribución acumulada porcentual, una
ojiva y una ojiva porcentual.
Solución:
a) el límite superior de la quinta clase. 799
b) el límite inferior de la octava clase. 1000
c) la marca de clase de la séptima clase. 949.5
d) las fronteras de clase de la última clase. 1100 - 1199
e) el tamaño del intervalo de clase. 99
f) la frecuencia de la cuarta clase. 76
g) la frecuencia relativa de la sexta clase. 0.155
h) el porcentaje de estudiantes que no ven
televisión
más de 600 minutos por semana. 30%
i) el porcentaje de estudiantes que ven
televisión 900 o más minutos por semana. 20%
j) el porcentaje de estudiantes que ven
televisión por lo menos 500 minutos por
semana, pero menos de 1000 minutos por
semana. 78%
K) histograma
Se hace división de los en elemento número de estudiantes con los tiempos para con esto hacer posible
sacar las graficas
TIEMPO (minutos) Yi Numero de estudiantes Ni pi Pi
[300-399) 349.5 14 14 3.50% 3.50%
[400-499) 449.5 46 60 11.50% 15.00%
[500-599) 549.5 58 118 14.50% 29.50%
[600-699) 649.5 76 194 19.00% 48.50%
[700-799) 749.5 68 262 17.00% 65.50%
[800-899) 849.5 62 324 15.50% 81.00%
[900-999) 949.5 48 372 12.00% 93.00%
[1000-1099) 1049.5 22 394 5.50% 98.50%
[1100-1199) 1149.5 6 400 1.50% 100%
Total 400 100%
HISTOGRAMA
80 76
68
70 62
Numero de Estudiantes
58
60
46 48
50
40
30 22 Column C
20 14
10 6
0
[300- [400- [500- [600- [700- [800- [900- [1000- [1100-
399) 499) 599) 699) 799) 899) 999) 1099) 1199)
Intervalos
*un polígono de frecuencias:
I) Construir una distribución de frecuencias relativas, un histograma de frecuencias relativas y un
polígono de frecuencias relativas
un histograma de frecuencias relativas
HISTOGRAMA DE FRECUENCIAS RELATIVAS
20% 19%
17%
16%
Numero de alumnos (ni)
15%
15% 12%
12%
10%
6%
5% 4%
2%
0%
300 - 399 400 - 499 500 - 599 600 - 699 700 - 799 800 - 899 900 - 999 1000 - 1100 -
1099 1199
Minutos por semana
Un poligono de frecuencias relativas.
POLIGONO DE FRECUENCIAS
80
70
Numero de alumnos (ni)
60
50
40
30
20
10
0
300 - 399 400 - 499 500 - 599 600 - 699 700 - 799 800 - 899 900 - 999 1000 - 1100 -
1099 1199
Minutos por semana
m) Construir una distribución de frecuencias acumuladas, una distribución acumulada porcentual, una
ojiva y una ojiva porcentual.
Frecuencias acumuladas y porcentuales
Número de
TIEMPO (minutos) Yi estudiantes Ni pi Pi
(ni)
[300-399) 349.5 14 14 3.50% 3.50%
[400-499) 449.5 46 60 11.50% 15.00%
[500-599) 549.5 58 118 14.50% 29.50%
[600-699) 649.5 76 194 19.00% 48.50%
[700-799) 749.5 68 262 17.00% 65.50%
[800-899) 849.5 62 324 15.50% 81.00%
[900-999) 949.5 48 372 12.00% 93.00%
[1000-1099) 1049.5 22 394 5.50% 98.50%
[1100-1199) 1149.5 6 400 1.50% 100%
Total 400 100%
Ojiva
OJIVA DE FRECUENCIAS
450
394 400
400 372 394 400
372
350 324
324
300
Frecuencia Acumulada
262
250 262
194
200 194
150 118
118
100 60
50 60
14
0 14
[300-399) [400-499) [500-599) [600-699) [700-799) [800-899) [900-999) [1000- [1100-
1099) 1199)
Intervalos
ojiva porcentual
TRABAJO DE APLICACIÓN (3.5)
1. Dentro de las bases de datos sugeridas del curso, busque una serie de datos de una variable a
través del tiempo. Esta serie debe contener por lo menos 200 elementos.
2. Presente una introducción del estudio de esa variable, en dicha introducción debe hablar de su
definición, su importancia, su dominio y forma de medición.
3. Organice los datos en las clases que considere pertinentes, esta organización debe estar
debidamente justificada. Con base en esta organización, realice una distribución de frecuencias
absolutas, relativas, acumuladas y relativas acumuladas.
4. Con base en las distribuciones, realice un histograma de frecuencias y una ojiva. Con base en
los puntos 3 y 4, presente por lo menos tres conclusiones.
5. Calcule los diferentes tipos de promedios sobre la serie de datos, así como las demás medidas de
tendencia central. Defina qué promedio es el más apropiado para la serie de datos y justifique
teóricamente su respuesta.
6. Identifique los cuatro cuartiles de la serie de datos, escriba una conclusión para cada uno de
ellos.
7. Con base en la información de la variable, identifique el punto a partir del cual ésta se pudiera
considerar como “positiva” o “favorable”. Con base en esta información, describa qué
proporción de los datos son “positivos” o “favorables”. Escriba por lo menos tres conclusiones
de este análisis.
8. Calcule las medidas de dispersión de la serie de datos, rango, rango intercuartílico, varianza,
desviación estándar, coeficiente de variación. Escriba por lo menos tres conclusiones.
9. Con base en los datos anteriores identifique por lo menos tres datos extremos, que estén a más
de 2.5 desviaciones estándar del promedio. Explique, con base en información de la variable a
qué se debe cada uno de ellos.
10. Escriba por lo menos cinco conclusiones generales del trabajo de aplicación.
Solución:
TALLER PUNTO
4.xlsx