Ejercicios propuestos:
1. El jefe del departamento de aguas de una ciudad desea establecer una relación entre el
consumo mensual domiciliario de agua Y, y el tamaño de las familias X, Dados los datos
muestrales, determine:
Tamaño de Galones de
familia agua
2 650
7 1200
9 1300
4 430
12 1400
6 900
9 1800
3 640
3 793
2 925
a) Elabora el diagrama de dispersión. / d) Traza la línea estimada en el diagrama de
dispersión.
Relacion entre tamaño de familia y
consumo de galones de agua
2000
y = 96.692x + 452.66
Galones de agua
1500
1000
500
0
0 2 4 6 8 10 12 14
Tamaño de la familia
y Pronóstico y Lineal (Pronóstico y)
b) Calcula la pendiente y ordenada al origen.
Datos
ȳ 1003.8
ẋ 5.7
b= 96.969
a= 451.0767
c) Obtener la ecuación que mejor se ajusta a los datos.
Ecuación mejor ajustada
y=451.1+96.9(5.7)
y= 1003.8
e) Calcula el error estándar de estimación/ f) Calcula el coeficiente de determinación. / g)
Determina el coeficiente de correlación.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.803526632
Coeficiente de determinación R^2 0.645655048
R^2 ajustado 0.601361929
Error típico 263.3122296
Observaciones 10
h) Determina el intervalo de confianza al 99%.
2
ȳ=1003±3.355(263.31/√10)
723.9649≤ 𝑦𝑐 ≤1282.0351
2. El gerente de una compañía de seguros desea establecer la relación entre el seguro de vida de
las personas Y, y sus salarios X. Realice una regresión con los datos muestrales:
Salario Anual Seguro de vida
10 50
29 80
30 100
31 130
36 150
a) Elabora el diagrama de dispersión. / d) Traza la línea estimada en el diagrama de
dispersión.
Relacion entre el seguro de vida y
el salario de las personas.
y = 3.4554x + 8.014
200
Seguro de vida
100
0
0 10 20 30 40
Salario anual
Y Pronóstico Y Lineal (Pronóstico Y)
b) Calcula la pendiente y ordenada al origen.
ȳ= 102
x= 27.2
b= 3.455
a= 8.024
c) Obtener la ecuación que mejor se ajusta a los datos.
Ecuación que mejor se ajusta y=3.455(27.2)+8.024
y= 102
e) Calcula el error estándar de estimación. / f) Calcula el coeficiente de determinación. / g)
Determina el coeficiente de correlación.
Estadísticas de la regresión
Coeficiente de 0.87074667
correlación múltiple
Coeficiente de 0.75819976
determinación R^2
R^2 ajustado 0.67759968
Error típico 22.4981889
Observaciones 5
h) Determina el intervalo de confianza al 90%.
2
Yc=102±2.353(22.49/ √5)
79.3474≤ 𝑦𝑐 ≤124.6526
3. Un economista desea establecer la relación entre la tasa de desempleo Y, y la tasa de
cuentas vencidas de la Tesorerías, Determine la regresión y correlación con los datos
muestrales.
C. vencidas T. desempleo
9.7 6.7
9.8 7.3
7.6 8.9
6.1 9.1
10.2 7.2
12.7 5.2
14.3 6.9
7.9 6.9
8.9 7.1
1. Elabora el diagrama de dispersión. / 4. Traza la línea estimada en el diagrama de
dispersión.
Relacion entre la tasas de desempleo
y las cuentas vencidas en tesoreria
10
Tasa de desempleo
8
6
y = -0.332x + 10.472
4
2
0
0 2 4 6 8 10 12 14 16
tasa de cuentas vencidas en la tesoreri a
Y Pronóstico Y Lineal (Pronóstico Y)
2. Calcula la pendiente y ordenada al origen.
ȳ= 7.25555556
ẋ= 9.68888889
b= -0.328
a= 10.355
3. Obtener la ecuación que mejor se ajusta a los datos.
Ecuación que mejor se ajusta y=10.355+(-0.328)(9.688)
y= 7.177044444
5. Calcula el error estándar de estimación.
6. Calcula el coeficiente de determinación.
7. Determina el coeficiente de correlación.
Estadísticas de la regresión
Coeficiente de correlación 0.722115376
múltiple
Coeficiente de determinación 0.521450616
R^2
R^2 ajustado 0.453086418
Error típico 0.864111659
Observaciones 9
8. Determina el intervalo de confianza al 95%.
2
Yc=7.255±2.365(0.8641/√9)
6.5738≤ 𝑦𝑐 ≤7.93612
4. Un director de ventas desea establecer la relación entre las ventas del segundo año de
vendedores Y, y sus ventas del primer año X. Realice un análisis de regresión.
Primer año Segundo
año
170 69
133 75
86 86
161 111
112 129
133 133
a) Elabora el diagrama de dispersión. / d) Traza la línea estimada en el diagrama de
dispersión.
Relacion entre las ventas del
primer y segundo año
ventas del seundo año de vendedores
y = -0.1642x + 122.26
150
100
50
0
0 50 100 150 200
ventas del primer año
y Pronóstico y Lineal (Pronóstico y)
b) Calcula la pendiente y ordenada al origen.
y= 100.5
x= 132.5
b= -0.165
a= 122.362
c) Obtener la ecuación que mejor se ajusta a los datos.
Ecuación que mejor se ajusta y=122.362+(-0.165)(132.5)
y= 100.4995
e) Calcula el error estándar de estimación.
f) Calcula el coeficiente de determinación.
g) Determina el coeficiente de correlación.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.18383526
Coeficiente de determinación R^2 0.0337954
R^2 ajustado -0.20775575
Error típico 30.4220845
Observaciones 6
h) Determina el intervalo de confianza al 95%.
2
Yc=100.5±2.447(30.422/√8)
74.1798≤ 𝑦𝑐 ≤126.8202
5. Un gerente de comercialización desea establecer la relación entre las ventas Y, y el precio de un
producto similar fabricado por la competencia X, Realice un análisis de correlación.
P. de Ventas
competencia
13 520
13 550
15 600
15 610
16 620
21 724
21 680
14 300
40 962
12 270
1. Elabora el diagrama de dispersión. / 4. Traza la línea estimada en el diagrama de
dispersión.
Relacion entre las ventas y precio de un
1500
producto
1000
ventas
y = 19.706x + 228.89
500
0
0 10 20 30 40 50
precio de competencia
y Pronóstico y Lineal (Pronóstico y)
2. Calcula la pendiente y ordenada al origen.
y= 583.6
x= 18
b= 19.7
a= 228.89
3. Obtener la ecuación que mejor se ajusta a los datos.
Ecuación que más se ajusta y=228.89+19.7(18)
y= 583.49
5. Calcula el error estándar de estimación.
6. Calcula el coeficiente de determinación.
7. Determina el coeficiente de correlación.
Estadísticas de la regresión
Coeficiente de correlación 0.82354015
múltiple
Coeficiente de determinación 0.67821837
R^2
R^2 ajustado 0.63799567
Error típico 120.070977
Observaciones 10
8. Determina el intervalo de confianza al 99%.
Yc=583.6±3.355(120.0709/ 2√10)
455.6084≤ 𝑦𝑐 ≤710.9916
6. Se hizo una encuesta a una muestra de 10 los estudiantes de 3er. Semestre de la carrera de Lic.
En administración del grupo 1301 del semestre 2009-1 y se encontraron los siguientes datos:
Estudiante Altura Peso
1 1.5 48
2 1.54 50
3 1.6 52
4 1.72 70
5 1.8 72
6 1.5 50
7 1.61 57
8 1.54 54
9 1.63 80
10 1.7 62
a) Elabora el diagrama de dispersión. / d) Traza la línea estimada en el diagrama de
dispersión.
Relacion Peso/altura de los
estudiantes
2
y = 0.0069x + 1.2023
1.5
Altura
0.5
0
0 20 40 60 80 100
Peso
Y Pronóstico Y Lineal (Pronóstico Y)
b) Calcula la pendiente y ordenada al origen.
y= 59.5
x= 1.614
b= 83
a= -74.9
c) Obtener la ecuación que mejor se ajusta a los datos.
Ecuación que más se ajusta y=-74.9+83(1.614)
y= 59.062
e) Calcula el error estándar de estimación.
f) Calcula el coeficiente de determinación.
g) Determina el coeficiente de correlación.
Estadísticas de la regresión
Coeficiente de correlación 0.761646785
múltiple
Coeficiente de determinación 0.580105825
R^2
R^2 ajustado 0.527619053
Error típico 0.068973915
Observaciones 10
h) Determina el intervalo de confianza al 95%.
Yc=59.5±2.306(0.0689/ 2√10)
59.4498≤ 𝑦𝑐 ≤59.6
7. Los datos siguientes muestran las ventas (en miles de cajas) y los costos de
un anuncio publicitario para la televisión (en millones de pesos) para 7 marcas
principales de refrescos.
Marca Publicidad Ventas
X Y
Coca-Cola 13 19.3
Pepsi 9.4 13.8
Sprite 6.4 8.4
Diet coke 5.7 5.5
7-Up 4.2 5.9
Jarritos 2.9 5.3
Boing 1.6 2.5
a) ¿Dibuje el diagrama de dispersión, que parece indicar este diagrama
acerca de la relación entre las dos variables?
b) Trace una recta que pase por los datos, para aproximar una relación
lineal entre los gastos del anuncio y las ventas.
Relacion entre publicidad y ventas
25
y = 1.4575x - 0.3233
20
15
Ventas
10
0
0 2 4 6 8 10 12 14
Publicidad
Y Pronóstico Y Lineal (Pronóstico Y)
c) Aplique el método de los cuadrados mínimos para plantear la ecuación
estimada de regresión.
y= 8.67142857
x= 6.17142857
b= 1.4575
a= -0.3233
Ecuación estimada: −0.3233 + 1.4575(6.17) = 8.6714
d) Prediga las ventas para una marca que decida gastar $7 millones de
pesos en un anuncio publicitario.
e) Calcule el error estándar en la regresión.
f) Calcule el coeficiente de determinación y correlación e interprételos.
Estadísticas de la regresión
Coeficiente de 0.97703868
correlación múltiple
Coeficiente de 0.954604583
determinación R^2
R^2 ajustado 0.9455255
Error típico 1.369358245
Observaciones 7
g) Determina el intervalo de confianza al 95%.
2
Yc= 8.67±2.571(1.3693/√7)
7.339≤ 𝑦𝑐 ≤ 10
h) Determina el intervalo de predicción 95%
8. La revista del consumidor público en su número 381 del mes de noviembre del 2008 la siguiente
información acerca del uso de los teléfonos celulares:
Año Usuarios(miles)
2000 1628
2001 1728
2002 2006
2003 2029
2004 2508
2005 3268
2006 4035
2007 5199
a) Trace un diagrama de dispersión para estos datos, c) Trace una recta que pase por los
datos, para aproximar una relación lineal entre la altura y el peso.
Relacion de años con usuarios
de celulares
y = 485.68x - 970257
6000
Usuarios(miles)
4000
2000
0
1998 2000 2002 2004 2006 2008
Años
y Pronóstico y Lineal (Pronóstico y)
b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.
y= 2800.125
x= 2003.5
b= 485.67
a= -970257
Ecuación que más se ajusta y=-970257+485.67(2003.5
y= 2782.845
d) Prediga cuantos usuarios compraran tiempo aire para su teléfono
celular para el año 2009.
Para el año 2009, los usuarios que compraran tiempo aire para sus celulares serian:
y=-970257+485.67 (2003.5
y= 2782.845 usuarios.
e) Calcule el error estándar en la regresión.
f) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.
Estadísticas de la regresión
Coeficiente de correlación 0.935003912
múltiple
Coeficiente de 0.874232315
determinación R^2
R^2 ajustado 0.853271035
Error típico 487.3815302
Observaciones 8
9. Un vendedor de Century 21 desea establecer la relación entre el tiempo en meses que están a la
venta los departamentos antes de lograr su venta y el precio pedido por ellos. Los datos de una
muestra de 9 departamentos se muestran a continuación:
Meses Precio
6.5 800
7 1000
8.6 990
12.1 1250
9 1400
9.5 1100
8.6 990
10.6 990
15 1250
a) Trace un diagrama de dispersión para estos datos,
Relacion de precio por meses de
venta
y = 41.947x + 680.53
1500
1000
Precio
500
0
0 5 10 15 20
Meses de venta
y Pronóstico y Lineal (Pronóstico y)
b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.
y= 1085.55556
x= 9.65555556
b= 42.13
a= 679.3
Ecuación estimada:
Ecuación estimada: y=679.3+42.13(9.65)
Y= 1086.08856
d) Calcule el error estándar en la regresión.
e) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.
Estadísticas de la regresión
Coeficiente de correlación 0.599997589
múltiple
Coeficiente de determinación 0.359997106
R^2
R^2 ajustado 0.268568122
Error típico 156.9490371
Observaciones 9
f) Determina el intervalo de confianza al 95%.
156.94
Yc=1085.55±2.365( 2 )
√9
961.829 ≤ 𝑦𝑐 ≤ 1209.271
10. El Organismo Operador de agua en el Municipio de Cuautitlán Izcalli OPERAGUA quiere
conocer la relación entre en consumo mensual domiciliario de agua y el tamaño de las familias,
toma una muestra de 10 familias elegidas al azar y encuentra los siguientes datos:
Metros Tamaño
consumidos Familia
65 2
120 7
130 9
43 4
140 12
90 6
180 9
64 3
79 3
92 4
a) Trace un diagrama de dispersión para estos datos,
Relacion metros consumidos por tamaño
de familia
15
y = 0.0658x - 0.6994
Tamaño de familia
10
0
0 50 100 150 200
Metros
Y Pronóstico Y Lineal (Pronóstico Y)
b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.
y= 5.9
x= 100.3
b= 0.06
a= -0.69
Ecuación estimada: y=-0.69+0.06(100.3)
y= 5.328
d) Calcule el error estándar en la regresión.
e) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.
Estadísticas de la regresión
Coeficiente de correlación 0.836819559
múltiple
Coeficiente de determinación 0.700266975
R^2
R^2 ajustado 0.662800347
Error típico 1.905391368
Observaciones 10
f) Determina el intervalo de confianza al 95%.
1.9053
𝑦𝑐 = 5.9 ± 2.306( 2 )
√10
4.511 ≤ 𝑦𝑐 ≤ 7.289
11- El gerente de una mueblería “FAMSA” quiere conocer la relación de las ventas logradas por un
vendedor en dos años, toma una muestra de 8 vendedores que lograron la etiqueta de (vendedor
del mes) y encontró los siguientes datos:
Año 2006 Año 2007
99 170
95 133
50 86
80 161
92 112
88 133
130 136
100 82
a) Trace un diagrama de dispersión para estos datos,
Relacion Año 2006 y 2007
200
y = 0.4557x + 84.812
150
Año 2007
100
50
0
0 20 40 60 80 100 120 140
Año 2006
y Pronóstico y Lineal (Pronóstico y)
b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.
y= 126.625
x= 91.75
b= 0.4557
a= 84.81
Ecuación estimada: y=84.81+0.4557(91.75)
y= 126.620475
c) Calcule el error estándar en la regresión.
d) Calcule el coeficiente de correlación y el coeficiente de determinación e
interprételos.
Estadísticas de la regresión
Coeficiente de correlación 0.31976121
múltiple
Coeficiente de determinación R^2 0.102247231
R^2 ajustado -0.04737823
Error típico 32.56572689
Observaciones 8
e) Determina el intervalo de confianza al 95%.
32.5657
𝑦𝑐 = 126.62 ± 2.447( 2 )
√8
97.87 ≤ 𝑦𝑐 ≤ 155.37
12. Según el INEGI los nacimientos registrados en el país en el 2007 fueron:
Mes N Mes Nacimientos
enero 1 220670
febrero 2 211330
marzo 3 213299
abril 4 270819
mayo 5 225298
junio 6 205572
julio 7 211180
agosto 8 249626
septiembre 9 220666
octubre 10 241529
noviembre 11 211857
diciembre 12 173237
a) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.
b) El INEGI reporto que en julio de 2007 se registraron 211,330
nacimientos, utiliza la ecuación obtenida y predice cuantos debieron
de haberse registrado en ese mes, compara resultados y obtén tus
conclusiones.
c) Estime cuantos nacimientos se registraron en enero de 2008.
d) Calcule el error estándar en la regresión.
e) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.
f) Determina el intervalo de confianza al 95%.
Universidad Nacional Autónoma de Nicaragua
UNAN-León
Facultad de Ciencias y Tecnología
Ciencias Actuariales y Financieras
Tema: Regresión Lineal
Integrantes:
• Oriethel Arliz Quintana Caballero
• Josué David Gutiérrez López
Tutor:
Lic. Álvaro Arauz
Miércoles, 24 de febrero.
¡A la libertad por la Universidad!