0% encontró este documento útil (0 votos)
1K vistas17 páginas

Regresion Lineal

Este documento presenta varios ejemplos de regresión lineal simple y múltiple. En el primer ejemplo, se analiza la relación entre la antigüedad de los camiones de basura y los gastos anuales de reparación para determinar la ecuación de regresión. Los otros ejemplos muestran cómo calcular las constantes a y b para obtener la ecuación de estimación Y= a + bX y hacer predicciones utilizando la ecuación. El documento concluye con una breve introducción a la regresión lineal múltiple.

Cargado por

Lesly Villatoro
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
1K vistas17 páginas

Regresion Lineal

Este documento presenta varios ejemplos de regresión lineal simple y múltiple. En el primer ejemplo, se analiza la relación entre la antigüedad de los camiones de basura y los gastos anuales de reparación para determinar la ecuación de regresión. Los otros ejemplos muestran cómo calcular las constantes a y b para obtener la ecuación de estimación Y= a + bX y hacer predicciones utilizando la ecuación. El documento concluye con una breve introducción a la regresión lineal múltiple.

Cargado por

Lesly Villatoro
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 17

REGRESIÓN LINEAL SENCILLA

1. Suponga que la directora del Departamento de Salubridad de Chapel Hill está


interesada en la relación que existe entre la antigüedad de un camión de basura y
los gastos anuales de reparación que debe esperar. Con el fin de determinar ésta
relación, la directora ha reunido información de cuatro de los camiones de la
ciudad.

El primer paso para


calcular la recta de
regresión de este
problema es
organizar los datos como resumen en la siguiente tabla, esto nos permite sustituirlos
directamente en las ecuaciones para encontrar la pendiente y ordenada Y de la recta de
regresión de mejor ajuste.
Con la información de la tabla podemos usar las ecuaciones para la pendiente y la
ordenada Y con el fin de encontrar las constantes numéricas para la recta de regresión.
La pendiente es:

b=
∑ XY −n X́ Ý
∑ X 2 −n X́ 2
78−(4)(3)(6) 78−72 6
¿ = = =0.75
44−( 4)(3)2 44−36 8

Y la ordenada Y es:

a=Ý −b X́

¿ 6−( 0.75 ) ( 3 )

¿ 6−2.25

¿ 3.7 5

Ahora, pues para obtener la ecuación de estimación que describe la relación entre
la antigüedad de un camión y sus gastos anuales de reparación, podemos sustituir
los valores de a y b en la ecuación general para una línea recta:

Y^ =a+bX

¿ 3.75+0.75 X

Utilizando esta ecuación de estimacion la directora del Departamento de


Salubridad puede estimar los gastos anuales de reparación, dada la antigüedad de
su equipo. Si, por ejemplo, la ciudad tiene un camion de 4 años de antigüedad, la
directora podría usar la ecuación para predecir los gastos anuales de reparacion
para este camión de la siguiente manera:

Y^ =3.75+ 0.75 X

¿ 3.75+3
¿ 6.75

Así se calcularía que la ciudad gasta aproximadamente $675 al año en


reparaciones de un camión de cuatro años de antigüedad.

9 Recta de regresión lineal


Gastos de reparacion (cientos de dolares)

8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7
Antiguedad del camión (años)

2. Se tiene un problema referente a la relación entre el dinero gastado en


investigación y desarrollo y las ganancias anuales de la compañía química.
La siguiente tabla presenta la información de los seis años anteriores. Con
esto, podemos determinar la ecuación de regresión que describe la
relación.
Nuevamente, podemos facilitar la recolección de la información necesaria si
realizamos los cálculos de la tabla:

Con esta información, estamos listos para encontrar las constantes numéricas a y
b para la ecuación de la estimación.

El valor de b es:

b=
∑ XY −n X́ Ý
∑ X 2 −n X́ 2

1000−(6)(5)(30) 1000−900 100


¿ = = =2
200−(6)(5)2 200−150 50

Y a es:

a=Ý −b X́
¿ 30− ( 2 )( 5 )

¿ 30−10

¿ 20

Entonces podemos sustituir estos valores de a y b en la ecuación y obtener:

Y^ =a+bX

¿ 20+2 X

Al utilizar esta ecuación de estimación, el vicepresidente de investigación y


desarrollo puede predecir las ganancias futuras anuales a partir de la cantidad
presupuestada para ID. Si la compañía gastó 8 millones de dólares para ID en
1996, entonces debió ganar aproximadamente 36 millones de dólares durante ese
año: Y^ =20+2 ( 8 )

¿ 20+16

¿ 36

RECTA DE REGRESIÓN LINEAL

3. Para el siguiente conjunto de datos


a) Dibuje un diagrama de dispersión
b) Desarrolle la ecuación de estimación que mejor describa los datos.
c) Pronostique Y para X=10,15,20.

X 13 16 14 11 17 9 13 17 18 12
Y 6.2 8.6 7.2 4.5 9.0 3.5 6.5 9.3 9.5 5.7

a)

b)

140 70
X́ = =14 Ý = =7
10 10
b=
∑ XY −n X́ Ý = 1035−10 (14)(7) =0.7051
∑ X 2 −n X́ 2 2038−10 ( 14 )2
a=Ý −b X́=7−( 0.7051 ) ( 14 )=−2.8714

Entonces:

Y^ =a+bX =−2.8714+0.7051 X

c)
^ =−2.8714+0.7051 ( 10 )=4.1796
X=10 Y
^ =−2.8714+0.7051 ( 15 )=7.7051
X=15 Y
^ =−2.8714+0.7051 ( 10 )=11.2306
X=20 Y
4. A menudo, quienes hacen la contabilidad de costos estiman los gastos
generales con base en el nivel de producción. En Standard Knitting Co, han
reunido información acerca de los gastos generales y las unidades
producidas en diferentes plantas, y ahora desean estimar una ecuación de
regresión para predecir los gastos generales futuros.

a) Desarrolle una ecuación de regresión para contabilidad de costos.


420 1922
X́ = =42 Ý = =192.2
10 10

b=
∑ XY −n X́ Ý = 84541−10(42)(192.2) =6.4915
∑ X 2 −n X́ 2 18228−10 ( 42 )2

a=Ý −b X́=192.2−( 6.4915 )( 42 )=−80.4430

^ =−80.4430+6.4915 X
Entonces: Y

b) Pronostique los gastos generales cuando se producen 50 unidades .


^ =−80.4430+6.4915 ( 50 )=244.1320
X=50 Y

5. La relación entre el número de años (x) laborando para la empresa y el


número de ventas logradas (y) por cada vendedor es la mostrada en la
siguiente tabla:

a) ¿Cuántas ventas pueden esperarse en un trabajador con 16 años de


servicio?
93 71
X́ = =6.64 Ý = =5.07
14 14

b=
∑ XY −n X́ Ý = 520−14 (6.64)(5.07) =0. 6981
∑ X 2 −n X́ 2 687−1 4 ( 6.64 )2

a=Ý −b X́=5.07−( 0.6981 ) ( 6.64 )=0.4346

Entonces:

Y^ =a+bX =0.4346+0.6981 X

b) ¿Cuántos años aproximadamente se requieren para lograr 14


ventas?
Y^ =0.4346+0.6981 X
14=0.4346+0.6981 X
14−0.4346
X=
0.6981
¿ 19.4318
6. La relación entre el número de semanas (x) de haber comenzado con un
negocio y las pérdidas (y) en tanto se aclientelaba es la mostrada en la
siguiente tabla. ¿Cuántas semanas pueden esperarse para que las
pérdidas sean nulas?

28 55.5
X́ = =4 Ý = =7.92
7 7

b=
∑ XY −n X́ Ý = 182.5−7 (4)(7.92) = −39.26 =−1.4021
∑ X 2 −n X́ 2 140−7 ( 4 )2 28

a=Ý −b X́=7.92−(−1.4021 )( 4 )=13.5284


Entonces:

Y^ =a+bX =13.5284−1.4021 X

Como en la ecuación x representa el número de semanas de haber cmenzado con


un negocio mientras que y las pérdidas registradas, para la pregunta se tiene
como dato que y = 0, de manera que sustituyéndolo en la ecuación de la recta se
obtiene:

0 = 13.5284−1.4021 X

X= 9.6486

Es decir, se puede esperar aproximadamente que entre la novena y la décima


semanas las pérdidas desaparezcan.

7. Las librerías de la universidad han vendido el libro Believe or Not: Wonders


of Statistics Guide durante 12 semestres y desean estimar la relación entre
las ventas y el número de secciones de estadística elemental que se
enseñan en cada semestre, Se recolectan los siguientes datos:
a) Desarrolle la ecuación de estimación que mejor se ajuste a los datos.
Y= Ventas y X= Número de secciones.
Sustituyendo en las ecuaciones:

123 621
X́ = =10.25 Ý = =51.75
12 12

b=
∑ XY −n X́ Ý = 6833−12( 10.25)(51.75) =2.9189
∑ X 2 −n X́ 2 1421−12 ( 10.25 )2

a=Ý −b X́=51.75−( 2.9189 ) (10.25 )=21.8313

^ =21.8313+ 2.9189 X
Entonces: Y

REGRESIÓN LINEAL MÚLTIPLE

8. El servicio Interno de Contribuciones (IRS, Internal Revenne Service) de Estados


Unidos está tratando de estimar la cantidad mensual de impuestos no pagados
descubiertos por su departamento de auditorías. En el pasado, el IRS estimaba
esta cantidad con base en el número esperado de horas de trabajo en auditorías
de campo. En los últimos años, sin embargo, las horas de trabajo de auditorías de
campo se han convertido en un pronosticador errático de los impuestos no
pagados reales. Como resultado, la dependencia está buscando otro factor para
mejorar la ecuación de estimación. El departamento de auditorías tiene un registro
del numero de horas que usa sus computadoras para detectar impuestos no
pagados. ¿Podriamos combinar esta información con los datos referentes a las
horas de trabajo de auditorías de campo y obtener una ecuación de estimación
más precisa para los impuestos no pagados descubiertos cada mes?
En este problema, X1 representa el número de horas de trabajo de auditoría de campo y
X2 el número de horas en computadora. La variable dependiente, Y, será los impuestos
reales no pagados descubiertos. La ecuación de estimación que describe la relación entre
^ = a + b1X1 + b2X2
tres variables es: Y
Utilizando la información de la tabla en las ecuaciones obtenemos tres ecuaciones con
tres constantes deconocidas a, b1 y b2.

272 = 10a + 441b1 + 147b2

12005 = 441a + 19461b1 + 6485b2

4013 = 147a + 6485b1 + 2173b2

Cuando resolvemos estas tres ecuaciones de manera simultánea, obtenemos:

a = -13.828

b1 = 0.564

b2 = 1.099

Sustituyendo estos tres valores en la ecuaciones de regresión de dos variables


^ = a + b1X1 + b2X2 = -13.828 + 0.564X1 + 1.099X2
obtenemos: Y

Evaluando con X1= 43 y X2 = 16 obtenemos como resultado:

Y^ = -13.828 + 0.564X1 + 1.099X2

= -13.828 + 0.564(43) + 1.099(16)

=28.008

Por tanto, en el pronóstico para noviembre, el departamento de auditorías espera


encontrar una evasión de impuestos cercana a los 28 millones de dólares.

9. Dado el siguiente conjunto de datos.


a. Calcule el plano de regresión múltiple
Las ecuaciones se convierten en:

134 = 6a + 18.6b1 + 24.0b2


473.8 = 18.6a + 84.64b1 + 77.97b2
497.2 = 24.0a + 77.97b1 + 131.50b2

Al resolver las ecuaciones de manera simultánea se obtiene

a= 20.3916 b1 = 2.3403 b2 = -1.3283

Entonces: Y^ = a + b1X1 + b2X2 = 20.3916 + 2.3403X1 – 1.3283X2

^ cuando X1 = 3.0 y X2 = 2.7


b. Prediga Y
Y^ = 20.3916 + 2.3403(3.0) – 1.3283(2.7) = 28.83

10. Se ha reunido la siguiente información de una muestra aleatoria de arrendadores


de departamentos en una ciudad. Se intenta predecir la renta (en dólares por mes)
con base en el tamaño del departamento (número de habitaciones) y la distancia
al centro de la ciudad (en millas).
a. Calcule la ecuación de minimos cuadrados que relacione mejor estas tres
variables
Y^ = renta, X1 = número de habitaciones, X2 = distancia al centro.
Las ecuaciones se convierten en:
2985 = 6a + 18b1 + 21b2
11170 = 18a + 70b1 + 50b2
8535 = 21a + 50b1 + 131b2

Al resolver las ecuaciones de manera simultánea se obtiene


a= 96.4581 b1 = 136.4847 b2 = -2.4035

Entonces: Y^ = a + b1X1 + b2X2 = 96.4581 + 136.4847X1 – 2.4035X2

b. Si alguien busca un departamento de dos habitaciones a dos millas del


centro ¿qué renta debe esperar pagar?
X1 = 2 X2 = 2
Y^ = = 96.4581 + 136.4847X1 – 2.4035X2
= 96.4581 + 136.4847(2) – 2.4035(2)
= $365
FORMULARIO
 REGRESIÓN LINEAL SENCILLA
∑ XY −n X́ Ý
 b= ∑ X −n X́
2 2

 a=Ý −b X́
 Ý =a+b X́

 REGRESIÓN MÚLTIPLE
 Y^ = a + b1X1 + b2X2

También podría gustarte