Mdulo II
ANLISIS DE REGRESIN
(CONCEPTOS Y APLICACIN)
Mg. Christian Acua Opazo
Profesor DII
2013
Agenda
El Modelo de regresin Lineal general
Regresin Lineal Simple: Caso Particular
Especificaciones al Modelo de Reg. Simple
El Error en el Modelo
Funcin de Regresin Poblacional y Muestral
Determinacin del Parmetro i
Regresin Mltiple: Caso General
Anlisis Matricial
Mnimos Cuadrados Ordinarios (MCO)
Hiptesis del Modelo
Mxima Verosimilitud
Anexos
2
Introduccin al Tema
El Sub-Gerente de Inversiones de una gran
empresa opina que las rentabilidades
anuales de las acciones de la empresa
dependen del riesgo de las mismas.
El Gerente no est muy convencido de ello,
ya que est seguro que existen otras
variables que influyen, por lo que ha
solicitado pruebas.
Cuestionamiento a Resolver
Qu herramienta puede presentar el Sub-Gerente
de inversiones que sustenten su teora?
Qu variables tendr que evaluar y medir?
Qu MODELO (ecuacin) ayudar a predecir las
rentabilidades en funcin del riesgo?
Ser un MODELO (ecuacin) lineal o no lineal?
Qu precisin se puede esperar al usar esta
herramienta de toma de decisiones?
Modelo Economtrico General
Y f (X ) u
Variable
Explicada
Dependiente
Endgena
Respuesta
Variable
Explicativa
Independiente
Exgena
Shock
Funcin o Transformacin
Lineal (ventajas estadsticas, simplicidad,
interpretacin):
Lineal Simple
Lineal Mltiple
Error
(Perturbaci
n)
Permite
explicar
la
relacin
entre
una
variable
estocstica y
una
determinsti
ca
de
un
fenmeno
Especificaciones del MLG
El MLG tiene trmino constante cuando X0i para
todo i=1,,t. es igual a uno (1). En este caso, se tiene:
Yi 0 1 X 1i ... kXki ui
(i = 1, 2,, t)
0 es el trmino constante y 1, 2,, k las pendientes del modelo.
Muy importante:
El8MLG es Lineal porque los parmetros que figuran en su lado derecho lo
REGRESIN LINEAL SIMPLE
Regresin Lineal:
Concepto
Regresin: conjunto de tcnicas que son usadas
para establecer una relacin entre una variable
cuantitativa llamada variable dependiente y
una o ms variables independientes, llamadas
predictoras. Estas deben ser por lo general
cuantitativas, sin embargo usar predictoras que
son cualitativas es permisible.
Modelo de regresin. Ecuacin que representa
la relacin entre las variables. Para estimar la
ecuacin del modelo, se deben tener DATOS (o
un conjunto de DATOS = MUESTRA).
10
Reg. Lineal Simple v/s Reg.
Lineal Mltiple
Modelo de Regresin Simple: Determinar la
relacin entre la rentabilidad de una accin (y) y
los niveles de riesgo de la accin (x).
Yi = 0 + 1 X1i + i
Modelo de Regresin Mltiple. Determinar la
relacin del gasto en consumo de las familias (y),
como funcin del ingreso (x1), los activos
financieros de la familia (x2) y del tamao de la
familia (x3).
11
Yi = 0 + 1 X1i + 2 X2i + i
Regresin Lineal Simple
(Caso Particular)
Definicin:
Se vincula a la descripcin y evaluacin de la
relacin
entre
una
determinada
variable
dependiente (o explicada) y una variable
denominada independiente (o explicativa).
Obs.:
Actualmente se denomina regresin al estudio de la
dependencia de una variable dependiente de una o ms
variables explicativas, con la perspectiva de estimar y/o
predecir el valor poblacional medio de la primera en
trminos de los valores conocidos de las segundas.
12
Ejemplo para
El anlisis
Una
teora
financiera
popular,
sostiene
que
existe una relacin directa
entre el riesgo de una
inversin y el rendimiento
que promete. El riesgo de
una accin se mide por
medio de su valor . A
continuacin se presentan
los rendimientos y los
valores de para 20
acciones
(ficticias)
sugeridas por la empresa
de inversiones "AAA".
13
Estos
datos confirman
Accin Rendimiento
(%) de la
Accin
1
5,4
2
8,9
3
2,3
4
1,5
5
3,7
6
8,2
7
5,3
8
0,5
9
1,3
10
5,9
11
6,8
12
7,2
13
4,5
14
5,3
15
1,9
16
2,5
17
6,5
18
7,1
19
7,8
20
5,9
Valor
(Nivel de
Riesgo)
1,5
1,9
1
0,5
1,5
1,8
1,3
-0,5
0,5
1,8
1,9
1,9
1,1
1,4
0,9
1,4
1,6
1,1
1,4
1,8
Rendimiento (%)
Grficamente
Nivel de Riesgo ()
14
Anlisis de Regresin Simple
Es modelar la dependencia de la variable Y en
funcin de la variable X, a travs de la ecuacin
de una recta.
Yi 0 1 X i ei
i=1, 2, , n
Error ~ NID(0, 2)
Parmetros
Variable
dependiente
16
Variable
predictora
(independiente)
La ecuacin de regresin estimada, podra
responder las siguientes preguntas:
y: Rentabilidad (%)
x: Nivel de Riesgo (Beta)
Cul ser el valor de la
rentabilidad, por cada un
punto de riesgo que quiera
asumir la empresa?
Coeficiente de
regresin
estimado
Cul ser la rentabilidad
anual promedio, dado un nivel
de riesgo de x = 1,5 ?
Intervalo de
confianza para
Cul ser la rentabilidad del
prximo perodo, si el nivel de
riesgo es de 2,0?
Intervalo de prediccin
para el valor de Y dado
X=2,0
Y/X=1,5
Algunos Supuestos
del Modelo de
Regresin Lineal Simple
18
Supuesto 1:
Modelo de regresin Lineal
El modelo de regresin es lineal en los parmetros,
como se observa a continuacin.
Yi 0 1 X i ei
Como se indica en el supuesto los parmetros son los que
deben ser lineales (elevados a la uno) sin importar que forma
tomen la variable dependiente y la variable explicativa
Supuesto 2:
Valores de x son fijos en muestreo repetido.
Los valores que toma la variable explicativa (X) son
considerados fijos en muestreo repetido. Ms
tcnicamente,
se
supone
no
estocsticos
(regresores no estocsticos).
La parte sistmica y aleatoria son independientes
Cov(X, ) = 0
Supuesto 2:
Valores de x son fijos en muestreo repetido.
Lo anterior implica:
Cuando estamos analizando un evento econmico,
lo deseable es que se tengan diferentes muestras,
para
poder
as
observar
el
comportamiento
promedio de los parmetros. Este supuesto nos
indica que para todas las muestras analizadas, los
valores que tome(n) la(s) variable(s) explicativa(s),
deben ser los mismas para todas las muestras.
Supuesto 3:
Valor medio de las perturbaciones es igual
a cero
Dado el valor de X, la media o el valor esperado del
trmino aleatorio de perturbaciones es cero.
Tcnicamente, el valor de la media condicional de
es cero (es decir, no hay error sistmico).
Simblicamente, se tiene:
E( / Xi) = E()= 0,
para todo i=1,,n
Lo cual implica: E(y / Xi) = 0 + 1 X
Supuesto 3:
Valor medio de las perturbaciones es igual
a cero
E (u rx1 ) E
u1
u
2
ur
E (u1 )
E (u )
2
E (u r )
0
0
Obs.:
Este supuesto no es muy restrictivo, puesto que siempre podemos
ajustar el intercepto 0 para normalizar E(u) = 0
Supuesto 4:
Homocedasticidad, o varianza de = cte.
Dado el valor de X, la varianza de es la misma
para todas las observaciones. Esto es, las
varianzas condicionales de son idnticas,
Simblicamente se tiene que:
Var(i/Xi) = E(i E(i )/Xi)2
= E(2i /Xi)
= 2
por supuesto 3
Obs: De los supuesto 3 y 4, se puede concluir: Los errores se
distribuyen normalmente. (Se usa Kolmogorov)
Verificacin supuesto 3 y 4
Prueba de Kolmogorov-Smirnov para una muestra
Unstandardi
zed Residual
N
11
Parmetros
Media
,0000000
a,b
normales
Desviacin tpica
2,50282563
Diferencias ms
Absoluta
,143
extremas
Positiva
,143
Negativa
-,112
Z de Kolmogorov-Smirnov
,474
Sig. asintt. (bilateral)
,978
a. La distribucin de contraste es la Normal.
b. Se han calculado a partir de los datos.
25
> 0.05. Los errores se
distribuye normalmente
Supuesto 4:
Homocedasticidad, o varianza de = cte.
y
f(y|x)
.
x1
x2
.E(y|x) = + x
0
Supuesto 4: (en contraste)
Heterocedasticidad, o var( i/Xi) =
f(y|x)
2i.
.
x1
x2
x3
E(y|x) = 0 + 1x
Supuesto 5:
No Autocorrelacin entre las perturbaciones
Dado dos valores cualquiera de U, La correlacin
entre dos i y j cualquiera (i j) es cero.
Simblicamente:
Cov( i j/Xi Xj) = E( i E( i )/Xi) ( j E( j )/Xj)
= E( i /Xi) ( j /Xj)
=0
Obs.:
Lo que este supuesto nos indica, es que entre dos o ms
perturbaciones (observaciones de la variable aleatoria) no de
debe existir ninguna relacin.
Verificacin supuesto 5
Los errores no se encuentran autocorrelacionados
(Durbin Watson D-W).
Ho: No existe Autocorrelacin entre los residuos
H1: Si existe Autocorrelacin entre los residuos
Modelo
R2
R2 adj.
Error tp. De
la estimacin
DurbinWatson
,80177
,64284
,62299
1,5505
1,6861
No existe Autocorrelacin
Autocorrelacin (+)
0 DW 4
No hay
Autocorrelacin
Autocorrelacin (-)
Supuesto 6:
La covarianza entre i y xi es cero
Este supuesto establece que la perturbacin i y
la
variable
explicativa
xi
no
estn
correlacionadas.
Supuesto 7:
No hay Multicolinealidad Perfecta
No hay relaciones perfectamente lineales entre
las variables explicativas.
Cov(Xi/Xj) = 0, donde ij
Para poder analizar la relacin existente entre la
variable dependiente y las variables explicativas, el
investigador debe tener seguridad de que las
variables explicativas son totalmente independientes
una de las otras, para poder tener certeza plena del
significado de cada uno de los coeficientes
pendientes.
Supuesto 8:
Grados de libertad suficientes
Nmero de observaciones n debe ser mayor que
el nmero de parmetros por estimar.
Es decir:
Tk>0
Alternativamente, el nmero de observaciones n
debe ser mayor al nmero de variables
explicativas.
Supuesto 9:
Variabilidad de los valores de x
No todos los valores de X en una muestra dad
deben ser iguales.
Tcnicamente,
positivo finito.
var(X)
debe
ser
un
nmero
Ecuacin Estimada
Y b0 b1 X
Pero cmo obtener los valores de los parmetros i
en una Regresin Lineal Simple:
Clculo de 0 y 1
Mtodo de Mnimos Cuadrados Ordinarios.
Mtodo de Momentos.
Mxima Verosimilitud
_ _
X, y= Promedio
35
36
Matemticamente, se tiene:
n
X y n X y
i 1
X
i 1
2
i
n X
0 y 1 X
y = Variable dependiente
X = Variable Independiente
_ _B0 = Interseccin en el eje Y
B1 = Pendiente
X, y= Promedio
n = N de datos
39
Como el modelo de regresin es un modelo estadstico, es posible determinar
su grado de presicin y confiabilidad de los resultados de la regresin. Para
esto es utilizado el coeficiente de determinacin (r2), que indica que tan
correcto es el estimado de la ecuacin de regresin
n
Xy
X
y
r2
2
2
2
2
n X X n y y
Mientras ms alto sea r2, ms confianza podr tenerse en el estimado de
la lnea de regresin. De forma ms concreta, representa la proporcin
de la variacin total en Y, que se explica por la ecuacin de regresin,
pudiendo asumir un valor entre 0 y 1.
40
Con los antecedentes disponibles es posible calcular el error estndar de una
estimacin, para determinar la desviacin estndar de la variable
independiente y para un valor especfico de la variable independiente X.
El error estndar de la variable estimada y, designado como S e, se
define como la desviacin estndar de la regresin, y se calcula por
medio de la siguiente ecuacin:
Se
a y b Xy
n2
Entonces, si suponemos que los trminos del error estn
normalmente distribuidos en torno a la lnea de regresin, la mayor
precisin se asocia con los errores estndares ms pequeos de la
estimacin.
41
Ecuacin Estimada: Sumatorias
(segn Excel)
= 1,29
= 4,925
n = 20
Accin
1
2
3
4
5
6
.
.
17
18
19
20
Suma
():
Y:
X:
Rend. Riesgo
(%)
X2
Y2
XY
5,4
8,9
2,3
1,5
3,7
8,2
1,5
1,9
1
0,5
1,5
1,8
2,25
3,61
1,00
0,25
2,25
3,24
29,16
79,21
5,29
2,25
13,69
67,24
8,10
16,91
2,30
0,75
5,55
14,76
6,5
7,1
7,8
5,9
1,6
1,1
1,4
1,8
2,56
1,21
1,96
3,24
42,25
50,41
60,84
34,81
10,40
7,81
10,92
10,62
98,5
25,8
40,16 606,27150,21
y = 0 + 1 x = 0,5840505 +3,3650771057 * x
42
Ecuacin Estimada: ANOVA
(segn Excel)
Valor
Suma de
Prom.
crtico de
G. L.
cuadrados Cuadrados
F
F
77,8847084
2,13115ERegresin
1
9 77,88470849 32,39737267
05
43,2727915
Residuos
18
1 2,404043973
Total
19
121,1575
Error
Probabilida
Coeficientes
tpico
Estadstico t
d
0,83776453
Intercepcin 0,584050596
6
0,69715364 0,494613205
0,59120774
y
=
x
=
0,5840505
+3,3650771057 * x
0
1
Variable X 1 3,365077057
9
5,691868996 2,13115E-05
43
Anlisis de Varianza: ANOVA
Se rechaza Ho, si:
SCE /
F0 > F(, 1, n-2)
Grfica Distribucin F de Ficher
Zona de
Aceptacin de Ho
F(, v1, v2) = F(0,05, 1, 18) = 4,41
77,8847085
SCE /
2,404043972
= 32,3973727
Qu tan bueno es el modelo estimado?
Coeficiente de determinacin
Porcentaje de la variabilidad de Y que es explicada por la ecuacin
de regresin ajustada.
Coeficiente de no determinacin
Porcentaje de la variabilidad de Y que es no es explicada por el
modelo
Prueba de Hiptesis: Pendiente 1
Intervalos de Confianza para los
Valores predichos
Para hallar un intervalo con nivel de confianza
del (1-)100%, de los valores predichos para la
respuesta media y para un valor individual,
dado un valor de x, se utilizan las siguientes
frmulas:
Intervalos
de
Confianza
nuestro ejemplo de anlisis
para
Intervalo de 95% de confianza para
Y/X=1.5
y = 0 + 1 x = 0,5840505 +3,3650771057 * x
Datos
n=
20
Xo =
1,5
Xprom =
1,29
Yo =
5,631666159
Se =
1,5505
Sxx=
40,16(25,82 / 20)= 6,878
t(/2,n-2)= 2,1009
Intervalos
de
Confianza
nuestro ejemplo de anlisis
para
Intervalo de 95% de confianza para
Y/X=1.5
y = 0 + 1 x = 0,5840505 +3,3650771057 * x
Si x = x0 =1,5:
Lmite Superior= 5,631666159 + 3,3480640886088 = 8,97973025
Lmite Inferior = 5,631666159 - 3,3480640886088 = 2,28360207
50
Anlisis de Correlacin
Es una herramienta estadstica que
podemos usar para describir el grado de
relacin lineal entre las variables.
Tiene el mismo signo que 1
r 00,64284
.838 =0.0,80177
915
51
Existe un una fuerte
correlacin lineal directa
entre la rentabilidad y el
nivel de riesgo
Grficas de Correlaciones
a)Asociacin lineal
inversa
b) Asociacin lineal
directa
c) No hay asociacin
lineal
d) No hay asociacin
lineal
Interpretacin
1.
2.
El valor absoluto de r indica la fuerza de la relacin
entre Y y X.
El signo da la direccin de la relacin (directa o
inversamente proporcional)
r=1
r = -1
r=0
54
correlacin positiva perfecta.
correlacin negativa perfecta.
no hay relacin lineal entre Y y X.
r
Sr
SCR
SCT
(1 r 2 )
( n 2)
r
t
Sr
Se Rechaza Ho
Con un nivel de significancia
del 5% se puede afirmar que
la
rentabilidad
est
correlacionada con el nivel
de riesgo de la accin.
5,692
5,692
-2,11
2,11
REGRESIN LINEAL MLTIPLE
Regresin Mltiple
(Caso General)
Mtodo multivariante que analiza la relacin entre una nica variable
dependiente (criterio) y varias variables independientes (predictores). El
objetivo es predecir cambios en la variable dependiente en respuesta a
cambios en varias de las variables independientes
Cada variable predictor es ponderada, indicando la ponderacin su
contribucin relativa a la prediccin conjunta
El conjunto de variables independientes ponderadas se denomina valor
terico de la regresin o ecuacin de regresin
Y= b0 + b1X1 + b2X2 +.....+ bn Xn
Tcnica de dependencia en la que los datos deben ser mtricos o
apropiadamente transformados
57
Objetivos de la Regresin
Mltiple
Prediccin de la variable criterio con un conjunto de variables
independientes, de forma que se maximice el valor terico de la
regresin.
La prediccin del modelo elegido debe demostrar tanto significacin
prctica como estadstica
Explicacin objetiva del grado y carcter de la relacin entre las
variables independientes y la variable dependiente. Concretamente:
Determinacin de la importancia relativa de cada variable
independiente sobre la variable dependiente (magnitud y
direccin de la relacin)
Evaluacin de la naturaleza de las relaciones entre las variables
independientes y la dependiente (lineal y/o curvilineal)
Evaluacin
58
de
independientes
las
interrelaciones
entre
las
variables
Supuestos del Modelo
Como
se dijo anteriormente, los
supuestos son los mismos que en el
caso del modelo de regresin lineal
simple. Pero con una presentacin de
la forma matricial.
(ver
59
Anexo 2).
Supuestos del modelo
Notacin Escalar
E (ei)=0
(para cada i)
Var(ei)= 2 (cte.)
Notacin Matricial
E (e)=0 donde e y 0 son vectores
columna nx1 siendo 0 un vector nulo
E (ee)= 2 I donde I es una matriz
Homocedasticidad de los errores
identidad n x n
x1; x2; x3;;xn son fijas no
estocsticas
La matriz X, n x k, es no estocstica
No hay relacin lineal exacta
entre las variables X, es decir no
hay multicolienalidad
El rango de X es k, donde k es el
nmero de columnas en X y k es
menor que el N de observaciones
60
Supuestos del modelo
Notacin Escalar
Errores se distribuyen
normales con media 0 y
varianza 2
Notacin Matricial
El vector E tiene una distribucin
normal multivariada, es decir
E~N(0; 2 I)
Modelo lineal en los parmetros
61
ANEXO 1
FRP y FRM
Funcin de Regresin Poblacional y
Muestral
Dado que el objetivo del anlisis de regresin es estimar o predecir el valor
medio o promedio (poblacional) de la variable dependiente basndose en los
valores fijos o conocidos de las variables explicativas, distinguiremos algunos
conceptos.
1. Funcin de Regresin Poblacional
(FRP):
Es la recta que surge de unir las esperanzas
condicionales de la variable dependiente para los
valores fijos de la variable explicativa.
Dado que para cada Xi, existe una poblacin de
valores de Y, se puede calcular la esperanza
condicional de los valores de Y, condicional a
cada Xi. A la unin de las esperanzas
condicionales
se le denomina FRP.
63
Del grfico podemos concluir que E(Y/Xi) es una funcin de Xi, y esa ser una
funcin lineal de Xi. Recordar: la linealidad puede ser en las variables y en
los parmetros.
Lo que nos interesa es que la relacin sea lineal en los parmetros.
Ejemplo:
E(Y/Xi) = 1 + 2 Xi2
Es lineal en parmetros, no en las variables
E(Y/Xi) = 1 + 2 Xi2
No es lineal ni en los parmetros,
ni en las variables
Sin perjuicio de lo anterior, es posible LINEALIZAR la funciones.
64
Modelos Linealizables:
E (Y/Xi)= 1 Xi 2
ln E(Y/Xi)= ln 1 + 2Xi
Modelos No Linealizables:
E (Y/Xi)= 1 + 2 e 2Xi
65
2. Funcin de Regresin Muestral (FRM):
Hasta ahora nos hemos referido a los valores poblacionales de Y
correspondientes a los valores fijos de X. Al hacer econometra nuestro inters
es estimar 1 y 2, pero el primer obstculo que enfrentamos es que no
conocemos la poblacin, sino una muestra de ella.
66
As como tenemos esta muestra,
podramos tener otra.
Dado que no conocemos la poblacin
sino muestras, la estimacin de la
E(Y/Xi) depender de la muestra
elegida. Cul es la verdadera? No lo
sabemos.
Nuestro objetivo es conocer E(Y/Xi) => lo sabemos si tenemos 1 + 2 Xi ,
pero no conocemos 1 y 2 (parmetros poblacionales o tericos), por lo que
debemos estimarlos:
Yi = 1 + 2 Xi + i
, ser la recta estimada
Yi =
Yi =
67
+ ei
+ ei , donde:
Primero se estima:
Donde los i son los valores resultantes (estimaciones) a partir de
estimadores (frmulas o algoritmos).
68
ANEXO 2
MODELO LINEAL GENERAL
SIMPLE Y MLTIPLE
(Presentacin Matricial)
Matricialmente, la Regresin Lineal Simple
puede escribirse como.
Y1
Y
2
Y3
1
1
Yn
x1
1
2
x2
0
1 x3
3
1 xn
n
Como resultado se tiene que el modelo lineal simple puede
expresarse en la notacin de matrices:
70
Y = X +
Tal como se vio anteriormente, se mantiene
que:
E 0
Var I
2
Donde 2 es la varianza del error, comn a todos ellos, e I
es la matriz de identidad correspondiente.
71
Dado que
1
X'X
x1
1
x2
1
x3
1
xn
1 x1
1 x
2
* 1 x3
2 xn
1 xn
Y1
Y
2
nx 2
1 1 1 1
X 'Y
* Y3
x1 x2 x3 xn
Yn
72
Y
xY
i
i i
x
x
i
2
i
2x2
Entonces
X ' X B
x
x
i
2
i
n 0 n1
2
0 xi 1 xi
73
2x2
0
*
Y
xY
X 'Y
i i
2 x1
2 x1
Modelo Lineal General en forma
Matricial
Variable dependienta Y: La
informacin
asociada
a
la
variable endgena se almacena
en un vector (matriz) columna Y
de tamao Tx1.
Y1
Y
2
Y .
.
YT
1
1 X
Variables Independientes X: La
informacin (datos) asociada a
las variables explicativas se recoge
en una matriz X de tamao Txk.
X .
Parmetros y Perturbaciones: Las
perturbaciones en un vector u de
tamao Tx1 y los parmetros en
un vector b de tamao (kx1).
74
u1
u
2
u .
.
uT
12
22
.
.
X
X
13
23
.
.
T2
. .
. .
. .
. .
T3
. .
1
2
b .
.
k
X
X
ik
2k
Tk
Modelo Lineal en forma Matricial
Ordenando los valores de Y, X y u como sigue:
Y1
Y
2
Y .
.
YT
1 X
X .
12
22
13
23
X
X
.
T2
T3
. .
. .
. .
. .
. .
X
X
ik
2k
u1
u
2
Tk
u .
.
uT
1
2
b .
.
k
Nota:
-El 1 subndice de X indica el nmero de la observacin, el 2 identifica la variable.
-Es importante que T>K
Podemos escribir el modelo en forma matricial como:
Y = Xb + u
75
En trminos generales
Y = X + U
Observaciones en perodo t=1 de todas las variables
Y1
Y
2
Y .
.
YT
X
X
21
X
X
12
22
Tx1
11
13
23
.
T1
X
X
.
T2
T3
. .
. .
. .
. .
. .
X
X
ik
2k
Tk
Txk
1
2
.
.
k
Kx1
u1
u
2
.
.
uT
Tx1
Observaciones Variable x1
Observaciones
Variable Endgena
76
Observaciones
Variable Explicativa
Perturbaciones
Parmetros
Los Parmetros de Posicin:
Mtodo de Mnimos Cuadrados
Ordinarios (MCO)
Matricialmente el modelo lineal es:
YTx1 X TxK Kx1 Tx1
es un vector de K parmetros desconocidos,
X es una matriz de valores conocidos de variables explicativas,
es un vector, tal que (X,), de variables aleatorias independientes.
La estimacin de los parmetros del modelo lineal, por MCO es:
S ( y X )' ( y X ) ( y ' ' X ' )( y X )
y ' y ' X ' y y ' X ' X ' X
y ' y 2 ' X ' y ' X ' X
S
2 X ' y 2 X ' X 0
X ' Xb X ' y
1
(
X
'
X
)
X'y
77
b es un vector aleatorio
puesto que, como se ve, es
una funcin lineal de Y,
que es una v.a.
Estimadores MCO en Excel:
Tomando el mismo ejemplo
anterior
y dado que
estimando
78
Ventas y publicidad
en millones de pesos
b ( X ' X ) 1 X ' y
(X`X):
Obtencin del resultado en formato de Matriz:
1.- Aplicar frmula (Mmulti(rango))
2.- Seleccionar rango (extensin) matricial
3.- Presionar F2, luego presionar Ctrl + Shif + Enter
Luego es posible determinar la matriz inversa de (X`X), esto
es:
Matriz Inversa =
(X`X)-1
Entonces los parmetros son:
79
Ejercicio: Ventas de una empresa de radios.
Ventas t = B1 + B2 * Gastos en Publicidad + B3 * Precio t + ut
t=1,2,,10
Datos:
Matricialmente
80
ANEXO 3
REGRESIN LINEAL: SIMPLE Y MLTIPLE
(Decisiones)
Diagrama de Decisin de la Regresin
Mltiple
Problema de investigacin
Primer paso
Seleccionar objetivo (s)
- Prediccin
- Explicacin
Seleccionar variables dep. e indep.
Diseo de la investigacin
Segundo paso
Seleccin del tamao muestral
Creacin de variables adicionales
No
Supuestos en la regresin mltiple
Tercer paso
Cumplen las variables individuales los
supuestos de:
normalidad
linealidad
homoscedasticidad?
Si
Diagrama de Decisin de la Regresin
Mltiple
Estimacin del modelo de regresin
especifica el investigador el modelo o
se utiliza algn procedimiento de
seleccin de las var. indep.?
Cuarto paso
Especificacin del investigador
Procedimiento de seleccin
Mtodo de estimacin secuencial
Estimacin progresiva/regresiva
Estimacin por etapas
Mtodo de combinacin
Examinar todas las combinaciones
posibles para identificar la que
mejor se ajusta
Cumple el valor terico de regresin los supuestos
del anlisis de regresin?
Si
Examinar significacin estadstica del modelo
Coeficiente de determinacin (R 2)
Coeficiente de determinacin ajustado
Significacin de los coeficientes de regresin
No
A segundo
paso:
Creacin de
variables
adicionales
Diagrama de Decisin de la Regresin
Mltiple
Quinto paso
Interpretacin del valor terico de la regresin
Evaluar importancia relativa de las variables
independientes con los coeficientes beta
Valoracin de la multicolinealidad
Sexto paso
Validacin de los resultados
Contraste del modelo de regresin en
una nueva muestra de la poblacin
Dividir la muestra en dos partes y utilizar
una submuestra para crear el modelo y
otra para contrastarlo