Parcial 1-2-3
Parcial 1-2-3
Básicos de
Econometría
1
Tema 1.
La modelización econométrica
uniecuacional y multiecuacional
2
Qué se entiende
por econometría
3
La palabra “econometría”, significa “medición de la
economía”, definición que resulta muy general al
tomar en cuenta el alcance de esta disciplina, el cual
puede asociarse, de un modo más concreto, a las
siguientes acepciones:
4
La econometría es una ciencia social a través de la cual
se intenta cuantificar las relaciones entre los agentes
económicos, apoyándose para ello en el empleo
conjunto de la estadística, las matemáticas y la teoría
económica:
Economía
Econometría
Definición
Informática Econometría Estadística
Matemática
5
Los orígenes de la econometría como disciplina
científica, éstos se ubican a principios del siglo XX
NACIMIENTO Y FORMALIZACIÓN:
1930-1950
6
CRISISY APORTACIONES RECIENTES:
1930-1950
7
Actualmente el entorno económico
se caractiza por su alta dinamicidad y
cambios permanentes.
Ante estas circunstancias resulta
imperante realizar un seguimiento
continuo del entorno a efecto de
Importancia reducir el nivel de incertidumbre y
facilitar la toma de decisiones con el
del Análisis claro objetivo de ajustarse a tales
de Datos cambios.
La herramienta mas adecuada para
alcanzar este objetivo es el Análisis de
Datos, dentro de los cuales se
encuentra los modelos econométricos.
El modelo econométrico es una representación
simplificada de la relación que existe entre dos
o más variables, que se utiliza para analizar
sistemas reales concretos. Tiene que basarse en
sistemas económicos más o menos generales y
completarse con aspectos particulares propios
del sistema de estudio. Por tanto las
conclusiones de su aplicación es de ámbito
reducido (espacial y temporal) y no generable
a todos los sistemas.
Fases de elaboración de un Modelo
Econométrico
• Especificación
Fase 1
Fase 2
• Estimación
• Validación
Fase 3
• Utilización
Fase 4
Fase 1
• Especificación
3. Búsqueda de la información
1. Recopilar e integrar las fuentes de información
estadística
2. Identificar y seleccionar las variables relevantes
3. Aplicar las técnicas adecuadas de muestreo
Fase 1
• Especificación
13
• Especificación: Búsqueda de la fuente
Fase 1 de información
Fuente de NACIONAL
información • INE y Banco de España
secundaria
• Estimación
Fase 2
𝑒ෝ𝑡 = 𝑌𝑡 − 𝑌𝑡
• Estimación
Fase 2
V = Media poblacional
V
Estatura
10 11 12 13 14
Edad en Años
ANÁLISIS DE REGRESIÓN
REGRESIÓN CORRELACIÓN
20 20
Variable Y
Variable Y
15 15
10 10
5 5
0 0
0 5 10 15 20 25 -25 -20 -15 -10 -5 0
Variable X Variable X
400 25
20
Variab le Y
Variab le Y
300
15
200
10
100 5
0 0
0 5 10 15 20 25 0 20 40 60 80
Variable X Variable X
ANÁLISIS DE REGRESIÓN
INGRESO FAMIILIAR
TOTAL 325 462 445 707 678 750 685 1043 966 1211
Medias
Condiciona 65 77 89 101 113 125 137 149 161 173
les
ANÁLISIS DE REGRESIÓN
200
Gasto d el C o n su m o F in al
160
120
80
40
50 75 100 125 150 175 200 225 250 275
Ingreso Semanal
ANÁLISIS DE REGRESIÓN
FUNCIÓN DE REGRESIÓN POBLACIONAL :
Curva que conecta las medias de las subpoblaciones de la variable dependiente
que corresponden a los valores dados por la variable independiente.
Gasto Semanal
Y V = Media Condicional
E (Y / X i ) = f ( X i )
149 V
101 V
65
V
Xi
80 140 220
Ingreso Semanal
ANÁLISIS DE REGRESIÓN
OBJETIVO PRINCIPAL :
Del análisis de regresión es por tanto estimar la función de regresión
poblacional (FRP) a partir de la función de regresión muestral (FRM).
FUNCIÓN DE REGRESIÓN MUESTRAL
200
150
100
50
0
0 50 100 150 200 250 300
Serie1
FUNCIÓN DE REGRESIÓN MUESTRAL
200
150
100
50
0
0 50 100 150 200 250 300
Serie2
FUNCIÓN DE REGRESIÓN MUESTRAL
200
150
100
50
0
80 100 120 140 160 180 200 220 240 260
FRM1 FRM2
ANÁLISIS DE REGRESIÓN
Yi = β1 + β 2 X i + ui
Fundamentos de Econometría
TEMA 1.-
PROPÓSITO DEL ANÁLISIS ECONOMÉTRIC O
CORRELACIÓN SIMPLE VERSUS PARCI AL
Correlación:
Medida del grado de relación lineal entre dos o mas variables
2
1−𝜌𝑥𝑦
𝜎𝜌 =
𝑁−2
lo que implica obtener el siguiente estadístico muestral a
contrastar es
𝜌𝑥𝑦 − 0
𝑡 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 =
2
1 − 𝜌𝑥𝑦
𝑁−2
de Correlación Simple
𝜌𝑥𝑦 −0 𝜖/2
Si ≤ 𝑡𝑛−𝑘 Se acepta H0. Las variables no están relacionadas
𝜎𝜌
La correlación obtenida procede de una población cuyo 𝜌𝑥𝑦 = 0
Ejemplo: Determinar la significatividad estadística del
coeficiente de correlación simple entre la variable ventas
(y) y la variable publicidad (X)
0,8675−0 0,8675
𝑡 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 =
de Correlación Simple
= = 3,020
1−(0,86752 ) 0,2872
5−2
primeras.
Las variables que se introducen para controlar la
relación originaria se les denomina variables de
control
Si se analiza sólo el efecto de una tercera variable el
Coeficiente
estudiado.
El coeficiente de correlación parcial de orden 1 podrá ser
menor, igual o superior al coeficiente de correlación
simple.
La correlación parcial será igual a la correlación siempre
Coeficiente
que:
Las variables explicativas (X2 y X3) sean
independientes, o
Si la variable control (X3) no es estadísticamente
relevante para explicar Y
Matriz de varianzas y
covarianzas
Matriz de correlaciones
Ecuación:
𝑟𝑦𝑥2..𝑥3 =
2 2
(1 − 𝑟𝑦𝑥3 )(1 − 𝑟𝑥2𝑥3 )
Estimación:
Correlación Parcial
2
La definición de las variables: depende de la
dimensión Espacio-Tiempo
Temporal Transversal
4
200000
0
250000
50000
100000
150000
2000T1
2000T3
2001T1
2001T3
2002T1
2002T3
2003T1
2003T3
2004T1
2004T3
2005T1
2005T3
2006T1
2006T3
2007T1
2007T3
2008T1
España
2008T3
2009T1
2009T3
VAB del Sector Servicios
2010T1
2010T3
2011T1
2011T3
2012T1
2012T3
2013T1
2013T3
2014T1
2014T3
2015T1
2015T3
2016T1
SERIES TEMPORALES
2016T3
2017T1
COMPONENTES DE LAS
2017T3
2018T1
2018T3
2019T1
TENDENCIA: Patrón de evolución sostenido a medio y largo plazo de la serie
COMPONENTES DE LAS
SERIES TEMPORALES
ESTACIONALIDAD: Oscilaciones de una serie temporal que se completa
dentro de un año y se repiten mas o menos de forma invariable en los años
sucesivos.
Índice de Producción Industrial
15000
0
20000
30000
10000
25000
5000
35000
2000T1
2000T3
2001T1
una serie temporal
2001T3
2002T1
2002T3
2003T1
2003T3
2004T1
2004T3
2005T1
2005T3
2006T1
2006T3
2007T1
2007T3
2008T1
2008T3
2009T1
2009T3
2010T1
2010T3
2011T1
2011T3
2012T1
VAB de la Construcción
2012T3
2013T1
2013T3
2014T1
2014T3
2015T1
2015T3
2016T1
SERIES TEMPORALES
2016T3
COMPONENTES DE LAS
2017T1
2017T3
2018T1
2018T3
2019T1
CICLO: Movimiento oscilatorio por encima y por debajo de la tendencia de
COMPONENTES DE LAS
SERIES TEMPORALES
IRREGULAR: Oscilaciones de una serie temporal que se atribuyen a factores
fortuitos, aleatorios y esporádicos
Serie:
Índice de Producción Industrial. Total Nacional y total industria
Método de agregación: ADITIVO
Escala de Medición de las variables
Escala
Discreta
Nominal
Escala
Continua
Ordinal
Cualitativa o categórica
10
Cuantitativa
11
Transformaciones de las Variables:
Tasas de Número
Niveles Logaritmo
crecimiento Índices
Inter-
Flujos Simple Neperiano
período
MODELOS ECONOMÉTRICOS
E INFORMACIÓN ESTADÍSTICA
La expresión formal del modelo básico de regresión lineal, que es el modelo básico en
econometría queda formulada como se expresa a continuación:
Yi = β 1 + β 2 X 2i + ... + β k X ki + ui
Donde:
Y: es la variable endógena o explicada cuyo comportamiento se quiere analizar
X: cada una de las variables exógenas o explicativas y que son consideradas como las
causas que crean transformaciones en la variable endógena.
B: son los parámetros cuyo valor desconozco y voy a estimar. A través de la
estimación de los parámetros obtengo una cuantificación de las relaciones existentes
entre la Y y cada una de las X.
U: perturbación aleatoria que recoge el efecto conjunto de otras variables no
directamente explicitadas en el modelo, cuyo efecto individual sobre la endógena no
resulta relevante.
i: es el subíndice que hace referencia a las diversas observaciones para las cuales se
establece su validez. Según el tipo de valores con los que esté trabajando, el
subíndice hará referencia a distintos momentos del tiempo (series temporales: las
cotizaciones en bolsa diarias, los índices de predio al consumo mensuales, los datos
anuales del PIB de un país, etc.) o a distintas unidades económicas (series de corte
transversal: consumo de diferentes familias, inversión de distintas empresas, paro en
diferentes provincias, etc.).
La principal utilidad que tienen los parámetros es la de cuantificar las relaciones que
existen entre las variables explicativas y la variable endógena. Así:
- El parámetro que corresponde al término constante debe ser interpretado como
el valor que toma la variable endógena cuando el resto de variables
explicativas valen cero. Por ejemplo, en una función de consumo, aunque éste
depende de la renta y de otras variables, cuando todas ellas valen cero el
individuo realiza un consumo para sobrevivir, lo que es conocido como
“autoconsumo”. Ese valor queda recogido en el modelo básico de regresión
lineal a través del parámetro que corresponde al término constante.
- El resto de parámetros que acompañan a las variables explicativas me miden
la relación entre éstas y la variable endógena a través de su signo y su cuantía.
El signo me mide si la relación entre las variables es directa o inversa (si a
medida que la explicativa incrementa también lo hace la endógena o
viceversa). La cuantía sirve para medir que variable explicativa, de todas las
explicitadas en el modelo, es más importante para explicar el comportamiento
de la endógena, de tal manera que si todas las variables están medidas en las
mismas unidades de medida, la variable más importante será la que tenga un
mayor valor de su parámetro.
Ahora bien, una vez estimado el modelo, admitimos que la estructura permanece
constante para todo el periodo de estimación. Esto es, que los parámetros son los
mismos para toda la muestra y que las relaciones permanecen constantes para todo el
periodo analizado. Es por ello, que los parámetros no van acompañados de un
subíndice en la expresión matemática del modelo básico de regresión lineal.
Sin embargo, la estructura o relaciones entre las variables pueden variar en el periodo
analizado, lo que implicaría cambios en los valores de los parámetros. Los valores de
los parámetros cambian cuando:
Las principales etapas que hay que cubrir en un modelo econométrico se pueden
resumir en las cuatro siguientes:
- Selección del tema objeto de análisis. Este puede ser del campo de la
economía, la gestión de empresas e incluso temas sociales no estrictamente
económicos.
- Selección de las variables explicativas más importantes, la cual se realiza a
través del:
o Análisis de los antecedentes económicos: a través de las teorías
económicas encuentro aquellas variables que a nivel general influyen
de una manera importantes sobre la variable endógena
o Análisis de los antecedentes econométricos: búsqueda de modelos
similares a la materia objeto de análisis en libros y revistas sobre
econometría.
o Propio conocimiento del investigador.
Y = β 0 + β1 X1 + β2 X2 + µ
Yˆ = βˆ 0 + βˆ 1 X 1 + βˆ 2 X 2
Especificación
Antecedentes económicos
Antecedentes econométricos
Conocimiento del investigador
Estimación
Validación
NO
Bondad del modelo
SI
Utilización
Análisis estructural
Predicción
Simulación
TIPOLOGÍA DE VARIABLES Y DATOS EN LA MODELIZACIÓN ECONOMÉTRICA
Se entiende por datos, los diferentes valores que toma una variable.
Los datos pueden corresponder a los valores de una variable en el tiempo (serie
temporal), o a valores para diferentes sujetos en un momento dado (datos de corte
transversal).
Por otro lado, las formas alternativas en que un modelo puede venir expresado, obliga
frecuentemente a transformaciones de los datos originales (tasas de crecimiento,
diferencias, logaritmos) o incluso a un cierto tratamiento previo de los mismos
(eliminación de tendencia, eliminación de estacionalidad, etc...)
Con la información disponible, el económetra deberá elaborar una base de datos de tal
manera que:
Ver el Caso 9 (pag. 505 y ss.) del libro de A. Pulido y A. López (1999), “Predicción y Simulación
aplicada a la economía y gestión de empresas”. Ed. Pirámide. En el mismo se presentan “algunas
relaciones macroeconómicas básicas para la economía española”: consumo privado nacional,
inversión privada, exportaciones e importaciones de bienes y servicios, pagos por intereses de las
AAPP, créditos al sector privado y tipos de interés.
Vt = a + bPRt + cPBt
siendo TPA: tasa de paro, definida como población en paro dividida por población activa.
P14: población de 14 y más años
PROD: productividad, definida como el PIB dividido por la población ocupada.
También podría haberse especificado otro modelo con PPA (población en paro) como variable
endógena:
PPAt = a 0 + a1 P14 t + a 2UCPt + U t
C i = a0 + a1 Ri + a 2 Fi + U i
siendo: Ci: el consumo del producto
Ri: el ingreso familiar
Fi: una variable ficticia que tomará el valor 1 si la familia tiene vivienda en propiedad y
0 en caso contrario.
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.
Este modelo se encuentra ya estimado (se conoce el valor de los parámetros), por lo que no
incluye el término de la perturbación aleatoria: más adelante profundizaremos más en esta
cuestión.
Cuando, como en éste y otros muchos casos, se parte de una especificación potencial, es decir,
lineal en los logaritmos de las variables, entonces los parámetros son directamente las
elasticidades: elasticidad de P respecto de L y C. En este caso, los parámetros indicarán, en
forma suficientemente aproximada para incrementos porcentuales pequeños de L o C, el
incremento porcentual correspondiente a P. Por ejemplo, en EEUU, en el período 1900-1922,
una variación porcentual de 1% en los inputs de trabajo (L) dio lugar a un incremento de la
producción total de 0,75%, mientras que incrementos de 1% en los inputs de capital C
producían un aumento de la producción en sólo 0,25%. Es decir, los incrementos en inputs de
trabajo, respecto a los de capital, producían aumentos 3 veces mayores en la producción total.
Ejemplo 5: Sea un modelo de la renta (R) en función del nivel educativo (E):
R t = β1 + β2 E t + u t
Este modelo olvida que la mayoría de la gente tiene más ingresos de mayores que cuando son
jóvenes, independientemente de su educación. Por eso, el parámetro β2 estará sobrestimando el
impacto de la educación sobre la renta. Por eso, una especificación más adecuada debería incluir
la variable edad (A) en el modelo:
R t = β1 + β2 E t + β3 A t + u t
Sin embargo, es algo contrastado que la renta tiende a crecer menos que proporcionalmente en
los últimos años de vida laboral que en los primeros. Por eso, el modelo debería especificarse:
R t = β1 + β2 E t + β3 A t + β4 A 2t + u t
En este caso, lo esperado es que β3 tenga signo positivo y que β4 sea negativo.
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.
Ejemplo 6: Una empresa comercial pretende conocer la evolución de su beneficio bruto (BEN),
teniendo en cuenta el capital invertido (SK), el número de trabajadores (L), el precio de venta
(PRE) y un índice de actividad económica (ACT). Para estimar el comportamiento de dichos
beneficios se plantea inicialmente una ecuación con la siguiente especificación:
Tras una primera estimación se llega a la conclusión que el modelo no es muy bueno debido a
que el beneficio tiene 2 elementos claramente diferenciados cuyo comportamiento debería ser
analizado por separado: ingresos (ING) y gastos (GAS), por lo que el modelo queda así:
Como puede apreciarse, hemos pasado de un modelo uniecuacional (1º) a otro modelo
multiecuacional recursivo (2º), pasando por un modelo multiecuacional bloque-recursivo (3º) y
terminando con un modelo multiecuacional de ecuaciones simultáneas (4º).
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.
⎧C t = a1 + a 2Yt −1 + U t
⎪
⎨ I t = b1 + b2 (Yt − Yt −1 ) + Vt
⎪Y = C + I + G
⎩ t t t t
La última ecuación es una identidad contable, en una economía cerrada, por lo que no se incluye
la perturbación aleatoria, dado que la relación es exacta, sin posibilidad de error.
Ejemplo 9: Sea un modelo de la serie mensual de consumo de gasolina (z), que ha sido
previamente transformada en logaritmos y en diferencias (primeras diferencias y diferencias de
orden 12) con el objetivo de eliminar de la misma todas las tendencias existentes (tendencias en
varianza y tendencias en media, en la parte regular y estacional). El modelo finalmente
especificado es el siguiente:
Ejemplo 10: Sea un modelo de la variable mensual del IPC de alimentación (p) donde esta
variable ha sido previamente transformada en logaritmos, en segundas diferencias en la parte
regular y en primeras diferencias en la parte estacional:
p t = Φ1p t −12 + a t + θa t −1
Pese a todo, la predicción en el período histórico del IPC deja todavía bastante que desear, por
lo que se prueba introduciendo en el modelo la incidencia que los precios de no alimentación (q)
tienen sobre los de alimentación. La variable IPC de no alimentación se introduce en el modelo
transformada (del mismo modo que p) para evitar la existencia de tendencias en la misma:
wi = β 0 + β 1 S i + u i
ln wi = β 0 + β 1 S i + u i
Se puede saber en qué porcentaje (en tantos por 1) se incrementa el salario-hora ante variaciones
del nivel educativo en 1 año.
Dado que la experiencia de trabajo (EX) es también una variable importante, el modelo anterior
debería considerar también esta variable. Aunque, en este caso, el impacto que valores mayores de
años de experiencia sobre el salario-hora se supone que se produce de forma menos que
proporcional:
ln wi = β 0 + β 1 S i + β 3 EX i + β 4 EX 2 + u i
Planteamiento
El comportamiento de una magnitud económica puede ser
explicada a través de otra
Y = F(X )
Si se considera que la relación puede ser de tipo lineal, la
formalización vendría determinada por una ecuación como la
siguiente
Y = β1 + β 2 X
Regresión Lineal Simple
Planteamiento
Dado que las relaciones en la ciencias sociales no son exactas se
incluye el término de pertubación aleatoria
Y = β1 + β 2 X + U
Supongamos que se dispone de T observaciones de las
variable Y y X
Y1 = β1 + β 2 X 1 + u1
Y2 = β1 + β 2 X 2 + u 2
………………………………
Yn = β1 + β 2 X n + un
Regresión Lineal Simple
Planteamiento
De forma abreviada el sistema de ecuaciones se puede escribir
de la siguiente manera
Yt = β1 + β 2 X t + U t
t = 1, 2, 3…………….,T.
Regresión Lineal Simple
Planteamiento
14 14
12 12
10 10
8 8
Y
Y
6 6
4 4
2 2
0 0
0 2 4 6 8 10 0 2 4 6 8 10
X
X
Regresión Lineal Simple
Planteamiento
Dado que la relación de dependencia entre ambas variables es
aleatoria o estocástica, las observaciones no se encontrarán a lo
largo de una recta
18
La estimación de los
16 parámetros supone
14
12 encontrar la ordenada en
10
el origen y la pendiente
Y
8
6
4
de una recta que mejor
2 se aproxime a los puntos
0
0 2 4 6 8 10
X
Regresión Lineal Simple
Planteamiento
Recta de Regresión Especificada
Yt = β 1 + β 2 X t + U t
Yˆt = βˆ1 + βˆ 2 X t
Errores o residuos
uˆ t = Yt − Yˆt = βˆ1 − βˆ 2 X t
Regresión Lineal Simple
Criterios de Ajuste
Minimizar ∑ uˆ
t =1
t
( ) =∑ (Y − βˆ − βˆ X )
n n 2
2
S =∑ Yt − Yˆt
n
∑ t =1
uˆ =
2
t t 1 2 t
t =1 t =1
∂S n
= −2∑ (Yt − βˆ1 − βˆ 2 X t ) = 0
∂βˆ1 t =1
∂S n
= −2∑ (Yt − βˆ1 − βˆ 2 X t )X t = 0
∂βˆ 2 t =1
Regresión Lineal
Cov (Y , X )
βˆ1 = Y − βˆ2 X β2 =
ˆ
var( X )
En el caso de un modelo de regresión lineal múltiple, las expresiones anteriores se transformarían del siguiente modo:
Cov (Y , X 3 ) − βˆ2Cov( X 3 , X 2 )
β3 =
ˆ
var( X 3 )
Modelo Lineal Básico
Hipótesis
Forma funcional
Sobre la perturbación Aleatoria
Sobre las variables independientes
Sobre el vector de parámetros
Modelo Lineal Básico
Hipótesis
Forma funcional
Hipótesis
Sobre la perturbación aleatoria
a) La perturbación aleatoria es una variable aleatoria no observable
Hipótesis
Sobre la perturbación aleatoria
b) Son homoscedásticas.
Hipótesis
Sobre la perturbación aleatoria
Hipótesis
Sobre las variables exógenas.
a) Los valores de las variables independientes son fijos en
muestreos repetidos.
b) No hay multicolinealidad perfecta. No hay relación perfecta entre
las variables
Sobre el vector de parámetros.
a) Las betas son valores fijos. Lo que supone estabilidad en la
estructura del fenómeno estudiado.
Modelo Lineal Básico
Hipótesis
Otras hipótesis
Expresado matricialmente:
Método de mínimos cuadrado ordinarios
(expresión matricial)
IMPORTANTE:
Método de mínimos cuadrados ordinarios
(expresión matricial)
Reagrupando y despejando el vector de los parámetros de la expresión anterior a partir de la inversa de la matriz X’X se tend ría: