0% encontró este documento útil (0 votos)
17 vistas110 páginas

Parcial 1-2-3

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
17 vistas110 páginas

Parcial 1-2-3

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 110

Fundamentos

Básicos de
Econometría

1
Tema 1.
La modelización econométrica
uniecuacional y multiecuacional

2
Qué se entiende
por econometría

3
La palabra “econometría”, significa “medición de la
economía”, definición que resulta muy general al
tomar en cuenta el alcance de esta disciplina, el cual
puede asociarse, de un modo más concreto, a las
siguientes acepciones:

 Ciencia que permite la contrastación de las


diversas teorías económicas.
Econometría
Definición  Conjunto de herramientas útiles para la
predicción de variables económicas.

 Ciencia y arte de utilizar los datos históricos


para realizar recomendaciones cuantitativas a
distintos agentes como las empresas y el
gobierno.

4
La econometría es una ciencia social a través de la cual
se intenta cuantificar las relaciones entre los agentes
económicos, apoyándose para ello en el empleo
conjunto de la estadística, las matemáticas y la teoría
económica:

Economía

Econometría
Definición
Informática Econometría Estadística

Matemática

5
Los orígenes de la econometría como disciplina
científica, éstos se ubican a principios del siglo XX

NACIMIENTO Y FORMALIZACIÓN:
1930-1950

 Creación de la Econometrics Society (1930).


 Fundación de la Cowles Comisión (1932).
Breve  Creación de la Revista Econométrica (1933).
 Puesta en marcha del Primer departamento de
historia de la economía aplicada, Universidad de Cambridge (1939).
Econometría EXTENSIÓN:
1950-1970

 Aparición de los primeros manuales (1953).


 Los años setenta supone una década de
aceptación general de los modelos econométricos
en el mundo y en especial en los EEUU.

6
CRISISY APORTACIONES RECIENTES:
1930-1950

La crisis producidas por la elevación de los precios


energéticos configuran un nuevo escenario mundial
afectando el planteamiento económico y por tanto el
econométrico. Se lanza un fuerte ataque a la
Breve econometría que derivó en:
historia de la  En el desarrollo de los modelo de variables
Econometría cualitativas: Modelos logit y probit
 La aparición de los modelos con datos de panel.
 Incorporación de relaciones dinámicas Se
desarrollan los modelos ARIMA, los modelos VAR
 Microeconometría
 Econometría espacial.

7
 Actualmente el entorno económico
se caractiza por su alta dinamicidad y
cambios permanentes.
 Ante estas circunstancias resulta
imperante realizar un seguimiento
continuo del entorno a efecto de
Importancia reducir el nivel de incertidumbre y
facilitar la toma de decisiones con el
del Análisis claro objetivo de ajustarse a tales
de Datos cambios.
 La herramienta mas adecuada para
alcanzar este objetivo es el Análisis de
Datos, dentro de los cuales se
encuentra los modelos econométricos.
El modelo econométrico es una representación
simplificada de la relación que existe entre dos
o más variables, que se utiliza para analizar
sistemas reales concretos. Tiene que basarse en
sistemas económicos más o menos generales y
completarse con aspectos particulares propios
del sistema de estudio. Por tanto las
conclusiones de su aplicación es de ámbito
reducido (espacial y temporal) y no generable
a todos los sistemas.
Fases de elaboración de un Modelo
Econométrico

• Especificación
Fase 1

Fase 2
• Estimación

• Validación
Fase 3

• Utilización
Fase 4
Fase 1
• Especificación

1. Determinación del tema objeto de estudio

2. Definición de variables explicativas más importantes


1. Análisis de los antecedentes económicos
2. Análisis de los antecedentes econométricos

3. Búsqueda de la información
1. Recopilar e integrar las fuentes de información
estadística
2. Identificar y seleccionar las variables relevantes
3. Aplicar las técnicas adecuadas de muestreo
Fase 1
• Especificación

4. Homogenización y tratamiento previo de los datos


1. Imputar datos faltantes
2. Cambios de frecuencia en series temporales
3. Enlace de series por cambios metodológicos

5. Exploración de los datos

6. Transformación básicas de la series


• Tasas de crecimiento
• En logaritmo

7. Determinación de la forma funcional


Hay que dar respuesta a todas estas
interrogantes

 ¿Cuál es el objetivo de análisis?


 ¿Qué datos obtener?
 ¿Cómo y dónde y con qué frecuencia?
 ¿Qué formato? ¿Cómo y con qué aplicación?
 ¿Cómo se procesa, depuran y utilizan para el análisis? ¿Dónde se
almacenan?

13
• Especificación: Búsqueda de la fuente
Fase 1 de información

Fuente de Información Fuente de Información


PRIMARIA: Se obtiene a SECUNDARIA: La
partir de una información está
investigación como la elaborada y se encuentra
aplicación de encuestas. disponible
INTERNACIONAL
• Fondo Monetario:Público:

Fuente de NACIONAL
información • INE y Banco de España
secundaria
• Estimación
Fase 2

Consiste en el cálculo de los parámetros del modelo especificado:

𝑌𝑡 = 𝛽1 + 𝛽2 𝑋2𝑡 +𝛽3 𝑋3𝑡 + ⋯ 𝛽𝑘 𝑋𝑘𝑡 + 𝑈𝑡


Modelo estimado:

𝑌෡𝑡 = 𝛽መ1 + 𝛽መ2 𝑋2 +𝛽መ3 𝑋3 + ⋯ 𝛽መ𝑘 𝑋𝑘

𝑒ෝ𝑡 = 𝑌𝑡 − 𝑌෡𝑡
• Estimación
Fase 2

𝑌𝑡 = 𝛽1 + 𝛽2 𝑋2𝑡 +𝛽3 𝑋3𝑡 + ⋯ 𝛽𝑘 𝑋𝑘𝑡 + 𝑈𝑡


Donde:
Y: es la variable endógena o explicada cuyo comportamiento se quiere analizar
X: cada una de las variables exógenas o explicativas y que son consideradas como las
causas de los cambios en la variable endógena.
: son los parámetros cuyos valores son desconozco. A través de su estimación se obtiene
una cuantificación de las relaciones existentes entre laY y cada una de las X.
U: perturbación aleatoria que recoge el efecto conjunto de otras variables no
directamente explicitadas en el modelo, cuyo efecto individual sobre la endógena no
resulta relevante
• Validación
Fase 3

Se analiza la bondad del modelo estimado:


1. Validación a priori
Si el resultado 1. Individual
de la 1. Signo y significatividad de cada uno de los
evaluación no parámetros
es óptima se 2. Conjunta
deberá re- 1. Coeficiente de determinación
espeficar el 2. Constraste F
3. Medidas sobre los errores
modelo
4. Análisis de predicción realización
2. Validación a posteriori
1. Evaluación de incumplimiento de hipótesis básicas
• Utilización
Fase 4

1. Análisis Estructural lo cual permite


cuantificar las relaciones entre los
agentes económicos

2. Predecir. Anticipar los valores futuros


de las variables económicas

3. Simulación: Determinar los efectos que


sobre la variable Y tendrían las distintas
estrategias en X
ANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN

En términos generales, el análisis de Regresión trata sobre


el estudio de la dependencia de un fenómeno económico
respecto de una o varias variables explicativas, con el
objetivo de explorar o cuantificar la media o valor promedio
poblacional de la primera a partir de un conjunto de valores
conocidos o fijos de la/s segunda/s.
ANÁLISIS DE REGRESIÓN

V = Media poblacional

V
Estatura

10 11 12 13 14

Edad en Años
ANÁLISIS DE REGRESIÓN
REGRESIÓN CORRELACIÓN

 Estudiar y predecir el valor  El objetivo es medir el


promedio de una variable grado de asociación
sobre la base de valores lineal entre dos
fijos de otras variables. variables.
 Existe una asimetría en el
 El tratamiento de las
tratamiento que se les da a
variables es simétrico:
las variables.
 No se distinguen entre
 La variable dependiente es variable dependiente y
aleatoria o estocástica: su variable explicativa.
valor depende de una
 Se asume que las dos
distribución de probabilidades.
variables son simétricas.
 Las variables independientes
tienes valores fijos en
muestras repetidas.
ANÁLISIS DE REGRESIÓN
 La forma más intuitiva de formarse una primera
impresión sobre el tipo de relación que existe entre dos
variables es a través del Diagrama de Dispersión.

Un diagrama de dispersión es un gráfico en el que una de las variables (Xi)


se coloca en el eje de las abscisas y la otra (Yi) en el eje de las ordenadas y
los pares de puntuaciones de cada sujeto (xi,yi) se representan como una
nube de puntos.
ANÁLISIS DE REGRESIÓN
CORRELACIÓN POSITIVA CORRELACIÓN NEGATIVA
25 25

20 20

Variable Y
Variable Y

15 15

10 10

5 5

0 0
0 5 10 15 20 25 -25 -20 -15 -10 -5 0
Variable X Variable X

CORRELACIÓN NO LINEAL AUSENCIA DE CORRELACIÓN


500 30

400 25
20
Variab le Y
Variab le Y

300
15
200
10
100 5
0 0
0 5 10 15 20 25 0 20 40 60 80
Variable X Variable X
ANÁLISIS DE REGRESIÓN

INGRESO FAMIILIAR

80 100 120 140 160 180 200 220 240 260


Gasto de 55 65 79 80 102 110 120 135 137 150
Consumo
Familiar 60 70 84 93 107 115 136 137 145 152
Semanal
65 74 90 95 110 120 140 140 155 175

70 80 94 103 116 130 144 152 165 178

75 85 98 108 118 135 145 157 175 180

88 113 125 140 160 189 185

115 162 191

TOTAL 325 462 445 707 678 750 685 1043 966 1211

Medias
Condiciona 65 77 89 101 113 125 137 149 161 173
les
ANÁLISIS DE REGRESIÓN

200
Gasto d el C o n su m o F in al

160

120

80

40
50 75 100 125 150 175 200 225 250 275
Ingreso Semanal
ANÁLISIS DE REGRESIÓN
FUNCIÓN DE REGRESIÓN POBLACIONAL :
Curva que conecta las medias de las subpoblaciones de la variable dependiente
que corresponden a los valores dados por la variable independiente.
Gasto Semanal
Y V = Media Condicional
E (Y / X i ) = f ( X i )

149 V

101 V
65
V

Xi
80 140 220
Ingreso Semanal
ANÁLISIS DE REGRESIÓN

 Población (Universo): un conjunto total de


elementos que poseen una o más características
en común.
 Hace referencia al conjunto total de elementos
que se desea estudiar.
 Pueden ser finitas, formadas por un número
finitos de elementos, o infinitas donde el
número de elementos es infinitos.

Dado que es imposible describir con exactitud todas las características


de una población infinita o conformada por un gran número de
elementos, lo habitual es trabajar con muestras.
ANÁLISIS DE REGRESIÓN

 Muestra Es un subconjunto de la población.


 Suelen ser conjuntos de elementos de
tamaño reducido.
 La información que contiene permite extraer
conclusiones sobre las propiedades de la
población, siempre que los elementos que
conformen la muestra sean representativos
de la población.
ANÁLISIS DE REGRESIÓN

FUNCIÓN DE REGRESIÓN MUESTRAL :


Son aproximaciones de la función de regresión poblacional. Las diferencias
con respecto a esta última son ocasionadas por las fluctuaciones
muestrales. Por lo que se tendrían N FRMs para N muestras diferentes y
tales FRMs no necesariamente coinciden.

OBJETIVO PRINCIPAL :
Del análisis de regresión es por tanto estimar la función de regresión
poblacional (FRP) a partir de la función de regresión muestral (FRM).
FUNCIÓN DE REGRESIÓN MUESTRAL

200

150

100

50

0
0 50 100 150 200 250 300

Serie1
FUNCIÓN DE REGRESIÓN MUESTRAL

200

150

100

50

0
0 50 100 150 200 250 300

Serie2
FUNCIÓN DE REGRESIÓN MUESTRAL

200

150

100

50

0
80 100 120 140 160 180 200 220 240 260

FRM1 FRM2
ANÁLISIS DE REGRESIÓN

FUNCIÓN DE REGRESIÓN MUESTRAL :

Yi = βˆ1 + βˆ2 Xi + uˆi

FUNCIÓN DE REGRESIÓN POBLACIONAL :

Yi = β1 + β 2 X i + ui
Fundamentos de Econometría

TEMA 1.-
PROPÓSITO DEL ANÁLISIS ECONOMÉTRIC O
CORRELACIÓN SIMPLE VERSUS PARCI AL
Correlación:
Medida del grado de relación lineal entre dos o mas variables

Correlación Simple Correlación Parcial

 Mide la correlación entre dos  Mide la correlación entre dos


variables (Y,X1) controlando el
variables (Y,X1): efecto que otra u otras variables
Correlación de PEARSON (X2, X3,……Xk) tienen sobre dicha
relación.
ത /𝑛
σ(𝑥2𝑖 − 𝑋2𝑖 )(𝑦𝑖 − 𝑌) 𝑟𝑦𝑥2 − 𝑟𝑦𝑥3 ∗ 𝑟𝑥2𝑥3
𝑟𝑦𝑥2 = 𝑟𝑦𝑥2..𝑥3 =
𝑉𝑎𝑟(𝑥2𝑖 ) ∗ 𝑉𝑎𝑟(𝑌𝑖 ) 2 2
(1 − 𝑟𝑦𝑥3 )(1 − 𝑟𝑥2𝑥3 )
 Es muy útil cuando entre variables
En el numerador se tiene la no se manifiestan las verdaderas
covarianza entre X e Y y en el correlaciones a causa del efecto
denominador la raíz cuadrada de la que sobre éstas ejerce una tercera
variable
varianza de X y de Y
 El coeficiente de correlación lineal de Pearson está
pensado exclusivamente para variables cuantitativas y
constituye una medida adimensional que mide el
grado de covariación entre variables relacionadas
de Correlación Simple

linealmente. Cabe destacar, pueden existir variables


fuertemente relacionadas, pero no de forma lineal, en
cuyo caso no procede aplicar este coeficiente.
 Hay tres elementos básicos a tener en cuenta al
analizar una correlación: signo, magnitud y la
significación estadística.
Coeficiente

 El valor del coeficiente de correlación de Pearson


oscila en términos absolutos entre 0 y 1. La magnitud
de la relación viene especificada por el valor numérico
del coeficiente, reflejando el signo la dirección de tal
valor.
Por lo que tan fuerte es una relación de +1 como de -1. En
el primer caso la relación es perfecta positiva y en el
segundo perfecta negativa, este hecho sólo suele darse
en las ciencias físicas. No obstante en los fenómenos
de Correlación Simple

sociales, cargados fuertemente de componentes


aleatorios no suele ser posible establecer relaciones
funcionales exactas.
En términos generales se puede afirmar que el grado de
asociación lineal se puede establecer atendiendo a la
magnitud del coeficiente:
Coeficiente

 Si |  | < 0,3 la asociación es débil


 Si 0,30 |  | 0,70 la asociación es moderada
 Si |  | > 0,70 la asociación es fuerte
Correlación Simple
Ejemplo Numérico
Correlación Simple
Ejemplo Numérico
Correlación Simple
Ejemplo Numérico
 Tras calcular el coeficiente de correlación interesa
determinar si tal valor obtenido muestra que las
variables X e Y están relacionadas en realidad, o tan
sólo presenta dicha relación como consecuencia del
de Correlación Simple

azar, lo que implica preguntarse sobre la significación


estadística de dicho coeficiente de correlación.
 Un coeficiente de correlación se dice que es
significativo (en términos estadísticos) si se puede
afirmar con cierta probabilidad, que es diferente de
cero. Lo que implica preguntarse por la probabilidad
Coeficiente

de que tal coeficiente proceda de una población cuyo


valor sea cero.

𝐻0 = 𝜌𝑥𝑦 = 0 → El coeficiente de correlación obtenido procede de


una población cuya correlación es cero (𝜌 = 0)
𝐻1 = 𝜌𝑥𝑦 ≠ 0 → El coeficiente de correlación obtenido procede de
una población cuyo coeficiente de correlación es distinto de cero
(𝜌 ≠ 0)

Por lo que dado un coeficiente de correlación 𝜌𝑥𝑦


de Correlación Simple

obtenido en una determinada muestra procedente de


una población caracterizada por una correlación igual a
cero sigue una función de distribución T de Student con
N-2 grados de libertad de media el valor de la población y
desviación típica igual a:
Coeficiente

2
1−𝜌𝑥𝑦
𝜎𝜌 =
𝑁−2
lo que implica obtener el siguiente estadístico muestral a
contrastar es
𝜌𝑥𝑦 − 0
𝑡 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 =
2
1 − 𝜌𝑥𝑦
𝑁−2
de Correlación Simple

Y posteriormente compararlo con el existente en las


tablas de la t-estuden, para un determinado 𝛼 nivel de
significatividad estadística y N-2 grados de libertad.
𝜌𝑥𝑦 −0 𝜖/2
Si > 𝑡𝑛−𝑘 Se rechaza H0. Las variables están relacionadas
𝜎𝜌
Coeficiente

La correlación obtenida no procede de una población cuyo 𝜌𝑥𝑦 = 0

𝜌𝑥𝑦 −0 𝜖/2
Si ≤ 𝑡𝑛−𝑘 Se acepta H0. Las variables no están relacionadas
𝜎𝜌
La correlación obtenida procede de una población cuyo 𝜌𝑥𝑦 = 0
Ejemplo: Determinar la significatividad estadística del
coeficiente de correlación simple entre la variable ventas
(y) y la variable publicidad (X)

0,8675−0 0,8675
𝑡 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 =
de Correlación Simple

= = 3,020
1−(0,86752 ) 0,2872
5−2

Al compararlo con el valor de la t-estuden de las tablas


para 95% de confianza y 3 grados de libertad se obtuvo
que .
Coeficiente

3,020 ≤ 3,182 y por tanto se acepta H0, lo que implica que


las variables no están relacionadas
o lo que es lo mismo la correlación obtenida procede de una población
cuyo 𝜌𝑥𝑦 = 0
 Es muy útil cuando entre las variables no se manifiesta
las verdaderas correlaciones como consecuencia de
que una tercera variable influye (opaca) en la
correlación inicialmente estimadas entre las dos
de Correlación Parcial

primeras.
 Las variables que se introducen para controlar la
relación originaria se les denomina variables de
control
 Si se analiza sólo el efecto de una tercera variable el
Coeficiente

coeficiente recibe el nombre de correlación parcial de


orden 1, si se incorporan dos variables control,
entonces el coeficiente calculado se denomina
Correlación Parcial de orden 2
 En el cálculo a la correlación simple se le descuenta
algebraicamente la correlación entre las dos variables
explicativas (X2 y X3) y la correlación que tiene la variable
control sobre la Y. En el primer caso, se analiza qué tan
independientes son X2 y X3 y en segundo caso se estima
la relevancia de la variable control sobre el fenómeno
de Correlación Parcial

estudiado.
 El coeficiente de correlación parcial de orden 1 podrá ser
menor, igual o superior al coeficiente de correlación
simple.
 La correlación parcial será igual a la correlación siempre
Coeficiente

que:
 Las variables explicativas (X2 y X3) sean
independientes, o
 Si la variable control (X3) no es estadísticamente
relevante para explicar Y
Matriz de varianzas y
covarianzas
Matriz de correlaciones
Ecuación:

𝑟𝑦𝑥2 − 𝑟𝑦𝑥3 ∗ 𝑟𝑥2𝑥3


Calculo del coeficiente de

𝑟𝑦𝑥2..𝑥3 =
2 2
(1 − 𝑟𝑦𝑥3 )(1 − 𝑟𝑥2𝑥3 )

Estimación:
Correlación Parcial

0,87−( −0,98 ∗ −0,85 )


𝑟𝑦𝑥2..𝑥3 = =0,31
(1−(−0,98)2 )(1−(−0,85)2 )
A modo de repaso:
Contrastación de hipótesis

La contrastación de hipótesis es un proceso fundamental en el análisis


estadístico que permite tomar decisiones basadas en datos muestrales.
A través de la contrastación de hipótesis, los investigadores evalúan si
hay suficiente evidencia en los datos para aceptar o rechazar una
suposición (hipótesis) sobre una población.
Es una herramienta clave en casi todas las disciplinas científicas, desde
la medicina hasta las ciencias sociales, para evaluar la validez de los
resultados y teorías.
En suma:
➔ Permite a los investigadores y analistas tomar decisiones
objetivas basadas en evidencia estadística, en lugar de conjeturas
o suposiciones subjetivas.
➔ Ayuda a validar o refutar suposiciones sobre la población, como
el valor de un estadístico (por ejemplo: análisis sobre la media de
una variable), diferencias entre grupos, relaciones entre variables
o cambios de éstas a lo largo del tiempo, etc.
Los tipos de contraste de hipótesis según la hipótesis alternativa se
dividen en dos categorías principales: pruebas de una cola y pruebas
de dos colas. Estos contrastes dependen de la formulación de la
hipótesis alternativa y la dirección del efecto que se desea detectar.
1. Contraste de hipótesis de una cola:
En este tipo de contraste, la hipótesis alternativa establece que el efecto
o diferencia está en una dirección específica, ya sea mayor o menor que
un valor de referencia.
• Prueba de una cola por la derecha:
Esta prueba se utiliza cuando se espera que el efecto sea mayor que un
valor de referencia.
Ejemplo: Queremos comprobar si un nuevo método de enseñanza
mejora significativamente las calificaciones, es decir, esperamos que las
calificaciones con el nuevo método sean mayores.
Se establece las hipótesis de la siguiente manera:
o Hipótesis nula (H₀): La media o parámetro de referencia es
menor o igual a un valor específico (μ ≤ μ₀).
o Hipótesis alternativa (H₁): La media o parámetro de
referencia es mayor que un valor específico (μ > μ₀).
• Prueba de una cola por la izquierda:
Esta prueba se usa cuando se espera que el efecto sea menor que un
valor de referencia.
Ejemplo: Comprobamos si la nueva máquina de producción produce
menos defectos por hora que la anterior, es decir, esperamos que el
número de defectos sea menor.
Se establece las hipótesis de la siguiente manera:
o Hipótesis nula (H₀): La media o parámetro es mayor o igual
a un valor específico (μ ≥ μ₀).
o Hipótesis alternativa (H₁): La media o parámetro es menor
que un valor específico (μ < μ₀).
2. Contraste de hipótesis de dos colas:
Se utiliza cuando queremos detectar cualquier diferencia, ya sea por
encima o por debajo del valor de referencia.
Ejemplo: Queremos saber si el rendimiento de un nuevo fertilizante es
diferente al del fertilizante estándar, pero no tenemos un interés
específico en saber si es mejor o peor, solo si hay diferencia.
En este contraste, la hipótesis alternativa no especifica una dirección
concreta, sino que busca detectar cualquier diferencia significativa, ya
sea mayor o menor.
• Hipótesis nula (H₀): La media o parámetro es igual a un valor
específico (μ = μ₀).
• Hipótesis alternativa (H₁): La media o parámetro es diferente a un
valor específico (μ ≠ μ₀).
Pasos para llevar a cabo la Contrastación de Hipótesis debe tomarse en
cuenta los siguientes pasos:
1. Formulación de la Hipótesis:
o Hipótesis Nula (H₀): Es la suposición inicial que se somete a
prueba (enmarcadas en las tipologías mencionadas
anteriormente), y se asume que es cierta hasta que se
demuestre lo contrario.
o Hipótesis Alternativa (H₁): Es la afirmación opuesta a la
hipótesis nula, que indica la existencia de un efecto,
diferencia o relación.
2. Seleccionar el nivel de Significatividad (α):
o Es el umbral que determina el riesgo de cometer un error
de Tipo I (rechazar una hipótesis nula verdadera). Los
niveles de significatividad común son α = 0.1, α = 0.05 y
α = 0.001, lo que implica un 10%, un 5% y 1% de
probabilidad de cometer este error.
3. Elegir el Estadístico de prueba o muestral
o Dependiendo del tipo de datos y del contraste específico,
se selecciona un estadístico de prueba apropiado (como la
t de Student, chi-cuadrado, F de Fisher, etc.). Este
estadístico se calcula a partir de los datos muestrales y
ayuda a evaluar la hipótesis.
4. Regla de Decisión:
o Comparar el valor del estadístico muestral con el
procedente de las tablas correspondientes, según el nivel
de significatividad elegido.

Dependiendo de la formulación de la hipótesis alternativa se


tomará en cuenta los siguientes criterios:
o Comparar el valor del error tipo 1 (valor p) obtenido a través
de los distintos programas informáticos con el nivel de
significatividad estadística establecido al principio de la
investigación.
1. Si valor p ≤ α, se rechaza H₀.
2. Si valor p > α, no se rechaza H₀.

5. Conclusión e Interpretación y la toma respectiva de la decisión


correspondiente.
Tratamiento y medición de
la información estadística

Sofía García Gámez


Departamento de Economía Aplicada. UAM
[email protected]

FUNDAMENTOS BASICOS DE ECONOMETRÍA


Doble Grado en Derecho y Administración de
Empresas
1
¿Qué es una Serie de Datos?
Entenderemos por serie de datos cualquier conjunto de datos
relativos a una misma variable.

2
La definición de las variables: depende de la
dimensión Espacio-Tiempo

Temporal Transversal

Series Series de Corte


temporales transversal
Series Temporales o Series de corte
Serie Histórica transversal

Se denomina así cuando Corresponden a datos


datos se refieren a la que se refieran al
evolución de una o mas comportamiento de una
Tipos de variables a lo largo del variable para diferentes
datos en tiempo. individuos, unidades
económicas o lugares o
Tiempo y Las frecuencia que se espacio geográficos.
Espacio observan en mayor
medida son: Ejemplos:
• Anual, Datos referidos a países,
• Trimestral, comunidades
• Mensual, autónomas, municipios,
• Semanal y para un solo momento
• Diaria del tiempo

4
200000

0
250000

50000
100000
150000
2000T1
2000T3
2001T1
2001T3
2002T1
2002T3
2003T1
2003T3
2004T1
2004T3
2005T1
2005T3
2006T1
2006T3
2007T1
2007T3
2008T1
España

2008T3
2009T1
2009T3
VAB del Sector Servicios

2010T1
2010T3
2011T1
2011T3
2012T1
2012T3
2013T1
2013T3
2014T1
2014T3
2015T1
2015T3
2016T1
SERIES TEMPORALES

2016T3
2017T1
COMPONENTES DE LAS

2017T3
2018T1
2018T3
2019T1
TENDENCIA: Patrón de evolución sostenido a medio y largo plazo de la serie
COMPONENTES DE LAS
SERIES TEMPORALES
ESTACIONALIDAD: Oscilaciones de una serie temporal que se completa
dentro de un año y se repiten mas o menos de forma invariable en los años
sucesivos.
Índice de Producción Industrial
15000

0
20000
30000

10000
25000

5000
35000
2000T1
2000T3
2001T1
una serie temporal
2001T3
2002T1
2002T3
2003T1
2003T3
2004T1
2004T3
2005T1
2005T3
2006T1
2006T3
2007T1
2007T3
2008T1
2008T3
2009T1
2009T3
2010T1
2010T3
2011T1
2011T3
2012T1
VAB de la Construcción

2012T3
2013T1
2013T3
2014T1
2014T3
2015T1
2015T3
2016T1
SERIES TEMPORALES

2016T3
COMPONENTES DE LAS

2017T1
2017T3
2018T1
2018T3
2019T1
CICLO: Movimiento oscilatorio por encima y por debajo de la tendencia de
COMPONENTES DE LAS
SERIES TEMPORALES
IRREGULAR: Oscilaciones de una serie temporal que se atribuyen a factores
fortuitos, aleatorios y esporádicos
Serie:
Índice de Producción Industrial. Total Nacional y total industria
Método de agregación: ADITIVO
Escala de Medición de las variables

Escala cualitativa Escala


o categóricas Cuantitativa

Escala
Discreta
Nominal

Escala
Continua
Ordinal
Cualitativa o categórica

Nominal: Identifica la pertenencia de un elemento a un


determinado grupo o a otro (clasificación mutuamente
excluyente). Como puede ser:
Variables • Sexo (Hombre/Mujer)
• Medio de transporte para ir al trabajo
según la (Autobús/Metro/Coche/Moto)
escala de • Estado civil (Soltero/Casado/Viudo/Divorciado)
medida Ordinal: Los números asignados sirven para establecer un
orden entre personas u objetos:
• Nivel de estudios (Primaria/Secundaria/Terciaria) o
• Nivel de renta (Alto/Medio/Bajo)
• Nivel de satisfacción con el uso de un producto
determinado (Nada satisfecho, Satisfecho, Muy
satisfecho).

10
Cuantitativa

Discreta: Solo puede tomar un número finito de valores en


un intervalo.
Entre estas se pueden destacar.
• La edad
Variables • Tamaño de la Población
según la • La temperatura
escala de Continua o de intervalo: Puede tomar infinitos valores en
medida un intervalo. Lo permite establecer razones (divisiones)
entre variable los cual posibilidad determinar el número de
veces que una personas u objetos en mayor, igual, o menor
entre si. Ejemplos:
• Peso
• Altura
• Precios
• Renta

11
Transformaciones de las Variables:

Tasas de Número
Niveles Logaritmo
crecimiento Índices

Inter-
Flujos Simple Neperiano
período

Stocks Inter-anual Compuesto


Cuantifica el cambio Transformación de las Variables:
en el valor de una
variable a lo largo del
tiempo, expresando
dicho cambio como Tasas de
un porcentaje del
valor inicial. Puede
crecimiento
ser positiva o
negativa,
dependiendo de si la
Inter-
variable aumenta o período
disminuye a lo largo
del período. Se
utiliza para medir,
evaluar y planificar el Inter-anual
crecimiento en una
variedad de
contextos, desde los
negocios hasta la
economía en
general.
Transformación de las Variables:

Permite analizar la senda evolutiva de una


Número Índices magnitud respecto de un período o una unidad
económica conocida como base

Analiza la senda evolutiva de una única


Simples magnitud

Analiza la senda evolutiva de una única


Compuestos un conjunto de magnitudes
simultáneamente
Transformación de las Variables:

En el campo de la econometría aplicar


logaritmo s permite :
Logaritmos
• La linealización de modelos
originalmente especificados en
términos multiplicativos,

Corresponde • El tratamiento de problemas simples


al exponente al cual hay de heterocedasticidad
que elevar una base
determinada para obtener • Para aproximar al concepto de
dicho número “elasticidad” a partir de los parámetros
estimados de una regresión
INTRODUCCIÓN A LA ECONOMETRÍA E INFORMÁTICA

MODELOS ECONOMÉTRICOS
E INFORMACIÓN ESTADÍSTICA

Eva Medina Moral


(Febrero 2002)

EXPRESIÓN DEL MODELO BASICO DE REGRESIÓN LINEAL

La expresión formal del modelo básico de regresión lineal, que es el modelo básico en
econometría queda formulada como se expresa a continuación:

Yi = β 1 + β 2 X 2i + ... + β k X ki + ui

Donde:
Y: es la variable endógena o explicada cuyo comportamiento se quiere analizar
X: cada una de las variables exógenas o explicativas y que son consideradas como las
causas que crean transformaciones en la variable endógena.
B: son los parámetros cuyo valor desconozco y voy a estimar. A través de la
estimación de los parámetros obtengo una cuantificación de las relaciones existentes
entre la Y y cada una de las X.
U: perturbación aleatoria que recoge el efecto conjunto de otras variables no
directamente explicitadas en el modelo, cuyo efecto individual sobre la endógena no
resulta relevante.
i: es el subíndice que hace referencia a las diversas observaciones para las cuales se
establece su validez. Según el tipo de valores con los que esté trabajando, el
subíndice hará referencia a distintos momentos del tiempo (series temporales: las
cotizaciones en bolsa diarias, los índices de predio al consumo mensuales, los datos
anuales del PIB de un país, etc.) o a distintas unidades económicas (series de corte
transversal: consumo de diferentes familias, inversión de distintas empresas, paro en
diferentes provincias, etc.).

IMPORTANCIA DE LOS PARÁMETROS EN EL MODELO BÁSICO DE REGRESIÓN


LINEAL

La principal utilidad que tienen los parámetros es la de cuantificar las relaciones que
existen entre las variables explicativas y la variable endógena. Así:
- El parámetro que corresponde al término constante debe ser interpretado como
el valor que toma la variable endógena cuando el resto de variables
explicativas valen cero. Por ejemplo, en una función de consumo, aunque éste
depende de la renta y de otras variables, cuando todas ellas valen cero el
individuo realiza un consumo para sobrevivir, lo que es conocido como
“autoconsumo”. Ese valor queda recogido en el modelo básico de regresión
lineal a través del parámetro que corresponde al término constante.
- El resto de parámetros que acompañan a las variables explicativas me miden
la relación entre éstas y la variable endógena a través de su signo y su cuantía.
El signo me mide si la relación entre las variables es directa o inversa (si a
medida que la explicativa incrementa también lo hace la endógena o
viceversa). La cuantía sirve para medir que variable explicativa, de todas las
explicitadas en el modelo, es más importante para explicar el comportamiento
de la endógena, de tal manera que si todas las variables están medidas en las
mismas unidades de medida, la variable más importante será la que tenga un
mayor valor de su parámetro.

Por tanto, el análisis de los parámetros estimados me permite conocer la estructura


económica del fenómeno que estamos analizando, entendiendo por estructura el
patrón de comportamiento de acuerdo con el cual se desarrolla una acción. De este
modo, en un modelo en el que trato de explicar la evolución del consumo en función
de la renta y de los tipos de interés, la estructura económica quedará definida como
incrementos de consumo a medida que incrementa la renta y reducciones de consumo
a medida que incrementan los tipos de interés.

Ahora bien, una vez estimado el modelo, admitimos que la estructura permanece
constante para todo el periodo de estimación. Esto es, que los parámetros son los
mismos para toda la muestra y que las relaciones permanecen constantes para todo el
periodo analizado. Es por ello, que los parámetros no van acompañados de un
subíndice en la expresión matemática del modelo básico de regresión lineal.

Sin embargo, la estructura o relaciones entre las variables pueden variar en el periodo
analizado, lo que implicaría cambios en los valores de los parámetros. Los valores de
los parámetros cambian cuando:

- Se incorpora una nueva variable al modelo. Ya que como en economía todo


está relacionado entre sí, la inclusión de una nueva variable explicativa
modifica las relaciones existentes entre las variables explicativas, y por tanto
las relaciones existentes entre éstas y la variable endógena. Así, si dos
variables explicativas están muy relacionadas entre sí, estarán explicando lo
mismo del comportamiento de la endógena y al incluirlas juntas en el modelo
su aportación a la evolución de la endógena se repartirá, mientras que si sólo
incorporásemos una de ellas toda ella acumularía el peso importante en el
análisis de la endógena por lo que el valor de su parámetro sería superior que
en el caso anterior.
- Se modifica el periodo muestral. Ya que la inclusión de nuevos años en el
análisis implica incluir también nuevos factores explicativos de la variable
endógena o una modificación en los pesos en que las variables explicativas
participan en el comportamiento de la endógena.

El supuesto de constancia en el parámetro estimado conduce a errores en


determinadas ocasiones. Esto ocurre cuando se produce un cambio estructural en el
sistema económico a analizar. Así, en un mismo periodo se puede haber producido un
cambio económico importante que implique una modificación radical de las relaciones
existentes entre las variables. Por ejemplo: la entrada de España en la Unión Europea
implica que el peso de las exportaciones en el crecimiento del PIB es mayor que
durante los años anteriores a la inclusión en la UE, lo que modificaría las cuantías de
los parámetros; países que han cambiado de un sistema económico socialista a uno
capitalista implica un cambio radical en las relaciones económicas (antes tenía más
peso el sector público y ahora las relaciones de libre mercado); el cambio que se
produce en los hábitos de consumo con el trascurso de los años; la aparición de las
tarjetas como medio de pago supone un cambio también en los hábitos de consumo.

UTILIDADES DE LOS MODELOS ECONOMÉTRICOS

El modelo econométrico tiene tres utilidades principales:

- Análisis estructural: cuantificación de las relaciones que entre el periodo


analizado ha existido entre las variables implicadas, a través del conocimiento
del signo y valor de los parámetros estimados. Es decir, sirve para conocer
como incide en la endógena variaciones de las variables explicativas.
- Predicción: Dados unos valores a futuro para las variables explicativas, y
conociendo la expresión matemática que relaciona las variables explicativas y
la variable endógena, es posible predecir los valores que tomará a futuro la
variable objeto de estudio.
- Simulación o evaluación de políticas: Efectos que tienen sobre la endógena
diferentes estrategias que se planteen de las variables explicativas. Por
ejemplo si analizamos las ventas de una empresa en función de los precios del
producto y del nivel de gasto realizado en publicidad, podríamos estar
interesados en analizar cuanto incrementarían las unidades vendidas si se
mantienen los precios fijos y se incrementa el gasto en publicidad en un
porcentaje determinado.

En general, el modelo econométrico es una herramienta de análisis que ayuda en la


toma de decisiones tanto a nivel económico en general (macro) como en el ámbito de
la dirección de empresas (micro).
CLASIFICACIÓN DE LOS MODELOS ECONOMÉTRICOS

Existe una tipología de modelos econométricos en función de distintas clasificaciones:

Según el tipo de datos de las variables utilizadas en el modelo:

- Series temporales: los datos pueden corresponder a los valores de una


variable en el tiempo. Estos pueden tener frecuencia, diaria, semanal, mensual
o anual. Así podemos analizar las cotizaciones en bolsa diarias, los índices de
predio al consumo mensuales, los datos anuales del PIB de un país, etc.
- Series de corte transversal: los valores corresponden a distintos sujetos para
un mismo momento del tiempo. En este caso se trataría de series del tipo de
consumo de diferentes familias, inversión de distintas empresas, paro en
diferentes provincias, etc.

Según el momento del tiempo al que hacen referencia se distingue entre:

- Modelos estáticos: cuando el subíndice i hace referencia al mismo momento


del tiempo o al mismo individuo económico tanto para la endógena como para
todas las explicativas.
- Modelos dinámicos: cuando están involucradas las variables en diferentes
puntos del tiempo. Así si estoy analizando la variable endógena consumo,
utilizaré como variable explicativa la renta de ese mismo periodo, pero también
podría utilizar la renta del año pasado, ya que mis decisiones de compra las
tomaré en función de lo que pude ahorrar el año pasado. Al incluir variables en
distintos momentos del tiempo podemos hablar de modelos dinámicos.

Según el número de variables endógenas que se desee explicar:

- Modelos uniecuaciones: únicamente existe una variable endógena.


- Modelos multiecuacionales: existen varias variables endógenas que deseamos
explicar, algunas de las cuales pueden ser a su vez variables explicativas de
otras ecuaciones.

Según la transformación de los datos que se realice:

- Modelo en niveles: las variables aparecen expresadas en unidades de medida.


- Modelo en tasas de variación: las variables aparecen expresadas como
incrementos. Cuando una variable la expreso en vez de en niveles en
incrementos estoy eliminando la tendencia. Al introducir las variables en niveles
puedo encontrar un mayor número de variables explicativas aparentemente
correctas, ya que es más fácil encontrar variables explicativas que tengan la
misma tendencia que la endógena. Pero eso no significa que esas variables
sean las que realmente son causas explicativas de los cambios de la
endógena. Por ello, al eliminar la tendencia de las variables exijo más al
modelo, es decir, tengo en cuenta las variables que son realmente “causa”.
- Modelo en logaritmos. El modelo básico de regresión lineal permite únicamente
trabajar con relaciones lineales. Pero no todas las variables tienen porque estar
expresadas a través de una relación lineal. Cuando estimo un modelo
unicamente con una variable endógena y una explicativa lo que trato es de
encontrar la línea que mejor me recoja la información suministrada por ambas
variables.

FASES PARA LA ELABORACIÓN DE UN MODELO ECONOMÉTRICO

Las principales etapas que hay que cubrir en un modelo econométrico se pueden
resumir en las cuatro siguientes:

Especificación: Esta etapa comprende tanto la determinación del tema objeto de


análisis como la definición de las variables explicativas que se incluirán en el modelo.

- Selección del tema objeto de análisis. Este puede ser del campo de la
economía, la gestión de empresas e incluso temas sociales no estrictamente
económicos.
- Selección de las variables explicativas más importantes, la cual se realiza a
través del:
o Análisis de los antecedentes económicos: a través de las teorías
económicas encuentro aquellas variables que a nivel general influyen
de una manera importantes sobre la variable endógena
o Análisis de los antecedentes econométricos: búsqueda de modelos
similares a la materia objeto de análisis en libros y revistas sobre
econometría.
o Propio conocimiento del investigador.

Estimación: consiste en el cálculo del valor de los parámetros a través de la ayuda de


un programa informático (Eviews). Para realizar esta fase es necesario previamente
haber realizado una búsqueda y depuración de datos. Es necesaria la obtención de
datos suficientes, homogéneos y actualizados.

Y = β 0 + β1 X1 + β2 X2 + µ

Yˆ = βˆ 0 + βˆ 1 X 1 + βˆ 2 X 2

En la expresión estimada no existe el componente de la perturbación aleatoria, ya que


una vez que estimo, el valor de la endógena estimado se convierte en una
combinación lineal exacta de las variables explicativas que he utilizado al realizar la
estimación. La estimación de la perturbación aleatoria será el error que cometo con mi
modelo al estimar, que incluirá precisamente las variables que dejo fuera de la
explicación (aquellas que tienen poca importancia sobre la variable que trato de
analizar).
Validación: a través de la interpretación de los resultados analizaremos la bondad del
modelo. De tal manera que si el modelo no es bueno para explicar a la variable
endógena deberé perfeccionarlo a través de:

- Una reespecificación de las variables explicativas, es decir, es posible que


haya olvidado incluir alguna variable importante por lo cual el modelo me esté
dando un grado de error elevado.
- Una nueva búsqueda de los datos utilizados, ya que si no son los correctos
pueden estar añadiendo un componente errático a la estimación.
- Etc.

Esta tarea puede repetirse en la práctica un número elevado de veces.

Utilización: para realizar:

- Análisis estructural: cuantificar las relaciones entre las X y la Y.


- Predicción: anticipar los valores a futuro de la Y
- Simulación: efectos sobre Y de distintas estrategias de las X.

Esquema a seguir en la elaboración de un modelo econométrico

Especificación

Antecedentes económicos
Antecedentes econométricos
Conocimiento del investigador

Estimación

Búsqueda y depuración de datos

Validación

NO
Bondad del modelo
SI

Utilización

Análisis estructural
Predicción
Simulación
TIPOLOGÍA DE VARIABLES Y DATOS EN LA MODELIZACIÓN ECONOMÉTRICA

Se entiende por variable al concepto económico que queremos analizar.

Normalmente utilizaremos variables cuantitativas, es decir, aquellas cuyos valores


vienen expresados de forma numérica.
Sin embargo, también existe la posibilidad de incluir en el modelo econométrico
información cualitativa, siempre que la información cualitativa pueda expresarse de
forma cuantitativa. Dentro de este tipo de variables conviene conocer las siguientes
posibilidades que se le pueden presentar al económetra:

- Variables proxies: son variables aproximadas a la variables objeto de análisis.


Por ejemplo, si quiero utilizar una variable que mida el nivel cultural de un país
(variable culitativa) puedo utilizar como variable proxy el número de bibliotecas
existentes en un país, que si bien no recoge el concepto exacto que yo quiero
medir, si se aproxima al mismo.
- Variables ficiticas o dummy: estas variables representan la incidencia que tiene
sobre la variable endógena objeto de análisis un fenómeno cualitativo.
Habitualmente, a la variable ficticia se le asignan dos valores arbitrarios según
se de o no cierta cualidad en un fenómeno. Así, se le puede asignar el valor 1
si ocurre un determinado fenómeno y 0 en caso contrario. Estas variables
pueden ser de dos tipos:

o Ficticia de intervalo: Por ejemplo si estoy analizando la variable


exportaciones en España desde 1970 hasta el año 2000, hay un hecho
importante que es la entrada de España en la Unión Económica que
debo recoger a través de la utilización de la variable ficticia.
o Ficticia de escalón: Por ejemplo si está analizando el crecimiento
económico de un país en el que en un año determinado hubo un
acontecimiento meteorológico que tuvo una repercusión negativa sobre
la economía, al tratarse éste de un dato casual (y no equilibrado con el
resto de valores que toma la serie) debo introducir en el modelo este
tipo de información para que la tenga en cuenta en la estimación y
cometa un menor error.

Las variables ficticias se pueden incluir tanto en modelos temporales como en


modelos de corte transversal. Por ejemplo, si se analiza la venta de coches a
nivel provincial, se puede incluir una variable ficticia que valga 0 cuando la
provincia no tiene metro y 1 cuando si que lo tiene.

Se entiende por datos, los diferentes valores que toma una variable.

Los datos pueden corresponder a los valores de una variable en el tiempo (serie
temporal), o a valores para diferentes sujetos en un momento dado (datos de corte
transversal).
Por otro lado, las formas alternativas en que un modelo puede venir expresado, obliga
frecuentemente a transformaciones de los datos originales (tasas de crecimiento,
diferencias, logaritmos) o incluso a un cierto tratamiento previo de los mismos
(eliminación de tendencia, eliminación de estacionalidad, etc...)

Con la información disponible, el económetra deberá elaborar una base de datos de tal
manera que:

Años Individuos Variable 1 Variable 2 Variable 3


1990 1 Datos Datos Datos
1991 2 Datos Datos Datos
... ... Datos Datos Datos
2000 N Datos Datos Datos

Los datos que formen la base de datos han de ser:


- Suficientes: como mínimo para poder realizar la estimación, el número de
observaciones debe ser igual al número de parámetros que queremos estimar.
Sin embargo si no se cumplen unos requisitos mínimos, aunque teóricamente
se puede realizar la estimación, ésta no será fiable.
- Homogéneos: los datos que hacen referencia a una misma variable deben
estar expresados de una forma homogénea, esto quiere decir que todos deben
ir en niveles o en tasas de variación o en logaritmos. La homogeneidad de los
datos también hace referencia al hecho de que todos deben o no ir corregidas
de determinados efectos que se dan en la economía como la tendencia o la
estacionalidad. Nunca se puede incluir en el modelo una variable cuyos datos
estén expresados de forma diferente.
- Actuales: La falta de actualidad en los datos impide realizar un análisis
completo del fenómeno económico, ya que éste se referirá únicamente al
periodo muestral utilizado en la estimación.
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.

EJEMPLO DE MODELOS ECONOMÉTRICOS

Ver el Caso 9 (pag. 505 y ss.) del libro de A. Pulido y A. López (1999), “Predicción y Simulación
aplicada a la economía y gestión de empresas”. Ed. Pirámide. En el mismo se presentan “algunas
relaciones macroeconómicas básicas para la economía española”: consumo privado nacional,
inversión privada, exportaciones e importaciones de bienes y servicios, pagos por intereses de las
AAPP, créditos al sector privado y tipos de interés.

1. MODELOS DE SERIES TEMPORALES UNIECUACIONALES

Ejemplo 1: Supongamos el siguiente modelo:

Vt = a + bPRt + cPBt

siendo V: ventas de una empresa


PR: precios
PB: presupuesto en publicidad

Ejemplo 2: A efectos de predecir el volumen de paro en España podría elaborarse el siguiente


modelo:
TPAt = a 0 + a1 P14 t + a 2UCPt + U t

siendo TPA: tasa de paro, definida como población en paro dividida por población activa.
P14: población de 14 y más años
PROD: productividad, definida como el PIB dividido por la población ocupada.

También podría haberse especificado otro modelo con PPA (población en paro) como variable
endógena:
PPAt = a 0 + a1 P14 t + a 2UCPt + U t

Ejemplo 3: Supongamos que el consumo de un determinado producto depende del ingreso


familiar y de que tenga o no vivienda en propiedad, pudiendo establecerse el siguiente modelo:

C i = a0 + a1 Ri + a 2 Fi + U i
siendo: Ci: el consumo del producto
Ri: el ingreso familiar
Fi: una variable ficticia que tomará el valor 1 si la familia tiene vivienda en propiedad y
0 en caso contrario.
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.

Ejemplo 4: La función de producción calculada por Cobb y Douglas, para el conjunto de la


economía de Estados Unidos en el período 1900-1922, fue estimada de la siguiente forma:

Pt = 1,10 L0t , 75 C t0, 25

siendo: P: índice de producción total por año


L: índice de "inputs" de trabajo
C: índice de "inputs" de capital

Este modelo se encuentra ya estimado (se conoce el valor de los parámetros), por lo que no
incluye el término de la perturbación aleatoria: más adelante profundizaremos más en esta
cuestión.

Cuando, como en éste y otros muchos casos, se parte de una especificación potencial, es decir,
lineal en los logaritmos de las variables, entonces los parámetros son directamente las
elasticidades: elasticidad de P respecto de L y C. En este caso, los parámetros indicarán, en
forma suficientemente aproximada para incrementos porcentuales pequeños de L o C, el
incremento porcentual correspondiente a P. Por ejemplo, en EEUU, en el período 1900-1922,
una variación porcentual de 1% en los inputs de trabajo (L) dio lugar a un incremento de la
producción total de 0,75%, mientras que incrementos de 1% en los inputs de capital C
producían un aumento de la producción en sólo 0,25%. Es decir, los incrementos en inputs de
trabajo, respecto a los de capital, producían aumentos 3 veces mayores en la producción total.

Ejemplo 5: Sea un modelo de la renta (R) en función del nivel educativo (E):

R t = β1 + β2 E t + u t

Este modelo olvida que la mayoría de la gente tiene más ingresos de mayores que cuando son
jóvenes, independientemente de su educación. Por eso, el parámetro β2 estará sobrestimando el
impacto de la educación sobre la renta. Por eso, una especificación más adecuada debería incluir
la variable edad (A) en el modelo:

R t = β1 + β2 E t + β3 A t + u t

Sin embargo, es algo contrastado que la renta tiende a crecer menos que proporcionalmente en
los últimos años de vida laboral que en los primeros. Por eso, el modelo debería especificarse:

R t = β1 + β2 E t + β3 A t + β4 A 2t + u t

En este caso, lo esperado es que β3 tenga signo positivo y que β4 sea negativo.
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.

2. MODELOS DE SERIES TEMPORALES MULTIECUACIONALES

Ejemplo 6: Una empresa comercial pretende conocer la evolución de su beneficio bruto (BEN),
teniendo en cuenta el capital invertido (SK), el número de trabajadores (L), el precio de venta
(PRE) y un índice de actividad económica (ACT). Para estimar el comportamiento de dichos
beneficios se plantea inicialmente una ecuación con la siguiente especificación:

BEN t = β1 + β2SK t + β3 L t + β4 PRE t + β5 ACTt + u t

Tras una primera estimación se llega a la conclusión que el modelo no es muy bueno debido a
que el beneficio tiene 2 elementos claramente diferenciados cuyo comportamiento debería ser
analizado por separado: ingresos (ING) y gastos (GAS), por lo que el modelo queda así:

ING t = β1 + β2SK t + β3L t + β4 PRE t + β5 ACTt + u t


BEN t = ING t − GASt

A la hora de realizar predicciones, la empresa se encuentra con la dificultad de determinar el


nivel del gasto a futuro, ya que éste se va a ver directamente condicionado por la evolución de
los ingresos, así como por el número de empleados, constatándose la necesidad de endogeneizar
la variable de gastos para determinar simultáneamente el nivel de ingresos y gastos a futuro.
Asimismo, la variable de ingresos no sólo depende de las variables del entorno, sino del propio
volumen de compras realizadas, por lo que se incluirá GAS como explicativa de ING:

ING t = β1 + β2 GASt + β3SK t + β4 L t + β5 PRE t + β6 ACTt + u1,t


GASt = γ1 + γ 2 ING t + γ 3 L t + u 2,t
BEN t = ING t − GASt

Finalmente, una vez constatada la necesidad de desarrollar un modelo multiecuacional, se


considera oportuno que, para gestionar adecuadamente la empresa, es preciso modelizar,
además de los beneficios, la evolución del stock de capital, cumpliendo el doble objetivo de
analizar los beneficios y la reinversión de los mismos para el aumento del stock de capital:

ING t = β1 + β2GASt + β3SK t + β4 L t + β5 PRE t + β6 ACTt + u1,t


GASt = γ1 + γ 2 ING t + γ 3 L t + u 2,t
SK t = λ1 + λ 2 BEN t + u 3,t
BEN t = ING t − GASt

Como puede apreciarse, hemos pasado de un modelo uniecuacional (1º) a otro modelo
multiecuacional recursivo (2º), pasando por un modelo multiecuacional bloque-recursivo (3º) y
terminando con un modelo multiecuacional de ecuaciones simultáneas (4º).
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.

Ejemplo 7: Sea un modelo simplificado de determinación del consumo C, la inversión I y la


renta Y de un país:

⎧C t = a1 + a 2Yt −1 + U t

⎨ I t = b1 + b2 (Yt − Yt −1 ) + Vt
⎪Y = C + I + G
⎩ t t t t

La última ecuación es una identidad contable, en una economía cerrada, por lo que no se incluye
la perturbación aleatoria, dado que la relación es exacta, sin posibilidad de error.

Ejemplo 8: Modelo de Lawrence R. Klein:

⎧⎧C i = α 0 + α 1 (W1 + W2 )i + α 2 π1 + u1i


⎪⎪
⎪⎨ I i = ρ 0 + ρ1 π i + ρ 2 π i −1 + ρ 3 K i −1 + u 2i
⎪⎪⎪W1i = δ 0 + δ1 (Y + T − W2 ) + δ 2 (Y + T − W2 ) + δ 3i + u 3i
⎩ i i −1

⎪⎧Yi + Ti = C i + I i + Gi
⎪⎪Y = W + W + π
⎪⎨ i 1i 2i i

⎪⎩⎩∆K i = I i

n = 1921-1941 (economía norteamericana)


Las variables monetarias: miles de millones de dólares de 1934 (términos reales)
C: consumo privado
W1 : salarios pagados por el sector privado
W2 : salarios pagados por el sector público
π: beneficios
I: inversión privada
K: stock de capital privado
Y: renta nacional
I: impuesto sobre empresas
G: gasto público (excepto salarios)
i: tiempo (año de referencia); i = 1, 2, ..., n
u1, u2, u3: perturbaciones aleatorias
α, ρ, δ: parámetros del modelo.

- Las 3 primeras ecuaciones son modelos econométricos uniecuacionales.


- Las 3 últimas ecuaciones son modelos deterministas o identidades contables, que deben
desaparecer y ser sustituidas en las demás ecuaciones.
Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.

3. MODELOS AUTORREGRESIVOS DE SERIES TEMPORALES

Ejemplo 9: Sea un modelo de la serie mensual de consumo de gasolina (z), que ha sido
previamente transformada en logaritmos y en diferencias (primeras diferencias y diferencias de
orden 12) con el objetivo de eliminar de la misma todas las tendencias existentes (tendencias en
varianza y tendencias en media, en la parte regular y estacional). El modelo finalmente
especificado es el siguiente:

z t = φ1z t −1 + Φ1z t −12 + a t + θa t −1

Se trata de un modelo ARIMA(1,1,1) x SARIMA(1,1,0) en el que la variable del consumo de


gasolina se explica en función de sí misma en el mes anterior, así como también doce meses
antes, y del error que comete el modelo en el período anterior.

Ejemplo 10: Sea un modelo de la variable mensual del IPC de alimentación (p) donde esta
variable ha sido previamente transformada en logaritmos, en segundas diferencias en la parte
regular y en primeras diferencias en la parte estacional:

p t = Φ1p t −12 + a t + θa t −1

Se trata de un modelo ARIMA(0,2,1) x SARIMA(1,1,0) en el que la variable del IPC de


alimentación se explica en función de sí doce meses antes y del error que comete el modelo en
el período anterior. Los resultados de la estimación ponen de manifiesto la existencia de errores
atípicos. Al profundizar en los motivos por los que se producen estos valores, se descubre que la
climatología (cuando ha sido especialmente favorable o desfavorable) ha hecho especial mella
sobre los precios de alimentación. Por eso, se incluyen en el modelo 3 nuevas variables ficticias
que recojan estos efectos:

p t = α1Z1t + α 2 Z2 t + α 3 Z3t + Φ1p t −12 + a t + θa t −1

Z1 adopta el valor 1 si se trata de un mes de clima excepcionalmente malo y 0 en caso contrario.


Z2 adopta el valor 1 si se trata de un mes de clima malo y 0 en caso contrario. Z3 adopta el
valor 1 si se trata de un clima bueno y 0 en caso contrario. De esta manera es posible cuantificar
la incidencia de la climatología (muy mala, mala o buena) sobre los precios de alimentación.

Pese a todo, la predicción en el período histórico del IPC deja todavía bastante que desear, por
lo que se prueba introduciendo en el modelo la incidencia que los precios de no alimentación (q)
tienen sobre los de alimentación. La variable IPC de no alimentación se introduce en el modelo
transformada (del mismo modo que p) para evitar la existencia de tendencias en la misma:

p t = λ1q t + α1Z1t + α 2 Z2 t + α 3 Z3t + Φ1p t −12 + a t + θa t −1


Coro Chasco Yrigoyen, Dpto. Economía Aplicada, UAM.

4. MODELOS DE DATOS DE CORTE-TRANSVERSAL

Ejemplo 11: Sea un modelo de asalariados del Panel de Hogares de la UE 94:

wi = β 0 + β 1 S i + u i

Donde w es el salario-hora en pesetas y S el nivel educativo en años. El coeficiente estimado de β1


indica en cuántas pesetas se incrementa el salario ante aumentos del nivel educativo en 1 año.

Si la variable de salarios-hora se transforma en logaritmos:

ln wi = β 0 + β 1 S i + u i

Se puede saber en qué porcentaje (en tantos por 1) se incrementa el salario-hora ante variaciones
del nivel educativo en 1 año.

Dado que la experiencia de trabajo (EX) es también una variable importante, el modelo anterior
debería considerar también esta variable. Aunque, en este caso, el impacto que valores mayores de
años de experiencia sobre el salario-hora se supone que se produce de forma menos que
proporcional:

ln wi = β 0 + β 1 S i + β 3 EX i + β 4 EX 2 + u i

En este caso, se espera un signo negativo en β4.


REGRESIÓN LINEAL
Regresión Lineal Simple

 Planteamiento
El comportamiento de una magnitud económica puede ser
explicada a través de otra

Y = F(X )
Si se considera que la relación puede ser de tipo lineal, la
formalización vendría determinada por una ecuación como la
siguiente

Y = β1 + β 2 X
Regresión Lineal Simple

 Planteamiento
Dado que las relaciones en la ciencias sociales no son exactas se
incluye el término de pertubación aleatoria

Y = β1 + β 2 X + U
Supongamos que se dispone de T observaciones de las
variable Y y X

Y1 = β1 + β 2 X 1 + u1
Y2 = β1 + β 2 X 2 + u 2
………………………………

Yn = β1 + β 2 X n + un
Regresión Lineal Simple

 Planteamiento
De forma abreviada el sistema de ecuaciones se puede escribir
de la siguiente manera

Yt = β1 + β 2 X t + U t
t = 1, 2, 3…………….,T.
Regresión Lineal Simple
 Planteamiento

El objetivo del análisis de regresión es la estimación de los


parámetros.

El primer paso es la representación gráfica de las variables (y,x)


en un diagrama de dispersión
Relación Lineal Exacta Relación Lineal Exacta

14 14

12 12

10 10

8 8

Y
Y

6 6

4 4

2 2

0 0
0 2 4 6 8 10 0 2 4 6 8 10
X
X
Regresión Lineal Simple

 Planteamiento
Dado que la relación de dependencia entre ambas variables es
aleatoria o estocástica, las observaciones no se encontrarán a lo
largo de una recta

Regresion Lineal Simple

18
La estimación de los
16 parámetros supone
14
12 encontrar la ordenada en
10
el origen y la pendiente
Y

8
6
4
de una recta que mejor
2 se aproxime a los puntos
0
0 2 4 6 8 10
X
Regresión Lineal Simple

 Planteamiento
Recta de Regresión Especificada

Yt = β 1 + β 2 X t + U t

Recta de Regresión Estimada

Yˆt = βˆ1 + βˆ 2 X t
Errores o residuos

uˆ t = Yt − Yˆt = βˆ1 − βˆ 2 X t
Regresión Lineal Simple
 Criterios de Ajuste

a) La suma de todos los residuos sean próximas a cero


T

Minimizar ∑ uˆ
t =1
t

b) La suma de todos los residuos en términos absolutos sean próximas


a cero
n
Minimizar ∑ t =1
uˆ t

c) La suma de todos los residuos elevados al cuadrado sean próximas a


cero
n
Minimizar ∑ t =1 t
ˆ
u 2
Regresión Lineal Simple

 Obtención de los estimadores


Los estimadores se obtienen aplicando el criterio de minimización de la suma cuadrática de los errores

( ) =∑ (Y − βˆ − βˆ X )
n n 2
2
S =∑ Yt − Yˆt
n
∑ t =1
uˆ =
2
t t 1 2 t
t =1 t =1

Para minimizar S se derivará la función respecto de cada uno de los parámetros

∂S n
= −2∑ (Yt − βˆ1 − βˆ 2 X t ) = 0
∂βˆ1 t =1

∂S n
= −2∑ (Yt − βˆ1 − βˆ 2 X t )X t = 0
∂βˆ 2 t =1
Regresión Lineal

 Obtención de los estimadores

Operando y reagrupando términos se obtendría, la expresión analítica de los estimadores mínimo-cuadráticos de la


regresión lineal simple:

Cov (Y , X )
βˆ1 = Y − βˆ2 X β2 =
ˆ
var( X )
En el caso de un modelo de regresión lineal múltiple, las expresiones anteriores se transformarían del siguiente modo:

Cov (Y , X 2 ) − βˆ3 Cov ( X 2 , X 3 )


βˆ1 = Y − βˆ 2 X 2 − βˆ3 X 3 β2 =
ˆ
var( X 2 )

Cov (Y , X 3 ) − βˆ2Cov( X 3 , X 2 )
β3 =
ˆ
var( X 3 )
Modelo Lineal Básico

 Hipótesis

 Forma funcional
 Sobre la perturbación Aleatoria
 Sobre las variables independientes
 Sobre el vector de parámetros
Modelo Lineal Básico

 Hipótesis
 Forma funcional

Yt = βˆ1 + βˆ2 X 2 t + βˆ3 X 3t + βˆ4 X 4 t + LLL + βˆk X kt + ut

a) La relación entre la variable dependiente y las variables


independientes es tipo lineal. La incorporación del término de
perturbación aleatoria de forma aditiva, garantiza a su vez la relación
lineal con el resto de elementos
Modelo Lineal Básico

 Hipótesis
 Sobre la perturbación aleatoria
a) La perturbación aleatoria es una variable aleatoria no observable

La perturbación aleatoria representa el conjunto de variables que a


tono individual poseen un efecto irrelevante, no obstante, el efecto
total recogido por esta no es desdeñable. Adicionalmente representa
la aleatoriedad intrínseca del comportamiento humano, con lo que
dicha variable toma valores siguiendo una distribución de
probabilidades

Dado que la variable dependiente es una combinación lineal del


término de perturbación aleatoria ésta constituye igualmente una
variable aleatoria
Modelo Lineal Básico

 Hipótesis
 Sobre la perturbación aleatoria

b) El promedio es igual a cero.

Los efectos individuales de las variables incluidas en el término de


pertubación aleatoria tienden a compensarse.

b) Son homoscedásticas.

Las poblaciones de Y dado los distintos valores de X tienen la


misma varianza
Modelo Lineal Básico

 Hipótesis
 Sobre la perturbación aleatoria

d) No existe autocorrelación entre las perturbaciones.

Supone que las perturbaciones correspondientes a distintos


unidades o períodos del tiempo no están relacionadas entre si

e) Se distribuye como una variable normal.


Dado que la perturbación aleatoria incluye un amplio grupo de
variables omitidas de forma explícita en el modelo de regresión
lineal, que son independientes entre si, apoyándose en el teorema
de límite central se asume que el vector de las perturbaciones
corresponde a una variable normalmente distribuida.
Modelo Lineal Básico

 Hipótesis
 Sobre las variables exógenas.
a) Los valores de las variables independientes son fijos en
muestreos repetidos.
b) No hay multicolinealidad perfecta. No hay relación perfecta entre
las variables
 Sobre el vector de parámetros.
a) Las betas son valores fijos. Lo que supone estabilidad en la
estructura del fenómeno estudiado.
Modelo Lineal Básico

 Hipótesis
 Otras hipótesis

a) El modelo está correctamente especificado.


b) Se dispone de información estadística suficiente, como mínimo n>K.
En general para tres variables independientes se necesita 15
observaciones.
Modelo Lineal Básico
 Interpretación de los coeficientes

 Si las variables introducidas están expresadas en niveles

Representa el cambio en la variable dependiente


∂ Yˆt
β jt =
ˆ ante un cambio unitario en la variable j,
∂ X jt permaneciendo el resto de factores constantes

 Si las variables introducidas están expresadas en logaritmos

Representa el cambio relativo en la variable


∂ log Yˆt
β jt =
ˆ dependiente ante un cambio en un 1% en la variable j,
∂ log X jt permaneciendo el resto de factores constantes
Modelo Lineal Básico
 Interpretación de los coeficientes

 Si las variables introducidas están expresadas en la


misma unidad de medida (tipificadas)

Representa la importancia relativa que tiene cada una


β̂ * jt de las variables en la explicación de la variable
dependiente.

Relación entre los parámetros estimados con las variable expresadas


en niveles y en la misma unidad de medida (tipificadas).

σx j Donde: σx j Corresponde al cociente de las


β * jt = β jt
ˆ ˆ σy desviaciones típicas de la variable
σy independiente j y de la variable
dependiente y
Derivación matricial (cálculo)
del estimador de Mínimos
Cuadrados Ordinarios
Modelo poblacional: (expresión matricial)
Modelo muestral: (expresión matricial)
Método de mínimos cuadrados ordinarios
(expresión matricial)

Determina aquella combinación de parámetros que minimiza la suma al cuadrado


de todos los errores cometidos para las “n” observaciones disponibles:

Expresado matricialmente:
Método de mínimos cuadrado ordinarios
(expresión matricial)

IMPORTANTE:
Método de mínimos cuadrados ordinarios
(expresión matricial)

Reagrupando y despejando el vector de los parámetros de la expresión anterior a partir de la inversa de la matriz X’X se tend ría:

También podría gustarte