VARIÁVEIS INSTRUMENTAIS E
ESTIMAÇÃO GMM
Henrique Dantas Neder
Universidade Federal de Uberlândia
VARIÁVEIS INSTRUMENTAIS
O que são métodos de variáveis instrumentais (IV)?
Mais conhecidos como uma solução para regressores
endógenos: variáveis explicativas correlacionadas com o
termo de erro da regressão, os métodos de variáveis
instrumentais são uma maneira de obter estimativas de
parâmetros consistentes.
A hipótese fundamental para a consistência dos
estimadores OLS é que o termo de erro do modelo é não
correlacionado com os regressores.
VARIÁVEIS INSTRUMENTAIS
Esta hipótese, também conhecida como hipótese da esperança
condicional nula, pode ser expressa por E[u|x] = 0
Podemos entender isto de uma forma concreta: quando quisermos
regredir rendimentos com anos de estudo e soubermos que uma
variável latente (não observada) também determina os rendimentos.
Neste caso, esta variável latente, por exemplo a habilidade do
trabalhador não deve ter sua esperança condicionada ao número de
anos de estudo igual a zero. Para cada valor de anos de estudo (por
exemplo, 3 anos de estudo e 5 anos de estudo) temos um valor
médio da variável latente diferente.
Esta condição também pode ser representada pela independência
entre u e X, ou seja, covariância(u,x)=0
Vamos primeiro considerar um diagrama de causalidade para
ilustrar o problema colocado por variáveis instrumentais.
Podemos usar mínimos quadrados ordinários (MQO) para
estimar consistentemente o seguinte modelo:
regressão: y = xb + u (1)
Nenhuma associação entre x e u; MQO é consistente.
X y
u
Entretanto, a regressão falha na seguinte circunstancia:
Endogeneidade: y = xb + u
Correlação entre x e u; MQO não é consistente.
x y
A correlação entre x e u (ou a falha na hipótese de média
condicional nula E[u|x] = 0) pode ser causada por muitos
fatores.
•Podemos nos referir ao problema da endogeneidade como duas
ou mais variáveis determinadas conjuntamente em um modelo
comportamental. Um exemplo é o modelo de equações
simultâneas tal como o conhecido sistema de oferta e demanda
em economia, no qual o preço e a quantidade são
conjuntamente determinados no mercado.
• Um choque ou perturbação tanto na oferta como na demanda
afetará tanto o preço como a quantidade no mercado de forma
que ambas as variáveis estão correlacionadas com uma
perturbação no sistema. Regressão por MQO resultará em
estimativas inconsistentes de qualquer regressão incluindo
preço
e quantidade.
•Uma outra situação em que temos que utilizar variáveis
instrumentais é quando temos que levar em conta fatores não
observáveis relevantes e que são omitidos da equação de
regressão. Tanto y como x podem ser afetados por estes
fatores latentes, como por exemplo a habilidade.
• Considere a regressão de (ln) rendimentos (y) sobre anos de
estudo (x). O termo de erro u engloba todos os outros fatores
que afetam os rendimentos tais como habilidade inata dos
indivíduos ou inteligência.
• Mas a habilidade é certamente correlacionada com o grau de
escolaridade alcançado, causando uma correlação entre o
regressor e o erro, Matematicamente, este é o mesmo problema
que aquele causado pela endogeneidade ou erros de medida.
A solução deste problema por variáveis instrumentais
pode ser vista como:
Regressão de variáveis instrumentais: y = xb + u
z não correlacionado com u, correlacionado com x
z x y
A variável adicional z é chamada de instrumento para x. Em
geral, temos muitas variáveis em x, e mais de uma destas
variáveis correlacionada com u. Neste caso, necessitamos
no mínimo tantas variáveis em z, quantas forem as variáveis
em x correlacionadas com u.
• Para tratar do problema de endogeneidade em um sistema de
oferta e demanda, um candidato z deve afetar a quantidade
ofertada, mas não deve impactar diretamente a demanda do
produto. Um exemplo para um produto agrícola pode ser a
temperatura ou a precipitação pluviométrica: estes fatores são
claramente exógenos ao mercado, mas provavelmente
importantes no processo de produção.
• Consideremos o seguinte sistema de equações de “equilíbrio”
de mercado:
q 1d 2 d p 3d r u1 (2)
p 1o 2 o q u2
• Se considerarmos a solução algébrica deste sistema de
equações estruturais para as variáveis p e q, teremos as
equações na forma reduzida, nas quais os fatores exógenos
aparecerão em seus lados direitos.
•No caso dos fatores latentes da equação de rendimentos,
podemos escolher o instrumento z como o número de anos de
estudo do pai ou da mãe. Pais com maior escolaridade
provavelmente têm filhos com maior escolaridade; ao mesmo
tempo, fatores não observáveis que influenciam
simultaneamente a renda e o nível educacional dos indivíduos
não podem influenciar variáveis cujos valores são definidos no
passado, como a escolaridade dos pais.
MAS PORQUE NÃO UTILIZAR SEMPRE
VARIÁVEIS INSTRUMENTAIS?
Pode ser difícil achar variáveis que servem como instrumentos
válidos. Muitas variáveis que têm um efeito sobre as variáveis
endógenas incluídas, também têm um efeito direto sobre a
variável dependente.
Estimadores IV são viesados para pequenas amostras e suas
propriedades para amostras finitas são freqüentemente
problemáticas. Estes estimadores podem ter resultado ruim em
pequenas amostras.
A precisão de estimadores IV é menor do que a de
estimadores OLS. Na presença de instrumentos fracos
(instrumentos incluídos com baixa correlação com os
regressores endógenos) a perda de precisão é muito grande e
as estimativas IV podem não compensar a inconsistência dos
estimadores OLS. Isto sugere a necessidade de um método
para determinar se um dado regressor pode ser tratado como
endógeno.
COMO SABER SE OS INSTRUMENTOS
SÃO FORTES?
Instrumentos podem ser fracos: satisfatoriamente exógenos
mas fracamente correlacionados com os regressores
endógenos. Neste caso, “a cura pode ser pior do que a
doença”.
Alguns autores (ver citação em Baum, 2008), formalizaram a
definição de instrumentos fracos: concluem que a estatística F
da equação de primeiro estágio deve exceder 10 para que os
instrumentos sejam considerados fortes. Mas este critério não
é suficiente para considerar que um instrumento não seja
fraco.
Outros autores (Stock e Yogo, 2005) estabelecem uma regra
de bolso para avaliar a fraqueza de instrumentos. Os
comandos STATA ivreg2 e ivregress incorporam tabulações
referentes a esta regra.
SIMULAÇÃO DE UMA VARIÁVEL
ENDÓGENA
SIMULAÇÃO DE UMA VARIÁVEL
ENDÓGENA
SIMULAÇÃO DE UMA VARIÁVEL ENDÓGENA
– UMA NOVA ERA NO ENSINO DA
ECONOMETRIA
O viés para este exemplo com variável endógena, com tamanho de
amostra n = 150 e 1000 replicações é de aproximadamente 20%
para 2 pg
(Cameron e Trivedi, 2009, 2 143), o erro padrão é cerca
de 17 vezes menor e sempre rejeitamos a hipótese nula verdadeira
de que . 2 2
O erro padrão (parâmetro) de x = raiz(1+.52x1) = 1.1180.
1.1180/0.06580 = 17. Ou seja, a estimativa OLS é também
inconsistente para a variância do coeficiente (subestima o valor do
parâmetro)
Outros exemplos podem ser testados. Esta possibilidade de
simulação computacional do DGP (“data generation process”) nos
coloca em uma nova era do ensino da econometria.
UM PRIMEIRO EXEMPLO DE USO DE IV
Utilizaremos um exemplo de Cameron e Trivedi(2009):
gastos médicos com um regressor endógeno.
A variável dependente ldrugexp é o logaritmo dos gastos
totais em medicamentos.
Os regressores são: um indicador (dummy) se os
indivíduos tem seguro por empresa ou por sindicato
(hi_empunion), número de condições crônicas (totchr),
idade em anos (age), indicador de gênero (female), se é
negro ou hispânico (blhisp) e o logaritmo natural da
renda domiciliar anual em milhares de dólares (linc).
UM PRIMEIRO EXEMPLO DE USO DE IV
Vamos considerar que a variável hi_empunion é
endógena. A justificativa é que os indivíduos escolhem
uma ou outra condição baseados na sua expectativa de
gasto.
Os instrumentos selecionados são: a relação da
rendimentos de seguridade social – rendimentos de todas
as fontes (ssiratio), uma variável indicadora qualitativa
(dummy) do status de renda reduzida (lowincome), o
tamanho da força de trabalho empregada na firma
(firmsz) e uma variável dummy indicando se a firma é
uma grande operadora com localizações múltiplas.
UM PRIMEIRO EXEMPLO DE USO DE IV
Os primeiros dois instrumentos são relevantes porque
espera-se que sejam negativamente correlacionados com
ter seguro suplementar.
Para serem instrumentos válidos (sem correlação com o
termo de erro da equação de segundo estágio) – vamos
admitir que se eles podem ser omitidos desta equação
dado que o efeito dos rendimentos já é inteiramente
capturado pela variável linc.
Os últimos dois instrumentos podem ser irrelevantes
porque muitos indivíduos podem estar aposentados,
serem autônomos ou estarem em sistemas de seguro de
saúde privados.
UM PRIMEIRO EXEMPLO DE USO DE IV –
ESTIMAÇÃO DE UM MODELO EXATAMENTE
IDENTIFICADO
use "C:\cameron stata data files\mus06data.dta", clear
global x2list totchr age female blhisp linc
ivregress 2sls ldrugexp (hi_empunion = ssiratio) $x2list, vce(robust)
first
Em modelos com mais de um regressor endógeno, mais de uma
regressão de primeiro estágio é mostrada se a opção first é usada.
Indivíduos com seguro suplementar tem despesas com remédios que
são 90% mais baixas do que as pessoas com este suplemento.
UM PRIMEIRO EXEMPLO DE USO DE IV –
ESTIMAÇÃO DE UM MODELO SOBRE
IDENTIFICADO
global ivmodel “ldrugexp (hi_empunion=ssiratio multlc) $x2list”
quietly ivregress 2sls $ivmodel, vce(robust)
estimates store TwoSLS
quietly ivregress gmm $ivmodel, wmatrix(robust)
estimates store GMM_hat
quietly ivregress gmm $ivmodel, wmatrix(robust) igmm
estimates store GMM_igmm
quietly ivregress gmm $ivmodel, wmatrix(cluster age)
estimates store GMM_clu
quietly ivregress 2sls $ivmodel
estimates store TwoSLS_def
estimates table TwoSLS GMM_hat GMM_igmm GMM_clu TwoSLS_def, b(%9.5f) se
FÓRMULAS DERIVADAS PARA OS
ESTIMADORES
ˆIV ( Z ´ X ) 1 Z ´ y
ˆ2 SLS ( X ´Z ( Z ´Z ) 1 Z ´ X ) X ´Z ( Z ´Z ) 1 y
ˆGMM ( X ´ZWZ ´ X ) 1 X ´ZWZ ´ y
onde:
Wé qualquer matriz de ponderação simétrica
de posto completo
Para modelos exatamente identificados, todas
as escolhas de W conduzem aos mesmos estimadores
FÓRMULAS DERIVADAS PARA OS
ESTIMADORES
Este estimador minimiza a função objetivo:
1 1
Q( )={ (y-X )´Z}W{ Z´(y-X )}
N N
que é uma forma quadrática de matriz ponderada
em Z´(y-X ).
Para GMM, algumas escolhas de W são melhores
do que outras. O estimador 2SLS é obtido com
W = (Z´Z) 1. O estimador ótimo GMM usa W =Sˆ 1
onde Sˆ é uma estimativa de Var(N 1/2 Z´u ).
TESTE PARA ENDOGENEIDADE DO
REGRESSOR
Se o regressor hi_empunion for exógeno, os estimadores
IV (IV, 2SLS ou GMM) são ainda consistentes, mas eles
serão muito menos eficientes do que o estimador OLS.
Hausman test: se há pequena diferença entre as
estimativas IV e OLS, concluímos que o regressor é
exógeno.
( ˆIV OLS ) 2
TH ~ (1)
2
Vˆ ( ˆIV OLS )
H0:ρ=0
COMENTÁRIOS SOBRE O TESTE
HAUSMAN
O comando estat endogenous implementa o teste
Durbin-Wu-Hausman (DWH).
É baseado em uma estatística de teste robusta.
Considere o modelo:
y1i y´2i 1 x´1i 2 ui , i 1,...., N
Podemos re-escrever esta equação estrutural adicionando
uma variável v1 que é o erro da equação de primeiro
estágio para y2:
y1i y´2i 1 x´1i 2 v1i ui , i 1,...., N
COMENTÁRIOS SOBRE O TESTE
HAUSMAN
Sob a hipótese nula de que y2i é éxógena
E[v1i ui | y2i , x1i ] 0
O teste de exogeneidade é o teste de H0:ρ=0 na regressão
de y1 sobre y2, x1 e v1. Como v1 não é diretamente
observado utiliza-se o vetor de resíduos ajustados da
v̂1
equação de primeiro estágio.
Para erros homocedásticos e independentes, o teste é
assintoticamente equivalente ao primeiro teste Hausman.
No caso mais realista de erros heterocedáticos, o teste
H0:ρ=0 pode ser ainda implementado desde que
utilizemos estimativas robustas de variâncias.
TESTES DE RESTRIÇÕES DE SOBRE
IDENTIFICAÇÃO
a validade de um instrumento não pode ser testada em
um modelo exatamente identificado.
mas é possível testar a validade de instrumentos em um
modelo sobre identificado desde que os parâmetros do
modelo são estimados usando o GMM ótimo.
o mesmo teste tem diversos nomes, incluindo teste de
restrições de sobre identificação (OIR), teste de sobre
identificação (OID), Teste de Hansen, teste de Sargent e
teste Hansen-Sargent.
TESTES DE RESTRIÇÕES DE SOBRE
IDENTIFICAÇÃO
Consideremos o valor da função de critério para o
estimador GMM ótimo:
1 ˆ 1 1
Q( )={ (y-X )´Z}S { Z´(y-X )}
N N
Se as condições de momento da população E[Z´(y-X )]=0
estão corretas, então Z´(y-X ) e 0 Q( ˆ ). 0
Sob a hipótese nula de que todos os instrumentos são
válidos, pode ser demonstrado que tem uma
Q( ˆ ) assintoticamente qui-quadrado com
distribuição
numero de graus de liberdade igual ao número de
restrições sobre identificação.
NOTAÇÃO VETORIAL (MATRICIAL)
UTILIZADA
Regressores [ X 1 X 2 ] [ X 1Z 2 ] [Endógenos Exógenos]
Instrumentos Z = [Z1Z 2 ] [Excluídos Incluídos]
Portanto: a matriz Z será formada por vetores-coluna constituídos
dos instrumentos excluídos e dos instrumentos incluídos.
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
1
Seja PZ Z ( Z ' Z ) Z. O
' estimador de variáveis
instrumentais de β é:
IV ( X ' Z ( Z ' Z ) 1 Z ' X ) 1 X ' Z ( Z ' Z ) 1 Z ' y
1
(3)
( X ' PZ X ) X ' PZ y
Apesar deste estimador ser chamado de estimador de
variáveis instrumentais em dois estágios, ele pode ser
calculado em duas etapas como em apenas uma através
da expressão anterior.
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
Equação de primeiro estágio:
iq= 1 + 2s+ 3expr+ 4 tenure+ 5rns+ 6smsa+dummies+
7 med+8kww+ 9age+10mrt+u
Equação de segundo estágio:
lw = 1 + 2s+ 3expr+ 4 tenure+5 rns+ 6smsa+dummies+
7 pred (iq) u
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
O estimador IV em dois estágios:
ˆ2 SLS ( Xˆ ' X ) 1 Xˆ ' y { X ' Z ( Z ' Z ) 1 Z ' X }{ X ' Z ( Z ' Z ) 1 Z ' y}
( X ' Pz X ) 1 X ' Pz y
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS: A ESTIMATIVA DA
VARIÂNCIA
O estimador da variância dos parâmetros estimados pelo
método 2SLS é:
Var ( ˆ2 SLS ) ˆ 2 { X ' Z ( Z ' Z ) 1 Z ' X }1 ˆ 2 ( X ' Pz X ) 1
O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS
– ESTIMATIVA DA VARIÂNCIA
O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS
– ESTIMATIVA DA VARIÂNCIA
PROPRIEDADES DA IV COM UMA VARIAVEL
INSTRUMENTAL POBRE: ESTIMAÇÃO COM APENAS UMA
VARIÁVEL ENDÓGENA
O viés assintótico de um estimador IV é dado pela
seguinte equação:
ˆ corr ( z , u ) u
p lim 1 1 .
corr ( z , x) x
Mesmo se corr(z,u) for pequena, a inconsistência no estimador IV pode
ser muito grande se corr(z,x) também for pequena.
PROPRIEDADES DA IV COM UMA VARIAVEL
INSTRUMENTAL POBRE: ESTIMAÇÃO COM APENAS UMA
VARIÁVEL ENDÓGENA
Outra expressão para representar o viés assintótico é
dada por:
ˆ
p lim 1 1 co rr ( x, u ). u
x
IV é preferível a OLS em termos de viés assintótico
quando corr(z,u)/corr(z,x) < corr(x,u)
ESTIMAÇÃO IV: “SÍNTESE”
Quando temos certeza de que os regressores da nossa
equação não estão correlacionados com os erros
podemos aplicar o método convencional de OLS. No
entanto, mesmo nesse caso temos que verificar se os
resíduos da regressão são homocedásticos. Então temos
que realizar o teste heterocedasticidade. Caso os resíduos
sejam heterocedásticos temos que realizar a regressão
robusta. Isto pode ser feito utilizando a opção robust
(após a vírgula) no comando regress.
ESTIMAÇÃO IV: “SÍNTESE”
Caso tenhamos motivos para acreditar que um ou mais
regressores sejam endógenos (tenham correlação não
nula com termo de erro da equação) temos que aplicar o
método das variáveis instrumentais. Então nesse caso
utilizaremos o comando ivreg (ou através do menu
endogenous covariates) ao invés do comando regress.
ESTIMAÇÃO IV: “SÍNTESE”
Mas mesmo nesse caso podemos ter uma complicação.
Pode acontecer que aplicando o método das variáveis
instrumentais os resíduos do modelo não sejam
homocedásticos. Nesse caso temos que aplicar o método
das variáveis instrumentais articulado com o método dos
momentos generalizados (GMM).
QUAIS SÃO AS IMPLICAÇÕES DA
HETEROCEDASTICIDADE PARA O
ESTIMADOR IV?
Os regressores Os resíduos da
Sim Sim
regressão OLS Utilizar estimação
são todos são OLS
exógenos? homocedásticos?
Não
Não Utilizar estimação
OLS com opção
Os resíduos da Sim robust
Utilizar estimação
regressão IV são
IV
homocedásticos?
Não
Utilizar estimação
GMM
O MÉTODO DOS MOMENTOS
GENERALIZADOS (GMM)
Os economistas consideram que o GMM foi uma
invenção de Lars Hansen em seu paper de 1982 na
revista Econometrica.
Mas o método tem seus antecedentes nos trabalhos de
Karl Pearson sobre o método dos momentos datados em
1895 e mais a frente (1928) nos trabalhos de Neyman e
Egon Pearson sobre o método MCE que supera a
dificuldade do método dos momentos quando temos
mais condições de momentos do que parâmetros a serem
estimados.
O método tem portanto, como qualquer descoberta
cientifica, uma história bem definida.
O MÉTODO DOS MOMENTOS
GENERALIZADOS
O GMM foi introduzido por Lars Hansen em 1982.
A equação a ser estimada, em notação matricial é:
com uma linha típica:
y X u
yi X i ui
O MÉTODO DOS MOMENTOS
GENERALIZADOS
A matriz de regressores X tem dimensão n x K, onde n é
o número de observações.
Alguns dos regressores são endógenos, de forma que
E(Xiui) ≠0.
Fazemos uma partição do conjunto de regressores em
[X1 X2], com K1 regressores X1que de acordo com a
hipótese nula são endógenos e K2=(K-K1)
regressores X2 que são considerados exógenos.
O MÉTODO DOS MOMENTOS
GENERALIZADOS
Temos então a seguinte equação:
y [ X X ][ ]' u
1 2
' '
1 2
(4)
O conjunto de variáveis instrumentais é Z e tem dimensão
n x L.
Este é o conjunto completo de variáveis que são exógenas -
E(Ziui) =0.
Fazemos uma partição dos instrumentos em [Z1-Z2], com
L1 instrumentos Z1que são instrumentos excluídos e L2=(L-
L1)instrumentos Z2 =X2 que são os instrumentos incluídos /
regressores exógenos.
O MÉTODO DOS MOMENTOS
GENERALIZADOS
Regressores [ X 1 X 2 ] [ X 1Z 2 ] [Endógenos Exógenos]
Instrumentos Z = [Z1Z 2 ] [Excluídos Incluídos]
A condição de ordem para identificação da equação é: L
≥K
Isto implica que precisamos ter no mínimo tantos
instrumentos excluídos (L1)quantos forem os regressores
endógenos (K1).
Se L = K a equação é exatamente identificada.
Se L > K a equação é sobre-identificada.
O ESTIMADOR IV-GMM
Os L instrumentos nos dão um conjunto de L momentos:
(5)
gi ( ) Z i'ui Z i' ( yi X i ) i = 1,n
Temos um vetor gi que é L x 1 (resultado de uma
multiplicação de uma matriz que é
'
Z
L x n por outra matriz que é n x 1. i
Dado que os L instrumentos são todos exógenos - E(Ziui)
=0, temos L momentos nulos:
(6)
E ( gi ( )) 0
O ESTIMADOR IV-GMM
Cada uma das L equações de momento corresponde a um
momento amostral. Para um dado estimador ,
podemos escrever̂
estes L momentos amostrais como:
1 n 1 n
g ( ) g i ( ) Z i ( yi X i ˆ )
ˆ '
n i 1 n i 1 (7)
1
Z ' uˆ
n
O ESTIMADOR IV-GMM
g1 ( ) z11 z21 ... zl1 y1 ( 1 x11 ... k x1k )
g ( ) z z22 ... zl 2 y2 ( 1 x21 ... k x2 k )
2 1
12
... n ... ... ... ... ...
g ( ) z z2l ... zll y ( x ... x )
l 1l n 1 n1 k nk
O ESTIMADOR IV-GMM
O que está por trás da estimação GMM? Temos que
escolher um estimador para o vetor de parâmetros que
torne tãopróximo de zero
g ( quanto
) possível.
No caso de L = K (equação exatamente identificada)
temos L condições (equações) iguais a K coeficientes
(incógnitas) em . Neste caso, é possível achar uma
matriz que soluciona o sistema ̂ .
ˆ
g ( )
O ESTIMADOR IV-GMM
Quando L = K a equação é exatamente identificada e
uma solução única existe equivalente ao estimador
padrão de variáveis instrumentais:
(9)
ˆ 1
( Zde' sobre-identificação
NoIV caso X) Z'y (L > K), podemos definir
um conjunto de K instrumentos:
(10)
Xˆ Z '( Z ' Z ) 1 Z ' X Pz X
que é o estimador de mínimos quadrados em dois estágios
(2SLS) que a despeito do seu nome é calculado por esta
simples equação matricial.
O ESTIMADOR IV-GMM
Se a equação é sobre-identificada (L ≥ K) temos mais
equações do que incógnitas e neste caso não é possível
achar uma matriz ̂
que iguale exatamente todo o conjunto de L momentos a
zero.
Neste caso, temos que tomar uma matriz de ponderação
W (L x L) e utilizá-la para construir uma forma
quadrática nas condições de momento.
O ESTIMADOR IV-GMM
No método 2SLS com sobre-identificação os L instrumentos
disponíveis são reduzidos aos K necessários para definir a
matriz Pz.
De acordo com Baum(2008), na abordagem IV-GMM esta
redução não é necessária e todos os L instrumentos são usados
no estimador.
Uma matriz de ponderação é empregada de forma que
podemos determinar ˆGMM de forma que os elementos de
são ˆGMM
g (tão próximos
) de zero quanto possível.
Com L > K nem todas as L condições de momento podem ser
satisfeitas e um critério de função que pondere estas condições
apropriadamente é utilizado para aumentar a eficiência do
estimador.
O ESTIMADOR IV-GMM
O estimador GMM minimiza o critério (função objetivo):
(11)
J ( ˆGMM ) ng ( ˆGMM )'Wg ( ˆGMM )
onde W é uma matriz de ponderação simétrica LxL.
Resolvendo através deste critério de minimização obtemos o
estimador IV-GMM de uma equação sobre-identificada:
(12)
ˆGMM ( X ' ZWZ ' X ) X ' ZWZ ' y
que será idêntico para todas as matrizes W que diferem por um
fator de proporcionalidade.
O ESTIMADOR IV-GMM
A consistência é garantida por qualquer matriz de
ponderação W simétrica positiva e portanto há tantos
estimadores GMM como há escolhas da matriz de
ponderação W.
Mas a eficiência não é garantida por uma W arbitrária.
Então, o último estimador será referido como estimador
GMM possivelmente ineficiente.
Estamos interessados em obter estimadores GMM
eficientes: estimadores com mínima variância
assintótica.
QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A
VARIÂNCIA DO ESTIMADOR GMM?
Seja S a matriz de covariância assintótica das condições
de momento : g
1
S AVar ( g ( )) lim E ( Z ' uu ' Z )
n n
1 (13)
lim E ( Z ' Z )
n n
1
onde S é uma matriz L x L , g ( ) Z 'u
n
e Ω é a matriz de variância-covariância dos resíduos.
QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A
VARIÂNCIA DO ESTIMADOR GMM?
A fórmula geral para a distribuição do estimador GMM é:
1 (14)
V ( GMM ) (Q ' XZ WQXZ ) 1 (Q ' XZ WSWQXZ )(Q ' XZ WQXZ ) 1
n
O estimador GMM eficiente é o estimador GMM com uma
matriz de ponderação ótima que minimiza a variância
assintótica do estimador. Isto é obtido pela escolha de W = S-
1
QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A
VARIÂNCIA DO ESTIMADOR GMM?
Substituindo W por S-1 na expressão anterior do estimador
GMM, temos:
ˆGMM ( X ' ZS 1Z ' X ) X ' ZS 1Z ' y (15)
com variância assintótica:
ˆ
V ( EGMM ) (Q ' XZ S Q ' XZ )
1 1 (16)
A matriz S é obtida em um primeiro estágio através da
estimativa ineficiente de uma matriz diagonal que é ̂
posteriormente introduzida na expressão:
1 n 2 ' 1 (17)
Sˆ
n
uˆ Z Z
i 1
i i i
n
ˆZ
Z '
QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A
VARIÂNCIA DO ESTIMADOR GMM?
onde ̂é uma matriz diagonal de resíduos ao quadrado
de , queuéi2 o estimador GMM de primeiro estágio
consistente mas não necessariamente eficiente. No
comando Stata ivreg2, este estimador de primeiro estágio
é , ˆIV
o estimador de variáveis instrumentais.
COMO UTILIZAR O COMANDO IVREG2
PARA ESTIMAR GMM
use MROZ, clear
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6)
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), robust
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s robust
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s
No primeiro comando (acima) temos um estimador padrão IV/2SLS
(estamos assumindo da matriz de variância- covariância que os erros são
condicionalmente homocedásticos e independentes (i.i.d.).
No segundo comando temos um estimador IV/ 2SLS com estimador da matriz de
variância-covariância que é robusto a heterocedasticidade.
GMM E ERROS HETEROCEDÁSTICOS
̂ é a matriz diagonal de quadrados dos resíduos.
uˆ12 0
ˆ
uˆi 2
0 uˆn2
onde é uma estimativa consistente de . Então, um
uˆi
estimador consistente de S é ui
ˆ 1 (18)
ˆ Z)
S (Z '
n
GMM E ERROS HETEROCEDÁSTICOS
1. Estimar uma equação usando IV.
2. Calcule os resíduos . Use
û estes resíduos para calcular
a matriz de ponderação ótima:
ˆ ˆ 1 1 ˆ Z )) 1
W S1. ( ( Z ´ (19)
n
3. Calcule o estimador GMM eficiente ˆEGMM
e sua matriz
de variância-covariância usando a matriz de
ponderação ótima estimada.
QUAIS SÃO AS IMPLICAÇÕES DA
HETEROCEDASTICIDADE PARA O
ESTIMADOR IV?
Na presença de heterocedasticidade, o estimador IV é ineficiente
mas consistente, enquanto que a matriz padrão estimada de
covariância é inconsistente.
A vantagem do GMM sobre IV é clara: se a heterocedasticidade está
presente, o estimador GMM é mais eficiente que o estimador
simples IV, enquanto que se não existe heterocedasticidade o
estimador GMM não é pior assintoticamente que o estimador IV.
No entanto, o uso do GMM tem um preço. A matriz de ponderação
ótima é uma função dos quartos momentos e a obtenção de uma
Ŝ estes requer amostras muito grandes.
estimativa razoável para
Se o erro é homocedástico, IV é preferível ao GMM eficiente (ver
Slide 30).
TESTES DE HETEROCEDASTICIDADE
Estatísticas de Breusch-Pagan/Godfrey/Cook-Weisberg e
White/Koenker são testes de heterocedasticidade em regressão OLS.
Testa-se a relação entre os resíduos da regressão e p variáveis
indicadores que são relacionadas a heterocedasticidade (por
hipótese).
A estatística é distribuída como uma com 2p graus de liberdade sob
a nula de não heterocedasticidade e de queo erro da regressão é
normalmente distribuído.
O poder deste teste é muito sensível a hipótese de normalidade dos
resíduos: Koenker proposum teste que relaxa esta hipótese.
Estes testes estão no Stata após a estimação com o comando regress,
com ivhettest, hettest e whitetst.
TESTES DE HETEROCEDASTICIDADE
Pagan e Hall mostraram que estes testes são válidos na
regressão IV somente se há heterocedasticidade naquela
equação e em nenhuma outra mais no sistema.
As outras equações estruturais no sistema
(correspondentes aos regressores endógenos X1)
precisam ser homocedásticas mesmo que elas não sejam
explicitamente estimadas.
Este teste está disponível no Stata através do comando
ivhettest após a estimação com ivreg, ivreg2 ou ivgmm0
TESTANDO A RELEVÂNCIA E VALIDADE
DOS INSTRUMENTOS
Como vimos as variáveis instrumentais tem que
satisfazer duas condições: precisam ser correlacionadas
com os regressores endógenos e devem ser ortogonais
ao processo de erro.
A primeira condição pode ser testada examinando o grau
de ajuste das regressões de primeiro estágio, ou o que é o
mesmo, verificar o poder explicativo dos instrumentos
excluídos nestas regressões.
A estatística comumente usada é o R2 da regressão de
primeiro estágio: a correlação parcial ao quadrado entre
os instrumentos excluídos Z1 e o regressor endógeno
(Bound).
TESTANDO A RELEVÂNCIA E VALIDADE
DOS INSTRUMENTOS
Um exemplo: o pesquisador tem um modelo com dois regressores
endógenos e dois instrumentos excluídos. Um dos instrumentos
excluídos é altamente correlacionado com os dois regressores
endógenos mas o outro instrumento excluído tem uma correlação
nula (representa um processo de ruído).
O modelo está, portanto, sub-identificado: há um instrumento bom
mas dois regressores endógenos. Mas a estatística F e o R2 não
revelam esta fraqueza.
A solução é encontrar mais instrumentos relevantes ou eliminar o
regressor endógeno da equação.
A estatística de Bound só e válida quando temos apenas um
regressor endógeno.
TESTANDO A RELEVÂNCIA E VALIDADE
DOS INSTRUMENTOS
Para levar em conta diversos regressores endógenos
Shea(1997) propôs “uma medida de R2 parcial que leva
em conta as inter-correlações entre os instrumentos”.
Para um modelo contendo um único regressor endógeno,
as duas medidas de R2 são equivalentes.
Se uma equação gera um grande valor do R2 parcial
(Bound) e pequeno valor da medida de Shea, podemos
concluir que os instrumentos tem pouca relevância para
explicar os regressores endógenos e o modelo pode estar
sub-especificado.
CONSEQÜÊNCIAS DE INSTRUMENTOS
FRACOS
Aumento do viés dos coeficientes IV estimados.
O modelo não fica identificado com relação as variáveis endógenas.
Neste caso, o viés do estimador IV é o mesmo do estimador OLS –
a estimação IV é inconsistente e nada se ganha com isto.
Para equação com um único regressor endógeno uma estatística F
com valor menor do que 10 significa que os instrumentos são
fracos.
Deve-se ser parcimonioso na escolha dos instrumentos, dado que o
viés por IV é crescente com o numero de instrumentos.
O problema de instrumentos fracos pode aparecer mesmo quando os
testes de primeiro estágio são significativos aos níveis de 5 e 1 % e
se dispõe de uma amostra grande.
TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA (WOOLDRIDGE PG
473)
Suponha a seguinte equação de regressão:
y1 0 1 y2 2 z1 3 z2 u1 (20)
onde y2 é a variável que suspeita-se que seja endógena e z1
e z2 são exógenas.
Temos a equação de y2 na forma reduzida:
y2 0 1z1 2 z2 3 z3 4 z4 v2 (21)
Como as variáveis z são não correlacionadas com u1, y2
será não correlacionado com u1 se, e somente se v2 for
não correlacionada com u1.
TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA
Existem duas maneiras de testar isto:
1) Regredir u1 contra em v2 um modelo u1 1v2 e1
onde e1 é não correlacionado com v2 e tem média 0. Então
u1 e v2 serão não correlacionados se, e somente se .
1 0um regressor adicional na primeira
2) Incluir v como
2
equação e fazer um teste t para :
(22)1
y1 0 1 y2 2 z1 3 z2 1v2 u1
TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA
1 significativa (através de um teste t)
Se a estimativa for
concluímos que y2 é endógena na equação (20).
Podemos também testar a endogeneidade de múltiplas
variáveis explicativas. Para cada variável suspeita de ser
endógena obtemos os resíduos da equação da forma
reduzida e verificamos a significância conjunta da forma
estrutural usando um teste F. Se rejeitarmos a nula
concluímos que pelo menos uma das variáveis
explicativas é endógena (Wooldridge pg. 477).
TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA
* TESTE DE ENDOGENEIDADE DE UMA UNICA VARIAVEL EXPLICATIVA
use "c:\textos download\wooldridge data files\mroz.dta", clear
regress educ exper expersq motheduc fatheduc if hours > 0
test motheduc fatheduc
predict v2,residuals
regress lwage educ exper expersq v2
regress lwage educ exper expersq
ivregress 2sls lwage exper expersq (educ = motheduc fatheduc)
MODELOS DE EQUAÇÃO SIMULTÂNEA E
O PROBLEMA DA IDENTIFICAÇÃO
Vamos supor um modelo Keynesiano simples de determinação
de renda:
Função consumo: (23) Ct 0 1Yt ut 0 < 1 1
Identidade da renda: Ct I t ( St )
Yt (24)
onde:
C = despesas de consumo
Y = renda
I = investimento (considerado exógeno)
S = poupança
t = tempo
u = termo de erro estocástico
MODELOS DE EQUAÇÃO SIMULTÂNEA E
O PROBLEMA DA IDENTIFICAÇÃO
No modelo de equações simultâneas (equações 23 e 24)
nota-se que C e Y são variáveis interdependentes.
Quando o termo aleatório ut muda, o valor de C varia
(pela equação 23) e isto faz variar Y (pela equação 24)
tornando Yt e ut correlacionados em (23).
Isto faz com que o estimador OLS de em (23) seja
1 isto
viesado e inconsistente. Podemos demonstrar
também (ver Gujarati, pg 582) substituindo (23) em (24)
e teremos:
(25)
Yt 0 1Yt ut I t
O PROBLEMA DA IDENTIFICAÇÃO
Problema da identificação = possibilidade de obter, ou
não, os parâmetros de uma equação estrutural a partir
dos coeficientes estimados na forma reduzida. Em caso
afirmativo, dizemos que a equação é identificada. Em
caso negativo, dizemos que a equação é sub-identificada.
Uma equação é exatamente identificada quando
podemos obter valores numéricos exatos para seus
parâmetros.
Uma equação é sobre-identificada quando mais de um
valor numérico podem ser obtidos para alguns dos
parâmetros das equações estruturais.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
No caso de um modelo com M equações simultâneas,
para que a equação possa ser identificada, é preciso que
exclua no mínimo M-1 das variáveis (tanto endógenas
quanto exógenas) que aparecem no modelo.
Para que uma equação seja identificada, em um modelo
de M equações simultâneas, o número de variáveis
exógenas excluídas da equação não poderá ser menor do
que o número de variáveis endógenas incluídas nesta
equação menos 1.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
Exemplo 1:
Função de demanda: Qt 0 1Pt u1t
Função de oferta: Qt 0 1Pt u2t
modelo com duas variáveis endógenas, P e Q e nenhuma
variável exógena. Para serem identificadas, cada uma
destas equações devem excluir M-1 = 2-1 = 1 variável.
Como isto não ocorre nenhuma das equações é
identificada.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
Exemplo 2:
Função de demanda: Qt 0 1 Pt 2l + u1t
Função de oferta: Qt 0 1Pt u2 t
modelo com duas variáveis endógenas, P e Q e l é exógena.
Para serem identificadas, cada uma destas equações devem
excluir M-1 = 2-1 = 1 variável. A função de demanda não é
identificada, mas a função de oferta é exatamente
identificada.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
Exemplo 3:
Função de demanda: Qt 0 1 Pt 2l + u1t
Função de oferta: Qt 0 1Pt 2 Pt 1 u2t
modelo com duas variáveis endógenas, Pt e Qt e l e Pt-1 são
exógenas. Para serem identificadas, cada uma destas
equações devem excluir M-1 = 2-1 = 1 variável. Tanto a
função de demanda como a função de oferta são
exatamente identificadas. Portanto, o modelo como um
todo é identificado.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE POSTO
Ver Gujarati e Baum.
TESTES REALIZADOS ATRAVÉS DO
COMANDO IVREG2: TESTE HANSEN-SARGAN
Teste de restrições de sobre-identificação.
A hipótese nula conjunta é que os instrumentos são
instrumentos válidos, isto é, não correlacionados com o
termo de erro e que os instrumentos excluídos são
corretamente excluídos da equação estimada.
Sob a nula, a estatística de teste é distribuída como qui-
quadrado no número de restrições de sobre-identificação.
Uma rejeição coloca em dúvida a validade dos
instrumentos.
TESTES REALIZADOS ATRAVÉS DO
COMANDO IVREG2: TESTE HANSEN-SARGAN
Para o estimador eficiente GMM, a estatística de teste é
a estatística J de Hansen, que é o valor minimizado da
função objetivo GMM.
Para os estimador 2SLS, a estatística de teste é a
estatística de Sargan, calculada como N*R2 de uma
regressão dos resíduos de IV sobre o conjunto completo
de instrumentos.
.
TESTES REALIZADOS ATRAVÉS DO
COMANDO IVREG2: ESTATÍSTICA C
A estatística C, ou estatística “diferença-em-Sargan” é obtida através
da opção orthog do comando ivreg2.
Permite o teste de um subconjunto de condições de ortogonalidade,
ou seja, é o teste de exogeneidade de um ou mais instrumentos.
É definida como a diferença da estatística Hansen-Sargan da
equação com o conjunto menor de instrumentos e a equação com o
conjunto completo de instrumentos (incluindo os instrumentos
suspeitos).
Sob a nula de que todos os instrumentos são válidos a estatística C
tem distribuição qui-quadrado no número de instrumentos testados.
A falha em rejeitar a nula significa que o conjunto total de condições
de ortogonalidade é válido.
TESTES REALIZADOS ATRAVÉS DO COMANDO
IVREG2: TESTE DE RAZÃO DE VEROSSIMILHANÇA
DE CORRELAÇÃO CANÔNICA DE ANDERSON
Testa se a equação é identificada, ou seja, se os instrumentos
excluídos são válidos.
A hipótese nula é que a equação é sub-especificada.
Sob a nula de sub-identificação, a estatística é distribuída como qui-
quadrado com L-K+1 graus de liberdade (L= número de
instrumentos excluídos e incluídos).
A estatística fornece uma medida da relevância dos instrumentos e a
rejeição da nula indica que o modelo é identificado.
Importante: uma rejeição da nula deve ser interpretada com cautela,
já que problemas de instrumentos fracos podem ainda estar
presentes.
O COMANDO IVREG2
O COMANDO IVREG2 E
COMPLEMENTARES
Uma importante referencia a ser pesquisada é:
Baum, Christopher F. Instrumental variables: Overview
and advances. Boston College and DIW BerlinUKSUG
13, London, September 2007.
REFERENCIAS
Baum, C. F., M. E. Schaffer, and S. Stillman. 2003.
Instrumental variables and GMM: Estimation and
testing. Stata Journal 3: 1–31.
Baum, C. F. 2006. An Introduction to Modern
Econometrics Using Stata. College Station, TX: Stata
Press.
Baum, C. F. Schaffer M.E. e Stillman, S. 2006. Enhanced
routines for instrumental variables/GMM estimation and
testing, 2007.
Wooldridge, J. M.. 2003. Introductory Econometrics: A
Modern Approach. 2nd ed. New York: Thomson
Learning.
REFERENCIAS
Cameron, A.C. e Trivedi, P.K., 2009. Microeconometrics
using Stata, StataCorp LP., College Station, Texas.