0% encontró este documento útil (0 votos)
79 vistas13 páginas

Modelo Probit en la Oferta Laboral Perú

dfgdy rt rty uh idrnm ghdf ghdfhd f dsf hpdfjigjdñ uifo ngodu gnñlisdfn m gñlkdnsfñl gdsfljk gldsf df sd f h sdf h sd h fg jfg j kg dfhkj dh gjk gjg hk f kgf jfg hf g j df j lotfh´hifg fdm hmñhg ´df h´dfm gfd f fg hfg
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
79 vistas13 páginas

Modelo Probit en la Oferta Laboral Perú

dfgdy rt rty uh idrnm ghdf ghdfhd f dsf hpdfjigjdñ uifo ngodu gnñlisdfn m gñlkdnsfñl gdsfljk gldsf df sd f h sdf h sd h fg jfg j kg dfhkj dh gjk gjg hk f kgf jfg hf g j df j lotfh´hifg fdm hmñhg ´df h´dfm gfd f fg hfg
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 13

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE CIENCIAS MATEMTICAS


E.A.P. DE. ESTADSTICA

Modelos Probit y Tobit aplicados al estudio de la oferta


laboral de los trabajadores secundarios en el Per
Captulo 3. Modelo Probit

MONOGRAFA
Para optar el Ttulo de Licenciado en Estadstica

AUTOR
Edgard Abanto Millones

LIMA PER
2003

CAPTULO III
MODELO PROBIT
3.1 INTRODUCCIN
En el captulo anterior se mostr el modelo de probabilidad lineal, que es una
aplicacin sencilla del modelo de regresin lineal mltiple a una

variable

dependiente binaria. La cualidad discreta de y no significa en s que los modelos


lineales sean inadecuados, pero como vimos, el modelo de probabilidad lineal
tiene ciertos inconvenientes. Las dos desventajas ms importantes que presenta
son que las probabilidades ajustadas pueden ser menores a cero o mayores que
uno y que el efecto marginal de cualquier variable explicativa es constante. Sin
embargo, se present de manera general algunos modelos tales como el Logit y el
Probit, que salvan las deficiencias del Modelo de Probabilidad Lineal (MPL), la
desventaja es que la interpretacin de sus resultados no es tan sencilla.

3.2 FORMULACIN DEL MODELO PROBIT


En el MPL, suponemos que la probabilidad de respuesta es lineal en el conjunto
de parmetros ; para evitar las limitaciones del MPL, se considera una clase
especial de modelos de respuesta binaria de la forma:
P( y =1|x)= F(0 + 1 x1+ 2 x2+...+n xn)=F (x)

(3.1)

Donde F es una funcin que asume valores que se hallan estrictamente entre
cero y uno 0<F(x)<1, para todos los nmero reales. Esto asegura que todas las
probabilidades de respuestas estimadas se hallen estrictamente entre cero y uno.
En este captulo se analizar el modelo Probit el cual ser la base para el
problema planteado al inicio de trabajo. Donde F es la funcin de distribucin
acumulada normal estndar, que se expresa como una integral:
'x

P( y = 1) = F ( ' x) =

'x

1
1
exp( t 2 ) dt = ( t ) dt
2
2

(3.2)

y
(t ) = ( 2 ) 1 2 exp( t 2 2)

La funcin F en (3.2) es creciente. F(t)


t

0 cuando t -

y F(t)

1 cuando

. La funcin Probit se presenta en la grfica N 2.

Grfico N 2
'x

Funcin Probit P( y = 1) = F ( ' X ) =

1
1
exp( t 2 ) dt =
2
2

'x

(t)dt

3.2.1 Modelo de Variables Latentes


Los Modelos de Respuesta Binaria (MRB) pueden ser desarrollados usando una
variable latente la cual satisface las suposiciones del modelo lineal clsico. En los
MRB se supone que hay una variable no observada y * que toma valores
continuos tal que para aquellos valores mayores a un valor a, y = 1 y para
aquellas valores de y * menores que a, y =0 . En otras palabras los MRB
aparecen con frecuencia como modelos con funcin ndice la cual es el resultado
de una eleccin discreta en base a una regresin subyacente.
Siguiendo con nuestro problema planteado en el captulo I, es decir, la decisin
del trabajador secundario de participar en el mercado laboral, el individuo hace
un clculo entre la cantidad de consumo y ocio que pueden comprar dadas las
restricciones impuestas por el ingreso familiar disponible, el ingreso no laboral y
laboral, y con el beneficio que podra generar otra decisin. Puesto que la
cantidad de consumo evidentemente no es observable, ajustamos la diferencia
entre el consumo y el beneficio de otra decisin con una variable no observable
y* que cumple
y * = x +

(3.3)

Supongamos que la distribucin del error es normal con media cero y varianza
uno.
No observamos el beneficio neto de decidir participar en la oferta laboral, slo si
sta se hace o no. Por lo tanto, nuestra observacin es

y =1 si y * > a
y =0 si y *

Con esta formulacin, x recibe el nombre de funcin ndice, donde a es el


umbral o punto de corte.
La conexin entre la variable latente y * y la observada y es mostrada en la
figura N 3 para el modelo 3.3 . En la figura y * esta en el eje vertical, con un
umbral =0 indicado por la lnea horizontal punteada. La distribucin de y *
muestra una curva acampanada, cuando y * es mayor que , indicado por la
regin sombreada, se observa y =1.
Como vemos el modelo no puede ser estimado con MCO, por ello usamos la
estimacin por Mxima Verosimilitud que requiere conocer la distribucin de los
errores. Para el modelo Probit asumimos que el error sigue una distribucin
normal con media 0 y varianza 1, la hiptesis de que el umbral es cero puede
facilitar los clculos, sin embargo puede tomar cualquier valor.
Grfico N 3
La distribucin de y* dado x en la Distribucin de Respuesta Binaria

La probabilidad del suceso y=1 es:


Prob ( y = 1)

= Prob ( y * > 0)

= Prob (x + > 0)
= Prob ( > - x )
Si la distribucin es simtrica, como la distribucin normal,
Prob ( y = 1)

=Prob ( y * > 0)
= Prob ( < x )
= F (x)

De este modo se obtiene un modelo estructural para la probabilidad.

3.3 ESTIMACIN DE MXIMA VEROSIMILITUD DEL MODELO


PROBIT
Todos los modelos de eleccin binaria, excepto el modelo de probabilidad lineal,
se estiman habitualmente por el mtodo de Mxima VerosimilItud. Cada
observacin se considera como realizacin individual de una variable aleatoria
con distribucin Bernoulli (es decir binomial con n=1). La probabilidad conjunta,
o funcin de verosimilitud, de un modelo con probabilidad de xito F(x) y
observaciones independientes es
Pr ob(Y1 = y1 , Y2 = y2 ,..., Yn = yn ) =

(1 F (' x)) F (' x)


yi = 0

(3.4)

yi = 1

Podemos re escribir esta frmula como


1 y i

L = [F ( ' x )] [1 F( ' x )]
n

yi

(3.5)

i =0

Esta es la funcin de verosimilitud para una muestra de n observaciones.


Tomando logaritmos obtenemos:
ln L = [ y i ln F ( ' xi ) + (1 yi ) ln( 1 F ( ' x i ))]

(3.6)

Las condiciones de primer orden del problema de maximizacin requieren que


ln L
=

y
i =1

f ( ' x )
f ( ' x)
+ (1 yi )
x=0
F ( ' x)
(1 F ( ' x ))

(3.7)

A menos que se utilice el modelo de probabilidad lineal, las ecuaciones


contenidas en (3.7) sern no lineales y habrn de resolverse con mtodos
numricos. Para los MRB, los estimadores de mximo verosimilitud son
obtenidos igualando la primera derivada (o gradiente) a 0 y haciendo uso del
lgebra. Sin embargo, en los modelos no lineales es raramente posible encontrar
la solucin usando lgebra. En consecuencia, se usa los mtodos numricos para
encontrar estimadores que maximicen la funcin de verosimilitud. Los mtodos
numricos empiezan con un supuesto de los valores e iterando para mejorar la
suposicin.
Uno de los mtodos ms utilizados es el conocido mtodo del tanteo. El mtodo
de tanteo (Scoring) usa la informacin de la matriz de informacin, las
estimaciones Probit se obtienen como resultado de varias etapas:
l
f +1 = f + I 1 ( f )
f

(3.8)

donde los subndices indican el nmero de iteraciones necesarias para hallar la


solucin. El proceso se detiene cuando la diferencia entre f +1 y f se acerca lo
suficiente a cero.
I( f ) es una estimacin de la matriz de informacin de Fisher (matriz cuadrada
y simtrica del negativo de las derivadas de segundo orden del logaritmo de la
funcin de verosimilitud, por lo que la mxima verosimilitud logartmica es
globalmente cncava2) evaluada en el ltimo supuesto.
2

Mtodos de Econometra. J. Johnston. 1997. Una de las caractersticas del modelo probit (o logit) es que las
funciones mximo de verosimilitud son globalmente cncavas. As pues, no resulta necesario que el programa
de optimizacin se preocupe por la discriminacin entre mximos locales y mximos globales. Se trata de
encontrar aquellos valores de los parmetros que maximizan el logaritmo de la funcin de verosimilitud que
sern, a su vez, los mximos locales y globales.

I( ) = - E (

ln L
)
'

(3.9)

Esta matriz es definida negativa sea cual sea el valor de .


Superado el problema de la naturaleza no lineal de la maximizacin, en
condiciones optimas los estimadores MV son consistentes, asintticamente
normales y eficientes. Adems de estimar los parmetros

, los m todos

numricos proporcionan estimaciones de la matriz de la covarianza asinttica


Cov (), que es usada para estimar los test estadsticos. La teora de mxima
verosimilitud muestra que la matriz varianza covarianza asinttica es, menos la
inversa de la matriz que se utilice para estimar el Hessiano esperado. Lo ms
habitual es utilizar el Hessiano observado, puesto que ste es el que se utiliza,
generalmente, en las iteraciones.
Cov () = I 1 ( f ) ,
donde:

2
-1

( f )= -E (

ln L -1
)
'

(3.10)

Con los estimadores calculados, podemos considerar la interpretacin del


Modelo de Respuesta Binaria .

3.3.1 Interpretacin del cambio parcial en P(y=1/x)

Los s pueden ser usados para calcular el cambio parcial en la probabilidad de


un evento.
Dado
Prob ( y = 1/x)

= F (x)

(3.11)

Donde F es la funcin de distribucin acumulada de la distribucin normal.


La funcin de densidad es indicado como . El cambio parcial en la
probabilidad, tambin llamado efecto marginal, es calculado tomando la derivada
parcial de la ecuacin (3.11) con respecto a xk.
P ( y = 1 / x) F ( ' x) dF ( ' x) ' x
=
=
= f ( ' x) k
xk
xk
d ' x xk

para el modelo probit


P( y = 1 / x)
= ( ' x) k
xk

(3.12)

El efecto marginal es la pendiente de la curva de probabilidad referente a xk ,


manteniendo a todas las otras variables constantes. El signo del efecto marginal
es determinado por k ya que (x) es siempre positiva. La magnitud del cambio
depende de la magnitud de k y del valor de x.

3.4 PRUEBA DE HIPTESIS PARA LOS PARMETROS ESTIMADOS


En los modelos lineales se utilizan generalmente las pruebas t, F y Ji cuadrado
para probar diversidad de hiptesis, pero como nos encontramos en un mundo
menos cmodo, es decir el de los modelos no lineales donde se necesitan otros
mtodos para probar hiptesis con los que se puedan evaluar estos modelos.
De manera general se puede mencionar las conocidas pruebas de verosimilitud y
de Wald que permite lograr este propsito. Lo interesante de observar es que
asintoticamente (muestras grandes) las dos pruebas son equivalentes en cuanto a
que la estadstica de prueba asociada con cada una de estas pruebas sigue la
distribucin ji-cuadrado.
3.4.1 El Test de Wald
Consideremos el contraste lineal de la forma:
R =r
donde es el vector de parmetros, R es la matriz de constantes, y r es un vector
de constantes. As, (R - r ) indicar hasta que punto los estimadores no
restringidos de Mxima Verosimilitud ajustan la hiptesis nula. Cuando el vector
se acerque a cero la hiptesis nula tender a cumplirse; por otro lado los valores
grandes tendern a contradecirla.
La hiptesis Ho : R =r puede ser testada con el estadstico Wald:

W= [R r ][' RV a r ( ) R'] [R r ]
1

(3.13)

W esta distribuida como Ji cuadrada con grados de libertad igual al nmero de


contrastes (numero de filas de R). El estadstico de Wald esta compuesta de dos
componentes. Primero R r que es la medida entre el estimador y el valor de la
hiptesis. Segundo el termino [RV a r ( ) R'] refleja la variabilidad del estimador.
1

Cuando W es mayor que el valor crtico indicado a un nivel de significancia se


rechaza la hiptesis Ho.
3.4.2 Contraste de Bondad de Ajuste: Razn de Verosimilitud
Como medida de bondad de ajuste realizado, puede utilizarse el porcentaje de
individuos directamente el porcentaje de individuos que eligen la opcin predicha
por el modelo.
Alternativamente, como medida ms usual, puede utilizarse el ratio de
verosimilitud, definido como :
LR= - 2 [1nL r 1nL ],
Siendo L r y L las funciones de verosimilitud logartmicas evaluadas en el estimador
restringido y no restringido, respectivamente. Un contraste que se realiza con
frecuencia, similar al contraste F de que todas las pendientes del modelo probit
son cero. En este contraste, por tanto, no hay ninguna restriccin para el trmino
contraste.

La idea bsica detrs de la prueba Razn de Verosimilitud es simple: si la(s)


restriccin(es) a priori son vlidas, las funciones restringidas y no restringidas no
deben ser diferentes, en cuyo caso LR debe ser cercano a cero. Pero si ese no es
el caso, las funciones divergirn. Puesto que para las muestras grandes sabemos
que LR sigue una distribucin ji-cuadrado, podemos averiguar si la divergencia es
estadsticamente significativa.
Las hiptesis son:
H0 : El modelo ajustado es significativo
H1 : El modelo ajustado no es significativo
Estadstico de prueba
LR ~ X2 con n-k-1 grados de libertad
donde:
n: nmero de registros
K: nmero de variables
Decisin
si LR < X2,(n k 1) no rechazamos H0, el modelo ajustado es significativo.

También podría gustarte