Chapitre 2
Le modèle de régression linéaire simple
L’économétrie est un outil d’analyse à la disposition de l’économiste qui aide à la
modélisation, à la réflexion théorique ou à l’action économique par :
– la mise en évidence de relations entre des variables économiques qui n’étaient pas a priori
évidentes ou pressenties ;
– l’induction statistique ou l’inférence statistique qui consiste à inférer, à partir des
caractéristiques d’un échantillon, les caractéristiques d’une population. Elle permet de
déterminer des intervalles de confiance pour des paramètres du modèle ou de tester si un
paramètre est significativement inférieur, supérieur ou simplement différent d’une valeur fixée;
– la simulation qui mesure l’impact de la modification de la valeur d’une variable sur une autre;
– la prévision, par l’utilisation de modèles économétriques, qui est utilisée par les pouvoirs
publics ou l’entreprise afin d’anticiper et éventuellement de réagir à l’environnement
économique.
1. Présentation du modèle
1.1. Construction du modèle
[sur la base de la théorie économique]
Considérons la fonction de consommation keynésienne suivante :
C = α 0 + α1Y
avec
Les variables :
C : la consommation indique la variable à expliquer ou endogène ou dépendante ;
Y : le revenu indique la variable explicative ou exogène ou indépendante ;
Les paramètres du modèle (que nous appellerons plus loin coefficient de régression) :
α 0 : consommation autonome ou incompressible
α1 : propension marginale à consommer
1.2. Spécification du modèle
Nous pouvons spécifier le modèle en fonction du type de données recueillies, ainsi nous
avons :
1
• Les modèles en série temporelle, les variables représentent des phénomènes observés à
intervalles de temps réguliers, par exemple la consommation et le revenu sur un nombre
d’années T pour une ville donnée :
Ct = α 0 + α1Yt , t = 1,..., T
• Les modèles en coupe instantanée, les variables représentent des phénomènes observés au
même instant mais concernant plusieurs individus, par exemple la consommation et le revenu
observés sur un échantillon de n villes :
Ci = α 0 + α1Yi , i = 1,..., n
• Prise en compte du terme d’erreur
Le modèle tel qu’il est spécifié n’est qu’une représentation restreinte de la réalité. Ne
choisir que le revenu pour expliquer la consommation est à l’évidence même insuffisant car il
existe une multitude d’autres facteurs susceptibles d’expliquer la consommation.
C’est pourquoi nous intégrons un terme (ε) qui synthétise l’ensemble de ces
informations non explicitées dans le modèle.
Dès lors, nous obtenons le modèle économétrique suivant :
Ci = α 0 + α1Yi + ε i
où εi représente l’erreur de spécification du modèle, c’est-à-dire l’ensemble des
phénomènes explicatifs de la consommation non liée au revenu. Le terme εi mesure la différence
entre les valeurs réellement observées de Ci et les valeurs qui auraient été observées si la relation
spécifiée avait été rigoureusement exacte.
Le terme εi regroupe donc un ensemble d’erreurs :
– une erreur de spécification, c’est-à-dire le fait que la seule variable explicative n’est pas
suffisante pour rendre compte de la totalité du phénomène expliqué ;
– une erreur de mesure, les données ne représentent pas exactement le phénomène ;
– une erreur de fluctuation d’échantillonnage, d’un échantillon à l’autre les observations, et
donc les estimations, sont légèrement différentes.
2. Estimation des paramètres
2.1. Modèle et hypothèses
Dans sa forme générale, le modèle de régression linéaire simple est le suivant :
yi = β0 + β1 xi + ε i , i = 1,..., n
2
avec yi la variable à expliquer ; xi la variable explicative; β0 , β1 les paramètres à estimer; εi le
terme d’erreur de spécification (l’erreur est inconnue et restera inconnue).
Hypothèses
H1. le modèle est linéaire en xi (ou en n’importe quelle transformation de xi ).
H2. les valeurs xi sont observées sans erreur (xi sont mesurés avec certitude).
H3. E(εi) = 0, l’espérance mathématique de l’erreur est nulle ; en moyenne le modèle est bien
spécifié et donc l’erreur moyenne est nulle.
H4. E (ε i2 ) = σ 2 , ∀i , la variance de l’erreur est constante: homoscédacticité
H5. E ( ε i ε j ) = 0, i ≠ j : les erreurs sont non corrélées (ou encore indépendantes) absence
d’autocorrélation
H6. Cov ( xi ε i ) = 0 , l’erreur est indépendante de la variable explicative.
2.2 Formulation des estimateurs
En traçant un graphique des couples de données liant le revenu et la consommation observée,
nous obtenons un nuage de points que nous pouvons ajuster à l’aide d’une droite.
L’estimateur des coefficients β0 et β1 est obtenu en minimisant la distance au carré entre
chaque observation et la droite, d’où le nom d’estimateur des moindres carrés ordinaires
(MCO).
La résolution analytique est la suivante :
3
n n
S = min ε i2 = min ( yi − β 0 − β1 xi )
2
i =1 i =1
Dérivons cette fonction par rapport aux paramètres afin d’obtenir son minimum :
∂S n
= −2 ( yi − β 0 − β1 xi ) = 0 ,
∂β 0 i =1
∂S n
= −2 xi ( yi − β 0 − β1 xi ) = 0
∂β1 i =1
En faisant la somme par rapport à i, on parvient aux équations normales
y i − nβˆ0 − βˆ1 xi = 0
i i
x y i i − βˆ0 xi − βˆ1 xi2 = 0
i i i
d’où
βˆ0 = y − βˆ1 x (1)
( x − x )( y
i i − y) x y i i − nxy
βˆ1 = i
= i
(2)
( x − x ) x
2
i
2
i − nx 2
i i
On note que : β̂1 est la pente de la droite ou encore une propension marginale. Il permet
de mesurer l’impact d’une variation de xi sur yi : ∆yi = βˆ1∆xi
2.3. Ecriture du modèle estimé
Le modèle simple peut s’écrire suivant :
- Modèle théorique spécifié avec εi l’erreur inconnue
yi = β0 + β1 xi + ε i
- Modèle estimé à partir d’un échantillon:
yi = βˆ0 + βˆ1 xi + ei = yˆi + ei
Le résidu observé ei est donc la différence entre les valeurs observées de la variable à expliquer
yi et les valeurs ajustées yˆi à l’aide des estimations des coefficients du modèle
ei = yi − yˆi
3. Propriétés des estimateurs
yi = β0 + β1 xi + ε i
4
y = β0 + β1 x + ε
Faisons
yi − y = β1 ( xi − x ) + ( ε i − ε )
En insérant cette expression dans l’estimateur, on obtient :
( x − x )(ε
i i −ε ) ( x i − x )ε i
βˆ1 = β1 + i
= β1 + i
( x − x) ( x − x)
2 2
i i
i i
Puisque
ε ( xi − x ) =ε xi − ε nx =ε nx − ε nx = 0
i i
Biais des estimateurs :
( x − x ) E (ε i )
( )
i
E βˆ1 = β1 + i
( x − x )
2
i
i
( )
donc E βˆ1 = β1 car E ( ε i ) = 0 : l’estimateur est sans biais.
De même on démontre que E βˆ0 = β 0 ( )
y = βˆ0 + βˆ1 x
y = β0 + β1 x + ε
On a βˆ0 = β 0 + ε − βˆ1 − β1 x ( )
Appliquons l’espérance
( )
E βˆ0 = β 0 + E ( ε ) − E βˆ1 − β1 x = β 0
( )
( )
car E βˆ1 − β1 = 0 et E (ε ) = 0
Les estimateurs sont sans biais.
Convergence des estimateurs
5
EXERCICES
Exercice 1
Le tableau 1 présente le revenu moyen par habitant sur 10 ans exprimé en dollars pour un pays.
Tableau 1 – Évolution du revenu moyen par habitant en dollars
Sachant que la propension marginale à consommer est de 0,8 et que la consommation
incompressible est 1 000, on demande :
1) de calculer la consommation théorique sur les 10 ans ;
2) considérant que notre erreur d’observation suit une loi normale de moyenne 0 et de variance
20 000, de générer cette variable aléatoire et de calculer une consommation observée tenant
compte de cette erreur.
3) Estimation des coefficients de régression : À partir des données du tableau obtenu, on
demande de calculer βˆ0 et βˆ1 .