Support Master 2
Support Master 2
Le modèle
de régression multiple
L
e modèle linéaire général est une extension du modèle de régres-
sion simple abordé au chapitre précédent. Après avoir présenté le
modèle linéaire général (I), nous envisageons une procédure d’es-
timation des paramètres en étudiant les propriétés statistiques des esti-
mateurs (II). Les différents tests d’hypothèses concernant les coefficients
du modèle sont proposés en (III), et la section (IV) est consacrée à l’analy-
se de la variance ainsi qu’aux tests s’y rattachant.
En (V) nous présentons une classe particulière de séries explicatives : les
variables indicatrices, puis la prévision à l’aide du modèle linéaire géné-
ral fait l’objet de la section (VI).
Enfin nous terminons ce chapitre par quelques exercices récapitulatifs.
B. Forme matricielle
L’écriture précédente du modèle est d’un maniement peu pratique. Afin d’en
alléger l’écriture et de faciliter l’expression de certains résultats, on a habituel-
lement recours aux notations matricielles. En écrivant le modèle, observation
par observation, nous obtenons :
avec :
y1 1 x11 x21 ... xk1 ε1
y2 1 x12 x22 ... xk2 a 0 ε2
. . .. .. a1 .
. . .
. . . . ... a .
Y = ; X = ; a = 2 ; ε =
yt 1 x1t x2t ... xkt ... εt
. . .. .. .
. .. . . ... ..
. ak
yn 1 x1n x2n ... xkn εn
Nous remarquons la première colonne de la matrice X , composée de 1, qui
correspond au coefficient a0 (coefficient du terme constant).
La dimension de la matrice X est donc de n lignes et k + 1 colonnes (k étant
le nombre de variables explicatives réelles, c’est-à-dire constante exclue).
48 ÉCONOMÉTRIE
L’écriture sous forme matricielle rend plus aisée la manipulation du modèle
linéaire général, c’est pourquoi nous l’adoptons par la suite.
n
Min εt2 = Min ε′ ε = Min (Y − Xa)′ (Y − Xa) = Min S [2]
t=1
1) Cas particulier
Si nous raisonnons sur des données centrées, l’estimateur de a peut s’écrire en
fonction des matrices des variances et covariances empiriques :
−1
a1 Var(x1 ) Cov(x1 , x2 ) Cov(x1 , x3 ) . . . Cov(x1 xk )
a Cov(x2 , x1 ) Var(x2 ) Cov(x2 , x3 ) . . . Cov(x2 , xk )
2
= . . . Cov(x3 , xk )
a3 Cov(x3 , x1 ) Cov(x3 , x2 ) Var(x3 )
... ...
ak Cov(xk , x1 ) Cov(xk , x2 ) Cov(xk , x3 ) . . . Var(xk )
Cov (x1 ,y)
Cov(x2 , y)
×
Cov(x3 , y)
...
Cov(xk , y)
avec a0 = y −
a1 x 1 −
a2 x 2 − . . . −
ak x k .
Que sont des données centrées sur la moyenne ? Soit xt une variable connue
sur n observations et x sa moyenne, nous pouvons calculer une nouvelle variable
n
n
(X t = xt –x) dont la somme est par construction nulle : (xt − x) = Xt = 0 .
t=1 t=1
Nous avons donc X = 0 .
50 ÉCONOMÉTRIE
Si la variable x2 passe de la valeur x2t à (x2t + x2t ) , toutes choses étant
égales par ailleurs (les k − 1 autres variables restant constantes), alors la
a2 x2 : ŷt =
variable à expliquer varie de a2 x2t .
Les coefficients s’interprètent donc directement en terme de propension mar-
ginale.
1) Hypothèses stochastiques
2) Hypothèses structurelles
1. Dans le cas d’une égalité, nous aurions un système de n équations à n inconnues, donc parfai-
tement déterminé.
Y = Xa + ε
Y = X
a+e (e = résidu)
→e =Y −Y
= X
Y a
Nous obtenons :
a = (X ′ X)−1 X ′ Y = (X ′ X)−1 X ′ (Xa + ε)
a = (X ′ X)−1 X ′ (Xa) + (X ′ X)−1 X ′ ε [4]
a = a + (X ′ X)−1 X ′ ε
a ) = a + (X ′ X)−1 X ′ E(ε) = a
d’où E( car E(ε) = 0
L’estimateur est donc sans biais : E(
a) = a
a − a) = (X ′ X)−1 X ′ ε et (
Or, d’après [4], ( a − a)′ = ε′ X (X ′ X)−1 puisque
′ −1
(X X) est symétrique . 1
52 ÉCONOMÉTRIE
−1
σ2 X′X
â = ε ⇒ Lim â = 0 si n −→ ∞ (d’après les hypothèses H3
n n
et H7). L’estimateur est donc convergent.
Théorème de Gauss-Markov : L’estimateur [3] des moindres carrés est qua-
lifié de BLUE (Best Linear Unbiaised Estimator), car il s’agit du meilleur esti-
mateur linéaire sans biais (au sens qu’il fournit les variances les plus faibles pour
les estimateurs).
Il est à noter que l’estimateur du maximum de vraisemblance des paramètres
fournit des résultats identiques à ceux de l’estimateur des MCO si l’hypothèse
de normalité des erreurs est vérifiée.
Après un calcul matriciel1, il apparaît que nous pouvons estimer sans biais
2
σε par :
e′ e
σε2 =
[6]
n−k−1
â =
σε2 (X ′ X)−1 [7]
Supposons que les variables explicatives soient séparées en deux groupes repré-
sentés par les matrices X 1 et X 2 . Le modèle s’écrit : Y = X 1 a1 + X 2 a2 + ε .
Le théorème de FWL nous dit que l’estimateur des MCO du paramètre a2 et
des résidus sont les mêmes que ceux du modèle : M1 Y = M1 X 2 a2 + v avec
M1 = I − X 1 (X 1′ X 1 )−1 X 1′ .
La matrice M1 est symétrique et idempotente (M1′ M1 = M1 ) , de plus
M1 X 1 = 0 .
Ce théorème permet de bien comprendre le problème de la spécification d’un
modèle : si une variable Y est effectivement expliquée par le groupe de variables
X 1 et X 2 , il faut impérativement faire figurer dans le modèle ces deux groupes
de variables même si seul le groupe de variables X 1 nous intéresse.
(yt − y)2 = y)2 +
yt −
( et2
t t t [8]
SC T = SC E + SC R
yt − y)2
( et2
t t
R2 = =1− [9]
(yt − y)2 (yt − y)2
t t
′ Y
Y e′ e
R2 = = 1 − [10]
Y′ Y Y′ Y
54 ÉCONOMÉTRIE
liberté est faible1, il convient de corriger le R 2 afin de tenir compte du relative-
ment faible nombre d’observations comparé 2
au nombre de facteurs explicatifs
par le calcul d’un R 2 « corrigé » noté R :
2 n−1
R =1− (1 − R 2 ) [11]
n−k−1
2 2
On a R < R 2 et si n est grand R ≃ R 2 .
Nous verrons au chapitre 4 section IV deux critères (Akaike et Schwarz) per-
mettant d’arbitrer, lors de l’introduction d’une ou plusieurs variables explica-
tives, entre la perte de degrés de liberté et l’apport d’information.
Exercice n° 1
fichier C3EX1
1. Dans le cas d’un modèle où le nombre d’observations est égal au nombre de variables explica-
tives (degré de liberté = 0 ), le R 2 = 1 . Cependant, le pouvoir explicatif de ce modèle est nul.
1 12 2 45 121
2 14 1 43 132
3 10 3 43 154
4 16 6 47 145
5 14 7 42 129
6 19 8 41 156
7 21 8 32 132
8 19 5 33 147
9 21 5 41 128
10 16 8 38 163
11 19 4 32 161
12 21 9 31 172
13 25 12 35 174
14 21 7 29 180
Solution
1) Forme matricielle
Nous disposons de 14 observations et trois variables explicatives, le modèle peut
donc s’écrire :
Y = Xa + ε avec : ε
1
12 1 2 45 121 ε2
14 1 1 43 132 a0 .
.
a .
Y = 10 ; X = 1 3 43 154 ; a =
1
.
a2 ; ε = εt
.. .. .. .. ..
. . . . . .
a3 ..
21 1 7 29 180
ε14
Dimensions :
(14,1) (14,4) (4,1) (14,1)
Calcul de X ′ X et de (X ′ X)−1
X′ X
1 2 45 121
1 1 1 ... 1 1 1 43 132
2 1 3 ... 7
1 3 43 154
45 =
43 43 . . . 29 .. .. .. ..
. . . .
121 132 154 . . . 180
1 7 29 180
14 85 532 2 094
85 631 3 126 13 132
=
532
3 126 20 666 78 683
2 094 13 132 78 683 317 950
56 ÉCONOMÉTRIE
20,16864 0,015065 −0,23145 −0,07617
0,015065 0,013204 0,001194 −0,00094
(X ′ X)−1
=
−0,23145 0,001194 0,003635 0,000575
−0,07617 −0,00094 0,000575 0,000401
Calcul de X ′ Y
X′ Y
12
1 1 1 ... 1 14 248
2 7
1 3 ... 1 622
45 10 =
43 43 ... 29 .. 9 202
.
121 132 154 ... 180 37 592
21
Calcul de
a
(X X)−1
′
X′ Y
20,16864 0,015065 −0,23145 −0,07617 248
0,015065 0,013204 0,001194 −0,00094
1 622 =
a
−0,23145 0,001194 0,003635 0,000575 9 202
−0,07617 −0,00094 0,000575 0,000401 37 592
32,89132
0,801900
= − 0,38136
− 0,03713
Soit
a0 = 32,89 ;
a1 = 0,80 ;
a2 = −0,38 ;
a3 = −0,03
Les calculs que nous venons de développer sont longs et fastidieux et mettent en évi-
dence l’intérêt incontestable d’utiliser un ordinateur.
σâ2
σε2 et de
3) Calcul de
e′ e
σε2 =
D’après [6] , nous devons donc calculer le résidu e .
n−k−1
e =Y −Y = Y − X a
Soit a0 +
et = yt − ( a1 x1t +
a2 x2t +
a3 x3t )
et = yt − 32,89 − 0,80 x1t + 0,38 x2t + 0,03 x3t
Par exemple pour e1 :
e1 = y1 − 32,89 − 0,80 x11 + 0,38 x21 + 0,03 x31
e1 = 12 − 32,89 − 0,80 × 2 + 0,38 × 45 + 0,03 × 121 = −0,84
Le tableau 2 présente l’ensemble des résultats.
Par construction, la somme des résidus est bien nulle.
t=14
et2
e′ e t=1 67,45
σε2
= = = = 6,745
n−k−1 14 − 3 − 1 10
t
. yt
yt et et2
La matrice des variances et covariances estimées des coefficients nous est donnée
par [7], soit :
â =
σε2 (X ′ X)−1
20,16864 0,015065 −0,23145 −0,07617
0,015065 0,013204 0,001194 −0,00094
â = 6,745 ×
−0,23145 0,001194 0,003635 0,000575
−0,07617 −0,00094 −0,000575 0,000401
2
Le R corrigé est donné par [11] :
2 n−1 14 − 1
R =1− (1 − R 2 ) = 1 − (1 − 0,702) = 0,613
n−k−1 14 − 4
58 ÉCONOMÉTRIE
Nous observons la baisse du coefficient de détermination lorsque nous le corrigeons
par le degré de liberté.
1. L’ensemble de ces résultats sont une généralisation à k variables explicatives des résultats pré-
sentés au chapitre 2, paragraphe III.B.
60 ÉCONOMÉTRIE
La relation [13], sous H0 ( ai = 0 ), devient :
ai = t ∗ → loi de Student à n − k − 1 degrés de liberté [14]
σâi
âi
tâi∗ est appelé le ratio de Student, les règles de décision citées plus haut s’appli-
quent alors.
Ce test est très important ; en effet, si dans un modèle estimé, un des coeffi-
cients (hormis le terme constant) n’est pas significativement différent de 0, il
convient d’éliminer cette variable1 et de ré-estimer les coefficients du modèle.
La cause de cette non-significativité, est due :
– soit à une absence de corrélation avec la variable à expliquer,
– soit à une colinéarité trop élevée avec une des variables explicatives.
H0 : aq = a q
H1 : aq = a q
1 â−1 (
aq − āq )′
( q,q
aq − āq ) F α (q, n − k − 1) [15]
q
1. En effet, elle n’apporte aucune contribution et dégrade l’estimation des autres variables.
σε2 (n − k − 1)
(n − k − 1) σε2
IC = 2
; 2
[16]
χ1 χ2
1) La matrice HAT
1. Attention, la loi du chi-deux n’est pas symétrique, il convient donc de lire sur la table les deux
probabilités 1 − α/2 et α/2 .
2. Cette matrice permet de passer du vecteur Y au vecteur Ŷ d’où le nom de matrice HAT (chapeau
en anglais), en effet nous avons Ŷ = X â = X (X ′ X )−1 X ′ Y = H Y .
62 ÉCONOMÉTRIE
Si chaque observation pèse le même poids, alors les valeurs des h i doivent
k+1
être proches de .
n
k+1
Le levier d’une observation i est donc anormalement élevé si : h i > 2 ,
n
l’observation est alors considérée comme un point de levier (leverage point) ou
point d’influence.
Une observation exerce un effet de levier si elle est éloignée des autres en
termes de combinaison des variables explicatives ; c’est-à-dire que les valeurs
prises par les variables explicatives, pour cette observation de la variable à expli-
quer, sont inattendues. Par exemple, un pays dont la population est faible mais
le PIB élevé, chaque facteur explicatif pris individuellement n’est pas surpre-
nant, mais la survenance de deux valeurs à la fois pour un pays est insolite.
Le point d’influence est une observation qui contribue très fortement au pou-
voir explicatif du modèle (sans cette valeur la régression peut être non signifi-
cative !), l’observation pèse de manière exagérée dans la régression, au point
que les résultats obtenus sont très différents selon que nous l’intégrons ou non
dans la régression.
La valeur prise par la variable explicative est anormale si le résidu de cette
observation est beaucoup plus élevé que les autres résidus, pour identifier une
valeur anormale nous pouvons calculer le résidu standardisé (ou encore appelé
le résidu studentisé). Une autre approche permettant de détecter des valeurs
anormales à l’aide de variables indicatrices sera présentée dans ce chapitre à la
section V.
Les résidus standardisés1 notés eiS permettent de détecter des valeurs anor-
males. Le résidu ei est divisé par son écart type estimé pondéré par le levier2 :
ei
eiS = √ suit une loi de Student à n – k – 1 degrés de liberté, avec
σ̂ 1 − h
e i
ei2
t
σ̂e = . Si, par exemple, les résidus standardisés eiS sont compris
n−k−1
0,025
dans l’intervalle ± tn−k−1 , on ne suspecte pas de valeurs anormales pour un seuil
de confiance 95 %.
1. Dans cette méthode de calcul nous parlons de résidus studentisés internes car le calcul porte sur
l’ensemble des observations. ei
2. Certains auteurs divisent le résidu par son écart type eiS = sans intégrer la valeur du levier.
σ̂e
Exercice n° 2
fichier C3EX1
Solution
1) Il convient de calculer les trois ratios de Student et de les comparer à la valeur lue
dans la table pour un seuil de 5 % (la table de Student en fin d’ouvrage indique direc-
tement les valeurs de α pour un test bilatéral).
D’après [14], nous obtenons :
a1 0,80 ∗ 0,05
= = tâ1 = 2,75 > t10 = 2,228 → a1 = 0 , la variable explicative x1 est
σâ1 0,29
a3 −0,03
= = t ∗ = 0,60 < t 0,05 = 2,228 → a3 = 0
σâ3 0,05 â3 10
64 ÉCONOMÉTRIE
0,05
I Ca1 =
a1 ± tn−k−1 ·
σâ1 = 0,80 ± 2,228 × 0,29 = [0,14 ; 1,45]
H0 : a1 = 1
H1 : a1 < 1
1. Attention, le test est unilatéral, il convient de lire sur la table de Student tabulée pour α/2 à un
seuil de 0,10 = 2 × 0,05 .
0,05
F ∗ = 0,612 est à comparer à F α (q, n − k − 1) = F2,10 = 4,10 , le F ∗ empirique est
inférieur au F lu dans la table, on accepte l’hypothèse H0. Les données ne sont pas
incompatibles avec la possibilité que les coefficients a1 et a2 soient simultanément et
respectivement égaux à 1 et – 0,5.
Soit 3,30 σε2 20,75. La variance vraie (mais inconnue) σε2 de l’erreur a 95 % de
chance de se situer à l’intérieur de cet intervalle.
5) Le calcul de h i et des résidus standardisés sont effectués à l’aide du programme
C3EX2.PRG. Les résultats sont présentés sur le tableau 3.
Résidus
i ei hi eiS
1 – 0,8408 0,2790 – 0,3813
2 1,6068 0,2966 0,7377
3 – 3,1800 0,3091 – 1,4732
4 1,6055 0,3248 0,7523
5 – 3,6973 0,2609 – 1,6559
6 1,1220 0,1825 0,4778
7 – 1,2015 0,5327 – 0,6768
8 0,1426 0,2025 0,0615
9 4,4880 0,1804 1,9088
10 – 2,7622 0,1442 – 1,1497
11 1,0830 0,3066 0,5008
12 – 0,8994 0,2115 – 0,3900
13 2,2946 0,4086 1,1489
14 0,2387 0,3605 0,1149
k+1 4
Le seuil du levier est égal à 2 =2 = 0,57 , aucune valeur n’est supérieure
n 14
à 0,57, nous ne détectons pas de point de levier (ou de point d’influence).
0,025
Les résidus studentisés sont tous dans l’intervalle ± t10 = ± 2,228, nous ne détec-
tons pas de valeur anormale.
66 ÉCONOMÉTRIE
IV. L’analyse de la variance
A. Construction du tableau d’analyse de la variance
et test de signification globale d’une régression
Dans cette section, nous allons nous interroger sur la signification globale du
modèle de régression, c’est-à-dire si l’ensemble des variables explicatives a une
influence sur la variable à expliquer. Ce test peut être formulé de la manière
suivante : existe-t-il au moins une variable explicative significative ? Soit le test
d’hypothèses :
H0 : a1 = a2 = . . . = ak = 0 (tous les coefficients sont nuls1)
H1 : il existe au moins un des coefficients non nul
Nous ne testons pas le cas où le terme constant a0 est nul, car seules nous
intéressent les variables explicatives. Un modèle dans lequel seul le terme
constant est significatif n’a aucun sens économique.
Le cas où l’hypothèse H0 est acceptée signifie qu’il n’existe aucune relation
linéaire significative entre la variable à expliquer et les variables explicatives (ou
encore que la Somme des Carrés Expliqués n’est pas significativement différen-
te de 0).
Nous reprenons l’équation fondamentale [8] d’analyse de la variance :
(yt − y)2 = yt − y)2 +
( et2
t t t
yt − y)2 /k
(
t R 2 /k
F∗ = 2 = (d’après [9])
et /(n − k − 1) (1 − R 2 )/(n − k − 1)
t
[17]
1. Nous remarquons que nous pouvons répondre à cette question par le test d’un sous-ensemble
de coefficients [15], le test ici présenté conduit évidemment à des résultats identiques.
2. Voir chapitre 2, paragraphe 4, pour la construction de ce tableau.
68 ÉCONOMÉTRIE
4) Augmentation de la taille de l’échantillon servant à estimer le modèle
Lorsque la taille de l’échantillon aug mente (le nombre d’observations à dispo-
sition est plus important), le modèle reste-t-il stable ? Ce test se ramène au test
de Chow de stabilité des coefficients sur deux sous-périodes. L’estimation sur la
sous-période 1 est effectuée à partir de l’échantillon initial et l’estimation de la
sous-période 2 à partir des nouvelles observations.
Nous voyons l’intérêt pratique de ces tests et l’apport pour l’économiste des
réponses à ces questions.
Exercice n° 3
fichier C3EX1
Tests à partir de l’analyse de la variance
En reprenant les données de l’exercice 1 (tableau 1), dont nous rappelons les résul-
tats de l’estimation du modèle1 :
Solution2
Nous pouvons tout d’abord appliquer le test de Fisher [17] afin de tester la signifi-
cation globale de la régression à trois variables x1 , x2 et x3 .
R 2 /k 0,702/3 0,05
F∗ = = = 7,878 > F3,10 = 3,71
(1 − R 2 )/(n − k − 1) (1 − 0,702)/10
1. Le lecteur notera la présentation « standard » des résultats d’estimation d’un modèle. Les infor-
mations listées ici doivent impérativement figurer. À noter que le t de Student est souvent indi-
qué à la place de l’écart type des coefficients afin de pouvoir, sans aucun calcul, procéder aux
tests de significativité des coefficients.
2. Les calculs sont effectués à partir d’un logiciel, il peut apparaître de légères différences entre
les calculs manuels et les résultats, imputables au fait que le logiciel tient compte d’un nombre
élevé de décimales.
x1 SC E 1 = 117,65 1 117,65
x1 , x2 , x3 SC E = 159,41 3 53,14
Résidu SC R = 67,45 10 6,74
Total SC T = 226,85 13
1. Sauf si la ou les variables ajoutées sont orthogonales à la variable à expliquer, SC E reste alors
identique. Ce cas est évidemment rare.
70 ÉCONOMÉTRIE
Étape 4 : calcul du Fisher empirique.
(SC E − SC E 1 )/(k − k ′ ) 41,67/(3 − 1) 0,05
F∗ = = = 3,09 < F2,10 = 4,10
SC R/(n − k − 1) 67,45/10
1. Les deux sous-périodes peuvent être de longueur inégale, cependant elles doivent impérative-
ment recouvrir la totalité des observations de la période.
sous-période 2 : données de 8 à 14
peut s’écrire :
yt = a0 + 1 x1t + a2 x2t + a2 x3t + εt
ou encore :
yt − x1t = a0 + a2 (x2t + x3t ) + εt
z t = a0 + a2 vt + εt
72 ÉCONOMÉTRIE
z t = −0,0111vt + 13,74 + et
(0,051)
n = 14
R 2 = 0,0389
(.) = Ecart type
σε = 3,0109
1 10 166
2 13 175
3 7 197
4 10 192
5 7 171
6 11 197
7 13 164
8 14 180
9 16 169
10 8 201
11 15 193
12 12 203
13 13 209
14 14 209
74 ÉCONOMÉTRIE
nation issu de l’estimation de l’équation intermédiaire) qui suit un χ 2 à r degrés
de liberté ( r étant le nombre de contraintes) ; nous verrons des applications de
cette statistique au chapitre 5 concernant les tests de détection de l’autocorréla-
tion des erreurs et de l’hétéroscédasticité.
1. Les termes de variables indicatrices, de variables auxiliaires ou de variables muettes sont indif-
féremment employés en français. Le terme anglo-saxon dummy est le plus couramment
utilisé.
Exercice n° 4
Détection et correction de valeurs anormales par variable indicatrice
Un modèle de production de service du secteur du tourisme est spécifié de la maniè-
re suivante :
Q P St = a0 + a1 V At + a2 P O Pt + εt
avec :
Q P St = production du secteur tourisme pour l’année t ;
V At = valeur ajoutée du secteur tourisme pour l’année t ;
P O Pt = population pour l’année t .
Dt = 0 pour t = 1 à 15 et t = 17 à 18
Dt = 1 pour t = 16
76 ÉCONOMÉTRIE
Solution
0,05
La variable indicatrice Dt a un ratio de Student de t ∗ = 5,8 > t14 = 2,14 , le coef-
ficient de régression de cette variable est significativement différent de 0, la production
de service pour l’année 16 est donc anormalement basse (−120,56) . Cette baisse est,
sans doute imputable à l’effet de la guerre.
• Généralisation
Dans le cas d’un phénomène se produisant de manière sporadique, la variable indi-
catrice prend la valeur 1 pour la ou les périodes que l’on désire corriger et 0 pour les
autres.
Nous remarquons que nous pouvons procéder au test de Chow (stabilité du modèle
sur l’ensemble de la période) en recourant à une variable indicatrice prenant la valeur 1
pour la première sous-période et la valeur 0 pour la deuxième sous-période. Le test de
Student portant sur le coefficient de la variable indicatrice permet alors de se détermi-
ner sur un modèle à un régime ou un modèle à deux régimes.
2) Variable qualitative
78 ÉCONOMÉTRIE
3) Analyse de saisonnalité
Exercice n° 6
fichier C3EX6
Années T1 T2 T3 T4
1 Ventes 164 198 85 179
Pub. 34 36 32 29
2 Ventes 168 201 98 197
Pub. 45 67 76 75
3 Ventes 197 209 100 216
Pub. 75 78 72 75
4 Ventes 223 245 119 260
Pub. 78 81 84 83
5 Ventes 298 309 124 267
Pub. 89 82 81 83
Solution
1. Dans un modèle économétrique, les variables doivent être non saisonnières ou Corrigées des
Variations Saisonnières (CVS).
80 ÉCONOMÉTRIE
n = 20
R 2 = 0,83
(·) = t de Student
Les dépenses publicitaires, dont le ratio de Student est égal 3,97, sont maintenant
explicatives1 des ventes ; la variable indicatrice D3t est la seule variable muette signifi-
cative (t ∗ = 6,25), ce qui implique que la saisonnalité des ventes est liée essentielle-
ment au creux du troisième trimestre.
T1 164 34 1 0 0
T2 198 36 0 1 0
T3 85 32 0 0 1
T4 179 29 0 0 0
T1 168 45 1 0 0
T2 201 67 0 1 0
T3 98 76 0 0 1
T4 197 75 0 0 0
T1 197 75 1 0 0
T2 209 78 0 1 0
T3 100 72 0 0 1
T4 216 75 0 0 0
T1 223 78 1 0 0
T2 245 81 0 1 0
T3 119 84 0 0 1
T4 260 83 0 0 0
T1 298 89 1 0 0
T2 309 82 0 1 0
T3 124 81 0 0 1
T4 267 83 0 0 0
A. Prédiction2 conditionnelle
Le problème consiste à déterminer quelle valeur doit être attribuée à la variable
endogène lorsque nous connaissons les valeurs des variables exogènes.
1. Ceci est à noter : dans un modèle, l’absence d’une ou de plusieurs variables explicatives impor-
tantes peut entraîner une mauvaise estimation des variables figurant déjà dans le modèle.
2. Il ne s’agit pas toujours de prévoir une valeur dans le futur, mais dans le cadre de séries tem-
porelles de simuler le passé ou bien dans les modèles en coupe instantanée de prédire des
valeurs.
82 ÉCONOMÉTRIE
Or l’erreur de prévision (et+h = yt+h − yt+h ) est distribuée suivant une loi nor-
2
male N (0, σet+h ) , en remplaçant la variance théorique σε2 par la variance empi-
σε2 dans l’expression [18], nous pouvons en déduire que :
rique
yt+h − yt+h
′
suit une loi de Student à n − k − 1 degrés de liberté.
σε [X t+h (X ′ X)−1 X t+h + 1]1/2
α/2
"
yt+h =
yt+h ± tn−k−1 ′
σε2 [X t+h (X ′ X)−1 X t+h + 1] [19]
Exercice n° 7
fichier C3EX1
Solution
84 ÉCONOMÉTRIE