L’Econométrie des Données de          Panel       Modèles Linéaires          Simples
L’Econométrie des Données de Panel                                                     2                                  ...
L’Econométrie des Données de Panel                                                3Table des Matières    Introduction     ...
L’Econométrie des Données de Panel                                        4    Annexes                                    ...
L’Econométrie des Données de Panel          5                              Chapitre I                        Modèles Linéa...
L’Econométrie des Données de Panel                                                     6IntroductionDans ce premier chapit...
L’Econométrie des Données de Panel                                                   7   Dans une seconde section, nous pr...
L’Econométrie des Données de Panel                                                         81.   Tests    de           spé...
L’Econométrie des Données de Panel                                                         9    Toutefois, lorsque l’on tr...
L’Econométrie des Données de Panel                                                                      101.2. Procédure d...
Figure 1.1: Procédure Générale de Tests d’Homogénéité                                                                     ...
on obtient K N paramètres. L’égalité des N vecteurs ¯ i revient donc à imposer K N ¡ K restrictions.De la même façon, l’ég...
La seconde étape consiste à tester l’égalité pour tous les individus des K com-posantes des vecteurs ¯ i .                ...
1.2.2. Construction des statistiques de testNous allons à présent, présenter les méthodes de construction des di¤érents te...
tion pour chaque individu. Soit SCR1;i la somme des carrés des résidus obtenue pour
chaque équation. La somme des carrés des résidus du modèle (1.1) non contraint estalors tout simplement dé…nie comme la so...
XX                                  2Syy =             (yi;t ¡ y i )       (1.13)        i=1 t=1
XX                                     N T                                                                           0    ...
La somme des carrés des résidus du modèle non contraint, SC R1 ; est donnée parl’équation (1.7). Sous l’hypothèse H02 ; la...
données de panel.
1.3. ApplicationConsidérons à présent une application simple de ces tests d’homogénéité à partir dedonnées de panel relati...
Figure 1.2: Résultats des Tests de Spéci…cation sous TSP 4.3A
de l’hypothèse d’homogénéité totale (test H 1 dans nos notations). Ce dernier est                                         ...
des constantes individuelles.
L’Econométrie des Données de Panel                                                      202.     Modèles           à      ...
L’Econométrie des Données de Panel                                                    21  2.     Empilement par dates : po...
L’Econométrie des Données de Panel                  @     A                  @        A             @        A   22       ...
On dé…nit 0T le vecteur nul         de dimension (T ; 1) :                       0                           1            ...
B          C   B 0 1 C   ®2   B                   C   ¯n       B          CB          C   B    C         B                ...
2.2. Empilement par datesDe façon parallèle, il est possible de représenter de façon symétrique le modèle (2.1)en utilisan...
L’écriture vectorielle complète du modèle est la suivante : 0         1                          0                  1     ...
3. Modèle à e¤ets …xesOn fait maintenant l’hypothèse que les e¤ets individuels ®i sont représentés pardes constantes (d’où...
3.1. Estimateur Within ou LSDVConsidérons l’écriture vectorielle du modèle obtenue par un empilement desdonnées par pays. ...
X                                              XX   (xi;t ¡ xi ) (xi;t                                    (xi;t ¡ xi ) (yi...
Proposition 3.1. L’estimateur W ithin ou LSDV de ¯; obtenu dans le modèle àe¤ets individuels …xes (3.2) est identique à l’...
Le fait qu’il soit équivalent d’estimer les paramètres du modèle (3.2) directementà partir de cette spéci…cation incluant ...
3.2. ApplicationConsidérons à nouveau l’exemple du modèle de grèves dans le secteur industriel.Nous avons établi précédemm...
pc=p-@mean;             enddo;             ?---- Estimation Modèle Transformé----             ls srtc uc pc;             ?...
L’Econométrie des Données de Panel                                          30 Figure 3.1: Comparaison des Estimateurs Whi...
L’Econométrie des Données de Panel                                                       313.3.             Ecriturevector...
L’Econométrie des Données   de Panel                                                    32      0                         ...
Dès lors, a…n d’éliminer les e¤ets individuels de l’équation (3.9), il su¢t de prémul-tiplier les membres de cette équatio...
4.    Modèle           à       e¤etsaléatoiresDans la pratique standard de l’analyse économétrique, on suppose qu’il exist...
´0         =0i;t            x
Sous ces hypothèses, la variance de la variable endogène yi;t conditionnellement auxvariables explicatives xi;t est alors ...
= V ¡1 : Par                                     e                e                                  ®          v         ...
Reste alors à déterminer l’expression de ee0 Ve : Raisonnons par une méthode                                             d...
toire. Pour bien comprendre ces propriétés, il est nécessaire de bien appréhender lesconséquences de la structure des rési...
Remark 1. Dans le modèle de la proposition (4.1), le fait que les e¤ets individuels®i constituent l’une des composantes de...
(MCG).   9       On a en e¤et :                                                     p                                     ...
Nous ne donnerons pas ici de démonstration de cette propriété. Si l’on résume,quelle que soit la nature des e¤ets individu...
de la matrice de variance covariance V: La seconde étapeconsiste alors à appliquer l’estimateur des MCG selon la formule (...
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
Prochain SlideShare
Chargement dans…5
×

L’Econométrie des Données de Panel

7 815 vues

Publié le

Modèles Linéaires Simples

Publié dans : Économie & finance
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
7 815
Sur SlideShare
0
Issues des intégrations
0
Intégrations
5
Actions
Partages
0
Téléchargements
369
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

L’Econométrie des Données de Panel

  1. 1. L’Econométrie des Données de Panel Modèles Linéaires Simples
  2. 2. L’Econométrie des Données de Panel 2 Figure 0.1:Présentation Le but de ce séminaire est de proposer une initiation, tant sur le plan théoriqueque sur le plan appliqué, à l’économétrie des données de panel. Sur le plan théorique,le séminaire débutera par une présentation des problèmes de spéci…cations de base enéconométrie de panel et par les méthodes d’estimation traditionnelles. Cette premièrepartie insistera en particulier sur les stratégies de tests de spéci…cation du modèle. Laseconde partie du séminaire sera consacrée à l’étude des panels dynamiques et pro-posera une introduction aux concepts de non stationnarité stochastique en panelet notamment à la spéci…cation des tests de non stationnarité et de cointégration.Ces concepts théoriques seront appliqués à di¤érentes problématiques économiques,comme par exemple la problématique de la convergence des PIB par tête, que ce soit autravers de commentaires de travaux empiriques ou par la programmation d’exemplesillustratifs sous un logiciel d’économétrie (TSP ou SAS à préciser)
  3. 3. L’Econométrie des Données de Panel 3Table des Matières Introduction 2 Chapitre 1 : Modèles Linéaires Simples 5 Introduction 6 1. Tests de spéci…cation ou tests d’homogénéité 8 1.1. L’exemple d’une fonction de production 8 1.2. Procédure de tests de spéci…cation 10 1.2.1. Procédure générale 10 1.2.2. Construction des statistiques de test 13 1.3. Application 17 2. Modèles à e¤ets individuels 20 2.1. Empilement par pays 21 2.1.1. Exemple 22 2.2. Empilement par dates 23 2.2.1. Exemple 23 3. Modèles à e¤ets …xes 25 3.1. Estimateur Within ou LSDV 26 3.2. Application 28 3.3. Ecriture vectorielle 31 4. Modèles à e¤ets aléatoires 33 4.1. Modèle à variance composée 34 4.2. Estimateurs du modèle à e¤ets aléatoires 35 4.3. Estimateur des Moindres Carrés Généralisés 37 4.4. Application 42 5. Tests de spéci…cation des e¤ets individuels 44 5.1. Corrélation des e¤ets individuels et des variables explicatives 45 5.2. Test de spéci…cation d’Hausman 49 6.3. Application 51 6. Modèles à coe¢cients …xes et aléatoires 53 6.1. Modèle MFR de Hsiao (1989) 53 6.2. Méthode d’estimation des paramètres 56 6.3. Application 57
  4. 4. L’Econométrie des Données de Panel 4 Annexes 62 A.1. Equivalence entre les estimateurs Within et pooled à = 1 62 : A.2. Programme TSP : Modèle MFR 63 Bibliographie 67
  5. 5. L’Econométrie des Données de Panel 5 Chapitre I Modèles Linéaires Simples
  6. 6. L’Econométrie des Données de Panel 6IntroductionDans ce premier chapitre, nous nous restreindrons à l’étude des modèles linéaires sim-ples sur données de panel, ces derniers étant dé…nis par opposition aux modèles dy-namiques faisant intervenir des variables endogènes retardées. Dans toute la suite dece chapitre, on considère des processus strictement stationnaires au sens de lastationnarité du second ordre1 . L’objectif des cinq premières sections de ce chapitre est de faire en sorte quele lecteur puisse interpréter, de façon exhaustive et relativement approfondie, lesrésultats de base que donnent les principaux logiciels d’économétrie lorsque l’onenvisage des modèles de panel. Nous prendrons ici comme référence le logiciel TSP4.3, mais il est bien entendu évident que ces résultats de base sont sensiblementidentiques si l’on considère d’autres logiciels comme Eviews, SAS ou Rats. Quelles sont les connaissances minimales nécessaires à l’économètre appliqué pourpouvoir interpréter un tableau de résultats d’estimation de panel ? Prenonscomme exemple la commande panel de TSP. A l’issue de cette procédure, l’utilisateurdispose des réalisations des estimateurs Pooled, Between, des estimateurs du modèleà e¤ets individuels …xes (Within ), du modèle à e¤ets individuels aléatoires (ErrorComponent Model ), des résultats de trois tests de Fischer, d’un estimateur de lavariance des e¤ets individuels, d’un estimateur de la variance totale, de l’estimateurd’un paramètre de pondération et de la statistique du test d’Hausman. Voilà ainsirésumés tous les élements que nous nous proposons d’étudier tout au long des cinqpremières sections. Ainsi, la première section est consacrée aux tests de spéci…cation quicorrespondent en fait aux trois tests de Fischer du …chier de résultat des estimationsTSP. Il s’agit ici de déterminer la manière dont doit être spéci…é un modèle de panel, sitant que l’hypothèse de panel puisse être acceptée. Nousverrons alors que toute l’analyse repose alors sur la notion d’homogénéité desparamètres du modèle envisagé. Les tests présentés visent ainsi à porter undiagnostic sur l’éventuelle nécessité d’intégrer une dimension hétérogène et sur lamanière dont cette hétérogénéité doit être spéci…ée. Une desmanières simples pour ne pas supposer l’existence d’un modèle totalementidentique consiste ainsi à introduire des e¤ets individuels sous la forme de constantesspéci…ques, propres à chaque individu du panel. Nous proposerons ainsi une procéduregénérale de tests de spéci…cation des modèles linéaires simples. 1 La dé…nition de la stationnarité fera l’ob jet du chapitre suivant.
  7. 7. L’Econométrie des Données de Panel 7 Dans une seconde section, nous présenterons le modèle à e¤ets individuels. Cemodèle suppose l’existence de coe¢cients identiques pour tous les individus et de con-stantes spéci…ques. Ainsi, la relation économique mise en évidence à travers ce typede modélisation n’est censée di¤érer pour tous les individus qu’au niveau desconstantes introduites dans le modèle. Nous insisterons alors sur la construction dumodèle et en particulier sur sa représentation sous forme vectorielle. Il s’agit ici deprésenter les deux principales méthodes de construction des échantillons de données, àsavoir la méthode d’empilement par date et la méthode d’empilement par individus. La troisième section est consacré au modèle à e¤ets individuels …xes. On supposedans cette section que les e¤ets individuels sont des paramètres déterministes.Nous serons alors amener à présenter la construction et les propriétés de l’estimateurWithin des coe¢cients du modèle. Une application sur les relations entre le nombrede grèves dans le secteur industriel et les déterminants macroéconomiques seraproposée. Nous nous appuierons sur les résultats et les di¤érents tests proposés sousTSP. Une quatrième section sera consacrée au modèle à e¤ets individuels aléatoires. Onsuppose dans cette section que les e¤ets individuels ne sont plus des paramètres, maisdes variables aléatoires possédant une distribution commune pour tous lesindividus. Nous commencerons par étudier la structure des résidus de ce modèle àvariance com- posée. Nous étudierons ensuite les di¤érents estimateurs des coe¢cients du modèle à e¤ets aléatoires et plus particulièrement l’estimateur desMoindres Carrés Généralisés. En…n, la cinquième section sera consacrée aux tests de spéci…cation des e¤ets indi-viduels. La question est alors de savoir quel modèle, parmi les modèles à e¤etsaléatoires et e¤ets …xes, doit être retenu. Ceci nous conduira à présenter le testd’Hausman (1978) qui constitue le test standard de spéci…cation des e¤ets individuels. Nous conclurons en…n en introduisant un sixième section consacrée à la présentationd’un type de modèle de plus en plus utilisé en économétrie appliqué : le modèle aveccoe¢cients …xes et coe¢cients aléatoires. Ce modèle, introduit notamment parHsiao (1989), permet de réaliser di¤érents exercices de modélisation économiqueparticulière- ment intéressants.
  8. 8. L’Econométrie des Données de Panel 81. Tests de spéci…cation ou testsd’homogénéitéLorsque l’on considère un échantillon de données de panel, la toute première chose qu’ilconvient de véri…er est la spéci…cation homogène ou hétérogène du processusgénérateur de données. Sur le plan économétrique, cela revient à tester l’égalité descoe¢cients du modèle étudié dans la dimension individuelle. Sur le planéconomique, les tests de spéci…cation reviennent à déterminer si l’on est en droit desupposer que le modèle théorique étudié est parfaitement identique pour tous les pays,ou au contraire s’il existe des spéci…cités propres à chaque pays. Nous commencerons par présenter un petit exemple illustratif construit à partird’une fonction de production agrégée. Dans une seconde section, nous généraliseronsla procédure de tests de spéci…cation en introduisant les notions de variancesintra- classes (Within ) et inter-classes (Between ). En…n, nous proposerons uneapplication de ces tests de spéci…cation à l’estimation d’une relation entre le nombrede grèves et un ensemble de variables explicatives.1.1. L’exemple d’une fonction de productionPrenons l’exemple d’une fonction de production. Supposons que l’on disposed’un échantillon de données de P I B et de facteurs (travail et capital) sur unedurée de T périodes pour un ensemble de N pays. Si l’on note yi;t le logarithme duP I B, ki;t le logarithme du stock de capital privé et ni;t le logarithme de l’emploi etque l’on suppose une fonction de production de type Cobb Douglass, le modèlegénéral s’écrit sous la forme 8 i 2 [1; N ] ; 8 t 2 [1; T ] : yi;t = ®i + ¯ i ki;t + ° i ni;t + "i;tLes innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance égaleྠ2 ; 8 i 2 [1; N ] : " Dans un premier temps, la phase de test de spéci…cation, revient sur le planéconomique, à déterminer s’il est en droit de supposer une fonction de productiontotalement identique pour tous les pays (modèle pooled ). Dans ce cas, les élasticitésde l’emploi et du capital sont identiques pour tous les pays (¯ i = ¯; ° i = °; 8 i 2 [1; N ]) etle niveau moyen de la productivité totale des facteurs, représenté ici par lesconstantes®i ; est lui aussi identique pour tous les pays. Le modèle s’écrit alors sous la forme : yi;t = ® + ¯ki;t + °ni;t + "i;t
  9. 9. L’Econométrie des Données de Panel 9 Toutefois, lorsque l’on travaille sur des séries agrégés, il est relativement peu prob-able que la fonction de production macroéconomique soit strictement identiquepour tous les pays étudiés. Si l’hypothèse d’homogénéité totale est rejetée, il convientalors de tester si les élasticités des di¤érents facteurs sont identiques. Si ce n’est pas lecas, il n’existe a priori aucune structure de production commune entre les pays. Dansce cas, l’utilisation des données de panel ne se justi…e pas et peut même conduire àdes biais d’estimation. On doit donc estimer les fonctions de production pays parpays. Si en revanche, il s’avère qu’il existe bien une relation identique entre laproduction et les facteurs pour tous les pays, la source d’hétérogénéité du modèle peutalors provenir des constantes ®i : Dans notre exemple, ces constantes représentent lamoyenne de la productivité totale des facteurs de production (résidu de Solow). Or,rien ne garan- tit que les pays étudiés possèdent le même niveau de productivitéstructurelle. Au contraire, il se peut parfaitement que des facteurs a-temporels oustructurels, comme la position géographique, le climat, l’éloignement par rapport augrands axes commerciaux etc... aient pu conduire à des di¤érences structurelles deniveau de productivité entre les pays. Il convient donc de tester l’hypothèse d’uneconstante commune à tous les pays. Si cette hypothèse est rejetée, on obtient alorsun modèle avec e¤ets individuels qui s’écrit sous la forme : yi;t = ®i + ¯ki;t + °ni;t + "i;t Dans ce cas, le niveau moyen de la productivité totale des facteurs, déterminé parE (®i + "i;t ) = ®i ; varie selon les pays, même si la structure de production (lesélasticités des deux facteurs travail et capital) est identique. Cet exemple, que nous allons à présent généraliser, montre bien que la phase detest de spéci…cation revient à déterminer si le processus générateur de donnéespeut être considéré comme homogène, c’est à dire unique pour tous les individus, ousi au contraire il apparaît totalement hétérogène, auquel cas l’utilisation destechniques de panel ne peut se justi…er. Entre ces deux cas extrêmes, il convientde précisément identi…er la source d’hétérogénéité pour bien spéci…er le modèle.
  10. 10. L’Econométrie des Données de Panel 101.2. Procédure de tests de spéci…cationOn considère un échantillon de T observations de N processus individuels fyi;t ; t 2 Z; i 2Ng et fxi;t ; t 2 Z; i 2 Ng : Par la suite, on notera fyi;t g et fxi;t g ces deux processus.On suppose que le processus fyi;t g est dé…ni de façon générale par le relation linéaire suiv-ante, 8 i 2 N, 8 t 2 Z : yi;t = ®i + ¯i0 xi;t + "i;t (1.1) ¡ ¢ 0où ®i 2 R, ¯ i = ¯ 1;i ¯ 2;i ::::¯ K;i est un vecteur de dimension (K; 1). Onconsidère ainsi un vecteur de K variables explicatives : 0 xi;t = (x1;i;t ; x2;i;t ; :::; xK;i;t ) (1.2) Les innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance égale 2à ¾" ; 8 i 2 [1; N ] : Ainsi on suppose que les paramètres ®i et ¯ i du modèle (1.1) peuventdi¤érer dans la dimension individuelle2 , mais l’on suppose qu’ils sont constants dans letemps.1.2.1. Procédure généraleSi l’on considère le modèle (1.1), plusieurs con…gurations sont alors possibles : 1. Les N constantes ®i et les N vecteurs de paramètres ¯ i sont identiques : ®i = ®; ¯ i = ¯ 8 i 2 [1; N ]. On quali…e alors le panel de panel homogène. 2. Les N constantes ®i et les N vecteurs de paramètres ¯ i sont di¤érents selon les individus. On a donc N modèles di¤érents, on rejette la structure de panel. 3. Les N constantes ®i sont identiques, ®i = ® 8 i 2 [1; N ] ; tandis que les vecteurs de paramètres ¯ i di¤èrent selon les individus. Dans ce cas, tous les coe¢cients du modèle, à l’exception des constantes, sont di¤érents selon les individus. On a donc N modèles di¤érents. 4. Les N vecteurs de paramètres ¯ i sont identiques, ¯ i = ¯ 8 i 2 [1; N ] ; tandis que les constantes ®i di¤èrent selon les individus. On obtient un modèle à e¤ets individuels. Pour discriminer ces di¤érentes con…gurations et pour s’assurer du bien fondé de lastructure de panel, il convient d’adopter une procédure de tests d’homogénéitéemboîtés. La procédure générale de test présentée dans Hsiao (1986) est décrite sur la …gure (1.1). 2 A l’exception de la variance des innovations que l’on supposera identique pour tous les individus.
  11. 11. Figure 1.1: Procédure Générale de Tests d’Homogénéité 1 TestH 0 : i i i 1, N 1 H 0 rejetée H 1 vraie 0 2 TestH 0 : i i 1, yi,t xi,t i,t N 0 2 H 0 rejetée H 2 vraie 3 yi,t i i xi,t i,t TestH : i 1, N 0 i 3 H 0 vraie H 3 rejetée 0 yi,t xi,t i,t yi,t i xi,t i,t Dans une première étape, on teste l’hypothèse d’une structure parfaitement ho-mogène (constantes et coe¢cients identiques) : 1 H 0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N ] 1 H a : 9 (i; j) 2 [1; N ] = ¯ i = ¯ j ou ®i = ®j On utilise alors une statistique de Fischer pour tester ces (K + 1) (N ¡ 1)restric- tions linéaires3 . Si l’on suppose que les résidus "i;t sont indépendammentdistribués dans les dimensions i et t; suivant une loi normale d’espérance nulle etde variance…nie ¾"2 ; cette statistique suit une distribution de Fischer avec (K + 1) (N ¡ 1)et N T ¡ N (K + 1) degrés de liberté. Les conclusions de ce test sont les 0suivantes. Si l’on accepte l’hypothèse nulle H 1 d’homogénéité, on obtient alors unmodèle de pooledtotalement homogène. yi;t = ® + ¯ 0 xi;t + "i;t (1.3) Si en revanche, on rejette l’hypothèse nulle, on passe à une seconde étape qui consisteà déterminer si l’hétérogénéité provient des coe¢cients ¯ i . 3 Dans notre modèle, chaque vecteur ¯ i comprend K paramètres. Pour les N individus du panel,
  12. 12. on obtient K N paramètres. L’égalité des N vecteurs ¯ i revient donc à imposer K N ¡ K restrictions.De la même façon, l’égalité des N constantes revient à imposer N ¡ 1 restrictions. Au total,l’hypothèse 1H 0 revient à imposer (K + 1) (N ¡ 1) restrictions linéaires.
  13. 13. La seconde étape consiste à tester l’égalité pour tous les individus des K com-posantes des vecteurs ¯ i . H02 : ¯ i = ¯8 i 2 [1; N ] H 2a : 9 (i; j) 2 [1; N ] = ¯ i = ¯j Sous l’hypothèse nulle, on n’impose ici aucune restriction sur les constantesindi- viduelles ®i : De la même façon, on construit une statistique de Fischer pourtester ces (N ¡ 1) K restrictions linéaires. Toujours sous l’hypothèsed’indépendance et de normalité des résidus, cette statistique suit une loi de Fischeravec (N ¡ 1) K et N T ¡ N (K + 1) degrés de liberté. Si l’on rejette l’hypothèse nulle 2H 0 d’homogénéité des coef-…cients ¯ i , on rejette alors la structure de panel, puisque au mieux seules les constantes®i peuvent être identiques entre les individus : yi;t = ® + ¯i0 xi;t + "i;t (1.4) On estime alors les paramètres vectoriels ¯ i en utilisant les modèles di¤érents payspar pays. Si en revanche, on accepte l’hypothèse nulle H20 d’homogénéité des coe¢cients¯ i ; on retient la structure de panel et l’on cherche alors à déterminer dans unetroisième étape si les constantes ®i ont une dimension individuelle. La troisième étape de la procédure consiste à tester l’égalité des N constantes indi-viduelles ®i ; sous l’hypothèse de coe¢cients ¯ i communs à tous les individus : 3 H0 : ®i = ® 8 i 2 [1; N ] 3 H a : 9 (i; j) 2 [1; N ] = ®i = ®j Sous l’hypothèse nulle, on impose ¯ i = ¯: Sous l’hypothèse d’indépendance etde normalité des résidus, on construit une statistique de Fischer pour tester ces N¡1 restrictions linéaires. Cette statistique suit une loi de Fischer avec (N ¡ 1) Ket N (T ¡ 1) ¡ K degrés de liberté. Si l’on rejette l’hypothèse nulle H 0 d’homogénéité 3des constantes ®i , on obtient alors un modèle de panel avec e¤ets individuels : yi;t = ®i + ¯ 0 xi;t + "i;t (1.5) Dans le cas où l’on accepte l’hypothèse nulle H30 , on retrouve alors une structure de 0panel totalement homogène (modèle pooled ). Le test H 3 ne sert alors qu’à con… 0rmer ou in…rmer les conclusions du 1tests H ; étant donné que le fait de réduire lenombre de restrictions linéaires permet d’accroître la puissance du test du Fischer.
  14. 14. 1.2.2. Construction des statistiques de testNous allons à présent, présenter les méthodes de construction des di¤érents tests deFischer utilisés dans cette procédure. On considère le modèle (1.1) et l’on suppose queles résidus "i;t sont indépendamment distribués dans les dimensions i et t; suivantuneloi normale d’espérance nulle et de variance …nie ¾ 2 . On suppose que la variance ¾2est " "connue.Test d’homogénéité globale On considère tout d’abord, le test de l’hypothèsed’homogénéité totale H 01 : 1 H 0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N ] Soit F1 la statistique de Fischer associée à ce test. Ce test revient à imposer(K + 1) (N ¡ 1) restrictions linéaires sur les coe¢cients du modèle (1.1). Deplus, sous l’hypothèse alternative H 2 ; il existe au plus N K coe¢cients di¤érents apour les composantes des N vecteurs ¯ i (de dimension K) et N constantesindividuelles. On dispose donc de N T ¡ N (K + 1) degrés de liberté.De…nition 1.1. La statistique de Fischer F1 associée au test d’homogénéité totale H01dans le modèle (1.1) : 1 H0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N ] (K;1)s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1) (K + 1) et N T ¡N (K +1)degrés de liberté : (SCR1;c ¡ SCR1 ) = [(N ¡ 1) (K + 1)] F1 = (1.6) SCR1 = [N ¡ N (K + 1)] Toù SC R1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c la sommedes carrés des résidus du modèle contraint : yi;t = ® + ¯ 0 xi;t + "i;t Ainsi, si la réalisation de la statistique de Fischer pour l’échantillon considéréest supérieure au seuil théorique à ®%; on rejette l’hypothèse nulle d’homogénéité.Reste à présent à déterminer la formule générale des sommes de carrés des résidus desmodèles contraint et non contraint. Considérons tout d’abord le modèle noncontraint : yi;t = ®i + ¯ 0i xi;t + "i;t Les estimateurs ¯bi e®i des paramètres individuels sont obtenus équation par équa- t b
  15. 15. tion pour chaque individu. Soit SCR1;i la somme des carrés des résidus obtenue pour
  16. 16. chaque équation. La somme des carrés des résidus du modèle (1.1) non contraint estalors tout simplement dé…nie comme la somme des N somme des carrés desrésidusobtenues pour les N équations individuelles. X N X N h i 0 ¡1 SCR1 = SCR1;i = Syy;i ¡ xy;iSxx;i Sxy;i (1.7) S i=1 i=1où les sommes Sk;i sont dé…nies de la façon suivante 8 i 2 [1; N ] : X T 2 Syy;i = (yi;t ¡ yi ) (1.8) t=1 X T 0 Sxx;i = (xi;t ¡ xi ) (xi;t ¡ xi ) (1.9) t=1 X T 0 Sxy;i = (xi;t ¡ xi ) (yi;t ¡ y i ) (1.10) t=1 Les moyennes xi et yi sont dé…nies, pour chaque individu, dans la dimensiontem- porelle de façon traditionnelle par 8 i 2 [1; N ] : T 1X xi = xi;t T t=1 T 1X yi = yi;t T t=1 L’expression de SCR1 fait ainsi apparaître la somme des variances individuellesdes résidus obtenues à partir des N régressions individuelles. L’expression Syy;i¡ ¡1Sxy;i Sxx;i Sxy;i correspond ainsi (à une transformée linéaire près) à la variance intra- 0groupe (Within variance) des résidus. Le modèle (1.1) contraint sous l’hypothèse H01 s’écrit : yi;t = ® + ¯ 0 xi;t + "i;t (1.11) On dispose ainsi d’un échantilon de T N observations pour identi…er les paramètrescommuns ® et ¯ de cette relation. On applique alors les Moindres Carrés Ordinairessur les données empilées (modèle pooled). La somme des carrés s’écrit sous la forme : SC R1;c = Syy ¡ S 0 Sxx Sxy xy ¡1 (1.12)où les sommes Sk sont dé…nies de la façon suivante : N T
  17. 17. XX 2Syy = (yi;t ¡ y i ) (1.13) i=1 t=1
  18. 18. XX N T 0 Sxx;i = (xi;t ¡ xi ) (xi;t ¡ xi ) (1.14) i=1 t=1 XX N T 0 Sxy;i = (xi;t ¡ xi ) (yi;t ¡ y i ) (1.15) i=1 t=1 Les moyennes x et y sont alors dé…nies sur l’ensemble des T N observations : 1 XX N T x= xi;t NT i=1 t=1 1 XX N T y= yi;t NT i=1 t=1 L’expression SCR1;c correspond à une transformée de la variance totale desrésidus (total variance) obtenus à partir de l’estimation d’un modèle unique sur les N Tdonnées empilées.Test d’homogénéité des coe¢cients ¯ i Considérons à présent le test de l’hypothèse d’homogénéité des coe¢cients ¯ i , notée 2H0 : 2 H0 : ¯ i = ¯ 8 i 2 [1; N ] Soit F2 la statistique de Fischer associée à ce test. Sous l’hypothèse nulle, onn’im- pose aucune restriction sur les constantes individuelles ®i : Toujours sousl’hypothèse d’indépendance et de normalité des résidus, on construit unestatistique de Fischer pour tester ces (N ¡ 1) K restrictions linéaires. aSousl’hypothèse alternative H 2 ; onretrouve le modèle (1.1) et N T ¡ N (K + 1) degrés de liberté.De…nition 1.2. La statistique de Fischer F2 associée au test d’homogénéité totale H02dans le modèle (1.1) : 2 H 0 : ¯i = ¯ 8 i 2 [1; N ] (K;1)s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1) K et N T ¡ N (K +1)degrés de liberté : ¡ ¢ SC R1;c0 ¡ SCR1 = [(N ¡ 1) K] F2 = (1.16) SCR1 = [N ¡ N (K + 1)] Toù SCR1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c0 la sommedes carrés des résidus du modèle contraint (modèle à e¤ets individuels) : yi;t = ®i + ¯ 0 xi;t + "i;t
  19. 19. La somme des carrés des résidus du modèle non contraint, SC R1 ; est donnée parl’équation (1.7). Sous l’hypothèse H02 ; la somme des carrés des résidus dans le modèleà e¤ets individuels est donnée par : à !0 à !¡1 à ! X N X N X N XN SC R1;c0 = Syy;i ¡ Sxy;i Sxx;i Sxy;i (1.17) i=1 i=1 i=1 i=1où les sommes Sk;i ont été dé…nies par les équations (1.8), (1.9) et (1.10). Cetteécriture signi…e que dans le modèle à e¤ets individuels, les estimateurs (Within ) desparamètres¯ i et ®i sont obtenus en centrant les variables sur leurs moyennes individuellesrespec- tives. Nous reviendrons par la suite sur cette propriété.Test d’homogénéité des constantes ®i Considérons en…n le dernier test d’homogénéité des constantes ®i , notée H03 : 3 H0 : ®i = ® 8 i 2 [1; N ] Soit F3 la statistique de Fischer associée à ce test. Sous l’hypothèse nulle,on impose l’égalité des paramètres ¯ i : Sous l’hypothèse d’indépendance et denormalité des résidus, on construit une statistique de Fischer pour tester ces N ¡ 1restrictionslinéaires. Sous l’hypothèse alternative Ha3 ; les coe¢cients ¯ i sont tous égaux, mais lesconstantes di¤èrent selon les individus. On a donc N T ¡ N ¡ K degrés de liberté.De…nition 1.3. La statistique de Fischer F3 associée au test d’homogénéité totale H03dans le modèle (1.1) : 3 H 0 : ®i = ® 8 i 2 [1; N ]s’écrit sous la forme suivante et suit un Fischer avec N ¡ 1 et N (T ¡ 1) ¡ K degrésde liberté : ¡ ¢ SCR1;c ¡ SCR1;c0 = (N ¡ 1) F3 = (1.18) SC R1;c0= [N (T ¡ ¡ K] 1)où SC R1;c0 désigne la somme des carrés des résidus du modèle (1.1) sous l’hypothèse¯ i = ¯ (modèle à e¤ets individuels) et SCR1;c la somme des carrés des résidus dumodèle contraint (modèle de pooled) : yi;t = ® + ¯ 0 xi;t + "i;t Les sommes des carrés des résidus SCR1;c0 et SC R1;c ont été respectivement dé…nies par les équations (1.17) et (1.12). Il est en outre possible de tester la constance dans le temps des di¤érentsparamètres du panel suivant une procédure sensiblement identique (voir Hsiao 1986).Mais cette problématique relève plus de la notion traditionnelle de stabilité des coe¢cients dans le temps que de la pure application des techniques économétriques de
  20. 20. données de panel.
  21. 21. 1.3. ApplicationConsidérons à présent une application simple de ces tests d’homogénéité à partir dedonnées de panel relatives au nombre de grèves dans le secteur industriel4 . Les donnéesannuelles couvrent 17 pays5 de l’OCDE et sont disponibles de 1951 à 1985. Soit si;tle nombre de jours chômés pour cause de grève, pour 1000 salariés du secteurindustriel, du pays i observé à la date t. Nous cherchons à relier cette variable d’unepart au taux de chômage de l’économie, noté ui;t ; et d’autre au niveau de l’in‡ation,notée pi;t ; selon la relation linéaire suivante : si;t = ®i + ¯ i ui;t + ° i pi;t + "i;t 8 i = 1; ::; 17 (1.19) Appliquons la stratégie de test d’homogénéité à ce modèle. Pour ce faire, nousutiliserons directement les résultats des tests programmés sous TSP (version 4.3Aou versions ultérieures). Les commandes TSP sont donc les suivantes : load(file=’’strikes.wks’’); panel (id=i,time=t,byid) srt u p; La première ligne du programme sert tout simplement à lire les données du …chierstrike.wks. La seconde ligne du programme permet d’obtenir l’ensemble desestima- teurs de base (pooled, between, e¤ets …xes et e¤ets aléatoires) ainsi queles résultats des principaux tests de spéci…cation (tests d’homogénéité et testd’Hausman). L’option id = i indique le nom de l’indicatrice pays et l’option time = tindique le nom de l’indi- catrice temporelle. L’option byid est nécessaire pour a¢cher l’ensemble des résultats des tests de spéci…cation6 . Les variables sontrespectivement nommées srt , u et p. Sur la …gure (1.2) sont reportés les résultats d’estimation de cette procédure TSP.Nous allons nous concentrer plus particulièrement sur l’analyse des résultats destests d’homogénéité. TSP propose, avec l’option byid, les trois tests de Fischerprésentés précédemment. On observe tout d’abord le panel est cylindré (balanced), c’est à dire qu’ilcomporte le même nombre de points dans la dimension temporelle pour tous lesindividus. On a ici N = 17 et T = 35; soit 595 observations. Commençons toutd’abord par le test 4 Les données ont été collectées par Bruce Western et proviennent du sitehttp://lib.stat.cmu.edu/datasets/ 5 Le panel comporte initialement 18 pays, mais pour le pays 3, les données ne sont disponibles quejusqu’en 1980. C’est pourquoi a…n de travailler sur un panel cylindré nous avons choisi de retirer cepays de notre échantillon. 6 Pour plus de détails sur l’instruction panel sous TSP, se reporter au manuel de programmation dulogiciel.
  22. 22. Figure 1.2: Résultats des Tests de Spéci…cation sous TSP 4.3A
  23. 23. de l’hypothèse d’homogénéité totale (test H 1 dans nos notations). Ce dernier est 0noté sous la forme F test of A; B = Ai ; Bi dans le …chier résultat de TSP. Lalettre A désigne ici les constantes, tandis que la lettre B désigne le vecteur des coe¢cients des variables explicatives. Dans le cadre de notre échantillon, la réalisation de 1la statistique de Fischer associée au test H 0 , notée F1 ; est de 3:8320. Le logicielindique en outre le nombre de degré de liberté de cette statistique. Nous avons vuprécédemment que F1 suivait un Fischer avec (N ¡ 1) (K + 1) et N T ¡ N (K + 1)degrés de liberté. Compte tenu des dimensions de notre panel et du nombre devariables explicatives (K = 2), on doit donc comparer la valeur de cette réalisationau seuil d’un Fischer F (48; 544) : Le logiciel nous donne directement la pvalueassociée à ce test. En l’occurrence ici, cette pvalue est très largement inférieure auseuil de 5%, donc pour ce seuil, on rejettel’hypothèse nulle H0 d’égalité des constantes ®i et des coe¢cients ¯ i et°i: Il convient alors de tester l’hypothèse H0 2 ; d’égalité des coe¢cients et ° i (co- ¯ie¢cients associés aux variables explicatives) entre les pays. Ce test est noté sousla forme F test of Ai ; B = Ai ; Bi dans le …chier résultat de TSP. Dans le cadrede notre échantillon, la réalisation de la statistique de Fischer associée au test H 2 , 0notéeF2 ; est de 1:1845. Cette valeur est à comparer au seuil d’un Fischer avec (N ¡ 1) Ket N T ¡ N (K + 1) degrés de liberté , c’est à dire ici un F (32; 544) : La pvalueindique ici que jusqu’au seuil de 25%, l’hypothèse nulle ne peut pas être rejetée. A 5%,on con-…rme donc ici la structure de panel, puisque l’on est en droit de supposer qu’il existedes coe¢cients communs pour tous les pays entre le volume des grèves et les variablesexplicatives que sont le chômage et l’in‡ation. Reste en…n à tester l’hypothèse 0 3 de constantes individuelles ®i : Ce test est Hnoté sous la forme F test of Ai ; B = Ai ; B dans le …chier résultat de TSP. Dans lecadre de notre échantillon, la réalisation de la statistique de Fischer associée 0autest H 3 , notée F3 ; est de 9:0342. Cette valeur est à comparer au seuil d’un Fischeravec N ¡ 1 et N (T ¡ 1) ¡ K degrés de liberté , c’est à dire ici un F (16; 576) : Lapvalue est trèslargement inférieure au seuil de 5%. Pour ce seuil, on rejette l’hypothèse nulle H0d’égalité des constantes ®i : Il est nécessaire d’introduire ici des e¤ets individuels.La spéci…cation …nale de notre modèle est donc : si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17 (1.20) Reste à présent à étudier les di¤érentes méthodes d’estimation des modèles incluant
  24. 24. des constantes individuelles.
  25. 25. L’Econométrie des Données de Panel 202. Modèles à e¤etsindividuelsNous allons à présent nous à des modèles de panel hétérogènes, où la seule sourced’hétérogénéité provient des constantes individuelles. On suppose ainsi que les coe¢-cients des di¤érentes variables stochastiques explicatives sont identiques pour tousles individus du panel (¯ i = ¯). On suppose en outre que ces coe¢cients sont descon-stantes déterministes. Les constantes individuelles ®i ; quant à elles, di¤èrent selonlesindividus.Hypothèse (H1) On suppose que les N vecteurs de paramètres ¯ i sontidentiques, ¯ i = ¯ 2 R; 8 i 2 [1; N ] ; tandis que les constantes ®i peuvent di¤érer selon 2 les individus. En particulier, il existe au moins un couple (j; i) 2 [1; N ] tel que ®j = ®i Sous l’hypothèse (H 1), le modèle (1.1), s’écrit sous la forme suivante : yi;t = ®i + ¯ 0 xi;t + "i;t (2.1)où ®i 2 R et ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) 2 RK est un vecteur de constantes. Les innovations"i;tsont supposées être i:i:d: de moyenne nulle, de variance égale à ¾ 2 ; 8 i 2 [1; N ] et "sont supposées non corrélées que ce soit dans la dimension individuelle ou dans ladimension temporelle. Dès lors, dans ce contexte, on doit distinguer deux cas : le cas où les paramètres®i sont des constantes déterministes (modèle à e¤ets …xes) et le cas où les paramètres®i sont des réalisations d’un variable aléatoire d’espérance et de variance …nie(modèle à e¤ets aléatoires). Nous allons donc successivement envisager ces deux typesde modèle (sections 3 et 4). Toutefois, avant de présenter ces deux modèles, nouscommencerons tout d’abord par introduire les di¤érentes méthodes d’empilement dedonnées de panel qui autorisent une écriture vectorielle du modèle à e¤et individuel. En e¤et, il existe deux possibilité d’écriture vectorielle du modèle (2.1). Autrementdit, il existe deux façons d’empiler les données : 1. Empilement par individus : pour une variable donnée, les T réalisations his- toriques de chaque individu sont stockées dans un vecteur colonne, et les N vecteurs colonnes ainsi obtenus sont ensuite empilés à la suite des uns des autres dans l’ordre des individus.
  26. 26. L’Econométrie des Données de Panel 21 2. Empilement par dates : pour une variable donnée, les N réalisations individuelles pour une date donnée sont stockées dans un vecteur colonne, et les T vecteurs colonnes ainsi obtenus pour toutes les dates sont ensuite empilés à la suite des uns des autres. Il est très important de noter que les principaux logiciels d’économétrie(notamment TSP) optent généralement pour une méthode d’empilement par pays. Si le logicieln’empile pas lui même les données, les séries utilisées dans le cadre des applicationsdoivent, de façon impérative, être ordonnées sous la forme préconisée par lesconcepteurs du logiciel.2.1. Empilement par paysConsidérons tout d’abord la méthode d’empilement par pays. On considère un échan-tillon de N individus sur T périodes, et un modèle avec K variables explicatives. Onpose : 0 1 0 0 1 yi;1 x1;i;1 x2;i;1 ::: "i;1 B C B C B yi;2 C 1 B "i;2 C i ::: xK;i;1 i = C ::: B B x1;i;2 x2;i;2 ::: xK;i;2 C Xi = " ::: ::: ::: ::: y =@ A (T ;K) @ A (T ;1) @ A (T ;1) yi;T x1;i;T x2;i;T ::: xK;i;T "i;T On dé…nit en outre un vecteur unitaire, noté e; tel que : 0 1 1 B 1 C e =B C (T ;1) @ ::: A 1De…nition 2.1. Dans le cas de l’empilement par pays, pour chaque individu 8i 2[1; N ] ; le modèle (2.1) peut s’écrire sous la forme : yi = e®i + Xi ¯ + "i 8 i = 1; ::; N (2.2) C’est principalement cette expression du modèle (2.1) que l’on utilisera par la suitepour étudier les estimateurs du modèle linéaire simple. On peut toutefois écrirele modèle de façon totalement vectorielle en empilant les vecteurs yi et les matricesXi :Pour cela on pose : 01 0 1 0 1 y1 X1 "1 B y2 C B X C B" C Y =B C X =B 2 C " =B 2 C ::: ::: :::
  27. 27. L’Econométrie des Données de Panel @ A @ A @ A 22 (T N;1) (T N;K ) (T N;1) yN XN "N
  28. 28. On dé…nit 0T le vecteur nul de dimension (T ; 1) : 0 1 0 1 e ®1 B 0T C B ®2 C e = 0T ::: 0T ® = B e ::: 0T C B C e (T N ;N ) @ ::: e ::: ::: 0T A (N;1) @ ::: A 0T 0T ::: e ®N On obtient alors la représentation vectorielle suivante : e e® + X ¯ + " (2.3)2.1.1. ExempleConsidérons un panel de 2 pays (N = 2), dont les données annuelles sont disponiblessur 3 ans (T = 3). On cherche à estimer une fonction de production log-linéaire (Cobb-Douglass), supposée commune à ces deux pays. Soit yi;t le logarithme du P I B, ki;tle logarithme du stock de capital privé et ni;t le logarithme de l’emploi. On supposeque cette fonction de production s’écrit sous la forme : yi;t = ®i + ¯ k ki;t + ¯ n ni;t + "i;t 8 i 2 [1; 2] ; 8 t 2 [1; T ]où ¯ k et ¯ n désignent respectivement les élasticités (supposées communes auxdeux pays) de la production par rapport au capital et à l’emploi. L’e¤et individuel ®imesure ici les spéci…cités a-temporelles de la productivité totale des facteurs quicorrespond dans cette régression, aux résidus "i;t : Ce modèle s’écrit sous formevectorielle de lafaçon suivante : 0 1 0 1 0 1 0 1 yi;1 1 ki;1 ni;1 µ ¶ "i;1 ¯ @ yi;2 A = @ 1 A ®i + @ ki;2 ni;2 A k + @ "i;2 A ¯ n yi;3 1 ki;3 ni;3 "i;3 () yi = e®i + Xi ¯ + "i 8 i = 1; ::; N L’écriture vectorielle complète du modèle est la suivante : 0 1 0 1 0 0 1 y1;1 1 0 k1;1 n1;1 "1;1 C B 1 B y B 1;2 C B 1 0 C B k1;2 B n1;2 CCµ Cµ B k1;3 y1;3 1 0 ®1 + n1;3 C B C C B "1;2 C "1;3 + B C ¶ B C B C B C ¯k B C = B C B C B C B C y2;1 k2;1 n2;1 "2;1
  29. 29. B C B 0 1 C ®2 B C ¯n B CB C B C B C ¶ B C y2;2 k2;2 n2;2 "2;2@ A @0 1 A @ A @ A y2;3 0 1 k2;3 n2;3 "2;3 e e® + X ¯ + "
  30. 30. 2.2. Empilement par datesDe façon parallèle, il est possible de représenter de façon symétrique le modèle (2.1)en utilisant la méthode d’empilement par dates. Pour ce faire, il su¢t de poserles dé…nitions suivantes : 0 1 0 0 1 y1;t x1;1;t x2;1;t ::: "1;t B C 1 B C B y2;t C B "2;t C t xK;1;t t = ::: B C ::: Xt = B x1;2;t x2;2;t ::: xK;2;t C " ::: ::: ::: ::: y =@ A @ A @ A (N;1) (N;K) (T ;1) yN;t x1;N;t x2;N;t ::: xK;N;t "N;tDe…nition 2.2. Dans le cas de l’empilement par dates, pour chaque date t 2 [1; T ];le modèle (2.1) peut s’écrire sous la forme : yt = e + Xt ¯ + "t ® 8 t = 1; ::; T (2.4) De la même façon, il est possible d’exprimer le modèle (2.1) sous une forme vecto-rielle complète. On pose : 0 1 0 1 0 1 y1 X1 "1 B y2 C B X2 C B " C Y =B C X =B C =B 2 C ::: ::: ::: @ A @ A @ A (T N;1) (T N;K ) " (T N;1) yT XT "T Soit IN la matrice identité de dimension (N; N ) : On dé…nit la matrice suivante : 0 1 IN B C e = B IN C e (T N ;N ) @ ::: A IN Il vient alors : e e® + X ¯ + " (2.5)2.2.1. ExempleReprenons l’exemple présenté précédemment. Lorsque les données sont empiléespar dates, ce modèle s’écrit sous forme vectorielle de la façon suivante : µ ¶ µ ¶ µ ¶µ ¶ µ ¶ y1;t ®1 + k1;t n1;t ¯ k + "1;t = y2;t ®2 k2;t n2;t ¯n "2;t () yt = ® + Xt ¯ + "t e 8 t = 1; ::; T
  31. 31. L’écriture vectorielle complète du modèle est la suivante : 0 1 0 1 0 1 y1;1 0 1 k1;1 n1;1 "1;1 1 0 B k2;1 B n2;1 C B y2;1 C B 0 1 C µ B B C B C ¶ B C ¶ B B B "2;1 C C k1;2 Cµ y1;2 B1 0 ®1 n1;2 ¯k "1;2 B C B C B B C= +B C y2;2 C B k ;2 C "2;2 C +B C C B C B C B 0 1 C ®2 B C B B 2 n2;2 C ¯n B C B C @ A B C A @ y1;3 A 1 0 @ k1;3 @ 0 1 n1;3 A "1;3 y2;3 k2;3 n2;3 "2;3 e e® + X ¯ + " Maintenant que nous avons présenté l’écriture vectorielle des modèles de panelà e¤ets individuels, nous allons à présent étudier les propriétés des estimateursdes paramètres de ces modèles suivant la spéci…cation des e¤ets individuels. Nousdis- tinguerons pour cela deux cas : le cas des e¤ets …xes et le cas des e¤etsaléatoires.
  32. 32. 3. Modèle à e¤ets …xesOn fait maintenant l’hypothèse que les e¤ets individuels ®i sont représentés pardes constantes (d’où l’appellation modèle à e¤ets …xes ). Nous allons déterminer laforme générale des estimateurs des paramètres ®i et ¯ dans ce modèle à e¤ets …xes. On considère donc le modèle (1.1) sous l’hypothèse (H 1) : yi;t = ®i + ¯ 0 xi;t + "i;t 8 i 2 [1; N ] ; 8 t 2 [1; T ] (3.1)où ®i 2 R, ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) 2 RK . Tous les paramètres du modèle sont desconstantes et l’on suppose pour simpli…er qu’il n’existe pas d’e¤et temporel. On dé…nit le vecteur"i tel que : ¢0 ¡ "i = "i;1 "i;2 ::: "i;T (T ;1) Pour étudier les propriétés des estimateurs du modèle à e¤ets …xes, nous allonsfaire une hypothèse supplémentaire sur la nature du processus des résidus "i;t :Cette hypothèse constitue tout simplement la généralisation dans la dimension depanel de la dé…nition d’un bruit blanc.Hypothèse (H2) On suppose que les résidus "i;t sont i:i:d: et satisfont les conditions suivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ] ² E ("i;t ) = 0 ½ ¾2" t=s ² E ("i;t "i;s ) = ; ce qui implique que E ("i "0 ) = ¾2 IT où It désigne i " 0 8t = s la matrice identité (T ; T ) : ² E ("i;t "j;s ) = 0; 8j = i; 8 (t; s) La première condition impose tout simplement que l’espérance des résidus du mod-èle (3.1) soit nulle. La seconde condition, standard en économétrie des sériestem- porelles, impose que le processus "i;t soit un processus ”sans mémoire” (dansla di- mension temporelle). Pour chaque individu, il n’existe ainsi aucune corrélationentre le niveau présent du processus "i;t et les réalisations passées. Seule lavariance du processus "i;t est non nulle. L’introduction d’une dimensionindividuelle, nous oblige ici à dé…nir une seconde contrainte qui est que tous lesprocessus individuels "i;t ontla même variance ¾2 quel que soit l’individu considéré. Autrement dit, la matrice "devariance covariance du processus "i est proportionnelle, à un scalaire près, à lamatrice identité. En…n, la troisième condition stipule qu’il n’existe aucunecorrélation entre les processus d’innovation pour deux individus distincts et celaquelle que soit la date considérée.
  33. 33. 3.1. Estimateur Within ou LSDVConsidérons l’écriture vectorielle du modèle obtenue par un empilement desdonnées par pays. yi = e ®i + Xi ¯ + "i 8 i = 1; ::; N (3.2) (T ;1) (T ;1) (T ;K)(K;1) (T ;1) L’estimateur des Moindres Carrés Ordinaires (M C O) des paramètres ®i et ¯ dansle modèle à e¤ets …xes est appelé estimateur W ithin; ou estimateur à e¤ets …xesou estimateur LSDV (Least Square Dummy Variable ). Comme nous l’avons vu, leterme W ithin s’explique par le fait cet estimateur tient compte de la variance intragroupe de la variable endogène. La troisième appellation LSDV tient au fait que cetestimateur conduit à introduire des variables dummies, qui dans la spéci…cation (3.2)correspondent aux vecteurs colonnes de e: On peut démontrer que sous l’hypothèse (H 2), l’estimateur des MoindresCarrés Ordinaires (MCO) des paramètres ®i et ¯ du modèle (3.2) est le meilleurestimateur linéaire sans biais (BLU E 7 ). Si l’on suppose que ¾ " est connu, cetestimateur est obtenu en minimisant la variance des résidus empiriques, notée S;par rapport auxseuls paramètres ®i et ¯: N N X X min 0 N S= "i0 "i = (yi ¡ e®i ¡ Xi ¯) (yi ¡ e®i ¡ Xi ¯) f®i ;¯gi=1 i=1 i=1 La première condition nécessaire de ce programme; nous donne immédiatementl’expression de l’estimateur de la constante ®i , 8 i 2 [1; N ] : 0 ® i = y i ¡ ¯b xi (3.3) b LSDVoù les termes y i et xi désignent les moyennes individuelles des variables endogèneset exogènes. 1X 1X T T yi = yi;t xi = xi;t 8 i 2 [1; N ] (3.4) (1;1) T t=1 (K;1) T t=1 Ces moyennes sont donc calculées de façon traditionnelle dans la dimensiontem- porelle, et cela pour chaque individu de l’échantillon. C’est pourquoi elles sontindicées en i: A partir de la seconde condition nécessaire du programme de minimisation, onmontre que l’estimateur du paramètre vectoriel ¯ est donné par la relation suivante : "N T #¡1 " # N T X ¯bLSDV =
  34. 34. X XX (xi;t ¡ xi ) (xi;t (xi;t ¡ xi ) (yi;t ¡ (3.5) 0¡ xi ) yi )i=1 t=1 i=1 t=1 7 Best Linear Unbiased Estimator
  35. 35. Proposition 3.1. L’estimateur W ithin ou LSDV de ¯; obtenu dans le modèle àe¤ets individuels …xes (3.2) est identique à l’estimateur des M C O obtenu à partir d’unmodèle transformé où les variables expliquées et explicatives sont centrées sur leurmoyennes individuelles respectives : 0 (yi;t ¡ y i ) = ¯b (xi;t ¡ xi ) + "i;t 8i 2 [1; N ] ; 8 t 2 [1; T ] (3.6)Les réalisations des estimateurs des constantes ®i sont alors déduits de la relation: b ®i = y i ¡ 0 ¯b xi En e¤et, on voit d’après l’équation (3.5), que l’estimateur W ithin des coe¢cients de ¯ peut être obtenu en centrant les di¤érentes (variables endogène etexogènes) sur les moyennes individuelles respectives. Ainsi, on peut obtenir lemême estimateur en utilisant le modèle transformé suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] : yi;t = ¯ 0 xi;t + "i;t e yi;t i;t xi;t i;t i ¡ y i ) et eavec e = (y = (x ¡ x ). En e¤et, dans ce cas on obtient : e " #¡1 " # N T N T XX XX ¯b = e ei;t e e i=1 t=1 0 i=1 t=1 xi;t yi;t xi;t x " #¡1 " # N T N T XX XX = (xi;t ¡ xi ) (xi;t ¡ (xi;t ¡ xi ) (yi;t ¡ y i ) 0 i=1 t=1 xi ) i=1 t=1 On reconnaît ici l’expression générale de l’estimateur W ithin ¯bLSDV : Reste alors àobtenir les réalisations des estimateurs des constantes individuelles selon la formule : 0 b 1 = y 1 ¡ ¯b ® x1 0 b 2 = y ¡ ¯b ® 2 x2 :::: b ®N = y N ¡ 0 ¯b x N
  36. 36. Le fait qu’il soit équivalent d’estimer les paramètres du modèle (3.2) directementà partir de cette spéci…cation incluant des dummies individuelles ou à partir d’unmodèle transformé où les variables sont centrées sur leurs moyennes individuellesrespectives est particulièrement important. Cela illustre la notion de varianceintra-classes qui est fondamentale dans la construction de l’estimateur Within. Nousallons à présent, proposer une illustration de cette propriété de l’estimateur W ithin:
  37. 37. 3.2. ApplicationConsidérons à nouveau l’exemple du modèle de grèves dans le secteur industriel.Nous avons établi précédemment que le modèle de panel comportait des e¤etsindividuels et pouvait s’écrire sous la forme: si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17 (3.7)où si;t désigne le nombre de jours chômés pour cause de grève, pour 1000 salariésdu secteur industriel, ui;t désigne le taux de chômage de l’économie et pi;t letaux d’in‡ation. On suppose que l’on peut spéci…er les e¤ets individuels ®i sous laforme d’e¤ets …xes. Dans le programme ci-dessous, on cherche à comparer l’estimateurWithin et l’estimateur des MCO du modèle transformé : (si;t ¡ si ) = ¯ (ui;t ¡ ui ) + ° (pi;t ¡ pi ) + "i;t (3.8) L’instruction panel de TSP avec les options notot, nobet et novar permet d’obtenirdirectement et uniquement les résultats de l’estimation W ithin: Pour construire leses- timateurs du modèle transformé, on doit au préalable centrer les variables surleur moyennes individuelles respectives. Pour réaliser cette opération onconstruit une boucle sur les N = 17 individus, avec un compteur j et à chaque étapeon sélectionne un pays dont le code pays (variable i) est égal à la valeur ducompteur j (instruc- tion select i = j). Pour le sous échantillon sélectionné,l’instruction msd [Nom de la Variable ] permet alors de calculer di¤érents momentsde la variable considérée sans les a¢cher (si l’on ajoute l’option noprint). Enparticulier, la moyenne empirique est stockée dans la variable réservée @mean. Dèslors, pour chaque individu, on construit de nouvelles variables en centrant sur lesmoyennes individuelles correspondantes. En-…n, il ne reste plus qu’à e¤ectuer la régression par les MCO sur le modèle transformé(instruction ls ou ols) load(file=’’strikes.wks’’); ?---- Estimation Within ---- panel (id=i,time=t,notot,nobet,novar) srt u p; ?---- Centrer les Données --- do j=1 to 17; select (i=j); msd(noprint) srt; srtc=srt-@mean; msd(noprint) u; uc=u-@mean; msd(noprint) p;
  38. 38. pc=p-@mean; enddo; ?---- Estimation Modèle Transformé---- ls srtc uc pc; ?---- Affichage des Effets Fixes (Instruction Panel) ---- print @fixed; Les résultats de ce programme sont reproduits sur la …gure (3.1). On véri…eque l’estimateur W ithin est totalement équivalent à l’estimateur des M COappliqué sur un modèle transformé où les variables endogènes et exogènes ont étécentrées sur leurs moyennes individuelles respectives. Dans les deux cas, lesréalisations des estimateurs des coe¢cients des deux variables explicatives(respectivement ui;t et pi;t ) sont stricte- ment identiques (respectivement ¡21:5968 et16:2729). Dans le cas où l’on utilise la commande panel de TSP, on peut a¢cher lesesti- mations des e¤ets …xes en utilisant la commande print @fixed. Dans le casoù l’on utilise le modèle transformé, il convient alors de reconstruire lesestimateurs des ef- fets …xes selon la formule (3.3) en utilisant les moyennesindividuelles des variables (cf. programme ci-dessus) et les réalisations desestimateurs des coe¢cients ° et ¯. Essayons à présent de commenter lesestimations ainsi obtenues. Il s’avère ainsi que le pays 9 a, de façon structurelle, leplus de journées chômées pour cause de grève. Pour ce pays, di¤érents facteurshistoriques (législation sur le droit de grève) ou soci- ologique (représentation dessyndicats par exemple) expliquent que toutes choses égales par ailleurs (chômage etin‡ation), la fréquence des grève soit particulièrement élévée. A l’inverse, les pays 15et 2 ont des e¤ets …xes négatifs. Pour un même niveau de chô- mage et d’in‡ation,ces deux pays auront le nombre de jours chômés le plus faible de tout notreéchantillon. Il faut bien comprendre que les estimations des e¤ets individu- els nepeuvent s’analyser qu’en niveau relatif (c’est à dire en comparant les di¤érentesréalisations individuelles) et non en niveau absolu.
  39. 39. L’Econométrie des Données de Panel 30 Figure 3.1: Comparaison des Estimateurs Whithin et OLS sur Modèle Transformé
  40. 40. L’Econométrie des Données de Panel 313.3. EcriturevectorielleUne façon équivalente d’obtenir l’estimateur W ithin et de montrer l’équivalence avecle modèle transformé où les variables sont centrées, consiste à travailler directementavec l’écriture vectorielle (3.2). Par la suite, nous adopterons souvent cette notationvecto- rielle qui permet d’alléger particulièrement les notations du modèle et desestimateurs correspondants. On considère donc le modèle vectoriel suivant : yi = e®i + Xi ¯ + "i 8 i = 1; ::; N (3.9) Nous allons à présent introduire un opérateur matriciel qui permet de centrerles variables sur leurs moyennes individuelles respectives.De…nition 3.2. Le modèle (3.9) à e¤et individuels …xes peut s’écrire sous laforme vectorielle suivante 8 i = 1; ::; N : Qyi = QXi ¯ + Q"ioù la matrice Q de dimension (T ; T ) est telle que: 1 Q = IT ¡ ee0 (3.10) TL’estimateur W ithin du vecteur ¯ est alors dé…ni de la façon suivante: " #¡1 " # X N N X ¯b LSDV = Xi0 QXi Xi0 Qyi (3.11) i=1 i=1 En e¤et, on peut montrer que les processus transformés Qyi et QXi correspondentaux variables centrées sur leurs moyennes respectives. En e¤et, on montre que : 0 1 0 1 µ ¶ µ ¶ yi;1 Ã ! 1 T 1 1 = yi;2 1X 1 B C B C Qyi = IT 0 ¡ yi = yi ¡ e0 yi ¡ yi;t ee T e T ::: T ::: B C B @ A yi;T @ CA t=1 1 De la même façon, on peut montrer que : 1 QXi = Xi ¡ ee0 T Xi
  41. 41. L’Econométrie des Données de Panel 32 0 1 0 1 x1;i;1 x2;i;1 ::: xK;i;1 1 ³ ´ B x1;i;2 x2;i;2 ::: xK;i;2 C 1 B 1 C PT PT PTQXi = B C¡ B C ::: ::: ::: ::: t=1 x1;i;t t=1 x2;i;t ::: t=1 xK;i;t @ A T @ ::: A x1;i;T x2;i;T ::: xK;i;T 1
  42. 42. Dès lors, a…n d’éliminer les e¤ets individuels de l’équation (3.9), il su¢t de prémul-tiplier les membres de cette équation par Q. Ainsi 8 i = 1; ::; N Qyi = Qe®i + QXi ¯ + Q"i () Qyi = QXi ¯ + Q"i En appliquant les M C O à cette expression on obtient donc une écritureéquivalente de ¯bLSDV : " #¡1 " N # X N X ¯b LSDV = 0 Xi QXi 0 Xi Qyi (3.12) i=1 i=1
  43. 43. 4. Modèle à e¤etsaléatoiresDans la pratique standard de l’analyse économétrique, on suppose qu’il existe un grandnombre de facteurs qui peuvent a¤ecter la valeur de la variable expliquée et quipour- tant ne sont pas introduits explicitement sous la forme de variablesexplicatives. Ces facteurs sont alors approximés par la structure des résidus. Leproblème se pose de la façon similaire en économétrie de panel. La seule di¤érencetient au fait que trois types de facteurs omis peuvent être envisagés. Il y a toutd’abord les facteurs qui af- fectent la variable endogène di¤éremment suivant lapériode et l’individu considéré. Il peut en outre exister des facteurs qui a¤ectent defaçon identique l’ensemble des indi- vidus, mais dont l’in‡uence dépend de la périodeconsidérée (e¤ets temporel). En…n, d’autres facteurs peuvent au contraire re‡éter desdi¤érences entre les individus de type structurelles, c’est à dire indépendantes dutemps (e¤ets individuel). Dès lors le résidu, noté "i;t ; d’un modèle de panel peut être décomposé en troisprincipales composantes de la façon suivante (Hsiao 1986) 8 i 2 [1; N ] ; 8 t 2 [1; T ] : "i;t = ®i + ¸t + vi;t (4.1) Les variables ®i désignent ici les e¤ets individuels qui représentent l’ensemble desspéci…cités structurelles ou a-temporelles de la variable endogène, qui di¤érentselon les individus. On suppose ici que ces e¤ets sont aléatoires. Les variablesaléatoires¸t représentent quant à elle les e¤ets temporels strictement identiques pour tousles individus. En…n, le processus stochastique vi;t désigne la composante du résidu total"i;t orthogonale aux e¤ets individuels et aux e¤ets temporels. Généralement, on estconduit à faire un certain nombre d’hypothèses techniques sur cette structure derésidus.Hypothèses (H3) On suppose que les résidus "i;t = ®i +¸t +vi;t sont i:i:d: et satisfont les conditions suivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ] ² E (®i ) = E (¸t ) = E (vi;t ) = 0 ² E (®i ¸t ) = ½ (¸t vi;t ) = E (®i vi;t ) = 0 E ¾2® i=j ² E (®i ®j ) = 0 8i = j ½ 2 ¾¸ t=s ² E (¸t ¸s ) 0 8t = s = ½ 2 ¾ t = s; i = j ² E (vi;t vj;s ) = v 0 8t = s; 8i = j ³ ´ ³ ´ ³ ² E ®i xi;t = E ¸t x 0 =E 0 i;t vi;t
  44. 44. ´0 =0i;t x
  45. 45. Sous ces hypothèses, la variance de la variable endogène yi;t conditionnellement auxvariables explicatives xi;t est alors égale à ¾2 = ¾2 + ¾2 + ¾2 . Les variances ¾2 , ¾2et y ® ¸ v ® ¸¾ 2 correspondent aux di¤érentes composantes de la variance totale. C’est pourquoi, le vmodèle à e¤ets aléatoires est aussi appelé modèle à erreurs composés (error componentmodel ). Dans une première étape, nous allons présenter le modèle simple à e¤ets individuelsaléatoires. Nous supposerons ainsi, pour simpli…er l’analyse, qu’il n’existe pas d’e¤ettemporel. Nous proposerons alors une écriture vectorielle du modèle à e¤etsaléatoires. Dans une seconde étape nous étudierons les estimateurs des di¤érents coe¢cients de ce modèle.4.1. Modèle à variance composéeOn se limite au cas où il n’existe pas d’e¤et temporel (¸t = 0; 8t). On considère doncle modèle suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] : yi;t = ¹ + ¯ 0 xi;t + "i;t (4.2) "i;t = ®i + vi;t (4.3)où ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) est un vecteur de constantes et le processus f"i;t g satisfaitles hypothèses (H3 ). La constante ¹ désigne ici l’espérance inconditionnelle duprocessus y;i;t puisque on suppose que E (®i ) = 0; 8 i 2 [1; N ] :Proposition 4.1. Le modèle à e¤ets individuels aléatoires s’écrit vectoriellement sousla forme : yi = X ° + "i 8 i = 1; ::; N (4.4) ei (T ;1) (T ;K +1) (T ;1) (K+1;1) ¡ ¢avec "i = ®i e + X ei = (e; Xi ) et ° 0 = ¹; ¯ 0 : Sous les hypothèses (H3 ), lavi ; matricede variance covariance de "i ; notée V; est alors dé…nie par : ¡ 0¢ £ 0 ¤ V = E "i "i = E (®i e + vi ) (®i e + vi ) = ® 2 ee0 +v ¾2 IT ¾ (4.5)L’inverse de cette matrice de variance covariance est dé…nie comme : 1 · µ ¶ ¸ V ¡1 = ¾2 ® 0 IT ¡ ee (4.6) ¾2 ¾2 2 v v + T ¾® Donnons ici une démonstration possible de ce résultat8 . On pose e V Vedé…nition on a Ve V = V Ve = IT : On en déduit que : V Ve = ¾2 ee0 Ve + ¾2 V = IT () ¾ 2 V = IT ¡ ¾2 ee0
  46. 46. = V ¡1 : Par e e ® v v ® 8 Pour une démonstration plus élégante voir Graybill (1969), Nerlove (1971), Wallace et Hussain (1969)
  47. 47. Reste alors à déterminer l’expression de ee0 Ve : Raisonnons par une méthode de 0 ecoe¢cient indéterminé. On suppose que ee V peut s’écrire sous la forme µee0 où µ 2R+ . Considérons l’expression de ee0 Ve V en substituant ee0 Ve par son expression, ilvient : ee0 Ve V = µee0 V ¡ ¢ = µee0 ¾ 2® e0 + ¾v IT 2 £ ¡e ¢ ¤ ¡ ¢ 2 0 0 2 0 = µ¾® e e e e + µ¾ ee v Par dé…nition de Ve ; on a ee0 Ve V = ee0 : Sachant que e (e0 e) e0 = T ee0 ; on obtientalors la relation suivante : ee0 Ve V = ee0 ¡ ¢ () µee0 ¾ 2 T + ¾2 = ®ee0 v On en déduit immédiatement la valeur du paramètre µ : 1 µ= 2 R+ ®T + ¾v On obtient ainsi : ¾2 2 µ ¶ 1 ee Ve = 0 ee 0 ¾2 2 ®T + ¾v Dès lors, en reprenant l’expression de Ve , il vient : µ ¶ 2 2 e = I ¾® ¾v V T ¡ 2 2 e e0 ¾ T ® + ¾v Ainsi, l’inverse de la matrice de variance covariance des "i s’écrit sous la forme : · µ ¶ ¸ ¡1 1 ¾2 ® 0 V = IT ¡ ee ¾2 2 ¾2 v v + T ¾® L’écriture vectorielle du modèle à e¤ets aléatoires de la proposition (4.1) nous seraparticulièrement dans la section suivante pour construire les estimateurs desdi¤érents paramètres de ce modèle.4.2. Estimateurs du modèle à e¤ets aléatoiresNous allons à présent nous intéresser aux propriétés des estimateurs du modèle aléa-
  48. 48. toire. Pour bien comprendre ces propriétés, il est nécessaire de bien appréhender lesconséquences de la structure des résidus.
  49. 49. Remark 1. Dans le modèle de la proposition (4.1), le fait que les e¤ets individuels®i constituent l’une des composantes des résidus "i du modèle (4.4), induit unecor- rélation entre le niveau de ces résidus lorsque l’on considère un individudonné. En revanche, sous (H3 ), il n’existe pas de corrélation de ces résidus dansla dimension inter individuelle. Quelles sont alors les conséquences de cette structure des résidus ? Si l’on raisonneen termes de biais d’estimation, il n’y en a aucune dès lors que l’on centre les variablesdu modèle sur leur moyenne respective. En e¤et, dans ce cas la composante individuelledes résidus disparaît et les corrélations inter-individuels des résidus du modèletransformé disparaissent par la même occasion. Pour le vecteur ¯; on retrouvealors la forme générale de l’estimateur du modèle à e¤ets …xes. Pour preuve,appliquons l’opérateur Q au modèle à e¤et aléatoire : Qyi = Qe¹ + QXi ¯ + Qe®i + Qvi ¡ ¢ ¡1 Or, on sait par dé…nition de l’application que Qe = IT ¡ T ee0 e = 0: Dèslors, on obtient le modèle 8 i 2 [1; N ] : Qyi = Qe¹ + QXi ¯ + Qvi (4.7) Dans ce modèle, sous (H3 ), l’estimateur ¯bLSDV du vecteur ¯ est non biaisé etconvergent 9 . L’estimateur de la constante ¹ est alors construit sous la forme : 0 ¹ = y ¡ ¯b x (4.8) b LSDVavec : N T N T 1 XX 1 XX yi = yi;t x = xi;t (4.9) (1;1) NT (K;1) NT i=1 t=1 i=1 t=1 Ainsi, il n’existe pas de problème de biais lorsque l’on envisage les techniques d’es-timation utilisées dans les modèles à e¤ets …xes, c’est à dire lorsque l’on centrelesvariables sur leurs moyennes individuelles respectives. Toutefois, l’estimateur¯bLSDVainsi obtenu n’est pas un estimateur à variance minimale : c’est pas l’estimateur BLU E:Proposition 4.2. Dans un modèle à e¤ets aléatoires, l’estimateur Within ¯bLSDV ;obtenu sous l’hypothèse d’e¤ets …xes, est un estimateur sans biais et convergentdu vecteur de paramètres ¯: Toutefois, ce n’est pas l’estimateur BLU E. Unestimateur BLU E est alors donné par l’estimateur de Moindres Carrés Généralisés
  50. 50. (MCG). 9 On a en e¤et : p ¯b LS DV ¡! ¯ N T !1où l’indice p désigne la convergence en probabilité (voir section précédente pour une démonstration).
  51. 51. Nous ne donnerons pas ici de démonstration de cette propriété. Si l’on résume,quelle que soit la nature des e¤ets individuels (…xes ou aléatoires), l’estimateur Withinest un estimateur sans biais et convergent. Toutefois, cette estimateur n’est pas unestimateur à variance minimale lorsque les e¤ets individuels sont aléatoires. Unestimateur BLU E possible du vecteur ¯ est alors donné par l’estimateur de MoindresCarrés Généralisés (MCG). Cette propriété sera particulièrement intéressantelorsqu’il sera nécessaire de discriminer les deux modèles et de construire les tests despéci…cation appropriés (test d’Hausman 1978, en particulier).4.3. Estimateur des Moindres Carrés GénéralisésNous avons vu que dans un modèle à e¤ets aléatoires, un estimateur BLU E peut êtreconstruit à partir de l’estimateur des Moindres Carrés Généralisés (MCG).Considéronsle modèle vectoriel de la proposition (4.1) : yi = Xei ° + "i 8 i = 1; ::; N (4.10)avec "i = ®i e +vi ¡ ¢; Xei = (e; Xi ) et ° 0 = ¹; ¯ 0 : Soit V la matrice de variance covariancedu vecteur des résidus "i : V = E ("i "i0 ) : On suppose, dans un premier temps, que Vest connue. Le problème est que, du fait de la structure du modèle, la matrice V n’estpas diagonale en raison de la présence de corrélations intra-individuelles desrésidus. Tout comme en séries temporelles, c’est pourquoi on applique alors lesMCG.De…nition 4.3. Si la matrice V est connue, l’estimateur des MCG du vecteur °;noté°MbG C; est alors dé…ni par la relation : " #¡1 " # N N X X °M C G = b Xe 0 V 1 e i ¡ Xi 0 V ¡ e 1 (4.11) i=1 Xi i=1 yi °M C G Cette dé…nition de l’estimateur b correspond à la dé…nition générale (iden-tique à celle utilisée en série temporelle, cf. Bourbonnais 2000) des MoindresCarrés Généralisés. Bien entendu, lorsque la matrice V n’est pas connue, bl’estimateur ° M C G est obtenu en deux étapes. La première étape consiste à appliquerl’estimateur W ithinpour obtenir une première estimation sans biais et convergente des paramètres ¯et¹: A partir de ces estimations, on construit les séries de résidus individuels "i etl’onconstruit un estimateur Vb
  52. 52. de la matrice de variance covariance V: La seconde étapeconsiste alors à appliquer l’estimateur des MCG selon la formule (4.11) en utilisantl’estimateur de V:Vb Il existe une autre façon d’obtenir l’estimateur des MCG. En e¤et, dans la pratique,la procédure en deux étapes, utilisée dans les principaux logiciels d’économétrie, n’est

×