SlideShare une entreprise Scribd logo
1  sur  28
Télécharger pour lire hors ligne
Ricco Rakotomalala 
Ricco.Rakotomalala@univ-lyon2.fr 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 1
PLAN 
1. Econométrie : Origine(s), définition(s) et objectif(s) 
2. La démarche économétrique 
3. Analyse de régression – L’hypothèse de linéarité 
4. Domaines d’application 
5. Types de données 
6. Bibliographie 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 2
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 3
Quelques définitions 
DDDDééééffffiiiinnnniiiittttiiiioooonnnn 1111. Etudes des relations quantitatives de la vie économique faisant appel à l’analyse 
statistique et à la formulation mathématique. 
DDDDééééffffiiiinnnniiiittttiiiioooonnnn 2222.... L'économétrie exprime quantitativement les corrélations pouvant exister entre des 
phénomènes économiques dont la théorie affirme l'existence. La théorie économique fournit 
des idées sur les processus qui déterminent les grandeurs économiques, l'économétrie 
apporte une vérification empirique et établit quantitativement les corrélations qui apparaissent 
valides. 
DDDDééééffffiiiinnnniiiittttiiiioooonnnn 3333. L’objectif de l’économétrie est de confronter un modèle économique à un 
ensemble de données (données de panel, série temporelle, etc.) et ainsi d’en vérifier la validité. 
DDDDééééffffiiiinnnniiiittttiiiioooonnnn 4444. L’économétrie est une branche de l’économie qui traite de l’estimation pratique 
des relations économiques. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 4
Carrefour de 3 disciplines 
Economiste (Expert du domaine) 
Exprime une théorie sur un phénomène économique 
Ex. La demande dépend du prix 
Mathématicien (Modélisation) 
Propose une formulation 
algébrique de la théorie. 
Ex. Demande = a * prix + b 
Statisticien (Estimation) 
Estime les paramètres du 
modèle à partir de données. 
Validation statistique. 
Ex. a = -0.5 ; b = 10 
Sous le contrôle de l’Economiste 
Validation de l’Expert du domaine (ex. a est forcément négatif) 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 5
Notions clés – Modèle Economique 
Un modèle consiste en une présentation formalisée d’un phénomène sous 
forme d’équations mathématiques. 
Comme toutes les variables économiques sont interdépendantes (notion 
de système), il n'est pas suffisant de construire des équations isolées : il 
faut établir un système complet d'équations. 
Exemple : O = 
f ( p) 
) 
p 
( ) 
= 
O D 
D g p 
= + D 
Equations de comportement. 
Identité 
TTTTTTTThhhhhhhhééééééééoooooooorrrrrrrriiiiiiiieeeeeeee ééééééééccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiiqqqqqqqquuuuuuuueeeeeeee 
MMMMMMMMooooooooddddddddéééééééélllllllliiiiiiiissssssssaaaaaaaattttttttiiiiiiiioooooooonnnnnnnn 
((((((((IIIIIIIInnnnnnnnttttttttrrrrrrrroooooooodddddddduuuuuuuuccccccccttttttttiiiiiiiioooooooonnnnnnnn dddddddd’’’’’’’’hhhhhhhhyyyyyyyyppppppppooooooootttttttthhhhhhhhèèèèèèèèsssssssseeeeeeeessssssss 
= ´ + 
D p 
O a p b 
ssssssssiiiiiiiimmmmmmmmpppppppplllllllliiiiiiiiffffffffiiiiiiiiccccccccaaaaaaaattttttttrrrrrrrriiiiiiiicccccccceeeeeeeessssssss ssssssssuuuuuuuurrrrrrrr llllllllaaaaaaaa ffffffffoooooooorrrrrrrrmmmmmmmmeeeeeeee ddddddddeeeeeeee llllllllaaaaaaaa rrrrrrrreeeeeeeellllllllaaaaaaaattttttttiiiiiiiioooooooonnnnnnnn)))))))) =a ´ +b 
Estimation de a, b, @ et A à partir des données disponibles 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 6
Notions clés – Modèle Econométrique 
Faire intervenir l’aléatoire dans l’équation économique. 
Parce que la relation n’est pas déterministe. 
La spécification retenue est une simplification, il est évident qu’il ne résume 
pas toute la teneur de la relation (ex. dans les équations, la relation est 
vraiment linéaire ?) 
Il y a d’autres facteurs dont on ne tient pas compte (ex. le prix des autres de 
biens qui peuvent se substituer au bien étudié) 
Les erreurs de mesure sur les grandeurs étudiées, soit lors du processus de récolte 
des informations, soit tout simplement parce que la donnée récoltée représente peu 
ou prou le concept que l’on veut étudier. 
Introduction IIIIIIInnnnnnntttttttrrrrrrroooooooddddddduuuuuuuccccccctttttttiiiiiiiooooooonnnnnnn dddddddduuuuuuuu ffffffffaaaaaaaacccccccctttttttteeeeeeeeuuuuuuuurrrrrrrr « aaaaaaaallllllllééééééééaaaaaaaattttttttooooooooiiiiiiiirrrrrrrreeeeeeee » 
RRRRRRRRééééééééssssssssuuuuuuuummmmmmmméééééééé ddddddddeeeeeeee ttttttttoooooooouuuuuuuutttttttteeeeeeee llllllll’’’’’’’’iiiiiiiinnnnnnnnffffffffoooooooorrrrrrrrmmmmmmmmaaaaaaaattttttttiiiiiiiioooooooonnnnnnnn nnnnnnnnoooooooonnnnnnnn pppppppprrrrrrrriiiiiiiisssssssseeeeeeee 
e 
O 
= ´ + + 
O a p b 
= ´ + + 
a b e 
D p 
eeeeeeeennnnnnnn ccccccccoooooooommmmmmmmpppppppptttttttteeeeeeee ddddddddaaaaaaaannnnnnnnssssssss lllllllleeeeeeee mmmmmmmmooooooooddddddddèèèèèèèèlllllllleeeeeeee D 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 7
Notions clés – Variable 
Les variables représentent des grandeurs économiques observées ou mesurées. Ex. 
les quantités vendues d’un bien, le prix d’un bien, des taux d’intérêt, le solde d’une 
balance commerciale, le taux de change, etc. 
La variable doit être représentative du phénomène que l’on étudie, de sa qualité 
dépend la validité des résultats obtenus 
 Problèmes d’inadéquation (étudier les ventes de pain, et utiliser 
des données mesurant les ventes de biscottes) 
 Erreur de mesures (problèmes lors du recueil des données ou 
des transmissions des données), d’unités (compter en nombre de 
pain vendu, ou en chiffre d’affaires) 
 Problème de représentativité (mesurer uniquement des ventes 
des boulangeries, et ne pas tenir compte des ventes en grande 
surface) 
PPPPPPPPrrrrrrrroooooooobbbbbbbbllllllllèèèèèèèèmmmmmmmmeeeeeeeessssssss ssssssssuuuuuuuurrrrrrrr lllllllleeeeeeeessssssss 
vvvvvvvvaaaaaaaarrrrrrrriiiiiiiiaaaaaaaabbbbbbbblllllllleeeeeeeessssssss 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 8
Notions clés – Variable aléatoire 
Une variable aléatoire est une grandeur mesurable dont les valeurs 
sont soumises à une certaine dispersion lors de la répétition d’un 
processus donné. 
La dispersion d’une variable aléatoire est régie par une llllooooiiii ddddeeee pppprrrroooobbbbaaaabbbbiiiilllliiiittttéééé . 
Ex. le résultat du jet d’une pièce de monnaie est une variable aléatoire, il 
prend deux valeurs possibles « pile » ou « face », il suit une loi de 
Bernouilli de paramètre p = 0.5. 
Remarque : à chaque phénomène étudié sa loi de probabilité. 
Ex. Durée entre deux phénomènes, nombre d’occurrence d’un 
phénomène dans un laps de temps, nombre d’essais avant d’obtenir un 
résultat, etc. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 9
Notions clés – Types de variables 
Quantitative 
Qualitative nominale 
Qualitative ordinale 
Success Wages Job Refunding 
Y 0 Unemployed Slow 
N 2000 Skilled Worker Slow 
N 1400 Worker Slow 
N 1573 Retired Slow 
Y 2776 Skilled Worker Slow 
N 2439 Retired Fast 
N 862 Office employee Slow 
Y 1400 Salesman Slow 
N 1700 Skilled Worker Slow 
Y 785 Employee Fast 
Y 1274 Worker Slow 
N 960 Employee Fast 
N 1656 Worker Fast 
N 0 Unemployed Slow 
Le critère le plus important pour distinguer les variables est de 
déterminer si l’écart entre deux valeurs a un sens, et qu’elles 
sont comparables deux à deux. 
Ex. Age, Salaires, Satisfaction, Type d’études suivies,… 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 10
Notions clés – Population et échantillon 
La population définit l’ensemble d’individus sur lesquels nous voulons travailler : 
on parle alors de population de référence ou de population parente ou population 
mère (ex. les véhicules vendus en France en 2005, etc.). Tous les résultats 
obtenus sont toujours relatifs à (circonscrites à) une population. 
Les enquêtes exhaustives consiste à observer tous les individus qui composent 
la population. Opération très coûteuse. 
On procède alors à un échantillonnage, on prélève une fraction de la population 
en veillant à ce qu’il soit représentatif de la population c.-à.-d refléter la 
composition et la complexité de la population. 
Le taux de sondage correspond au rapport entre la taille de l’échantillon et la 
taille de la population. 
Attention au mauvais AAAAAAAtttttttttttttteeeeeeennnnnnntttttttiiiiiiiooooooonnnnnnn aaaaaaauuuuuuu mmmmmmmaaaaaaauuuuuuuvvvvvvvaaaaaaaiiiiiiisssssss éééééééécccccccchhhhhhhhaaaaaaaannnnnnnnttttttttiiiiiiiilllllllllllllllloooooooonnnnnnnnnnnnnnnnaaaaaaaaggggggggeeeeeeee........ 
CCCCCCCCoooooooommmmmmmmmmmmmmmmeeeeeeeennnnnnnntttttttt ssssssss’’’’’’’’aaaaaaaassssssssssssssssuuuuuuuurrrrrrrreeeeeeeerrrrrrrr qqqqqqqquuuuuuuueeeeeeee llllllll’’’’’’’’éééééééécccccccchhhhhhhhaaaaaaaannnnnnnnttttttttiiiiiiiilllllllllllllllloooooooonnnnnnnn eeeeeeeesssssssstttttttt rrrrrrrreeeeeeeepppppppprrrrrrrréééééééésssssssseeeeeeeennnnnnnnttttttttaaaaaaaattttttttiiiiiiiiffffffff ???????? 
RRRRRRRRôôôôôôôôlllllllleeeeeeee ddddddddeeeeeeeessssssss vvvvvvvvaaaaaaaarrrrrrrriiiiiiiiaaaaaaaabbbbbbbblllllllleeeeeeeessssssss ddddddddeeeeeeee ccccccccoooooooonnnnnnnnttttttttrrrrrrrrôôôôôôôôlllllllleeeeeeee........ 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 11
Notions clés – Inférence statistique 
Inférence statistique. Elle consiste alors à effectuer des études sur 
l’échantillon et transposer les résultats sur la population. 
Cette transposition n’est pas stricte, elle attache toujours une probabilité 
aux résultats et aux conclusions émises. 
Tirer des conclusions sur l’existence ou non d’un 
phénomène (test d’hypothèses – ex. l’augmentation du prix 
du tabac réduit-t-il vraiment la consommation de 
cigarettes ?) 
Estimer les paramètres d’un phénomène (estimation de 
paramètres – ex. une augmentation de 1 euro du prix du 
paquet de cigarette réduit de combien le nombre de paquets 
vendus ?) 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 12
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 13
Attention : Distinguer ce qui relève de la simple régularité statistique AAAAAAAtttttttttttttteeeeeeennnnnnntttttttiiiiiiiooooooonnnnnnn ::::::: DDDDDDDiiiiiiissssssstttttttiiiiiiinnnnnnnggggggguuuuuuueeeeeeerrrrrrr ccccccceeeeeee qqqqqqquuuuuuuiiiiiii rrrrrrreeeeeeelllllllèèèèèèèvvvvvvveeeeeee dddddddeeeeeee lllllllaaaaaaa sssssssiiiiiiimmmmmmmpppppppllllllleeeeeee rrrrrrréééééééggggggguuuuuuulllllllaaaaaaarrrrrrriiiiiiitttttttééééééé ssssssstttttttaaaaaaatttttttiiiiiiissssssstttttttiiiiiiiqqqqqqquuuuuuueeeeeee ((((((((aaaaaaaarrrrrrrrtttttttteeeeeeeeffffffffaaaaaaaacccccccctttttttt)))))))) 
ddddddddeeeeeeee cccccccceeeeeeee qqqqqqqquuuuuuuuiiiiiiii rrrrrrrreeeeeeeepppppppprrrrrrrréééééééésssssssseeeeeeeennnnnnnntttttttteeeeeeee uuuuuuuunnnnnnnneeeeeeee ccccccccaaaaaaaauuuuuuuussssssssaaaaaaaalllllllliiiiiiiittttttttéééééééé ééééééééccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiiqqqqqqqquuuuuuuueeeeeeee........ 
LLLLLLLLaaaaaaaa tttttttthhhhhhhhééééééééoooooooorrrrrrrriiiiiiiieeeeeeee ééééééééccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiiqqqqqqqquuuuuuuueeeeeeee ((((((((llllllllaaaaaaaa ccccccccoooooooonnnnnnnnnnnnnnnnaaaaaaaaiiiiiiiissssssssssssssssaaaaaaaannnnnnnncccccccceeeeeeee dddddddduuuuuuuu ddddddddoooooooommmmmmmmaaaaaaaaiiiiiiiinnnnnnnneeeeeeee)))))))) eeeeeeeesssssssstttttttt uuuuuuuunnnnnnnn 
ggggggggaaaaaaaarrrrrrrrddddddddeeeeeeee-ffffffffoooooooouuuuuuuu iiiiiiiinnnnnnnnddddddddiiiiiiiissssssssppppppppeeeeeeeennnnnnnnssssssssaaaaaaaabbbbbbbblllllllleeeeeeee........ 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 14
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 15
Source: CRISP-DM 1.0, Step-by-step Data Mining Guide, SPSS Publication 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 16
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 17
Analyse de régression – Schéma de régression 
= ( , , , ) +e 1 2 p Modèle à une équation : Y f X X K X 
Prédiction / Explication : Prédire/expliquer les valeurs de Y à partir des valeurs de 
X1, X2, …, Xp. 
Y est dite « variable endogène », c’est la variable donc on essaie de prédire les 
valeurs (variable à prédire, variable dépendante, expliquée) ; 
X1…Xp sont les « variables exogènes », ce sont les variables qui servent à prédire 
les valeurs de Y (variables prédictives, variables indépendantes, explicatives). 
Les valeurs des X sont donc connues (ou mesurées rapidement, facilement), elles 
servent à prédire les valeurs des Y qui sont inconnues (ou connues avec retard). 
Ex 1. Prédire les ventes nationales de pain sur l’année (connu uniquement à la fin de l’année) à 
partir de son prix (connu instantanément). 
Ex 2. Expliquer la consommation des pays européens à partir du revenu et du taux de chômage. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 18
Régression linéaire multiple 
Le modèle parfait n’existe pas. On procède très souvent à une simplification 
supplémentaire en considérant que la liaison est linéaire, ou encore on procède à 
des transformations (de variables) de manière à se ramener à combinaison linéaire 
des variables exogènes. 
 Il faut pouvoir estimer les paramètres, il faut pouvoir les interpréter !!! 
= + + + + +e p p Y a a X a X K a X 
0 1 1 2 2 
Y quantitative (forcément). 
X quantitative ou qualitative 
recodée (0/1). 
O est le terme d’erreur. C’est une 
variable aléatoire. Elle résume tout 
ce que le modèle n’explique pas. 
X est supposé non aléatoire. 
Y est aléatoire à cause de O. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 19
Linéarité par rapport aux paramètres 
Y = a 0 + a 1 ln(X 1 ) + a X + a X 2 
C’est un modèle linéaire. 
2 1 3 1 Cf. Transformation de variables. 
X 
+ 
a a 
= 0 1 1 
Ce n’est pas un modèle linéaire. 
X 
+ 
0 1 2 
Y 
b b 
= ´ 
Y b eaX 
= + 
ln( ) ln( ) 
Y b aX 
Linéaire après transformation. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 20
Evaluation de la régression linéaire 
Quel est le pouvoir explicatif du modèle ? Est-ce la liaison découverte entre Y et 
les X est significative ? (c.-à-d. transposable dans la population et non pas propre 
à l’échantillon observé) 
Quel est l’apport marginal de chaque variable X dans l’explication des valeurs de 
Y ? (c.-à-d. un paramètre est-il significativement différent de 0 ?) 
Quelle sont les propriétés (notamment la précision) des paramètres « a » 
obtenus ? (biais, variance) 
Quelle sera la qualité de la prédiction des valeurs de Y à partir des valeurs de X ? 
(intervalle de prédiction, fourchettes) 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 21
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 22
Usage de la régression linéaire 
L’explication. Comprendre la nature des liaisons entre les variables. On 
parle également d’analyse aaannnaaalllyyyssseee ssssttttrrrruuuuccccttttuuuurrrreeeelllllllleeee. 
Outil privilégié pour valider les théories émises par les économistes. 
Ex. consommation = a * revenu + b : b  0 , c’est la consommation incompressible, a est positif et 
sûrement inférieur à 1, [1-a] correspond alors au taux d’épargne des ménages) 
La prédiction. Premier usage opérationnel de la régression. Pour 
l’anticipation et la prise de décision. 
Ex. La consommation des ménages va augmenter l’année prochaine ? 
La simulation et la définition des politiques économiques. Second usage 
opérationnel de la régression. Permet de définir (1) les bonnes politiques 
économiques et (2) d’en mesurer à l’avance les conséquences. 
Ex. Fixer la bonne valeur de la « prime à la casse ». 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 23
Autres domaines d’application 
Tous les domaines où on essaie de détecter des relations de causalité 
EEEEEEEEccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiisssssssstttttttteeeeeeee ÛEEEEEEEExxxxxxxxppppppppeeeeeeeerrrrrrrrtttttttt dddddddduuuuuuuu ddddddddoooooooommmmmmmmaaaaaaaaiiiiiiiinnnnnnnneeeeeeee 
Marketing. Evaluer le budget publicitaire nécessaire à une augmentation 
significative des ventes. 
Sociologie. Prédire le niveau des notes des étudiants à partir de leur âge ou du 
nombre de redoublements. Expliquer le niveau d’études atteint par les étudiants 
à partir de la profession et des revenus des parents… 
Agriculture. Evaluer les rendements des parcelles de terrains à partir de la 
quantité d’engrais utilisés ou du nombre de jours de pluie dans l’année. 
Ecologie. Estimer la mortalité des poissons à partir de la quantité de résidus 
rejetés par les usines dans les cours d’eau. 
Santé. Evaluer l’influence des compléments alimentaires sur la fréquence des 
maladies cardio-vasculaires (cf. par exemple les oméga 3 et les maladies cardio-vasculaires). 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 24
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 25
Recueil des données 
Problème récurrent : le manque de données pertinentes. 
Ex. Analyse des processus de blanchiment d’argent 
Données brutes vs. données corrigés normalisées 
Données brutes : recueillies directement sur le terrain, très bonne qualité si précautions de recueil prises. 
Données corrigées (institut de sondages) : + normalisation des définitions ; - déjà manipulées et 
corrigées, attention. 
Données expérimentales vs. données non-expérimentales 
Données expérimentales : contrôlées dans une expérimentation (ex. doses de médicaments pour un 
cobaye). 
Données non expérimentales : directement observées. 
X peut être expérimental ; Y est toujours observé. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 26
Données transversales, longitudinales, de panel 
Parcelle 
Rendement 
(quintal) 
Engrais 
(kilo) 
A 16 20 
B 18 24 
C 23 28 
D 24 22 
E 28 32 
F 29 28 
G 26 32 
H 31 36 
I 32 41 
J 34 41 
Coupes transversales 
Ligne = individu 
Ex. Personne, véhicule, client, parcelle de 
terrain, etc. 
Données temporelles (longitudinales) 
Ligne = date 
« Stock », définie sur une date 
« Flux » définie sur une période 
Stock  Flux facile (ex. somme, moyenne) 
Flux  Stock pas évident (Mars = 5000 euros de CA, 
comment définir la valeur pour la date du 15 mars ?) 
Mois CA (K-euros) Prospectus distribués 
janv-04 1250 156 
févr-04 1456 178 
mars-04 4863 293 
Données de panel 
Faire des coupes transversales sur plusieurs dates. 
Si on observe spécifiquement les mêmes individus, on 
parle de « cohorte ». 
Ex. Recueillir les ventes d’un 
échantillon de concessionnaires. 
Renouveler l’opération sur plusieurs 
mois. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 27
Bibliographique 
http://eric.univ-lyon2.fr/~ricco/cours/cours_econometrie.html 
Régis BOURBONNAIS, « Econométrie – Manuel et exercices corrigés », Dunod, 1998. 
Y.Dodge, V.Rousson, « Analyse de régression appliquée », Dunod, 2004. 
M. Tenenhaus, « Statistique : Méthodes pour décrire, expliquer et prévoir », Dunod, 
2007. 
René GIRAUD, Nicole CHAIX, « Econométrie », PUF, 1994. (il existe une version QSJ, 
plus accessible) 
Jack JOHNSTON, John DINARDO, « Méthodes économétriques », ECONOMICA, 1997. 
Équipe de recherche en Ingénierie des Connaissances 
Laboratoire ERIC 28

Contenu connexe

Tendances

5.2 Régression linéaire
5.2 Régression linéaire5.2 Régression linéaire
5.2 Régression linéaireBoris Guarisma
 
Regression lineaire simple
Regression lineaire simpleRegression lineaire simple
Regression lineaire simpleMehdi Rajawi
 
Cours complet macroéconomie
Cours complet macroéconomie Cours complet macroéconomie
Cours complet macroéconomie Mejdoubi Amal
 
Budgetisation des ventes
Budgetisation des ventesBudgetisation des ventes
Budgetisation des ventesmarrakech108
 
Principes de l’intelligence économique
Principes de l’intelligence économiquePrincipes de l’intelligence économique
Principes de l’intelligence économiqueBAHLOUL LOTFI
 
Donnees de panel
Donnees de panelDonnees de panel
Donnees de panelzizou36
 
regression_logistique.pdf
regression_logistique.pdfregression_logistique.pdf
regression_logistique.pdfSidiAbdallah1
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfAnassFarkadi
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et RAB IR
 
cour complet de microeconomie
cour complet de microeconomiecour complet de microeconomie
cour complet de microeconomieJamal Yasser
 
Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul Professeur Falloul
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée Adad Med Chérif
 
les processus VAR et SVAR
les processus VAR et SVAR  les processus VAR et SVAR
les processus VAR et SVAR Anissa ATMANI
 
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Adad Med Chérif
 

Tendances (20)

5.2 Régression linéaire
5.2 Régression linéaire5.2 Régression linéaire
5.2 Régression linéaire
 
Regression lineaire simple
Regression lineaire simpleRegression lineaire simple
Regression lineaire simple
 
Cours complet macroéconomie
Cours complet macroéconomie Cours complet macroéconomie
Cours complet macroéconomie
 
Budgetisation des ventes
Budgetisation des ventesBudgetisation des ventes
Budgetisation des ventes
 
Series temporelles
Series temporellesSeries temporelles
Series temporelles
 
Moyenne mobile
Moyenne mobile Moyenne mobile
Moyenne mobile
 
Principes de l’intelligence économique
Principes de l’intelligence économiquePrincipes de l’intelligence économique
Principes de l’intelligence économique
 
Donnees de panel
Donnees de panelDonnees de panel
Donnees de panel
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
regression_logistique.pdf
regression_logistique.pdfregression_logistique.pdf
regression_logistique.pdf
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et R
 
cour complet de microeconomie
cour complet de microeconomiecour complet de microeconomie
cour complet de microeconomie
 
Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée
 
LISSAGE EXPONENTIEL.pdf
LISSAGE EXPONENTIEL.pdfLISSAGE EXPONENTIEL.pdf
LISSAGE EXPONENTIEL.pdf
 
les processus VAR et SVAR
les processus VAR et SVAR  les processus VAR et SVAR
les processus VAR et SVAR
 
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
 

En vedette

Bourbonnais econométrie partie 1
Bourbonnais econométrie partie 1Bourbonnais econométrie partie 1
Bourbonnais econométrie partie 1scofield812
 
Interaction
InteractionInteraction
Interactionkimo063
 
Projet de fin d'etude ikrame final
Projet de fin d'etude ikrame finalProjet de fin d'etude ikrame final
Projet de fin d'etude ikrame finalWadiaa Piczo
 
Cours commerce internationale
Cours commerce internationaleCours commerce internationale
Cours commerce internationalebrahim halmaoui
 
Gestion budgétaire
Gestion budgétaire Gestion budgétaire
Gestion budgétaire hassan1488
 
La pratique du contrôle de gestion
La pratique du contrôle de gestionLa pratique du contrôle de gestion
La pratique du contrôle de gestionOULAAJEB YOUSSEF
 
Le Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’EntrepriseLe Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’Entrepriseclaude wastiaux
 
S6 eco
S6 ecoS6 eco
S6 ecomfrwah
 
Master Audio MD4 soundsystem
Master Audio MD4 soundsystemMaster Audio MD4 soundsystem
Master Audio MD4 soundsystemguestfb04
 
Solo tiene mujer quien puede
Solo tiene mujer quien puedeSolo tiene mujer quien puede
Solo tiene mujer quien puedetakis22
 
Figaronron - Journée à Trèves 03 (30-11-2008)
Figaronron - Journée à Trèves 03 (30-11-2008)Figaronron - Journée à Trèves 03 (30-11-2008)
Figaronron - Journée à Trèves 03 (30-11-2008)Figaronron Figaronron
 
Social CRM: Neukunden an Land ziehen - und auch behalten
Social CRM: Neukunden an Land ziehen - und auch behaltenSocial CRM: Neukunden an Land ziehen - und auch behalten
Social CRM: Neukunden an Land ziehen - und auch behaltenINM AG
 
Cartographie Interactive
Cartographie Interactive Cartographie Interactive
Cartographie Interactive sly
 
Depression Estudiantine - Pr. Asri & Pr. BENALI
Depression Estudiantine - Pr. Asri & Pr. BENALI Depression Estudiantine - Pr. Asri & Pr. BENALI
Depression Estudiantine - Pr. Asri & Pr. BENALI MedecIN-Casa
 

En vedette (20)

Econométrie par : www.lfaculte.com
Econométrie par : www.lfaculte.comEconométrie par : www.lfaculte.com
Econométrie par : www.lfaculte.com
 
Bourbonnais econométrie partie 1
Bourbonnais econométrie partie 1Bourbonnais econométrie partie 1
Bourbonnais econométrie partie 1
 
Correlation econometrie
Correlation econometrieCorrelation econometrie
Correlation econometrie
 
01 introduction
01 introduction01 introduction
01 introduction
 
Interaction
InteractionInteraction
Interaction
 
Projet de fin d'etude ikrame final
Projet de fin d'etude ikrame finalProjet de fin d'etude ikrame final
Projet de fin d'etude ikrame final
 
Cours commerce internationale
Cours commerce internationaleCours commerce internationale
Cours commerce internationale
 
Gestion budgétaire
Gestion budgétaire Gestion budgétaire
Gestion budgétaire
 
La pratique du contrôle de gestion
La pratique du contrôle de gestionLa pratique du contrôle de gestion
La pratique du contrôle de gestion
 
Le Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’EntrepriseLe Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’Entreprise
 
Ch02 seance01-diapos
Ch02 seance01-diaposCh02 seance01-diapos
Ch02 seance01-diapos
 
S6 eco
S6 ecoS6 eco
S6 eco
 
Contrôle de gestion
Contrôle de gestionContrôle de gestion
Contrôle de gestion
 
Master Audio MD4 soundsystem
Master Audio MD4 soundsystemMaster Audio MD4 soundsystem
Master Audio MD4 soundsystem
 
Solo tiene mujer quien puede
Solo tiene mujer quien puedeSolo tiene mujer quien puede
Solo tiene mujer quien puede
 
Figaronron - Journée à Trèves 03 (30-11-2008)
Figaronron - Journée à Trèves 03 (30-11-2008)Figaronron - Journée à Trèves 03 (30-11-2008)
Figaronron - Journée à Trèves 03 (30-11-2008)
 
Social CRM: Neukunden an Land ziehen - und auch behalten
Social CRM: Neukunden an Land ziehen - und auch behaltenSocial CRM: Neukunden an Land ziehen - und auch behalten
Social CRM: Neukunden an Land ziehen - und auch behalten
 
Cartographie Interactive
Cartographie Interactive Cartographie Interactive
Cartographie Interactive
 
Antioquia abejorral
Antioquia abejorralAntioquia abejorral
Antioquia abejorral
 
Depression Estudiantine - Pr. Asri & Pr. BENALI
Depression Estudiantine - Pr. Asri & Pr. BENALI Depression Estudiantine - Pr. Asri & Pr. BENALI
Depression Estudiantine - Pr. Asri & Pr. BENALI
 

Similaire à Generalites econometrie

Calculs tc2015
Calculs tc2015Calculs tc2015
Calculs tc2015szarzynski
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016ibtissam el hassani
 
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...MohamedAmineHACHICHA1
 
La programmation par contraintes avec Choco3 (Java)
La programmation par contraintes avec Choco3 (Java)La programmation par contraintes avec Choco3 (Java)
La programmation par contraintes avec Choco3 (Java)Aline Figoureux
 
Présentation Conjoncture économique et fan chart par M.CORNEC
Présentation Conjoncture économique et fan chart par M.CORNEC Présentation Conjoncture économique et fan chart par M.CORNEC
Présentation Conjoncture économique et fan chart par M.CORNEC Cdiscount
 
cours_statistiques_master.pdf
cours_statistiques_master.pdfcours_statistiques_master.pdf
cours_statistiques_master.pdfArkadaar
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisionsJean-Michel POU
 
Recherche Opérationnelle - Optimisation (notions de base)
Recherche Opérationnelle - Optimisation (notions de base)Recherche Opérationnelle - Optimisation (notions de base)
Recherche Opérationnelle - Optimisation (notions de base)Mohammed TAMALI
 
Présentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdfPrésentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdfVIA INNO
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaXL Formation
 
Chapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptxChapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptxdalaamaima
 
Statistiques ofppt
Statistiques ofpptStatistiques ofppt
Statistiques ofpptkhawla atir
 
Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01ilhamto katosa
 
Retour d'expérience - Credit.fr
Retour d'expérience - Credit.frRetour d'expérience - Credit.fr
Retour d'expérience - Credit.frAltares D&B
 
Jeu lean construction management
Jeu lean construction managementJeu lean construction management
Jeu lean construction managementCIPE
 
Genopole 1998-2025 premier biocluster français Recherche et biotechnologies
Genopole 1998-2025 premier biocluster français Recherche et biotechnologiesGenopole 1998-2025 premier biocluster français Recherche et biotechnologies
Genopole 1998-2025 premier biocluster français Recherche et biotechnologiesGenopole
 

Similaire à Generalites econometrie (20)

Calculs tc2015
Calculs tc2015Calculs tc2015
Calculs tc2015
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
 
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
 
La programmation par contraintes avec Choco3 (Java)
La programmation par contraintes avec Choco3 (Java)La programmation par contraintes avec Choco3 (Java)
La programmation par contraintes avec Choco3 (Java)
 
Présentation Conjoncture économique et fan chart par M.CORNEC
Présentation Conjoncture économique et fan chart par M.CORNEC Présentation Conjoncture économique et fan chart par M.CORNEC
Présentation Conjoncture économique et fan chart par M.CORNEC
 
cours_statistiques_master.pdf
cours_statistiques_master.pdfcours_statistiques_master.pdf
cours_statistiques_master.pdf
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisions
 
Recherche Opérationnelle - Optimisation (notions de base)
Recherche Opérationnelle - Optimisation (notions de base)Recherche Opérationnelle - Optimisation (notions de base)
Recherche Opérationnelle - Optimisation (notions de base)
 
Présentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdfPrésentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdf
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 Sigma
 
#UX - Flup 12 novembre
#UX - Flup 12 novembre#UX - Flup 12 novembre
#UX - Flup 12 novembre
 
Cours masterlyon
Cours masterlyonCours masterlyon
Cours masterlyon
 
Chapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptxChapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptx
 
Statistiques ofppt
Statistiques ofpptStatistiques ofppt
Statistiques ofppt
 
Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01
 
Retour d'expérience - Credit.fr
Retour d'expérience - Credit.frRetour d'expérience - Credit.fr
Retour d'expérience - Credit.fr
 
Jeu lean construction management
Jeu lean construction managementJeu lean construction management
Jeu lean construction management
 
6 sigma -chapitre4 : Analyser
6 sigma -chapitre4 : Analyser6 sigma -chapitre4 : Analyser
6 sigma -chapitre4 : Analyser
 
Genopole 1998-2025 premier biocluster français Recherche et biotechnologies
Genopole 1998-2025 premier biocluster français Recherche et biotechnologiesGenopole 1998-2025 premier biocluster français Recherche et biotechnologies
Genopole 1998-2025 premier biocluster français Recherche et biotechnologies
 
Flexi
FlexiFlexi
Flexi
 

Generalites econometrie

  • 1. Ricco Rakotomalala Ricco.Rakotomalala@univ-lyon2.fr Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 1
  • 2. PLAN 1. Econométrie : Origine(s), définition(s) et objectif(s) 2. La démarche économétrique 3. Analyse de régression – L’hypothèse de linéarité 4. Domaines d’application 5. Types de données 6. Bibliographie Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 2
  • 3. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 3
  • 4. Quelques définitions DDDDééééffffiiiinnnniiiittttiiiioooonnnn 1111. Etudes des relations quantitatives de la vie économique faisant appel à l’analyse statistique et à la formulation mathématique. DDDDééééffffiiiinnnniiiittttiiiioooonnnn 2222.... L'économétrie exprime quantitativement les corrélations pouvant exister entre des phénomènes économiques dont la théorie affirme l'existence. La théorie économique fournit des idées sur les processus qui déterminent les grandeurs économiques, l'économétrie apporte une vérification empirique et établit quantitativement les corrélations qui apparaissent valides. DDDDééééffffiiiinnnniiiittttiiiioooonnnn 3333. L’objectif de l’économétrie est de confronter un modèle économique à un ensemble de données (données de panel, série temporelle, etc.) et ainsi d’en vérifier la validité. DDDDééééffffiiiinnnniiiittttiiiioooonnnn 4444. L’économétrie est une branche de l’économie qui traite de l’estimation pratique des relations économiques. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 4
  • 5. Carrefour de 3 disciplines Economiste (Expert du domaine) Exprime une théorie sur un phénomène économique Ex. La demande dépend du prix Mathématicien (Modélisation) Propose une formulation algébrique de la théorie. Ex. Demande = a * prix + b Statisticien (Estimation) Estime les paramètres du modèle à partir de données. Validation statistique. Ex. a = -0.5 ; b = 10 Sous le contrôle de l’Economiste Validation de l’Expert du domaine (ex. a est forcément négatif) Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 5
  • 6. Notions clés – Modèle Economique Un modèle consiste en une présentation formalisée d’un phénomène sous forme d’équations mathématiques. Comme toutes les variables économiques sont interdépendantes (notion de système), il n'est pas suffisant de construire des équations isolées : il faut établir un système complet d'équations. Exemple : O = f ( p) ) p ( ) = O D D g p = + D Equations de comportement. Identité TTTTTTTThhhhhhhhééééééééoooooooorrrrrrrriiiiiiiieeeeeeee ééééééééccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiiqqqqqqqquuuuuuuueeeeeeee MMMMMMMMooooooooddddddddéééééééélllllllliiiiiiiissssssssaaaaaaaattttttttiiiiiiiioooooooonnnnnnnn ((((((((IIIIIIIInnnnnnnnttttttttrrrrrrrroooooooodddddddduuuuuuuuccccccccttttttttiiiiiiiioooooooonnnnnnnn dddddddd’’’’’’’’hhhhhhhhyyyyyyyyppppppppooooooootttttttthhhhhhhhèèèèèèèèsssssssseeeeeeeessssssss = ´ + D p O a p b ssssssssiiiiiiiimmmmmmmmpppppppplllllllliiiiiiiiffffffffiiiiiiiiccccccccaaaaaaaattttttttrrrrrrrriiiiiiiicccccccceeeeeeeessssssss ssssssssuuuuuuuurrrrrrrr llllllllaaaaaaaa ffffffffoooooooorrrrrrrrmmmmmmmmeeeeeeee ddddddddeeeeeeee llllllllaaaaaaaa rrrrrrrreeeeeeeellllllllaaaaaaaattttttttiiiiiiiioooooooonnnnnnnn)))))))) =a ´ +b Estimation de a, b, @ et A à partir des données disponibles Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 6
  • 7. Notions clés – Modèle Econométrique Faire intervenir l’aléatoire dans l’équation économique. Parce que la relation n’est pas déterministe. La spécification retenue est une simplification, il est évident qu’il ne résume pas toute la teneur de la relation (ex. dans les équations, la relation est vraiment linéaire ?) Il y a d’autres facteurs dont on ne tient pas compte (ex. le prix des autres de biens qui peuvent se substituer au bien étudié) Les erreurs de mesure sur les grandeurs étudiées, soit lors du processus de récolte des informations, soit tout simplement parce que la donnée récoltée représente peu ou prou le concept que l’on veut étudier. Introduction IIIIIIInnnnnnntttttttrrrrrrroooooooddddddduuuuuuuccccccctttttttiiiiiiiooooooonnnnnnn dddddddduuuuuuuu ffffffffaaaaaaaacccccccctttttttteeeeeeeeuuuuuuuurrrrrrrr « aaaaaaaallllllllééééééééaaaaaaaattttttttooooooooiiiiiiiirrrrrrrreeeeeeee » RRRRRRRRééééééééssssssssuuuuuuuummmmmmmméééééééé ddddddddeeeeeeee ttttttttoooooooouuuuuuuutttttttteeeeeeee llllllll’’’’’’’’iiiiiiiinnnnnnnnffffffffoooooooorrrrrrrrmmmmmmmmaaaaaaaattttttttiiiiiiiioooooooonnnnnnnn nnnnnnnnoooooooonnnnnnnn pppppppprrrrrrrriiiiiiiisssssssseeeeeeee e O = ´ + + O a p b = ´ + + a b e D p eeeeeeeennnnnnnn ccccccccoooooooommmmmmmmpppppppptttttttteeeeeeee ddddddddaaaaaaaannnnnnnnssssssss lllllllleeeeeeee mmmmmmmmooooooooddddddddèèèèèèèèlllllllleeeeeeee D Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 7
  • 8. Notions clés – Variable Les variables représentent des grandeurs économiques observées ou mesurées. Ex. les quantités vendues d’un bien, le prix d’un bien, des taux d’intérêt, le solde d’une balance commerciale, le taux de change, etc. La variable doit être représentative du phénomène que l’on étudie, de sa qualité dépend la validité des résultats obtenus Problèmes d’inadéquation (étudier les ventes de pain, et utiliser des données mesurant les ventes de biscottes) Erreur de mesures (problèmes lors du recueil des données ou des transmissions des données), d’unités (compter en nombre de pain vendu, ou en chiffre d’affaires) Problème de représentativité (mesurer uniquement des ventes des boulangeries, et ne pas tenir compte des ventes en grande surface) PPPPPPPPrrrrrrrroooooooobbbbbbbbllllllllèèèèèèèèmmmmmmmmeeeeeeeessssssss ssssssssuuuuuuuurrrrrrrr lllllllleeeeeeeessssssss vvvvvvvvaaaaaaaarrrrrrrriiiiiiiiaaaaaaaabbbbbbbblllllllleeeeeeeessssssss Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 8
  • 9. Notions clés – Variable aléatoire Une variable aléatoire est une grandeur mesurable dont les valeurs sont soumises à une certaine dispersion lors de la répétition d’un processus donné. La dispersion d’une variable aléatoire est régie par une llllooooiiii ddddeeee pppprrrroooobbbbaaaabbbbiiiilllliiiittttéééé . Ex. le résultat du jet d’une pièce de monnaie est une variable aléatoire, il prend deux valeurs possibles « pile » ou « face », il suit une loi de Bernouilli de paramètre p = 0.5. Remarque : à chaque phénomène étudié sa loi de probabilité. Ex. Durée entre deux phénomènes, nombre d’occurrence d’un phénomène dans un laps de temps, nombre d’essais avant d’obtenir un résultat, etc. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 9
  • 10. Notions clés – Types de variables Quantitative Qualitative nominale Qualitative ordinale Success Wages Job Refunding Y 0 Unemployed Slow N 2000 Skilled Worker Slow N 1400 Worker Slow N 1573 Retired Slow Y 2776 Skilled Worker Slow N 2439 Retired Fast N 862 Office employee Slow Y 1400 Salesman Slow N 1700 Skilled Worker Slow Y 785 Employee Fast Y 1274 Worker Slow N 960 Employee Fast N 1656 Worker Fast N 0 Unemployed Slow Le critère le plus important pour distinguer les variables est de déterminer si l’écart entre deux valeurs a un sens, et qu’elles sont comparables deux à deux. Ex. Age, Salaires, Satisfaction, Type d’études suivies,… Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 10
  • 11. Notions clés – Population et échantillon La population définit l’ensemble d’individus sur lesquels nous voulons travailler : on parle alors de population de référence ou de population parente ou population mère (ex. les véhicules vendus en France en 2005, etc.). Tous les résultats obtenus sont toujours relatifs à (circonscrites à) une population. Les enquêtes exhaustives consiste à observer tous les individus qui composent la population. Opération très coûteuse. On procède alors à un échantillonnage, on prélève une fraction de la population en veillant à ce qu’il soit représentatif de la population c.-à.-d refléter la composition et la complexité de la population. Le taux de sondage correspond au rapport entre la taille de l’échantillon et la taille de la population. Attention au mauvais AAAAAAAtttttttttttttteeeeeeennnnnnntttttttiiiiiiiooooooonnnnnnn aaaaaaauuuuuuu mmmmmmmaaaaaaauuuuuuuvvvvvvvaaaaaaaiiiiiiisssssss éééééééécccccccchhhhhhhhaaaaaaaannnnnnnnttttttttiiiiiiiilllllllllllllllloooooooonnnnnnnnnnnnnnnnaaaaaaaaggggggggeeeeeeee........ CCCCCCCCoooooooommmmmmmmmmmmmmmmeeeeeeeennnnnnnntttttttt ssssssss’’’’’’’’aaaaaaaassssssssssssssssuuuuuuuurrrrrrrreeeeeeeerrrrrrrr qqqqqqqquuuuuuuueeeeeeee llllllll’’’’’’’’éééééééécccccccchhhhhhhhaaaaaaaannnnnnnnttttttttiiiiiiiilllllllllllllllloooooooonnnnnnnn eeeeeeeesssssssstttttttt rrrrrrrreeeeeeeepppppppprrrrrrrréééééééésssssssseeeeeeeennnnnnnnttttttttaaaaaaaattttttttiiiiiiiiffffffff ???????? RRRRRRRRôôôôôôôôlllllllleeeeeeee ddddddddeeeeeeeessssssss vvvvvvvvaaaaaaaarrrrrrrriiiiiiiiaaaaaaaabbbbbbbblllllllleeeeeeeessssssss ddddddddeeeeeeee ccccccccoooooooonnnnnnnnttttttttrrrrrrrrôôôôôôôôlllllllleeeeeeee........ Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 11
  • 12. Notions clés – Inférence statistique Inférence statistique. Elle consiste alors à effectuer des études sur l’échantillon et transposer les résultats sur la population. Cette transposition n’est pas stricte, elle attache toujours une probabilité aux résultats et aux conclusions émises. Tirer des conclusions sur l’existence ou non d’un phénomène (test d’hypothèses – ex. l’augmentation du prix du tabac réduit-t-il vraiment la consommation de cigarettes ?) Estimer les paramètres d’un phénomène (estimation de paramètres – ex. une augmentation de 1 euro du prix du paquet de cigarette réduit de combien le nombre de paquets vendus ?) Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 12
  • 13. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 13
  • 14. Attention : Distinguer ce qui relève de la simple régularité statistique AAAAAAAtttttttttttttteeeeeeennnnnnntttttttiiiiiiiooooooonnnnnnn ::::::: DDDDDDDiiiiiiissssssstttttttiiiiiiinnnnnnnggggggguuuuuuueeeeeeerrrrrrr ccccccceeeeeee qqqqqqquuuuuuuiiiiiii rrrrrrreeeeeeelllllllèèèèèèèvvvvvvveeeeeee dddddddeeeeeee lllllllaaaaaaa sssssssiiiiiiimmmmmmmpppppppllllllleeeeeee rrrrrrréééééééggggggguuuuuuulllllllaaaaaaarrrrrrriiiiiiitttttttééééééé ssssssstttttttaaaaaaatttttttiiiiiiissssssstttttttiiiiiiiqqqqqqquuuuuuueeeeeee ((((((((aaaaaaaarrrrrrrrtttttttteeeeeeeeffffffffaaaaaaaacccccccctttttttt)))))))) ddddddddeeeeeeee cccccccceeeeeeee qqqqqqqquuuuuuuuiiiiiiii rrrrrrrreeeeeeeepppppppprrrrrrrréééééééésssssssseeeeeeeennnnnnnntttttttteeeeeeee uuuuuuuunnnnnnnneeeeeeee ccccccccaaaaaaaauuuuuuuussssssssaaaaaaaalllllllliiiiiiiittttttttéééééééé ééééééééccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiiqqqqqqqquuuuuuuueeeeeeee........ LLLLLLLLaaaaaaaa tttttttthhhhhhhhééééééééoooooooorrrrrrrriiiiiiiieeeeeeee ééééééééccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiiqqqqqqqquuuuuuuueeeeeeee ((((((((llllllllaaaaaaaa ccccccccoooooooonnnnnnnnnnnnnnnnaaaaaaaaiiiiiiiissssssssssssssssaaaaaaaannnnnnnncccccccceeeeeeee dddddddduuuuuuuu ddddddddoooooooommmmmmmmaaaaaaaaiiiiiiiinnnnnnnneeeeeeee)))))))) eeeeeeeesssssssstttttttt uuuuuuuunnnnnnnn ggggggggaaaaaaaarrrrrrrrddddddddeeeeeeee-ffffffffoooooooouuuuuuuu iiiiiiiinnnnnnnnddddddddiiiiiiiissssssssppppppppeeeeeeeennnnnnnnssssssssaaaaaaaabbbbbbbblllllllleeeeeeee........ Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 14
  • 15. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 15
  • 16. Source: CRISP-DM 1.0, Step-by-step Data Mining Guide, SPSS Publication Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 16
  • 17. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 17
  • 18. Analyse de régression – Schéma de régression = ( , , , ) +e 1 2 p Modèle à une équation : Y f X X K X Prédiction / Explication : Prédire/expliquer les valeurs de Y à partir des valeurs de X1, X2, …, Xp. Y est dite « variable endogène », c’est la variable donc on essaie de prédire les valeurs (variable à prédire, variable dépendante, expliquée) ; X1…Xp sont les « variables exogènes », ce sont les variables qui servent à prédire les valeurs de Y (variables prédictives, variables indépendantes, explicatives). Les valeurs des X sont donc connues (ou mesurées rapidement, facilement), elles servent à prédire les valeurs des Y qui sont inconnues (ou connues avec retard). Ex 1. Prédire les ventes nationales de pain sur l’année (connu uniquement à la fin de l’année) à partir de son prix (connu instantanément). Ex 2. Expliquer la consommation des pays européens à partir du revenu et du taux de chômage. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 18
  • 19. Régression linéaire multiple Le modèle parfait n’existe pas. On procède très souvent à une simplification supplémentaire en considérant que la liaison est linéaire, ou encore on procède à des transformations (de variables) de manière à se ramener à combinaison linéaire des variables exogènes. Il faut pouvoir estimer les paramètres, il faut pouvoir les interpréter !!! = + + + + +e p p Y a a X a X K a X 0 1 1 2 2 Y quantitative (forcément). X quantitative ou qualitative recodée (0/1). O est le terme d’erreur. C’est une variable aléatoire. Elle résume tout ce que le modèle n’explique pas. X est supposé non aléatoire. Y est aléatoire à cause de O. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 19
  • 20. Linéarité par rapport aux paramètres Y = a 0 + a 1 ln(X 1 ) + a X + a X 2 C’est un modèle linéaire. 2 1 3 1 Cf. Transformation de variables. X + a a = 0 1 1 Ce n’est pas un modèle linéaire. X + 0 1 2 Y b b = ´ Y b eaX = + ln( ) ln( ) Y b aX Linéaire après transformation. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 20
  • 21. Evaluation de la régression linéaire Quel est le pouvoir explicatif du modèle ? Est-ce la liaison découverte entre Y et les X est significative ? (c.-à-d. transposable dans la population et non pas propre à l’échantillon observé) Quel est l’apport marginal de chaque variable X dans l’explication des valeurs de Y ? (c.-à-d. un paramètre est-il significativement différent de 0 ?) Quelle sont les propriétés (notamment la précision) des paramètres « a » obtenus ? (biais, variance) Quelle sera la qualité de la prédiction des valeurs de Y à partir des valeurs de X ? (intervalle de prédiction, fourchettes) Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 21
  • 22. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 22
  • 23. Usage de la régression linéaire L’explication. Comprendre la nature des liaisons entre les variables. On parle également d’analyse aaannnaaalllyyyssseee ssssttttrrrruuuuccccttttuuuurrrreeeelllllllleeee. Outil privilégié pour valider les théories émises par les économistes. Ex. consommation = a * revenu + b : b 0 , c’est la consommation incompressible, a est positif et sûrement inférieur à 1, [1-a] correspond alors au taux d’épargne des ménages) La prédiction. Premier usage opérationnel de la régression. Pour l’anticipation et la prise de décision. Ex. La consommation des ménages va augmenter l’année prochaine ? La simulation et la définition des politiques économiques. Second usage opérationnel de la régression. Permet de définir (1) les bonnes politiques économiques et (2) d’en mesurer à l’avance les conséquences. Ex. Fixer la bonne valeur de la « prime à la casse ». Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 23
  • 24. Autres domaines d’application Tous les domaines où on essaie de détecter des relations de causalité EEEEEEEEccccccccoooooooonnnnnnnnoooooooommmmmmmmiiiiiiiisssssssstttttttteeeeeeee ÛEEEEEEEExxxxxxxxppppppppeeeeeeeerrrrrrrrtttttttt dddddddduuuuuuuu ddddddddoooooooommmmmmmmaaaaaaaaiiiiiiiinnnnnnnneeeeeeee Marketing. Evaluer le budget publicitaire nécessaire à une augmentation significative des ventes. Sociologie. Prédire le niveau des notes des étudiants à partir de leur âge ou du nombre de redoublements. Expliquer le niveau d’études atteint par les étudiants à partir de la profession et des revenus des parents… Agriculture. Evaluer les rendements des parcelles de terrains à partir de la quantité d’engrais utilisés ou du nombre de jours de pluie dans l’année. Ecologie. Estimer la mortalité des poissons à partir de la quantité de résidus rejetés par les usines dans les cours d’eau. Santé. Evaluer l’influence des compléments alimentaires sur la fréquence des maladies cardio-vasculaires (cf. par exemple les oméga 3 et les maladies cardio-vasculaires). Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 24
  • 25. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 25
  • 26. Recueil des données Problème récurrent : le manque de données pertinentes. Ex. Analyse des processus de blanchiment d’argent Données brutes vs. données corrigés normalisées Données brutes : recueillies directement sur le terrain, très bonne qualité si précautions de recueil prises. Données corrigées (institut de sondages) : + normalisation des définitions ; - déjà manipulées et corrigées, attention. Données expérimentales vs. données non-expérimentales Données expérimentales : contrôlées dans une expérimentation (ex. doses de médicaments pour un cobaye). Données non expérimentales : directement observées. X peut être expérimental ; Y est toujours observé. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 26
  • 27. Données transversales, longitudinales, de panel Parcelle Rendement (quintal) Engrais (kilo) A 16 20 B 18 24 C 23 28 D 24 22 E 28 32 F 29 28 G 26 32 H 31 36 I 32 41 J 34 41 Coupes transversales Ligne = individu Ex. Personne, véhicule, client, parcelle de terrain, etc. Données temporelles (longitudinales) Ligne = date « Stock », définie sur une date « Flux » définie sur une période Stock Flux facile (ex. somme, moyenne) Flux Stock pas évident (Mars = 5000 euros de CA, comment définir la valeur pour la date du 15 mars ?) Mois CA (K-euros) Prospectus distribués janv-04 1250 156 févr-04 1456 178 mars-04 4863 293 Données de panel Faire des coupes transversales sur plusieurs dates. Si on observe spécifiquement les mêmes individus, on parle de « cohorte ». Ex. Recueillir les ventes d’un échantillon de concessionnaires. Renouveler l’opération sur plusieurs mois. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 27
  • 28. Bibliographique http://eric.univ-lyon2.fr/~ricco/cours/cours_econometrie.html Régis BOURBONNAIS, « Econométrie – Manuel et exercices corrigés », Dunod, 1998. Y.Dodge, V.Rousson, « Analyse de régression appliquée », Dunod, 2004. M. Tenenhaus, « Statistique : Méthodes pour décrire, expliquer et prévoir », Dunod, 2007. René GIRAUD, Nicole CHAIX, « Econométrie », PUF, 1994. (il existe une version QSJ, plus accessible) Jack JOHNSTON, John DINARDO, « Méthodes économétriques », ECONOMICA, 1997. Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC 28