SlideShare une entreprise Scribd logo
1  sur  32
Télécharger pour lire hors ligne
Statistique appliquée
La régression linéaire
simple
1
M. HOUSSAS
Slide 8-2
Méthodes descriptives et
Méthodes explicatives
Méthodes descriptives
 Décrire une variable, un lien entre variables, un
tableau de chiffres.
 Visualiser, grâce à des représentations adaptées,
un ensemble de données complexes.
 Résumer une série de valeurs par des indices.
M. HOUSSAS
Slide 8-3
Méthodes explicatives
 Généraliser un résultat observé sur un échantillon
à toute la population.
 Vérifier une hypothèse grâce à l’utilisation de
critères fiables et contrôlables. (Test)
 Prévoir un résultat numérique à partir d’un
échantillon. (Modèle)
 Estimer des paramètres auxquels on n’a pas
accès.
4
 Expliquer la variation d’une variable endogène
(dépendante ou à expliquée) par une ou plusieurs
variables exogènes (indépendantes ou explicatives)
 Expliquer la droite de régression (méthode de MCO)
 Estimer les paramètres de régression et leurs
caractéristiques
 Établir les prévisions
Objectifs
Plan de la séance
1- La régression linéaire simple
A. Formulation du modèle
B. Formulation des estimateurs
C. Spécification du modèle de régression : Test de Student
D. Validation du modèle de régression : Test de Fisher
E. Qualité du modèle de régression: Le coefficient de
détermination R²
F. Représentation graphique
2- La régression linéaire multiple
3- Travail à rendre N°3
M. HOUSSAS
Slide 8-6
La démarche de la statistique
explicative.
 Le choix d’un modèle théorique: ce qui nécessite la
maîtrise de la théorie en question. Le modèle peut être soit
un modèle simple:
• Yt = a Xt + b +Et
• Multiple: Yt = a1 X1t + a2X2t + a3X3t + a4X4t+ … +εt
 la collecte des données: ce qui nécessite au préalable le
choix d’un échantillon représentatif.
 L’estimation des paramètres du modèle.
 L’inférence statistique: étude de la validité du modèle basée
essentiellement sur les tests.
1. Le choix d’un modèle
2. Collecte des données
3. Estimation des paramètres
4. Tester le modèle
Si valable: à utiliser
pour faire des prévisions
Si non, le modèle est rejeté
On revient à
l’étape 1 pour
choisir un autre
modèle
Schéma de la démarche
M. HOUSSAS
Slide 8-8
Chapitre 1: régression simple
• 1. définition d’une régression:
C’est l’étude de la dépendance d’une variable
par rapport à une autre ou plusieurs en vue
d’estimer et/ou de prédire les paramètres de
la population.
Deux types de dépendance peuvent être
observés:
- déterministe.
- stochastique (aléatoire).
9
Le modèle linéaire à une seule variable explicative est de la
forme:
pour t = 1, …, n
avec:
yt : variable à expliquer au temps t;
xt : variable explicative au temps t;
a0 , a1 : paramètres du modèle;
εt : erreur de spécification (différence entre le
modèle vrai et le modèle spécifié), cette erreur est
inconnue et restera inconnue;
n : nombre d’observations.
0 1
t t t
y a a x 
  
1- la régression linéaire simple
M. HOUSSAS
Slide 8-10
• La présence de la perturbation ε peut être
expliquée par les facteurs suivants:
• La fonction liant Y et X peut être plus complexe
dans la réalité. (problème de linéarité)
• La négligence de certaines variables
explicatives.
• Le comportement à des dates différentes n’est
pas forcément constant.
• La difficulté de mesurer certaines variables
socio-économiques.
11
Hypothèses du modèle de régression linéaire:
H1: le modèle est linéaire en xt;
H2: les valeurs xt sont observées sans erreur;
H3: E(εt) = 0, modèle bien spécifié, donc erreur moyenne nulle;
H4: E(ε²t) = σ²ε , variance de l’erreur constante (homoscédasticité);
H5: E(εtεt’) = 0, si t ≠ t’, les erreurs sont non corrélées;
Introduction générale
M. HOUSSAS
Slide 8-12
Exemple d’homoscédasticité
0
10
20
0 1 2 3 4 5
M. HOUSSAS
Slide 8-13
Exemple
0
50
100
150
200
0 2 4 6 8 10
Phénomène
d’hétéroscédasticité:
la variance n’est pas
constante (on utilise
la méthode des
moindres carrés
généralisée)
14
A- Formulation du modèle estimé
Le modèle estimé à partir d’un échantillon d’observation est de
la forme:
Avec: et : résidu, estimation de l’erreur εt.
Le résidu observé et différence entre les valeurs observées de y
et les valeurs ajustées à l’aide des coefficients du modèle.
0 1
t t t t
t
y a a x e y e
    
1- la régression linéaire simple
15
B- Formulation des estimateurs
Les estimateurs sont dits BLUE (Best Linear Unbiased Estimator),
c’est-à-dire meilleurs estimateurs linéaires sans biais.
Procédure SPSS de la régression:
ANALYSEREGRESSION  LINEAIRE sélectionner les
variables à étudier.
  
 
x
â
y
a
x
x
y
y
x
x
a n
t
t
n
t
t
t
1
0
1
2
1
1
ˆ
ˆ










1
0
ˆ â
et
a
1- la régression linéaire simple
16
Exemple 1
On a relevé pendant 13 mois
consécutifs, le cours de l’action
d’une société S et un indice
représentatif du cours moyen sur le
marché boursier des actions. Nous
voulons étudier les variations de la
variable dépendante (Y: cours de
l’action) en fonction de la variable
indépendante (X: cours de l’indice
boursier):
1. Formuler le modèle linéaire
2. Donner la formulation du modèle
à estimer
3. Calculer les estimateurs du modèle
4. Calculer les valeurs ajustées à
l’aide du modèle estimé
5. Calculer les résidus et
6. Vérifier l’hypothèse H3
Périodes
Cours de
l'action Y
Indice du
marché X
1 140 430
2 148 507
3 154 512
4 164 589
5 169 536
6 153 509
7 140 499
8 137 499
9 130 444
10 120 391
11 118 340
12 137 384
13 154 481
1- la régression linéaire simple
• Le modèle de régression linéaire entre l’indice
boursier est l’action S est alors de la forme
17
193
,
0
ˆ
53
,
52
ˆ
1
0


a
a
x
y 193
,
0
53
,
52 


La droite de
régression qui
permet de
déterminer
le cours moyen
de l’action S
pour un cours
de l’indice
boursier x.
C’est l’augmentation du cours
de de l’action (Y) pour une
augmentation
unitaire de l’indice de marché
(X)
Ordonnée à l’origine
(cours moyen de l’actions si
Le cours de l’indice vaut 0)
1- la régression linéaire simple
Définition des variables
18
La saisie des données
19
Après la saisie des données qui doivent être
exactes, on passe au traitement qui consiste à
estimer les paramètres (a0 et a1) et d’étudier la
validité du modèle
Résultats SPSS
• ESTIMATION DES PARAMETRES
20
DONC: Y = 52,53 + 0,193 X
Résultats SPSS
21
22
C- La spécification du modèle : test de Student
• Les estimateurs sont ils significatifs?
 Test de significativité de
1- Hypothèses du test:
2- Ensuite, on calcule un ratio appelé le t de Student empirique
3- On compare le seuil de signification (p) lié à la statistique t avec le
seuil théorique de risque α (5%)
4- Conclusion:
• Si p < α on rejette H0, a1 significativement ≠ 0, X explique Y de
façon significative, donc la variable explicative est contributive à
l’explication de la variable Y ;
• Si p > α , on accepte H0, a1 égal 0, X n’explique pas Y de façon
contributive.
1- la régression linéaire simple





0
:
0
:
1
1
1
0
a
H
a
H
1
â
23
Exemple 2 :
En reprenant l’exemple de la société S, tester la
significativité du coefficient de régression au seuil
de α=0,05
1- la régression linéaire simple
1
a
 Réponse
1- Hypothèses du test:
2- tc= 5,64
3- p=0,00
4- p< α donc on rejette H0 et on accepte H1, a1
significativement ≠ de 0, X explique Y de façon
significative, donc la variable explicative est
contributive à l’explication de la variable Y ;
24





0
:
0
:
1
1
1
0
a
H
a
H
1- la régression linéaire simple
1- Analyse statistique
Signification par intervalle de confiance
D’après l’intervalle de confiance, on constate que la vraie
valeur de a1 a de une probabilité de 95% de chance d’être
comprise entre 0,118 et 0,268. elle est donc différente de zéro.
Par conséquent X explique significativement Y
1- Analyse statistique
D- Validation du modèle de régression : Test de Fisher
A- Décomposition de la variance
Il est d’usage de décomposer la variance totale en la variance
expliquée par la régression et la variance résiduelle.
La somme des carrés totale (SCT) se décompose en la somme
des carrés expliqués par la régression (SCE) et la somme des carrés
résiduelles (SCR): SCT = SCE + SCR
B- ANOVA
Source de variance Somme des carrés Degrés de liberté Carrés moyens
Régression X SCE 1 SCE / 1
Résidu ε SCR n-2 SCR / (n-2)
Total SCT n-1
C- TEST DE FISHER: même démarche que le test de student
F= (SCE / 1) / (SCR / (n-2))
27
Exemple 3 :
En reprenant l’exemple de la société S, établir le test de
Fischer au seuil de 5%
1- la régression linéaire simple
P< α alors le modèle de régression est validé
28
1- la régression linéaire simple
E- La qualité du modèle de régression: Le coefficient de
détermination R²
R² fournit une indication de la force de la liaison possible pouvant
exister entre Y et X au niveau de la population. De plus, c’est un
indice de la qualité de l’ajustement de la droite aux points
expérimentaux.
Dans le cas d’une régression simple, le coefficient de
détermination est égal au carré du coefficient de corrélation









SCT
SCR
SCT
SCE
R 1
2
2
2
XY
R 

30
Exemple 3 :
En reprenant l’exemple de la société S, apprécier la
qualité du modèle de régression.
1- la régression linéaire simple
31
Réponse
R²=74,3% c’est-à-dire que la variation de l’indice du
marché explique 74,3% du comportement de
l’action S.
R = 0,862 on parle donc d’une relation linéaire entre
X et Y.
1- la régression linéaire simple
Merci de votre attention
32

Contenu connexe

Tendances

Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
Giorgio Pauletto
 
Analyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afcAnalyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afc
Rémi Bachelet
 
Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009
mohamedchaouche
 
Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)
Pierre Robentz Cassion
 

Tendances (20)

Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Regression lineaire simple
Regression lineaire simpleRegression lineaire simple
Regression lineaire simple
 
Règles d’association
Règles d’associationRègles d’association
Règles d’association
 
Test t de student pour des échantillons indépendants
Test  t  de student  pour  des échantillons indépendants Test  t  de student  pour  des échantillons indépendants
Test t de student pour des échantillons indépendants
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
Cours de probabilités chap2.pptx
Cours de probabilités chap2.pptxCours de probabilités chap2.pptx
Cours de probabilités chap2.pptx
 
La Regression lineaire
La Regression lineaireLa Regression lineaire
La Regression lineaire
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
Analyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afcAnalyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afc
 
Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009Introduction a l'econometrie luxembourg 2008 2009
Introduction a l'econometrie luxembourg 2008 2009
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr Falloul
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et R
 
Analyse de données avec SPSS (1).pdf
Analyse de données avec SPSS (1).pdfAnalyse de données avec SPSS (1).pdf
Analyse de données avec SPSS (1).pdf
 

Similaire à chapitre 1 régression simple.pdf

Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
mohamedchaouche
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
afryma
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
afryma
 
modele destimation.pptx
modele destimation.pptxmodele destimation.pptx
modele destimation.pptx
zahrakmar
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
TarekDHAHRI1
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)
mohamedchaouche
 
Metrologie termilnal
Metrologie termilnalMetrologie termilnal
Metrologie termilnal
m.a bensaaoud
 

Similaire à chapitre 1 régression simple.pdf (20)

Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique
 
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdffr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
fr_Tanagra_Naive_Bayes_Classifier_Explained.pdf
 
FINAL.pptx
FINAL.pptxFINAL.pptx
FINAL.pptx
 
Traitements statistiques de description
Traitements statistiques de descriptionTraitements statistiques de description
Traitements statistiques de description
 
modele destimation.pptx
modele destimation.pptxmodele destimation.pptx
modele destimation.pptx
 
Analyse en Composantes Principales
Analyse en Composantes PrincipalesAnalyse en Composantes Principales
Analyse en Composantes Principales
 
Regression simple
Regression simpleRegression simple
Regression simple
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Stat1
Stat1Stat1
Stat1
 
Chapitre2: Sondage aléatoire simple
Chapitre2: Sondage aléatoire simpleChapitre2: Sondage aléatoire simple
Chapitre2: Sondage aléatoire simple
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)
 
Metrologie termilnal
Metrologie termilnalMetrologie termilnal
Metrologie termilnal
 
Loic sarton spss 2011
Loic sarton  spss 2011Loic sarton  spss 2011
Loic sarton spss 2011
 
Cours statistiques
Cours statistiquesCours statistiques
Cours statistiques
 
6 sigma -chapitre4 : Analyser
6 sigma -chapitre4 : Analyser6 sigma -chapitre4 : Analyser
6 sigma -chapitre4 : Analyser
 
COURS SUR LES SERIES TEMPORELLES
COURS SUR LES SERIES TEMPORELLESCOURS SUR LES SERIES TEMPORELLES
COURS SUR LES SERIES TEMPORELLES
 

Dernier

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 

Dernier (16)

les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 

chapitre 1 régression simple.pdf

  • 2. M. HOUSSAS Slide 8-2 Méthodes descriptives et Méthodes explicatives Méthodes descriptives  Décrire une variable, un lien entre variables, un tableau de chiffres.  Visualiser, grâce à des représentations adaptées, un ensemble de données complexes.  Résumer une série de valeurs par des indices.
  • 3. M. HOUSSAS Slide 8-3 Méthodes explicatives  Généraliser un résultat observé sur un échantillon à toute la population.  Vérifier une hypothèse grâce à l’utilisation de critères fiables et contrôlables. (Test)  Prévoir un résultat numérique à partir d’un échantillon. (Modèle)  Estimer des paramètres auxquels on n’a pas accès.
  • 4. 4  Expliquer la variation d’une variable endogène (dépendante ou à expliquée) par une ou plusieurs variables exogènes (indépendantes ou explicatives)  Expliquer la droite de régression (méthode de MCO)  Estimer les paramètres de régression et leurs caractéristiques  Établir les prévisions Objectifs
  • 5. Plan de la séance 1- La régression linéaire simple A. Formulation du modèle B. Formulation des estimateurs C. Spécification du modèle de régression : Test de Student D. Validation du modèle de régression : Test de Fisher E. Qualité du modèle de régression: Le coefficient de détermination R² F. Représentation graphique 2- La régression linéaire multiple 3- Travail à rendre N°3
  • 6. M. HOUSSAS Slide 8-6 La démarche de la statistique explicative.  Le choix d’un modèle théorique: ce qui nécessite la maîtrise de la théorie en question. Le modèle peut être soit un modèle simple: • Yt = a Xt + b +Et • Multiple: Yt = a1 X1t + a2X2t + a3X3t + a4X4t+ … +εt  la collecte des données: ce qui nécessite au préalable le choix d’un échantillon représentatif.  L’estimation des paramètres du modèle.  L’inférence statistique: étude de la validité du modèle basée essentiellement sur les tests.
  • 7. 1. Le choix d’un modèle 2. Collecte des données 3. Estimation des paramètres 4. Tester le modèle Si valable: à utiliser pour faire des prévisions Si non, le modèle est rejeté On revient à l’étape 1 pour choisir un autre modèle Schéma de la démarche
  • 8. M. HOUSSAS Slide 8-8 Chapitre 1: régression simple • 1. définition d’une régression: C’est l’étude de la dépendance d’une variable par rapport à une autre ou plusieurs en vue d’estimer et/ou de prédire les paramètres de la population. Deux types de dépendance peuvent être observés: - déterministe. - stochastique (aléatoire).
  • 9. 9 Le modèle linéaire à une seule variable explicative est de la forme: pour t = 1, …, n avec: yt : variable à expliquer au temps t; xt : variable explicative au temps t; a0 , a1 : paramètres du modèle; εt : erreur de spécification (différence entre le modèle vrai et le modèle spécifié), cette erreur est inconnue et restera inconnue; n : nombre d’observations. 0 1 t t t y a a x     1- la régression linéaire simple
  • 10. M. HOUSSAS Slide 8-10 • La présence de la perturbation ε peut être expliquée par les facteurs suivants: • La fonction liant Y et X peut être plus complexe dans la réalité. (problème de linéarité) • La négligence de certaines variables explicatives. • Le comportement à des dates différentes n’est pas forcément constant. • La difficulté de mesurer certaines variables socio-économiques.
  • 11. 11 Hypothèses du modèle de régression linéaire: H1: le modèle est linéaire en xt; H2: les valeurs xt sont observées sans erreur; H3: E(εt) = 0, modèle bien spécifié, donc erreur moyenne nulle; H4: E(ε²t) = σ²ε , variance de l’erreur constante (homoscédasticité); H5: E(εtεt’) = 0, si t ≠ t’, les erreurs sont non corrélées; Introduction générale
  • 12. M. HOUSSAS Slide 8-12 Exemple d’homoscédasticité 0 10 20 0 1 2 3 4 5
  • 13. M. HOUSSAS Slide 8-13 Exemple 0 50 100 150 200 0 2 4 6 8 10 Phénomène d’hétéroscédasticité: la variance n’est pas constante (on utilise la méthode des moindres carrés généralisée)
  • 14. 14 A- Formulation du modèle estimé Le modèle estimé à partir d’un échantillon d’observation est de la forme: Avec: et : résidu, estimation de l’erreur εt. Le résidu observé et différence entre les valeurs observées de y et les valeurs ajustées à l’aide des coefficients du modèle. 0 1 t t t t t y a a x e y e      1- la régression linéaire simple
  • 15. 15 B- Formulation des estimateurs Les estimateurs sont dits BLUE (Best Linear Unbiased Estimator), c’est-à-dire meilleurs estimateurs linéaires sans biais. Procédure SPSS de la régression: ANALYSEREGRESSION  LINEAIRE sélectionner les variables à étudier.      x â y a x x y y x x a n t t n t t t 1 0 1 2 1 1 ˆ ˆ           1 0 ˆ â et a 1- la régression linéaire simple
  • 16. 16 Exemple 1 On a relevé pendant 13 mois consécutifs, le cours de l’action d’une société S et un indice représentatif du cours moyen sur le marché boursier des actions. Nous voulons étudier les variations de la variable dépendante (Y: cours de l’action) en fonction de la variable indépendante (X: cours de l’indice boursier): 1. Formuler le modèle linéaire 2. Donner la formulation du modèle à estimer 3. Calculer les estimateurs du modèle 4. Calculer les valeurs ajustées à l’aide du modèle estimé 5. Calculer les résidus et 6. Vérifier l’hypothèse H3 Périodes Cours de l'action Y Indice du marché X 1 140 430 2 148 507 3 154 512 4 164 589 5 169 536 6 153 509 7 140 499 8 137 499 9 130 444 10 120 391 11 118 340 12 137 384 13 154 481 1- la régression linéaire simple
  • 17. • Le modèle de régression linéaire entre l’indice boursier est l’action S est alors de la forme 17 193 , 0 ˆ 53 , 52 ˆ 1 0   a a x y 193 , 0 53 , 52    La droite de régression qui permet de déterminer le cours moyen de l’action S pour un cours de l’indice boursier x. C’est l’augmentation du cours de de l’action (Y) pour une augmentation unitaire de l’indice de marché (X) Ordonnée à l’origine (cours moyen de l’actions si Le cours de l’indice vaut 0) 1- la régression linéaire simple
  • 19. La saisie des données 19 Après la saisie des données qui doivent être exactes, on passe au traitement qui consiste à estimer les paramètres (a0 et a1) et d’étudier la validité du modèle
  • 20. Résultats SPSS • ESTIMATION DES PARAMETRES 20 DONC: Y = 52,53 + 0,193 X
  • 22. 22 C- La spécification du modèle : test de Student • Les estimateurs sont ils significatifs?  Test de significativité de 1- Hypothèses du test: 2- Ensuite, on calcule un ratio appelé le t de Student empirique 3- On compare le seuil de signification (p) lié à la statistique t avec le seuil théorique de risque α (5%) 4- Conclusion: • Si p < α on rejette H0, a1 significativement ≠ 0, X explique Y de façon significative, donc la variable explicative est contributive à l’explication de la variable Y ; • Si p > α , on accepte H0, a1 égal 0, X n’explique pas Y de façon contributive. 1- la régression linéaire simple      0 : 0 : 1 1 1 0 a H a H 1 â
  • 23. 23 Exemple 2 : En reprenant l’exemple de la société S, tester la significativité du coefficient de régression au seuil de α=0,05 1- la régression linéaire simple 1 a
  • 24.  Réponse 1- Hypothèses du test: 2- tc= 5,64 3- p=0,00 4- p< α donc on rejette H0 et on accepte H1, a1 significativement ≠ de 0, X explique Y de façon significative, donc la variable explicative est contributive à l’explication de la variable Y ; 24      0 : 0 : 1 1 1 0 a H a H 1- la régression linéaire simple
  • 25. 1- Analyse statistique Signification par intervalle de confiance D’après l’intervalle de confiance, on constate que la vraie valeur de a1 a de une probabilité de 95% de chance d’être comprise entre 0,118 et 0,268. elle est donc différente de zéro. Par conséquent X explique significativement Y
  • 26. 1- Analyse statistique D- Validation du modèle de régression : Test de Fisher A- Décomposition de la variance Il est d’usage de décomposer la variance totale en la variance expliquée par la régression et la variance résiduelle. La somme des carrés totale (SCT) se décompose en la somme des carrés expliqués par la régression (SCE) et la somme des carrés résiduelles (SCR): SCT = SCE + SCR B- ANOVA Source de variance Somme des carrés Degrés de liberté Carrés moyens Régression X SCE 1 SCE / 1 Résidu ε SCR n-2 SCR / (n-2) Total SCT n-1 C- TEST DE FISHER: même démarche que le test de student F= (SCE / 1) / (SCR / (n-2))
  • 27. 27 Exemple 3 : En reprenant l’exemple de la société S, établir le test de Fischer au seuil de 5% 1- la régression linéaire simple
  • 28. P< α alors le modèle de régression est validé 28 1- la régression linéaire simple
  • 29. E- La qualité du modèle de régression: Le coefficient de détermination R² R² fournit une indication de la force de la liaison possible pouvant exister entre Y et X au niveau de la population. De plus, c’est un indice de la qualité de l’ajustement de la droite aux points expérimentaux. Dans le cas d’une régression simple, le coefficient de détermination est égal au carré du coefficient de corrélation          SCT SCR SCT SCE R 1 2 2 2 XY R  
  • 30. 30 Exemple 3 : En reprenant l’exemple de la société S, apprécier la qualité du modèle de régression. 1- la régression linéaire simple
  • 31. 31 Réponse R²=74,3% c’est-à-dire que la variation de l’indice du marché explique 74,3% du comportement de l’action S. R = 0,862 on parle donc d’une relation linéaire entre X et Y. 1- la régression linéaire simple
  • 32. Merci de votre attention 32