Modèles Linéaires Appliqués
Arthur Charpentier
Automne 2020
Intro #1 (plan de cours)
@freakonometrics freakonometrics freakonometrics.hypotheses.org 1 / 17
Modèles Linéaires Appliqués (STT5100)
“Méthode d’estimation par moindre carrés, Régression linéaire simple et
multiple, Tests d’hypothèses et intervalles de confiance, tests d’ajustement,
introduction aux modèles linéaires généralisés (GLM): régression logistique,
régression Poisson, régression Gamma. Applications numériques à l’aide de R”
https://etudier.uqam.ca/cours?sigle=STT5100
Instructeur: Arthur Charpentier
charpentier.arthur@uqam.ca
@freakonometrics
freakonometrics
freakonometrics.hypotheses.org
→ plan de cours.pdf
@freakonometrics freakonometrics freakonometrics.hypotheses.org 2 / 17
Modèles Linéaires Appliqués (STT5100)
• R & RStudio
• probas Y ∼ F, E[Y ], etc
• stats {y1, . . . , yn} ∼ Fθ,
estimateur ˆθ, E[ˆθ], etc
• algèbre linéaire x, ε = 0
matrices, projection
orthogonales, etc
xkcd.com/2048
@freakonometrics freakonometrics freakonometrics.hypotheses.org 3 / 17
Modèles Linéaires Appliqués (STT5100)
1 Rappels
• R & Markdown
• Probabilités & Algèbre Linéaire
• Statistiques, inférence & tests
• Simulations & Optimisation
2 Modèles Linéaires (OLS)
• Moindres Carrés & Modèle Gaussien
• Inférence & Tests
• Incertitude & Prévision
3 Modèles Linéaires Généralisés (GLM)
• Logistique, binomiale (y ∈ {0, 1}) & multinomiale
• Comptage, Poisson (y ∈ {0, 1, 2, . . . })
• Famille exponentielle & GLM
@freakonometrics freakonometrics freakonometrics.hypotheses.org 4 / 17
Statistique Inférentielle & R
ı
@freakonometrics freakonometrics freakonometrics.hypotheses.org 5 / 17
Modèles Linéaires (OLS & GLM)
@freakonometrics freakonometrics freakonometrics.hypotheses.org 6 / 17
Modèles Linéaires Appliqués (STT5100)
“when a measure becomes a target, it ceases to be a good
measure", Charles Goodhart, membre du Comité de politique
monétaire de la Banque d’Angleterre
Autrement dit, les examens ne sont pas l’objectif du cours
• Quizz hebdomadaire (×10) = 20%
• Examen 1 = 20% (OLS)
• Examen 2 = 20% (GLM)
• Projet 1 = 18% (OLS)
• Projet 2 = 18% (GLM)
• Participation = 4%
@freakonometrics freakonometrics freakonometrics.hypotheses.org 7 / 17
Modèles Linéaires Appliqués (STT5100)
Dépôt des documents (slides + devoirs): github + moodle
@freakonometrics freakonometrics freakonometrics.hypotheses.org 8 / 17
Modèles Linéaires Appliqués (STT5100)
Dépôt des documents (slides + devoirs): github + moodle
Les travaux seront à rendre sur moodle !
@freakonometrics freakonometrics freakonometrics.hypotheses.org 9 / 17
Modèles Linéaires Appliqués (STT5100)
Vidéos du cours: youtube (+ github + moodle)
@freakonometrics freakonometrics freakonometrics.hypotheses.org 10 / 17
Modèles Linéaires Appliqués (STT5100)
Quizz: moodle
par example
on sauve le fichier echantillon.csv puis on ouvre R
@freakonometrics freakonometrics freakonometrics.hypotheses.org 11 / 17
Modèles Linéaires Appliqués (STT5100)
1 > b = read.csv (" echantillon .csv ")
2 > n = nrow(b)
3 > m = mean(b$x)
4 > s = sd(b$x)
5 > interval = m + 1.96*c(-1,+1)*s/sqrt(n)
6 > interval
7 [1] 370.0794 407.7525
puisque l’intervalle de confiance pour µ, avec un niveau de
confiance 1 − α, est de la forme
xn + Φ−1
(α/2)
sn
√
n
; xn + Φ−1
(1 − α/2)
sn
√
n
avec les constantes usuelles ±1.96 puisque
1 > qnorm(c(.025 ,.975))
2 [1] -1.959964 1.959964
@freakonometrics freakonometrics freakonometrics.hypotheses.org 12 / 17
Modèles Linéaires Appliqués (STT5100)
On peut alors soumettre la réponse (définitivement)
@freakonometrics freakonometrics freakonometrics.hypotheses.org 13 / 17
Modèles Linéaires Appliqués (STT5100)
Des éléments de réponse (succints) sont alors proposés
@freakonometrics freakonometrics freakonometrics.hypotheses.org 14 / 17
Modèles Linéaires Appliqués (STT5100)
Discussion: forum teams
@freakonometrics freakonometrics freakonometrics.hypotheses.org 15 / 17
Modèles Linéaires Appliqués (STT5100)
Tricherie et intégrité académique
http://r18.uqam.ca/
par exemple Comment citer ses sources?
Politique 16, https://harcelement.uqam.ca/
@freakonometrics freakonometrics freakonometrics.hypotheses.org 16 / 17
Modèles Linéaires Appliqués (STT5100)
@freakonometrics freakonometrics freakonometrics.hypotheses.org 17 / 17

STT5100 Automne 2020, introduction

  • 1.
    Modèles Linéaires Appliqués ArthurCharpentier Automne 2020 Intro #1 (plan de cours) @freakonometrics freakonometrics freakonometrics.hypotheses.org 1 / 17
  • 2.
    Modèles Linéaires Appliqués(STT5100) “Méthode d’estimation par moindre carrés, Régression linéaire simple et multiple, Tests d’hypothèses et intervalles de confiance, tests d’ajustement, introduction aux modèles linéaires généralisés (GLM): régression logistique, régression Poisson, régression Gamma. Applications numériques à l’aide de R” https://etudier.uqam.ca/cours?sigle=STT5100 Instructeur: Arthur Charpentier charpentier.arthur@uqam.ca @freakonometrics freakonometrics freakonometrics.hypotheses.org → plan de cours.pdf @freakonometrics freakonometrics freakonometrics.hypotheses.org 2 / 17
  • 3.
    Modèles Linéaires Appliqués(STT5100) • R & RStudio • probas Y ∼ F, E[Y ], etc • stats {y1, . . . , yn} ∼ Fθ, estimateur ˆθ, E[ˆθ], etc • algèbre linéaire x, ε = 0 matrices, projection orthogonales, etc xkcd.com/2048 @freakonometrics freakonometrics freakonometrics.hypotheses.org 3 / 17
  • 4.
    Modèles Linéaires Appliqués(STT5100) 1 Rappels • R & Markdown • Probabilités & Algèbre Linéaire • Statistiques, inférence & tests • Simulations & Optimisation 2 Modèles Linéaires (OLS) • Moindres Carrés & Modèle Gaussien • Inférence & Tests • Incertitude & Prévision 3 Modèles Linéaires Généralisés (GLM) • Logistique, binomiale (y ∈ {0, 1}) & multinomiale • Comptage, Poisson (y ∈ {0, 1, 2, . . . }) • Famille exponentielle & GLM @freakonometrics freakonometrics freakonometrics.hypotheses.org 4 / 17
  • 5.
    Statistique Inférentielle &R ı @freakonometrics freakonometrics freakonometrics.hypotheses.org 5 / 17
  • 6.
    Modèles Linéaires (OLS& GLM) @freakonometrics freakonometrics freakonometrics.hypotheses.org 6 / 17
  • 7.
    Modèles Linéaires Appliqués(STT5100) “when a measure becomes a target, it ceases to be a good measure", Charles Goodhart, membre du Comité de politique monétaire de la Banque d’Angleterre Autrement dit, les examens ne sont pas l’objectif du cours • Quizz hebdomadaire (×10) = 20% • Examen 1 = 20% (OLS) • Examen 2 = 20% (GLM) • Projet 1 = 18% (OLS) • Projet 2 = 18% (GLM) • Participation = 4% @freakonometrics freakonometrics freakonometrics.hypotheses.org 7 / 17
  • 8.
    Modèles Linéaires Appliqués(STT5100) Dépôt des documents (slides + devoirs): github + moodle @freakonometrics freakonometrics freakonometrics.hypotheses.org 8 / 17
  • 9.
    Modèles Linéaires Appliqués(STT5100) Dépôt des documents (slides + devoirs): github + moodle Les travaux seront à rendre sur moodle ! @freakonometrics freakonometrics freakonometrics.hypotheses.org 9 / 17
  • 10.
    Modèles Linéaires Appliqués(STT5100) Vidéos du cours: youtube (+ github + moodle) @freakonometrics freakonometrics freakonometrics.hypotheses.org 10 / 17
  • 11.
    Modèles Linéaires Appliqués(STT5100) Quizz: moodle par example on sauve le fichier echantillon.csv puis on ouvre R @freakonometrics freakonometrics freakonometrics.hypotheses.org 11 / 17
  • 12.
    Modèles Linéaires Appliqués(STT5100) 1 > b = read.csv (" echantillon .csv ") 2 > n = nrow(b) 3 > m = mean(b$x) 4 > s = sd(b$x) 5 > interval = m + 1.96*c(-1,+1)*s/sqrt(n) 6 > interval 7 [1] 370.0794 407.7525 puisque l’intervalle de confiance pour µ, avec un niveau de confiance 1 − α, est de la forme xn + Φ−1 (α/2) sn √ n ; xn + Φ−1 (1 − α/2) sn √ n avec les constantes usuelles ±1.96 puisque 1 > qnorm(c(.025 ,.975)) 2 [1] -1.959964 1.959964 @freakonometrics freakonometrics freakonometrics.hypotheses.org 12 / 17
  • 13.
    Modèles Linéaires Appliqués(STT5100) On peut alors soumettre la réponse (définitivement) @freakonometrics freakonometrics freakonometrics.hypotheses.org 13 / 17
  • 14.
    Modèles Linéaires Appliqués(STT5100) Des éléments de réponse (succints) sont alors proposés @freakonometrics freakonometrics freakonometrics.hypotheses.org 14 / 17
  • 15.
    Modèles Linéaires Appliqués(STT5100) Discussion: forum teams @freakonometrics freakonometrics freakonometrics.hypotheses.org 15 / 17
  • 16.
    Modèles Linéaires Appliqués(STT5100) Tricherie et intégrité académique http://r18.uqam.ca/ par exemple Comment citer ses sources? Politique 16, https://harcelement.uqam.ca/ @freakonometrics freakonometrics freakonometrics.hypotheses.org 16 / 17
  • 17.
    Modèles Linéaires Appliqués(STT5100) @freakonometrics freakonometrics freakonometrics.hypotheses.org 17 / 17