SlideShare une entreprise Scribd logo
Comment faire disparaître les
          rides
        Ou le statisticien esthéticien
Comment éliminer les rides

Voici un nuage de points   Quelle est la tendance ?
Contenu


1. Régression linéaire
2. Méthodes de lissage
  i.     Lisseur à bac
  ii.    Moyenne mobile
  iii.   Droite mobile
  iv.    Régression par noyau
  v.     Régression polynomiale locale
  vi.    Spline
3. Modèles additifs généralisés
Notation


X: La variable explicatrice. Dans le cas de variables
multiples, représente la matrice des variables
explicatrices.
Y: La variable réponse.
xi: La cible, pourrait être n’importe quelle valeur de
l’espace de X, par exemple une observation de X
s(xi): la valeur lissée de Y à la cible.
Régression linéaire


La régression linéaire établi un lien bien défini entre
deux variables.
Techniquement, la fonction est lisse, mais cela vient
de la contrainte de linéarité imposée.



             Y =a + bX
Régression linéaire
Lissage


Aucune forme imposée
Capture les caractéristiques du nuage
« Lisse »
  Moins variable que les valeurs observées Y
Le lisseur à bac


On sépare le nuage de point en régions selon la
variable X et on fait la moyenne dans chaque région
Le lisseur à bac
Le lisseur à bac
La moyenne mobile


On défini le voisinage d’une valeur xi comme étant les N
points les plus proches de xi.
Version symétrique:
  On prend les valeurs de X qui sont dans l’intervalle [i-k,i+k]
  On obtient donc 2K+1 = N éléments
  Aux extrémités, nous avons moins de points
Version non-symétrique
  On prend l’intervalle symétrique lorsque possible
  Aux extrémités, 2K+1 éléments, peu importe de leur position par
  rapport à xi
La moyenne mobile


On prend la moyenne des Y appartenant au voisinage
défini
Une modification à cette procédure nous permet
d’obtenir la droite mobile
  Au lieu de faire la moyenne des Y du voisinage, on ajuste
  on modèle de régression dans ce voisinage et on prend
  la valeur prédite.


             s ( xi ) = a ( xi ) + b ( xi ) xi
                        ˆ          ˆ
La moyenne mobile
La moyenne mobile
La droite mobile
Régression par le noyau

Plutôt que de donné la même importance à tous les
points d’un voisinage, pourquoi ne pas favoriser les
points les plus proches et pénaliser les points éloignés ?
On défini le poids de chaque observation pour un xi
donné { l’aide d’une fonction de densité symétrique
(par exemple, la loi normale)
On calcule la moyenne pondérée { l’aide de ce noyau:
                                æ xi - x j ö
                            å d ç l ÷y j
                            j è            ø
                 s ( xi ) =
                                 æ x - xj ö
                            å è l ÷
                               dç i
                                             ø
                             j
Régression par le noyau
Régression par le noyau
Régression polynomiale locale


Pour éviter les problème de l’estimateur noyau aux extrémités,
on pourrait abandonner la symétrie en faveur d’un voisinage
asymétrique
Ainsi, on détermine le voisinage des K plus proches voisins de xi
On calcule la distance au plus loin des proches-voisins D(xi)
On attribue aux observations le poids suivant

                      ì
                      ï   æ æ              3 3
                                           ö   ö
                      ï   ç1- ç xi - x j   ÷   ÷   si xi - x j < D(xi )
           W (x j ) = í   ç ç D(xi )       ÷   ÷
                      ï   è è              ø   ø
                      ï
                      î            0                  autrement
Régression polynomiale locale


s(xi) sera la prévision à xi du modèle de régression
pondéré { l’aide de ce poids.
Régression polynomiale locale
Splines de régression


Simplifier le problème de régression en ajustant un
polynôme par partie.
On sépare l’espace des X en (K+1) groupes, la jonction
entre deux groupe ce nomme un nœud et nous avons
K nœuds internes.
Dans chaque groupe on ajuste un polynôme avec une
contrainte de continuité aux nœuds.
      s(xi ) = bo + b1 xi + b x + b x + åq j ( xi - x j )+
                              2      3                   3
                            2 i    3 i
                                           j
Splines de régression


On peut écrire l’équation précédente { l’aide de K+4
polynômes de base:
                       K+4
              s ( xi ) = å b j Pj
                        j=1
Les polynômes Pj forment la base des B-splines.
Splines de régression
Splines de lissage


Au lieu de séparer l’espace des X en groupes, les
splines émergent naturellement du problème de
régression pénalisée suivant:
                                       b

            å{ y - f ( x )}       + l ò { f ¢¢ ( t )} dt
                              2                    2
                 i      i
             i                         a



Je vous épargne les détails mathématiques de
l’estimation
Splines de lissage
Qu’est-ce qu’une fonction « lisse » ?


  La définition de lisse change selon le lisseur, mais
  l’objectif général est toujours d’être moins variable
  que les données brutes.
  Certains lisseurs ne sont pas généralement lisses.
    Le lisseur { bac est loin d’être lisse car il s’agit d’une
    fonction discontinue. Mais il est moins variable que les
    observations.
    Les lisseurs à moyenne mobile et à droite mobile sont
    continues, mais rien ne les empêche de changer
    rapidement et donc d’avoir une une apparence ridée.
Trop, c’est comme pas assez


La difficulté est de lissée suffisamment, sans effacer
toutes les caractéristiques intéressantes de la relation
(surlissage)
Le choix du paramètre de lissage est donc critique
  Sélection automatique { l’aide de la validation croisée
  généralisée
Surlissage

Surlissage                Lissage
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Hypothèses


L’estimation des lisseurs ne requiert aucune
hypothèse sur la nature des données, outre qu’il
existe une forme fonctionnelle qui lie les deux
variable.
On pourrait vouloir comparer un lisseur à une droite
de régression, dans ce cas, on doit assumer que les
observations sont indépendantes et que les erreurs
sont distribuées normalement.
Et si on a plus d’une variable
           explicatrice ?


Il existe des lisseurs de dimensions plus élevées du type
f(x1,x2), etc.
  On peut généraliser le lisseur à bac, la moyenne mobile, la
  droite mobile, en effectuant un maillage
  On peut généraliser la régression par noyau en utilisant un
  noyau multidimensionnel
  On peut généraliser la régression polynomiale locale en
  définissant une distance multidimensionnelle appropriée
  Les splines se généralisent par ce qui est appelé « thin-plate
  splines »
Et si on a plus d’une variable
           explicatrice ?


Dans tous les cas on est confronté à la malédiction
des grands nombres
Il est donc peu pratique de penser pouvoir
représenter librement la relation qui peut exister
entre plus de deux variables explicatrices et une
variable réponse
Modèles additifs généralisés


Une simplification du problème est de travailler avec
une extension de la régression linéaire multiple

          Y = a + f1 ( X1 ) + f2 ( X2 )
Où les fonctions fi sont obtenues par lissage
Conséquence: la relation entre X1 et Y est
indépendante de X2
Modèles additifs généralisés


Une des hypothèses importante des modèles linéaires
généralisés est l’hypothèse de linéarité, souvent
difficile à valider
Les modèles additifs généralisés pourraient être une
piste { emprunter pour valider l’hypothèse de
linéarité, ainsi que pour suggérer une forme
paramétrique plus appropriée

Contenu connexe

Tendances

03 théorème de gauss
03 théorème de gauss03 théorème de gauss
03 théorème de gaussKais Kh
 
Cours suite
Cours suiteCours suite
Cours suite
hassan1488
 
Cours deplacements simplifies
Cours deplacements simplifiesCours deplacements simplifies
Cours deplacements simplifiesm.a bensaaoud
 
Lignes Et Cables Electriques
Lignes Et Cables ElectriquesLignes Et Cables Electriques
Lignes Et Cables Electriques
Sais Abdelkrim
 
Recherche à voisinage variable
Recherche à voisinage variableRecherche à voisinage variable
Recherche à voisinage variable
Mohammed Mansouri
 
L'essentiel du programme de l'agrégation de mathématiques
L'essentiel du programme de l'agrégation de mathématiquesL'essentiel du programme de l'agrégation de mathématiques
L'essentiel du programme de l'agrégation de mathématiques
CharvetXavier
 
Cours series fourier
Cours series fourierCours series fourier
Cours series fourierMehdi Maroun
 
espace etudiant.licence 1er/2 anneé
espace etudiant.licence 1er/2 anneé espace etudiant.licence 1er/2 anneé
espace etudiant.licence 1er/2 anneé
saoula khereddine
 
Intégrations sur des espaces produits
Intégrations sur des espaces produitsIntégrations sur des espaces produits
Intégrations sur des espaces produits
NIDAL SABI
 
Analyse SMIA
Analyse SMIAAnalyse SMIA
Analyse SMIA
sarah Benmerzouk
 
harris corner detector
harris corner detectorharris corner detector
harris corner detector
Mohamed Khomsi
 
Convex Multi-Task Feature Learning
Convex Multi-Task Feature LearningConvex Multi-Task Feature Learning
Convex Multi-Task Feature Learning
Sakher BELOUADAH
 
Fórmulas elementales de derivación
Fórmulas elementales de derivaciónFórmulas elementales de derivación
Fórmulas elementales de derivaciónLuis Castañeda
 
Formes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdfFormes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdf
VrazylandGuekou1
 
Localisation d’une source émettrice par un réseau d’antennes
Localisation d’une source émettrice par un réseau d’antennesLocalisation d’une source émettrice par un réseau d’antennes
Localisation d’une source émettrice par un réseau d’antennes
Ahmed Ammar Rebai PhD
 
Séries de Fourier
Séries de FourierSéries de Fourier
Séries de Fourier
Frederic Jacobs
 
103433 flexion hyperstatique
103433 flexion hyperstatique103433 flexion hyperstatique
103433 flexion hyperstatiqueAissa Ouai
 
Rapport - Partie th‚orique
Rapport - Partie th‚oriqueRapport - Partie th‚orique
Rapport - Partie th‚oriqueBelkacem KAID
 

Tendances (20)

Cours mef
Cours mefCours mef
Cours mef
 
03 théorème de gauss
03 théorème de gauss03 théorème de gauss
03 théorème de gauss
 
Cours suite
Cours suiteCours suite
Cours suite
 
Cours deplacements simplifies
Cours deplacements simplifiesCours deplacements simplifies
Cours deplacements simplifies
 
Lignes Et Cables Electriques
Lignes Et Cables ElectriquesLignes Et Cables Electriques
Lignes Et Cables Electriques
 
Recherche à voisinage variable
Recherche à voisinage variableRecherche à voisinage variable
Recherche à voisinage variable
 
L'essentiel du programme de l'agrégation de mathématiques
L'essentiel du programme de l'agrégation de mathématiquesL'essentiel du programme de l'agrégation de mathématiques
L'essentiel du programme de l'agrégation de mathématiques
 
Cours series fourier
Cours series fourierCours series fourier
Cours series fourier
 
espace etudiant.licence 1er/2 anneé
espace etudiant.licence 1er/2 anneé espace etudiant.licence 1er/2 anneé
espace etudiant.licence 1er/2 anneé
 
Intégrations sur des espaces produits
Intégrations sur des espaces produitsIntégrations sur des espaces produits
Intégrations sur des espaces produits
 
Slides cirm-copulasv3
Slides cirm-copulasv3Slides cirm-copulasv3
Slides cirm-copulasv3
 
Analyse SMIA
Analyse SMIAAnalyse SMIA
Analyse SMIA
 
harris corner detector
harris corner detectorharris corner detector
harris corner detector
 
Convex Multi-Task Feature Learning
Convex Multi-Task Feature LearningConvex Multi-Task Feature Learning
Convex Multi-Task Feature Learning
 
Fórmulas elementales de derivación
Fórmulas elementales de derivaciónFórmulas elementales de derivación
Fórmulas elementales de derivación
 
Formes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdfFormes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdf
 
Localisation d’une source émettrice par un réseau d’antennes
Localisation d’une source émettrice par un réseau d’antennesLocalisation d’une source émettrice par un réseau d’antennes
Localisation d’une source émettrice par un réseau d’antennes
 
Séries de Fourier
Séries de FourierSéries de Fourier
Séries de Fourier
 
103433 flexion hyperstatique
103433 flexion hyperstatique103433 flexion hyperstatique
103433 flexion hyperstatique
 
Rapport - Partie th‚orique
Rapport - Partie th‚oriqueRapport - Partie th‚orique
Rapport - Partie th‚orique
 

En vedette

Développement d'une identité de marque pour les rhums karukéra
Développement d'une identité de marque pour les rhums karukéraDéveloppement d'une identité de marque pour les rhums karukéra
Développement d'une identité de marque pour les rhums karukéra
H-design
 
E. Bertrand PréSentation1
E. Bertrand  PréSentation1E. Bertrand  PréSentation1
E. Bertrand PréSentation1promateria
 
Kohaference San Sebastian - Paul Poulain - Novembre 2015
Kohaference San Sebastian - Paul Poulain - Novembre 2015Kohaference San Sebastian - Paul Poulain - Novembre 2015
Kohaference San Sebastian - Paul Poulain - Novembre 2015
BibLibre
 
Mpinning Gyalg12(Analg)
Mpinning Gyalg12(Analg)Mpinning Gyalg12(Analg)
Mpinning Gyalg12(Analg)
Spimy
 
Atelier Jfk 2009 Atelier Nisand
Atelier Jfk 2009 Atelier NisandAtelier Jfk 2009 Atelier Nisand
Atelier Jfk 2009 Atelier Nisand
Pierre Trudelle
 
Infr artisans® juin2015
Infr artisans® juin2015Infr artisans® juin2015
Infr artisans® juin2015
Alain Jennepin
 
Esadelicadaflorllamadamujer
EsadelicadaflorllamadamujerEsadelicadaflorllamadamujer
Esadelicadaflorllamadamujer
Vitrubio
 
Présentation de biowallonie
Présentation de biowalloniePrésentation de biowallonie
Présentation de biowallonie
Collège des Producteurs
 
EdCamp Québec 2015 - Présentation des prix de présence
EdCamp Québec 2015 - Présentation des prix de présenceEdCamp Québec 2015 - Présentation des prix de présence
EdCamp Québec 2015 - Présentation des prix de présence
L'École branchée
 
C E P H A L O T A X A C E A E
C E P H A L O T A X A C E A EC E P H A L O T A X A C E A E
C E P H A L O T A X A C E A E
Kryztho D´ Fragg
 
Krita - Tu tambien puedes pintar un arbol Feliz
Krita - Tu tambien puedes pintar un arbol FelizKrita - Tu tambien puedes pintar un arbol Feliz
Krita - Tu tambien puedes pintar un arbol Feliz
Alexandro Colorado
 
Bambois 2016
Bambois 2016Bambois 2016
Bambois 2016
Fabrice Carlier
 
Conferencia Creatividad CampañAs Electorales
Conferencia Creatividad CampañAs ElectoralesConferencia Creatividad CampañAs Electorales
Conferencia Creatividad CampañAs Electorales
Jose Eduardo Rey Villacorta
 
Big Idea: McDonald's Remix
Big Idea: McDonald's RemixBig Idea: McDonald's Remix
Big Idea: McDonald's Remix
Marquis L. Burch
 
Projets carrières
Projets carrièresProjets carrières
Projets carrières
ShawnBreau0568
 
Totagp
TotagpTotagp
Totagp
Fatima Zahra
 
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
APESS. Association pour la Promotion de l'Elevage au Sahel et en Savane
 
Dermatologic Surgery Enero 2009
Dermatologic Surgery Enero 2009Dermatologic Surgery Enero 2009
Dermatologic Surgery Enero 2009
juangavin
 
FILOSOFÌA DE LA VIDA
FILOSOFÌA DE LA VIDAFILOSOFÌA DE LA VIDA
FILOSOFÌA DE LA VIDA
germanifa
 

En vedette (20)

Développement d'une identité de marque pour les rhums karukéra
Développement d'une identité de marque pour les rhums karukéraDéveloppement d'une identité de marque pour les rhums karukéra
Développement d'une identité de marque pour les rhums karukéra
 
E. Bertrand PréSentation1
E. Bertrand  PréSentation1E. Bertrand  PréSentation1
E. Bertrand PréSentation1
 
Kohaference San Sebastian - Paul Poulain - Novembre 2015
Kohaference San Sebastian - Paul Poulain - Novembre 2015Kohaference San Sebastian - Paul Poulain - Novembre 2015
Kohaference San Sebastian - Paul Poulain - Novembre 2015
 
Mpinning Gyalg12(Analg)
Mpinning Gyalg12(Analg)Mpinning Gyalg12(Analg)
Mpinning Gyalg12(Analg)
 
Atelier Jfk 2009 Atelier Nisand
Atelier Jfk 2009 Atelier NisandAtelier Jfk 2009 Atelier Nisand
Atelier Jfk 2009 Atelier Nisand
 
Infr artisans® juin2015
Infr artisans® juin2015Infr artisans® juin2015
Infr artisans® juin2015
 
Esadelicadaflorllamadamujer
EsadelicadaflorllamadamujerEsadelicadaflorllamadamujer
Esadelicadaflorllamadamujer
 
Présentation de biowallonie
Présentation de biowalloniePrésentation de biowallonie
Présentation de biowallonie
 
EdCamp Québec 2015 - Présentation des prix de présence
EdCamp Québec 2015 - Présentation des prix de présenceEdCamp Québec 2015 - Présentation des prix de présence
EdCamp Québec 2015 - Présentation des prix de présence
 
Plaquette stratégie HORIZON 2020
Plaquette stratégie HORIZON 2020Plaquette stratégie HORIZON 2020
Plaquette stratégie HORIZON 2020
 
C E P H A L O T A X A C E A E
C E P H A L O T A X A C E A EC E P H A L O T A X A C E A E
C E P H A L O T A X A C E A E
 
Krita - Tu tambien puedes pintar un arbol Feliz
Krita - Tu tambien puedes pintar un arbol FelizKrita - Tu tambien puedes pintar un arbol Feliz
Krita - Tu tambien puedes pintar un arbol Feliz
 
Bambois 2016
Bambois 2016Bambois 2016
Bambois 2016
 
Conferencia Creatividad CampañAs Electorales
Conferencia Creatividad CampañAs ElectoralesConferencia Creatividad CampañAs Electorales
Conferencia Creatividad CampañAs Electorales
 
Big Idea: McDonald's Remix
Big Idea: McDonald's RemixBig Idea: McDonald's Remix
Big Idea: McDonald's Remix
 
Projets carrières
Projets carrièresProjets carrières
Projets carrières
 
Totagp
TotagpTotagp
Totagp
 
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
 
Dermatologic Surgery Enero 2009
Dermatologic Surgery Enero 2009Dermatologic Surgery Enero 2009
Dermatologic Surgery Enero 2009
 
FILOSOFÌA DE LA VIDA
FILOSOFÌA DE LA VIDAFILOSOFÌA DE LA VIDA
FILOSOFÌA DE LA VIDA
 

Similaire à Comment faire disparaître les rides

en analyse des composantes de donnees.pdf
en analyse des composantes de donnees.pdfen analyse des composantes de donnees.pdf
en analyse des composantes de donnees.pdf
ELHASSANEAJARCIF1
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)mohamedchaouche
 
fctusuelle-1.pdf
fctusuelle-1.pdffctusuelle-1.pdf
fctusuelle-1.pdf
TARIQBARKI3
 
M2 An 1986 20 3 371 0
M2 An 1986  20 3 371 0M2 An 1986  20 3 371 0
M2 An 1986 20 3 371 0guest8b8369
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon ici
wospro-academy
 
slides statistique mathématique.pdf
slides statistique mathématique.pdfslides statistique mathématique.pdf
slides statistique mathématique.pdf
FadwaZiani
 
AD-CH1-FCA-MAC-2019-21.pdf
AD-CH1-FCA-MAC-2019-21.pdfAD-CH1-FCA-MAC-2019-21.pdf
AD-CH1-FCA-MAC-2019-21.pdf
MoussaouiMohammed1
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiplemohamedchaouche
 
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
ssuserf33fd0
 
Systèmes d'equations lineaires
Systèmes d'equations lineairesSystèmes d'equations lineaires
Systèmes d'equations lineairesCham Nan
 
Modelisation systemes 1ddl
Modelisation systemes 1ddlModelisation systemes 1ddl
Modelisation systemes 1ddl
MED MED
 
analyse numerique
analyse numeriqueanalyse numerique
analyse numeriquehomme00
 
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
Ahmed Ammar Rebai PhD
 
ALGEBRE BINAIRE ET CIRCUITS LOGIQUES
ALGEBRE BINAIRE ET CIRCUITS LOGIQUESALGEBRE BINAIRE ET CIRCUITS LOGIQUES
ALGEBRE BINAIRE ET CIRCUITS LOGIQUES
sarah Benmerzouk
 
Comparaison
ComparaisonComparaison
éChantillonnage estimation
éChantillonnage   estimationéChantillonnage   estimation
éChantillonnage estimationmarouane hdidou
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
afryma
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multipleafryma
 

Similaire à Comment faire disparaître les rides (20)

en analyse des composantes de donnees.pdf
en analyse des composantes de donnees.pdfen analyse des composantes de donnees.pdf
en analyse des composantes de donnees.pdf
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)
 
Statistiques
StatistiquesStatistiques
Statistiques
 
Oc1 2013
Oc1 2013Oc1 2013
Oc1 2013
 
fctusuelle-1.pdf
fctusuelle-1.pdffctusuelle-1.pdf
fctusuelle-1.pdf
 
M2 An 1986 20 3 371 0
M2 An 1986  20 3 371 0M2 An 1986  20 3 371 0
M2 An 1986 20 3 371 0
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon ici
 
slides statistique mathématique.pdf
slides statistique mathématique.pdfslides statistique mathématique.pdf
slides statistique mathématique.pdf
 
AD-CH1-FCA-MAC-2019-21.pdf
AD-CH1-FCA-MAC-2019-21.pdfAD-CH1-FCA-MAC-2019-21.pdf
AD-CH1-FCA-MAC-2019-21.pdf
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
 
Systèmes d'equations lineaires
Systèmes d'equations lineairesSystèmes d'equations lineaires
Systèmes d'equations lineaires
 
Modelisation systemes 1ddl
Modelisation systemes 1ddlModelisation systemes 1ddl
Modelisation systemes 1ddl
 
analyse numerique
analyse numeriqueanalyse numerique
analyse numerique
 
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
 
ALGEBRE BINAIRE ET CIRCUITS LOGIQUES
ALGEBRE BINAIRE ET CIRCUITS LOGIQUESALGEBRE BINAIRE ET CIRCUITS LOGIQUES
ALGEBRE BINAIRE ET CIRCUITS LOGIQUES
 
Comparaison
ComparaisonComparaison
Comparaison
 
éChantillonnage estimation
éChantillonnage   estimationéChantillonnage   estimation
éChantillonnage estimation
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 

Dernier

Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
M2i Formation
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
BenotGeorges3
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
Friends of African Village Libraries
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
Txaruka
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 

Dernier (6)

Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
 

Comment faire disparaître les rides

  • 1. Comment faire disparaître les rides Ou le statisticien esthéticien
  • 2. Comment éliminer les rides Voici un nuage de points Quelle est la tendance ?
  • 3. Contenu 1. Régression linéaire 2. Méthodes de lissage i. Lisseur à bac ii. Moyenne mobile iii. Droite mobile iv. Régression par noyau v. Régression polynomiale locale vi. Spline 3. Modèles additifs généralisés
  • 4. Notation X: La variable explicatrice. Dans le cas de variables multiples, représente la matrice des variables explicatrices. Y: La variable réponse. xi: La cible, pourrait être n’importe quelle valeur de l’espace de X, par exemple une observation de X s(xi): la valeur lissée de Y à la cible.
  • 5. Régression linéaire La régression linéaire établi un lien bien défini entre deux variables. Techniquement, la fonction est lisse, mais cela vient de la contrainte de linéarité imposée. Y =a + bX
  • 7. Lissage Aucune forme imposée Capture les caractéristiques du nuage « Lisse » Moins variable que les valeurs observées Y
  • 8. Le lisseur à bac On sépare le nuage de point en régions selon la variable X et on fait la moyenne dans chaque région
  • 11. La moyenne mobile On défini le voisinage d’une valeur xi comme étant les N points les plus proches de xi. Version symétrique: On prend les valeurs de X qui sont dans l’intervalle [i-k,i+k] On obtient donc 2K+1 = N éléments Aux extrémités, nous avons moins de points Version non-symétrique On prend l’intervalle symétrique lorsque possible Aux extrémités, 2K+1 éléments, peu importe de leur position par rapport à xi
  • 12. La moyenne mobile On prend la moyenne des Y appartenant au voisinage défini Une modification à cette procédure nous permet d’obtenir la droite mobile Au lieu de faire la moyenne des Y du voisinage, on ajuste on modèle de régression dans ce voisinage et on prend la valeur prédite. s ( xi ) = a ( xi ) + b ( xi ) xi ˆ ˆ
  • 16. Régression par le noyau Plutôt que de donné la même importance à tous les points d’un voisinage, pourquoi ne pas favoriser les points les plus proches et pénaliser les points éloignés ? On défini le poids de chaque observation pour un xi donné { l’aide d’une fonction de densité symétrique (par exemple, la loi normale) On calcule la moyenne pondérée { l’aide de ce noyau: æ xi - x j ö å d ç l ÷y j j è ø s ( xi ) = æ x - xj ö å è l ÷ dç i ø j
  • 19. Régression polynomiale locale Pour éviter les problème de l’estimateur noyau aux extrémités, on pourrait abandonner la symétrie en faveur d’un voisinage asymétrique Ainsi, on détermine le voisinage des K plus proches voisins de xi On calcule la distance au plus loin des proches-voisins D(xi) On attribue aux observations le poids suivant ì ï æ æ 3 3 ö ö ï ç1- ç xi - x j ÷ ÷ si xi - x j < D(xi ) W (x j ) = í ç ç D(xi ) ÷ ÷ ï è è ø ø ï î 0 autrement
  • 20. Régression polynomiale locale s(xi) sera la prévision à xi du modèle de régression pondéré { l’aide de ce poids.
  • 22. Splines de régression Simplifier le problème de régression en ajustant un polynôme par partie. On sépare l’espace des X en (K+1) groupes, la jonction entre deux groupe ce nomme un nœud et nous avons K nœuds internes. Dans chaque groupe on ajuste un polynôme avec une contrainte de continuité aux nœuds. s(xi ) = bo + b1 xi + b x + b x + åq j ( xi - x j )+ 2 3 3 2 i 3 i j
  • 23. Splines de régression On peut écrire l’équation précédente { l’aide de K+4 polynômes de base: K+4 s ( xi ) = å b j Pj j=1 Les polynômes Pj forment la base des B-splines.
  • 25. Splines de lissage Au lieu de séparer l’espace des X en groupes, les splines émergent naturellement du problème de régression pénalisée suivant: b å{ y - f ( x )} + l ò { f ¢¢ ( t )} dt 2 2 i i i a Je vous épargne les détails mathématiques de l’estimation
  • 27. Qu’est-ce qu’une fonction « lisse » ? La définition de lisse change selon le lisseur, mais l’objectif général est toujours d’être moins variable que les données brutes. Certains lisseurs ne sont pas généralement lisses. Le lisseur { bac est loin d’être lisse car il s’agit d’une fonction discontinue. Mais il est moins variable que les observations. Les lisseurs à moyenne mobile et à droite mobile sont continues, mais rien ne les empêche de changer rapidement et donc d’avoir une une apparence ridée.
  • 28. Trop, c’est comme pas assez La difficulté est de lissée suffisamment, sans effacer toutes les caractéristiques intéressantes de la relation (surlissage) Le choix du paramètre de lissage est donc critique Sélection automatique { l’aide de la validation croisée généralisée
  • 37. Hypothèses L’estimation des lisseurs ne requiert aucune hypothèse sur la nature des données, outre qu’il existe une forme fonctionnelle qui lie les deux variable. On pourrait vouloir comparer un lisseur à une droite de régression, dans ce cas, on doit assumer que les observations sont indépendantes et que les erreurs sont distribuées normalement.
  • 38. Et si on a plus d’une variable explicatrice ? Il existe des lisseurs de dimensions plus élevées du type f(x1,x2), etc. On peut généraliser le lisseur à bac, la moyenne mobile, la droite mobile, en effectuant un maillage On peut généraliser la régression par noyau en utilisant un noyau multidimensionnel On peut généraliser la régression polynomiale locale en définissant une distance multidimensionnelle appropriée Les splines se généralisent par ce qui est appelé « thin-plate splines »
  • 39. Et si on a plus d’une variable explicatrice ? Dans tous les cas on est confronté à la malédiction des grands nombres Il est donc peu pratique de penser pouvoir représenter librement la relation qui peut exister entre plus de deux variables explicatrices et une variable réponse
  • 40. Modèles additifs généralisés Une simplification du problème est de travailler avec une extension de la régression linéaire multiple Y = a + f1 ( X1 ) + f2 ( X2 ) Où les fonctions fi sont obtenues par lissage Conséquence: la relation entre X1 et Y est indépendante de X2
  • 41. Modèles additifs généralisés Une des hypothèses importante des modèles linéaires généralisés est l’hypothèse de linéarité, souvent difficile à valider Les modèles additifs généralisés pourraient être une piste { emprunter pour valider l’hypothèse de linéarité, ainsi que pour suggérer une forme paramétrique plus appropriée