SlideShare une entreprise Scribd logo
1  sur  41
Comment faire disparaître les
          rides
        Ou le statisticien esthéticien
Comment éliminer les rides

Voici un nuage de points   Quelle est la tendance ?
Contenu


1. Régression linéaire
2. Méthodes de lissage
  i.     Lisseur à bac
  ii.    Moyenne mobile
  iii.   Droite mobile
  iv.    Régression par noyau
  v.     Régression polynomiale locale
  vi.    Spline
3. Modèles additifs généralisés
Notation


X: La variable explicatrice. Dans le cas de variables
multiples, représente la matrice des variables
explicatrices.
Y: La variable réponse.
xi: La cible, pourrait être n’importe quelle valeur de
l’espace de X, par exemple une observation de X
s(xi): la valeur lissée de Y à la cible.
Régression linéaire


La régression linéaire établi un lien bien défini entre
deux variables.
Techniquement, la fonction est lisse, mais cela vient
de la contrainte de linéarité imposée.



             Y =a + bX
Régression linéaire
Lissage


Aucune forme imposée
Capture les caractéristiques du nuage
« Lisse »
  Moins variable que les valeurs observées Y
Le lisseur à bac


On sépare le nuage de point en régions selon la
variable X et on fait la moyenne dans chaque région
Le lisseur à bac
Le lisseur à bac
La moyenne mobile


On défini le voisinage d’une valeur xi comme étant les N
points les plus proches de xi.
Version symétrique:
  On prend les valeurs de X qui sont dans l’intervalle [i-k,i+k]
  On obtient donc 2K+1 = N éléments
  Aux extrémités, nous avons moins de points
Version non-symétrique
  On prend l’intervalle symétrique lorsque possible
  Aux extrémités, 2K+1 éléments, peu importe de leur position par
  rapport à xi
La moyenne mobile


On prend la moyenne des Y appartenant au voisinage
défini
Une modification à cette procédure nous permet
d’obtenir la droite mobile
  Au lieu de faire la moyenne des Y du voisinage, on ajuste
  on modèle de régression dans ce voisinage et on prend
  la valeur prédite.


             s ( xi ) = a ( xi ) + b ( xi ) xi
                        ˆ          ˆ
La moyenne mobile
La moyenne mobile
La droite mobile
Régression par le noyau

Plutôt que de donné la même importance à tous les
points d’un voisinage, pourquoi ne pas favoriser les
points les plus proches et pénaliser les points éloignés ?
On défini le poids de chaque observation pour un xi
donné { l’aide d’une fonction de densité symétrique
(par exemple, la loi normale)
On calcule la moyenne pondérée { l’aide de ce noyau:
                                æ xi - x j ö
                            å d ç l ÷y j
                            j è            ø
                 s ( xi ) =
                                 æ x - xj ö
                            å è l ÷
                               dç i
                                             ø
                             j
Régression par le noyau
Régression par le noyau
Régression polynomiale locale


Pour éviter les problème de l’estimateur noyau aux extrémités,
on pourrait abandonner la symétrie en faveur d’un voisinage
asymétrique
Ainsi, on détermine le voisinage des K plus proches voisins de xi
On calcule la distance au plus loin des proches-voisins D(xi)
On attribue aux observations le poids suivant

                      ì
                      ï   æ æ              3 3
                                           ö   ö
                      ï   ç1- ç xi - x j   ÷   ÷   si xi - x j < D(xi )
           W (x j ) = í   ç ç D(xi )       ÷   ÷
                      ï   è è              ø   ø
                      ï
                      î            0                  autrement
Régression polynomiale locale


s(xi) sera la prévision à xi du modèle de régression
pondéré { l’aide de ce poids.
Régression polynomiale locale
Splines de régression


Simplifier le problème de régression en ajustant un
polynôme par partie.
On sépare l’espace des X en (K+1) groupes, la jonction
entre deux groupe ce nomme un nœud et nous avons
K nœuds internes.
Dans chaque groupe on ajuste un polynôme avec une
contrainte de continuité aux nœuds.
      s(xi ) = bo + b1 xi + b x + b x + åq j ( xi - x j )+
                              2      3                   3
                            2 i    3 i
                                           j
Splines de régression


On peut écrire l’équation précédente { l’aide de K+4
polynômes de base:
                       K+4
              s ( xi ) = å b j Pj
                        j=1
Les polynômes Pj forment la base des B-splines.
Splines de régression
Splines de lissage


Au lieu de séparer l’espace des X en groupes, les
splines émergent naturellement du problème de
régression pénalisée suivant:
                                       b

            å{ y - f ( x )}       + l ò { f ¢¢ ( t )} dt
                              2                    2
                 i      i
             i                         a



Je vous épargne les détails mathématiques de
l’estimation
Splines de lissage
Qu’est-ce qu’une fonction « lisse » ?


  La définition de lisse change selon le lisseur, mais
  l’objectif général est toujours d’être moins variable
  que les données brutes.
  Certains lisseurs ne sont pas généralement lisses.
    Le lisseur { bac est loin d’être lisse car il s’agit d’une
    fonction discontinue. Mais il est moins variable que les
    observations.
    Les lisseurs à moyenne mobile et à droite mobile sont
    continues, mais rien ne les empêche de changer
    rapidement et donc d’avoir une une apparence ridée.
Trop, c’est comme pas assez


La difficulté est de lissée suffisamment, sans effacer
toutes les caractéristiques intéressantes de la relation
(surlissage)
Le choix du paramètre de lissage est donc critique
  Sélection automatique { l’aide de la validation croisée
  généralisée
Surlissage

Surlissage                Lissage
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Comparaison des lisseurs
Hypothèses


L’estimation des lisseurs ne requiert aucune
hypothèse sur la nature des données, outre qu’il
existe une forme fonctionnelle qui lie les deux
variable.
On pourrait vouloir comparer un lisseur à une droite
de régression, dans ce cas, on doit assumer que les
observations sont indépendantes et que les erreurs
sont distribuées normalement.
Et si on a plus d’une variable
           explicatrice ?


Il existe des lisseurs de dimensions plus élevées du type
f(x1,x2), etc.
  On peut généraliser le lisseur à bac, la moyenne mobile, la
  droite mobile, en effectuant un maillage
  On peut généraliser la régression par noyau en utilisant un
  noyau multidimensionnel
  On peut généraliser la régression polynomiale locale en
  définissant une distance multidimensionnelle appropriée
  Les splines se généralisent par ce qui est appelé « thin-plate
  splines »
Et si on a plus d’une variable
           explicatrice ?


Dans tous les cas on est confronté à la malédiction
des grands nombres
Il est donc peu pratique de penser pouvoir
représenter librement la relation qui peut exister
entre plus de deux variables explicatrices et une
variable réponse
Modèles additifs généralisés


Une simplification du problème est de travailler avec
une extension de la régression linéaire multiple

          Y = a + f1 ( X1 ) + f2 ( X2 )
Où les fonctions fi sont obtenues par lissage
Conséquence: la relation entre X1 et Y est
indépendante de X2
Modèles additifs généralisés


Une des hypothèses importante des modèles linéaires
généralisés est l’hypothèse de linéarité, souvent
difficile à valider
Les modèles additifs généralisés pourraient être une
piste { emprunter pour valider l’hypothèse de
linéarité, ainsi que pour suggérer une forme
paramétrique plus appropriée

Contenu connexe

Tendances

03 théorème de gauss
03 théorème de gauss03 théorème de gauss
03 théorème de gauss
Kais Kh
 
Cours deplacements simplifies
Cours deplacements simplifiesCours deplacements simplifies
Cours deplacements simplifies
m.a bensaaoud
 
Cours series fourier
Cours series fourierCours series fourier
Cours series fourier
Mehdi Maroun
 
Fórmulas elementales de derivación
Fórmulas elementales de derivaciónFórmulas elementales de derivación
Fórmulas elementales de derivación
Luis Castañeda
 
Formes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdfFormes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdf
VrazylandGuekou1
 
103433 flexion hyperstatique
103433 flexion hyperstatique103433 flexion hyperstatique
103433 flexion hyperstatique
Aissa Ouai
 
Rapport - Partie th‚orique
Rapport - Partie th‚oriqueRapport - Partie th‚orique
Rapport - Partie th‚orique
Belkacem KAID
 

Tendances (20)

Cours mef
Cours mefCours mef
Cours mef
 
03 théorème de gauss
03 théorème de gauss03 théorème de gauss
03 théorème de gauss
 
Cours suite
Cours suiteCours suite
Cours suite
 
Cours deplacements simplifies
Cours deplacements simplifiesCours deplacements simplifies
Cours deplacements simplifies
 
Lignes Et Cables Electriques
Lignes Et Cables ElectriquesLignes Et Cables Electriques
Lignes Et Cables Electriques
 
Recherche à voisinage variable
Recherche à voisinage variableRecherche à voisinage variable
Recherche à voisinage variable
 
L'essentiel du programme de l'agrégation de mathématiques
L'essentiel du programme de l'agrégation de mathématiquesL'essentiel du programme de l'agrégation de mathématiques
L'essentiel du programme de l'agrégation de mathématiques
 
Cours series fourier
Cours series fourierCours series fourier
Cours series fourier
 
espace etudiant.licence 1er/2 anneé
espace etudiant.licence 1er/2 anneé espace etudiant.licence 1er/2 anneé
espace etudiant.licence 1er/2 anneé
 
Intégrations sur des espaces produits
Intégrations sur des espaces produitsIntégrations sur des espaces produits
Intégrations sur des espaces produits
 
Slides cirm-copulasv3
Slides cirm-copulasv3Slides cirm-copulasv3
Slides cirm-copulasv3
 
Analyse SMIA
Analyse SMIAAnalyse SMIA
Analyse SMIA
 
harris corner detector
harris corner detectorharris corner detector
harris corner detector
 
Convex Multi-Task Feature Learning
Convex Multi-Task Feature LearningConvex Multi-Task Feature Learning
Convex Multi-Task Feature Learning
 
Fórmulas elementales de derivación
Fórmulas elementales de derivaciónFórmulas elementales de derivación
Fórmulas elementales de derivación
 
Formes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdfFormes bilineaire symetrique et formes quadratiques (1).pdf
Formes bilineaire symetrique et formes quadratiques (1).pdf
 
Localisation d’une source émettrice par un réseau d’antennes
Localisation d’une source émettrice par un réseau d’antennesLocalisation d’une source émettrice par un réseau d’antennes
Localisation d’une source émettrice par un réseau d’antennes
 
Séries de Fourier
Séries de FourierSéries de Fourier
Séries de Fourier
 
103433 flexion hyperstatique
103433 flexion hyperstatique103433 flexion hyperstatique
103433 flexion hyperstatique
 
Rapport - Partie th‚orique
Rapport - Partie th‚oriqueRapport - Partie th‚orique
Rapport - Partie th‚orique
 

En vedette

E. Bertrand PréSentation1
E. Bertrand  PréSentation1E. Bertrand  PréSentation1
E. Bertrand PréSentation1
promateria
 
Esadelicadaflorllamadamujer
EsadelicadaflorllamadamujerEsadelicadaflorllamadamujer
Esadelicadaflorllamadamujer
Vitrubio
 
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
APESS. Association pour la Promotion de l'Elevage au Sahel et en Savane
 

En vedette (20)

Développement d'une identité de marque pour les rhums karukéra
Développement d'une identité de marque pour les rhums karukéraDéveloppement d'une identité de marque pour les rhums karukéra
Développement d'une identité de marque pour les rhums karukéra
 
E. Bertrand PréSentation1
E. Bertrand  PréSentation1E. Bertrand  PréSentation1
E. Bertrand PréSentation1
 
Kohaference San Sebastian - Paul Poulain - Novembre 2015
Kohaference San Sebastian - Paul Poulain - Novembre 2015Kohaference San Sebastian - Paul Poulain - Novembre 2015
Kohaference San Sebastian - Paul Poulain - Novembre 2015
 
Mpinning Gyalg12(Analg)
Mpinning Gyalg12(Analg)Mpinning Gyalg12(Analg)
Mpinning Gyalg12(Analg)
 
Atelier Jfk 2009 Atelier Nisand
Atelier Jfk 2009 Atelier NisandAtelier Jfk 2009 Atelier Nisand
Atelier Jfk 2009 Atelier Nisand
 
Infr artisans® juin2015
Infr artisans® juin2015Infr artisans® juin2015
Infr artisans® juin2015
 
Esadelicadaflorllamadamujer
EsadelicadaflorllamadamujerEsadelicadaflorllamadamujer
Esadelicadaflorllamadamujer
 
Présentation de biowallonie
Présentation de biowalloniePrésentation de biowallonie
Présentation de biowallonie
 
EdCamp Québec 2015 - Présentation des prix de présence
EdCamp Québec 2015 - Présentation des prix de présenceEdCamp Québec 2015 - Présentation des prix de présence
EdCamp Québec 2015 - Présentation des prix de présence
 
Plaquette stratégie HORIZON 2020
Plaquette stratégie HORIZON 2020Plaquette stratégie HORIZON 2020
Plaquette stratégie HORIZON 2020
 
C E P H A L O T A X A C E A E
C E P H A L O T A X A C E A EC E P H A L O T A X A C E A E
C E P H A L O T A X A C E A E
 
Krita - Tu tambien puedes pintar un arbol Feliz
Krita - Tu tambien puedes pintar un arbol FelizKrita - Tu tambien puedes pintar un arbol Feliz
Krita - Tu tambien puedes pintar un arbol Feliz
 
Bambois 2016
Bambois 2016Bambois 2016
Bambois 2016
 
Conferencia Creatividad CampañAs Electorales
Conferencia Creatividad CampañAs ElectoralesConferencia Creatividad CampañAs Electorales
Conferencia Creatividad CampañAs Electorales
 
Big Idea: McDonald's Remix
Big Idea: McDonald's RemixBig Idea: McDonald's Remix
Big Idea: McDonald's Remix
 
Projets carrières
Projets carrièresProjets carrières
Projets carrières
 
Totagp
TotagpTotagp
Totagp
 
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
Dix ans après Maputo. Note APESS : Elements de bilan du soutien public à l’é...
 
Dermatologic Surgery Enero 2009
Dermatologic Surgery Enero 2009Dermatologic Surgery Enero 2009
Dermatologic Surgery Enero 2009
 
FILOSOFÌA DE LA VIDA
FILOSOFÌA DE LA VIDAFILOSOFÌA DE LA VIDA
FILOSOFÌA DE LA VIDA
 

Similaire à Comment faire disparaître les rides

(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)
mohamedchaouche
 
M2 An 1986 20 3 371 0
M2 An 1986  20 3 371 0M2 An 1986  20 3 371 0
M2 An 1986 20 3 371 0
guest8b8369
 
slides statistique mathématique.pdf
slides statistique mathématique.pdfslides statistique mathématique.pdf
slides statistique mathématique.pdf
FadwaZiani
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
mohamedchaouche
 
Systèmes d'equations lineaires
Systèmes d'equations lineairesSystèmes d'equations lineaires
Systèmes d'equations lineaires
Cham Nan
 
analyse numerique
analyse numeriqueanalyse numerique
analyse numerique
homme00
 
éChantillonnage estimation
éChantillonnage   estimationéChantillonnage   estimation
éChantillonnage estimation
marouane hdidou
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
afryma
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
afryma
 

Similaire à Comment faire disparaître les rides (20)

en analyse des composantes de donnees.pdf
en analyse des composantes de donnees.pdfen analyse des composantes de donnees.pdf
en analyse des composantes de donnees.pdf
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)
 
Statistiques
StatistiquesStatistiques
Statistiques
 
Oc1 2013
Oc1 2013Oc1 2013
Oc1 2013
 
fctusuelle-1.pdf
fctusuelle-1.pdffctusuelle-1.pdf
fctusuelle-1.pdf
 
M2 An 1986 20 3 371 0
M2 An 1986  20 3 371 0M2 An 1986  20 3 371 0
M2 An 1986 20 3 371 0
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon ici
 
slides statistique mathématique.pdf
slides statistique mathématique.pdfslides statistique mathématique.pdf
slides statistique mathématique.pdf
 
AD-CH1-FCA-MAC-2019-21.pdf
AD-CH1-FCA-MAC-2019-21.pdfAD-CH1-FCA-MAC-2019-21.pdf
AD-CH1-FCA-MAC-2019-21.pdf
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
Electrostatique et Electrocinetique. Rappel de cours et exercices corriges de...
 
Systèmes d'equations lineaires
Systèmes d'equations lineairesSystèmes d'equations lineaires
Systèmes d'equations lineaires
 
Modelisation systemes 1ddl
Modelisation systemes 1ddlModelisation systemes 1ddl
Modelisation systemes 1ddl
 
analyse numerique
analyse numeriqueanalyse numerique
analyse numerique
 
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
Sujet et Correction épreuve de mathématiques ESSEC ECE 2012
 
ALGEBRE BINAIRE ET CIRCUITS LOGIQUES
ALGEBRE BINAIRE ET CIRCUITS LOGIQUESALGEBRE BINAIRE ET CIRCUITS LOGIQUES
ALGEBRE BINAIRE ET CIRCUITS LOGIQUES
 
Comparaison
ComparaisonComparaison
Comparaison
 
éChantillonnage estimation
éChantillonnage   estimationéChantillonnage   estimation
éChantillonnage estimation
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 
Laffly regression multiple
Laffly regression multipleLaffly regression multiple
Laffly regression multiple
 

Dernier

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
Faga1939
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 

Dernier (18)

Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Cours
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 

Comment faire disparaître les rides

  • 1. Comment faire disparaître les rides Ou le statisticien esthéticien
  • 2. Comment éliminer les rides Voici un nuage de points Quelle est la tendance ?
  • 3. Contenu 1. Régression linéaire 2. Méthodes de lissage i. Lisseur à bac ii. Moyenne mobile iii. Droite mobile iv. Régression par noyau v. Régression polynomiale locale vi. Spline 3. Modèles additifs généralisés
  • 4. Notation X: La variable explicatrice. Dans le cas de variables multiples, représente la matrice des variables explicatrices. Y: La variable réponse. xi: La cible, pourrait être n’importe quelle valeur de l’espace de X, par exemple une observation de X s(xi): la valeur lissée de Y à la cible.
  • 5. Régression linéaire La régression linéaire établi un lien bien défini entre deux variables. Techniquement, la fonction est lisse, mais cela vient de la contrainte de linéarité imposée. Y =a + bX
  • 7. Lissage Aucune forme imposée Capture les caractéristiques du nuage « Lisse » Moins variable que les valeurs observées Y
  • 8. Le lisseur à bac On sépare le nuage de point en régions selon la variable X et on fait la moyenne dans chaque région
  • 11. La moyenne mobile On défini le voisinage d’une valeur xi comme étant les N points les plus proches de xi. Version symétrique: On prend les valeurs de X qui sont dans l’intervalle [i-k,i+k] On obtient donc 2K+1 = N éléments Aux extrémités, nous avons moins de points Version non-symétrique On prend l’intervalle symétrique lorsque possible Aux extrémités, 2K+1 éléments, peu importe de leur position par rapport à xi
  • 12. La moyenne mobile On prend la moyenne des Y appartenant au voisinage défini Une modification à cette procédure nous permet d’obtenir la droite mobile Au lieu de faire la moyenne des Y du voisinage, on ajuste on modèle de régression dans ce voisinage et on prend la valeur prédite. s ( xi ) = a ( xi ) + b ( xi ) xi ˆ ˆ
  • 16. Régression par le noyau Plutôt que de donné la même importance à tous les points d’un voisinage, pourquoi ne pas favoriser les points les plus proches et pénaliser les points éloignés ? On défini le poids de chaque observation pour un xi donné { l’aide d’une fonction de densité symétrique (par exemple, la loi normale) On calcule la moyenne pondérée { l’aide de ce noyau: æ xi - x j ö å d ç l ÷y j j è ø s ( xi ) = æ x - xj ö å è l ÷ dç i ø j
  • 19. Régression polynomiale locale Pour éviter les problème de l’estimateur noyau aux extrémités, on pourrait abandonner la symétrie en faveur d’un voisinage asymétrique Ainsi, on détermine le voisinage des K plus proches voisins de xi On calcule la distance au plus loin des proches-voisins D(xi) On attribue aux observations le poids suivant ì ï æ æ 3 3 ö ö ï ç1- ç xi - x j ÷ ÷ si xi - x j < D(xi ) W (x j ) = í ç ç D(xi ) ÷ ÷ ï è è ø ø ï î 0 autrement
  • 20. Régression polynomiale locale s(xi) sera la prévision à xi du modèle de régression pondéré { l’aide de ce poids.
  • 22. Splines de régression Simplifier le problème de régression en ajustant un polynôme par partie. On sépare l’espace des X en (K+1) groupes, la jonction entre deux groupe ce nomme un nœud et nous avons K nœuds internes. Dans chaque groupe on ajuste un polynôme avec une contrainte de continuité aux nœuds. s(xi ) = bo + b1 xi + b x + b x + åq j ( xi - x j )+ 2 3 3 2 i 3 i j
  • 23. Splines de régression On peut écrire l’équation précédente { l’aide de K+4 polynômes de base: K+4 s ( xi ) = å b j Pj j=1 Les polynômes Pj forment la base des B-splines.
  • 25. Splines de lissage Au lieu de séparer l’espace des X en groupes, les splines émergent naturellement du problème de régression pénalisée suivant: b å{ y - f ( x )} + l ò { f ¢¢ ( t )} dt 2 2 i i i a Je vous épargne les détails mathématiques de l’estimation
  • 27. Qu’est-ce qu’une fonction « lisse » ? La définition de lisse change selon le lisseur, mais l’objectif général est toujours d’être moins variable que les données brutes. Certains lisseurs ne sont pas généralement lisses. Le lisseur { bac est loin d’être lisse car il s’agit d’une fonction discontinue. Mais il est moins variable que les observations. Les lisseurs à moyenne mobile et à droite mobile sont continues, mais rien ne les empêche de changer rapidement et donc d’avoir une une apparence ridée.
  • 28. Trop, c’est comme pas assez La difficulté est de lissée suffisamment, sans effacer toutes les caractéristiques intéressantes de la relation (surlissage) Le choix du paramètre de lissage est donc critique Sélection automatique { l’aide de la validation croisée généralisée
  • 37. Hypothèses L’estimation des lisseurs ne requiert aucune hypothèse sur la nature des données, outre qu’il existe une forme fonctionnelle qui lie les deux variable. On pourrait vouloir comparer un lisseur à une droite de régression, dans ce cas, on doit assumer que les observations sont indépendantes et que les erreurs sont distribuées normalement.
  • 38. Et si on a plus d’une variable explicatrice ? Il existe des lisseurs de dimensions plus élevées du type f(x1,x2), etc. On peut généraliser le lisseur à bac, la moyenne mobile, la droite mobile, en effectuant un maillage On peut généraliser la régression par noyau en utilisant un noyau multidimensionnel On peut généraliser la régression polynomiale locale en définissant une distance multidimensionnelle appropriée Les splines se généralisent par ce qui est appelé « thin-plate splines »
  • 39. Et si on a plus d’une variable explicatrice ? Dans tous les cas on est confronté à la malédiction des grands nombres Il est donc peu pratique de penser pouvoir représenter librement la relation qui peut exister entre plus de deux variables explicatrices et une variable réponse
  • 40. Modèles additifs généralisés Une simplification du problème est de travailler avec une extension de la régression linéaire multiple Y = a + f1 ( X1 ) + f2 ( X2 ) Où les fonctions fi sont obtenues par lissage Conséquence: la relation entre X1 et Y est indépendante de X2
  • 41. Modèles additifs généralisés Une des hypothèses importante des modèles linéaires généralisés est l’hypothèse de linéarité, souvent difficile à valider Les modèles additifs généralisés pourraient être une piste { emprunter pour valider l’hypothèse de linéarité, ainsi que pour suggérer une forme paramétrique plus appropriée