SlideShare une entreprise Scribd logo
1  sur  139
Télécharger pour lire hors ligne
institut de science financiere et d’assurances                      laboratoire saf



 Université Claude Bernard Lyon 1
 Institut de Science Financière et d’Assurances




 Introduction aux méthodes de lissage
 par vraisemblance locale
 Applications à l’assurance dépendance

 Julien Tomas
 Institut de Science Financière et d’Assurances
 Laboratoire de recherche de Sciences Actuarielle et Financière




 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
 Slide 1/138
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 2/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 3/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        L’assurance dépendance


            • Mix de prestations sociales et santé fournit sur une base
                    journalière, à domicile ou dans une institution, à des individus
                    souffrant d’une perte de mobilité ou d’autonomie dans leur activité
                    journalière.
            • Peut être individuelle ou collective.
            • Garantit le paiement d’une indemnité, sous la forme d’un bénéfice
                    numéraire qui peut être proportionnel au degré de dépendance.
            • Voir Kessler (2008) et Courbage et Roudaut (2011) pour des
                    études sur le marché français de l’assurance dépendance.




Slide 4/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        L’assurance dépendance

            • Niveaux des primes et des réserves ainsi que la gestion d’une
              portefeuille d’assurance dépendance sont très sensibles au choix de
              la table de mortalité adoptée.
            • Construction d’une table est un exercice difficile :
                         • petits portefeuilles et taux de mortalité très volatiles,
                         • lien fort entre l’âge de survenance et la pathologie.
                           Nécessite de construire des tables de mortalité en fonction de l’âge
                           de survenance et l’ancienneté,
                         • les taux de mortalité diminuent très rapidement avec l’ancienneté.
            • En pratique, on utilise des méthodes qui s’appuient lourdement sur
                    les opinions d’expert.
            • Le but : avoir des méthodes plus rigoureuses



Slide 5/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        L’assurance dépendance
        Analyse de la mortalité




        Analyser les variations de la mortalité en fonction de
            • l’âge de survenance de la pathologie v ,
            • et de l’ancienneté u (mois).

        On a donc 2 variables temporelles, mais elles n’ont pas le même statut :
            • v représente l’hétérogénéité,
            • u est la variable de durée.




Slide 6/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 7/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Notions démographiques et notation
        Durée de vie restante




            • Soit Tu (v ) la durée de vie restante d’un individu dont la
                    pathologie survient à l’âge v et dont l’ancienneté est u, i.e.

                                    P[Tu (v ) > ξ] = P[T (v ) > u + ξ|T (v ) > u] = ξ pu (v ).

            • Donc, un individu dont la pathologie survient à l’âge v et
                    d’ancienneté u décèdera à l’ancienneté u + Tu (v ).
            • La fdc de Tu (v ) est

                    ξ qu (v )        = 1 − ξ pu (v ) = P[Tu (v ) < ξ] = P[T (v ) ≤ u + ξ|T (v ) > u].




Slide 8/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Notions démographiques et notation
        Probabilité de survie / décès dans le mois


            • La probabilité de décès dans le mois lorsque la pathologie survient
                    à l’âge v et dont l’ancienneté est u est définie par

                                     qu (v ) = P[Tu (v ) ≤ 1] = P[T (v ) ≤ u + 1|T (v ) > u].

            • La probabilité de survie dans le mois lorsque la pathologie survient
                    à l’âge v et dont l’ancienneté est u est

                                     pu (v ) = P[Tu (v ) > 1] = P[T (v ) > u + 1|T (v ) > u].

            • On a donc pour un entier k,

                         k pu (v )         = P[Tu (v ) > k] = pu (v ) × pu+1 (v ) × . . . × pu+k−1 (v ).


Slide 9/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Notions démographiques et notation
        Nombre espéré de survivants


            • Soit Lu,v le nombre d’individus vivant lorsque la pathologie est
                    survenue à l’âge v et dont l’ancienneté est u en commençant par
                     0 (v ) individus touché par la pathologie. Le nombre espéré
                    d’individus atteignant l’ancienneté u à partir de 0 (v ) individus est

                                                              E[Lu,v ] =                 u,v     =        0 (v )      × u p0 (v ).

            • La fonction (u, v ) → u,v est assumée être continue et
                    différenciable.
            • Du,v = Lu,v − Lu+1,v est le nombre de décès à l’ancienneté u et
                    lorsque la pathologie est survenue à l’âge v , et

                          E[Du,v ] = du,v =                             u,v    −        u+1,v         =       u,v (1       − pu (v )) =                     u,v qu (v ).



Slide 10/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Notions démographiques et notation
        Exposition au risque

            • L’exposition au risque mesure le temps durant lequel les individus
                    sont exposés au risque (de décès) après survenance de la
                    pathologie. Il s’agit de la durée totale vécue par ces individus après
                    la survenance de la maladie.
            • La durée espérée vécue par les individus entre l’ancienneté u et
                    u + 1 est donnée par
                                                               1                                                                        1
                                    ERu,v =                           Lu+ξ,v dξ et E[ERu,v ] =                                                   u+ξ,v           dξ.
                                                             ξ=0                                                                      ξ=0

            • le taux de mortalité à l’ancienneté u lorsque la pathologie survient
                    à l’âge v est
                                                                                                        du,v
                                                                              mu (v ) =                         .
                                                                                                      E[ERu,v ]

Slide 11/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Notions démographiques et notation
        Forces de mortalité


            • La force de mortalité à l’ancienneté u + τ lorsque la pathologie
                    survient à l’âge v , notée ϕu+τ (v ) est définie par

                                                                    P [τ < Tu (v ) ≤ τ + ∆τ |Tu (v ) > τ ]
                                   ϕu+τ (v ) =                     lim +
                                                           ∆τ →0                     ∆τ
                                                              1      ∂
                                                         =              τ qu (v ).
                                                           τ pu (v ) ∂τ

            • Une expansion de Taylor au premier ordre donne

                         ∆τ qu (v )            = ϕu (v )∆τ + o(∆τ ) ⇒ ∆τ qu (v ) ≈ ϕu (v )∆τ
                         ∆τ pu (v )            = 1 − ϕu (v )∆τ + o(∆τ ) ⇒ ∆τ pu (v ) ≈ 1 − ϕu (v )∆τ

                    Pour ∆τ suffisamment petit.

Slide 12/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Notions démographiques et notation
        Quelques formules utiles...



            • On remarque que ∂τ ln τ pu (v ) = −ϕu+τ (v ). On obtient, avec la
                              ∂

                    condition 0 pu (v ) = 1,
                                                                                                         τ
                                                         τ pu (v )         = exp −                              ϕu+ξ (v ) dξ .
                                                                                                       ξ=0

            • La fonction de densité de Tu (v ) est ∂τ τ qu (v ) = τ pu (v )ϕu+τ (v )
                                                    ∂

                    et en résolvant cette équation différentielle avec 0 qu (v ) = 0, on
                    obtient
                                                                                                 τ
                                                τ qu (v )         = exp −                               ξ pu (v ) ϕu+ξ (v ) dξ                           .
                                                                                              ξ=0




Slide 13/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Notions démographiques et notation
        Espérance de vie



            • La durée de vie restante moyenne d’un individu dont la pathologie
                    est apparue à l’âge v et d’ancienneté u est notée eu (v ).
            • Concrètement on s’attend à ce qu’un individu d’ancienneté u et
                    dont la pathologie survient à l’âge v décède à l’ancienneté
                    u + eu (v ).
            • On exprime eu (v ) par

                                     eu (v ) = E[Tu (v )] =                                         ξ dξ qu (v ) =                            ξ pu (v ) dξ
                                                                                          ξ≥0                                        ξ≥0
                                                             1
                                                    =                               u+ξ,v        dξ.
                                                             u,v        ξ≥0




Slide 14/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 15/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Hypothèse de mortalité constante par morceaux
        Hypothèse

            • Dorénavant on fait l’hypothèse de constance par morceaux des
                    forces de mortalité, i.e.

                     ϕu+ξ (v + ζ) = ϕu (v ) pour 0 ≤ ξ < 1 et 0 ≤ ζ < 1 et u, v entiers

            • Sous cette hypothèse,

                                           ϕu (v ) = − ln pu (v )
                                                                       1                                                   1
                                    E[ERu,v ] =                                 u+ξ,v        dξ =             u,v                 ξ pu (v ) dξ
                                                                    ξ=0                                                 ξ=0
                                                                                1                                          − u,v qu (v )
                                                           =       u,v                (pu (v ))ξ dξ =
                                                                             ξ=0                                          ln(1 − qu (v ))
                                                       1                                     1
                                          mu (v ) =                                                   u+ξ,v         ϕu+ξ (v ) dξ = ϕu (v ).
                                                    E[ERu,v ]                              ξ=0

Slide 16/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Hypothèse de mortalité constante par morceaux
        Modélisation



            • A chacune des observations, on associe une indicatrice δi indiquant
                    si l’individu est décédé ou non,

                                                                           1 si l’individu i est décédé,
                                                        δi =
                                                                           0 sinon,

                    pour i = 1, . . . , Lu,v .
            • On définie τi , le temps durant lequel l’individu a été observé (c’est
                    l’exposition au risque).
            • On suppose avoir à disposition pour chacun des Lu,v individus les
                    observations (δi ,τi ).



Slide 17/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Hypothèse de mortalité constante par morceaux
        Contribution de l’individu i à la vraisemblance



            • La contribution du ième individu à la vraisemblance s’écrit,
                • si l’individu survie à la (u + 1)ème ancienneté (δi = 0, τi = 1) alors :

                                                                                  pu (v ) = exp(−ϕu (v ));

                        • si l’individu décède avant la (u + 1)ème ancienneté (δi = 1, τi < 1)
                               alors :
                                                              τi pu (v )       ϕu+τi (v ) = exp(−τi ϕu (v ))ϕu (v ).
            • La contribution de l’individu i à la vraisemblance vaut donc

                                                                       exp(−τi ϕu (v ))(ϕu (v ))δi .




Slide 18/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Hypothèse de mortalité constante par morceaux
        Ecriture de la vraisemblance


            • On définit
                                                               Lu,v                                        Lu,v
                                                                       τi = ERu,v et                                δi = Du,v .
                                                               i=1                                         i=1
            • Sous ces hypothèses, la vraisemblance devient

                                                                               Lu,v
                                               L(ϕu (v )) =                            exp(−τi ϕu (v ))(ϕu (v ))δi
                                                                               i=1
                                                                        = exp(−ERu,v ϕu (v ))(ϕu (v ))Du,v ,

            • et la log-vraisemblance associée est

                                           log L(ϕu (v )) = −ERu,v ϕu (v ) + Du,v log ϕu (v ).


Slide 19/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Hypothèse de mortalité constante par morceaux
        Lien avec la loi de Poisson
            • En Maximisant la log-vraisemblance log L(ϕu (v )) on obtient
                    l’estimateur du maximum de vraisemblance de ϕu (v ), à savoir
                                                                             ϕu (v ) = Du,v /ERu,v
                    qui coïncide avec le taux de mortalité mu (v ).
            • La vraisemblance L(ϕu (v )) est proportionnelle à la vraisemblance
                    de Poisson basée sur Du,v ∼ Poisson(ERu,v ϕu (v )).
            • Il est équivalent de travailler avec la vraie vraisemblance ou à
                    partir d’une vraisemblance de Poisson.
            • Donc sous l’hypothèse de la mortalité constante par morceaux
                    entre des valeurs non-entières u and v , on considère
                                                                 Du,v ∼ Poisson(ERu,v ϕu (v )),                                                                  (1)
                    pour pouvoir utiliser le cadre de travail des modèles linéaires
                    généralisés (GLMs).
Slide 20/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 21/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Présentation des données


        Analyse les variations de la mortalité en fonction de l’âge de survenance
        de la pathologie v et de l’ancienneté u (mois). On observe :
            • la plage d’âge de survenance : v ∈ [70, 90] ans pour la survenance,
            • la durée de dépendance (l’ancienneté) : u ∈ [0, 119] mois,
            • sur la période : 01/01/1998 à 31/12/2010.
        Les données on été agrégées selon l’âge de survenance et l’ancienneté.
        Les pathologies sont composées entre autres de démences, maladies
        neurologiques et de cancers en phase terminale. Les données sont
        composées de 2/3 de femmes et 1/3 d’hommes.




Slide 22/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Présentation des données (suite)




             (a) Nombre de décès,                                  (b) Exposition au risque, (c) Forces de mortalité,
                    Du,v                                                    ERu,v                     ϕu (v )

                                                             Figure: Statistiques observées
Slide 23/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Présentation des données (suite)
        Notation



        Par la suite, on réécrit les données en un vecteur colonne
            • Une matrice A de dimension m × n est réécrite en un vecteur
                    colonne mn × 1 en empilant les colonnes de la matrice A l’une sur
                    l’autre :

                            vec(A) = (a1,1 , . . . , am,1 , a1,2 , . . . , am,2 , . . . , a1,n , . . . , am,n )T .

            • On dispose de n quintuplets d’observations
                    {(ui , vi , ERi , Di , ϕi )}n , ou n = 2520.
                                                i=1
        Pour simplifier, le point (ui , vi ) est noté xi .




Slide 24/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 25/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Irrégularités dans la progression des taux observées


            • Ces estimations brutes, sur lesquelles se basent les tables de
                    mortalité, peuvent être considérées comme un échantillon
                    provenant d’une population plus importante et sont, par
                    conséquent, soumises à des fluctuations aléatoires.
            • Toutefois, l’actuaire souhaite la plupart du temps lisser ces
                    quantités afin de mettre en avant les caractéristiques de la
                    mortalité du groupe qu’il pense être régulières.
            • Ces irrégularités dans la progression des forces de mortalité
                    pourraient être réduites en augmentant le nombre Lu,v de
                    personnes observées.
            • Une méthode plus pratique est de graduer les données pour
                    éliminer partiellement ces erreurs aléatoires.


Slide 26/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Approche paramétrique VS non-paramétrique

        Plusieurs approches de graduation peuvent être adoptée.
            • Approches paramétriques, impliquant l’utilisation de loi de
                    mortalité
            • Approches non-paramétriques
        La relation entre les forces de mortalité, l’ancienneté et l’âge à la
        survenance peut être modélisée par

                                                          ϕi = ψ(xi ) + i , i = 1, . . . , n,

        où ψ est une fonction de régression inconnue et i un terme d’erreur
        représentant les erreurs aléatoires dans les observations ou variations
        qui ne sont pas incluses dans les xi = (ui , vi ).
        Le but de toute régression est de fournir une analyse raisonnable de la
        fonction de réponse inconnue ψ.

Slide 27/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Approche paramétrique VS non-paramétrique (suite)



            • Les approches paramétriques supposent que la fonction de réponse
                    ψ à une forme pré-spécifiée (par exemple, loi de Thiele, loi de
                    Perks, modèles de classe Gompertz-Makeham, etc...). La relation
                    est alors pleinement décrite par un nombre fini de paramètres.
            • Un modèle paramétrique pré-sélectionné peut être trop restrictif
                    pour modéliser les caractéristiques de la mortalité.
            • La modélisation non-paramétrique offre un outil flexible dans
                    l’analyse de la relation. Comme les méthodes paramétriques, elles
                    sont susceptibles de donner des estimations biaisées, mais de telles
                    sorte qu’il est possible d’équilibrer une augmentation du biais avec
                    une diminution de la variation d’échantillonnage.



Slide 28/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Approche paramétrique VS non-paramétrique (suite)


        La question de quelle approche devrait être adoptée dans l’analyse de
        données était l’une des raisons d’un discussion houleuse entre Pearson
        et Fisher dans les années 1920.
            • Fisher soulignant que l’approche non-paramétrique est
              généralement peu efficace alors que Pearson était plus préoccupé
              par la question de spécification.
            • Les deux points de vue sont intéressants en eux-mêmes :
                        • Pearson a fait remarquer que le prix que nous devons payer pour
                          une modélisation purement paramétrique est la possibilité d’une
                          erreur de spécification lourde entraînant un biais de modèle élevé.
                        • Fisher était préoccupé par la considération de modèles sans
                          paramètres qui peuvent résulter dans des estimations plus variables
                          surtout pour des échantillons de taille réduite.


Slide 29/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Natura non agit per saltum : L’idée basique du lissage



            • Chaque force de mortalité est lié étroitement à ses voisines.
            • Les observations ϕj dans le voisinage de ϕi contiennent de
                    l’information à propos de la valeur de ψ à xi = (ui , vi ).
            • Les forces de la nature opèrent graduellement et leurs effets
                    deviennent visibles de façon continue et non par des sauts
                    brusques.
            • Cela implique que les observations ϕj , dans un rayon d’un point xi ,
                    peuvent être utilisées pour augmenter l’information que nous avons
                    à xi et une estimation améliorée de ϕi peut être obtenue en lissant
                    les estimations individuelles ϕj .



Slide 30/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Natura non agit per saltum : L’idée basique du lissage (suite)




            • Cette procédure d’approximation de la fonction de réponse ψ est
                    communément appelée lissage.
            • Ainsi la mortalité n’est pas résumé en a petit nombre de
                    paramètres mais décrite par les n forces de mortalité.
            • Dans la littérature actuarielle, ce procédé est connu sous le terme
                    de graduation. Les petites collines et vallées des données brutes
                    sont graduées jusqu’à devenir lisses, comme lorsque l’on construit
                    une route sur un terrain accidenté.




Slide 31/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Développement historique


            • Les méthodes de lissage sont des extensions directes des modèles
                    paramétriques, si naturelles qu’elles se sont développées à des
                    périodes et dans des pays différents à la fin du 18ème siècle. La
                    plupart sont apparues dans des études actuarielles. Les taux de
                    mortalité et de maladies étaient lissés selon une fonction de l’âge.
            • Premières références : Johann Lambert en 1765, John Finlaison en
                    1823, Wesley Woolhouse en 1866, De Forest en 1873, Thomas
                    Sprague en 1887, John Spencer en 1904, Robert Henderson en
                    1916 and Edmund Whittaker en 1923.
            • Cependant les régressions locales ont reçu que peu d’attention
                    jusqu’à la fin des années 1970. Voir Seal (1982), Haberman (1996)
                    et Loader (1999) pour une revue historique.


Slide 32/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Prémisses sur les modèles de lissage
        Développement historique (suite)

            • Les méthodes de régression locale sont originaires des méthodes à
                    noyaux introduites par Rosenblatt (1956) et Parzen (1962).
            • La méthode à noyaux est un cas spécial de la régression locale où
                    la famille paramétrique est une fonction constante.
            • Applications actuarielles des méthodes à noyaux : Copas et
                    Haberman (1983) et Gavin et collab. (1993).
            • Les régressions locales ont connu un regain d’intérêt après les
                    développements de Stone (1977) et Stone (1982) et la procédure
                    loess de Cleveland (1979).
            • Tibshirani et Hastie (1987) ont introduit la procédure de
                    vraisemblance locale, et ont étendu le domaine des méthodes de
                    lissage à d’autres distributions que gaussienne. Extensions : Loader
                    (1996), Fan et collab. (1998) et Loader (1999).

Slide 33/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 34/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Les modèles linéaires généralisés

            • Durant les trente dernières années, l’utilisation des GLMs (Nelder
                    et Wedderburn (1972)) a reçu beaucoup d’attention depuis les
                    applications de McCullagh et Nelder (1989).
            • Les GLMs sont idéalement adaptés à l’analyse de données
              non-normales que l’on rencontre typiquement lorsque l’on
              s’intéresse à des sujets relatifs à l’assurance.
            • La modélisation diffère des modèles linéaires gaussiens par deux
              importants aspects :
                        • La distribution de la variable dépendante est choisie dans la famille
                          exponentielle et n’est donc pas spécifiquement Normale mais peut
                          être explicitement non-Normale.
                        • Une transformation de l’espérance de la variable dépendante est
                          linéairement liée aux variables explicatives.



Slide 35/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Les modèles linéaires généralisés
        Caractéristiques




        Les modèles linéaires généralisés possèdent 3 caractéristiques :
            • Un élément aléatoire, qui établit que les observations sont des
                    variables aléatoires indépendantes Yi , i = 1, . . . , n avec une densité
                    appartenant à la famille exponentielle linéaire.
            • Un élément systématique qui attribut à chaque observation un
                    prédicteur linéaire ηi .
            • Un troisième élément qui connecte les deux premiers éléments : µi
                    l’espérance de Yi est lié au prédicteur linéaire ηi par une fonction
                    de lien.




Slide 36/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Les modèles linéaires généralisés
        La famille exponentielle linéaire



            • La technique des GLMs s’applique à toutes distributions
                    appartenant à la famille exponentielle, i.e. lorsque la variable
                    dépendante Yi à une loi de probabilité de la forme

                                                                                              yi θi − b(θi )
                                                f (yi |θi , φ) = exp                                         + c(yi , φ) ,
                                                                                                   a(φ)

                    pour des fonctions a(), b() and c() spécifiques. Les fonctions a
                    and c sont telles que a(φ) = φ and c = c(yi , φ).
                    θi est le paramètre canonique (ou paramètre naturel) et φ est le
                    paramètre de dispersion.



Slide 37/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Les modèles linéaires généralisés
        La famille exponentielle linéaire (suite)
        Exemple d’une loi de Poisson :.

             Distribution de yi                             θi             a(φ)             b(θi )              c(yi , φ)              E[Yi ]           V[µi ] =      V[Yi ]
                                                                                                                                                                      a(φ)

                          Poisson(µi )                  ln(µi )               1           exp(θi )             − log yi !                 µi                     µi

                          Table: Loi de Poisson appartenant à la famille exponentielle.


        L’espérance et la variance sont calculées comme la première et seconde
        dérivées de b(θi ) :

                                ∂           ∂b ∂µi
           E[Yi ] =                b(θi ) =         = µi
                                ∂θ          ∂µi ∂θi
                                                                                                                      2
                                           ∂2                 ∂2b                                        ∂µi                     ∂b ∂ 2 µi
           V[Yi ] = a(φ)                        b(θi ) = a(φ)                                                             +                                  = a(φ)µi .
                                           ∂θi2               ∂µ2
                                                                i                                        ∂θi                     ∂µi ∂θi2

Slide 38/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Les modèles linéaires généralisés
        Qu’est-ce que veut dire linéaire dans GLMs
            • "Linéaire" signifie que les variables explicatives sont combinées
              linéairement pour modéliser l’espérance.
            • Si x1 , x2 , . . . , xp sont des variables explicatives alors des
              combinaisons linéaires de la forme β0 + β1 x1 + . . . + βp xp servent
              comme des prédicteurs linéaires de l’espérance de la variable
              dépendante.
            • La linéarité dans les GLMs se réfère seulement à la linéarité dans
              les coefficients βj , non dans les variables explicatives.
            • Par exemple,

                                      β0 + β1 x1 + β2 x1 and β0 + β1 x1 + β2 x2 + β3 x1 x3
                                                       2


                    sont "linéaires" au sens définie par les GLMs, mais
                                                                         β0 + β1 x1 + exp(β2 x2 )
                    ne l’est pas.
Slide 39/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Les modèles linéaires généralisés
        Fonction de lien

            • µi = E [Yi |xi ], i = 1, 2, . . . , n, est liée au prédicteur linéaire ηi par
                    une fonction de lien g() monotone et différenciable

                                                                    g(µi ) = ηi ⇔ µi = g −1 (ηi )

            • La fonction de lien est dite canonique lorsque θi = ηi , où θi est le
                    paramètre canonique.
            • la fonction de lien canonique assure donc que g(µi ) = θi et
                    g −1 = b () (puisque µi = b (θi )).

                                                                                                 Lien canonique
                                                                           Poisson               ηi = log(µi )

                                                  Table: Lien canonique pour la loi de Poisson


Slide 40/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 41/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Des GLMs à la vraisemblance locale
            • L’approche GLM fait l’hypothèse que θi a une forme paramétrique
                    spécifique, e.g.

                                             θi = β0 + β1 ui + β2 vi + β3 ui2 + β4 ui vi + β5 vi2
                                                   ≡ x T β,

                    où x = (1, ui , vi , ui2 , ui vi , vi2 )T et β = (β0 , . . . , β5 )T .
            • L’approche de la vraisemblance locale ne fait plus l’hypothèse que
                    θi a une forme paramétrique rigide.
            • On suppose que θi est une fonction lisse non-spécifiée ψ(xi ) qui a
                    (p + 1) dérivées continues au point xi .
            • L’idée est : ajuster un modèle polynomial à l’intérieur d’une fenêtre
                    d’observation.
                                                     ⇒ Penser au développement de Taylor.

Slide 42/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Des GLMs à la vraisemblance locale
        Expansion de Taylor

            • Pour xj dans le voisinage de xi , on va approximer ψ(xj ) via une
                    expansion de Taylor par un polynôme de degré p, e.g. une
                    approximation quadratique :

                                 ψ(xj ) = ψ(uj , vj )
                                                                ∂ψ(ui , vi )              ∂ψ(ui , vi )
                                               ≈ ψ(ui , vi ) +               (uj − ui ) +              (vj − vi )
                                                                    ∂ui                        ∂vi
                                                1 ∂ 2 ψ(ui , vi )                ∂ψ(ui , vi )
                                              +                   (uj − ui )2 +               (uj − ui )(vj − vi )
                                                2        2
                                                       ∂ui                        ∂vi ∂ui
                                                    1 ∂ 2 ψ(ui , vi )
                                              +                       (vj − vi )2 ≡ x T β,
                                                    2      ∂vi2
                                                                                                                                                                 T
                    où x = 1, uj − ui , vj − vi , (uj − ui )2 , (uj − ui )(vj − vi ), (vj − vi )2
                                                                                                           2
                                                                                                               ψ(ui ,vi ) ∂ψ(ui ,vi ) 1 ∂ 2 ψ(ui ,vi )
                    et β = ψ(ui , vi ), ∂ψ(uii,vi ) , ∂ψ(uii,vi ) , 1 ∂
                                          ∂u            ∂v          2                                           ∂ui2
                                                                                                                         , ∂vi ∂ui 2 ∂v 2                        .
                                                                                                                                               i



Slide 43/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Des GLMs à la vraisemblance locale
        Ecriture de la vraisemblance

            • La log vraisemblance d’un GLM s’écrit :
                                                              n                                          n                                          n
                                                                                                               yi θi − b(θi )
                               l(β; y, φ) =                         ln f (yi |θi , φ) =                                       +                           c(yi , φ).
                                                            i=1                                        i=1
                                                                                                                    a(φ)                          i=1

            • La fonction de log vraisemblance locale à xi s’écrit :
                                                                  n                                                n                                             n
                                                                                                                               yj θj − b(θj )
                    l(β; y, wj (xi ), φ) =                              wj ln f (yj |θj , φ) =                           wj                   +     wj c(yj , φ).
                                                                j=1                                              j=1
                                                                                                                                    a(φ)        j=1

                        • Maximiser la vraisemblance locale par rapport à β donne le vecteur
                               des estimateurs β.
                        • Dans le cas d’une approximation quadratique β = (β0 , . . . , β5 ), et
                               l’estimateur de ψ(xi ) est donné par : ψ(xi ) = β0 .
            • Ainsi le rôle des GLMs est celui d’un modèle en arrière-plan qui est
                    ajusté localement.
Slide 44/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Des GLMs à la vraisemblance locale
        La fonction de poids


                                                                                                        Fonction de poids                      W (a)
        La localisation s’effectue via la fonction de
        poids :                                                                                                         Uniforme               1
                                                                                                                                               2
                                                                                                                                                 I(|a|     ≤ 1)
                                                                                                                   Triangulaire                (1 − |u|)I(|a| ≤ 1)
                          W (ρ(xi , xj )/h)               if ρ(xi , xj )/h ≤ 1,
         wj =                                                                                                   Epanechnikov                   3
                                                                                                                                                 (1    − a2 )I(|a| ≤ 1)
                          0                               otherwise.                                                                           4

                                                                                                      Quartic (Biweight)                       15
                                                                                                                                               16
                                                                                                                                                  (1    − a2 )2 I(|a| ≤ 1)
        W (.) est une fonction de poids non né-                                                                         Triweight              35
                                                                                                                                                  (1    − a2 )3 I(|a| ≤ 1)
                                                                                                                                               32
        gative qui dépend de la distance ρ(xi , xj ),
                                                                                                                           Tricube             (1 − u 3 )3 I(|a| ≤ 1)
        e.g. la distance Euclidienne :
                                                                                                                    Gaussienne                 √1
                                                                                                                                                2π
                                                                                                                                                       exp( 1 a2 )
                                                                                                                                                            2
              ρ(xi , xj ) =               (uj − ui )2 + (vj − vi )2 .
                                                                                                                                                 avec a = ρ(xi , xj )/h




Slide 45/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Des GLMs à la vraisemblance locale
        La fonction de poids (suite)




                 (a) Epanechnikov                                            (b) Triangulaire                                             (c) Triweight

             Figure: Système de pondération pour des fonctions de poids avec h = 7

Slide 46/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 47/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 48/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 49/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 50/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 51/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 52/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 53/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 54/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comment estimer ψ ? Par un ajustement local...




Slide 55/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Comparaison de l’ajustement avec différents voisinages




               (a) h = 3 (29 obs.)                                       (b) h = 5 (81 obs.)                                     (c) h = 10 (317 obs.)

                        Figure: Comparaison de l’ajustement avec différents voisinages
Slide 56/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Illustration de l’idée générale
        Le but




            • Trouver les paramètres de lissage :
                • la fenêtre d’observation : h
                • le degré d’approximation : p
                • la fonction de poids : W (.)
            • Obtenir une surface aussi lisse que possible sans altérer la forme de
                    la dépendance de la réponse sur les variables explicatives.
            • On veut ψ avec un biais faible et une variance faible.




Slide 57/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 58/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Equations de vraisemblance
        Parallèle entre GLM et vraisemblance locale



           GLMs                                                                                   Vraisemblance locale
                                       Les paramètres β sont estimés par maximum de vraisemblance.
           • La log vraisemblance pour les obser-                                                 • La fonction de log vraisemblance lo-
           vations yi , i = 1, . . . , n, s’écrit :                                               cale à xi s’écrit :
                                   n                                  n                                                              n                            n
                                         yi θi − b(θi )                                                                                       yj θj − b(θj )
             l(βj ; yi ) =                              +                  c(yi , φ).               l(βv ; y, wj (xi )) =                wj                  +         wj c(yj , φ).
                                              a(φ)                                                                                                 a(φ)
                                 i=1                                i=1                                                            j=1                           j=1



                                                                   On résout les équations normales :

               n                                                                                      n
                      ∂                                                                                           ∂
                         l(β0 , . . . , βp ; yi ) = 0, j = 0, . . . , p.                                    wj       l(β0 , . . . , βp ; yj ) = 0, v = 1 . . . , p.
                     ∂βj                                                                                         ∂βv
              i=1                                                                                    j=1




Slide 59/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Equations de vraisemblance
        Parallèle entre GLM et vraisemblance locale (suite)

           GLMs                                                                                   Vraisemblance locale
           • La dérivée de l par rapport à βj est :                                               • De même,
                           ∂l    ∂l ∂θi ∂µi ∂ηi                                                                    ∂l   ∂l ∂θj ∂µj ∂ηj
                               =                 ,                                                                    =                 ,
                           ∂βj   ∂θi ∂µi ∂ηi ∂βj                                                                  ∂βv   ∂θj ∂µj ∂ηj ∂βv
           où                                                                                     où
                     ∂l    yi − b (θi )    yi − µi                                                  ∂l    y j − µj
                         =              =          ,                                                    =          ,
                     ∂θi        a(φ)         a(φ)                                                   ∂θj     a(φ)
                     ∂µi              V[Yi ]                                                        ∂µj              V[Yj ]
                         = b (θi ) =         ,                                                          = b (θj ) =         ,
                     ∂θi               a(φ)                                                         ∂θj              a(φ)
                     ∂ηi                  ∂ηi                                                       ∂ηj                                                 ∂ηj
                         = 1,                  = ui ,                                                   = 1,                                                = uj − ui ,
                     ∂β0                  ∂β1                                                       ∂β0                                                 ∂β1
                     ∂ηi                  ∂ηi                                                       ∂ηj                                                 ∂ηj
                         = vi ,                = ui2 ,                                                  = vj − vi ,                                         = (uj − ui )2 ,
                     ∂β2                 ∂β3                                                        ∂β2                                                 ∂β3
                     ∂ηi                  ∂ηi                                                       ∂ηj                                                 ∂ηj
                         = ui vj ,             = vi2 .                                                  = (uj − ui )(vj − vi ),                             = (vj − vi )2 .
                     ∂β4                  ∂β5                                                       ∂β4                                                 ∂β5



Slide 60/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Equations de vraisemblance
        Parallèle entre GLM et vraisemblance locale (suite)




           GLMs                                                                                   Vraisemblance locale
                                        On obtient les équations de vraisemblance suivantes :

                  n                     n                                                              n                     n
                        ∂l                      (yi − µi ) ∂µi                                                ∂l                          (yj − µj ) ∂µj
                           =                                   =0                                                =                   wj                  =0
                       ∂β0                        V[Yi ] ∂ηi                                                 ∂β0                            V[Yj ] ∂ηj
                i=1                   i=1                                                             j=1                  j=1

                                            .
                                            .                                                                                    .
                                                                                                                                 .
                                            .                                                                                    .
                  n                     n                                                              n                     n
                        ∂l                      (yi − µi ) ∂µi 2                                              ∂l                          (yj − µj ) ∂µj
                           =                                  vi = 0.                                            =                   wj                  (vj − vi )2 = 0.
                       ∂β5                        V[Yi ] ∂ηi                                                 ∂β5                            V[Yj ] ∂ηj
                i=1                   i=1                                                             j=1                  j=1




Slide 61/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Equations de vraisemblance
        Parallèle entre GLM et vraisemblance locale (suite)

           GLMs                                                                                   Vraisemblance locale
                                                                      En notation matricielle :
           X V (y − µ) = 0, où
               T
                                                                                                  X T W V (y − µ) = 0, où

                   1          2
                                  u1       v1       u1       u1 v1        v12
                                                                                                         1              u1 − ui           v1 − vi          ...   (v1 − vi )2
                                                                                                                                                                        
                  1              u2       v2       u22
                                                             u2 v2          2
                                                                          v2                           1              u2 − ui           v2 − vi          ...   (v2 − vi )2 
              X = .
                  .               .        .        .         .           . ,                     X = .                 .                 .              .         .      ,
                   .               .
                                   .        .
                                            .        .
                                                     .         .
                                                               .           .
                                                                           .
                                                                                                        .
                                                                                                         .                 .
                                                                                                                           .                 .
                                                                                                                                             .              .
                                                                                                                                                            .         .
                                                                                                                                                                      .
                                                                                                                                                                             
                   1              un       vn       un2
                                                             un vn        vn2
                                                                                                         1              un − ui           vn − vi          ...   (vn − vi )2


           et V est une matrice diagonale avec                                                    et W est une matrice diagonale avec wj
             1 ∂µi
           V[Yi ] ∂ηi
                      comme ième éléments sur sa                                                  comme jème éléments sur sa diagonale.
           diagonale.
                   La fonction de lien η = g(µ) détermine ∂µi /∂ηi = ∂g −1 (ηi )/∂ηi .
                   Ces équations ne possèdent en général pas de solutions explicites et doivent
                   être résolues numériquement. On utilise une modification de l’algorithme
                   de Newton-Raphson qui porte le nom de méthode de scoring de Fisher.

Slide 62/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Table des matières
                                                     Modification de la fonction de poids
       1 Introduction                                aux bordures
           L’assurance dépendance                    Variance, influence et degrés de
           Notions démographiques et notation        liberté
           Hypothèse de mortalité constante          Intervalles de confiance
           par morceaux                              Sélection des paramètres
           Présentation des données                  Conclusion
           Prémisses sur les modèles de lissage 3 Méthodes adaptatives de
           Rappel sur les GLMs                    vraisemblance locale
                                                     Intersection des intervalles de
       2 Méthode de vraisemblance locale             confiance
           Des GLMs à la vraisemblance locale        Facteurs de correction de la fenêtre
           Illustration de l’idée générale           d’observation
           Equations de vraisemblance           4 Applications
           Résolution des équations de               Surfaces ajustées
           vraisemblance                             Analyse des résidus
           Implémentation de l’algorithme sous       Comparaisons
           R                                    5 Conclusions


Slide 63/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Résolution des équations de vraisemblance
        Parallèle entre GLM et vraisemblance locale (suite)

        Dans le cadre d’un GLM,
            • chaque étape de l’algorithme constitue un ajustement de type
                    moindres carrées pondérés,
            • c’est une généralisation des MCO qui prend en compte la
                    non-constance de la variance de Yi .
            • les observations recueillies en des points où la variabilité est plus
                    faible sont affectées d’un poids plus important dans la
                    détermination des paramètres.
            • à chaque itération les poids sont remis à jours.
            • on emploie le terme de moindres carrés itérativement re-pondérés
                    ou IRWLS.
        Dans le cadre de la vraisemblance locale, on emploiera une version
        localisée de l’IRWLS.

Slide 64/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Résolution des équations de vraisemblance
        Parallèle entre GLM et vraisemblance locale (suite)

            • L’algorithme de Newton-Raphson utilise la matrice d’information
                    de Fisher.
            •       Cette matrice contient l’information concernant la courbure de la
                    fonction de log vraisemblance au point d’estimation.
            •       Plus grande est la courbure, plus l’information apportée au sujet
                    des paramètres du modèles est importante.
            •       (En effet les écarts-types des estimateurs sont les racines carrées
                    des éléments diagonaux de l’inverse de la matrice d’information de
                    Fisher. Plus la courbure de la fonction de vraisemblance est
                    importante, plus les écarts-types sont petits.)
            •       Pour un GLM, la dérivée partielle seconde est :

                                                                               ∂2l     ∂2l
                                                                                     =      xij xik .
                                                                              ∂βj βk   ∂ηi2

Slide 65/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                   laboratoire saf


        Résolution des équations de vraisemblance
        Parallèle entre GLM et vraisemblance locale (suite)
            • En utilisant la règle de dérivation en chaine, on obtient :

                                       ∂2l    ∂                        ∂l ∂θi                         ∂              ∂2l                        ∂l ∂ 2 θi
                                         2 = ∂η
                                       ∂ηi                             ∂θi ∂ηi
                                                                                              =
                                                                                                     ∂ηi            ∂θi ∂ηi
                                                                                                                                          +
                                                                                                                                                ∂θi ∂ηi2
                                                i
                                                                                    2
                                                         ∂2l            ∂θi                    ∂l ∂ 2 θi
                                                  =                                     +
                                                         ∂θi2           ∂ηi                    ∂θi ∂ηi2
            • Comme ∂l/∂θi = (yi − µi )/a(φ), sa dérivée est ∂ 2 l/∂θi2 =
                    −1/a(φ)∂µi /∂θi . De plus ∂µi /∂θi = b (θi ), on obtient
                                ∂2l   1            ∂θi                                                  2
                                                                                                                ∂µi          2
                                                                                                                                                             ∂ 2 θi
                                    =     −b (θi )                                                                               + (yi − µi )
                                ∂ηi2 a(φ)          ∂µi                                                          ∂ηi                                          ∂ηi2
                                                   1       1                                ∂µi          2
                                                                                                                                         ∂ 2 θi
                                            =          −                                                     + (yi − µi )                       .
                                                  a(φ)   b (θi )                            ∂ηi                                          ∂ηi2
            • SI θ ≡ η, alors ∂ 2 θi /∂ηi2 = 0.
Slide 66/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
institut de science financiere et d’assurances                                                                                                    laboratoire saf


        Résolution des équations de vraisemblance
        Parallèle entre GLM et vraisemblance locale (suite)
            • Dans la méthode de scoring de Fisher, l’actuelle matrice hessienne
                    dans l’itération de Newton-Raphson est remplacé par sa valeur
                    espérée, qui est la négative de la matrice d’information de Fisher
                    I. Dans ce cas là aussi le second terme disparait. On obtient
                                                                                                   n
                                                                       ∂2l                                1 1                       ∂µi          2
                                          Ijk = E −                                       =                                                          xij xik
                                                                      ∂βj βk                     i=1
                                                                                                          φ b (θi )                 ∂ηi
                                                            n
                                                                   ωii xij xik  1
                                                   =                           = (X T ΩX)jk
                                                          i=1
                                                                       φ        φ
                                                                                                                                                        2
              où Ω est un matrice diagonale avec ωii = b 1 i ) ∂µii
                                                             (θ ∂η                                                                                          qui dépend
              de µi . Car ηi = g(µi ), on a ∂ηi /∂µi = g (µi ).
            • Dans le cadre de la vraisemblance locale, on obtient
                                             1
                                      Ivk = (X T W ΩX)vk
                                             φ
Slide 67/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print
Intro vrais loc-print

Contenu connexe

En vedette (20)

Slides act6420-e2014-partie-2
Slides act6420-e2014-partie-2Slides act6420-e2014-partie-2
Slides act6420-e2014-partie-2
 
Slides econometrics-2017-graduate-2
Slides econometrics-2017-graduate-2Slides econometrics-2017-graduate-2
Slides econometrics-2017-graduate-2
 
Econometrics 2017-graduate-3
Econometrics 2017-graduate-3Econometrics 2017-graduate-3
Econometrics 2017-graduate-3
 
Slides ensae-2016-4
Slides ensae-2016-4Slides ensae-2016-4
Slides ensae-2016-4
 
Econometrics, PhD Course, #1 Nonlinearities
Econometrics, PhD Course, #1 NonlinearitiesEconometrics, PhD Course, #1 Nonlinearities
Econometrics, PhD Course, #1 Nonlinearities
 
Slides 2040-4
Slides 2040-4Slides 2040-4
Slides 2040-4
 
Slides 2040-5
Slides 2040-5Slides 2040-5
Slides 2040-5
 
Slides 2040-6-a2013
Slides 2040-6-a2013Slides 2040-6-a2013
Slides 2040-6-a2013
 
Slides 2040-8-2013
Slides 2040-8-2013Slides 2040-8-2013
Slides 2040-8-2013
 
Slides 2040-4
Slides 2040-4Slides 2040-4
Slides 2040-4
 
Slides 2040-7-a2013
Slides 2040-7-a2013Slides 2040-7-a2013
Slides 2040-7-a2013
 
Exercices act2121-session8
Exercices act2121-session8Exercices act2121-session8
Exercices act2121-session8
 
Slides ensae-2016-1
Slides ensae-2016-1Slides ensae-2016-1
Slides ensae-2016-1
 
Slides ensae-2016-2
Slides ensae-2016-2Slides ensae-2016-2
Slides ensae-2016-2
 
Slides ensae-2016-6
Slides ensae-2016-6Slides ensae-2016-6
Slides ensae-2016-6
 
Slides ensae-2016-8
Slides ensae-2016-8Slides ensae-2016-8
Slides ensae-2016-8
 
Slides ensae-2016-9
Slides ensae-2016-9Slides ensae-2016-9
Slides ensae-2016-9
 
Slides ensae-2016-7
Slides ensae-2016-7Slides ensae-2016-7
Slides ensae-2016-7
 
Slides ensae-2016-5
Slides ensae-2016-5Slides ensae-2016-5
Slides ensae-2016-5
 
Slides ensae-2016-3
Slides ensae-2016-3Slides ensae-2016-3
Slides ensae-2016-3
 

Plus de Arthur Charpentier (20)

Family History and Life Insurance
Family History and Life InsuranceFamily History and Life Insurance
Family History and Life Insurance
 
ACT6100 introduction
ACT6100 introductionACT6100 introduction
ACT6100 introduction
 
Family History and Life Insurance (UConn actuarial seminar)
Family History and Life Insurance (UConn actuarial seminar)Family History and Life Insurance (UConn actuarial seminar)
Family History and Life Insurance (UConn actuarial seminar)
 
Control epidemics
Control epidemics Control epidemics
Control epidemics
 
STT5100 Automne 2020, introduction
STT5100 Automne 2020, introductionSTT5100 Automne 2020, introduction
STT5100 Automne 2020, introduction
 
Family History and Life Insurance
Family History and Life InsuranceFamily History and Life Insurance
Family History and Life Insurance
 
Machine Learning in Actuarial Science & Insurance
Machine Learning in Actuarial Science & InsuranceMachine Learning in Actuarial Science & Insurance
Machine Learning in Actuarial Science & Insurance
 
Reinforcement Learning in Economics and Finance
Reinforcement Learning in Economics and FinanceReinforcement Learning in Economics and Finance
Reinforcement Learning in Economics and Finance
 
Optimal Control and COVID-19
Optimal Control and COVID-19Optimal Control and COVID-19
Optimal Control and COVID-19
 
Slides OICA 2020
Slides OICA 2020Slides OICA 2020
Slides OICA 2020
 
Lausanne 2019 #3
Lausanne 2019 #3Lausanne 2019 #3
Lausanne 2019 #3
 
Lausanne 2019 #4
Lausanne 2019 #4Lausanne 2019 #4
Lausanne 2019 #4
 
Lausanne 2019 #2
Lausanne 2019 #2Lausanne 2019 #2
Lausanne 2019 #2
 
Lausanne 2019 #1
Lausanne 2019 #1Lausanne 2019 #1
Lausanne 2019 #1
 
Side 2019 #10
Side 2019 #10Side 2019 #10
Side 2019 #10
 
Side 2019 #11
Side 2019 #11Side 2019 #11
Side 2019 #11
 
Side 2019 #12
Side 2019 #12Side 2019 #12
Side 2019 #12
 
Side 2019 #9
Side 2019 #9Side 2019 #9
Side 2019 #9
 
Side 2019 #8
Side 2019 #8Side 2019 #8
Side 2019 #8
 
Side 2019 #7
Side 2019 #7Side 2019 #7
Side 2019 #7
 

Intro vrais loc-print

  • 1. institut de science financiere et d’assurances laboratoire saf Université Claude Bernard Lyon 1 Institut de Science Financière et d’Assurances Introduction aux méthodes de lissage par vraisemblance locale Applications à l’assurance dépendance Julien Tomas Institut de Science Financière et d’Assurances Laboratoire de recherche de Sciences Actuarielle et Financière 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles Slide 1/138
  • 2. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 2/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 3. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 3/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 4. institut de science financiere et d’assurances laboratoire saf L’assurance dépendance • Mix de prestations sociales et santé fournit sur une base journalière, à domicile ou dans une institution, à des individus souffrant d’une perte de mobilité ou d’autonomie dans leur activité journalière. • Peut être individuelle ou collective. • Garantit le paiement d’une indemnité, sous la forme d’un bénéfice numéraire qui peut être proportionnel au degré de dépendance. • Voir Kessler (2008) et Courbage et Roudaut (2011) pour des études sur le marché français de l’assurance dépendance. Slide 4/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 5. institut de science financiere et d’assurances laboratoire saf L’assurance dépendance • Niveaux des primes et des réserves ainsi que la gestion d’une portefeuille d’assurance dépendance sont très sensibles au choix de la table de mortalité adoptée. • Construction d’une table est un exercice difficile : • petits portefeuilles et taux de mortalité très volatiles, • lien fort entre l’âge de survenance et la pathologie. Nécessite de construire des tables de mortalité en fonction de l’âge de survenance et l’ancienneté, • les taux de mortalité diminuent très rapidement avec l’ancienneté. • En pratique, on utilise des méthodes qui s’appuient lourdement sur les opinions d’expert. • Le but : avoir des méthodes plus rigoureuses Slide 5/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 6. institut de science financiere et d’assurances laboratoire saf L’assurance dépendance Analyse de la mortalité Analyser les variations de la mortalité en fonction de • l’âge de survenance de la pathologie v , • et de l’ancienneté u (mois). On a donc 2 variables temporelles, mais elles n’ont pas le même statut : • v représente l’hétérogénéité, • u est la variable de durée. Slide 6/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 7. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 7/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 8. institut de science financiere et d’assurances laboratoire saf Notions démographiques et notation Durée de vie restante • Soit Tu (v ) la durée de vie restante d’un individu dont la pathologie survient à l’âge v et dont l’ancienneté est u, i.e. P[Tu (v ) > ξ] = P[T (v ) > u + ξ|T (v ) > u] = ξ pu (v ). • Donc, un individu dont la pathologie survient à l’âge v et d’ancienneté u décèdera à l’ancienneté u + Tu (v ). • La fdc de Tu (v ) est ξ qu (v ) = 1 − ξ pu (v ) = P[Tu (v ) < ξ] = P[T (v ) ≤ u + ξ|T (v ) > u]. Slide 8/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 9. institut de science financiere et d’assurances laboratoire saf Notions démographiques et notation Probabilité de survie / décès dans le mois • La probabilité de décès dans le mois lorsque la pathologie survient à l’âge v et dont l’ancienneté est u est définie par qu (v ) = P[Tu (v ) ≤ 1] = P[T (v ) ≤ u + 1|T (v ) > u]. • La probabilité de survie dans le mois lorsque la pathologie survient à l’âge v et dont l’ancienneté est u est pu (v ) = P[Tu (v ) > 1] = P[T (v ) > u + 1|T (v ) > u]. • On a donc pour un entier k, k pu (v ) = P[Tu (v ) > k] = pu (v ) × pu+1 (v ) × . . . × pu+k−1 (v ). Slide 9/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 10. institut de science financiere et d’assurances laboratoire saf Notions démographiques et notation Nombre espéré de survivants • Soit Lu,v le nombre d’individus vivant lorsque la pathologie est survenue à l’âge v et dont l’ancienneté est u en commençant par 0 (v ) individus touché par la pathologie. Le nombre espéré d’individus atteignant l’ancienneté u à partir de 0 (v ) individus est E[Lu,v ] = u,v = 0 (v ) × u p0 (v ). • La fonction (u, v ) → u,v est assumée être continue et différenciable. • Du,v = Lu,v − Lu+1,v est le nombre de décès à l’ancienneté u et lorsque la pathologie est survenue à l’âge v , et E[Du,v ] = du,v = u,v − u+1,v = u,v (1 − pu (v )) = u,v qu (v ). Slide 10/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 11. institut de science financiere et d’assurances laboratoire saf Notions démographiques et notation Exposition au risque • L’exposition au risque mesure le temps durant lequel les individus sont exposés au risque (de décès) après survenance de la pathologie. Il s’agit de la durée totale vécue par ces individus après la survenance de la maladie. • La durée espérée vécue par les individus entre l’ancienneté u et u + 1 est donnée par 1 1 ERu,v = Lu+ξ,v dξ et E[ERu,v ] = u+ξ,v dξ. ξ=0 ξ=0 • le taux de mortalité à l’ancienneté u lorsque la pathologie survient à l’âge v est du,v mu (v ) = . E[ERu,v ] Slide 11/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 12. institut de science financiere et d’assurances laboratoire saf Notions démographiques et notation Forces de mortalité • La force de mortalité à l’ancienneté u + τ lorsque la pathologie survient à l’âge v , notée ϕu+τ (v ) est définie par P [τ < Tu (v ) ≤ τ + ∆τ |Tu (v ) > τ ] ϕu+τ (v ) = lim + ∆τ →0 ∆τ 1 ∂ = τ qu (v ). τ pu (v ) ∂τ • Une expansion de Taylor au premier ordre donne ∆τ qu (v ) = ϕu (v )∆τ + o(∆τ ) ⇒ ∆τ qu (v ) ≈ ϕu (v )∆τ ∆τ pu (v ) = 1 − ϕu (v )∆τ + o(∆τ ) ⇒ ∆τ pu (v ) ≈ 1 − ϕu (v )∆τ Pour ∆τ suffisamment petit. Slide 12/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 13. institut de science financiere et d’assurances laboratoire saf Notions démographiques et notation Quelques formules utiles... • On remarque que ∂τ ln τ pu (v ) = −ϕu+τ (v ). On obtient, avec la ∂ condition 0 pu (v ) = 1, τ τ pu (v ) = exp − ϕu+ξ (v ) dξ . ξ=0 • La fonction de densité de Tu (v ) est ∂τ τ qu (v ) = τ pu (v )ϕu+τ (v ) ∂ et en résolvant cette équation différentielle avec 0 qu (v ) = 0, on obtient τ τ qu (v ) = exp − ξ pu (v ) ϕu+ξ (v ) dξ . ξ=0 Slide 13/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 14. institut de science financiere et d’assurances laboratoire saf Notions démographiques et notation Espérance de vie • La durée de vie restante moyenne d’un individu dont la pathologie est apparue à l’âge v et d’ancienneté u est notée eu (v ). • Concrètement on s’attend à ce qu’un individu d’ancienneté u et dont la pathologie survient à l’âge v décède à l’ancienneté u + eu (v ). • On exprime eu (v ) par eu (v ) = E[Tu (v )] = ξ dξ qu (v ) = ξ pu (v ) dξ ξ≥0 ξ≥0 1 = u+ξ,v dξ. u,v ξ≥0 Slide 14/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 15. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 15/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 16. institut de science financiere et d’assurances laboratoire saf Hypothèse de mortalité constante par morceaux Hypothèse • Dorénavant on fait l’hypothèse de constance par morceaux des forces de mortalité, i.e. ϕu+ξ (v + ζ) = ϕu (v ) pour 0 ≤ ξ < 1 et 0 ≤ ζ < 1 et u, v entiers • Sous cette hypothèse, ϕu (v ) = − ln pu (v ) 1 1 E[ERu,v ] = u+ξ,v dξ = u,v ξ pu (v ) dξ ξ=0 ξ=0 1 − u,v qu (v ) = u,v (pu (v ))ξ dξ = ξ=0 ln(1 − qu (v )) 1 1 mu (v ) = u+ξ,v ϕu+ξ (v ) dξ = ϕu (v ). E[ERu,v ] ξ=0 Slide 16/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 17. institut de science financiere et d’assurances laboratoire saf Hypothèse de mortalité constante par morceaux Modélisation • A chacune des observations, on associe une indicatrice δi indiquant si l’individu est décédé ou non, 1 si l’individu i est décédé, δi = 0 sinon, pour i = 1, . . . , Lu,v . • On définie τi , le temps durant lequel l’individu a été observé (c’est l’exposition au risque). • On suppose avoir à disposition pour chacun des Lu,v individus les observations (δi ,τi ). Slide 17/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 18. institut de science financiere et d’assurances laboratoire saf Hypothèse de mortalité constante par morceaux Contribution de l’individu i à la vraisemblance • La contribution du ième individu à la vraisemblance s’écrit, • si l’individu survie à la (u + 1)ème ancienneté (δi = 0, τi = 1) alors : pu (v ) = exp(−ϕu (v )); • si l’individu décède avant la (u + 1)ème ancienneté (δi = 1, τi < 1) alors : τi pu (v ) ϕu+τi (v ) = exp(−τi ϕu (v ))ϕu (v ). • La contribution de l’individu i à la vraisemblance vaut donc exp(−τi ϕu (v ))(ϕu (v ))δi . Slide 18/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 19. institut de science financiere et d’assurances laboratoire saf Hypothèse de mortalité constante par morceaux Ecriture de la vraisemblance • On définit Lu,v Lu,v τi = ERu,v et δi = Du,v . i=1 i=1 • Sous ces hypothèses, la vraisemblance devient Lu,v L(ϕu (v )) = exp(−τi ϕu (v ))(ϕu (v ))δi i=1 = exp(−ERu,v ϕu (v ))(ϕu (v ))Du,v , • et la log-vraisemblance associée est log L(ϕu (v )) = −ERu,v ϕu (v ) + Du,v log ϕu (v ). Slide 19/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 20. institut de science financiere et d’assurances laboratoire saf Hypothèse de mortalité constante par morceaux Lien avec la loi de Poisson • En Maximisant la log-vraisemblance log L(ϕu (v )) on obtient l’estimateur du maximum de vraisemblance de ϕu (v ), à savoir ϕu (v ) = Du,v /ERu,v qui coïncide avec le taux de mortalité mu (v ). • La vraisemblance L(ϕu (v )) est proportionnelle à la vraisemblance de Poisson basée sur Du,v ∼ Poisson(ERu,v ϕu (v )). • Il est équivalent de travailler avec la vraie vraisemblance ou à partir d’une vraisemblance de Poisson. • Donc sous l’hypothèse de la mortalité constante par morceaux entre des valeurs non-entières u and v , on considère Du,v ∼ Poisson(ERu,v ϕu (v )), (1) pour pouvoir utiliser le cadre de travail des modèles linéaires généralisés (GLMs). Slide 20/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 21. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 21/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 22. institut de science financiere et d’assurances laboratoire saf Présentation des données Analyse les variations de la mortalité en fonction de l’âge de survenance de la pathologie v et de l’ancienneté u (mois). On observe : • la plage d’âge de survenance : v ∈ [70, 90] ans pour la survenance, • la durée de dépendance (l’ancienneté) : u ∈ [0, 119] mois, • sur la période : 01/01/1998 à 31/12/2010. Les données on été agrégées selon l’âge de survenance et l’ancienneté. Les pathologies sont composées entre autres de démences, maladies neurologiques et de cancers en phase terminale. Les données sont composées de 2/3 de femmes et 1/3 d’hommes. Slide 22/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 23. institut de science financiere et d’assurances laboratoire saf Présentation des données (suite) (a) Nombre de décès, (b) Exposition au risque, (c) Forces de mortalité, Du,v ERu,v ϕu (v ) Figure: Statistiques observées Slide 23/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 24. institut de science financiere et d’assurances laboratoire saf Présentation des données (suite) Notation Par la suite, on réécrit les données en un vecteur colonne • Une matrice A de dimension m × n est réécrite en un vecteur colonne mn × 1 en empilant les colonnes de la matrice A l’une sur l’autre : vec(A) = (a1,1 , . . . , am,1 , a1,2 , . . . , am,2 , . . . , a1,n , . . . , am,n )T . • On dispose de n quintuplets d’observations {(ui , vi , ERi , Di , ϕi )}n , ou n = 2520. i=1 Pour simplifier, le point (ui , vi ) est noté xi . Slide 24/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 25. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 25/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 26. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Irrégularités dans la progression des taux observées • Ces estimations brutes, sur lesquelles se basent les tables de mortalité, peuvent être considérées comme un échantillon provenant d’une population plus importante et sont, par conséquent, soumises à des fluctuations aléatoires. • Toutefois, l’actuaire souhaite la plupart du temps lisser ces quantités afin de mettre en avant les caractéristiques de la mortalité du groupe qu’il pense être régulières. • Ces irrégularités dans la progression des forces de mortalité pourraient être réduites en augmentant le nombre Lu,v de personnes observées. • Une méthode plus pratique est de graduer les données pour éliminer partiellement ces erreurs aléatoires. Slide 26/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 27. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Approche paramétrique VS non-paramétrique Plusieurs approches de graduation peuvent être adoptée. • Approches paramétriques, impliquant l’utilisation de loi de mortalité • Approches non-paramétriques La relation entre les forces de mortalité, l’ancienneté et l’âge à la survenance peut être modélisée par ϕi = ψ(xi ) + i , i = 1, . . . , n, où ψ est une fonction de régression inconnue et i un terme d’erreur représentant les erreurs aléatoires dans les observations ou variations qui ne sont pas incluses dans les xi = (ui , vi ). Le but de toute régression est de fournir une analyse raisonnable de la fonction de réponse inconnue ψ. Slide 27/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 28. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Approche paramétrique VS non-paramétrique (suite) • Les approches paramétriques supposent que la fonction de réponse ψ à une forme pré-spécifiée (par exemple, loi de Thiele, loi de Perks, modèles de classe Gompertz-Makeham, etc...). La relation est alors pleinement décrite par un nombre fini de paramètres. • Un modèle paramétrique pré-sélectionné peut être trop restrictif pour modéliser les caractéristiques de la mortalité. • La modélisation non-paramétrique offre un outil flexible dans l’analyse de la relation. Comme les méthodes paramétriques, elles sont susceptibles de donner des estimations biaisées, mais de telles sorte qu’il est possible d’équilibrer une augmentation du biais avec une diminution de la variation d’échantillonnage. Slide 28/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 29. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Approche paramétrique VS non-paramétrique (suite) La question de quelle approche devrait être adoptée dans l’analyse de données était l’une des raisons d’un discussion houleuse entre Pearson et Fisher dans les années 1920. • Fisher soulignant que l’approche non-paramétrique est généralement peu efficace alors que Pearson était plus préoccupé par la question de spécification. • Les deux points de vue sont intéressants en eux-mêmes : • Pearson a fait remarquer que le prix que nous devons payer pour une modélisation purement paramétrique est la possibilité d’une erreur de spécification lourde entraînant un biais de modèle élevé. • Fisher était préoccupé par la considération de modèles sans paramètres qui peuvent résulter dans des estimations plus variables surtout pour des échantillons de taille réduite. Slide 29/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 30. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Natura non agit per saltum : L’idée basique du lissage • Chaque force de mortalité est lié étroitement à ses voisines. • Les observations ϕj dans le voisinage de ϕi contiennent de l’information à propos de la valeur de ψ à xi = (ui , vi ). • Les forces de la nature opèrent graduellement et leurs effets deviennent visibles de façon continue et non par des sauts brusques. • Cela implique que les observations ϕj , dans un rayon d’un point xi , peuvent être utilisées pour augmenter l’information que nous avons à xi et une estimation améliorée de ϕi peut être obtenue en lissant les estimations individuelles ϕj . Slide 30/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 31. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Natura non agit per saltum : L’idée basique du lissage (suite) • Cette procédure d’approximation de la fonction de réponse ψ est communément appelée lissage. • Ainsi la mortalité n’est pas résumé en a petit nombre de paramètres mais décrite par les n forces de mortalité. • Dans la littérature actuarielle, ce procédé est connu sous le terme de graduation. Les petites collines et vallées des données brutes sont graduées jusqu’à devenir lisses, comme lorsque l’on construit une route sur un terrain accidenté. Slide 31/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 32. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Développement historique • Les méthodes de lissage sont des extensions directes des modèles paramétriques, si naturelles qu’elles se sont développées à des périodes et dans des pays différents à la fin du 18ème siècle. La plupart sont apparues dans des études actuarielles. Les taux de mortalité et de maladies étaient lissés selon une fonction de l’âge. • Premières références : Johann Lambert en 1765, John Finlaison en 1823, Wesley Woolhouse en 1866, De Forest en 1873, Thomas Sprague en 1887, John Spencer en 1904, Robert Henderson en 1916 and Edmund Whittaker en 1923. • Cependant les régressions locales ont reçu que peu d’attention jusqu’à la fin des années 1970. Voir Seal (1982), Haberman (1996) et Loader (1999) pour une revue historique. Slide 32/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 33. institut de science financiere et d’assurances laboratoire saf Prémisses sur les modèles de lissage Développement historique (suite) • Les méthodes de régression locale sont originaires des méthodes à noyaux introduites par Rosenblatt (1956) et Parzen (1962). • La méthode à noyaux est un cas spécial de la régression locale où la famille paramétrique est une fonction constante. • Applications actuarielles des méthodes à noyaux : Copas et Haberman (1983) et Gavin et collab. (1993). • Les régressions locales ont connu un regain d’intérêt après les développements de Stone (1977) et Stone (1982) et la procédure loess de Cleveland (1979). • Tibshirani et Hastie (1987) ont introduit la procédure de vraisemblance locale, et ont étendu le domaine des méthodes de lissage à d’autres distributions que gaussienne. Extensions : Loader (1996), Fan et collab. (1998) et Loader (1999). Slide 33/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 34. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 34/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 35. institut de science financiere et d’assurances laboratoire saf Les modèles linéaires généralisés • Durant les trente dernières années, l’utilisation des GLMs (Nelder et Wedderburn (1972)) a reçu beaucoup d’attention depuis les applications de McCullagh et Nelder (1989). • Les GLMs sont idéalement adaptés à l’analyse de données non-normales que l’on rencontre typiquement lorsque l’on s’intéresse à des sujets relatifs à l’assurance. • La modélisation diffère des modèles linéaires gaussiens par deux importants aspects : • La distribution de la variable dépendante est choisie dans la famille exponentielle et n’est donc pas spécifiquement Normale mais peut être explicitement non-Normale. • Une transformation de l’espérance de la variable dépendante est linéairement liée aux variables explicatives. Slide 35/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 36. institut de science financiere et d’assurances laboratoire saf Les modèles linéaires généralisés Caractéristiques Les modèles linéaires généralisés possèdent 3 caractéristiques : • Un élément aléatoire, qui établit que les observations sont des variables aléatoires indépendantes Yi , i = 1, . . . , n avec une densité appartenant à la famille exponentielle linéaire. • Un élément systématique qui attribut à chaque observation un prédicteur linéaire ηi . • Un troisième élément qui connecte les deux premiers éléments : µi l’espérance de Yi est lié au prédicteur linéaire ηi par une fonction de lien. Slide 36/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 37. institut de science financiere et d’assurances laboratoire saf Les modèles linéaires généralisés La famille exponentielle linéaire • La technique des GLMs s’applique à toutes distributions appartenant à la famille exponentielle, i.e. lorsque la variable dépendante Yi à une loi de probabilité de la forme yi θi − b(θi ) f (yi |θi , φ) = exp + c(yi , φ) , a(φ) pour des fonctions a(), b() and c() spécifiques. Les fonctions a and c sont telles que a(φ) = φ and c = c(yi , φ). θi est le paramètre canonique (ou paramètre naturel) et φ est le paramètre de dispersion. Slide 37/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 38. institut de science financiere et d’assurances laboratoire saf Les modèles linéaires généralisés La famille exponentielle linéaire (suite) Exemple d’une loi de Poisson :. Distribution de yi θi a(φ) b(θi ) c(yi , φ) E[Yi ] V[µi ] = V[Yi ] a(φ) Poisson(µi ) ln(µi ) 1 exp(θi ) − log yi ! µi µi Table: Loi de Poisson appartenant à la famille exponentielle. L’espérance et la variance sont calculées comme la première et seconde dérivées de b(θi ) : ∂ ∂b ∂µi E[Yi ] = b(θi ) = = µi ∂θ ∂µi ∂θi 2 ∂2 ∂2b ∂µi ∂b ∂ 2 µi V[Yi ] = a(φ) b(θi ) = a(φ) + = a(φ)µi . ∂θi2 ∂µ2 i ∂θi ∂µi ∂θi2 Slide 38/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 39. institut de science financiere et d’assurances laboratoire saf Les modèles linéaires généralisés Qu’est-ce que veut dire linéaire dans GLMs • "Linéaire" signifie que les variables explicatives sont combinées linéairement pour modéliser l’espérance. • Si x1 , x2 , . . . , xp sont des variables explicatives alors des combinaisons linéaires de la forme β0 + β1 x1 + . . . + βp xp servent comme des prédicteurs linéaires de l’espérance de la variable dépendante. • La linéarité dans les GLMs se réfère seulement à la linéarité dans les coefficients βj , non dans les variables explicatives. • Par exemple, β0 + β1 x1 + β2 x1 and β0 + β1 x1 + β2 x2 + β3 x1 x3 2 sont "linéaires" au sens définie par les GLMs, mais β0 + β1 x1 + exp(β2 x2 ) ne l’est pas. Slide 39/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 40. institut de science financiere et d’assurances laboratoire saf Les modèles linéaires généralisés Fonction de lien • µi = E [Yi |xi ], i = 1, 2, . . . , n, est liée au prédicteur linéaire ηi par une fonction de lien g() monotone et différenciable g(µi ) = ηi ⇔ µi = g −1 (ηi ) • La fonction de lien est dite canonique lorsque θi = ηi , où θi est le paramètre canonique. • la fonction de lien canonique assure donc que g(µi ) = θi et g −1 = b () (puisque µi = b (θi )). Lien canonique Poisson ηi = log(µi ) Table: Lien canonique pour la loi de Poisson Slide 40/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 41. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 41/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 42. institut de science financiere et d’assurances laboratoire saf Des GLMs à la vraisemblance locale • L’approche GLM fait l’hypothèse que θi a une forme paramétrique spécifique, e.g. θi = β0 + β1 ui + β2 vi + β3 ui2 + β4 ui vi + β5 vi2 ≡ x T β, où x = (1, ui , vi , ui2 , ui vi , vi2 )T et β = (β0 , . . . , β5 )T . • L’approche de la vraisemblance locale ne fait plus l’hypothèse que θi a une forme paramétrique rigide. • On suppose que θi est une fonction lisse non-spécifiée ψ(xi ) qui a (p + 1) dérivées continues au point xi . • L’idée est : ajuster un modèle polynomial à l’intérieur d’une fenêtre d’observation. ⇒ Penser au développement de Taylor. Slide 42/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 43. institut de science financiere et d’assurances laboratoire saf Des GLMs à la vraisemblance locale Expansion de Taylor • Pour xj dans le voisinage de xi , on va approximer ψ(xj ) via une expansion de Taylor par un polynôme de degré p, e.g. une approximation quadratique : ψ(xj ) = ψ(uj , vj ) ∂ψ(ui , vi ) ∂ψ(ui , vi ) ≈ ψ(ui , vi ) + (uj − ui ) + (vj − vi ) ∂ui ∂vi 1 ∂ 2 ψ(ui , vi ) ∂ψ(ui , vi ) + (uj − ui )2 + (uj − ui )(vj − vi ) 2 2 ∂ui ∂vi ∂ui 1 ∂ 2 ψ(ui , vi ) + (vj − vi )2 ≡ x T β, 2 ∂vi2 T où x = 1, uj − ui , vj − vi , (uj − ui )2 , (uj − ui )(vj − vi ), (vj − vi )2 2 ψ(ui ,vi ) ∂ψ(ui ,vi ) 1 ∂ 2 ψ(ui ,vi ) et β = ψ(ui , vi ), ∂ψ(uii,vi ) , ∂ψ(uii,vi ) , 1 ∂ ∂u ∂v 2 ∂ui2 , ∂vi ∂ui 2 ∂v 2 . i Slide 43/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 44. institut de science financiere et d’assurances laboratoire saf Des GLMs à la vraisemblance locale Ecriture de la vraisemblance • La log vraisemblance d’un GLM s’écrit : n n n yi θi − b(θi ) l(β; y, φ) = ln f (yi |θi , φ) = + c(yi , φ). i=1 i=1 a(φ) i=1 • La fonction de log vraisemblance locale à xi s’écrit : n n n yj θj − b(θj ) l(β; y, wj (xi ), φ) = wj ln f (yj |θj , φ) = wj + wj c(yj , φ). j=1 j=1 a(φ) j=1 • Maximiser la vraisemblance locale par rapport à β donne le vecteur des estimateurs β. • Dans le cas d’une approximation quadratique β = (β0 , . . . , β5 ), et l’estimateur de ψ(xi ) est donné par : ψ(xi ) = β0 . • Ainsi le rôle des GLMs est celui d’un modèle en arrière-plan qui est ajusté localement. Slide 44/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 45. institut de science financiere et d’assurances laboratoire saf Des GLMs à la vraisemblance locale La fonction de poids Fonction de poids W (a) La localisation s’effectue via la fonction de poids : Uniforme 1 2 I(|a| ≤ 1) Triangulaire (1 − |u|)I(|a| ≤ 1) W (ρ(xi , xj )/h) if ρ(xi , xj )/h ≤ 1, wj = Epanechnikov 3 (1 − a2 )I(|a| ≤ 1) 0 otherwise. 4 Quartic (Biweight) 15 16 (1 − a2 )2 I(|a| ≤ 1) W (.) est une fonction de poids non né- Triweight 35 (1 − a2 )3 I(|a| ≤ 1) 32 gative qui dépend de la distance ρ(xi , xj ), Tricube (1 − u 3 )3 I(|a| ≤ 1) e.g. la distance Euclidienne : Gaussienne √1 2π exp( 1 a2 ) 2 ρ(xi , xj ) = (uj − ui )2 + (vj − vi )2 . avec a = ρ(xi , xj )/h Slide 45/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 46. institut de science financiere et d’assurances laboratoire saf Des GLMs à la vraisemblance locale La fonction de poids (suite) (a) Epanechnikov (b) Triangulaire (c) Triweight Figure: Système de pondération pour des fonctions de poids avec h = 7 Slide 46/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 47. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 47/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 48. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 48/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 49. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 49/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 50. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 50/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 51. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 51/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 52. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 52/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 53. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 53/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 54. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 54/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 55. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comment estimer ψ ? Par un ajustement local... Slide 55/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 56. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Comparaison de l’ajustement avec différents voisinages (a) h = 3 (29 obs.) (b) h = 5 (81 obs.) (c) h = 10 (317 obs.) Figure: Comparaison de l’ajustement avec différents voisinages Slide 56/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 57. institut de science financiere et d’assurances laboratoire saf Illustration de l’idée générale Le but • Trouver les paramètres de lissage : • la fenêtre d’observation : h • le degré d’approximation : p • la fonction de poids : W (.) • Obtenir une surface aussi lisse que possible sans altérer la forme de la dépendance de la réponse sur les variables explicatives. • On veut ψ avec un biais faible et une variance faible. Slide 57/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 58. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 58/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 59. institut de science financiere et d’assurances laboratoire saf Equations de vraisemblance Parallèle entre GLM et vraisemblance locale GLMs Vraisemblance locale Les paramètres β sont estimés par maximum de vraisemblance. • La log vraisemblance pour les obser- • La fonction de log vraisemblance lo- vations yi , i = 1, . . . , n, s’écrit : cale à xi s’écrit : n n n n yi θi − b(θi ) yj θj − b(θj ) l(βj ; yi ) = + c(yi , φ). l(βv ; y, wj (xi )) = wj + wj c(yj , φ). a(φ) a(φ) i=1 i=1 j=1 j=1 On résout les équations normales : n n ∂ ∂ l(β0 , . . . , βp ; yi ) = 0, j = 0, . . . , p. wj l(β0 , . . . , βp ; yj ) = 0, v = 1 . . . , p. ∂βj ∂βv i=1 j=1 Slide 59/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 60. institut de science financiere et d’assurances laboratoire saf Equations de vraisemblance Parallèle entre GLM et vraisemblance locale (suite) GLMs Vraisemblance locale • La dérivée de l par rapport à βj est : • De même, ∂l ∂l ∂θi ∂µi ∂ηi ∂l ∂l ∂θj ∂µj ∂ηj = , = , ∂βj ∂θi ∂µi ∂ηi ∂βj ∂βv ∂θj ∂µj ∂ηj ∂βv où où ∂l yi − b (θi ) yi − µi ∂l y j − µj = = , = , ∂θi a(φ) a(φ) ∂θj a(φ) ∂µi V[Yi ] ∂µj V[Yj ] = b (θi ) = , = b (θj ) = , ∂θi a(φ) ∂θj a(φ) ∂ηi ∂ηi ∂ηj ∂ηj = 1, = ui , = 1, = uj − ui , ∂β0 ∂β1 ∂β0 ∂β1 ∂ηi ∂ηi ∂ηj ∂ηj = vi , = ui2 , = vj − vi , = (uj − ui )2 , ∂β2 ∂β3 ∂β2 ∂β3 ∂ηi ∂ηi ∂ηj ∂ηj = ui vj , = vi2 . = (uj − ui )(vj − vi ), = (vj − vi )2 . ∂β4 ∂β5 ∂β4 ∂β5 Slide 60/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 61. institut de science financiere et d’assurances laboratoire saf Equations de vraisemblance Parallèle entre GLM et vraisemblance locale (suite) GLMs Vraisemblance locale On obtient les équations de vraisemblance suivantes : n n n n ∂l (yi − µi ) ∂µi ∂l (yj − µj ) ∂µj = =0 = wj =0 ∂β0 V[Yi ] ∂ηi ∂β0 V[Yj ] ∂ηj i=1 i=1 j=1 j=1 . . . . . . n n n n ∂l (yi − µi ) ∂µi 2 ∂l (yj − µj ) ∂µj = vi = 0. = wj (vj − vi )2 = 0. ∂β5 V[Yi ] ∂ηi ∂β5 V[Yj ] ∂ηj i=1 i=1 j=1 j=1 Slide 61/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 62. institut de science financiere et d’assurances laboratoire saf Equations de vraisemblance Parallèle entre GLM et vraisemblance locale (suite) GLMs Vraisemblance locale En notation matricielle : X V (y − µ) = 0, où T X T W V (y − µ) = 0, où 1 2 u1 v1 u1 u1 v1 v12 1 u1 − ui v1 − vi ... (v1 − vi )2     1 u2 v2 u22 u2 v2 2 v2  1 u2 − ui v2 − vi ... (v2 − vi )2  X = . . . . . . . , X = . . . . . , . . . . . . . . . . . . . . . . . . . . .  1 un vn un2 un vn vn2 1 un − ui vn − vi ... (vn − vi )2 et V est une matrice diagonale avec et W est une matrice diagonale avec wj 1 ∂µi V[Yi ] ∂ηi comme ième éléments sur sa comme jème éléments sur sa diagonale. diagonale. La fonction de lien η = g(µ) détermine ∂µi /∂ηi = ∂g −1 (ηi )/∂ηi . Ces équations ne possèdent en général pas de solutions explicites et doivent être résolues numériquement. On utilise une modification de l’algorithme de Newton-Raphson qui porte le nom de méthode de scoring de Fisher. Slide 62/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 63. institut de science financiere et d’assurances laboratoire saf Table des matières Modification de la fonction de poids 1 Introduction aux bordures L’assurance dépendance Variance, influence et degrés de Notions démographiques et notation liberté Hypothèse de mortalité constante Intervalles de confiance par morceaux Sélection des paramètres Présentation des données Conclusion Prémisses sur les modèles de lissage 3 Méthodes adaptatives de Rappel sur les GLMs vraisemblance locale Intersection des intervalles de 2 Méthode de vraisemblance locale confiance Des GLMs à la vraisemblance locale Facteurs de correction de la fenêtre Illustration de l’idée générale d’observation Equations de vraisemblance 4 Applications Résolution des équations de Surfaces ajustées vraisemblance Analyse des résidus Implémentation de l’algorithme sous Comparaisons R 5 Conclusions Slide 63/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 64. institut de science financiere et d’assurances laboratoire saf Résolution des équations de vraisemblance Parallèle entre GLM et vraisemblance locale (suite) Dans le cadre d’un GLM, • chaque étape de l’algorithme constitue un ajustement de type moindres carrées pondérés, • c’est une généralisation des MCO qui prend en compte la non-constance de la variance de Yi . • les observations recueillies en des points où la variabilité est plus faible sont affectées d’un poids plus important dans la détermination des paramètres. • à chaque itération les poids sont remis à jours. • on emploie le terme de moindres carrés itérativement re-pondérés ou IRWLS. Dans le cadre de la vraisemblance locale, on emploiera une version localisée de l’IRWLS. Slide 64/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 65. institut de science financiere et d’assurances laboratoire saf Résolution des équations de vraisemblance Parallèle entre GLM et vraisemblance locale (suite) • L’algorithme de Newton-Raphson utilise la matrice d’information de Fisher. • Cette matrice contient l’information concernant la courbure de la fonction de log vraisemblance au point d’estimation. • Plus grande est la courbure, plus l’information apportée au sujet des paramètres du modèles est importante. • (En effet les écarts-types des estimateurs sont les racines carrées des éléments diagonaux de l’inverse de la matrice d’information de Fisher. Plus la courbure de la fonction de vraisemblance est importante, plus les écarts-types sont petits.) • Pour un GLM, la dérivée partielle seconde est : ∂2l ∂2l = xij xik . ∂βj βk ∂ηi2 Slide 65/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 66. institut de science financiere et d’assurances laboratoire saf Résolution des équations de vraisemblance Parallèle entre GLM et vraisemblance locale (suite) • En utilisant la règle de dérivation en chaine, on obtient : ∂2l ∂ ∂l ∂θi ∂ ∂2l ∂l ∂ 2 θi 2 = ∂η ∂ηi ∂θi ∂ηi = ∂ηi ∂θi ∂ηi + ∂θi ∂ηi2 i 2 ∂2l ∂θi ∂l ∂ 2 θi = + ∂θi2 ∂ηi ∂θi ∂ηi2 • Comme ∂l/∂θi = (yi − µi )/a(φ), sa dérivée est ∂ 2 l/∂θi2 = −1/a(φ)∂µi /∂θi . De plus ∂µi /∂θi = b (θi ), on obtient ∂2l 1 ∂θi 2 ∂µi 2 ∂ 2 θi = −b (θi ) + (yi − µi ) ∂ηi2 a(φ) ∂µi ∂ηi ∂ηi2 1 1 ∂µi 2 ∂ 2 θi = − + (yi − µi ) . a(φ) b (θi ) ∂ηi ∂ηi2 • SI θ ≡ η, alors ∂ 2 θi /∂ηi2 = 0. Slide 66/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles
  • 67. institut de science financiere et d’assurances laboratoire saf Résolution des équations de vraisemblance Parallèle entre GLM et vraisemblance locale (suite) • Dans la méthode de scoring de Fisher, l’actuelle matrice hessienne dans l’itération de Newton-Raphson est remplacé par sa valeur espérée, qui est la négative de la matrice d’information de Fisher I. Dans ce cas là aussi le second terme disparait. On obtient n ∂2l 1 1 ∂µi 2 Ijk = E − = xij xik ∂βj βk i=1 φ b (θi ) ∂ηi n ωii xij xik 1 = = (X T ΩX)jk i=1 φ φ 2 où Ω est un matrice diagonale avec ωii = b 1 i ) ∂µii (θ ∂η qui dépend de µi . Car ηi = g(µi ), on a ∂ηi /∂µi = g (µi ). • Dans le cadre de la vraisemblance locale, on obtient 1 Ivk = (X T W ΩX)vk φ Slide 67/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles