Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

BIG DATA SGT2
NOUVEAUX MOD `ELES DE MUTUALISATION
Olivier Lopez
Ensae Paris-Tech & Crest-Ensae, Laboratoire de Finance et d’Assurance,
Centre d’Etudes Actuarielles
Maison des actuaires, 11 mars 2014
O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 1 / 18

INTRODUCTION
Modèle économique de l’assurance : repose sur la mutualisation,
la solidarité.
La population étant constituée de profils de risques hétérogènes,
les modèles de tarification reposent sur un équilibre entre une
prévision la plus fine possible du risque individuel, et une
expérience collective du risque.
Cette prédiction du risque est effectuée à partir de
caractéristiques mesurées sur l’individu (sinistres passés, âge,
catégorie socio-professionnelle...)
Big Data : opportunité d’accéder à un nombre gigantesque de
variables qui permettraient d’accéder à une meilleure
connaissance du risque.

OBSTACLES, QUESTIONS POS ÉES
Cette utopie (connaissance ”parfaite” du risque de chaque
individu) est-elle réalisable, et si oui, en quelle mesure, de quelle
manière ?
Le modèle sur lequel elle déboucherait est-il viable ?
Le principe de mutualisation sera-t-il toujours respecté ?

RÉPONSE DIFF ÉRENCI ÉE
Le ”Big Data” recouvre des situations variées et ces
problématiques peuvent trouver des réponses différentes suivant
les différents contextes.
Différents contextes auxquels on peut penser (liste non
exhaustive) :
Assurance auto (”pay as you drive”)
Assurance santé (”pay as you live”)
Assurance habitation (”pay as you own”)
Souscription en ligne (frontière avec le marketing ?)

PLAN DE LA PR ÉSENTATION
1 DIFFICULT ÉS M ÉTHODOLOGIQUES ET NOUVEAUX OUTILS
2 VIABILIT É DU SYST ÈME
3 DÉRIVES ÉVENTUELLES

DIFFICULT ´ES M ´ETHODOLOGIQUES ET NOUVEAUX OUTILS

DONN ÉES DE GRANDE DIMENSION
Incorporer plus de variables permet d’avoir un modèle en théorie
plus proche de la réalité.
Mais si le nombre de paramètres est trop important, leur
estimation sera très mauvaise et l’approche se trouvera
contre-productive.
Nécessité de prendre en compte des méthodes statistiques
récentes basées sur la réduction de dimension, la parcimonie etc.
Méthodes de machine learning: permettre d’envisager des
modèles moins linéaires que les modèles classiques.

PLUSIEURS FAÇONS D’ÊTRE ”BIG”
Formalisation mathématique sommaire :
Y = ce qu’on veut prédire (généralement coût de l’assuré)
X = caractéristiques d’un individu (contient toute l’information
disponible), X ∈ Rd
.
But : estimer E[Y|X] (i.e. prédiction de la valeur de Y à partir de
l’information donnée par X.
Pour l’estimer on dispose d’observations (Y1, X1, ..., Yn, Xn).
Big data version 1 : n est raisonnable, d est énorme.
Big data version 2 : n est également énorme.

DIFF ÉRENCES DE PROBL ÉMATIQUES (EXEMPLES)
Premier cas : (n raisonnable, d >> 1) les données proviennent
d’un portefeuille d’assurés comportant n individus, sur lesquels on
a récupéré des caractéristiques diverses et nombreuses.
Dans ce cas, la quantité d’information disponible sur un individu
est ”supérieure” à la quantité d’information dont on dispose pour
calibrer et/ou valider le modèle.
Nécessité de faire le tri entre information pertinente et moins
pertinente.
Deuxième cas : (n >> 1, d >> 1) on peut s’autoriser des
modèles plus compliqués, car on dispose de plus d’observations
pour les valider. Mais on peut buter sur des problématiques de
temps de calcul.

MANIPULATION DES MOD ÈLES OBTENUS
Le contexte Big Data offre la possibilité de produire des modèles
avec un grand degré de complexité.
Adéquation des modèles ?
Comment trouver un compromis entre cette volonté de produire
un modèle suffisamment proche d’une réalité complexe, et
suffisamment proche pour permettre un pilotage, une analyse etc.
Attitude des souscripteurs ? (hors question de la souscription en
ligne)
Une piste : construction d’indicateurs synthétiques et
compréhensibles à partir de données riches.

VIABILIT ´E DU SYST `EME

EFFET HIRSHLEIFER
Dans un monde où la connaissance du risque de chaque individu
est parfaite, les bons risques quittent le navire (départ vers une
concurrence qui aurait une longueur d’avance).
Asymétrie d’information : on peut imaginer que seul l’assureur
possède la connaissance du risque, l’assuré n’ayant qu’une vision
plus vague de son propre risque.
Risque de déséquilibre : l’assuré va vite apprendre à connaˆıtre
son propre risque en utilisant les mêmes outils que l’assureur
(quitte à passer par un intermédiaire).
Dans un tel contexte, la recherche d’une meilleure connaissance
du risque individuel aboutit à une position plus dangereuse de
l’assureur en détériorant son résultat suite au départ des bons
risques.

PERTINENCE DES MOD ÈLES
Comment ”backtester” la pertinence des variables retenues pour
prédire le risque ?
Santé : l’utilisation d’objet connectés permet de mesurer des
constantes que les médecins peuvent interpréter.
Pay as you drive : on peut sans doute trouver un lien entre les
variables rendant compte du comportement du conducteur et le
risque qu’il ait un accident.
Souscription en ligne : sans doute plus problématique car
1 les variables collectées sur l’assuré éclairent-elles le risque ?
2 problème d’un risque qui peut se produire sur un temps long,
évalué à partir de variables qui peuvent évoluer en un temps court.

ASSURANCE PARAM ÉTRIQUE
Principe : l’assurance porte sur un paramètre dont on estime qu’il
a un lien avec un élément contre lequel l’assuré souhaite se
protéger.
Exemple : si la quantité de pluie tombant dans une zone dépasse
un certain seuil, on verse un capital à une collectivité locale pour
indemniser les éventuels sinistres.
Dans l’exemple précédent, l’indemnisation ne tient pas compte
des dégâts réels liés à un épisode de pluies torrentielles.
Avantage : l’assureur maˆıtrise mieux son risque, puisqu’il peut le
faire porter sur un paramètre sur lequel il a une meilleure maˆıtrise.
Inconvénient : sous quelles conditions l’assuré est-il prêt à jouer
le jeu ? Que se passe-t-il si le paramètre est trop loin des
préoccupations de l’assuré ?

D´ERIVES ´EVENTUELLES

UTILISATION DU BIG DATA POUR CONTOURNER LA
L ÉGISLATION
Le législateur interdit l’utilisation de certaines variables
discriminantes.
Une tentation est d’essayer de reconstruire, via l’information
disponible sur l’individu, des caractéristiques auxquelles on n’a
pas le droit d’accéder, pour ensuite être à même de les utiliser.
Peut porter atteinte au principe de mutualisation et de solidarité
en excluant des catégories de population de l’assurance, ou en
majorant leur prime sur des critères qui ne sont pas souhaitables.
Attitude face à de telles pratiques ? Détection de tels
comportements ? Conséquences pour l’ensemble du marché ?

EXC ÈS DE CONFIANCE
Aussi précise que peuvent être les méthodes utilisées, la
survenance d’un sinistre reste un élément aléatoire.
La variabilité du résultat est d’autant plus grandes que les classes
de risque obtenues sont petites.
On peut imaginer que les résultats dans chacune de ces poches
finissent par se compenser, mais ceci est loin d’être évident
(notamment si on imagine des classes de risques petites où les
entrées-sorties peuvent être importantes vis-à-vis de l’effectif
général).
Si l’assureur possède une confiance excessive en ses modèles du
fait de la quantité d’information qu’il aura utilisée pour les
construire, il ne se couvrira pas suffisamment contre des mauvais
résultats.

OBJECTIFS DU SGT2
Identifier les outils pertinents pour :
1 saisir l’opportunité du Big Data et améliorer la connaissance et le
suivi de son risque par l’assureur;
2 tenir compte des contraintes qui permettent d’aboutir à un système
de mutualisation viable.
Formaliser scientifiquement aussi précisément que possible les
attentes des acteurs de l’assurance face au Big Data pour
proposer des pistes de résolution de leurs problématiques.
Anticiper l’impact des évolutions techniques sur le marché et
réciproquement.

Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

Recommandé

Recommandé

Contenu connexe

En vedette

En vedette (20)

Similaire à Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

Similaire à Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires (20)

Plus de Kezhan SHI

Plus de Kezhan SHI (20)

Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires