Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.
La détection de la Fraude
par la connaissance des données
Carte Blanche Partenaires
2
SOMMAIRE
Qui sommes-nous ? 3
La donnée au cœur 7
DataScience: Le Conseil 32
De l’analyse à la prédiction 14
La détection...
3
Qui sommes-nous ?
4
CARTE BLANCHE PARTENAIRES
Spécialisé dans la Santé, la Prévention, et la Protection sociale
L’ACCOMPAGNEMENT SANTÉ
Préve...
5
CARTE BLANCHE PARTENAIRES
3,5M de données personnelles de santé depuis 2015
Chiffres clés
160 000
professionnels de sant...
6
LE RESEAU OPTIQUE
Chiffres clés
14
enseignes optique
partenaires
27
verriers
partenaires
+58 000
références
de verres / ...
7
La donnée au cœur
8
LE TRAITEMENT DES DONNEES
Que fait-on de ces données ?
 Les consommations en
interne et en externe
(croisement avec les...
9
LE TRAITEMENT DES DONNEES
Volume et Variété
plus 100
tables de données
pour le modèle de base
500
variables
prise en
cha...
10
LE TRAITEMENT DES DONNEES
Dans le respect du RGPD
Règlement
Général sur la
Protection
des
Données
Au niveau
européen
Un...
11
Les données personnelles de santé sont
confinées et sécurisées au sein d’un
hébergeur agréé données de santé pour une
p...
12
LE TRAITEMENT DES DONNEES
Pour quoi faire ?
→ À la bonne personne
→ Au bon endroit
→ Au bon moment
Uniquement pour appo...
13
LE TRAITEMENT DES DONNEES
Satisfaction et Fraude
La satisfaction des assurés ne doit pas être
diminuée par la fraude.
N...
14
De l’analyse à la prédiction
15
FRAUDE A L’ASSURANCE
La dernière action menée au niveau européen sous forme d’un
livret intitulé « L’impact de la fraud...
16
CONTRÔLES
A POSTERIORI
Les contrôles sont
réalisés en sortie du
système de gestion des
prises en charge
Etablir de nouv...
17
LES PROCESS DE DETECTION
L’expertise se construit sur l’expérience.
Importance de l’historique de l’activité
Deux étape...
18
DETECTION - EXPERTISE
Nos experts Conseil
Utilisation du décisionnel santé pour
enrichir les analyses et disposer d’une...
19
RGPD & FRAUDE
Le règlement européen appliqué à la Fraude
RGPD et profilage
Le RGPD exige un consentement
spécial lorsqu...
20
DATAVISUALISATION
L’outil Décisionnel
Permet une meilleure compréhension
par la visualisation des données
21
UN COMPLEMENT NECESSAIRE
Afin d’améliorer ce taux de détection, le recours à
des techniques de DataScience est nécessai...
22
DATASCIENCE
AU SERVICE DE LA DETECTION
La mise en production
Trois étapes
La préparation des données
Deux formes d’algo...
23
LE PROJET DATASCIENCE
Limiter le nombre de champs libres pour éviter les
problèmes de chargement de données.
Eviter les...
24
LE PROJET DATASCIENCE
Etape 1 : LA PREPARATION DES DONNEES
La règle à suivre
Toute donnée doit faire l’objet de retrait...
25
LE PROJET DATASCIENCE
Etape 2 : LES ALGORITHMES
R est à la fois un logiciel de statistique et un langage de
programmati...
26
LE PROJET DATASCIENCE
Recherche des similarités
dans les demandes
et non des phénomènes de fraude.
Etape 2 : LES ALGORI...
27
Algorithme supervisé
LE PROJET DATASCIENCE
L’OBJECTIF
Déterminer un % de fraude potentielle sur chaque PEC, qui évolue ...
28
Algorithme supervisé
LE PROJET DATASCIENCE
L’apprentissage doit se faire sur de bonnes bases
(données), sinon l’algorit...
29
La quasi-totalité des langages de
programmation sont des langages
« in-memory » : tous les objets sont
stockés dans la ...
30
LE PROJET DATASCIENCE
Un meilleure ciblage des Professionnels de Santé en
sanctionnant les plus fraudeurs et en dissuad...
31
LE PROJET DATASCIENCE
Bilan
Les atypismes issus des contrôles poussés par
les algorithmes permettent de mettre en place...
32
DataScience : le conseil
33
CONSEIL EN DATA SCIENCE
Constat
Du Big Data au Machine Learning
Les tendances de recherche des mots clés « Big Data » e...
34
CONSEIL EN DATA SCIENCE
Il y a 20 ans …
La connaissance de la donnée
→ « Base de données clients »
→ « Datawarehouse »L...
35
CONSEIL EN DATA SCIENCE
Un usage largement limité des données
Une centralisation des données effective MAIS amenant à d...
36
CONSEIL EN DATA SCIENCE
Un constat
L’automatisation des tâches d’analyse simplifie grandement la
vie des utilisateurs.
...
37
CONSEIL EN DATA SCIENCE
L’automatisation de la data est un déclencheur pour entrer
de plain-pied dans l’ère de l’optimi...
38
CONSEIL EN DATA SCIENCE
Les 5 V du big data (Volume, Variété, Vitesse, Véracité et
Valeur) sont à recouper avec les 5 S...
39
CONSEIL EN DATA SCIENCE
Miser sur le Smart Data
Le Smart Data accorde + d’importance à la précision de
la valeur des do...
MERCI DE VOTRE ATTENTION
Nous contacter
Sarah GICQUEAU, Chargée d’Affaires
sarah.gicqueau@carteblanchepartenaires.fr
+33 (...
Prochain SlideShare
Chargement dans…5
×

La détection de la fraude par la connaissance des données - Carte Blanche Partenaires

624 vues

Publié le

En tant que régulateur des dépenses de santé, Carte Blanche Partenaires a développé une forte expertise dans la lutte contre la fraude, problématique maîtresse dans le secteur de l’assurance santé.

La solution d’analyse des données de Carte Blanche Partenaires et la plateforme de gestion des prises en charge dématérialisée garantissent la pertinence des contrôles anti-fraude. Le développement d’algorithmes auto-apprenants renforce ce niveau de pertinence. Mais c’est en couplant ces techniques avec une expertise d’analyse que l’entreprise tirera au mieux profit de l’utilisation de la data.

Comment la DataScience permet-elle le traitement optimal des données ? Comment l’utilisation d’algorithmes autoapprenants peut-elle amener à des règles de détection de la fraude pertinentes, le tout au service des assurés et des assureurs ?

Publié dans : Données & analyses
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

La détection de la fraude par la connaissance des données - Carte Blanche Partenaires

  1. 1. La détection de la Fraude par la connaissance des données Carte Blanche Partenaires
  2. 2. 2 SOMMAIRE Qui sommes-nous ? 3 La donnée au cœur 7 DataScience: Le Conseil 32 De l’analyse à la prédiction 14 La détection de la Fraude par la connaissance des données
  3. 3. 3 Qui sommes-nous ?
  4. 4. 4 CARTE BLANCHE PARTENAIRES Spécialisé dans la Santé, la Prévention, et la Protection sociale L’ACCOMPAGNEMENT SANTÉ Prévention, conseil & information → Apporter au bénéficiaire des informations et conseils pour l’aider à gérer sa santé au quotidien → Améliorer son parcours de santé par la mise en place de services innovants → Faciliter l’accès à des soins de qualité, à proximité, au juste prix → Accéder à des services spécifiques et des avantages qualitatifs et tarifaires exclusifs → Adapter l’orientation vers un professionnel ou établissement de santé selon les besoins
  5. 5. 5 CARTE BLANCHE PARTENAIRES 3,5M de données personnelles de santé depuis 2015 Chiffres clés 160 000 professionnels de santé 7,2 M de bénéficiaires 39 complémentaires Santé 7600 opticiens 6600 chirurgiens-dentistes 3400 audioprothésistes renouvellement du réseau audio en cours
  6. 6. 6 LE RESEAU OPTIQUE Chiffres clés 14 enseignes optique partenaires 27 verriers partenaires +58 000 références de verres / lentilles jusqu’à 40% de remise 100% de PEC dématérialisées 9 achats / 10 dans le réseau
  7. 7. 7 La donnée au cœur
  8. 8. 8 LE TRAITEMENT DES DONNEES Que fait-on de ces données ?  Les consommations en interne et en externe (croisement avec les données des gestionnaires d’assurance )  Parcours de santé intra- réseaux et inter-réseaux (optique, dentaire, audio,…) SANTÉ Analyser les comportements  Système expert pour le traitement de la fraude complété avec des algorithmes  Services d’informations (Guidhospi) et de préventions ciblés RÉSEAU Optimiser la gestion  Aide à la tarification  Aide à la conception d’offres et de services spécifiques ASSURANCE Collaborer 1 2 3
  9. 9. 9 LE TRAITEMENT DES DONNEES Volume et Variété plus 100 tables de données pour le modèle de base 500 variables prise en charge Convention Open data CataloguesCRM Web Permet d’avoir une vision transverse et riche des comportements
  10. 10. 10 LE TRAITEMENT DES DONNEES Dans le respect du RGPD Règlement Général sur la Protection des Données Au niveau européen Un cadre commun en matière de protection des données personnelles Entrée en application le 25 mai 2018 Droits des personnes et consentements renforcés La finalité des traitements est primordiale pour utiliser les données.
  11. 11. 11 Les données personnelles de santé sont confinées et sécurisées au sein d’un hébergeur agréé données de santé pour une période de 3 ans. Les données pseudonymisées puis les agrégats sont conservés dans une plateforme sécurisée sur une période de 6 ans pour les besoin de suivi statistiques. LE TRAITEMENT DES DONNEES Archivage et sécurité La sécurité et la conservation des données sont des enjeux majeurs. Responsable de traitement vis-à-vis de la CNIL Agrémentation HDS en cours auprès de l’ASIP
  12. 12. 12 LE TRAITEMENT DES DONNEES Pour quoi faire ? → À la bonne personne → Au bon endroit → Au bon moment Uniquement pour apporter des avantages Rendre Service Collecter les données et les analyser pour créer de nouveaux services adaptés et personnalisés dans un parcours de santé accompagné SERVICES PERSONNALISÉS SANS ÊTRE INDIVIDUALISÉS
  13. 13. 13 LE TRAITEMENT DES DONNEES Satisfaction et Fraude La satisfaction des assurés ne doit pas être diminuée par la fraude. Ni la qualité des soins ou des équipements
  14. 14. 14 De l’analyse à la prédiction
  15. 15. 15 FRAUDE A L’ASSURANCE La dernière action menée au niveau européen sous forme d’un livret intitulé « L’impact de la fraude » chiffre le montant des pertes liées à la fraude en Europe à 10 % du coût total des sinistres. « UFC que choisir » a estimé que 19,5% des opticiens du territoire français proposent spontanément une fraude à la complémentaire santé. les chiffres 10 % du coût total des sinistres. 19,5 % des opticiens
  16. 16. 16 CONTRÔLES A POSTERIORI Les contrôles sont réalisés en sortie du système de gestion des prises en charge Etablir de nouvelles règles pour enrichir les contrôles a priori en entrée du système de gestion. SERVICE CONTRÔLES Deux méthodes complémentaires CONTRÔLES A PRIORI Les contrôles sont réalisés en entrée du système de gestion des prises en charge. 500 000 prises en charges refusées par an 4 300 contrôles par an
  17. 17. 17 LES PROCESS DE DETECTION L’expertise se construit sur l’expérience. Importance de l’historique de l’activité Deux étapes DETECTION Le décisionnel Santé  Intuitivité et simplicité d’utilisation  Rapidité de restitution  Rapidité de traitement des informations INVESTIGATION Expertise et gestion  Expertise métiers  Outil interne de gestion de courriers  en interactions avec le décisionnel INVESTIGATION DETECTION
  18. 18. 18 DETECTION - EXPERTISE Nos experts Conseil Utilisation du décisionnel santé pour enrichir les analyses et disposer d’une vision transverse Une connaissance enrichie EXPERTISE METIER En lien permanent avec les professionnels de santé pour le traitement de dossier nécessitant une expertise Une connaissance actualisée Des professionnels de santé (opticiens, chirurgien-dentiste, audioprothésiste) Une connaissance des pratiques du métier
  19. 19. 19 RGPD & FRAUDE Le règlement européen appliqué à la Fraude RGPD et profilage Le RGPD exige un consentement spécial lorsqu’un profilage existe. Dans ce contexte, le profilage est axé sur les Prises en Charge, non les professionnels de santé. Autorisation CNIL La CNIL nous a autorisés à mettre en place notre traitement. L’ensemble des informations de consentement pour les professionnels et les assurés ont été mises à jour.
  20. 20. 20 DATAVISUALISATION L’outil Décisionnel Permet une meilleure compréhension par la visualisation des données
  21. 21. 21 UN COMPLEMENT NECESSAIRE Afin d’améliorer ce taux de détection, le recours à des techniques de DataScience est nécessaire. La logique DataScience 50 % TAUX DE DETECTION 10 règles REGLES DETERMINISTES
  22. 22. 22 DATASCIENCE AU SERVICE DE LA DETECTION La mise en production Trois étapes La préparation des données Deux formes d’algorithmes Algorithme non supervisé Algorithme supervisé
  23. 23. 23 LE PROJET DATASCIENCE Limiter le nombre de champs libres pour éviter les problèmes de chargement de données. Eviter les variables avec beaucoup de modalités (>500) Un traitement spécifique est réalisé pour que les données puissent entrer dans les algorithmes. Etape 1 : LA PREPARATION DES DONNEES Pour garder des champs libres, il est mieux de normaliser ces champs (espaces en trop,….) Pour préparer les données, il faut :
  24. 24. 24 LE PROJET DATASCIENCE Etape 1 : LA PREPARATION DES DONNEES La règle à suivre Toute donnée doit faire l’objet de retraitements et de contrôles avant son utilisation dans les modèles statistiques. Détection des anomalies Tests de cohérence, Requêtes, Data visualisation Traitement Suppression des données, Gestion des valeurs extrêmes, Discrétisation des variables continues Analyse des données Data visualisation, Données statistiques
  25. 25. 25 LE PROJET DATASCIENCE Etape 2 : LES ALGORITHMES R est à la fois un logiciel de statistique et un langage de programmation de référence chez les actuaires et plus largement dans les domaines de la banque et de l’assurance. Multiplier les approches pour avoir une vision plus large Algorithme non supervisé Modèle de clustering sans prise en compte de l’expérience Pour détecter les atypismes Algorithme supervisé Modèle prédictif avec prise en compte de l’expérience Pour scorer les PECs Programmer les algorithmes avec R
  26. 26. 26 LE PROJET DATASCIENCE Recherche des similarités dans les demandes et non des phénomènes de fraude. Etape 2 : LES ALGORITHMES Permet une qualification de fraude par les experts métiers à partir des regroupements de PEC atypiques. Et par défaut, d’identifier des failles dans la qualité de données. Algorithme Non supervisé Un modèle de clustering qui complète les techniques de détection en capitalisant sur tout l’historique de données (contrôlées ou pas)
  27. 27. 27 Algorithme supervisé LE PROJET DATASCIENCE L’OBJECTIF Déterminer un % de fraude potentielle sur chaque PEC, qui évolue avec l’autoapprentissage. OUI, MAIS… Etape 2 : LES ALGORITHMES Un modèle prédictif basé sur les fraudes avérées pour capitaliser sur l’historique des contrôles effectués Le machine learning
  28. 28. 28 Algorithme supervisé LE PROJET DATASCIENCE L’apprentissage doit se faire sur de bonnes bases (données), sinon l’algorithme apprend mais mal. Pour éviter ce phénomène, on a choisi de faire des algorithmes qui apprennent progressivement. Etape 2 : LES ALGORITHMES En raison de la sensibilité à la qualité des données en entrée, un autoapprentissage progressif est plus adapté. 1 algorithme de référence qui autoapprend qui n’apprend pas Comparaison des 2
  29. 29. 29 La quasi-totalité des langages de programmation sont des langages « in-memory » : tous les objets sont stockés dans la mémoire vive (RAM). LE PROJET DATASCIENCE Etape 3 : LA MISE EN PRODUCTION La phase d’industrialisation Prévoir des mises en production agiles Procéder à de nombreux tests comparatifs de modèles Préparer l’infrastructure
  30. 30. 30 LE PROJET DATASCIENCE Un meilleure ciblage des Professionnels de Santé en sanctionnant les plus fraudeurs et en dissuadant les autres. Bilan 50% Taux de détection des contrôles non conformes par rapport à la totalité des contrôles effectués. TAUX DE DETECTION 70% Quel bilan ?
  31. 31. 31 LE PROJET DATASCIENCE Bilan Les atypismes issus des contrôles poussés par les algorithmes permettent de mettre en place de nouvelles règles. L’explication des contrôles enrichit l’expertise. CAS DE FRAUDE DETECTEE Les algorithmes ont fait ressortir des prises en charges « trop normales ». Suite à l’investigation de l’expert, l’opticien renseignait toujours les mêmes corrections, tandis qu’il proposait des équipements de correction différente pour le même prix.
  32. 32. 32 DataScience : le conseil
  33. 33. 33 CONSEIL EN DATA SCIENCE Constat Du Big Data au Machine Learning Les tendances de recherche des mots clés « Big Data » et « Machine Learning » sur Google La fin du « Big Data » ? En tous cas, détrôné par le « Machine Learning » = algorithmes auto-apprenants
  34. 34. 34 CONSEIL EN DATA SCIENCE Il y a 20 ans … La connaissance de la donnée → « Base de données clients » → « Datawarehouse »Le « HYPE » Les entreprises investissaient alors dans des POC puis des projets de DataWarehouse « Base de données clients » « Datawarehouse » « Big Data » « Data Lake » En miroir avec aujourd’hui = =
  35. 35. 35 CONSEIL EN DATA SCIENCE Un usage largement limité des données Une centralisation des données effective MAIS amenant à du FACTUEL uniquement = Reporting et tableaux de bord Constat post tendance DataWarehouse L’usage intelligent et sophistiqué des données peu mis en œuvre Une forte expertise métiers est nécessaire pour une culture d’entreprise orientée « Données ». La clé ?
  36. 36. 36 CONSEIL EN DATA SCIENCE Un constat L’automatisation des tâches d’analyse simplifie grandement la vie des utilisateurs. La DataScience n’est pas une fin Une tendance lourde Automatiser tout ce qui est automatisable L’automatisation des algorithmes diminue le besoin de ressources en DataScientists au sein des entreprises. Capacité de multiplication des analyses dans un temps contraint
  37. 37. 37 CONSEIL EN DATA SCIENCE L’automatisation de la data est un déclencheur pour entrer de plain-pied dans l’ère de l’optimisation par la data. Vers le traitement intelligent des données Seul le traitement intelligent de ces données, le smart data, permettra à l’entreprise d’améliorer son efficacité. Les gisements d’efficacité et de croissance ne passeront pas exclusivement par le big data. Du Big Data au Smart Data … Une opportunité Le rôle du Business Analyst
  38. 38. 38 CONSEIL EN DATA SCIENCE Les 5 V du big data (Volume, Variété, Vitesse, Véracité et Valeur) sont à recouper avec les 5 S Les ingrédients du Smart Data Stratégie Sélectionner Signifier Symboliser Définir les bénéfices à venir grâce à une réflexion sur les usages concrets attendus par les opérationnels Sourcer Identifier les sources de données en interne et en externe Sélectionner des données réellement utiles et rationaliser les systèmes d’informations Transformer les données brutes en indicateurs plus faciles à manipuler La datavisualisation
  39. 39. 39 CONSEIL EN DATA SCIENCE Miser sur le Smart Data Le Smart Data accorde + d’importance à la précision de la valeur des données en rapport au but et à la problématique ciblés. ! La connaissance de la donnée n’est pas le stockage ! L’expertise de l’analyse métiers est essentielle. C’est le moteur de Carte Blanche Partenaires. Se centrer sur l’usage intelligent des données pour arriver à un but concret.+
  40. 40. MERCI DE VOTRE ATTENTION Nous contacter Sarah GICQUEAU, Chargée d’Affaires sarah.gicqueau@carteblanchepartenaires.fr +33 (0)6 40 79 18 96 Hélène BURY, Responsable Communication helene.bury@carteblanchepartenaires.fr +33 (0)6 31 69 43 08 www.jean-francois-tripodi.com www.carteblanchepartenaires.fr

×