SlideShare une entreprise Scribd logo
La détection de la Fraude
par la connaissance des données
Carte Blanche Partenaires
2
SOMMAIRE
Qui sommes-nous ? 3
La donnée au cœur 7
DataScience: Le Conseil 32
De l’analyse à la prédiction 14
La détection de la Fraude
par la connaissance des données
3
Qui sommes-nous ?
4
CARTE BLANCHE PARTENAIRES
Spécialisé dans la Santé, la Prévention, et la Protection sociale
L’ACCOMPAGNEMENT SANTÉ
Prévention, conseil & information
→ Apporter au bénéficiaire des informations et conseils pour
l’aider à gérer sa santé au quotidien
→ Améliorer son parcours de santé par la mise en place
de services innovants
→ Faciliter l’accès à des soins de qualité, à proximité, au juste prix
→ Accéder à des services spécifiques et des avantages qualitatifs et
tarifaires exclusifs
→ Adapter l’orientation vers un professionnel ou établissement de santé selon
les besoins
5
CARTE BLANCHE PARTENAIRES
3,5M de données personnelles de santé depuis 2015
Chiffres clés
160 000
professionnels de santé
7,2 M
de bénéficiaires
39
complémentaires Santé
7600
opticiens
6600
chirurgiens-dentistes
3400
audioprothésistes
renouvellement du réseau audio en cours
6
LE RESEAU OPTIQUE
Chiffres clés
14
enseignes optique
partenaires
27
verriers
partenaires
+58 000
références
de verres / lentilles
jusqu’à 40%
de remise
100%
de PEC dématérialisées
9 achats / 10
dans le réseau
7
La donnée au cœur
8
LE TRAITEMENT DES DONNEES
Que fait-on de ces données ?
 Les consommations en
interne et en externe
(croisement avec les
données des gestionnaires
d’assurance )
 Parcours de santé intra-
réseaux et inter-réseaux
(optique, dentaire,
audio,…)
SANTÉ
Analyser les comportements
 Système expert
pour le traitement
de la fraude
complété avec des
algorithmes
 Services d’informations
(Guidhospi) et de
préventions ciblés
RÉSEAU
Optimiser la gestion
 Aide à la tarification
 Aide à la conception
d’offres et de services
spécifiques
ASSURANCE
Collaborer
1 2 3
9
LE TRAITEMENT DES DONNEES
Volume et Variété
plus 100
tables de données
pour le modèle de base
500
variables
prise en
charge
Convention Open data
CataloguesCRM Web
Permet d’avoir une vision transverse et riche
des comportements
10
LE TRAITEMENT DES DONNEES
Dans le respect du RGPD
Règlement
Général sur la
Protection
des
Données
Au niveau
européen
Un cadre
commun
en matière de
protection
des données
personnelles
Entrée en
application
le 25 mai
2018
Droits des personnes et consentements renforcés
La finalité des traitements est primordiale pour utiliser les données.
11
Les données personnelles de santé sont
confinées et sécurisées au sein d’un
hébergeur agréé données de santé pour une
période de 3 ans.
Les données pseudonymisées puis les
agrégats sont conservés dans une plateforme
sécurisée sur une période de 6 ans pour les
besoin de suivi statistiques.
LE TRAITEMENT DES DONNEES
Archivage et sécurité
La sécurité et la conservation des données
sont des enjeux majeurs.
Responsable de traitement vis-à-vis de la CNIL
Agrémentation HDS en cours auprès de l’ASIP
12
LE TRAITEMENT DES DONNEES
Pour quoi faire ?
→ À la bonne personne
→ Au bon endroit
→ Au bon moment
Uniquement pour apporter des avantages
Rendre Service
Collecter les données et les analyser pour
créer de nouveaux services adaptés et
personnalisés dans un parcours de
santé accompagné
SERVICES PERSONNALISÉS SANS ÊTRE INDIVIDUALISÉS
13
LE TRAITEMENT DES DONNEES
Satisfaction et Fraude
La satisfaction des assurés ne doit pas être
diminuée par la fraude.
Ni la qualité des soins ou des équipements
14
De l’analyse à la prédiction
15
FRAUDE A L’ASSURANCE
La dernière action menée au niveau européen sous forme d’un
livret intitulé « L’impact de la fraude » chiffre le montant des
pertes liées à la fraude en Europe à 10 % du coût total des
sinistres.
« UFC que choisir » a estimé que 19,5% des opticiens du
territoire français proposent spontanément une fraude à la
complémentaire santé.
les chiffres
10 % du coût total des sinistres.
19,5 % des opticiens
16
CONTRÔLES
A POSTERIORI
Les contrôles sont
réalisés en sortie du
système de gestion des
prises en charge
Etablir de nouvelles règles pour
enrichir les contrôles a priori en
entrée du système de gestion.
SERVICE CONTRÔLES
Deux méthodes complémentaires
CONTRÔLES
A PRIORI
Les contrôles sont
réalisés en entrée du
système de gestion des
prises en charge.
500 000
prises en charges refusées par an
4 300
contrôles par an
17
LES PROCESS DE DETECTION
L’expertise se construit sur l’expérience.
Importance de l’historique de l’activité
Deux étapes
DETECTION
Le décisionnel Santé
 Intuitivité et simplicité d’utilisation
 Rapidité de restitution
 Rapidité de traitement des informations
INVESTIGATION
Expertise et gestion
 Expertise métiers
 Outil interne de gestion de courriers
 en interactions avec le décisionnel
INVESTIGATION
DETECTION
18
DETECTION - EXPERTISE
Nos experts Conseil
Utilisation du décisionnel santé pour
enrichir les analyses et disposer d’une
vision transverse
Une connaissance enrichie
EXPERTISE
METIER
En lien permanent avec les professionnels
de santé pour le traitement de dossier
nécessitant une expertise
Une connaissance actualisée
Des professionnels de santé
(opticiens, chirurgien-dentiste, audioprothésiste)
Une connaissance des pratiques
du métier
19
RGPD & FRAUDE
Le règlement européen appliqué à la Fraude
RGPD et profilage
Le RGPD exige un consentement
spécial lorsqu’un profilage existe. Dans
ce contexte, le profilage est axé sur les
Prises en Charge, non les
professionnels de santé.
Autorisation CNIL
La CNIL nous a autorisés à mettre en
place notre traitement. L’ensemble
des informations de consentement
pour les professionnels et les assurés
ont été mises à jour.
20
DATAVISUALISATION
L’outil Décisionnel
Permet une meilleure compréhension
par la visualisation des données
21
UN COMPLEMENT NECESSAIRE
Afin d’améliorer ce taux de détection, le recours à
des techniques de DataScience est nécessaire.
La logique DataScience
50 %
TAUX DE
DETECTION
10 règles
REGLES DETERMINISTES
22
DATASCIENCE
AU SERVICE DE LA DETECTION
La mise en production
Trois étapes
La préparation des données
Deux formes d’algorithmes
Algorithme non supervisé
Algorithme supervisé
23
LE PROJET DATASCIENCE
Limiter le nombre de champs libres pour éviter les
problèmes de chargement de données.
Eviter les variables avec beaucoup de modalités (>500)
Un traitement spécifique est réalisé pour que les données
puissent entrer dans les algorithmes.
Etape 1 : LA PREPARATION DES DONNEES
Pour garder des champs libres, il est
mieux de normaliser ces champs
(espaces en trop,….)
Pour préparer les données, il faut :
24
LE PROJET DATASCIENCE
Etape 1 : LA PREPARATION DES DONNEES
La règle à suivre
Toute donnée doit faire l’objet de retraitements et de contrôles avant
son utilisation dans les modèles statistiques.
Détection des
anomalies
Tests de cohérence,
Requêtes,
Data visualisation
Traitement
Suppression des
données,
Gestion des valeurs
extrêmes,
Discrétisation des
variables continues
Analyse des
données
Data visualisation,
Données statistiques
25
LE PROJET DATASCIENCE
Etape 2 : LES ALGORITHMES
R est à la fois un logiciel de statistique et un langage de
programmation de référence chez les actuaires et plus
largement dans les domaines de la banque et de l’assurance.
Multiplier les approches pour avoir une vision plus large
Algorithme non supervisé
Modèle de clustering
sans prise en compte de
l’expérience
Pour détecter les atypismes
Algorithme supervisé
Modèle prédictif
avec prise en compte de
l’expérience
Pour scorer les PECs
Programmer les algorithmes avec R
26
LE PROJET DATASCIENCE
Recherche des similarités
dans les demandes
et non des phénomènes de fraude.
Etape 2 : LES ALGORITHMES
Permet une qualification de fraude par les experts métiers à
partir des regroupements de PEC atypiques.
Et par défaut, d’identifier des failles dans la qualité de données.
Algorithme Non supervisé
Un modèle de clustering qui complète les techniques
de détection en capitalisant sur tout l’historique de
données (contrôlées ou pas)
27
Algorithme supervisé
LE PROJET DATASCIENCE
L’OBJECTIF
Déterminer un % de fraude potentielle sur chaque PEC, qui évolue avec
l’autoapprentissage.
OUI, MAIS…
Etape 2 : LES ALGORITHMES
Un modèle prédictif basé sur les fraudes avérées
pour capitaliser sur l’historique des contrôles effectués
Le machine learning
28
Algorithme supervisé
LE PROJET DATASCIENCE
L’apprentissage doit se faire sur de bonnes bases
(données), sinon l’algorithme apprend mais mal.
Pour éviter ce phénomène, on a choisi de faire des
algorithmes qui apprennent progressivement.
Etape 2 : LES ALGORITHMES
En raison de la sensibilité à la qualité des données en entrée,
un autoapprentissage progressif est plus adapté.
1 algorithme de référence
qui autoapprend qui n’apprend pas
Comparaison des 2
29
La quasi-totalité des langages de
programmation sont des langages
« in-memory » : tous les objets sont
stockés dans la mémoire vive (RAM).
LE PROJET DATASCIENCE
Etape 3 : LA MISE EN PRODUCTION
La phase d’industrialisation
Prévoir des mises en production agiles
Procéder à de nombreux tests
comparatifs de modèles
Préparer l’infrastructure
30
LE PROJET DATASCIENCE
Un meilleure ciblage des Professionnels de Santé en
sanctionnant les plus fraudeurs et en dissuadant les autres.
Bilan
50%
Taux de détection des contrôles non
conformes par rapport à la totalité
des contrôles effectués.
TAUX DE
DETECTION
70%
Quel bilan ?
31
LE PROJET DATASCIENCE
Bilan
Les atypismes issus des contrôles poussés par
les algorithmes permettent de mettre en place
de nouvelles règles.
L’explication des contrôles enrichit l’expertise.
CAS DE FRAUDE DETECTEE
Les algorithmes ont fait ressortir des prises en charges
« trop normales ». Suite à l’investigation de l’expert,
l’opticien renseignait toujours les mêmes corrections,
tandis qu’il proposait des équipements de correction
différente pour le même prix.
32
DataScience : le conseil
33
CONSEIL EN DATA SCIENCE
Constat
Du Big Data au Machine Learning
Les tendances de recherche des mots clés « Big Data » et « Machine Learning » sur Google
La fin du « Big Data » ?
En tous cas, détrôné par le
« Machine Learning »
= algorithmes auto-apprenants
34
CONSEIL EN DATA SCIENCE
Il y a 20 ans …
La connaissance de la donnée
→ « Base de données clients »
→ « Datawarehouse »Le « HYPE »
Les entreprises investissaient alors
dans des POC puis des projets de
DataWarehouse
« Base de données clients »
« Datawarehouse »
« Big Data »
« Data Lake »
En miroir avec aujourd’hui
=
=
35
CONSEIL EN DATA SCIENCE
Un usage largement limité des données
Une centralisation des données effective MAIS amenant à du
FACTUEL uniquement = Reporting et tableaux de bord
Constat post tendance DataWarehouse
L’usage intelligent et sophistiqué des données
peu mis en œuvre
Une forte expertise métiers est nécessaire pour une culture
d’entreprise orientée « Données ».
La clé ?
36
CONSEIL EN DATA SCIENCE
Un constat
L’automatisation des tâches d’analyse simplifie grandement la
vie des utilisateurs.
La DataScience n’est pas une fin
Une tendance lourde
Automatiser tout ce qui est
automatisable
L’automatisation des algorithmes diminue le besoin
de ressources en DataScientists au sein des
entreprises.
Capacité de multiplication des analyses dans un temps contraint
37
CONSEIL EN DATA SCIENCE
L’automatisation de la data est un déclencheur pour entrer
de plain-pied dans l’ère de l’optimisation par la data.
Vers le traitement intelligent des données
Seul le traitement intelligent de ces données, le smart data,
permettra à l’entreprise d’améliorer son efficacité.
Les gisements d’efficacité et de croissance ne passeront pas
exclusivement par le big data.
Du Big Data au Smart Data …
Une opportunité
Le rôle du Business Analyst
38
CONSEIL EN DATA SCIENCE
Les 5 V du big data (Volume, Variété, Vitesse, Véracité et
Valeur) sont à recouper avec les 5 S
Les ingrédients du Smart Data
Stratégie
Sélectionner
Signifier
Symboliser
Définir les bénéfices à venir grâce à une réflexion sur les
usages concrets attendus par les opérationnels
Sourcer
Identifier les sources de données en interne et en
externe
Sélectionner des données réellement utiles et
rationaliser les systèmes d’informations
Transformer les données brutes en indicateurs plus faciles
à manipuler
La datavisualisation
39
CONSEIL EN DATA SCIENCE
Miser sur le Smart Data
Le Smart Data accorde + d’importance à la précision de
la valeur des données en rapport au but et à la
problématique ciblés.
! La connaissance de la donnée n’est pas le
stockage !
L’expertise de l’analyse métiers est essentielle.
C’est le moteur de Carte Blanche Partenaires.
Se centrer sur l’usage intelligent des
données pour arriver à un but concret.+
MERCI DE VOTRE ATTENTION
Nous contacter
Sarah GICQUEAU, Chargée d’Affaires
sarah.gicqueau@carteblanchepartenaires.fr
+33 (0)6 40 79 18 96
Hélène BURY, Responsable Communication
helene.bury@carteblanchepartenaires.fr
+33 (0)6 31 69 43 08
www.jean-francois-tripodi.com
www.carteblanchepartenaires.fr

Contenu connexe

Tendances

Gestion de projet
Gestion de projetGestion de projet
Gestion de projet
Echecs et Stratégie
 
Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)
Ines Ben Kahla
 
Rapport de stage controle de gestion
Rapport de stage controle de gestionRapport de stage controle de gestion
Rapport de stage controle de gestion
abdeloahed hamdi
 
Tableau de bord prospectif
Tableau de bord prospectifTableau de bord prospectif
Tableau de bord prospectif
ABDELDJALIL DERRASCHOUK
 
La Business Intelligence
La Business Intelligence La Business Intelligence
La Business Intelligence
Khchaf Mouna
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
Mohamed Heny SELMI
 
Big data
Big dataBig data
Big data
Yosra ADDALI
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
Said Sadik
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
Mohamed Heny SELMI
 
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
proviseur
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
Mohamed Amine Sansar
 
Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...
Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...
Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...
Fadhel El Fahem
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
Lilia Sfaxi
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
Mehdi Aman
 
ANALYSE-FINANCIER
ANALYSE-FINANCIERANALYSE-FINANCIER
ANALYSE-FINANCIER
MbarkaAadi
 
diapo pour soutenance
diapo pour soutenance diapo pour soutenance
diapo pour soutenance
sara h
 
Rapport PFE | Eolane | Amélioration de la productivité de l'atelier CMS
Rapport PFE | Eolane | Amélioration de la productivité de l'atelier CMSRapport PFE | Eolane | Amélioration de la productivité de l'atelier CMS
Rapport PFE | Eolane | Amélioration de la productivité de l'atelier CMS
Zouhair Boufakri
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
Amal Abid
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
Lilia Sfaxi
 
Etude critique et amélioration de la gestion de la performance du service mai...
Etude critique et amélioration de la gestion de la performance du service mai...Etude critique et amélioration de la gestion de la performance du service mai...
Etude critique et amélioration de la gestion de la performance du service mai...
darckdaxter
 

Tendances (20)

Gestion de projet
Gestion de projetGestion de projet
Gestion de projet
 
Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)
 
Rapport de stage controle de gestion
Rapport de stage controle de gestionRapport de stage controle de gestion
Rapport de stage controle de gestion
 
Tableau de bord prospectif
Tableau de bord prospectifTableau de bord prospectif
Tableau de bord prospectif
 
La Business Intelligence
La Business Intelligence La Business Intelligence
La Business Intelligence
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
Big data
Big dataBig data
Big data
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
 
Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...
Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...
Rapport de stage Comptabilité + Sujet: Les compétences et les actions nécessa...
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
ANALYSE-FINANCIER
ANALYSE-FINANCIERANALYSE-FINANCIER
ANALYSE-FINANCIER
 
diapo pour soutenance
diapo pour soutenance diapo pour soutenance
diapo pour soutenance
 
Rapport PFE | Eolane | Amélioration de la productivité de l'atelier CMS
Rapport PFE | Eolane | Amélioration de la productivité de l'atelier CMSRapport PFE | Eolane | Amélioration de la productivité de l'atelier CMS
Rapport PFE | Eolane | Amélioration de la productivité de l'atelier CMS
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Etude critique et amélioration de la gestion de la performance du service mai...
Etude critique et amélioration de la gestion de la performance du service mai...Etude critique et amélioration de la gestion de la performance du service mai...
Etude critique et amélioration de la gestion de la performance du service mai...
 

Similaire à La détection de la fraude par la connaissance des données - Carte Blanche Partenaires

HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...
HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...
HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...
ASIP Santé
 
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper
Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper
Guillaume Valcin
 
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper 2
Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper 2Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper 2
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper 2
Guillaume Valcin
 
Protection des données personnelles - Sia Partners vous accompagne !
Protection des données personnelles - Sia Partners vous accompagne !Protection des données personnelles - Sia Partners vous accompagne !
Protection des données personnelles - Sia Partners vous accompagne !
Philippe Mignen
 
Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...
Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...
Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...
Stéphanie Roger
 
Le RGPD, véritable opportunité vers la gouvernance de l’information
Le RGPD, véritable opportunité vers la gouvernance de l’informationLe RGPD, véritable opportunité vers la gouvernance de l’information
Le RGPD, véritable opportunité vers la gouvernance de l’information
PECB
 
Support reglement donnees de sante
Support reglement donnees de santeSupport reglement donnees de sante
Support reglement donnees de sante
Kiwi Backup
 
Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017
Cyril Marsaud
 
20171221-5 jni-rgpd
20171221-5 jni-rgpd20171221-5 jni-rgpd
20171221-5 jni-rgpd
ASIP Santé
 
Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...
Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...
Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...
Canadian Patient Safety Institute
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
fatimabenjelloun1
 
Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...
Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...
Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...
Innov'Asso
 
Work'n Coffee : Protection des données personnelles by ND & Antaes
Work'n Coffee : Protection des données personnelles by ND & AntaesWork'n Coffee : Protection des données personnelles by ND & Antaes
Work'n Coffee : Protection des données personnelles by ND & Antaes
Net Design
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles
Soft Computing
 
Directive GPDR/RGPD du 28/11/2017
Directive GPDR/RGPD  du 28/11/2017Directive GPDR/RGPD  du 28/11/2017
Directive GPDR/RGPD du 28/11/2017
Zyxel France
 
Workshop CNIL - RGPD & données de santé 22 février
Workshop CNIL - RGPD & données de santé 22 févrierWorkshop CNIL - RGPD & données de santé 22 février
Workshop CNIL - RGPD & données de santé 22 février
Stéphanie Roger
 
Integrite des donnees_et_validation_de_procede
Integrite des donnees_et_validation_de_procedeIntegrite des donnees_et_validation_de_procede
Integrite des donnees_et_validation_de_procede
Minitab, LLC
 
Mailjet BigData - RGPD : les actions IT pour assurer la protection des données
Mailjet BigData - RGPD : les actions IT pour assurer la protection des donnéesMailjet BigData - RGPD : les actions IT pour assurer la protection des données
Mailjet BigData - RGPD : les actions IT pour assurer la protection des données
Mailjet
 
RGPD - 2 ans plus tard - Où en est votre mise en conformité ?
RGPD - 2 ans plus tard - Où en est votre mise en conformité ?RGPD - 2 ans plus tard - Où en est votre mise en conformité ?
RGPD - 2 ans plus tard - Où en est votre mise en conformité ?
Boris Clément
 

Similaire à La détection de la fraude par la connaissance des données - Carte Blanche Partenaires (20)

HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...
HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...
HIT 2017 - ASIP Santé - Atelier N°3 Règlement européen sur la protection des ...
 
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper
Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper
 
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper 2
Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper 2Guillaume VALCIN  - Livre Blanc RGPD - GDPR White Paper 2
Guillaume VALCIN - Livre Blanc RGPD - GDPR White Paper 2
 
Protection des données personnelles - Sia Partners vous accompagne !
Protection des données personnelles - Sia Partners vous accompagne !Protection des données personnelles - Sia Partners vous accompagne !
Protection des données personnelles - Sia Partners vous accompagne !
 
Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...
Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...
Workshop CNIL - "Privacy Impact Assessment" : comment réaliser une analyse de...
 
Le RGPD, véritable opportunité vers la gouvernance de l’information
Le RGPD, véritable opportunité vers la gouvernance de l’informationLe RGPD, véritable opportunité vers la gouvernance de l’information
Le RGPD, véritable opportunité vers la gouvernance de l’information
 
Support reglement donnees de sante
Support reglement donnees de santeSupport reglement donnees de sante
Support reglement donnees de sante
 
Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017
 
20171221-5 jni-rgpd
20171221-5 jni-rgpd20171221-5 jni-rgpd
20171221-5 jni-rgpd
 
Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...
Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...
Soins de santé plus sécuritaires maintenant! Les indicateurs maintenant et à ...
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
Présentation gary tokatelian
Présentation gary tokatelianPrésentation gary tokatelian
Présentation gary tokatelian
 
Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...
Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...
Evaluer et améliorer la qualité de vie à partir des données de santé | Webcam...
 
Work'n Coffee : Protection des données personnelles by ND & Antaes
Work'n Coffee : Protection des données personnelles by ND & AntaesWork'n Coffee : Protection des données personnelles by ND & Antaes
Work'n Coffee : Protection des données personnelles by ND & Antaes
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles
 
Directive GPDR/RGPD du 28/11/2017
Directive GPDR/RGPD  du 28/11/2017Directive GPDR/RGPD  du 28/11/2017
Directive GPDR/RGPD du 28/11/2017
 
Workshop CNIL - RGPD & données de santé 22 février
Workshop CNIL - RGPD & données de santé 22 févrierWorkshop CNIL - RGPD & données de santé 22 février
Workshop CNIL - RGPD & données de santé 22 février
 
Integrite des donnees_et_validation_de_procede
Integrite des donnees_et_validation_de_procedeIntegrite des donnees_et_validation_de_procede
Integrite des donnees_et_validation_de_procede
 
Mailjet BigData - RGPD : les actions IT pour assurer la protection des données
Mailjet BigData - RGPD : les actions IT pour assurer la protection des donnéesMailjet BigData - RGPD : les actions IT pour assurer la protection des données
Mailjet BigData - RGPD : les actions IT pour assurer la protection des données
 
RGPD - 2 ans plus tard - Où en est votre mise en conformité ?
RGPD - 2 ans plus tard - Où en est votre mise en conformité ?RGPD - 2 ans plus tard - Où en est votre mise en conformité ?
RGPD - 2 ans plus tard - Où en est votre mise en conformité ?
 

La détection de la fraude par la connaissance des données - Carte Blanche Partenaires

  • 1. La détection de la Fraude par la connaissance des données Carte Blanche Partenaires
  • 2. 2 SOMMAIRE Qui sommes-nous ? 3 La donnée au cœur 7 DataScience: Le Conseil 32 De l’analyse à la prédiction 14 La détection de la Fraude par la connaissance des données
  • 4. 4 CARTE BLANCHE PARTENAIRES Spécialisé dans la Santé, la Prévention, et la Protection sociale L’ACCOMPAGNEMENT SANTÉ Prévention, conseil & information → Apporter au bénéficiaire des informations et conseils pour l’aider à gérer sa santé au quotidien → Améliorer son parcours de santé par la mise en place de services innovants → Faciliter l’accès à des soins de qualité, à proximité, au juste prix → Accéder à des services spécifiques et des avantages qualitatifs et tarifaires exclusifs → Adapter l’orientation vers un professionnel ou établissement de santé selon les besoins
  • 5. 5 CARTE BLANCHE PARTENAIRES 3,5M de données personnelles de santé depuis 2015 Chiffres clés 160 000 professionnels de santé 7,2 M de bénéficiaires 39 complémentaires Santé 7600 opticiens 6600 chirurgiens-dentistes 3400 audioprothésistes renouvellement du réseau audio en cours
  • 6. 6 LE RESEAU OPTIQUE Chiffres clés 14 enseignes optique partenaires 27 verriers partenaires +58 000 références de verres / lentilles jusqu’à 40% de remise 100% de PEC dématérialisées 9 achats / 10 dans le réseau
  • 8. 8 LE TRAITEMENT DES DONNEES Que fait-on de ces données ?  Les consommations en interne et en externe (croisement avec les données des gestionnaires d’assurance )  Parcours de santé intra- réseaux et inter-réseaux (optique, dentaire, audio,…) SANTÉ Analyser les comportements  Système expert pour le traitement de la fraude complété avec des algorithmes  Services d’informations (Guidhospi) et de préventions ciblés RÉSEAU Optimiser la gestion  Aide à la tarification  Aide à la conception d’offres et de services spécifiques ASSURANCE Collaborer 1 2 3
  • 9. 9 LE TRAITEMENT DES DONNEES Volume et Variété plus 100 tables de données pour le modèle de base 500 variables prise en charge Convention Open data CataloguesCRM Web Permet d’avoir une vision transverse et riche des comportements
  • 10. 10 LE TRAITEMENT DES DONNEES Dans le respect du RGPD Règlement Général sur la Protection des Données Au niveau européen Un cadre commun en matière de protection des données personnelles Entrée en application le 25 mai 2018 Droits des personnes et consentements renforcés La finalité des traitements est primordiale pour utiliser les données.
  • 11. 11 Les données personnelles de santé sont confinées et sécurisées au sein d’un hébergeur agréé données de santé pour une période de 3 ans. Les données pseudonymisées puis les agrégats sont conservés dans une plateforme sécurisée sur une période de 6 ans pour les besoin de suivi statistiques. LE TRAITEMENT DES DONNEES Archivage et sécurité La sécurité et la conservation des données sont des enjeux majeurs. Responsable de traitement vis-à-vis de la CNIL Agrémentation HDS en cours auprès de l’ASIP
  • 12. 12 LE TRAITEMENT DES DONNEES Pour quoi faire ? → À la bonne personne → Au bon endroit → Au bon moment Uniquement pour apporter des avantages Rendre Service Collecter les données et les analyser pour créer de nouveaux services adaptés et personnalisés dans un parcours de santé accompagné SERVICES PERSONNALISÉS SANS ÊTRE INDIVIDUALISÉS
  • 13. 13 LE TRAITEMENT DES DONNEES Satisfaction et Fraude La satisfaction des assurés ne doit pas être diminuée par la fraude. Ni la qualité des soins ou des équipements
  • 14. 14 De l’analyse à la prédiction
  • 15. 15 FRAUDE A L’ASSURANCE La dernière action menée au niveau européen sous forme d’un livret intitulé « L’impact de la fraude » chiffre le montant des pertes liées à la fraude en Europe à 10 % du coût total des sinistres. « UFC que choisir » a estimé que 19,5% des opticiens du territoire français proposent spontanément une fraude à la complémentaire santé. les chiffres 10 % du coût total des sinistres. 19,5 % des opticiens
  • 16. 16 CONTRÔLES A POSTERIORI Les contrôles sont réalisés en sortie du système de gestion des prises en charge Etablir de nouvelles règles pour enrichir les contrôles a priori en entrée du système de gestion. SERVICE CONTRÔLES Deux méthodes complémentaires CONTRÔLES A PRIORI Les contrôles sont réalisés en entrée du système de gestion des prises en charge. 500 000 prises en charges refusées par an 4 300 contrôles par an
  • 17. 17 LES PROCESS DE DETECTION L’expertise se construit sur l’expérience. Importance de l’historique de l’activité Deux étapes DETECTION Le décisionnel Santé  Intuitivité et simplicité d’utilisation  Rapidité de restitution  Rapidité de traitement des informations INVESTIGATION Expertise et gestion  Expertise métiers  Outil interne de gestion de courriers  en interactions avec le décisionnel INVESTIGATION DETECTION
  • 18. 18 DETECTION - EXPERTISE Nos experts Conseil Utilisation du décisionnel santé pour enrichir les analyses et disposer d’une vision transverse Une connaissance enrichie EXPERTISE METIER En lien permanent avec les professionnels de santé pour le traitement de dossier nécessitant une expertise Une connaissance actualisée Des professionnels de santé (opticiens, chirurgien-dentiste, audioprothésiste) Une connaissance des pratiques du métier
  • 19. 19 RGPD & FRAUDE Le règlement européen appliqué à la Fraude RGPD et profilage Le RGPD exige un consentement spécial lorsqu’un profilage existe. Dans ce contexte, le profilage est axé sur les Prises en Charge, non les professionnels de santé. Autorisation CNIL La CNIL nous a autorisés à mettre en place notre traitement. L’ensemble des informations de consentement pour les professionnels et les assurés ont été mises à jour.
  • 20. 20 DATAVISUALISATION L’outil Décisionnel Permet une meilleure compréhension par la visualisation des données
  • 21. 21 UN COMPLEMENT NECESSAIRE Afin d’améliorer ce taux de détection, le recours à des techniques de DataScience est nécessaire. La logique DataScience 50 % TAUX DE DETECTION 10 règles REGLES DETERMINISTES
  • 22. 22 DATASCIENCE AU SERVICE DE LA DETECTION La mise en production Trois étapes La préparation des données Deux formes d’algorithmes Algorithme non supervisé Algorithme supervisé
  • 23. 23 LE PROJET DATASCIENCE Limiter le nombre de champs libres pour éviter les problèmes de chargement de données. Eviter les variables avec beaucoup de modalités (>500) Un traitement spécifique est réalisé pour que les données puissent entrer dans les algorithmes. Etape 1 : LA PREPARATION DES DONNEES Pour garder des champs libres, il est mieux de normaliser ces champs (espaces en trop,….) Pour préparer les données, il faut :
  • 24. 24 LE PROJET DATASCIENCE Etape 1 : LA PREPARATION DES DONNEES La règle à suivre Toute donnée doit faire l’objet de retraitements et de contrôles avant son utilisation dans les modèles statistiques. Détection des anomalies Tests de cohérence, Requêtes, Data visualisation Traitement Suppression des données, Gestion des valeurs extrêmes, Discrétisation des variables continues Analyse des données Data visualisation, Données statistiques
  • 25. 25 LE PROJET DATASCIENCE Etape 2 : LES ALGORITHMES R est à la fois un logiciel de statistique et un langage de programmation de référence chez les actuaires et plus largement dans les domaines de la banque et de l’assurance. Multiplier les approches pour avoir une vision plus large Algorithme non supervisé Modèle de clustering sans prise en compte de l’expérience Pour détecter les atypismes Algorithme supervisé Modèle prédictif avec prise en compte de l’expérience Pour scorer les PECs Programmer les algorithmes avec R
  • 26. 26 LE PROJET DATASCIENCE Recherche des similarités dans les demandes et non des phénomènes de fraude. Etape 2 : LES ALGORITHMES Permet une qualification de fraude par les experts métiers à partir des regroupements de PEC atypiques. Et par défaut, d’identifier des failles dans la qualité de données. Algorithme Non supervisé Un modèle de clustering qui complète les techniques de détection en capitalisant sur tout l’historique de données (contrôlées ou pas)
  • 27. 27 Algorithme supervisé LE PROJET DATASCIENCE L’OBJECTIF Déterminer un % de fraude potentielle sur chaque PEC, qui évolue avec l’autoapprentissage. OUI, MAIS… Etape 2 : LES ALGORITHMES Un modèle prédictif basé sur les fraudes avérées pour capitaliser sur l’historique des contrôles effectués Le machine learning
  • 28. 28 Algorithme supervisé LE PROJET DATASCIENCE L’apprentissage doit se faire sur de bonnes bases (données), sinon l’algorithme apprend mais mal. Pour éviter ce phénomène, on a choisi de faire des algorithmes qui apprennent progressivement. Etape 2 : LES ALGORITHMES En raison de la sensibilité à la qualité des données en entrée, un autoapprentissage progressif est plus adapté. 1 algorithme de référence qui autoapprend qui n’apprend pas Comparaison des 2
  • 29. 29 La quasi-totalité des langages de programmation sont des langages « in-memory » : tous les objets sont stockés dans la mémoire vive (RAM). LE PROJET DATASCIENCE Etape 3 : LA MISE EN PRODUCTION La phase d’industrialisation Prévoir des mises en production agiles Procéder à de nombreux tests comparatifs de modèles Préparer l’infrastructure
  • 30. 30 LE PROJET DATASCIENCE Un meilleure ciblage des Professionnels de Santé en sanctionnant les plus fraudeurs et en dissuadant les autres. Bilan 50% Taux de détection des contrôles non conformes par rapport à la totalité des contrôles effectués. TAUX DE DETECTION 70% Quel bilan ?
  • 31. 31 LE PROJET DATASCIENCE Bilan Les atypismes issus des contrôles poussés par les algorithmes permettent de mettre en place de nouvelles règles. L’explication des contrôles enrichit l’expertise. CAS DE FRAUDE DETECTEE Les algorithmes ont fait ressortir des prises en charges « trop normales ». Suite à l’investigation de l’expert, l’opticien renseignait toujours les mêmes corrections, tandis qu’il proposait des équipements de correction différente pour le même prix.
  • 33. 33 CONSEIL EN DATA SCIENCE Constat Du Big Data au Machine Learning Les tendances de recherche des mots clés « Big Data » et « Machine Learning » sur Google La fin du « Big Data » ? En tous cas, détrôné par le « Machine Learning » = algorithmes auto-apprenants
  • 34. 34 CONSEIL EN DATA SCIENCE Il y a 20 ans … La connaissance de la donnée → « Base de données clients » → « Datawarehouse »Le « HYPE » Les entreprises investissaient alors dans des POC puis des projets de DataWarehouse « Base de données clients » « Datawarehouse » « Big Data » « Data Lake » En miroir avec aujourd’hui = =
  • 35. 35 CONSEIL EN DATA SCIENCE Un usage largement limité des données Une centralisation des données effective MAIS amenant à du FACTUEL uniquement = Reporting et tableaux de bord Constat post tendance DataWarehouse L’usage intelligent et sophistiqué des données peu mis en œuvre Une forte expertise métiers est nécessaire pour une culture d’entreprise orientée « Données ». La clé ?
  • 36. 36 CONSEIL EN DATA SCIENCE Un constat L’automatisation des tâches d’analyse simplifie grandement la vie des utilisateurs. La DataScience n’est pas une fin Une tendance lourde Automatiser tout ce qui est automatisable L’automatisation des algorithmes diminue le besoin de ressources en DataScientists au sein des entreprises. Capacité de multiplication des analyses dans un temps contraint
  • 37. 37 CONSEIL EN DATA SCIENCE L’automatisation de la data est un déclencheur pour entrer de plain-pied dans l’ère de l’optimisation par la data. Vers le traitement intelligent des données Seul le traitement intelligent de ces données, le smart data, permettra à l’entreprise d’améliorer son efficacité. Les gisements d’efficacité et de croissance ne passeront pas exclusivement par le big data. Du Big Data au Smart Data … Une opportunité Le rôle du Business Analyst
  • 38. 38 CONSEIL EN DATA SCIENCE Les 5 V du big data (Volume, Variété, Vitesse, Véracité et Valeur) sont à recouper avec les 5 S Les ingrédients du Smart Data Stratégie Sélectionner Signifier Symboliser Définir les bénéfices à venir grâce à une réflexion sur les usages concrets attendus par les opérationnels Sourcer Identifier les sources de données en interne et en externe Sélectionner des données réellement utiles et rationaliser les systèmes d’informations Transformer les données brutes en indicateurs plus faciles à manipuler La datavisualisation
  • 39. 39 CONSEIL EN DATA SCIENCE Miser sur le Smart Data Le Smart Data accorde + d’importance à la précision de la valeur des données en rapport au but et à la problématique ciblés. ! La connaissance de la donnée n’est pas le stockage ! L’expertise de l’analyse métiers est essentielle. C’est le moteur de Carte Blanche Partenaires. Se centrer sur l’usage intelligent des données pour arriver à un but concret.+
  • 40. MERCI DE VOTRE ATTENTION Nous contacter Sarah GICQUEAU, Chargée d’Affaires sarah.gicqueau@carteblanchepartenaires.fr +33 (0)6 40 79 18 96 Hélène BURY, Responsable Communication helene.bury@carteblanchepartenaires.fr +33 (0)6 31 69 43 08 www.jean-francois-tripodi.com www.carteblanchepartenaires.fr

Notes de l'éditeur

  1. Notre enquête menée auprès de 1188 opticiens nous a permis de montrer qu’un arrangement de facture frauduleux avait été proposé dans 29,5% des cas chez les opticiens indépendants, 11,8 % des cas dans les grandes enseignes nationales, et 12,3 % des cas dans les petites enseignes. Par conséquent, compte tenu des parts de marché respectives des différentes catégories de magasins (en nombre de points de vente),
  2. Mettre en place des algorithmes non supervisés de détection de comportements atypiques : l’objectif est de déterminer des groupes de PEC au comportement très spécifique de façon automatique. Les groupes se feront au niveau des PEC et pas au niveau des opticiens. D’un point de vue opérationnel il est possible de démontrer qu’une PEC donnée est frauduleuse en vérifiant que le bon de commande auprès du verrier est identique à la PEC demandée par l’opticien à CBP, mais il est plus difficile prouver qu’un opticien est fraudeur de manière générale. Optimiser les règles déterministes existantes en place en apprenant des résultats des contrôles effectués préalablement : il s’agit ici d’ajuster les seuils de déclenchement des contrôles afin d’améliorer le taux de détection de fraude. Cet ajustement se fait sur la base d’algorithmes statistiques supervisés.
  3. Un graphique intéressant a été publié sur kdnuggets la semaine passée. Ce graphique montre les tendances de recherche des mots clés "Big Data" et "Machine Learning". On y voit que les recherches Big Data affichent un plateau alors que celles relatives au Machine Learning sont en croissance exponentielle. D’autres mots clé (Deep learning, IA ... ) ainsi que les tendances monde donnent des évolutions similaires. Serait-ce la fin du Big data ? Le Machine learning serait-il le nouvel hype des DSI ?
  4. Le hype de l’époque s’appelait Base de données clients et Datawarehouse. Les entreprises se sont alors massivement lancées dans des POC  puis des projets de construction de datawarehouse. Ca ne vous rappelle pas quelque chose ? Remplacez Base de données clients et Datawarehouse par Big Data et Data Lake ... Bien sûr les technologies sont différentes. Bien sûr les puissances de stockage et de traitement sont sans commune mesure. Néanmoins ces technologies s’inscrivent dans la même philosophie.  Celle de centraliser et stocker les données. Le Big Data n’est que la composante la plus récente, en passe de devenir une technologie mainstream. L’objectif des bases de données clients et des datawarehouses était, à l’époque, de mettre en place une vision client 360° pour améliorer la relation clients en utilisant les outils de (avec les mots de l’époque) segmentation clients, prédictif, machine learning. Ce qui est particulièrement intéressant, c’est que si les mots (et les technologies) employés pour le stockage et le traitement ont changé, ce n’est pas le cas de ceux relatifs à l’utilisation intelligente de ces données : segmentation clients, prédictif, machine learning ... Ceci n’est pas anodin car si les algorithmes ont progressé en sophistication et, un peu, en efficacité (rapportée au CPU disponible), leur philosophie et leur mise en œuvre sont restées essentiellement les mêmes. Si leur performance a bondi c’est principalement du côté de la croissance exponentielle de la puissance de calcul (merci Mr Moore) qu’il faut aller en chercher la raison. L’exemple peut être le plus frappant est évidemment le Deep learning qui n’est pas essentiellement différent des réseaux de neurones des années 90 si ce n’est le nombre de couches de traitement plus important qu’autorise le calcul intensif d’aujourd’hui.
  5. A quoi a-t-on assisté au cours des deux décennies qui ont suivi l’introduction des datawarehouses ? Si la centralisation des données a été effective, elle a donné lieu en revanche à un usage largement limité à du factuel, reporting et tableaux de bord. L’usage intelligent et sophistiqué des données, tel qu’il avait été imaginé initialement, c’est à dire celui qui aurait permis de comprendre en profondeur et d’anticiper les comportements clients, a finalement été peu mis en œuvre et limité aux entreprises les plus consommatrices de données et plus encore ... aux plus importantes. Si on en doute il suffit de mettre en regard les 240M€ du marché de data mining estimé en France et les 140 000 entreprises de 10 salariés et plus, ce qui fait moins de 2 000€ par an et par entreprise ! Les raisons sont connues et tiennent essentiellement à la complexité inhérente à la démarche analytique. Une forte expertise est nécessaire, les coûts associés sont élevés, et prohibitifs pour une entreprise qui n’a pas la culture nécessaire pour apprécier pleinement la valeur de l’investissement. Alors va-t-on assister à la poursuite de la course effrénée à la centralisation des données et leur stockage ? A une démarche qui fera encore fi d’un traitement intelligent des données? L’histoire analytique serait-elle un éternel recommencement ?