Big Data et Détection
des Fraudes
Jean Rohmer
ESILV
Cherche l’Aiguille dans la Botte de Foin …
… ou fabriquer la Botte de Foin Frauduleux ?
• Types d’informations:
• Structurées
• Non Structurées
• Multicanal / Hétérogènes
• Types de traitements:
• Statistiques
• Analytiques
• Manuels
• S’apparente aux activités de
• Renseignement Militaire ou de Sûreté Nationale
• Détection des signaux faibles
statistiques analytiques humaines
structureesnonstructuréesmulticanal
GOOGLE !!!
BI, DATA
MINING
EXCEL !!!
TEXT & OPINION
MINING
FUSION
D’INFORMATIONS
COURRIEL !!!
Des fraudes un peu partout
Clustering
non supervisé
Qui se ressemble s’assemble:
Fraudes roses, fraudes vertes …
Clustering
supervisé
Exemples de
Fraudes roses
(fournis par des
experts)
Apprentissage
automatique de
« l’équation fraude
rose »
Résultat de
l’application de
l’équation « fraude
rose » à analyser
par des experts
STATISTIQUES
ANALYTIQUE
Comprendre finement (via des experts) le contexte
et les articulations des fraudes roses
L’exprimer sous forme de graphe sémantique
Rechercher toutes les parties du graphe qui
correspondent
: Outil SVIVOT Contextor
1
2
3Interpretation of Semantic Networks by:
•Ad Hoc Graphical representation
•Human Inference (training)
•Automatic Inference (rules)
•Graph Clustering (not illustrated here)
0
4
REFERENCES:
-- Une liste d’outils:
http://www.kdnuggets.com/solutions/fraud-detection.html
-- sur les signaux faibles :
http://www.res-systemica.org/afscet/resSystemica/Paris05/rohmer.pdf
-- IDELIANCE (Outil sémantique open source de l’ESILV)
-- Mon blog: http://plexus-logos-calx.blogspot.fr/

Jean Rohmer Big data & risque de fraude

  • 1.
    Big Data etDétection des Fraudes Jean Rohmer ESILV
  • 2.
    Cherche l’Aiguille dansla Botte de Foin … … ou fabriquer la Botte de Foin Frauduleux ? • Types d’informations: • Structurées • Non Structurées • Multicanal / Hétérogènes • Types de traitements: • Statistiques • Analytiques • Manuels • S’apparente aux activités de • Renseignement Militaire ou de Sûreté Nationale • Détection des signaux faibles
  • 3.
    statistiques analytiques humaines structureesnonstructuréesmulticanal GOOGLE!!! BI, DATA MINING EXCEL !!! TEXT & OPINION MINING FUSION D’INFORMATIONS COURRIEL !!!
  • 4.
    Des fraudes unpeu partout Clustering non supervisé Qui se ressemble s’assemble: Fraudes roses, fraudes vertes … Clustering supervisé Exemples de Fraudes roses (fournis par des experts) Apprentissage automatique de « l’équation fraude rose » Résultat de l’application de l’équation « fraude rose » à analyser par des experts STATISTIQUES
  • 5.
    ANALYTIQUE Comprendre finement (viades experts) le contexte et les articulations des fraudes roses L’exprimer sous forme de graphe sémantique Rechercher toutes les parties du graphe qui correspondent : Outil SVIVOT Contextor
  • 6.
    1 2 3Interpretation of SemanticNetworks by: •Ad Hoc Graphical representation •Human Inference (training) •Automatic Inference (rules) •Graph Clustering (not illustrated here) 0 4
  • 9.
    REFERENCES: -- Une listed’outils: http://www.kdnuggets.com/solutions/fraud-detection.html -- sur les signaux faibles : http://www.res-systemica.org/afscet/resSystemica/Paris05/rohmer.pdf -- IDELIANCE (Outil sémantique open source de l’ESILV) -- Mon blog: http://plexus-logos-calx.blogspot.fr/