Este documento presenta una discusión sobre el uso de grafos para detectar y prevenir fraude. Explica cómo los modelos de bases de datos relacionales tienen limitaciones para modelar asociaciones entre datos, mientras que los enfoques NoSQL no proporcionan estructuras para almacenar relaciones. Propone que los grafos de propiedades etiquetadas pueden superar estas limitaciones al modelar y almacenar asociaciones de manera nativa. Luego, describe cómo analizar redes de grafos puede ayudar a identificar patrones sospechosos que indican fraude
15. Qué ha pasado hasta ahora? Límites del
enfoque relacional
• Introduce complejidad al modelizar
relaciones
• Degradación del rendimiento al
aumentar el numero de asociaciones,
y con el volumen de datos
• Complejidad de las consultas crece
necesidad de JOINs
• Introducir nuevos tipos de datos y
asociaciones requieres rediseño del
esquema, migración, coste
… hacen a las RDB inadecuadas cuando
las asociaciones entre puntos de datos
son valiosas en tiempo real
Desarrollo lento
Rendimiento pobre
Problemas escalabilidad
Coste de mantenimiento
16. NoSQL al rescate, pero que pasa con las
asociaciones?
• No ofrecen estructuras de datos
para modelizar o almacenar
relaciones
• Los lenguajes de consultas no
incluyen elementos para consultarlas
• La logica de association de datos
vive en la capa de aplicación
• No transaccionales (ACID)
… hacen a estas tres categorías NoSQL
inadecuadas cuando las asociaciones
entre puntos de datos son valiosas en
tiempo real
19. Fraude: First-Party
• Objetivo de los defraudadores? Solicitar lineas de credito, actuar
de forma aparentemente normal, extender el credito… y
desaparecer!
• Creación de identidades sintéticas
• Caso poco mediatizado, ya que solo los bancos se ven afectados.
• En el caso de 3rd party se da una suplantación de personalidad y el
afectado es una tercera persona.
20. Tamaño del problema
• Decenas de miles de millones de $ son defraudados al año solo a
bancos estadounidenses
• 25% del total de créditos personales amortizados como perdidas
23. …la reacción no es sencilla
• Cuando el fraude es detectado, qué se debe cancelar?
• Cómo hacerlo mas rápido que los defraudadores para minimizar
pérdidas? Es posible prevenirlo?
• Modelizando los datos como grafos
27. Cadena sospechosa
MATCH p = (a1:AccountHolder)-
[r1:HAS_ADDRESS|:HAS_PHONENUMBER*8]-
(a2:AccountHolder)
WHERE a1 <> a2
return p
28. Bloqueo de tarjetas
MATCH p = (a1:AccountHolder)-
[r1:HAS_ADDRESS|:HAS_PHONENUMBER*8]-
(a2:AccountHolder)
WHERE a1 <> a2
WITH nodes(p) as fraudsterList limit 1
UNWIND fraudsterList AS fraudster
MATCH fraudster-[:HAS_CREDITCARD]->(cc)
return fraudster.fullName, fraudster.UniqueId,
cc.accountNumber
29. Neo Technology Overview
Product
• Neo4j - World’s leading graph database
• 1M+ downloads, adding 50k+
per month
• 14 years of R&D
Company
• Neo Technology, Inc., founded 2007
• 110 employees with HQ in Silicon Valley;
offices in London, Munich, Paris and
Malmö
• 160+ enterprise subscription customers
including 60+ G2k companies
• 20,000+ education registrants
• 18,000+ Meetup members
• 100+ technology and service partners
• $45M in funding from Fidelity, Sunstone,
Conor, Creandum, Dawn Capital
Customers & Partners
• Retail: Walmart, Target, Adidas, eBay
• Telco: Telenor, Tre, AT&T, Deutsche Telecom
• Financial Services: UBS, JP Morgan, RBC, ICE
• Partners: Accenture, McKinsey, BCG
May 14 2015