SlideShare une entreprise Scribd logo
1  sur  44
Télécharger pour lire hors ligne
Introduction à Neo4j
La base de données de graphes
Cédric.Fauvet@neotechnology.com
Neo Technology
2
Société
• Neo Technology, Inc., fondée en 2007
• 100+ employés, QG dans la Silicon Valley;
Bureaux à Londres, Munich et Malmö
• 160+ clients dont 60+ parmi les Global 2000
Communauté
• 27,000+ développeurs ont validé une
formations Neo4j les 18 derniers mois.
• 25,000+ membres Meetup dans le monde dont
1100 à Paris.
Produit
• Neo4j – Leader mondial des bases de données
de graphes
• Graphe natif et les meilleures performances
• 1M+ de téléchargement, +50k par mois
Clients & Partenaires
• Commerce: Walmart, Target, Adidas, eBay
• Telco: Telenor, Tre, CenturyLink, StarHub
• Finances: UBS, ICE …
• 100+ partenaires technologiques et service,
incluant Accenture, Ekino, Zenika, Sopra-Steria
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans la base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans la base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Quelle valeur pour les relations ?
Le volume de données augmente…
• Nouveaux processus digitaux
• Augmentation des transactions
en ligne
• Nouveaux réseaux sociaux
• Plus de périphériques
Les relations ont une valeur à débloquer
• Recommandations temps-réél (TR)
• Détéction de Fraude TR
• Gestion des données de référence
• Gestion des réseaux
• Contrôle d’accès
• Moteur de recherche basé sur les graphes
… et elles sont de plus en plus
connectées
Clients, produits, processus,
matériel interagissent et
dépendent les uns des autres
Premiers utilisateurs
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans la base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Les bases de données relationnelles ne gèrent pas bien
les relations
• Impossible de modéliser les données ET les
relations sans complexité
• Les performance se dégradent avec les relations
nombreuses, profondes et la taille de la base
• La complexité des requêtes augmente avec la
nécessité des Jointures
• L’ajout de nouveaux types de données et relations
nécessite une redéfinition du modèle, augmentant
les délais de mise sur le marché
… et rendent les bases de données traditionnelles
inappropriées lorsque les relations sont exploitées en
temps-réel
Développement lent
Faibles performances
Passage à l’échelle limité
Difficile à maintenir
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans l base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Les bases de données NoSQL ne gèrent pas les relations
• Pas de structures de données pour modéliser
ou sauvegarder les relations
• Langage de requête inadapté pour supporter
les relations des données
• Relier les données nécessite une “Logique de
jointure” dans l’application
• Pas d’acidité dans les transactions
… et rendent les bases de données NoSQL inappropriées
lorsque les relations sont exploitées en temps-réel
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans la base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Neo4j – Re-Imagine vos données dans un graphe
Neo4j est une base de données de
graphes d’entreprise qui vous permet
de:
• Modéliser et stocker vos données
dans un graphe
• Requêter les données de relations
facilement en temps réel
• Faites évoluer facilement vos
applications par l’ajout de nouvelles
fonctionnalités, données et relations
Développement Agile
Haute performance
Echelonnement Vertical et
Horizontal
Neo4j: La base de données de graphes native
12
Stockage natif en Graphe
Garanti la persistance et la performance
Moteur de Graphes natif
Plusieurs Millions de ‘jointures’ par
seconde
Modélisation ‘sur tableau blanc’
Modélisation intuitive et naturelle
Cohérence des données
Transactions ACID
Langage de requêtes adapté aux ‘Jointures’
Nécessite 10 à 100 fois moins de code que SQL
Mise à l’échelle et haute disponibilité
Echelonnement vertical et horizontal adapté
aux graphes
ETL Intégré
Migration et import sans effort
Intégration
Pilotes et librairies pour les langages
populaires
Prix & reconnaissance du marché
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans la base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Modèle du tableau blanc
Modèle du tableau blanc
Modèle du tableau blanc = Modèle physique de graphes
Modèle du tableau blanc = Modèle physique de graphes
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans la base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Adoption de Neo4j par industrie
Finance Télécom Santé RH Média
Web
Social
Industrie
& Logistique
Jeux Commerce Information ServicesBusiness Services
Solution & Bénéfices
Contexte
Usage: Réseau social
Moteur de recommandation
Problème métier
- Expérience utilisateur personnalisée au maximum
- Solution scalable et simple à mettre en place
- Faible coût de maintenance et architecture fiable
- Leader Européen des sites de rencontre.
- 126,1 million euro/an
- 1 million de membres
- A l’origine réalisé par un traitement batch écrit en PHP
- Isoler et traiter les cas des super-dragueurs et super-
dragués.
- Recommandations précise afin de fidéliser les utilisateurs
et attirer de nouveaux membres.
• Manque des ventes à cause d’une
recommandation non personnalisée
• Processus de création des promotions trop
long (+1 jour) avec fort risque d’erreurs
• Remplacement de IBM WebSphere
Commerce
Solution & Bénéfices
• Expérience client basée sur les promotions, parcours client,
stock et autre informations du profil
• Neo4j permet d’établir les promotions en fonction de l’activité
spécifique de chaque utilisateur
• Calcul automatique du prix en fonction des promotions
• Amélioration du chiffre d’affaire eCommerce de +3 à +5% !
• En position 36 des Fortune 500
• 1,916 magasins aux US et Canada
• Compétition directe avec Kmart and Walmart
Contexte
Usage: eCommerce et Marketing
Moteur de recommandation
Problème métier
• Fabriquant de chaussures et d’articles de sports
Allemand, Multinationale.
• Fondée en 1949
• Emploie plus de de 53 000 personnes dans 160 pays
• Produit plus de 660 million de produits par an
• Chiffre d’affaire de 14.5 milliards en 2014
Usage: Marketing
Gestion de référentiel (MDM) et Recommandation
• Les applications internes communiquent peu et
difficilement du fait de la complexité du référentiel
existant
• Le contenu poussé aux visiteurs des plateformes
web est standard par manque d’accès au référentiel
de métadonnées
• Un seul référentiel centralisé, une seule version de la vérité
• Recommandation personnalisée pour les visiteurs des
différents sites internet de Adidas
Solution & Bénéfices
Problème métier
Contexte
Adidas
23
Adobe est le leader mondial des solutions multimédias
et de marketing numérique.
- Cluster de Neo4j Enterprise
- Composant d’une plus grande infrastructure
- Déploiement Multi-régions AWS
- Neo4j sélectionné sur une solution custom et Oracle
- Analyse des données hautement flexible
- Résultats temps réels malgré des données hautement
interconnectées
- Expérience de l’utilisateur – Avantage compétitif
- Durée du projet : 12 mois
• Volume de données important lié aux membres,
groupes d’utilisateurs, contenu des membres - le
tout massivement interconnecté
• Besoin d’en déduire les relations de collaboration
basé sur les contenu utilisateurs.
Problème métier
Contexte
Solution & Bénéfices
Usage: Marketing
Gestion de référentiel (MDM)
- Opérateur historique de logistique d’un grand pays EU.
- +5000 colis par seconde dans les pics.
- Routage temps-réel : 8 Millions par jour !
- Suivi des colis pour les clients B2C & B2B.
- Système critique en ligne 24x7.
- Capacité du système historique dépassée d’ici peu.
- Nombreux logiciels en interaction complexe.
- Performance attendue : Linéaire et scalable.
- Changements quotidiens des routes possibles.
Nouveau système de routage = Graphe = Neo4j.
- Plus simple : Cypher Vs SQL
- Plus Flexible : Reflet du monde réel.
- Plus rapide et hautement disponible :
Cluster Neo4j
- Une seule « source de vérité » pour tout le réseau.
Solution & Bénéfices
Usage: Logistique
Parcours de graphes, calcul de tournées
Problème métier
Contexte
25
- Opérateur téléphonique leader dans les pays nordiques
- Besoin d’un contrôle d’accès fiable pour 5 millions de
clients, souscriptions et accords.
- Neo4j solution entreprise.
- Embarqué et haute disponibilité.
- En remplacement de bases de données Oracles
- vieilles de 10 ans, Berkeley DB et un environnement
mainframe.
- Dépendances complexes entre les groupes, sociétés, individus,
comptes, produits, souscriptions, services et accords
- Graphs globaux et profonds (Client principaux avec 1000 fils,
souscriptions et accords)
- Architecture flexible et dynamique.
- Performance exceptionnelle.
- Bas coût comparé aux autres alternatives.
- Modèle de données extensible supportant l’ajout de nouvelles
applications et fonctionnalités.Problème métier
Contexte
Solution & Bénéfices
Usage: Télécom
Gestion de droits d’accès (ACL)
26
- Leader mondial de l’infrastructure réseau
- Vaste organisation commerciale
- 2 clusters Neo4J hautement disponibles
- Un cluster en production un second en sauvegarde dans des
Datacenter différents
- Au total : 6 bases de données Neo4J Enterprise embarquées
Solution & Bénéfices
- Vue temps réel sur les comptes et leurs propriétaires
- Capacité de modéliser des règles complexes pour la gestion de
la propriété des comptes
- Calcul des commissions automatique pour toute l’organisation
commerciale
- Environ 12 moins de développement
- Règles complexes régissant la propriété des comptes.
- Règles complexes de calcul des commissions
- Requêtes complexes dues à la structure des RDBMS
- Performances de la base de données Oracle insuffisante
pour une gestion temps réel des comptes
Problème métier
Contexte
Usage: Commerce et CRM
Gestion de données de référence client
Problème métier
- Augmenter la durée de moyenne de la visite
- SQL trop lent pour exécuter les millions de
jointures nécessaires à la détection de Fraude
- Réduire les phases de tests, par des simulations
dans le graphe
Contexte
- Plus grand gestionnaire de jeux sociaux d’argent en
ligne d’Angleterre et d’Europe
- Créateur du premier jeu d’argent sur Facebook
- Bingo, Machine à sous et Casino en ligne
- 5 millions de parieurs par an, 70 000€ par jour
Solution & Bénéfices
- Fidéliser les clients par l’ajout de couches sociales
- Réduire les fraude par l’analyse de relations de parrainage
en temps réel et analytique
- Temps de développements plus courts que prévu
- Pas d’interruption de service les 18 derniers mois
Usage: Réseau social
Détection de Fraude
- Deuxième opérateur Télécom Français.
- 12 Milliard de CA en 2012.
- 165 000 Clients entreprise.
- 250 Clients opérateurs.
- Une semaine entière pour planifier une maintenance.
- Analyste d’impact sur de multiples systèmes (>30).
- Changements quotidiens dans l’infrastructure.
- Identifier les clients impactés par une maintenance.
- Identifier les faiblesses du réseau (Deuxième projet).
- Calcul de budget déploiements (Troisième projet)
- Identification temps réel des clients liées à une panne.
- Gestion d’inventaire réseaux très flexible.
- Une seule source de vérité (Neo4j) représentant le réseau
entier.
- Système dynamique de chargement (ETL) des données issues
de +30 sources variées.
- Mise en application rapide des changements métiers.
Problème métier
Contexte
Solution & Bénéfices
Usage: Télécom
Analyse d’impact
Programme
• Quelle valeur pour les relations ?
• Les relations d’un point de vue SQL
• Le relations dans le monde NoSQL
• Les relations dans la base de données de graphes Neo4j
• Modélisation des données dans un graphe
• Cas d’usage
• Pourquoi choisir Neo4j ?
Pour conclure
Les trois grandes raisons de choisir Neo4j :
• Les performances exceptionnelles
• Des développements plus simples
• La découverte de nouveaux cas d’usage et
la valorisation des relations
Merci
cedric@neotechnology.com
Twitter: @CedricFauvet
Customers Customers_Accounts Accounts
Technologie Neo4, des requêtes haute performance
Customers Accounts
Technologie Neo4, des requêtes haute performance
Performance des requêtes connectées
Connectivité, volume et profondeur de parcours
Tempsde
réponse
Neo4j
SQL
Technologie Neo4j
Des requêtes haute performance
Les relations en jaune sont persistées dans Neo4j
balance: $100
balance: $632
balance: $212
name: Alice
Technologie Neo4, des requêtes haute performance
balance: $100
balance: $632
balance: $212
name: Alice
Nodes
Technologie Neo4, des requêtes haute performance
balance: $100
balance: $632
balance: $212
name: Alice
Relationships
Technologie Neo4, des requêtes haute performance
balance: $100
balance: $632
balance: $212
name: Alice
Labels
Technologie Neo4, des requêtes haute performance
(A) --> (B)
A B
Technologie Neo4j
Des projets plus simples avec Cypher
A -[:AIME]-> B
AIME
A B
Technologie Neo4j
Des projets plus simples avec Cypher
A --> B --> C
A B C
Technologie Neo4j
Des projets plus simples avec Cypher
A -[*]-> B
A B
A B
A B
Technologie Neo4j
Des projets plus simples avec Cypher
MATCH (VARjohn {name: 'John'})-[:friend]->()-[:friend]-
>(VARfof)
RETURN VARjohn, VARfof
Technologie Neo4j
Des projets plus simples avec Cypher

Contenu connexe

Tendances

Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Intro to Neo4j and Graph Databases
Intro to Neo4j and Graph DatabasesIntro to Neo4j and Graph Databases
Intro to Neo4j and Graph DatabasesNeo4j
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsMICHRAFY MUSTAFA
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkAmal Abid
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & SparkAlexia Audevart
 
Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -IliasAEA
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingLilia Sfaxi
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian Lilia Sfaxi
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2Amal Abid
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?Jean-Marc Dupont
 
Reporting avec JasperServer & iReport
Reporting avec JasperServer & iReportReporting avec JasperServer & iReport
Reporting avec JasperServer & iReportLilia Sfaxi
 

Tendances (20)

Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Intro to Neo4j and Graph Databases
Intro to Neo4j and Graph DatabasesIntro to Neo4j and Graph Databases
Intro to Neo4j and Graph Databases
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & Actions
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 
Chapitre 2 hadoop
Chapitre 2 hadoopChapitre 2 hadoop
Chapitre 2 hadoop
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data Processing
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
 
noSQL
noSQLnoSQL
noSQL
 
Reporting avec JasperServer & iReport
Reporting avec JasperServer & iReportReporting avec JasperServer & iReport
Reporting avec JasperServer & iReport
 
Chapitre 3 spark
Chapitre 3 sparkChapitre 3 spark
Chapitre 3 spark
 

Similaire à Introduction à Neo4j - La base de données de graphes - 2016

GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jNeo4j
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jNeo4j
 
Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Cédric Fauvet
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data TalendJean-Michel Franco
 
Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02
Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02
Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02Thierry Pastorello
 
ORACLE - La vue 360 de vos clients dans le cloud - Data forum MICROPOLE 2016
ORACLE - La vue 360  de vos clients dans le cloud -  Data forum MICROPOLE 2016 ORACLE - La vue 360  de vos clients dans le cloud -  Data forum MICROPOLE 2016
ORACLE - La vue 360 de vos clients dans le cloud - Data forum MICROPOLE 2016 Micropole Group
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Jean-Michel Franco
 
DATA FORUM MICROPOLE 2015 - Atelier Talend
 DATA FORUM MICROPOLE 2015 - Atelier Talend DATA FORUM MICROPOLE 2015 - Atelier Talend
DATA FORUM MICROPOLE 2015 - Atelier TalendMicropole Group
 
Optimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data VirtualizationOptimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data VirtualizationDenodo
 
Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...
Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...
Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...Jean-Michel Franco
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Denodo
 
Point de vue expert: la stratégie “ comptoir des données”
Point de vue expert: la stratégie “ comptoir des données”Point de vue expert: la stratégie “ comptoir des données”
Point de vue expert: la stratégie “ comptoir des données”Denodo
 
Élaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeÉlaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeFresche Solutions
 
Logiciels d'entreprise dans le Cloud, Google Apps et Zoho CRM
Logiciels d'entreprise dans le Cloud, Google Apps et Zoho CRMLogiciels d'entreprise dans le Cloud, Google Apps et Zoho CRM
Logiciels d'entreprise dans le Cloud, Google Apps et Zoho CRMDigital Link Sàrl
 
Digital GraphTour Paris - 26 March, 2020
Digital GraphTour Paris -  26 March, 2020Digital GraphTour Paris -  26 March, 2020
Digital GraphTour Paris - 26 March, 2020Neo4j
 

Similaire à Introduction à Neo4j - La base de données de graphes - 2016 (20)

GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4j
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4j
 
Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Cappuccino CRM
Cappuccino CRMCappuccino CRM
Cappuccino CRM
 
Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02
Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02
Lesclsdevotrestratgieebusinesslinternational 131209074509-phpapp02
 
ORACLE - La vue 360 de vos clients dans le cloud - Data forum MICROPOLE 2016
ORACLE - La vue 360  de vos clients dans le cloud -  Data forum MICROPOLE 2016 ORACLE - La vue 360  de vos clients dans le cloud -  Data forum MICROPOLE 2016
ORACLE - La vue 360 de vos clients dans le cloud - Data forum MICROPOLE 2016
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6
 
DATA FORUM MICROPOLE 2015 - Atelier Talend
 DATA FORUM MICROPOLE 2015 - Atelier Talend DATA FORUM MICROPOLE 2015 - Atelier Talend
DATA FORUM MICROPOLE 2015 - Atelier Talend
 
Optimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data VirtualizationOptimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data Virtualization
 
Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...
Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...
Pricing dynamique, « réassort », gestion des stocks, personnalisation : quand...
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022
 
Point de vue expert: la stratégie “ comptoir des données”
Point de vue expert: la stratégie “ comptoir des données”Point de vue expert: la stratégie “ comptoir des données”
Point de vue expert: la stratégie “ comptoir des données”
 
Élaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeÉlaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris Koppe
 
Business intelligence QLIKVIEW
Business intelligence QLIKVIEWBusiness intelligence QLIKVIEW
Business intelligence QLIKVIEW
 
Logiciels d'entreprise dans le Cloud, Google Apps et Zoho CRM
Logiciels d'entreprise dans le Cloud, Google Apps et Zoho CRMLogiciels d'entreprise dans le Cloud, Google Apps et Zoho CRM
Logiciels d'entreprise dans le Cloud, Google Apps et Zoho CRM
 
Digital GraphTour Paris - 26 March, 2020
Digital GraphTour Paris -  26 March, 2020Digital GraphTour Paris -  26 March, 2020
Digital GraphTour Paris - 26 March, 2020
 

Introduction à Neo4j - La base de données de graphes - 2016

  • 1. Introduction à Neo4j La base de données de graphes Cédric.Fauvet@neotechnology.com
  • 2. Neo Technology 2 Société • Neo Technology, Inc., fondée en 2007 • 100+ employés, QG dans la Silicon Valley; Bureaux à Londres, Munich et Malmö • 160+ clients dont 60+ parmi les Global 2000 Communauté • 27,000+ développeurs ont validé une formations Neo4j les 18 derniers mois. • 25,000+ membres Meetup dans le monde dont 1100 à Paris. Produit • Neo4j – Leader mondial des bases de données de graphes • Graphe natif et les meilleures performances • 1M+ de téléchargement, +50k par mois Clients & Partenaires • Commerce: Walmart, Target, Adidas, eBay • Telco: Telenor, Tre, CenturyLink, StarHub • Finances: UBS, ICE … • 100+ partenaires technologiques et service, incluant Accenture, Ekino, Zenika, Sopra-Steria
  • 3. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans la base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 4. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans la base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 5. Quelle valeur pour les relations ? Le volume de données augmente… • Nouveaux processus digitaux • Augmentation des transactions en ligne • Nouveaux réseaux sociaux • Plus de périphériques Les relations ont une valeur à débloquer • Recommandations temps-réél (TR) • Détéction de Fraude TR • Gestion des données de référence • Gestion des réseaux • Contrôle d’accès • Moteur de recherche basé sur les graphes … et elles sont de plus en plus connectées Clients, produits, processus, matériel interagissent et dépendent les uns des autres Premiers utilisateurs
  • 6. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans la base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 7. Les bases de données relationnelles ne gèrent pas bien les relations • Impossible de modéliser les données ET les relations sans complexité • Les performance se dégradent avec les relations nombreuses, profondes et la taille de la base • La complexité des requêtes augmente avec la nécessité des Jointures • L’ajout de nouveaux types de données et relations nécessite une redéfinition du modèle, augmentant les délais de mise sur le marché … et rendent les bases de données traditionnelles inappropriées lorsque les relations sont exploitées en temps-réel Développement lent Faibles performances Passage à l’échelle limité Difficile à maintenir
  • 8. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans l base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 9. Les bases de données NoSQL ne gèrent pas les relations • Pas de structures de données pour modéliser ou sauvegarder les relations • Langage de requête inadapté pour supporter les relations des données • Relier les données nécessite une “Logique de jointure” dans l’application • Pas d’acidité dans les transactions … et rendent les bases de données NoSQL inappropriées lorsque les relations sont exploitées en temps-réel
  • 10. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans la base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 11. Neo4j – Re-Imagine vos données dans un graphe Neo4j est une base de données de graphes d’entreprise qui vous permet de: • Modéliser et stocker vos données dans un graphe • Requêter les données de relations facilement en temps réel • Faites évoluer facilement vos applications par l’ajout de nouvelles fonctionnalités, données et relations Développement Agile Haute performance Echelonnement Vertical et Horizontal
  • 12. Neo4j: La base de données de graphes native 12 Stockage natif en Graphe Garanti la persistance et la performance Moteur de Graphes natif Plusieurs Millions de ‘jointures’ par seconde Modélisation ‘sur tableau blanc’ Modélisation intuitive et naturelle Cohérence des données Transactions ACID Langage de requêtes adapté aux ‘Jointures’ Nécessite 10 à 100 fois moins de code que SQL Mise à l’échelle et haute disponibilité Echelonnement vertical et horizontal adapté aux graphes ETL Intégré Migration et import sans effort Intégration Pilotes et librairies pour les langages populaires Prix & reconnaissance du marché
  • 13. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans la base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 16. Modèle du tableau blanc = Modèle physique de graphes
  • 17. Modèle du tableau blanc = Modèle physique de graphes
  • 18. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans la base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 19. Adoption de Neo4j par industrie Finance Télécom Santé RH Média Web Social Industrie & Logistique Jeux Commerce Information ServicesBusiness Services
  • 20. Solution & Bénéfices Contexte Usage: Réseau social Moteur de recommandation Problème métier - Expérience utilisateur personnalisée au maximum - Solution scalable et simple à mettre en place - Faible coût de maintenance et architecture fiable - Leader Européen des sites de rencontre. - 126,1 million euro/an - 1 million de membres - A l’origine réalisé par un traitement batch écrit en PHP - Isoler et traiter les cas des super-dragueurs et super- dragués. - Recommandations précise afin de fidéliser les utilisateurs et attirer de nouveaux membres.
  • 21. • Manque des ventes à cause d’une recommandation non personnalisée • Processus de création des promotions trop long (+1 jour) avec fort risque d’erreurs • Remplacement de IBM WebSphere Commerce Solution & Bénéfices • Expérience client basée sur les promotions, parcours client, stock et autre informations du profil • Neo4j permet d’établir les promotions en fonction de l’activité spécifique de chaque utilisateur • Calcul automatique du prix en fonction des promotions • Amélioration du chiffre d’affaire eCommerce de +3 à +5% ! • En position 36 des Fortune 500 • 1,916 magasins aux US et Canada • Compétition directe avec Kmart and Walmart Contexte Usage: eCommerce et Marketing Moteur de recommandation Problème métier
  • 22. • Fabriquant de chaussures et d’articles de sports Allemand, Multinationale. • Fondée en 1949 • Emploie plus de de 53 000 personnes dans 160 pays • Produit plus de 660 million de produits par an • Chiffre d’affaire de 14.5 milliards en 2014 Usage: Marketing Gestion de référentiel (MDM) et Recommandation • Les applications internes communiquent peu et difficilement du fait de la complexité du référentiel existant • Le contenu poussé aux visiteurs des plateformes web est standard par manque d’accès au référentiel de métadonnées • Un seul référentiel centralisé, une seule version de la vérité • Recommandation personnalisée pour les visiteurs des différents sites internet de Adidas Solution & Bénéfices Problème métier Contexte Adidas
  • 23. 23 Adobe est le leader mondial des solutions multimédias et de marketing numérique. - Cluster de Neo4j Enterprise - Composant d’une plus grande infrastructure - Déploiement Multi-régions AWS - Neo4j sélectionné sur une solution custom et Oracle - Analyse des données hautement flexible - Résultats temps réels malgré des données hautement interconnectées - Expérience de l’utilisateur – Avantage compétitif - Durée du projet : 12 mois • Volume de données important lié aux membres, groupes d’utilisateurs, contenu des membres - le tout massivement interconnecté • Besoin d’en déduire les relations de collaboration basé sur les contenu utilisateurs. Problème métier Contexte Solution & Bénéfices Usage: Marketing Gestion de référentiel (MDM)
  • 24. - Opérateur historique de logistique d’un grand pays EU. - +5000 colis par seconde dans les pics. - Routage temps-réel : 8 Millions par jour ! - Suivi des colis pour les clients B2C & B2B. - Système critique en ligne 24x7. - Capacité du système historique dépassée d’ici peu. - Nombreux logiciels en interaction complexe. - Performance attendue : Linéaire et scalable. - Changements quotidiens des routes possibles. Nouveau système de routage = Graphe = Neo4j. - Plus simple : Cypher Vs SQL - Plus Flexible : Reflet du monde réel. - Plus rapide et hautement disponible : Cluster Neo4j - Une seule « source de vérité » pour tout le réseau. Solution & Bénéfices Usage: Logistique Parcours de graphes, calcul de tournées Problème métier Contexte
  • 25. 25 - Opérateur téléphonique leader dans les pays nordiques - Besoin d’un contrôle d’accès fiable pour 5 millions de clients, souscriptions et accords. - Neo4j solution entreprise. - Embarqué et haute disponibilité. - En remplacement de bases de données Oracles - vieilles de 10 ans, Berkeley DB et un environnement mainframe. - Dépendances complexes entre les groupes, sociétés, individus, comptes, produits, souscriptions, services et accords - Graphs globaux et profonds (Client principaux avec 1000 fils, souscriptions et accords) - Architecture flexible et dynamique. - Performance exceptionnelle. - Bas coût comparé aux autres alternatives. - Modèle de données extensible supportant l’ajout de nouvelles applications et fonctionnalités.Problème métier Contexte Solution & Bénéfices Usage: Télécom Gestion de droits d’accès (ACL)
  • 26. 26 - Leader mondial de l’infrastructure réseau - Vaste organisation commerciale - 2 clusters Neo4J hautement disponibles - Un cluster en production un second en sauvegarde dans des Datacenter différents - Au total : 6 bases de données Neo4J Enterprise embarquées Solution & Bénéfices - Vue temps réel sur les comptes et leurs propriétaires - Capacité de modéliser des règles complexes pour la gestion de la propriété des comptes - Calcul des commissions automatique pour toute l’organisation commerciale - Environ 12 moins de développement - Règles complexes régissant la propriété des comptes. - Règles complexes de calcul des commissions - Requêtes complexes dues à la structure des RDBMS - Performances de la base de données Oracle insuffisante pour une gestion temps réel des comptes Problème métier Contexte Usage: Commerce et CRM Gestion de données de référence client
  • 27. Problème métier - Augmenter la durée de moyenne de la visite - SQL trop lent pour exécuter les millions de jointures nécessaires à la détection de Fraude - Réduire les phases de tests, par des simulations dans le graphe Contexte - Plus grand gestionnaire de jeux sociaux d’argent en ligne d’Angleterre et d’Europe - Créateur du premier jeu d’argent sur Facebook - Bingo, Machine à sous et Casino en ligne - 5 millions de parieurs par an, 70 000€ par jour Solution & Bénéfices - Fidéliser les clients par l’ajout de couches sociales - Réduire les fraude par l’analyse de relations de parrainage en temps réel et analytique - Temps de développements plus courts que prévu - Pas d’interruption de service les 18 derniers mois Usage: Réseau social Détection de Fraude
  • 28. - Deuxième opérateur Télécom Français. - 12 Milliard de CA en 2012. - 165 000 Clients entreprise. - 250 Clients opérateurs. - Une semaine entière pour planifier une maintenance. - Analyste d’impact sur de multiples systèmes (>30). - Changements quotidiens dans l’infrastructure. - Identifier les clients impactés par une maintenance. - Identifier les faiblesses du réseau (Deuxième projet). - Calcul de budget déploiements (Troisième projet) - Identification temps réel des clients liées à une panne. - Gestion d’inventaire réseaux très flexible. - Une seule source de vérité (Neo4j) représentant le réseau entier. - Système dynamique de chargement (ETL) des données issues de +30 sources variées. - Mise en application rapide des changements métiers. Problème métier Contexte Solution & Bénéfices Usage: Télécom Analyse d’impact
  • 29. Programme • Quelle valeur pour les relations ? • Les relations d’un point de vue SQL • Le relations dans le monde NoSQL • Les relations dans la base de données de graphes Neo4j • Modélisation des données dans un graphe • Cas d’usage • Pourquoi choisir Neo4j ?
  • 30. Pour conclure Les trois grandes raisons de choisir Neo4j : • Les performances exceptionnelles • Des développements plus simples • La découverte de nouveaux cas d’usage et la valorisation des relations
  • 32. Customers Customers_Accounts Accounts Technologie Neo4, des requêtes haute performance
  • 33. Customers Accounts Technologie Neo4, des requêtes haute performance
  • 34. Performance des requêtes connectées Connectivité, volume et profondeur de parcours Tempsde réponse Neo4j SQL Technologie Neo4j Des requêtes haute performance
  • 35. Les relations en jaune sont persistées dans Neo4j
  • 36. balance: $100 balance: $632 balance: $212 name: Alice Technologie Neo4, des requêtes haute performance
  • 37. balance: $100 balance: $632 balance: $212 name: Alice Nodes Technologie Neo4, des requêtes haute performance
  • 38. balance: $100 balance: $632 balance: $212 name: Alice Relationships Technologie Neo4, des requêtes haute performance
  • 39. balance: $100 balance: $632 balance: $212 name: Alice Labels Technologie Neo4, des requêtes haute performance
  • 40. (A) --> (B) A B Technologie Neo4j Des projets plus simples avec Cypher
  • 41. A -[:AIME]-> B AIME A B Technologie Neo4j Des projets plus simples avec Cypher
  • 42. A --> B --> C A B C Technologie Neo4j Des projets plus simples avec Cypher
  • 43. A -[*]-> B A B A B A B Technologie Neo4j Des projets plus simples avec Cypher
  • 44. MATCH (VARjohn {name: 'John'})-[:friend]->()-[:friend]- >(VARfof) RETURN VARjohn, VARfof Technologie Neo4j Des projets plus simples avec Cypher

Notes de l'éditeur

  1. In the near future, many of your apps will be driven by data relationships and not transactions You can unlock value from business relationships with Neo4j
  2. Backed by Fidelity, largest asset manager on the planet $50M funding $15M ARR Financial practical success – Add: Tripled revenues every year since 2011
  3. Presenter Notes - Higher Level Value Proposition Everyday, new data is being created at a volume never seen before. And we see that this data is getting even more connected. People communicating as customers, employees, friends, influencers. Customers purchasing products, services or content, expressing their likes and dislikes. Digitization of processes and more data elements for each step. And with Internet of Things (IoT), we have the same thing repeating but with machines talking to each other.  There is tremendous value in the knowledge of this relationship information for real-time applications. Examples are  Connect a user’s profile and purchases to other users and increase revenue through recommendations for new products and services Reimagine your master data - HR, Customer or Product as a connected model and identify ways to reach customers, improve their experience, identify the best people to staff on projects and more View your individual data elements as part of a process to determine fraud detection or process bottlenecks Companies like Google, LinkedIn and PayPal have done exactly that. Reimagine their data as a network (or a graph) and use the relationship information
  4. Presenter Notes - Challenges with current technologies? Database options are not suited to model or store data as a network of relationships Performance degrades with number and levels of relationships making it harder to use for real-time applications Not flexible to add or change relationships in realtime
  5. Relating data requires building JOIN logic in the application and more data movement over the network
  6. Presenter Notes - Neo4j - Enterprise Grade Database to re-imagine your data as a Graph Model and store your data as a Graph Traverse any number of or levels of relationships in real-time Evolve the model on the fly
  7. Want to find a relationship between two nodes Describing it as if it’s ASCII art