1. Neo4j, Inc. All rights reserved 2021
Neo4j, Inc. All rights reserved 2021
Introduction à Neo4j
La base de données de graphes la plus populaire du marché
1
2. Neo4j, Inc. All rights reserved 2021
7/10
20/25
7/10
Commerce
Finance
Edition logicielle
Options de
déploiement
Neo4j : l’entreprise #1 des graphes
L’investissement industriel le plus important dans les graphes
2
Inventeurs du graphe de
propriétés et du langage
Cypher à l’origine de GQL
(projet ISO)
Des milliers de clients à
travers le monde
Siège dans la Silicon Valley,
bureaux à Londres, Münich,
Paris & Malmö.
Les grandes industries
utilisent Neo4j
Auto-hébergement et
Auto-gestion
Clés-en-mains:
Auto-hébergement
Gestion par Neo4j
3. Neo4j, Inc. All rights reserved 2021
Les graphes, SGBD à la plus forte croissance
Neo4j est le principal acteur
La croissance la + rapide
Base de donnée la + populaire
auprès des développeurs
STRONGEST COMMUNITY
Développeurs
compétence
LinkedIn
41k+
Membres avec
220k+
Meetups
72k+
Membres de
3
4. Neo4j, Inc. All rights reserved 2021
Meilleurs scores en termes de :
● Performance
● Passage à l’échelle
● Charge/Volume
● Data management
● Ingestion de données
● Recherche/parcours
● Cas d’usage
● API/extensibilité
● Transactions
● Haute disponibilité/reprise après incident
● Options de déploiement
The Forrester WaveTM is copyrighted by Forrester Research, Inc. Forrester and Forrester Wave are trademarks of Forrester Research, Inc. The Forrester Wave is a graphical representation of Forrester's call on a market and is plotted using a detailed spreadsheet with exposed scores, weightings, and comments. Forrester does not endorse any vendor,
product, or service depicted in the Forrester Wave. Information is based on best available resources. Opinions reflect judgment at the time and are subject to change.
4
Neo4j : leader du marché des graphes
5. Neo4j, Inc. All rights reserved 2021
Graphe de propriétés - simple et puissant
Ville
Employé Société
Les noeuds
représentent des
objets (noms)
Les relations ont une
direction
Les relations qui connectent les
noeuds représentent des
actions (verbes)
Les relations peuvent porter des
propriétés (clé/valeur)
Les noeuds peuvent porter des
propriétés (clé/valeur)
nom: Amy Peters
date_naissance: 1984-03-01
ID_employe: 1
:TRAVAILLE_POUR
date_debut: 2008-01-20
:SITUEE_DANS
5
6. Neo4j, Inc. All rights reserved 2021
6
• Ventes record pendant le Cyber Monday
• 35 Mi de transactions quotidiennes
• De 3 à 22 sauts par transaction
• Requêtes en moins de 4 ms
• Remplacement d’IBM Websphere
commerce
Recommandations
en temps réel
Gestion d’ensembles de données volumineux
• 300 Mi de calculs de prix par jour
• 10 fois plus de transactions sur moitié moins
de matériel comparé à Oracle
• Remplacement d’une base de données
Oracle
Calcul de prix
en temps réel
• Grand service postal de 500 000 employés
• Neo4j achemine plus de 7 Mi de colis par
jour en période de pointe
• Pics de plus de 5 000 opérations de
routage par seconde
Routage de colis
en temps réel
7. Neo4j, Inc. All rights reserved 2021
7
• Majorité d’utilisateurs anonymes
multi-terminaux et sites avec cookies
changeants
• 4,4 To : + 14 Mi de noeuds, + 20 Mi relations
• Identification de + 160 Mi d’utilisateurs
uniques pour créer des profils persistants
• Près de 70% de fraudes non détectées
• + 1 Mi de noeuds et + 1 Mi de relations à
analyser
• Analyses de graphes avec requêtes et
algorithmes pour identifier 10 Mi € de fraudes
la 1ère année
Meredith Corporation
Identification des anonymes
Fraude financière
Détection & Recouvrement Top 10 Bank
• 3 années de visites, tests et diagnostics =
des dizaines de millions d’enregistrements
• Recherche de similitudes dans le parcours de
soins des patients
• Algorithmes de graphes pour identifier les
communautés et les meilleurs points
d’intervention
AstraZeneca
Parcours de soins
Amélioration radicale de l’analytique, IA et AM
8. Neo4j, Inc. All rights reserved 2021
Neo4j, Inc. All rights reserved 2021
La technologie des graphes Neo4j
8
9. Neo4j, Inc. All rights reserved 2021
Technologie de graphes pour les
applications et analyses
9
Outils
d’analyse
Transactions de graphes
Intégration de données
Dev.
& Admin
Pilotes & APIs Découverte & Visualisation
Analyses et data
science
Développeurs
Admins
Applications Utilisateurs métier
Analystes
Data
Scientists /
Statisticiens
10. Neo4j, Inc. All rights reserved 2021
10
Neo4j Bloom - Explorer les données sans code
11. Neo4j, Inc. All rights reserved 2021
Data Science dans le graphe - Plus de 70 algorithmes avec Neo4j
11
11
• Centralité (de degré)
• Centralité de proximité
• Centralité harmonique
• Centralité de vecteur propre
• Centralité intermédiaire & Approx.
• Liens concourants (PageRank)
• Liens concourants personnalisés
• ArticleRank
• Plus court chemin
• Tous les plus courts chemins (A*)
• Plus court chemin de Yen’s K
• Cheminement aléatoire
• Arbre couvrant de poids minimal
• Arbre couvrant
• Parcours en largeur
• Distance Euclidiène
• Similarité Cosinus
• Similarité de Jaccard
• Similarité de chevauchement
• Similarité de Pearson
• K plus proches voisins (approx.)
Recherche et
cheminement
Centralité et
Importance
Similarité
Prédiction de lien
• Adamic Adar
• Voisins en commun
• Attachement préférentiel
• Allocation de ressources
• Même communauté
• Voisins totaux
... Fonctions auxiliaires:
• Génération de graphes aléatoires
• Export de graphes
• Encodage à chaud
• Distributions & métriques
Vectorisation (Embedding)
• Node2Vec
• Projections aléatoires
• GraphSAGE
Détection de
communautés
• Décompte des triangles
• Coefficient d'agglomération
• Composants connectés
• Composants fortements connectés
• Propagation des labels
• Modularité de Louvain
• Coloration de graphe
• Optimisation de modularité
12. Neo4j, Inc. All rights reserved 2021
Neo4j, Inc. All rights reserved 2021
Hébergement de Neo4j
12
13. Neo4j, Inc. All rights reserved 2021
Modèles de déploiement flexibles
13
Base de données
clés-en-mains
Database-as-a-Service
SaaS
Auto-hébergement avec
gestion par Neo4j
Cloud Managed Services (CMS)
Auto-hébergement et
Auto-gestion
On-premise
Self-managed
SaaS entièrement géré
Tarif à la consommation
Service clé en main géré
par les experts Neo4j
Clouds privés/hybrides
Cloud natif
Déploiement en libre-service
Aucune gestion de l’infrastructure
sous-jacente
Modèle de déploiement et niveaux
de service entièrement
personnalisables
Hébergement dans vos
infrastructures physiques propres
ou dans un cloud privé
Contrôle total de votre
environnement
Hébergement dans le cloud de
votre choix en utilisant votre
compte utilisateur propre
15. Neo4j, Inc. All rights reserved 2021
15
Console
d’administration
16. Neo4j, Inc. All rights reserved 2021
16
Expérience unifiée dans le “Workspace” Aura
Bloom Cypher
17. Neo4j, Inc. All rights reserved 2021
Neo4j, Inc. All rights reserved 2021
Cas d’usage clients
17
18. Neo4j, Inc. All rights reserved 2021
Des cas d’usage variés et à grande valeur ajoutée qui
favorisent l’adoption en entreprise
Opérations de
réseaux
Détection
de fraude
Gestion des identités
et accès
Graphe de
connaissances
Gestion des données
de référence
Recommendations
en temps réel
18
19. Neo4j, Inc. All rights reserved 2021
Armée des USA
Gestion de la logistique des
équipements
Contexte
● Une société américaine de conseil IT a aidé l'armée américaine à
rationaliser les déploiements et la maintenance des équipements.
● Sauver des vies en améliorant la préparation opérationnelle des
équipements de l'armée.
Défi
● Moderniser les processus d'approvisionnement, de budgétisation et
de logistique pour les équipements et les pièces de rechange.
● Des millions de connexions entre les différentes nomenclatures.
● Améliorer les calculs de coûts « et si » lors de la planification des
missions et du déploiement des troupes.
● Les systèmes actuels nécessitaient plus de 60 heures de travail
manuel pour calculer les changements.
Resultats
● Réduction de 88 % des délais d'estimation des coûts,
● Amélioration des délais et de la précision de la livraison des pièces,
● Réduction de 77 % de la main d'œuvre pour effectuer les calculs,
● Coût total de possession des équipements plus prévisible.
19
20. Neo4j, Inc. All rights reserved 2021
Caterpillar
Fabrication d’équipements lourds
Contexte
● Fabricant d’équipement lourds classé dans Fortune 100.
● 27 millions de documents de garanties et de services.
Défi
● Améliorer la prévisibilité des besoins de maintenance.
● Besoin d’une base de connaissances pour 27 millions de
documents de garanties et demandes de maintenance.
● Prévoir quand l’équipement devra être entretenu et par qui. Les
graphes permettent à l’IA d’identifier les meilleures connexions
entre les pièces, les fournisseurs, les clients et les mécaniciens.
Resultats
● Création d’un graphe de connaissances avec le traitement du
langage naturel (NLP) qui regroupe les documents relatifs à des
décennies de garanties et de services.
● Ontologie commune pour les plaintes, les symptômes et les pièces.
● Anticipation du moment où l'équipement devra être réparé,
● Amélioration de la satisfaction du client et de l’image de marque,
● Maximisation de la durée de vie et la valeur des équipements.
20
21. Neo4j, Inc. All rights reserved 2021
Dun & Bradstreet
Neo4j pour le suivi de la
propriété effective
Contexte
● Réglementations et exigences en matière de propriété effective.
● Permettre aux clients B2B de conclure de nouvelles affaires
grâce à des enquêtes fiables et accélérées.
Défi
● Les enquêtes nécessitent un personnel hautement qualifié et
cette activité est difficile à mettre à l’échelle.
● Une seule demande peut immobiliser des personnes clés
pendant 10 à 15 jours, ce qui peut entraîner une perte de
revenus significative.
Resultats
● Neo4j est utilisé pour interroger rapidement les relations
historiques entre les propriétaires d’entreprise et les entreprises.
● Le temps de réponse aux requêtes ne prend plus que quelques
millisecondes contre des jours de recherche.
21
Dun & Bradstreet est une compagnie
américaine fondée en 1841 qui fournit des
données commerciales et financières, à la
fois analytiques et synthétiques, sur les
entreprises. Son siège social est situé à
Short Hills dans le New Jersey. Elle est le
numéro un mondial de l’information
économique BtoB (Wikipedia)
22. Neo4j, Inc. All rights reserved 2021
Adobe Behance
Réseau social de 10 millions
d’artistes
Contexte
● Réseau social de 10 millions d’artistes,
● Évaluation par les pairs de l'art et des travaux en cours,
● Site de recherche d'emploi pour les artistes,
● Des millions de mises à jour (lectures/écritures) du fil d'actualité,
● De 150 Mongo’s à 48 Cassandra's à 3 Neo4j's !
Défi
● Les artistes s'inscrivent, apprécient et conservent des
« galeries » de leurs œuvres et de celles d'autres artistes.
● Le fil d’actualité est le seul moyen de recevoir les mises à jour.
● 1ère implémentation comptait 150 instances MongoDB.
● 2ème implémentation ramenée à 48 instances Cassandra,
encore trop lente et demandante en infrastructure.
Resultats
● 3ème implémentation réduite à 3 instances Neo4j,
● Économie de plus de 500 000 $ en frais annuels AWS,
● Réduction de l'empreinte des données de 50 To à 40 Go.
● Introduction de nouvelles fonctionnalités facilitée (ex. nouveaux
projets dans votre réseau...)
22
23. Neo4j, Inc. All rights reserved 2021
COMCAST Xfinity xFi
Maison et objets connectés
Contexte
● Comcast est le plus grand fournisseur d’abonnements télévision et
internet aux États-Unis (3ème au niveau mondial).
● xFi c’est l’expérience consommateur dans les 3 millions de foyers
équipés d’internet, routeur, appareils, sécurité, voix et téléphonie.
Défi
● Intégrer toutes les expériences dans une maison connectée
● Créer des idées novatrices basées sur les préférences des
membres du foyers et les appareils utilisés.
● Ajouter de la valeur aux services xFinity triple-play et quad-play.
Resultats
● Utilisé par des millions de foyers,
● Contenu personnalisé pour chaque membre du foyer,
● Recommandations de contenu en fonction de l’utilisateur, du
moment de la journée, des autorisations et des préférences,
● Rappels de sécurité en temps réel (ex. enfant à la maison, porte du
garage laissée ouverte).
23
24. Neo4j, Inc. All rights reserved 2021
Meredith Inc.
Gestion des identités
Contexte
● Conglomérat de médias avec un revenu de 3,2 milliards de dollars
● Propriétaire de sites Web populaires tels que People,
Travel+Leisure et Better Homes & Gardens.
Défi
● Les utilisateurs sont souvent anonymes d’un site à l’autre et d’un
appareil à l’autre en raison des cookies changeant.
● Les données externes sont extrêmement coûteuses, difficiles à
valider et souffrent rapidement du problème de cookie.
● Une mauvaise compréhension du comportement des utilisateurs
réduit la pertinence des recommandations qui entraîne une
diminution du nombre de clics et, ultimement, des revenus.
Resultats
● Augmentation de 612% des visites par profil utilisateur identifié
● 4.4 To de données : +14 Mds de nœuds et +20 Mds de relations
● Utilisation des algorithmes de graphes pour identifier les clusters de
données représentant le comportement d’un utilisateur unique
● Transformation de 346 millions de cookies en 163 millions
d’utilisateurs uniques avec des profils plus riches et durables
24
25. Neo4j, Inc. All rights reserved 2021
AstraZeneca
Analyse du parcours des patients
Contexte
● Entreprise pharmaceutique mondiale avec un chiffre d’affaires de
22 milliards de dollars qui se focalise sur l’oncologie, le
cardiovasculaire, le rénal, le métabolisme et le respiratoire.
Défi
● Les maladies complexes se développent sur des années, avec de
nombreuses visites médicales, des tests et un diagnostic évolutif.
● Comment identifier les signes avant-coureurs, intervenir rapidement
et améliorer les résultats des tests?
● Les patients sont tous unique - comment trouver des similitudes?
Resultats
● Utilisation de la Graph Data Science Library de Neo4j pour
cartographier et prédire les parcours des patients.
● Projet d’intervention sur les maladies rénales : 3 ans de visites, de
tests et de diagnostics avec des milliards d’enregistrements.
● Graphe de connaissances, requêtes et algorithmes de graphes,
○ Détection des communautés pour trouver des similarités,
○ Recherche de points d’influence pour que les médecins
soient en mesure de guider et d’aider les patients.
25
26. Neo4j, Inc. All rights reserved 2021
Neo4j, Inc. All rights reserved 2021
26
Pour continuer avec Neo4j
https://neo4j.com/graphsummit/paris/
La Poste – Synergie entre graphes et les réseaux
de neurones pour comprendre les
comportements sur le SI
Servier - Graphe de connaissances pour les
phases primaires de recherche de nouveaux
médicaments
CHANEL - De l'innovation à la production, les
cas d’usages des graphes de connaissance
Neo4j - la voie du succès avec les bases de
données de graphes et la Graph Data Science
Atelier - Construire une solution basée sur les
graphes