Be Data Driven :
Monter son DataLab
#XebiConFr
Julien BURET
CTO
@julienburet
Amine BENHENNI
Chief Data Scientist
@bendaizer
#XebiConFr
Puissance disruptive du numérique
#XebiConFr
Prendre les bonnes décisions
➔ Contexte incertain.
➔ Intuition ne suffit pas.
➔ La donnée est une image du
monde réel
➔ On ne devine plus, on mesure
#XebiConFr
Principes fondamentaux :
➔ Itérer vite
➔ Confronter vite
➔ Échouer vite
Lean Startup et innovation continue
#XebiConFr
Rapprocher les métiers
SI d’un côté
Analystes de l’autre
#XebiConFr
➔ Donnée fluide
➔ Pas de barrière
➔ Vision complète
➔ Vision robuste
Briser les silos de données
#XebiConFr
Le DataLab
➔ Les profils data
➔ Datalake et données à disposition
➔ Approche Lean Startup
➔ De la donnée à la connaissance
➔ Disruption intra-entreprise
#XebiConFr
Une équipe pour
expérimenter avec les
données
#XebiConFr
Les experts de la Data
Intègre les
solutions au SI
Stratégie de collecte
des données
Met en place le
Datalake
#XebiConFr
Les experts de la Data
Crée les pipelines
de traitements
Maîtrise les
technos Big Data
Algorithme
Scalable
#XebiConFr
Les experts de la Data
Valorise la donnée
Crée des modèles
Accompagne le métier
#XebiConFr
Un emplacement unique
pour la donnée
#XebiConFr
➔ Un emplacement unique
pour toute la donnée
brute de l’entreprise
➔ Injection de données
extérieures
➔ Sans à priori
contraignants sur les
usages en aval
Créer son Datalake
#XebiConFr
Quelle technologies ?
#XebiConFr
● Simplifier l’accès.
● Pouvoir analyser et croiser.
● Eviter le “data-swamp”.
Exploiter la donnée
#XebiConFr
Rendre la donnée accessible
Formatage “technique”
Format exploitable
Création des tables
Consolidation
Partitionnement
Doit être un maximum automatisé
Mise à disposition des
schémas
#XebiConFr
Raffiner la donnée
/service_client
/crm
/webanalytics
/twitter
/commande
/visites
/crm_enrichie
/sentiment
Pyspark
SQL
RaffinéeBrute
#XebiConFr
Les données sont ensuite
croisées et agrégées selon les
besoins ou des cas d’usages de
chacun
Exploiter le Datalake
...
Détection de fraude
Recommandation
Services connectés
Optimisation
opérationnelle
Connaissance utilisateur
#XebiConFr
Integration du Datalake dans un SI
Les systèmes opérationnels
alimentent le Datalake
RT
Json
Kafka
30 min
CSV
hdsf put
24h
TXT
Data-scientist et data-
engineer sélectionnent et
organisent la donnée
NoSql
API Web
Datamart
Reporting
et requêtes
Adhoc
#XebiConFr
Répondre concrètement
aux besoins métiers
#XebiConFr
#XebiConFr
#XebiConFr
“ Le métier veut une
licorne.
Ils ont vu que les
concurrents X en avait
une dans un article sur
les dernières modes
du Big Data“
#XebiConFr
#XebiConFr
#XebiConFr
“Une image de marque”
“Je souhaite connaître la perception
publique de ma marque à partir des
réseaux sociaux”
#XebiConFr
“Je souhaite connaître la perception
publique de ma marque à partir des
réseaux sociaux”
“Une image de marque”
Source de données
#XebiConFr
De la donnée à l’information
Relier à d’autres données
Extraire des informations précises
Classifier : catégories, émotions
#XebiConFr
Extraire les informations
#XebiConFr
De l’information à l’exploitation
Connaissance
Action ?
#XebiConFr
Combiner les informations
Sujet 1
Sujet 2 Sujet 3
Communautés
(segmentation bottom-up)
Influenceurs
Sujets et sentiments
#XebiConFr
Disruption transverse
#XebiConFr
Chaque métier a une pièce du puzzle
Marketing Transactions Commercial SAV
LogistiqueFinances DSI
#XebiConFr
#XebiConFr
Le bon expert sur le bon sujet
Sujet 1
Sujet 2 Sujet 3
Historique d’interventions
Contribution au
fond documentaire
#XebiConFr
Pour une action optimale
Sujet 1
Sujet 2 Sujet 3
Répondre
rapidement, avec
les bonnes
compétences
#XebiConFr
#XebiConFr
#XebiConFr
Trouver la pépite et industrialiser
Valider les bonnes
idées pour déployer
rapidement et
exploiter la donnée
sans délai.
#XebiConFr
Exploitation finale
● Feature teams
● Agir rapidement pour
saisir les opportunités
Devops
#XebiConFr
Exploitation finale
● Remonter les bonnes
informations aux bonnes
personnes
● Outils d’aide à la
décision
Expert Dataviz
#XebiConFr
#XebiConFr
Merci
?

XebiConFr 15 - Be Data Driven : Monter son Data Lab