Big Data, Data Science, cluster Hadoop, Machine Learning, etc. Aujourd'hui, impossible de passer à côté de ce phénomène vers lequel de plus en plus d'entreprises se tournent.
Au-delà des mots et de la tendance, comment réellement tirer parti de toutes vos données et en tirer un véritable avantage concurrentiel? La réponse se résume en quelques mots: Monter un Data Lab. Au cours de cette présentation, nous vous proposons de définir ce qu'est réellement un Data Lab, de comprendre les grandes étapes essentielles pour le monter de manière intelligence, d'identifier les profils nécessaires à son bon fonctionnement et de savoir comment optimiser son utilisation pour en tirer une vraie valeur ajoutée pour votre entreprise.
La vidéo de la conférence est à retrouver sur : http://www.xebicon.fr/programme.html
4. #XebiConFr
Prendre les bonnes décisions
➔ Contexte incertain.
➔ Intuition ne suffit pas.
➔ La donnée est une image du
monde réel
➔ On ne devine plus, on mesure
8. #XebiConFr
Le DataLab
➔ Les profils data
➔ Datalake et données à disposition
➔ Approche Lean Startup
➔ De la donnée à la connaissance
➔ Disruption intra-entreprise
14. #XebiConFr
➔ Un emplacement unique
pour toute la donnée
brute de l’entreprise
➔ Injection de données
extérieures
➔ Sans à priori
contraignants sur les
usages en aval
Créer son Datalake
17. #XebiConFr
Rendre la donnée accessible
Formatage “technique”
Format exploitable
Création des tables
Consolidation
Partitionnement
Doit être un maximum automatisé
Mise à disposition des
schémas
19. #XebiConFr
Les données sont ensuite
croisées et agrégées selon les
besoins ou des cas d’usages de
chacun
Exploiter le Datalake
...
Détection de fraude
Recommandation
Services connectés
Optimisation
opérationnelle
Connaissance utilisateur
20. #XebiConFr
Integration du Datalake dans un SI
Les systèmes opérationnels
alimentent le Datalake
RT
Json
Kafka
30 min
CSV
hdsf put
24h
TXT
Data-scientist et data-
engineer sélectionnent et
organisent la donnée
NoSql
API Web
Datamart
Reporting
et requêtes
Adhoc