SlideShare une entreprise Scribd logo
1  sur  24
Télécharger pour lire hors ligne
Superbe maison d’architecte avec vue sur le lac
Des chantiers concrets pour démarrer
À propos...
Thomas VIAL
11 ans chez
Tribu Big Data & Analytics
depuis sa création en 2013
Consultant data geek
Architecture & data science
Auteur principal du livre blanc
Hadoop, feuille de route
Formateur Hadoop pour
Speaker au Hadoop Summit
2015 à Dublin, avec EDF
Au commencement était une ambition
"Le data lake Hadoop doit rationaliser la BI du Groupe et
porter les use cases analytiques, grâce à une démarche
agile centrée sur la gouvernance des données"
Et finalement… an architect’s dream come true
3 fichiers intégrés
1 score calculé, restitué dans une application BI
2 utilisateurs
3 noeuds Hadoop pour un cluster sur-dimensionné
0,2 ETP pour administrer la bête
1 application métier en semi-production=
Data lake
=
Concentrateur de données
+
Plateforme
pour favoriser l’émergence de projets s’appuyant
sur des données désilotées
Caractérisation
L’enjeu d’adoption
Construire une offre de services
Ingérer pour pouvoir publier
Gouverner
Offrir des services
Formaliser une offre de services
Valider l’intérêt du data lake J
Impliquer les “clients” : sponsors, utilisateurs, applications du SI,
public…
Décliner les services à tous les niveaux :
Mise à disposition et publication de données
Plateforme de construction d’applications orientées données
Soutien affiché aux projets utilisateurs du data lake
Organisation des données
Anticiper plusieurs fournisseurs et plusieurs projets
Anticiper les futures (?) exigences de sécurité
Privilégier la lisibilité et la simplicité (règle des 80/20) en proposant des
standards
Objectif : un script d’administration qui crée un espace projet en 5 min
Architecture de la plateforme
Analyser les besoins architecturaux à court terme
Prioriser les clients en fonction de l’enjeu, pas de la “hype”
technologique – Big data <> Hadoop
Faire des POC techniques pour mesurer la complexité des solutions
dans votre contexte
Architecture de la plateforme (suite)
Combiner les solutions techniques lorsque nécessaire répondre aux
besoins
Favoriser le prototypage et le self-service avec des API techniques
standards
Faire un état des lieux fréquent des usages et ajuster la trajectoire
Soutien & visibilité
Constituer un data lab faisant le pont entre les projets et les données
Publier : offre, projets, catalogue, documentation, backlog du datalab
Autoriser les dérogations aux standards, quitte à baisser le niveau de
support
Allouer du temps (~ 10%) à la formation et la veille technique continue
Ingérer
Premières sources de données
Cibler les 3-4 use cases les plus importants
Mettre ensemble les données de différents domaines
Inclure une source historiquement “difficile”
Bâtir un framework d’intégration
Commencer par le batch
Intégrer au format le plus brut possible
Archiver les données brutes
Objectif : une nouvelle source industrialisée en moins d’une semaine
L’intégration des données comme projet
Une équipe dédiée pour démarrer le framework, faire contribuer les
projets métier plus tard
Construire de manière itérative, au gré des besoins
Comme tout code applicatif, le framework est bien sûr testé
Gouverner
Des comités réguliers, même informels
Donner de la visibilité aux sponsors qui fédèrent les acteurs
Mettre en place des règles d’éligibilité des projets (accès ou
hébergement)
Définir quelques KPI simples à suivre pour ajuster l’offre de services
Environnements...
Comprendre l’importance de la pré-production technique
Envisager la mutualisation d’environnements sur une plateforme
Inclure le cycle de vie des données dans la définition des
environnements
Un SLA fort, ça coûte cher !
Un SLA modeste au début pour appréhender la complexité
Ne pas hésiter à dupliquer la donnée pour les SLA de restitution plus
critiques
Prendre acte des impacts de l’organisation sur le SLA
Gouvernance des données
Pas encore de solution miracle… ni open source ni commerciale
Chercher à répondre à des besoins simples avec des solutions simples
Le modèle d’organisation des données fait une partie du travail
Premiers plans
Premiers plans
Si vous avez besoin d’un data lake, bien étudier les besoins, et
comprendre les forces et faiblesses des solutions big data dans votre
contexte
Se fixer quelques objectifs pour les 2 premiers mois :
Des sponsors, une offre de services, et un embryon de data lab
Un modèle d’organisation des données, documenté dans un wiki
Un use case “étendard” en production (SLA réduit) s’appuyant sur un framework testé
Une architecture capable de traiter les tout prochains use cases sur la liste …
… et une méthodologie pour instruire les suivants
Merci

Contenu connexe

Tendances

Cloud commputing impacts sur la façon de pensée les SI et la DSI
Cloud commputing   impacts sur la façon de pensée les SI et la DSICloud commputing   impacts sur la façon de pensée les SI et la DSI
Cloud commputing impacts sur la façon de pensée les SI et la DSIJean-François Caenen
 
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017Absys Cyborg
 
SaaS et Cloud, une révolution ?
SaaS et Cloud, une révolution ?SaaS et Cloud, une révolution ?
SaaS et Cloud, une révolution ?Sage france
 
DU DEVOPS AU FASTLAB
DU DEVOPS AU FASTLABDU DEVOPS AU FASTLAB
DU DEVOPS AU FASTLABTREEPTIK
 
Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLICedric CARBONE
 
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?Microsoft Décideurs IT
 
Cwin16 - Paris - blockchain
Cwin16 - Paris - blockchainCwin16 - Paris - blockchain
Cwin16 - Paris - blockchainCapgemini
 
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - SharizonIBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - SharizonIBM France Lab
 
Cwin16 - Paris - dev ops
Cwin16 - Paris - dev opsCwin16 - Paris - dev ops
Cwin16 - Paris - dev opsCapgemini
 
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetiteGab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetiteAZUG FR
 
Conférence dynamics 365 journée 30 ans absys cyborg 06072017
Conférence dynamics 365   journée 30 ans absys cyborg 06072017Conférence dynamics 365   journée 30 ans absys cyborg 06072017
Conférence dynamics 365 journée 30 ans absys cyborg 06072017Absys Cyborg
 
Cwin16 - Paris - cloud
Cwin16 - Paris - cloudCwin16 - Paris - cloud
Cwin16 - Paris - cloudCapgemini
 
LANDesk Total User Management Case Study
LANDesk Total User Management Case StudyLANDesk Total User Management Case Study
LANDesk Total User Management Case StudyEvelyne Martin Yucatan
 
Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)Nuvollo
 
Des exemples de scénario de mobilité en entreprise
Des exemples de scénario de mobilité en entrepriseDes exemples de scénario de mobilité en entreprise
Des exemples de scénario de mobilité en entrepriseMicrosoft Décideurs IT
 
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !Simplicité Software
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réelSmile I.T is open
 

Tendances (20)

Cloud commputing impacts sur la façon de pensée les SI et la DSI
Cloud commputing   impacts sur la façon de pensée les SI et la DSICloud commputing   impacts sur la façon de pensée les SI et la DSI
Cloud commputing impacts sur la façon de pensée les SI et la DSI
 
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
 
SaaS et Cloud, une révolution ?
SaaS et Cloud, une révolution ?SaaS et Cloud, une révolution ?
SaaS et Cloud, une révolution ?
 
DU DEVOPS AU FASTLAB
DU DEVOPS AU FASTLABDU DEVOPS AU FASTLAB
DU DEVOPS AU FASTLAB
 
Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLI
 
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
 
ML Ops a Survey
ML Ops a SurveyML Ops a Survey
ML Ops a Survey
 
Cwin16 - Paris - blockchain
Cwin16 - Paris - blockchainCwin16 - Paris - blockchain
Cwin16 - Paris - blockchain
 
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - SharizonIBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon
 
Cwin16 - Paris - dev ops
Cwin16 - Paris - dev opsCwin16 - Paris - dev ops
Cwin16 - Paris - dev ops
 
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetiteGab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
 
Conférence dynamics 365 journée 30 ans absys cyborg 06072017
Conférence dynamics 365   journée 30 ans absys cyborg 06072017Conférence dynamics 365   journée 30 ans absys cyborg 06072017
Conférence dynamics 365 journée 30 ans absys cyborg 06072017
 
Cwin16 - Paris - cloud
Cwin16 - Paris - cloudCwin16 - Paris - cloud
Cwin16 - Paris - cloud
 
LANDesk Total User Management Case Study
LANDesk Total User Management Case StudyLANDesk Total User Management Case Study
LANDesk Total User Management Case Study
 
Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)
 
Mon Stockage a la Cloud Attitude
Mon Stockage a la Cloud Attitude Mon Stockage a la Cloud Attitude
Mon Stockage a la Cloud Attitude
 
Des exemples de scénario de mobilité en entreprise
Des exemples de scénario de mobilité en entrepriseDes exemples de scénario de mobilité en entreprise
Des exemples de scénario de mobilité en entreprise
 
Adopter le cloud avec microsoft
Adopter le cloud avec microsoftAdopter le cloud avec microsoft
Adopter le cloud avec microsoft
 
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
 

Similaire à La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"

Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agile5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agileagileDSS
 
CRIP HP Cloud Generation
CRIP HP Cloud GenerationCRIP HP Cloud Generation
CRIP HP Cloud GenerationPatrick Joubert
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyOxalide
 
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Excelerate Systems
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientDenodo
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesKezhan SHI
 
Élaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeÉlaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeFresche Solutions
 
Integration Drupal systemes d'informations
Integration Drupal systemes d'informationsIntegration Drupal systemes d'informations
Integration Drupal systemes d'informationsneuros
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologyImad ALILAT
 
SplunkLive! Paris 2016 - customer presentation - Neocles
SplunkLive! Paris 2016 - customer presentation - NeoclesSplunkLive! Paris 2016 - customer presentation - Neocles
SplunkLive! Paris 2016 - customer presentation - NeoclesSplunk
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 

Similaire à La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac" (20)

Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agile5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agile
 
Pj hug 07_04_2016
Pj hug 07_04_2016Pj hug 07_04_2016
Pj hug 07_04_2016
 
CRIP HP Cloud Generation
CRIP HP Cloud GenerationCRIP HP Cloud Generation
CRIP HP Cloud Generation
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
 
Big data
Big dataBig data
Big data
 
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
Élaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeÉlaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris Koppe
 
Integration Drupal systemes d'informations
Integration Drupal systemes d'informationsIntegration Drupal systemes d'informations
Integration Drupal systemes d'informations
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data Technology
 
SplunkLive! Paris 2016 - customer presentation - Neocles
SplunkLive! Paris 2016 - customer presentation - NeoclesSplunkLive! Paris 2016 - customer presentation - Neocles
SplunkLive! Paris 2016 - customer presentation - Neocles
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
BigData on change d'ère !
BigData on change d'ère ! BigData on change d'ère !
BigData on change d'ère !
 

Plus de OCTO Technology

Le Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonné
Le Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonnéLe Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonné
Le Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonnéOCTO Technology
 
Le Comptoir OCTO - MLOps : Les patterns MLOps dans le cloud
Le Comptoir OCTO - MLOps : Les patterns MLOps dans le cloudLe Comptoir OCTO - MLOps : Les patterns MLOps dans le cloud
Le Comptoir OCTO - MLOps : Les patterns MLOps dans le cloudOCTO Technology
 
La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...
La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...
La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...OCTO Technology
 
La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...
La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...
La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...OCTO Technology
 
Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...
Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...
Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...OCTO Technology
 
OCTO Talks - Les IA s'invitent au chevet des développeurs
OCTO Talks - Les IA s'invitent au chevet des développeursOCTO Talks - Les IA s'invitent au chevet des développeurs
OCTO Talks - Les IA s'invitent au chevet des développeursOCTO Technology
 
OCTO Talks - Lancement du livre Culture Test
OCTO Talks - Lancement du livre Culture TestOCTO Talks - Lancement du livre Culture Test
OCTO Talks - Lancement du livre Culture TestOCTO Technology
 
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...OCTO Technology
 
OCTO Talks - State of the art Architecture dans les frontend web
OCTO Talks - State of the art Architecture dans les frontend webOCTO Talks - State of the art Architecture dans les frontend web
OCTO Talks - State of the art Architecture dans les frontend webOCTO Technology
 
Comptoir OCTO ALD Automotive/Leaseplan
Comptoir OCTO ALD Automotive/LeaseplanComptoir OCTO ALD Automotive/Leaseplan
Comptoir OCTO ALD Automotive/LeaseplanOCTO Technology
 
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? OCTO Technology
 
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...OCTO Technology
 
Le Comptoir OCTO - Affinez vos forecasts avec la planification distribuée et...
Le Comptoir OCTO -  Affinez vos forecasts avec la planification distribuée et...Le Comptoir OCTO -  Affinez vos forecasts avec la planification distribuée et...
Le Comptoir OCTO - Affinez vos forecasts avec la planification distribuée et...OCTO Technology
 
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conceptionLe Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conceptionOCTO Technology
 
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...OCTO Technology
 
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone : les solutions E...
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone :  les solutions E...Le Comptoir OCTO - L'avenir de la gestion du bilan carbone :  les solutions E...
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone : les solutions E...OCTO Technology
 
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...OCTO Technology
 
RefCard Tests sur tous les fronts
RefCard Tests sur tous les frontsRefCard Tests sur tous les fronts
RefCard Tests sur tous les frontsOCTO Technology
 
RefCard RESTful API Design
RefCard RESTful API DesignRefCard RESTful API Design
RefCard RESTful API DesignOCTO Technology
 

Plus de OCTO Technology (20)

Le Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonné
Le Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonnéLe Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonné
Le Comptoir OCTO - Se conformer à la CSRD : un levier d'action insoupçonné
 
Le Comptoir OCTO - MLOps : Les patterns MLOps dans le cloud
Le Comptoir OCTO - MLOps : Les patterns MLOps dans le cloudLe Comptoir OCTO - MLOps : Les patterns MLOps dans le cloud
Le Comptoir OCTO - MLOps : Les patterns MLOps dans le cloud
 
La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...
La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...
La Grosse Conf 2024 - Philippe Stepniewski -Atelier - Live coding d'une base ...
 
La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...
La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...
La Grosse Conf 2024 - Philippe Prados - Atelier - RAG : au-delà de la démonst...
 
Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...
Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...
Le Comptoir OCTO - Maîtriser le RAG : connecter les modèles d’IA génératives ...
 
OCTO Talks - Les IA s'invitent au chevet des développeurs
OCTO Talks - Les IA s'invitent au chevet des développeursOCTO Talks - Les IA s'invitent au chevet des développeurs
OCTO Talks - Les IA s'invitent au chevet des développeurs
 
OCTO Talks - Lancement du livre Culture Test
OCTO Talks - Lancement du livre Culture TestOCTO Talks - Lancement du livre Culture Test
OCTO Talks - Lancement du livre Culture Test
 
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
 
OCTO Talks - State of the art Architecture dans les frontend web
OCTO Talks - State of the art Architecture dans les frontend webOCTO Talks - State of the art Architecture dans les frontend web
OCTO Talks - State of the art Architecture dans les frontend web
 
Refcard GraphQL
Refcard GraphQLRefcard GraphQL
Refcard GraphQL
 
Comptoir OCTO ALD Automotive/Leaseplan
Comptoir OCTO ALD Automotive/LeaseplanComptoir OCTO ALD Automotive/Leaseplan
Comptoir OCTO ALD Automotive/Leaseplan
 
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
 
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
 
Le Comptoir OCTO - Affinez vos forecasts avec la planification distribuée et...
Le Comptoir OCTO -  Affinez vos forecasts avec la planification distribuée et...Le Comptoir OCTO -  Affinez vos forecasts avec la planification distribuée et...
Le Comptoir OCTO - Affinez vos forecasts avec la planification distribuée et...
 
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conceptionLe Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception
 
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...
 
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone : les solutions E...
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone :  les solutions E...Le Comptoir OCTO - L'avenir de la gestion du bilan carbone :  les solutions E...
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone : les solutions E...
 
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...
 
RefCard Tests sur tous les fronts
RefCard Tests sur tous les frontsRefCard Tests sur tous les fronts
RefCard Tests sur tous les fronts
 
RefCard RESTful API Design
RefCard RESTful API DesignRefCard RESTful API Design
RefCard RESTful API Design
 

La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"

  • 1. Superbe maison d’architecte avec vue sur le lac Des chantiers concrets pour démarrer
  • 2. À propos... Thomas VIAL 11 ans chez Tribu Big Data & Analytics depuis sa création en 2013 Consultant data geek Architecture & data science Auteur principal du livre blanc Hadoop, feuille de route Formateur Hadoop pour Speaker au Hadoop Summit 2015 à Dublin, avec EDF
  • 3. Au commencement était une ambition "Le data lake Hadoop doit rationaliser la BI du Groupe et porter les use cases analytiques, grâce à une démarche agile centrée sur la gouvernance des données"
  • 4. Et finalement… an architect’s dream come true 3 fichiers intégrés 1 score calculé, restitué dans une application BI 2 utilisateurs 3 noeuds Hadoop pour un cluster sur-dimensionné 0,2 ETP pour administrer la bête 1 application métier en semi-production=
  • 5. Data lake = Concentrateur de données + Plateforme pour favoriser l’émergence de projets s’appuyant sur des données désilotées Caractérisation
  • 6. L’enjeu d’adoption Construire une offre de services Ingérer pour pouvoir publier Gouverner
  • 8. Formaliser une offre de services Valider l’intérêt du data lake J Impliquer les “clients” : sponsors, utilisateurs, applications du SI, public… Décliner les services à tous les niveaux : Mise à disposition et publication de données Plateforme de construction d’applications orientées données Soutien affiché aux projets utilisateurs du data lake
  • 9. Organisation des données Anticiper plusieurs fournisseurs et plusieurs projets Anticiper les futures (?) exigences de sécurité Privilégier la lisibilité et la simplicité (règle des 80/20) en proposant des standards Objectif : un script d’administration qui crée un espace projet en 5 min
  • 10. Architecture de la plateforme Analyser les besoins architecturaux à court terme Prioriser les clients en fonction de l’enjeu, pas de la “hype” technologique – Big data <> Hadoop Faire des POC techniques pour mesurer la complexité des solutions dans votre contexte
  • 11. Architecture de la plateforme (suite) Combiner les solutions techniques lorsque nécessaire répondre aux besoins Favoriser le prototypage et le self-service avec des API techniques standards Faire un état des lieux fréquent des usages et ajuster la trajectoire
  • 12. Soutien & visibilité Constituer un data lab faisant le pont entre les projets et les données Publier : offre, projets, catalogue, documentation, backlog du datalab Autoriser les dérogations aux standards, quitte à baisser le niveau de support Allouer du temps (~ 10%) à la formation et la veille technique continue
  • 14. Premières sources de données Cibler les 3-4 use cases les plus importants Mettre ensemble les données de différents domaines Inclure une source historiquement “difficile”
  • 15. Bâtir un framework d’intégration Commencer par le batch Intégrer au format le plus brut possible Archiver les données brutes Objectif : une nouvelle source industrialisée en moins d’une semaine
  • 16. L’intégration des données comme projet Une équipe dédiée pour démarrer le framework, faire contribuer les projets métier plus tard Construire de manière itérative, au gré des besoins Comme tout code applicatif, le framework est bien sûr testé
  • 18. Des comités réguliers, même informels Donner de la visibilité aux sponsors qui fédèrent les acteurs Mettre en place des règles d’éligibilité des projets (accès ou hébergement) Définir quelques KPI simples à suivre pour ajuster l’offre de services
  • 19. Environnements... Comprendre l’importance de la pré-production technique Envisager la mutualisation d’environnements sur une plateforme Inclure le cycle de vie des données dans la définition des environnements
  • 20. Un SLA fort, ça coûte cher ! Un SLA modeste au début pour appréhender la complexité Ne pas hésiter à dupliquer la donnée pour les SLA de restitution plus critiques Prendre acte des impacts de l’organisation sur le SLA
  • 21. Gouvernance des données Pas encore de solution miracle… ni open source ni commerciale Chercher à répondre à des besoins simples avec des solutions simples Le modèle d’organisation des données fait une partie du travail
  • 23. Premiers plans Si vous avez besoin d’un data lake, bien étudier les besoins, et comprendre les forces et faiblesses des solutions big data dans votre contexte Se fixer quelques objectifs pour les 2 premiers mois : Des sponsors, une offre de services, et un embryon de data lab Un modèle d’organisation des données, documenté dans un wiki Un use case “étendard” en production (SLA réduit) s’appuyant sur un framework testé Une architecture capable de traiter les tout prochains use cases sur la liste … … et une méthodologie pour instruire les suivants
  • 24. Merci