La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"

O
OCTO TechnologyOCTO Technology
Superbe maison d’architecte avec vue sur le lac
Des chantiers concrets pour démarrer
À propos...
Thomas VIAL
11 ans chez
Tribu Big Data & Analytics
depuis sa création en 2013
Consultant data geek
Architecture & data science
Auteur principal du livre blanc
Hadoop, feuille de route
Formateur Hadoop pour
Speaker au Hadoop Summit
2015 à Dublin, avec EDF
Au commencement était une ambition
"Le data lake Hadoop doit rationaliser la BI du Groupe et
porter les use cases analytiques, grâce à une démarche
agile centrée sur la gouvernance des données"
Et finalement… an architect’s dream come true
3 fichiers intégrés
1 score calculé, restitué dans une application BI
2 utilisateurs
3 noeuds Hadoop pour un cluster sur-dimensionné
0,2 ETP pour administrer la bête
1 application métier en semi-production=
Data lake
=
Concentrateur de données
+
Plateforme
pour favoriser l’émergence de projets s’appuyant
sur des données désilotées
Caractérisation
L’enjeu d’adoption
Construire une offre de services
Ingérer pour pouvoir publier
Gouverner
Offrir des services
Formaliser une offre de services
Valider l’intérêt du data lake J
Impliquer les “clients” : sponsors, utilisateurs, applications du SI,
public…
Décliner les services à tous les niveaux :
Mise à disposition et publication de données
Plateforme de construction d’applications orientées données
Soutien affiché aux projets utilisateurs du data lake
Organisation des données
Anticiper plusieurs fournisseurs et plusieurs projets
Anticiper les futures (?) exigences de sécurité
Privilégier la lisibilité et la simplicité (règle des 80/20) en proposant des
standards
Objectif : un script d’administration qui crée un espace projet en 5 min
Architecture de la plateforme
Analyser les besoins architecturaux à court terme
Prioriser les clients en fonction de l’enjeu, pas de la “hype”
technologique – Big data <> Hadoop
Faire des POC techniques pour mesurer la complexité des solutions
dans votre contexte
Architecture de la plateforme (suite)
Combiner les solutions techniques lorsque nécessaire répondre aux
besoins
Favoriser le prototypage et le self-service avec des API techniques
standards
Faire un état des lieux fréquent des usages et ajuster la trajectoire
Soutien & visibilité
Constituer un data lab faisant le pont entre les projets et les données
Publier : offre, projets, catalogue, documentation, backlog du datalab
Autoriser les dérogations aux standards, quitte à baisser le niveau de
support
Allouer du temps (~ 10%) à la formation et la veille technique continue
Ingérer
Premières sources de données
Cibler les 3-4 use cases les plus importants
Mettre ensemble les données de différents domaines
Inclure une source historiquement “difficile”
Bâtir un framework d’intégration
Commencer par le batch
Intégrer au format le plus brut possible
Archiver les données brutes
Objectif : une nouvelle source industrialisée en moins d’une semaine
L’intégration des données comme projet
Une équipe dédiée pour démarrer le framework, faire contribuer les
projets métier plus tard
Construire de manière itérative, au gré des besoins
Comme tout code applicatif, le framework est bien sûr testé
Gouverner
Des comités réguliers, même informels
Donner de la visibilité aux sponsors qui fédèrent les acteurs
Mettre en place des règles d’éligibilité des projets (accès ou
hébergement)
Définir quelques KPI simples à suivre pour ajuster l’offre de services
Environnements...
Comprendre l’importance de la pré-production technique
Envisager la mutualisation d’environnements sur une plateforme
Inclure le cycle de vie des données dans la définition des
environnements
Un SLA fort, ça coûte cher !
Un SLA modeste au début pour appréhender la complexité
Ne pas hésiter à dupliquer la donnée pour les SLA de restitution plus
critiques
Prendre acte des impacts de l’organisation sur le SLA
Gouvernance des données
Pas encore de solution miracle… ni open source ni commerciale
Chercher à répondre à des besoins simples avec des solutions simples
Le modèle d’organisation des données fait une partie du travail
Premiers plans
Premiers plans
Si vous avez besoin d’un data lake, bien étudier les besoins, et
comprendre les forces et faiblesses des solutions big data dans votre
contexte
Se fixer quelques objectifs pour les 2 premiers mois :
Des sponsors, une offre de services, et un embryon de data lab
Un modèle d’organisation des données, documenté dans un wiki
Un use case “étendard” en production (SLA réduit) s’appuyant sur un framework testé
Une architecture capable de traiter les tout prochains use cases sur la liste …
… et une méthodologie pour instruire les suivants
Merci
1 sur 24

Recommandé

La Duck Conf 2018 : "Mon mainframe fait du digital sans casser ma tirelire" par
La Duck Conf 2018 : "Mon mainframe fait du digital sans casser ma tirelire"La Duck Conf 2018 : "Mon mainframe fait du digital sans casser ma tirelire"
La Duck Conf 2018 : "Mon mainframe fait du digital sans casser ma tirelire"OCTO Technology
1.4K vues21 diapositives
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo... par
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...OCTO Technology
1.2K vues67 diapositives
La Duck Conf 2018 : "Une infrastructure peut en cacher une autre !" par
La Duck Conf 2018 : "Une infrastructure peut en cacher une autre !"La Duck Conf 2018 : "Une infrastructure peut en cacher une autre !"
La Duck Conf 2018 : "Une infrastructure peut en cacher une autre !"OCTO Technology
1.6K vues26 diapositives
La Duck Conf 2018 : "Big Data : guide de survie des architectures" par
La Duck Conf 2018 : "Big Data : guide de survie des architectures"La Duck Conf 2018 : "Big Data : guide de survie des architectures"
La Duck Conf 2018 : "Big Data : guide de survie des architectures"OCTO Technology
1.4K vues40 diapositives
La Duck Conf 2018 : "Stop à la résilience à la papa" par
La Duck Conf 2018 : "Stop à la résilience à la papa"La Duck Conf 2018 : "Stop à la résilience à la papa"
La Duck Conf 2018 : "Stop à la résilience à la papa"OCTO Technology
1.3K vues36 diapositives
La gouvernance du SI hybride - Principes et mise en oeuvre par
La gouvernance du SI hybride - Principes et mise en oeuvreLa gouvernance du SI hybride - Principes et mise en oeuvre
La gouvernance du SI hybride - Principes et mise en oeuvreOCTO Technology
6.1K vues18 diapositives

Contenu connexe

Tendances

Cloud commputing impacts sur la façon de pensée les SI et la DSI par
Cloud commputing   impacts sur la façon de pensée les SI et la DSICloud commputing   impacts sur la façon de pensée les SI et la DSI
Cloud commputing impacts sur la façon de pensée les SI et la DSIJean-François Caenen
1.1K vues27 diapositives
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017 par
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017Absys Cyborg
429 vues47 diapositives
SaaS et Cloud, une révolution ? par
SaaS et Cloud, une révolution ?SaaS et Cloud, une révolution ?
SaaS et Cloud, une révolution ?Sage france
2.7K vues52 diapositives
DU DEVOPS AU FASTLAB par
DU DEVOPS AU FASTLABDU DEVOPS AU FASTLAB
DU DEVOPS AU FASTLABTREEPTIK
215 vues20 diapositives
Petit Déjeuner Talend/SQLI par
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLICedric CARBONE
1.4K vues10 diapositives
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ? par
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?Microsoft Décideurs IT
1.2K vues24 diapositives

Tendances(20)

Cloud commputing impacts sur la façon de pensée les SI et la DSI par Jean-François Caenen
Cloud commputing   impacts sur la façon de pensée les SI et la DSICloud commputing   impacts sur la façon de pensée les SI et la DSI
Cloud commputing impacts sur la façon de pensée les SI et la DSI
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017 par Absys Cyborg
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
Conférence BI Collaboratif Web - journée 30 ans absys cyborg 06072017
Absys Cyborg429 vues
SaaS et Cloud, une révolution ? par Sage france
SaaS et Cloud, une révolution ?SaaS et Cloud, une révolution ?
SaaS et Cloud, une révolution ?
Sage france2.7K vues
DU DEVOPS AU FASTLAB par TREEPTIK
DU DEVOPS AU FASTLABDU DEVOPS AU FASTLAB
DU DEVOPS AU FASTLAB
TREEPTIK215 vues
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ? par Microsoft Décideurs IT
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
Cloud Hybride : Mythe ou réalité ? Quelle stratégie et solution ?
Cwin16 - Paris - blockchain par Capgemini
Cwin16 - Paris - blockchainCwin16 - Paris - blockchain
Cwin16 - Paris - blockchain
Capgemini908 vues
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon par IBM France Lab
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - SharizonIBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon
IBM Bluemix Paris Meetup #15 - Ecole 42 - 20160622 - Sharizon
IBM France Lab246 vues
Cwin16 - Paris - dev ops par Capgemini
Cwin16 - Paris - dev opsCwin16 - Paris - dev ops
Cwin16 - Paris - dev ops
Capgemini798 vues
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite par AZUG FR
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetiteGab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
AZUG FR144 vues
Conférence dynamics 365 journée 30 ans absys cyborg 06072017 par Absys Cyborg
Conférence dynamics 365   journée 30 ans absys cyborg 06072017Conférence dynamics 365   journée 30 ans absys cyborg 06072017
Conférence dynamics 365 journée 30 ans absys cyborg 06072017
Absys Cyborg398 vues
Cwin16 - Paris - cloud par Capgemini
Cwin16 - Paris - cloudCwin16 - Paris - cloud
Cwin16 - Paris - cloud
Capgemini355 vues
Nuvollo and La passerelle-I.D.E (french) par Nuvollo
Nuvollo and La passerelle-I.D.E (french)Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)
Nuvollo327 vues
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous ! par Simplicité Software
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !
Meetup #1 low-code, Pourquoi ? Pour qui ? Comment ? Rencontrons-nous !
Webinar Smile et Talend : Faites communiquer vos applications en temps réel par Smile I.T is open
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel

Similaire à La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"

Discovery Session France: Atelier découverte de la Data Virtualization par
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
245 vues45 diapositives
5 bonnes raisons pour des projets analytiques en agile par
5 bonnes raisons pour des projets analytiques en agile5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agileagileDSS
61 vues16 diapositives
Pj hug 07_04_2016 par
Pj hug 07_04_2016Pj hug 07_04_2016
Pj hug 07_04_2016Axel TIFRANI
4.1K vues15 diapositives
CRIP HP Cloud Generation par
CRIP HP Cloud GenerationCRIP HP Cloud Generation
CRIP HP Cloud GenerationPatrick Joubert
919 vues11 diapositives
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization par
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
17 vues62 diapositives
Livre blanc data-lakes converteo 2018 par
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
3.8K vues22 diapositives

Similaire à La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"(20)

Discovery Session France: Atelier découverte de la Data Virtualization par Denodo
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
Denodo 245 vues
5 bonnes raisons pour des projets analytiques en agile par agileDSS
5 bonnes raisons pour des projets analytiques en agile5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agile
agileDSS61 vues
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization par Denodo
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Denodo 17 vues
Livre blanc data-lakes converteo 2018 par Converteo
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
Converteo3.8K vues
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization par Denodo
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Denodo 175 vues
Session découverte de la Data Virtualization par Denodo
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
Denodo 260 vues
Session découverte de la Data Virtualization par Denodo
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
Denodo 209 vues
Morning Tech#1 BigData - Oxalide Academy par Oxalide
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
Oxalide266 vues
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'... par Excelerate Systems
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Excelerate Systems2.5K vues
La Logical Data Fabric au secours de la connaissance client par Denodo
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
Denodo 18 vues
Big data analytics focus technique et nouvelles perspectives pour les actuaires par Kezhan SHI
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Kezhan SHI4K vues
Élaboration d'une stratégie de modernisation par Chris Koppe par Fresche Solutions
Élaboration d'une stratégie de modernisation par Chris KoppeÉlaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris Koppe
Integration Drupal systemes d'informations par neuros
Integration Drupal systemes d'informationsIntegration Drupal systemes d'informations
Integration Drupal systemes d'informations
neuros2.6K vues
Social Network Analysis Utilizing Big Data Technology par Imad ALILAT
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data Technology
Imad ALILAT529 vues
SplunkLive! Paris 2016 - customer presentation - Neocles par Splunk
SplunkLive! Paris 2016 - customer presentation - NeoclesSplunkLive! Paris 2016 - customer presentation - Neocles
SplunkLive! Paris 2016 - customer presentation - Neocles
Splunk942 vues
Session découverte de la Data Virtualization par Denodo
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
Denodo 399 vues

Plus de OCTO Technology

Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’... par
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...OCTO Technology
3 vues28 diapositives
OCTO Talks - State of the art Architecture dans les frontend web par
OCTO Talks - State of the art Architecture dans les frontend webOCTO Talks - State of the art Architecture dans les frontend web
OCTO Talks - State of the art Architecture dans les frontend webOCTO Technology
65 vues64 diapositives
Refcard GraphQL par
Refcard GraphQLRefcard GraphQL
Refcard GraphQLOCTO Technology
19 vues14 diapositives
Comptoir OCTO ALD Automotive/Leaseplan par
Comptoir OCTO ALD Automotive/LeaseplanComptoir OCTO ALD Automotive/Leaseplan
Comptoir OCTO ALD Automotive/LeaseplanOCTO Technology
13 vues12 diapositives
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? par
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? OCTO Technology
159 vues12 diapositives
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi... par
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...OCTO Technology
17 vues10 diapositives

Plus de OCTO Technology(20)

Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’... par OCTO Technology
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
Le Comptoir OCTO - Green AI, comment éviter que votre votre potion magique d’...
OCTO Talks - State of the art Architecture dans les frontend web par OCTO Technology
OCTO Talks - State of the art Architecture dans les frontend webOCTO Talks - State of the art Architecture dans les frontend web
OCTO Talks - State of the art Architecture dans les frontend web
OCTO Technology65 vues
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? par OCTO Technology
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ? Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
Le Comptoir OCTO - Comment optimiser les stocks en linéaire par la Data ?
OCTO Technology159 vues
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi... par OCTO Technology
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
Le Comptoir OCTO - Retour sur 5 ans de mise en oeuvre : Comment le RGPD a réi...
OCTO Technology17 vues
Le Comptoir OCTO - Affinez vos forecasts avec la planification distribuée et... par OCTO Technology
Le Comptoir OCTO -  Affinez vos forecasts avec la planification distribuée et...Le Comptoir OCTO -  Affinez vos forecasts avec la planification distribuée et...
Le Comptoir OCTO - Affinez vos forecasts avec la planification distribuée et...
OCTO Technology15 vues
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception par OCTO Technology
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conceptionLe Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception
Le Comptoir OCTO - La formation au cœur de la stratégie d’éco-conception
OCTO Technology32 vues
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal... par OCTO Technology
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...
Le Comptoir OCTO - Une vision de plateforme sans leadership tech n’est qu’hal...
OCTO Technology63 vues
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone : les solutions E... par OCTO Technology
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone :  les solutions E...Le Comptoir OCTO - L'avenir de la gestion du bilan carbone :  les solutions E...
Le Comptoir OCTO - L'avenir de la gestion du bilan carbone : les solutions E...
OCTO Technology17 vues
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir... par OCTO Technology
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...
Le Comptoir OCTO - Continuous discovery et continuous delivery pour construir...
OCTO Technology22 vues
LA DUCK CONF 2023 - Journal de bord d’un archi dans l’océan du green par OCTO Technology
LA DUCK CONF 2023 - Journal de bord d’un archi dans l’océan du greenLA DUCK CONF 2023 - Journal de bord d’un archi dans l’océan du green
LA DUCK CONF 2023 - Journal de bord d’un archi dans l’océan du green
OCTO Technology10 vues
LA DUCK CONF 2023 - Sous le capot du cloud souverain par OCTO Technology
LA DUCK CONF 2023 - Sous le capot du cloud souverainLA DUCK CONF 2023 - Sous le capot du cloud souverain
LA DUCK CONF 2023 - Sous le capot du cloud souverain
OCTO Technology80 vues
LA DUCK CONF 2023 - Ré-urbanisation d'un SI à travers une archi évolutive par OCTO Technology
LA DUCK CONF 2023 - Ré-urbanisation d'un SI à travers une archi évolutiveLA DUCK CONF 2023 - Ré-urbanisation d'un SI à travers une archi évolutive
LA DUCK CONF 2023 - Ré-urbanisation d'un SI à travers une archi évolutive
OCTO Technology26 vues
LA DUCK CONF 2023 - Parce que nos plateformes le valent bien par OCTO Technology
LA DUCK CONF 2023 - Parce que nos plateformes le valent bienLA DUCK CONF 2023 - Parce que nos plateformes le valent bien
LA DUCK CONF 2023 - Parce que nos plateformes le valent bien
OCTO Technology35 vues
LA DUCK CONF 2023 - Guider, faire, faire faire ? Une solitude partagée entre ... par OCTO Technology
LA DUCK CONF 2023 - Guider, faire, faire faire ? Une solitude partagée entre ...LA DUCK CONF 2023 - Guider, faire, faire faire ? Une solitude partagée entre ...
LA DUCK CONF 2023 - Guider, faire, faire faire ? Une solitude partagée entre ...
OCTO Technology25 vues
LA DUCK CONF 2023 - Guide de survie du Change Data Capture par OCTO Technology
LA DUCK CONF 2023 - Guide de survie du Change Data CaptureLA DUCK CONF 2023 - Guide de survie du Change Data Capture
LA DUCK CONF 2023 - Guide de survie du Change Data Capture
OCTO Technology13 vues

La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"

  • 1. Superbe maison d’architecte avec vue sur le lac Des chantiers concrets pour démarrer
  • 2. À propos... Thomas VIAL 11 ans chez Tribu Big Data & Analytics depuis sa création en 2013 Consultant data geek Architecture & data science Auteur principal du livre blanc Hadoop, feuille de route Formateur Hadoop pour Speaker au Hadoop Summit 2015 à Dublin, avec EDF
  • 3. Au commencement était une ambition "Le data lake Hadoop doit rationaliser la BI du Groupe et porter les use cases analytiques, grâce à une démarche agile centrée sur la gouvernance des données"
  • 4. Et finalement… an architect’s dream come true 3 fichiers intégrés 1 score calculé, restitué dans une application BI 2 utilisateurs 3 noeuds Hadoop pour un cluster sur-dimensionné 0,2 ETP pour administrer la bête 1 application métier en semi-production=
  • 5. Data lake = Concentrateur de données + Plateforme pour favoriser l’émergence de projets s’appuyant sur des données désilotées Caractérisation
  • 6. L’enjeu d’adoption Construire une offre de services Ingérer pour pouvoir publier Gouverner
  • 8. Formaliser une offre de services Valider l’intérêt du data lake J Impliquer les “clients” : sponsors, utilisateurs, applications du SI, public… Décliner les services à tous les niveaux : Mise à disposition et publication de données Plateforme de construction d’applications orientées données Soutien affiché aux projets utilisateurs du data lake
  • 9. Organisation des données Anticiper plusieurs fournisseurs et plusieurs projets Anticiper les futures (?) exigences de sécurité Privilégier la lisibilité et la simplicité (règle des 80/20) en proposant des standards Objectif : un script d’administration qui crée un espace projet en 5 min
  • 10. Architecture de la plateforme Analyser les besoins architecturaux à court terme Prioriser les clients en fonction de l’enjeu, pas de la “hype” technologique – Big data <> Hadoop Faire des POC techniques pour mesurer la complexité des solutions dans votre contexte
  • 11. Architecture de la plateforme (suite) Combiner les solutions techniques lorsque nécessaire répondre aux besoins Favoriser le prototypage et le self-service avec des API techniques standards Faire un état des lieux fréquent des usages et ajuster la trajectoire
  • 12. Soutien & visibilité Constituer un data lab faisant le pont entre les projets et les données Publier : offre, projets, catalogue, documentation, backlog du datalab Autoriser les dérogations aux standards, quitte à baisser le niveau de support Allouer du temps (~ 10%) à la formation et la veille technique continue
  • 14. Premières sources de données Cibler les 3-4 use cases les plus importants Mettre ensemble les données de différents domaines Inclure une source historiquement “difficile”
  • 15. Bâtir un framework d’intégration Commencer par le batch Intégrer au format le plus brut possible Archiver les données brutes Objectif : une nouvelle source industrialisée en moins d’une semaine
  • 16. L’intégration des données comme projet Une équipe dédiée pour démarrer le framework, faire contribuer les projets métier plus tard Construire de manière itérative, au gré des besoins Comme tout code applicatif, le framework est bien sûr testé
  • 18. Des comités réguliers, même informels Donner de la visibilité aux sponsors qui fédèrent les acteurs Mettre en place des règles d’éligibilité des projets (accès ou hébergement) Définir quelques KPI simples à suivre pour ajuster l’offre de services
  • 19. Environnements... Comprendre l’importance de la pré-production technique Envisager la mutualisation d’environnements sur une plateforme Inclure le cycle de vie des données dans la définition des environnements
  • 20. Un SLA fort, ça coûte cher ! Un SLA modeste au début pour appréhender la complexité Ne pas hésiter à dupliquer la donnée pour les SLA de restitution plus critiques Prendre acte des impacts de l’organisation sur le SLA
  • 21. Gouvernance des données Pas encore de solution miracle… ni open source ni commerciale Chercher à répondre à des besoins simples avec des solutions simples Le modèle d’organisation des données fait une partie du travail
  • 23. Premiers plans Si vous avez besoin d’un data lake, bien étudier les besoins, et comprendre les forces et faiblesses des solutions big data dans votre contexte Se fixer quelques objectifs pour les 2 premiers mois : Des sponsors, une offre de services, et un embryon de data lab Un modèle d’organisation des données, documenté dans un wiki Un use case “étendard” en production (SLA réduit) s’appuyant sur un framework testé Une architecture capable de traiter les tout prochains use cases sur la liste … … et une méthodologie pour instruire les suivants
  • 24. Merci