SlideShare une entreprise Scribd logo
1  sur  25
C1 - Public
©Tous droits réservés - Copyright EVA Group
Efficient and secure IT for
business
Panorama des
acteurs de la
data 2021
Méthodologie pour réussir vos projets
data
28 Septembre 2021
Paris
C1 - Public
2
©Tous droits réservés - Copyright EVA Group
SOMMAIRE
Qui sommes-nous ?
Point de départ !
Déroulement d'un projet data
Typologie de projets
À retenir
C1 - Public
3
©Tous droits réservés - Copyright EVA Group
Qui sommes nous ?
Responsable offre
Data & Decision
Consultant senior
Data
Valentin Bourget Bruno Seznec
C1 - Public
©Tous droits réservés - Copyright EVA Group
MA SUPER SECTION
Qui sommes-nous ?
C1 - Public
5
©Tous droits réservés - Copyright EVA Group
Qui sommes-nous ?
C1 - Public
©Tous droits réservés - Copyright EVA Group
Point de départ !
C1 - Public
7
©Tous droits réservés - Copyright EVA Group
Point de départ !
C1 - Public
8
©Tous droits réservés - Copyright EVA Group
Point de départ !
Les trois éléments clés:
C1 - Public
©Tous droits réservés - Copyright EVA Group
Déroulement
d'un projet data
C1 - Public
10
©Tous droits réservés - Copyright EVA Group
Déroulement d'un projet data : Les étapes
Le parcours est itératif et
incrémental !
Cadrage
Acquisition /
Organisation de la
donnée
Modélisation
Déploiement ,
ML Ops
Data
Modélisation
Déploiement
Bilan
Cadrage
C1 - Public
11
©Tous droits réservés - Copyright EVA Group
Déroulement d'un projet data : étape 1
 Qui : le métier, direction générale, Data Stewart, Data manager, CDO, CPO
 Comment : Séparer les aspects métiers et les aspects Data Science / Technique. Faire plusieurs réunions de faisabilité
et cadrage temps des sprints, Indicateurs clés , ROI potentiel…
 Méthodologie : Idéation, Design Thinking, Benchmarking
 Résultats : Matrice de décision entre plusieurs projets, Critère d’acceptation / réussite
Cadrage
Acquisition /
Organisation de la
donnée
Modélisation
Déploiement ,
ML Ops
C1 - Public
12
©Tous droits réservés - Copyright EVA Group
Déroulement d'un projet data : étape 2
 Qui : Data Engineer, Data Scientist, Data Owner, Data Steward, CDO, CPO
 Comment :
 Etape 1 Collecte ;
 Etape 2 Labellisation , Organisation , Feature Engineering
 Outillage : Data Catalogue , Feature Store, Versionning, Reproductibilité , Passage à l’échelle (Big Data), Batch ou
Streaming
 Résultats :Données normalisées , versionnées, lignage, conformes aux réglementations applicables, avoir une baseline
Cadrage
Acquisition /
Organisation de la
donnée
Modélisation
Déploiement ,
ML Ops
C1 - Public
13
©Tous droits réservés - Copyright EVA Group
Déroulement d'un projet data : étape 3
 Qui : Data Scientist, Data Engineer, Métier
 Comment :
 Etape 1 Sélection et entrainement de modèles ;
 Etape 2 Analyse de la performance, précision (ML supervisé), Analyse des erreurs (impact)
 Outillage : Librairies Open source ou propriétaires, Studio de Data Science,
 Résultats : Modèle entrainé, optimisé suivant les contraintes de déploiement, explicabilité
Cadrage
Acquisition /
Organisation de la
donnée
Modélisation
Déploiement ,
ML Ops
C1 - Public
14
©Tous droits réservés - Copyright EVA Group
Déroulement d'un projet data : étape 4
 Qui : ML Engineer, Data Engineer, Data Scientist , (Dev)Ops,
 Comment :
 Etape 1 Déploiement, API fication
 Etape 2 Connexion avec un le Data Product : App Mobile, App Web
 Etape 3 Monitoring et Maintenance (MLOps)
 Outillage : Librairies Open source ou propriétaires, Studio de Data Science,
 Résultats : Data Product et modèles instrumentés, ROI , KPI en dashboard
Cadrage
Acquisition /
Organisation de la
donnée
Modélisation
Déploiement ,
ML Ops
C1 - Public
©Tous droits réservés - Copyright EVA Group
Typologie de projets
C1 - Public
16
©Tous droits réservés - Copyright EVA Group
Typologies de projets / Stacks 2012
C1 - Public
17
©Tous droits réservés - Copyright EVA Group
Typologies de projets / Stacks 2021
C1 - Public
18
©Tous droits réservés - Copyright EVA Group
EVA Data Quadrant
Rapidité à
délivrer
Coûts : Logiciel,
Matériel, RH
On premise
FRAMEWORK OPEN SOURCE
Bare metal
SERVICE MANAGÉ
DATA STUDIO EN MODE SAAS
Openstack (Iaas)
Scikit-Learn
TFX
Pytorch
Tensorflow
Jupyter Lab Neptune.ai
Gradient / Paperspace
Weights&Biases
Kedro , kedro-viz
Hugging Face , Spacy
Data Robot
Domino datalab
Dataiku DSS
AWS Sagemaker
Azure ML
GCP Vertex.ai
CDAP , Google Fusion
Pachyderm
C1 - Public
19
©Tous droits réservés - Copyright EVA Group
Différentes manières d’implémenter une
solution data
John DEUF
Directeur des ventes
Eric HOCHET
Directeur des ventes
Vicky NÉPAMORE
Directrice des ventes
C1 - Public
20
©Tous droits réservés - Copyright EVA Group
Cadrage
1
• Nettoyage
• Normalisation
data
2 Développement
desModèles
3
• Déploiement
• MLOps
• Monitoring
4
Framework open source,
Développement à façon
Usecase: prévisiondesventes
John DEUF
Directeurdesventes
C1 - Public
21
©Tous droits réservés - Copyright EVA Group
Services managés
Vicky NÉPAMORE
Directrice des ventes
Use case : prévision des ventes
Cadrage
1
Configuration
des services
managés
2
Préparation des
données ou Data
Préparation
managée
3
Développe
ment de
modèle ou
Auto ML
4 Monitoring
managé
5
C1 - Public
22
©Tous droits réservés - Copyright EVA Group
Cadrage
1 Configuration
studio intégré
2
Déploiement
dans le studio
intégré
3
Typologie de projets / Studio de Data Science
EricHOCHET
Directeurdesventes
Usecase: prévisiondesventes
C1 - Public
©Tous droits réservés - Copyright EVA Group
À retenir
C1 - Public
24
©Tous droits réservés - Copyright EVA Group
À retenir
 Le Cadrage, un grand oublié du projet;
 L’ implication dès le lancement du projet de toutes les parties prenantes est la seule chance de succès;
 Le MLOps fait le buzz, ce sont souvent des questions de bon sens et des bonnes pratiques;
C1 - Public
25
©Tous droits réservés - Copyright EVA Group
Questions ? Suite
 Retrouvez nous sur le stand C20 pour la présentation de nos offres packagées au
forfait :
 AUDACE : Audit Data dans un Contexte Entreprise
 MONA : Monitoring pour l’IA

Contenu connexe

Similaire à Prez ia big_data_bruno_v3_finale

Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesKezhan SHI
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems Excelerate Systems
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data TalendJean-Michel Franco
 
La Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de DenodoLa Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de DenodoDenodo
 
Pyksel & Camptocamp : Connecteur Magento / Open Erp
Pyksel & Camptocamp : Connecteur Magento / Open ErpPyksel & Camptocamp : Connecteur Magento / Open Erp
Pyksel & Camptocamp : Connecteur Magento / Open ErpSwissgento eCom Genève
 
Webinaire Starxpert : Ged transverse avec alfresco
Webinaire Starxpert : Ged transverse avec alfrescoWebinaire Starxpert : Ged transverse avec alfresco
Webinaire Starxpert : Ged transverse avec alfrescoJean Francois DONIKIAN
 
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...drupagora
 
Presentation memoire NGUEREZA Tony-20200731.pptx
Presentation memoire NGUEREZA Tony-20200731.pptxPresentation memoire NGUEREZA Tony-20200731.pptx
Presentation memoire NGUEREZA Tony-20200731.pptxTonyNguereza1
 
Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...
Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...
Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...CERTyou Formation
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationDenodo
 
Catalogue pfe 2018 2019
Catalogue pfe 2018 2019Catalogue pfe 2018 2019
Catalogue pfe 2018 2019TELNETTunisie
 
Nuxeo Summer Seminar 2007 - Micro Research (FR)
Nuxeo Summer Seminar 2007 - Micro Research (FR)Nuxeo Summer Seminar 2007 - Micro Research (FR)
Nuxeo Summer Seminar 2007 - Micro Research (FR)Stefane Fermigier
 
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivitéLe Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivitéOCTO Technology
 
Session en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data VirtualizationSession en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data VirtualizationDenodo
 
Présentation programme OREE
Présentation programme OREEPrésentation programme OREE
Présentation programme OREECYB@RDECHE
 
Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...
Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...
Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...Ametys
 
Ecopy Presentation Microsoft Ex
Ecopy Presentation Microsoft ExEcopy Presentation Microsoft Ex
Ecopy Presentation Microsoft ExUGAIA
 
CV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_FrançaisCV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_FrançaisAbdelaziz Kaddous
 
CV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_FrançaisCV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_FrançaisAbdelaziz Kaddous
 

Similaire à Prez ia big_data_bruno_v3_finale (20)

Nicolas_DINASQUET
Nicolas_DINASQUETNicolas_DINASQUET
Nicolas_DINASQUET
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
La Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de DenodoLa Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
 
Pyksel & Camptocamp : Connecteur Magento / Open Erp
Pyksel & Camptocamp : Connecteur Magento / Open ErpPyksel & Camptocamp : Connecteur Magento / Open Erp
Pyksel & Camptocamp : Connecteur Magento / Open Erp
 
Webinaire Starxpert : Ged transverse avec alfresco
Webinaire Starxpert : Ged transverse avec alfrescoWebinaire Starxpert : Ged transverse avec alfresco
Webinaire Starxpert : Ged transverse avec alfresco
 
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
 
Presentation memoire NGUEREZA Tony-20200731.pptx
Presentation memoire NGUEREZA Tony-20200731.pptxPresentation memoire NGUEREZA Tony-20200731.pptx
Presentation memoire NGUEREZA Tony-20200731.pptx
 
Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...
Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...
Dt205 g formation-using-infosphere-optim-data-growth-for-archiving-on-distrib...
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
 
Catalogue pfe 2018 2019
Catalogue pfe 2018 2019Catalogue pfe 2018 2019
Catalogue pfe 2018 2019
 
Nuxeo Summer Seminar 2007 - Micro Research (FR)
Nuxeo Summer Seminar 2007 - Micro Research (FR)Nuxeo Summer Seminar 2007 - Micro Research (FR)
Nuxeo Summer Seminar 2007 - Micro Research (FR)
 
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivitéLe Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
 
Session en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data VirtualizationSession en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data Virtualization
 
Présentation programme OREE
Présentation programme OREEPrésentation programme OREE
Présentation programme OREE
 
Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...
Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...
Refonte intranet du Conseil Général de la Drôme avec le CMS open source Amety...
 
Ecopy Presentation Microsoft Ex
Ecopy Presentation Microsoft ExEcopy Presentation Microsoft Ex
Ecopy Presentation Microsoft Ex
 
CV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_FrançaisCV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_Français
 
CV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_FrançaisCV_Kaddous_Abdelaziz_2015_Français
CV_Kaddous_Abdelaziz_2015_Français
 

Prez ia big_data_bruno_v3_finale

  • 1. C1 - Public ©Tous droits réservés - Copyright EVA Group Efficient and secure IT for business Panorama des acteurs de la data 2021 Méthodologie pour réussir vos projets data 28 Septembre 2021 Paris
  • 2. C1 - Public 2 ©Tous droits réservés - Copyright EVA Group SOMMAIRE Qui sommes-nous ? Point de départ ! Déroulement d'un projet data Typologie de projets À retenir
  • 3. C1 - Public 3 ©Tous droits réservés - Copyright EVA Group Qui sommes nous ? Responsable offre Data & Decision Consultant senior Data Valentin Bourget Bruno Seznec
  • 4. C1 - Public ©Tous droits réservés - Copyright EVA Group MA SUPER SECTION Qui sommes-nous ?
  • 5. C1 - Public 5 ©Tous droits réservés - Copyright EVA Group Qui sommes-nous ?
  • 6. C1 - Public ©Tous droits réservés - Copyright EVA Group Point de départ !
  • 7. C1 - Public 7 ©Tous droits réservés - Copyright EVA Group Point de départ !
  • 8. C1 - Public 8 ©Tous droits réservés - Copyright EVA Group Point de départ ! Les trois éléments clés:
  • 9. C1 - Public ©Tous droits réservés - Copyright EVA Group Déroulement d'un projet data
  • 10. C1 - Public 10 ©Tous droits réservés - Copyright EVA Group Déroulement d'un projet data : Les étapes Le parcours est itératif et incrémental ! Cadrage Acquisition / Organisation de la donnée Modélisation Déploiement , ML Ops Data Modélisation Déploiement Bilan Cadrage
  • 11. C1 - Public 11 ©Tous droits réservés - Copyright EVA Group Déroulement d'un projet data : étape 1  Qui : le métier, direction générale, Data Stewart, Data manager, CDO, CPO  Comment : Séparer les aspects métiers et les aspects Data Science / Technique. Faire plusieurs réunions de faisabilité et cadrage temps des sprints, Indicateurs clés , ROI potentiel…  Méthodologie : Idéation, Design Thinking, Benchmarking  Résultats : Matrice de décision entre plusieurs projets, Critère d’acceptation / réussite Cadrage Acquisition / Organisation de la donnée Modélisation Déploiement , ML Ops
  • 12. C1 - Public 12 ©Tous droits réservés - Copyright EVA Group Déroulement d'un projet data : étape 2  Qui : Data Engineer, Data Scientist, Data Owner, Data Steward, CDO, CPO  Comment :  Etape 1 Collecte ;  Etape 2 Labellisation , Organisation , Feature Engineering  Outillage : Data Catalogue , Feature Store, Versionning, Reproductibilité , Passage à l’échelle (Big Data), Batch ou Streaming  Résultats :Données normalisées , versionnées, lignage, conformes aux réglementations applicables, avoir une baseline Cadrage Acquisition / Organisation de la donnée Modélisation Déploiement , ML Ops
  • 13. C1 - Public 13 ©Tous droits réservés - Copyright EVA Group Déroulement d'un projet data : étape 3  Qui : Data Scientist, Data Engineer, Métier  Comment :  Etape 1 Sélection et entrainement de modèles ;  Etape 2 Analyse de la performance, précision (ML supervisé), Analyse des erreurs (impact)  Outillage : Librairies Open source ou propriétaires, Studio de Data Science,  Résultats : Modèle entrainé, optimisé suivant les contraintes de déploiement, explicabilité Cadrage Acquisition / Organisation de la donnée Modélisation Déploiement , ML Ops
  • 14. C1 - Public 14 ©Tous droits réservés - Copyright EVA Group Déroulement d'un projet data : étape 4  Qui : ML Engineer, Data Engineer, Data Scientist , (Dev)Ops,  Comment :  Etape 1 Déploiement, API fication  Etape 2 Connexion avec un le Data Product : App Mobile, App Web  Etape 3 Monitoring et Maintenance (MLOps)  Outillage : Librairies Open source ou propriétaires, Studio de Data Science,  Résultats : Data Product et modèles instrumentés, ROI , KPI en dashboard Cadrage Acquisition / Organisation de la donnée Modélisation Déploiement , ML Ops
  • 15. C1 - Public ©Tous droits réservés - Copyright EVA Group Typologie de projets
  • 16. C1 - Public 16 ©Tous droits réservés - Copyright EVA Group Typologies de projets / Stacks 2012
  • 17. C1 - Public 17 ©Tous droits réservés - Copyright EVA Group Typologies de projets / Stacks 2021
  • 18. C1 - Public 18 ©Tous droits réservés - Copyright EVA Group EVA Data Quadrant Rapidité à délivrer Coûts : Logiciel, Matériel, RH On premise FRAMEWORK OPEN SOURCE Bare metal SERVICE MANAGÉ DATA STUDIO EN MODE SAAS Openstack (Iaas) Scikit-Learn TFX Pytorch Tensorflow Jupyter Lab Neptune.ai Gradient / Paperspace Weights&Biases Kedro , kedro-viz Hugging Face , Spacy Data Robot Domino datalab Dataiku DSS AWS Sagemaker Azure ML GCP Vertex.ai CDAP , Google Fusion Pachyderm
  • 19. C1 - Public 19 ©Tous droits réservés - Copyright EVA Group Différentes manières d’implémenter une solution data John DEUF Directeur des ventes Eric HOCHET Directeur des ventes Vicky NÉPAMORE Directrice des ventes
  • 20. C1 - Public 20 ©Tous droits réservés - Copyright EVA Group Cadrage 1 • Nettoyage • Normalisation data 2 Développement desModèles 3 • Déploiement • MLOps • Monitoring 4 Framework open source, Développement à façon Usecase: prévisiondesventes John DEUF Directeurdesventes
  • 21. C1 - Public 21 ©Tous droits réservés - Copyright EVA Group Services managés Vicky NÉPAMORE Directrice des ventes Use case : prévision des ventes Cadrage 1 Configuration des services managés 2 Préparation des données ou Data Préparation managée 3 Développe ment de modèle ou Auto ML 4 Monitoring managé 5
  • 22. C1 - Public 22 ©Tous droits réservés - Copyright EVA Group Cadrage 1 Configuration studio intégré 2 Déploiement dans le studio intégré 3 Typologie de projets / Studio de Data Science EricHOCHET Directeurdesventes Usecase: prévisiondesventes
  • 23. C1 - Public ©Tous droits réservés - Copyright EVA Group À retenir
  • 24. C1 - Public 24 ©Tous droits réservés - Copyright EVA Group À retenir  Le Cadrage, un grand oublié du projet;  L’ implication dès le lancement du projet de toutes les parties prenantes est la seule chance de succès;  Le MLOps fait le buzz, ce sont souvent des questions de bon sens et des bonnes pratiques;
  • 25. C1 - Public 25 ©Tous droits réservés - Copyright EVA Group Questions ? Suite  Retrouvez nous sur le stand C20 pour la présentation de nos offres packagées au forfait :  AUDACE : Audit Data dans un Contexte Entreprise  MONA : Monitoring pour l’IA

Notes de l'éditeur

  1. Ok
  2. Ok