ÉCOSYSTÈME DATA &
IAET LES RÔLES CLÉS
Leading with Advanced Analytics & AI – Séance 2
Introduction aux rôles et à la gouvernance des
données
2.
DEVENIR
DATA-CENTRIC/DRIVEN
Les données doiventêtre gérées
et gouvernées comme un actif
stratégique de l’entreprise.
Les bonnes pratiques de gestion
des données doivent être
encouragées à travers toute
l'organisation.
3.
GOUVERNANCE DE DONNÉES
•La gouvernance des données implique de gouverner, c’est-à-
dire :
• Définir les principes de gouvernance (organisation,
responsabilités, politiques, procédures, règles et standards)
permettant
• une gestion efficace des données de l’entreprise.
• Mettre en œuvre ces principes et contrôler leurs applications
pour atteindre les objectifs (tirer profit du patrimoine data de
l’entreprise).
GERER LES SOURCES
•Sources: saisies, IoT, ERP, web scraping, customer …
• Risques:
• Duplication
• Inconsistance (pas de single source of truth)
• Ambigüité
8.
VALIDER EN ENTRÉE
•Les données doivent être valide en entrée
• Les données ne doivent pas seulement être validées et
nettoyées. Elles doivent aussi :
• Être synchronisées avec les données internes (y compris
l'historique)
• Être anonymisées ou obfusquées lorsque nécessaire
• Être étiquetées avec des métadonnées
9.
CLASSER LES DONNÉES
•Les entreprises utilisent des données venant de différentes sources (ventes,
clients, production, etc.). Si ces données ne sont pas bien organisées, elles
deviennent difficiles à analyser et à exploiter correctement.
• On peut les organiser selon plusieurs critères :
1.Par type : Données structurées (bases de données SQL), semi-structurées (JSON,
XML), non structurées (emails, vidéos, images).
2.Par usage : Données opérationnelles (utilisées au quotidien), analytiques
(servant aux décisions stratégiques).
3.Par provenance : Données internes (générées en entreprise) ou externes
(provenant de fournisseurs, partenaires, réseaux sociaux).
4.Par sensibilité : Données publiques, internes, confidentielles ou personnelles
(RGPD).
10.
DO THE HOUSEKEEPING
✅ Mettre en place des filtres pour ne garder que
les données utiles.
✅ Définir une politique de rétention claire (quand
supprimer ou archiver les données).
✅ Automatiser la suppression des données
périmées ou non nécessaires.
11.
DO THE HOUSEKEEPING
✅ Mettre en place des filtres pour ne garder que
les données utiles.
✅ Définir une politique de rétention claire (quand
supprimer ou archiver les données).
✅ Automatiser la suppression des données
périmées ou non nécessaires.
12.
CURATION DE DONNÉES
Ellevise à rendre les données exploitables de manière efficace et
cohérente pour tous les utilisateurs.
✔ Assurer l’accessibilité : Les utilisateurs doivent savoir où trouver
les données.
✔ Faciliter la compréhension : Les données doivent être bien
documentées pour éviter les erreurs d’interprétation.
✔ Garantir la fiabilité :Toute personne qui utilise une donnée doit
être sûre qu’elle est correcte, à jour et alignée avec la vérité unique
("single source of truth").
✔ Gérer les responsabilités : Identifier le propriétaire de la donnée
(Data Owner) pour toute modification ou clarification.
✔ Optimiser la réutilisation : Éviter la duplication en s’appuyant sur
les usages déjà établis par d’autres.
13.
UTILISATION DE DONNÉES
•Usage operationnel (gestion de stock, planning de production …)
• Key Performance Indicators (KPIs)
• Rapports
• Analytics (AI, Data Science, ML)
• Robotic Process Automation (RPA) (facture, suivi clients etc)
• Support d'audit
• Test de nouveaux produits (Tests de nouveaux outils logiciels, model
IA etc …)
DATA OFFICE
Chief DataOfficer
Ne pas confondre avec la Data science team lead
Le Chief Data Officer est un rôle
stratégique qui permet de transformer les
données en un atout majeur pour
l'organisation. En dirigeant la gestion,
l'exploitation et la gouvernance des
données, le CDO assure que l'organisation
tire parti de ses ressources data pour
améliorer la prise de décision, l'innovation
et la compétitivité.
• Définir la stratégie
de gestion des
données
• Assurer la
gouvernance des
données
• Favoriser
l'innovation et
l'analyse des
données
• Surveiller les
tendances et les
évolutions
technologiques
16.
DATA OFFICE
Data Architect
Lerôle d'un Data Architect est de
concevoir, structurer et gérer les systèmes
de données d'une organisation afin de
garantir qu'ils sont efficaces, évolutifs et
bien adaptés aux besoins de l'entreprise. Il
joue un rôle clé dans la construction de
l'infrastructure des données, assurant que
les informations soient accessibles, fiables
et bien organisées.
• Conception de
l'architecture des
données
• Développement
de bases de
données robustes
• Garantir la
performance et
l'évolutivité des
systèmes de
données
• Documentation de
l'architecture des
données
17.
DATA OFFICE
Data scientist
Lerôle du Data Scientist est de
transformer les données en insights
précieux en utilisant des techniques
statistiques, d'apprentissage automatique
(machine learning), d'intelligence
artificielle (IA) et de modélisation. Il
cherche à comprendre les tendances sous-
jacentes et les relations dans les données, et
à fournir des prédictions ou des
recommandations basées sur des modèles
complexes.
• Analyse
explorative des
données
• Préparation des
données
• Modélisation
statistique et
apprentissage
automatique
• Validation et
évaluation des
modèles
• Interprétation des
résultats
Résolution des problèmes complexes-
compétences techniques et une bonne
compréhension du business.
18.
DATA OFFICE
Data Analyst
Lerôle d'un Data Analyst est essentiel pour
transformer les données brutes en
informations précieuses que les
organisations peuvent utiliser pour
améliorer leurs performances et prendre
des décisions éclairées. Ils servent de lien
entre les besoins métiers et les solutions
techniques liées aux données, en s'assurant
que les données sont propres, bien
structurées et présentées de manière
significative pour l'analyse.
• Profilage,
Nettoyage et
Transformation
des Données
• Intégration de
l'Analyse Avancée
dans les Rapports
• Visualisation &
Reporting
• Data storytelling
19.
DATA OFFICE
Data Engineer
UnData Engineer est responsable de
l'intégration, de la transformation et de la
consolidation des données provenant de
différents systèmes, qu'ils soient structurés
ou non structurés, pour les rendre adaptées
à la construction de solutions d'analyse.
Voici une explication plus détaillée du rôle
du Data Engineer :
• Integration de
données
• Conception et
Maintenance des
Pipelines de
Données
• Stockage des
Données
• Data storytelling
DATA GOVERNANCE TEAM
DataSteward
Data Stewards: parmi les sachants internes
de l’entreprise qui peut faire valoir leur
maîtrise des processus, des données
métiers et du legacy.
Le Data Steward RH s'assure que les dossiers
des employés sont correctement saisis et
cohérents.
Opérationnel
Qualité des données, Cohérence, &
Conformité
Nettoie les données, assure la cohérence,
applique les politiques de gouvernance.
23.
DATA GOVERNANCE TEAM
Dataowner
Le Data Owner est une personne ou un
groupe au sein de l'organisation qui est
responsable de la gestion stratégique des
données.
Le responsable RH
possède les
données des
employés et définit
les politiques de
confidentialité.
Senior –
directeur –C level
Définir la politique, stratégie-
gouvernance
Controller l’accès -Confidentialité
24.
RÉSUMÉ ET DISCUSSION
•- Gérer et gouverner les données
• - Gestion de données un sport collectif
• Discussion : Quels défis rencontrez-vous actuellement dans la
gestion de vos données?
• Où en êtes-vous actuellement dans la gestion de vos données
et de leur gouvernance au sein de votre organisation ?
#1 La numérisation exponentielle de notre économie, les avancées technologiques majeures récentes et les possibilités de valorisation offertes par les outils d’analyse et d’Intelligence Artificielle sont des facteurs qui renforcent l’importance de la data, considérée comme l’un des actifs les plus importants d’une organisation. Il devient urgent pour les entreprises d’apprendre à maîtriser et exploiter ce capital data
#2 Dans une organisation data-driven, les données ne sont pas simplement un sous-produit des opérations, mais un véritable actif stratégique qui doit être géré avec le même soin que les ressources financières ou humaines. Cela signifie :
Définir des politiques de gouvernance des données pour assurer leur qualité, leur accessibilité et leur sécurité.
Mettre en place des rôles dédiés (Data Owners, Data Stewards) pour superviser la gestion des données.
Valoriser les données en les intégrant dans les décisions stratégiques et en cherchant à monétiser ou optimiser leur utilisation.
L’adoption d’une culture axée sur les données ne doit pas être limitée à la DSI ou à une équipe Data spécifique. Chaque département (marketing, finance, opérations, RH, etc.) doit être impliqué et responsabilisé. Cela implique :
Sensibiliser et former les collaborateurs sur l’importance des données et des meilleures pratiques.
Standardiser les processus de collecte, de stockage et d’analyse des données pour garantir leur cohérence et leur fiabilité.
Mettre en place des incitations (récompenses, KPIs, reconnaissance interne) pour encourager les équipes à adopter et respecter les bonnes pratiques en matière de gestion des données.
#3 Les données ne sont plus de sous-produit des operations
#6 Data doesn’t fall from the sky. It is captured or acquired, managed, stored, transformed, forwarded, and it finally gets used. None of these steps should be looked at in isolation, as they strongly depend on each other. This is also why an organization’s Data Office should be responsible for the entire lifecycle of data. I call it the “Data Supply Chain.” Let’s have a look at the seven steps of this Data Supply Chain.
Les données ne sont pas simplement « là ». Une grande partie d’entre elles sont créées de manière intentionnelle par votre organisation, certaines sont acquises, et parfois, elles sont fournies par des tiers. Même lorsqu’elles sont générées en tant que sous-produit, elles peuvent avoir une grande valeur.
Les sources de données typiques sont aussi variées que :
La saisie de données par les employés (via un clavier, la voix, un scanner, une caméra ou d'autres dispositifs)
Les e-mails et messages entrants
L’interprétation d’images de documents papier
Les appareils IoT
Les machines
Les logiciels (par exemple, les fichiers journaux)
Les échanges de données entre organisations
#9 Un site e-commerce collecte :
Des données clients (nom, email, adresse) → Données personnelles
Des commandes (produits achetés, prix, date) → Données transactionnelles
Des avis clients (étoiles, commentaires) → Données non structurées
👉 Si ces données sont bien classées, elles peuvent être facilement exploitées pour améliorer les ventes et l'expérience client
#10 Faire le ménage dans les données (Data Housekeeping)
Lorsqu’une entreprise accumule trop de données sans distinction, il devient difficile d’identifier celles qui ont réellement de la valeur. C’est comme verser un bon vin dans un tonneau rempli d’eau : la qualité est diluée et perdue.
Pourquoi faire du tri dans les données ?
Éviter l’encombrement : Trop de données inutiles compliquent l’analyse et augmentent les coûts de stockage.
Se conformer aux régulations : Certaines lois imposent des durées minimales ou maximales de conservation des données (ex : RGPD en Europe).
Minimiser les risques : Stocker des données personnelles trop longtemps sans raison peut exposer l’entreprise à des sanctions.
#11 Faire le ménage dans les données (Data Housekeeping)
Lorsqu’une entreprise accumule trop de données sans distinction, il devient difficile d’identifier celles qui ont réellement de la valeur. C’est comme verser un bon vin dans un tonneau rempli d’eau : la qualité est diluée et perdue.
Pourquoi faire du tri dans les données ?
Éviter l’encombrement : Trop de données inutiles compliquent l’analyse et augmentent les coûts de stockage.
Se conformer aux régulations : Certaines lois imposent des durées minimales ou maximales de conservation des données (ex : RGPD en Europe).
Minimiser les risques : Stocker des données personnelles trop longtemps sans raison peut exposer l’entreprise à des sanctions.
#12 Faire le ménage dans les données (Data Housekeeping)
Lorsqu’une entreprise accumule trop de données sans distinction, il devient difficile d’identifier celles qui ont réellement de la valeur. C’est comme verser un bon vin dans un tonneau rempli d’eau : la qualité est diluée et perdue.
Pourquoi faire du tri dans les données ?
Éviter l’encombrement : Trop de données inutiles compliquent l’analyse et augmentent les coûts de stockage.
Se conformer aux régulations : Certaines lois imposent des durées minimales ou maximales de conservation des données (ex : RGPD en Europe).
Minimiser les risques : Stocker des données personnelles trop longtemps sans raison peut exposer l’entreprise à des sanctions.
#13 robots logiciels pour automatiser des tâches répétitives, souvent basées sur des données. Par exemple :
Traitement des factures : Un robot peut extraire les informations des factures et les saisir dans un système de gestion des finances.
Suivi des demandes clients : Automatisation du suivi et de la gestion des tickets de support.
#14 Vous avez une entreprise, ce qui signifie que des clients ont effectué des transactions avec elle. Chaque transaction génère des données : contrats, commandes, factures, et peut-être des remboursements et des crédits. En stockant ces informations, vous avez créé une base de données de vos clients, contenant leurs noms, adresses, préférences de communication, et bien plus encore.
Vous avez également des employés, ce qui signifie une autre base de données contenant des informations sur leur rémunération, les heures travaillées, leur lieu de résidence et le bureau où ils travaillent, ainsi que leurs compétences et leur expérience.
À un moment donné, vous avez acheté des biens et des services pour votre entreprise : des matières premières pour la fabrication, de la papeterie, de l’énergie et de l’eau ; vous avez passé du temps au téléphone et loué un bureau. Tous ces enregistrements deviennent vos données.
Vous avez lancé vos propres produits et services après les avoir étudiés, développés et mis sur le marché. Vous avez rédigé des communiqués de presse, publié vos comptes et mis à jour vos sites web, générant encore plus de données.
Vos concurrents ont fait de même, et vous avez stocké des informations à leur sujet. Vos clients et des journalistes ont évalué vos produits et en ont parlé sur les réseaux sociaux, générant encore plus de données exploitables.
Toutes ces informations, et bien d’autres que vous capturez chaque jour, constituent ce que nous appelons les données.
#17 La transformation des données (normalisation, encodage des variables catégorielles, création de nouvelles fonctionnalités).
En résumé, la définition que vous donnez décrit bien les responsabilités et les compétences d'un Data Scientist. Ce dernier aide une organisation à comprendre ses données et à utiliser celles-ci de manière stratégique pour résoudre des problèmes complexes, souvent en exploitant des méthodes avancées comme l'apprentissage automatique et l'IA, tout en combinant des compétences techniques et une bonne
#18 La transformation des données (normalisation, encodage des variables catégorielles, création de nouvelles fonctionnalités).
Convertir les données dans un format adapté à l'analyse.
En résumé, la définition que vous donnez décrit bien les responsabilités et les compétences d'un Data Scientist. Ce dernier aide une organisation à comprendre ses données et à utiliser celles-ci de manière stratégique pour résoudre des problèmes complexes, souvent en exploitant des méthodes avancées comme l'apprentissage automatique et l'IA, tout en combinant des compétences techniques et une bonne
#19 créer des structures de données cohérentes et intégrées
Le Data Engineer est un maillon clé de la gestion des données au sein d'une organisation. Il construit et maintient l'infrastructure nécessaire pour permettre l'intégration, la transformation et l'utilisation efficace des données, tout en garantissant leur qualité et leur accessibilité. Sa collaboration avec les équipes techniques et métiers permet de garantir que les données sont prêtes à être exploitées par les équipes de Data Science, d'analytique et autres acteurs du Data Office.
#20 créer des structures de données cohérentes et intégrées
Le Data Engineer est un maillon clé de la gestion des données au sein d'une organisation. Il construit et maintient l'infrastructure nécessaire pour permettre l'intégration, la transformation et l'utilisation efficace des données, tout en garantissant leur qualité et leur accessibilité. Sa collaboration avec les équipes techniques et métiers permet de garantir que les données sont prêtes à être exploitées par les équipes de Data Science, d'analytique et autres acteurs du Data Office.
#21 créer des structures de données cohérentes et intégrées
Le Data Engineer est un maillon clé de la gestion des données au sein d'une organisation. Il construit et maintient l'infrastructure nécessaire pour permettre l'intégration, la transformation et l'utilisation efficace des données, tout en garantissant leur qualité et leur accessibilité. Sa collaboration avec les équipes techniques et métiers permet de garantir que les données sont prêtes à être exploitées par les équipes de Data Science, d'analytique et autres acteurs du Data Office.
#22 La transformation des données (normalisation, encodage des variables catégorielles, création de nouvelles fonctionnalités).
En résumé, la définition que vous donnez décrit bien les responsabilités et les compétences d'un Data Scientist. Ce dernier aide une organisation à comprendre ses données et à utiliser celles-ci de manière stratégique pour résoudre des problèmes complexes, souvent en exploitant des méthodes avancées comme l'apprentissage automatique et l'IA, tout en combinant des compétences techniques et une bonne
#23 Il définit les politiques et les règles d'accès aux données, en s'assurant que celles-ci sont alignées avec les objectifs commerciaux et les exigences légales. Le Data Owner prend des décisions concernant la sécurité, la confidentialité et la conformité des données tout en étant chargé de garantir qu'elles sont utilisées de manière optimale pour atteindre les objectifs de l'entreprise.
En résumé, la définition que vous donnez décrit bien les responsabilités et les compétences d'un Data Scientist. Ce dernier aide une organisation à comprendre ses données et à utiliser celles-ci de manière stratégique pour résoudre des problèmes complexes, souvent en exploitant des méthodes avancées comme l'apprentissage automatique et l'IA, tout en combinant des compétences techniques et une bonne