La data nous concerne tous, et les attentes sont considérables, partout dans l’entreprise. Mais elle n’a pas toujours tenu ses promesses.
Les conditions sont réunies pour généraliser ses usages et son adoption, en répondant à ces trois questions :
- Organisation : centraliser ou décentraliser la gestion des données ?
- Architecture : comment établir des fondations souples et pérennes ?
- Gouvernance : comment encadrer et susciter les usages et collaborations ?
2. En route vers l’entreprise data-driven…
… mais la route est longue
92,1%
constatent des
retours sur
investissement
26,5%
considèrent être
“data-driven”
Source : Data and AI Leadership Executive Survey 2022 – New Vantage Partners
73,7%
ont nommé
un CDO
ou eqt
3. Définir les règles du jeu
et instituer les contrôles
pour assurer
l’organisation, la
protection et l’utilisation
Rendre les données
facilement accessibles,
comprises,
échangeables
et réutilisables
Encourager le partage,
briser les silos, mettre la
data au cœur de la
transformation digitale
Faciliter les
collaborations
et le travail
des équipes data et
des consommateurs
Industrialiser les
usages de la data
de manière
homogène, partout
dans l’entreprise
Les défis
Démocratisation Accessibilité Fiabilité et Confiance Simplification Mise à l’échelle
4. Organisation/Etape 1 :
Instaurer la discipline avec la « Data
Office »
Valoriser la
data et
l’analytique
Diffuser
la culture
Définir
la stratégie
data
Innover
avec les
données
Développer
les processus,
plates-formes
et savoir-faire
Assurer
la gouvernance
et la protection de
données
Le bureau
du Chief
Data
Officer
5. Organisation/Etape 2 : décentraliser les
responsabilités (le data mesh)
65% considèrent que les domaines business n’ont pas de responsabilités sur les data
53% considèrent que les domaines business ont une culture data & IT insuffisantes
Responsabilités
par domaine
Plate-forme
self-service
Gouvernance
de données fédérée
et automatisée
Data en tant que
produit
@
Source The future of data architecture 2022 – BARC
6. L’architecture : privilégier le self-service, la
flexibilité et la diversité des usages
Sourcing et
intégration de
données
Catalogage,
et gestion des
données de
référence
Gouvernanc
e,
privacy et
sécurité
Business
Intelligence et
analytique
Qualité
et
observabilité
Data lake
Data warehouse
Data Management & Opérations
Données
brutes
Données
organisées
Données de
référence
Modèles
analytiques
7. Définir un cadre pour la gouvernance et la qualité
Objectifs
1
Méthodes
Rôles
Processus
Technologies
Culture
Ré-utilisation
Collaboration Crowdsourcing Communication Partage
Ingestion Catalogage Préparation Analyse
Supervision
Gestion du cgt Qualité Référencement Mesure
Impact
Sécurité Privacy & conformité Intégration Gestion du patrimoine
Consommateur
Sponsor Responsable Steward Producteur
Intégration
Inspiré par « the path to modern data governance » par Dave Wells/Eckerson Gro
Best Practices
Policies Guides Code de conduite Cartographies
1
1
1
1
1
8. Que retenir de ces data days ?
Retour d’expérience du groupe
Latécoère
10:05
Un data catalog au sein du groupe
Domofrance
11:00
Une architecture hybride pour
Bouygues Construction
11:45
Data Mesh & Logical Data Fabric :
l’intérêt des approches
décentralisées
10:05
Supply Chain en temps réel pour
les containers et wagons
connectés
11:00
Illustration de l’Intelligence Active
Avec Qlik
11:45
La data est devenue une discipline à part entière dans l’entreprise, au travers des organisations.
Mais la route est longue, bien plus longue par exemple que celle qui nous accompagné vers la digitalisation/dématérialisation de nos vies personnelles et professionnelles.
Car, dans le monde de la data, il n’y a pas eu ces Facebook, ces LinkedIn, ces Google, Zoom ou Slack qui ont imposé des nouvelles manières de travailler ou d’interagir.
Pourtant, il y a eu une énorme montée en puissance des compétences, à tel point que le métier de consultant data figure dans le top 25 des métiers les plus recherchés en France selon LinkedIn. On a vu s’installer très tôt tout un écosystème de spécialistes, tant du côté des éditeurs que des cabinets de consultants et intégrateurs. L’innovation a été phénoménale, y compris en France et en Europe. D’ailleurs, je me faisais la réflexion en voyant les partenaires de ces data days : Denodo est né à la Corogne, Qlik à Lund, Talend et la dimension analytique de SAP à Puteaux, Data Galaxy à Lyon, et même Snowflake tient ses racines de deux thésards de l’Université Paris VI.
L’innovation est donc portée de nos mains. Mais, jusqu’à preuve du contraire, il n’y a pas la place pour une solution universelle dans le domaine de la data. Et ce n’est pas souhaitable, car cela reviendrait à créer un nouveau silo, alors que l’on sait que les silos détruisent la valeur de la data.
Réussir son initiative data c’est donc savoir s’approprier cet écosystème pour mettre en place un système sociotechnique spécifique à votre entreprise. La définition d’un système sociotechnique est un réseau tissé entre acteurs économiques et sociaux autour d’un produit ou d’un service et c’est bien là l’enjeu.
Mon constat est que beaucoup d’entreprises ont atteint un niveau de maturité suffisante pour la mise en place d’un tel système car il y a cette prise de conscience de sa valeur potentielle. Mais ce qui est beaucoup plus difficile, c’est de le pérenniser : Parce qu’un système socio technique doit être en perpétuelle évolution, doit favoriser les innovations qui sont cohérentes avec son fonctionnement et bloquer celles qui ne s’y intègrent pas.
Or les innovations sont nombreuses et avec le cloud elles se sont accélérées : dans les 25 dernières années, on a vu se développer les concepts de data warehouse, de Businesss Intelligence, de Big Data, de data gouvernance puis tout s’est accéléré avec le Cloud, la data science, sans parler du tout dernier buzzword dont je reparlerai, le data mesh.
Tous ces concepts sont de potentiels principes fondateurs mais c’est à vous, si vous faites partie d’une task force data, d’en définir les enjeux, le cadre et les modalités d’adoption
Prendre la data par le bon sens : c’est cela qui rend notre travail passionnant, mais difficile.
La notion d’entreprise data driven n’est pas nouvelle. Depuis 30 ans maintenant, nous percevons la valeur de cet actif immatériel, de plus en plus surabondant, et qui permet à nos entreprises et à nos activités de se différencier ou d’opérer avec plus d’efficacité et de précision. Dans la plupart des entreprises, des projets sont été menés avec succès et il y a eu montée en compétence, souvent avec une petite équipe d’éclaireurs, à la périphérie du cœur du business de l’entreprise. Les vagues d’innovation se sont succédées pour accompagner cette montée en compétence, le plus souvent en mode projet.
Mais ce que n’est que récemment qu’on peut percevoir un point d’inflexion, cette bascule qui intervient lorsque la direction générale et les différentes activités business ont compris le champ des possibles et en veulent beaucoup plus. C’est à ce moment là ou l’on cherche à créer une organisation pérenne Beaucoup d’entreprises ont atteint ou atteignent actuellement cette point d’inflexion, avec des niveaux de maturité différents
J’ai pris des chiffres d’une étude de New Vantage Partner, filiale de Wavestone, que je recommande fortement, même si les chiffres sont forcément biaisés, car l’étude a été adressé à des grands comptes, essentiellement aux Etats Unis, et donc à priori ayant un niveau de maturité élevé sur la data. Donc ils montrent une tendance.
L’étude indique clairement cette prise de conscience sur les enjeux business, avec plus de 90% des participent qui mettent en avant les retours sur investissements de leurs initiatives data. Elle indique que presque ¾ des participants ont nommé un chief data officer ou équivalent. Ce qui est surtout à retenir est que ce taux était de 12% il y a dix ans.
Une autre étude de Strategy& indique qu’en Europe, 26% des entreprises ont nommé un CDO. Les secteurs de la banque, de l’assurance et des médias étant en pole position.
Donc, on voit bien le cap visé qui vise à rapprocher la data du business et des comités de direction, à lui donner plus d’envergure et la pérenniser
Mais, l’étude montre aussi que la route est longue. 60% des entreprises considèrent que le CDO doit encore démontrer son succès et sa pérennité dans l’organisation. Seul ¼ de ces grandes entreprises considèrent qu’elles sont data-driven et 20% qu’elles ont acquis une culture de la data.
73.7% vs 12% EN 2012
59,8% de ces organisations considèrent néanmoins que le rôle de Chief Data and Analytics Officer est encore naissant et 44,2% d’entre elles ont dû faire face à un turnover important sur ce poste.
#3 / Les entreprises continuent de lutter pour devenir « data-driven » puisque seulement 26,5% d’entre elles déclarent avoir atteint cet objectif.
#4 / Les obstacles culturels demeurent les plus critiques pour la mise en place d’une gestion stratégique de l’entreprise par la donnée, 91,9% des répondants estimant qu’il s’agit du principal défi à relever.
Quels sont les défis ?
Le premier est celui de la démocratisation. On a vécu une vague massive de professionnalisation : même s’ils restent difficiles à trouver, on a des data analysts, des data engineers, des data scientists, et on en trouvera de plus en plus. Ce qu’il reste à faire, c’est rendre la data aussi facile à consommer que le contenu sur Internet ; surtout de faire en sorte que tout un chacun ait le réflexe d’aller chercher des data points pour planifier, mesurer, améliorer, alerter, etc.
D’un point de vue technique et organisationnel, cela signifie qu’il faut rendre les données plus facilement accessibles, les documenter, faciliter leur utilisation, leur partage et leur réutilisation sous des formes diverses. C’est tout l’enjeu du self-service. Répondre à cet enjeu est devenu plus compliqué en raison de la diversification des usages. Un data scientist aura des besoins différents qu’un opérationnel, un développeur d’application ou un client. J’évoquerai d’ailleurs tout à l’heure ce concept de data product qui vise à packager la data de manière à la rendre consommable. Personnellement, j’aime bien cette l’idée, car par le passé, nous avons à mon avis échoué en nous nous en remettant à des outils. Des outils de business intelligence, de MDM, des catalogues. Bien sûr qu’on a besoin d’outils, mais ça ne suffit pas ; il faut consacrer plus de temps à documenter, catégoriser la donnée, la rendre plus facile à consommer.
Le troisième défi, c’est celui de la fiabilité et de la confiance. La qualité, c’est le tendon d'Achille des projets data, et pour être honnête, c’est un peu notre faute, car on n’a pas été assez exigeants sur ce point au départ. Par le passé, on a plutôt privilégié l’innovation, le design, les nouveaux projets, au détriment des opérations, on s’est dit qu’on verra ça après. Et donc c’est un gros point de vigilance, on a besoin de plus de rigueur, de mettre en place des règles du jeu, des SLA, des systèmes de surveillance. C’est un point essentiel, un exercice difficile, mais un facteur clé de succès. On a a parlé en préparant cette journée avec Nicolas à propos d’un de leur plus gros client et de cette étape difficile à franchir mais essentiel pour leur succès.
Il y aussi un besoin de simplification. C’est à mon sens un retour du bâton de la période initiale du big data. Parce qu’on souhaitait de diversité dans les données et dans les usages, et qu’on voulait aller vite, on est un peu revenu en arrière en partageant des données brutes et en mettant à disposition des outils très techniques pour les exploiter. J’ai l’impression qu’on revient à des choses plus simples. Par exemple, j’entends de plus en plus souvent parler de minimisation de la données, une idée qui est au cœur de RGPD. Mais cette idée de sobriété numérique est en train de vers son chemin,
Enfin, et ça s’applique surtout quand vos initiatives data ont déjà fait leur preuve, il y a cet enjeu de mise à l’échelle. On a vu aujourd’hui la diversité des cas d’usage, des contextes d’entreprise. Souvent la réussite des projets data passe par une équipe de choc qui crée la dynamique. Et il est aussi fréquent que le leader de cette équipe choc quitte l’entreprise, tout retombe comme un soufflé. Le point d’inflexion dont je parlais en intro impose de passer cette étape, d’’ou l’importance de l’organisation data dont je vais parler par la suite
Du côté de l’organisation, beaucoup d’entreprises choisissent de passer par la création d’une data office centralisé.
Son rôle est d’abord de définir la stratégie et la feuille de route, ce que la data peut apporter dans l’entreprise face à ses enjeux business et comment s’organiser pour rendre cela effectif. Le but est aussi de progresser dans l’échelle de maturité en identifiant les faiblesses et les axes souhaités d’amélioration
Il doit mettre en place les mécanismes pour permettre de valoriser la data, prioriser les initiatives et créer la task force sur l’analytique, en s’appuyant sur des équipes pluridisciplinaires, qui ne lui reportent pas nécessairement et qui embarque les utilisateurs le plus tôt possible
Il est clairement en charge de la gouvernance, c’est le rôle le plus compliqué car il faut à la fois être un agent du changement et un contrôleur, voire un empêcheur de tourner en rond. Et le paradoxe c’est que pendant ces dernière années, le rôle défensif sur les données a eu tendance a augmenter, il faut sabvoir faire des compromis entre protéger les données et les exploiter
Il doit développer les savoir faire sur la data, les plates formes, les méthodes.
Il est aussi en charge d’innovation, au travers d’un data lab qui est le lieu où l’on peut expérimenter de nouvelles idée ou de nouveaux cas d’usage en mode « try and fail »
Enfin , le rôle est de diffuser la culture data dans l’entreprise. Dans le digital, on a vu l’émergence du rôle de Chief Digital Officer. Mais le paradoxe, c’est que beaucoup ont disparu parce qu’ils avait bien fait leur boulot : on a considéré que la transformation numérique avait réussi et que chacun se l’était approprié dans l’entreprise.
Pour la data, la transformation est plus longue, mais il y a des signes qui indiquent que les entreprises les plus avancées penchent vers plus de décentralisation
Et c’est pourquoi on entend beaucoup parler de data mesh en ce moment : pas seulement parler, du reste, il y a de belles réussites en la matière. Le concept a été introduit en 2019 par une consultante, qui a mis un coup de pied dans la fourmilière de l’écosystème data avec l’idée de remettre le métier au centre des initiatives data, et donc de décentraliser, d’amener les équipes data vers le business plutôt que le contraire. Car c’est souvent là que la bas blesse. Je cite ici une étude de BARC qui indiquent que les responsalbiités sur le data sont restées très
Donc l’idée c’est de déléguer les responsabilités aux grands domaines fonctionnels en s’inspirant de démarche utilisée dans le software.
Autre idée force emprunté au monde du software, celle de packager les data comme des packages unitaires et standards réutilisables gérer des products, c’est avec un roadmap, un documentation, des service level agreements, etc.
Ca ce sont les deux idées empruntées aux architecture software qui amènent une rupture. Et pour les appliquer au monde de la data il faut tout d’abord que ces data products soient accessible en mode libre service, donc on revient à la démocratisation et l’accessibilité dont j’ai déjà parlé et qui n’est pas nouveau en soit mais qui est d’autant plus nécessaire si les data products sont créés de manière plus décentralisée
Et puis, il y a toujours, et même encore plus un besoin de gouvernance puisque plus on décentralise les responsabilité plus on a besoin de contrôle et de supervision. Don on parle de gouvernance fédérée et aussi automatisée.
Voilà les bases sont là, c’est un peu comme au début du data warehouse quand Bill Inmon et Ralph Kimball ont posé des principes fondateurs qu’il n’a pas fallu prendre comme argent comptant mais qui on permis d’avancer et de donner un cadre à tout un écosystème.
Un point très important à considérer c’est d’avoir la masse critique. Amener les équipes data vers le business dans une organisation par domaine, c’est pas si simple parce qu’ils ne sont pas forcément, c’est aussi que ça. Donc est ce que votre organisation est prête pour metrre en œuvre ce type de concept, ce n’est pas sur. Et il ya aussi ce principe indispensable de gouvernance fédérée et automatisée qui aussi est plus facile à énoncer qu’à mettre en pratique. Donc c’est pour ça que je considère que le data mesh, c’est un concept très intéressant, mais c’est pas du tout une mode, c’est une façon de s’organiser vers lequel on va progressivement s’orienter au fur et à mesure que la discipline data s’est installé dans l’entreprise. Ne commencez pas ça si votre niveau de maturité est faible
L’architecture est le deuxième facteur clé de succès que j’ai voulu souligner. Il faut un socle pour le data management et la gestion des opération
Ca ne veut pas forcément dire une plate-forme unique et centralisée, ce qui est important c’est de pouvoir accéder aux données, les modéliser, les référencer, les catégoriser… et aussi de répondre aux différents cas d’usage autour de la business intelligence et de l’IA.
Le cloud s’est imposé car il a apporté beaucoup de souplesse et de flexibilité. Prenez l’exemple de Traxens, une start up d’e moins de cent personnes qui grâce au cloud peut s’appuyer sur une plate-forme haut de gamme, potentiellement partager ses données avec ses clients, etc. Ca n’interdit pas les architectures hybrides, mais il faut avoir de sérieux arguments pour prendre l’exploitation de ce type de plate-forme à sa charge. La plate-forme doit permettre de partager différents types de data, certaines très packagées et dédiés à des cas d’usage précis, d’autres très standardisées pour être réutilisées au travers des use case, d’autres plus brutes pour de la découverte.
La plate-forme doit permettre le sourcing et l’intégration de données, qui reste en général une fonction de back office, pour les équipes de DataOps. En aval elle permet une accès en libre service avec des outils de business intelligence et pour de l’analyse plus sophistiquée
Mais la dimension souvent manquante, celle sur lequelle il conviendra de plus en plus de miser, c’est celle qui apparait dans le trois ronds du milieu au milieu. c’est à ce niveau que l’on voit le plus d’innovation technologique. Les fonctions de gestion d’accès, de provisioning de data, de masking, de référencement des données personnelles. Le catalogue de données est un composant crucial pour l’accessibilité, mais aussi pour la gouvernance, car il assure la traçabilité des données.
Le troisième facteur clé de succès, c’est la gouvernance, j’en ai d’ailleurs déjà pas mal parlé.
Quand le numérique n’a pas de règle, on sait que ça peut très mal se passer, il suffit de regarder ce qui est en train de se passer avec Twitter.
Comment par définir les objectifs : pourquoi dout on gouverner les données
Puis définir les méthodes utilisées
🎯 Atelier Denodo - Data Mesh & Logical Data Fabric : L’intérêt des approches décentralisées pour faciliter et accélérer les usages et le Data Management.🎯 Atelier SAP - Retour d’expérience du groupe Latécoère sur l’implémentation de la solution SAP Analytics Cloud.🎯 Atelier Snowflake - Présentation de la solution Snowflake et retour d’expérience de Traxens sur le processus de Supply Chain en temps réel pour les containers et wagons connectés.🎯 Atelier DataGalaxy - Témoignage de Domofrance sur la mise en place d’une nouvelle stratégie de datacatalog au sein du groupe.🎯 Atelier Talend - Retour d’expérience de Bouygues Construction sur la gestion des données de son architecture hybride avec la solution Talend.🎯 Atelier Qlik - Illustration de l’Intelligence Active à travers une présentation et une démo Qlik.
Drive Industry Innovation
Advanced Intelligence to transform customer engagement
Brings together multichannel engagement, commercial content, customer data, and artificial intelligence to drive smarter, compliant interactions with all customers across all channels
Leverage community
Network with your peers
Share best practices with global customers with users in 165 countries
Develop new industry partnerships across sponsors, CROs, and sites.
Opportunities: annual Commercial & Medical Summit – June 8-10, 2020 and a series of local community meetings in Boston, Philadelphia, Chicago, New Jersey in September 2019
Leverage expertise
Enhance value through robust ecosystem of partners
Implementation, managed services, and best practices with team of global subject matter experts
La data est devenu une discipline à part entière dans l’entreprise, au travers des organisations.
Mais la route est longue, bien plus longue par exemple sde celle qui nous amené à la digitalisation/dématérialisation de nos vies personnelles et professionnelles.
Car, il n’y a pas eu de Facebook, de Linkedin, de Google, de Zoom ou de Slack qui ont imposé des nouvelles manières de travailler ou d’interagir.
Il y a pourtant eu une très forte montée des compétences, à tel point que le métier de consultant data figure dans le top 25 des métiers les plus recherchés en France selon Linkedin. On a vu tout un écosystème de spécialistes se créer, tant du côté des éditeurs et des cabinets de consultants et intégrateurs. L’innovation a été phénoménale, y compris en Europe. D’ailleurs, je me faisais la réflexion en voyant les partenaires de ces data days : Denodo est né à la Corogne, Qlik à Lund, Talend et la dimension analytique de SAP à Puteaux, Data Galaxy à Lyon, et même Snowflake tient ses racines de deux thésards de l’Université Paris VI.
L’innovation est à portée de nos mains. Mais, jusqu’à preuve du contraire, il n’y a pas la place pour une solution universelle dans le domaine de la data car cela reviendrait à créer un silo, alors que l’on sait que les silos détruisent la valeur de la data
Réussir son initiative data c’est donc savoir s’approprier cet écosystème pour mettre en place un système socio-technique spécifique à votre entreprise. Mon constat est que beaucoup d’entreprises ont atteint un niveau de maturité suffisante pour la mise en place d’un tel système car il y a cette prise de conscience de sa valeur potentiel. Mais ce qui est beaucoup plus difficile, c’est de le pérenniser : la définition d’un système socio technique est qu’il doit doit favoriser les innovations qui sont cohérentes avec son fonctionnement et bloquer celles qui ne s’y intègrent pas.
Or les innovations sont nombreuses: dans les 25 dernières années, on a vu se développer les concepts de data warehouse, de Businesss Intelligence, de Big Data, de data gouvernance puis tout s’est accéléré avec le Cloud, la data science, sans parler du tout dernier buzzword dont je reparlerais, le data mesh.
Tous ces concepts sont de potentiels principes fondateurs mais c’est à vous, si vous vous partie de la task force data, d’en définir les enjeux, le cadre et les modalités d’adoption
Prendre la data par la le bon sens : c’est cela qui rend notre travail passionnant, mais difficile
--------------