Are Your Data Ready for GDPR? (with MAPR and Talend)
Information management : quand l\'information devient un capital d\'entreprise
1. Information management :
quand l'information devient
un capital d'entreprise
25 mars 2009
Jean-Michel Franco
Directeur des Solutions
Jean-michel.franco@businessdecision.com
2. Gestion de l’information : tout a commencé par l’aide à la décision
Systèmes Systèmes
Transactionnels d’aide à la
décision
Métaphore sectorielle Industrie manufacturière Distribution de détail
(Produire) (amener au consommateur )
Exécuter et manager Gouverner : Planifier, Améliorer,
Usage les processus Superviser, Optimiser les processus
Cible, et canaux pour les Opérationnels, Décideurs, au travers d’outils
“toucher” Au travers applications d’aide à la décision
Commande, factures, Client, compte de résultats,
Objets de gestion manipulés Ordres de fabrication… Indicateurs de performance…
L’essence pour dérouler
Rôle de l’information les processus et applications
Le Cœur du sujet
La pourquoi, le
Le contenu Le quoi comment,
La pièce à conviction
Organisé pour gérer les Organisé pour pouvoir s’agréger par
Niveau de détail transactions : seul le sujet (temps, produit, client…)
détail importe
Mission critique aucune Une tolérance sur la qualité et la
SLA souhaité tolérance en termes de qualité ; disponibilité (temps d’indisponibilité
temps réel, temps de réponse , temps de réponse, qualité de la
immédiat donnée…) mais évolution en cours
3. Une demande qui explose à l’intérieur des organisations
Moyenne 44 39 17
Transactionnel
Mgt & contrôle
Top performers 30 45 25 Stratégie
0% 20% 40% 60% 80% 100%
Aujourd’hui le plus gros des investissements informatiques sont
concentrés sur ce qui ne représente plus que la moitié, voire le
tiers du travail des employés d’une entreprise. Le reste n’est
pas géré sous la responsabilité du système d’information !
3
Sources ASUG
4. Et un besoin de partager l’information, bien au-delà du décisionnel
L’information : un capital à pérenniser
MDM
• Gestion des référentiels comme cadre de travail commun Data quality
• La qualité des données à la source ECM
• La gestion du contenu (structurer la donnée non structurée)
L’information sous la maitrise des fonctionnels
Méta données
• Principes de gouvernance des données Gouvernance et,
• L’informatique est en charge des contenants, les Traceability
« lignes de business » du contenu
Libérer l’information du contexte des transactions
• Information comme un capital indépendant Data Services
• Self Services Self Services
Mashups
• Un nouveau composant du SI
4
5. Une demande qui explose à l’extérieur des organisations
Produits de
Electronique Banque
consommation
Du prestataire de
Du lecteur MP3… D’un équipementier
produits financiers…
de sport…
…Au conseiller …à l’assistant …à un coach
pour les choix de gestion personnel
culturel du budget numérique
Utilities Industrie Secteur public
Des Megawatts… De la fabrication Du service public…
d’avions…
…au Negawatts …au service à
…à le gestion des la carte
Heures de vol
5
6. Et qui pose des questions économiques, sociales et politiques
autour d’un enjeu colossal : la gouvernance de l’information
6
7. Quatre principales raisons pour un projet d’information management (1/4)
1. Éliminer les redondances de données, qui sont causes
d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
4. Rendre l’information clef disponible et accessible à tout
moment.
1 La redondance de données (principalement les données maîtres) dans
plusieurs systèmes les soumet à des règles de gestion qui diffèrent selon
les métiers écarts :
La duplication dans plusieurs systèmes est d’origine historique : au moment de la conception d’un système
nouveau, une donnée cruciale était :
• soit indisponible : on l’a créée ainsi que sa gestion,
• soit incomplète : on l’a recopiée pour ensuite la compléter chez soi,
• soit d’accès difficile ou restreint : on l’a recopiée pour l’avoir sous la main, et on la recopie encore.
Par ailleurs, les entreprises cherchent depuis longtemps à harmoniser et unifier leurs données de référence
(nomenclatures) pour assurer un langage commun entre les métiers (produits, sites ou magasins,
id/password, …).
8. Quatre principales raisons pour un projet d’information management (1/4)
1. Éliminer les redondances de données, qui sont causes
d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
Rendre l’information clef disponible et accessible à tout
La réponse des systèmes d’information
4.
moment.
1 Le Master Data Management
La redondance de données (principalement les données maîtres) dans
plusieurs systèmes les soumet à des règles de gestion qui diffèrent selon
les métiers, entraînant des écarts sur des valeurs essentielles pour
l’entreprise :
La duplication dans plusieurs systèmes est d’origine historique : au moment de la conception d’un système
nouveau, une donnée cruciale était :
• soit indisponible : on l’a créée ainsi que sa gestion,
• soit incomplète : on l’a recopiée pour ensuite la compléter chez soi,
• soit d’accès difficile ou restreint : on l’a recopiée pour l’avoir sous la main, et on la recopie encore.
Par ailleurs, les entreprises cherchent depuis longtemps à harmoniser et unifier leurs données de référence
(nomenclatures) pour assurer un langage commun entre les métiers (produits, sites ou magasins,
9. Quatre principales raisons pour un projet d’information Management (2/4)
1. Éliminer les redondances de données maîtres, qui sont
causes d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
4. Rendre l’information clef disponible et accessible à tout
moment.
2 Le besoin d’évaluer et de certifier la qualité de certaines données clefs
devient pressant :
L’internationalisation des entreprises, la multiplication et/ou le développement de leurs activités, servis par le
progrès des techniques de l’information, induisent un accroissement du volume des données traitées. Cet
accroissement a pour effet secondaire de rendre significatives les marges d’erreur et d’incertitude sur les
données.
La fonction marketing, boostée par la prépondérance du quantitatif dans l’activité des entreprises, met en
exergue un besoin de fiabilisation de l’information relative aux clients, sources de revenus.
Des contraintes réglementaires nouvelles (SOX, Solvency, NRE) motivées par le souhait de rompre avec
l’opacité naturelle des SI, obligent à un traçage des données clefs, à l’enregistrement de pistes d’audit, à
l’explication argumentée des écarts, à la sécurisation des accès et des processus de gestion internes.
La généralisation de la Business Intelligence dans tous les métiers de l’entreprise amène un besoin de
fonder qualitativement les données de décision utilisées au plus haut niveau.
10. Quatre principales raisons pour un projet d’information Management (2/4)
1. Éliminer les redondances de données maîtres, qui sont
causes d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
4. Rendre l’information clef disponible et accessible à tout
La réponse de l’IT
moment.
2 Le besoin d’évaluer et de certifier de données
La qualité la qualité de certaines données clefs
devient pressant :
La data gouvernance
L’internationalisation des entreprises, la multiplication et/ou le développement de leurs activités, servis par
le progrès des
techniques de l’information, induisent un accroissement du volume des données traitées. Cet
accroissement a pour effet secondaire de rendre significatives les marges d’erreur et d’incertitude sur les
données.
La fonction marketing, boostée par la prépondérance du quantitatif dans l’activité des entreprises, met en
exergue un besoin de fiabilisation de l’information relative aux clients, sources de revenus.
Des contraintes réglementaires nouvelles (SOX, Solvency, NRE) motivées par le souhait de rompre avec
l’opacité naturelle des SI, obligent à un traçage des données clefs, à l’enregistrement de pistes d’audit, à
l’explication argumentée des écarts, à la sécurisation des accès et des processus de gestion internes.
La généralisation de la Business Intelligence dans tous les métiers de l’entreprise amène un besoin de
fonder qualitativement les données de décision utilisées au plus haut niveau.
11. Quatre principales raisons pour un projet d’information Management (3/4)
1. Éliminer les redondances de données maîtres, qui sont
causes d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
4. Rendre l’information clef disponible et accessible à tout
moment.
3 Les échanges internes et externes à l’entreprise sont aujourd’hui gérables
informatiquement, et peuvent donc être accélérés conformément à une
logique d’amélioration de la performance :
Le concept d’entreprise étendue ayant maintenant pris corps, les interactions sont désormais
fréquentes et parfois exigeantes en réactivité avec les fournisseurs, prestataires et clients.
La collaboration la plus rapprochée possible de systèmes pourtant espacés dans la chaîne de
valeur de l’entreprise (logistique/vente ou help desk/vente par exemple) est un besoin qu’a renforcé
l’optimisation de la relation client.
12. Quatre principales raisons pour un projet d’information Management (3/4)
1. Éliminer les redondances de données maîtres, qui sont
causes d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
4. Rendre l’information clef disponible et accessible à tout
La réponse de l’IT
moment.
L’Enterprise Information Integration (ETL,
3 Les échanges internes et externes à l’entreprise sont aujourd’hui gérables
EAI, ESB, fédération de données, Real Time Data
informatiquement, et peuvent donc être accélérés conformément à une
Management)
logique d’amélioration de la performance :
Le concept d’entreprise étendue ayant maintenant pris corps, les interactions sont désormais
fréquentes et parfois exigeantes en réactivité avec les fournisseurs, prestataires et clients.
La collaboration la plus rapprochée possible de systèmes pourtant espacés dans la chaîne de
valeur de l’entreprise (logistique/vente ou help desk/vente par exemple) est un besoin qu’a renforcé
l’optimisation de la relation client.
13. Quatre principales raisons pour un projet d’information Management (4/4)
1. Éliminer les redondances de données maîtres, qui sont
causes d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
4. Rendre l’information clef disponible et accessible à tout
moment.
4 L’information est désormais considérée comme faisant partie du capital de
l’entreprise, ‘immatériel’, elle est aussi un bien commercialisable, et
commercialisé. Elle doit être disponible à la consommation à tout moment :
Le développement d’Internet et des technologies afférentes a permis la multiplication des portails d’entreprise
x-net : l’information est banalisée, rendant par contraste inacceptable le manque de telle donnée clef.
La parallélisation croissante des traitements informatiques amenée par l’accélération des cycles de gestion
oblige la notation fonctionnelle des données utilisées, en statut, date, score qualité et responsabilité de gestion.
La recherche actuelle d’une caractérisation de la performance dans l’entreprise suggère pour demain une
valorisation marchande des données, une évaluation de leur utilité intrinsèque.
14. Quatre principales raisons pour un projet d’information Management (4/4)
1. Éliminer les redondances de données maîtres, qui sont
causes d’écarts à expliquer dans les résultats de gestion de
l’entreprise.
2. Améliorer la qualité de certaines données clefs, et la certifier.
3. Accélérer les transferts d’information intra et inter
entreprises.
4. Rendre l’information clef disponible et accessible à tout
La réponse de l’IT
moment.
Les Data Services SOA, l’enterprise search,
4 L’information est désormais considérée comme portails
la Business Intelligence, les faisant partie du capital de
l’entreprise, ‘immatériel’, elle est aussi un bien commercialisable, et
d’entreprise…
commercialisé. Elle doit être disponible à la consommation à tout moment :
Le développement d’Internet et des technologies afférentes a permis la multiplication des portails d’entreprise
x-net : l’information est banalisée, rendant par contraste inacceptable le manque de telle donnée clef.
La parallélisation croissante des traitements informatiques amenée par l’accélération des cycles de gestion
oblige la notation fonctionnelle des données utilisées, en statut, date, score qualité et responsabilité de
gestion.
La recherche actuelle d’une caractérisation de la performance dans l’entreprise suggère pour demain une
valorisation marchande des données, une évaluation de leur utilité intrinsèque.
15. Gérer les référentiels : quelle place dans le système d’information existant de
l’entreprise ?
1. Mettre en place un ensemble de service qui collaborent avec les S.I en place :
1. Il est au service des applications en place en les enrichissant et / ou en les exploitant
2. Il est, en principes, non intrusif sur les S.I en place (i.e ces dernières ne nécessitent pas d’être «
adaptées » pour collaborer avec lui.)
Un service partagé dans l’entreprise
pour gérer dans la durée et de
Ventes manière consistante les référentiels Centre d’appel
de données
Consomme
Consomme
Distribue
Distribue
Responsa
Modéliser
biliser
Dédu
Opportunités Référencer Tickets
pliquer
Gérer
Protéger
La qualité Commandes
Factures
Consomme
L’infrastructure
Consomme
Distribue
Distribue
Organiser Diffuser
Compta client L’organisation E-commerce
16. Information management : quelle place dans un projet
décisionnel ?
Opérations Risque &
Ventes & Ressources
Finances
Marketing
(achats &
humaines
devt Applications
supply chain)) durable
Diffusion de l’info. Découverte de l’info. Enrichissement
Rapports Tableaux Requêtes Multi-dimen
ou search sionnel
Modèles & Données de Exploitation
prédéfinis de bord « mash-ups» référence
Intégration poste travail Data Mining & prédictif Planning & ventil coûts
De l’information
Index Architected Ad-hoc Magasins
Data Marts Data Marts
De
Texte & Données de Faits, données Données
Contenu références, règles transactionnelles
Hub
« riche » information
nel
mails E-commerce ERP Intra/extranet SaaS
Web Supply chain CRM Applis métier B2B client
Office
Applications
Marketing CTMS Applis legacy B2B fournisseur
Non Dév Applications
transactionne
Applications Progiciels
structuré Best of breed intégrés spécifiques externalisées lles
17. Le Customer Data Integration : finalement, une vue du client à 360° ?
• Caractéristiques :
– Réconcilier la diversité des vues à constituer autour d’un même client
– Forte complexité du fait de la multiplicité des sources et de la dépendance à des
changements exogènes nécessité de définir des enjeux réalistes
– Rôle fondamental de la gestion de la qualité
Identification
& données
Historique descriptives
des Profils
interactions
et des
usages
Référentiel
Client Potentiel
Commer-
Relations cial
Type de
Préfé-
besoin,
rences
satisfaction
18. Le Product Data Management
• Caractéristiques:
– Organiser la circulation de l’information dans la supply chain étendue
– Exposer des vues différentes d’un même produit
– La complexité vient de la multiplicité des types de données à gérer et au nombre
important d’acteurs impliqués
PLM CRM
Vue R&D
Référentiel
(SGDT) Produit Commer
ciale
ERP SAV
Vue Vue
industrielle technique
Concevoir & Produire Commercialiser et utiliser
19. Quelles organisations pour la gestion des référentiels ?
Modèle
centralisé
Hub informationnel Hub informationnel
Réconciliation à postériori Mise à jour centralisée
Démarches Démarches
curatives préventives
Hub informationnel Hub informationnel
Modèle
Hiérarchisation des systèmes sources décentralisé Systèmes maitres et délégués
20. Les trois arômes d’un référentiel de données
Données nécessaires aux transactions
Dimension Fortement intégré aux processus
Opérationnelle valeur du référentiel : réduction des coûts
Objectif : Une seule version de la vérité
Mises à jour événementielles
Référentiel de
données
Dimension Dimension
Analytique Sémantique
Données nécessaires aux classifications, Données actuellement hors du contexte des SI ,
segmentation et pilotage, historique / futur mais potentiellement disponibles
Valeur du référentiel : flexibilité, rapidité Valeur du référentiel : Enrichir la valeur des
Objectif : autonomie des « auteurs » données de référence
Mises à jour par versions Mises à jour par une approche de crawling
21. Architecture fonctionnelle des solutions de MDM
Qu’attendre des solutions du marché pour gérer un référentiel ?
Créer/importer, Reconciler les Gouverner Distribuer
Fédérer les données
modèles
Définir et organiser les
Acquisition/diffusion de
Définition des modèles Découverte et diagnostic chaines de responsabilité
données en batch
(workflows)
Acquisition/diffusion de
Gestion des hiérarchies Correction Traçabilité des données
données en juste à temps
Traçabilité des actions Services d’accès aux
Import des modèles Dédoublonnage / Fusion
sur le référentiel données SOA
Interfaces d’accès
Indicateurs et sondes de adminstrateurs de
Gestion des méta data Standardisation
pilotage données
Assistance à la résolution Interfaces d’accès
Gestion fine des droits / utilisateurs (fonction de
Mappings De problème Découpage fonctionnel serach)
Intégration des données
Gérer les versions… … …
non structurées…
22. Le marché : un carrefour qui donne lieu à une guerre technologique
23. L’intégration de données : un pilier des systèmes Data
Warehouse, mais pas encore des architectures SOA
Des généralistes solidement
positionnés
• IBM en éclaireur
• Microsoft, Oracle, SAP
Mais des alternatives plus
neutres qui restent ouvertes
• Informatica
• Information Builders/iway
• Sas/Dataflux
• Tibco
26/
03/
23
201
0
24. Gérer la qualité de données : des solutions matures, mais dont l’adoption
tardent à se généraliser et à s’adapter à tout type de contexte
Des généralistes déjà aux avant-
postes
• IBM, SAP
• bientôt Microsoft
I
Les spécialistes BI et de l’intégration
de données en embuscade
• Informatica
• Sas/Dataflux
Et quelques hyper-spécialistes
• Trillium
• …
26/
03/
24
201
0
25. Référentiels client : le marché
Les locomotives déjà bien
identifiés
• Oracle, dans la continuité de Siebel
• IBM, dans la continuité de Websphere
Des spécialistes qui tardent
à s’internationaliser
• Initiate
• Siperian
Et des outsiders qui comptent
sur leur base installée
• SAP
• Tibco
• Sas/Dataflux
26/
03/
25
201
0
26. Référentiels produit : le marché
Le choc des titans
• IBM, déjà bien implanté
• SAP, dans une zone « de
confort »
• Oracle, à la croisée du
middleware et des
applications
Et spécialistes venus
d’horizons différents
• Middleware (Tibco)
• Echanges B2B (GXS,
Amalto…)
• ERP, PLM (QAD…)
26/
03/
26
201
0
27. L’enterprise Dimension Management : un marché émergent à très
fort potentiel
Des projets plus simples du point de vue de l’IT…
Intégration « lâche » au SI Un complément du Data Warehouse
Mais, un impact plus fort du côté du business
La mise en place d’un dispositif de data Le contrôle de gestion comme sponsor
gouvernance comme prérequis naturel
Les Acteurs positionnés
IBM Cognos SQLServer
Business Master Data Oracle DRM Kalido Teradata
Viewpoint Services
26/
03/
27
201
0