SlideShare une entreprise Scribd logo
1  sur  22
Des données de qualité
Contexte : Cours DataWerhouse
Elaboré par : Nassim BAHRI
Présenté le 10 Mars 2015
Plan de la présentation
I. Introduction
II. Le coût de la non qualité
III. Démarche de qualité
IV. Le socle technologique
V. Scénarios de mise en œuvre
VI. Conclusion and Q&A
Introduction
• Avoir un capital de données de qualité est une nécessité
incontournable pour la réussite de toute entreprise.
• La qualité des données collectées
• La maitrise de la qualité est un enjeu important
3
Introduction
4
Données
correctes
Complètes
À jour
cohérentes
Indicateurs
Compréhensibles
Faciles à
communiquer
Peux coûteux
Simples à calculer
Une version unifiée et
exploitable des informations
Introduction
5
Tronquées?Erronées ?
Redondantes ?
Les données issues de l’application sont :
Le coût de la non qualité
• Cet article a traité les coût de la non qualité sur trois niveaux:
– Lors de la saisie,
– Au cours d’exploitation des données,
– Lors de l’analyse.
6
Le coût de la non qualité
1. Lors de la saisie :
• Plus de 600 milliard de dollars perdu chaque année,
• Mauvaise qualité due à : erreur de saisie de l’information, fautes
d’orthographes, codes incorrectes, abréviation, duplication,…
7
610 000 titres à 1 yen
Au lieu de
1 titre à 610 000 yen
286 millions €
Le coût de la non qualité
2. Au cours de l’exploitation des données:
• Beaucoup d’entreprises négligent la qualité de leurs données,
 Exploiter des données fausses ou erronées
8
Détruit pendant sa mise en orbite autour de Mars
à une altitude 50km de la surface au lieu de 150
Mars Climate Orbiter
Malentendu au niveau de l’unité de mesure
 Perte de 125 millions de dollars
Le coût de la non qualité
3. Lors de l’analyse:
• Lors de l’analyse et la présentation, l’entreprise doit garantir la
qualité de ses données
• Données de qualité  analyse décisionnelle correcte et de qualité
9
Compagnie d’assurance
Décide de fusionner sa base de données client
pour avoir une meilleur compréhension
Je peux avoir 13 millions de client 
 5 millions de clients
Enregistrement dupliqués
Le coût de la non qualité
• La direction informatique n’est pas impactée par la mauvaise
qualité des données
– « Ces données viennent de l’application, elles doivent être correctes »
– « voila une technologie qui va me garantir la qualité des données », …
Garbage In – Garbage Out
10
Démarche de qualité
• Dans une démarche qualité il est important de définir les
caractéristiques attendu et les critères d’évaluation de la qualité
des données
1. Données, informations et connaissances
11
Données
• Une description
élémentaires
d’un objet
Informations
• Transformation
significative des
données
Connaissances
• Le traitement
des
informations :
compréhension
et
apprentissage
Démarche de qualité
1. Données, informations et connaissances
• Le but de cette étape est de définir des familles de données
12
Client
Numéro compte
Nom
Adresse
Téléphone
Transaction
Date
Quantité
Prix
Démarche de qualité
2. Qualités des données
• Expliquer ce qui fait la qualité des données
13
Qualités
des
données
Utilité
Accessibilité
Crédibilité
Interopérabilité
Pertinence
Usage
Opportunité
Disponibilité des systèmes
Privilèges
Standardisation
Cohérence
Exactitude
Format cohérent et sans
Ambiguïté (exemple date)
Démarche de qualité
3. Indicateurs et mesures
• Les organisations doivent créer leurs propres définitions
opérationnelles en fonctions des objectifs et priorités de l’entreprise
14
Critères de qualité des
données
Caractéristiques Exemples d’indicateurs
Cohérence Quelles sont les données
sources des informations
contradictoires?
-Vérification de la plausibilité
-Valeur de la déviation
standard
Exactitude Les valeurs représentent-
elles la réalité?
-Fréquence de changement
des valeurs
Duplication Quelles sont les données
répétées?
-Nombre d’enregistrements
dupliqués
Démarche de qualité
La gouvernance
• La direction générale et les directions opérationnelle : doivent
être impliqués dans le processus de collecte et de mesure de
qualité des données.
• La comité qualité des données : qui sera chargé de la suivi et de
l’amélioration de la qualité des données
15
Le socle technologique
• La plupart les solutions technologique de qualités de données
intègre des outils qui offre :
– Profilage : analyse de la qualité des données
– Standardisation : s’assurer que les données sont conformes aux règles de
qualité
– Rapprochement : comparaison des données
– Nettoyage : correction des données (inexactes)
– Enrichissement : utilisation des sources externes pour annoter les données
– Décomposition : décomposer les éléments par zone de saisie
– Surveillance : suivi de la qualité des données dans le temps 16
Le socle technologique
17
Un processus de qualité
Le socle technologique
• Rôle central des services de qualité dans l’architecture globale des
données
18
Scénarios de mise en œuvre
• Parmi les domaines stratégique qui dépondent fortement de la
qualité des données:
– Le business intelligence
– La conformité réglementaire
– Les données de référence
– Le service aux clients
– La consolidation et l’intégration des données
19
Conclusion
• L’amélioration de la qualité des données passe principalement par
une réflexion et une initiative du démarche qualité
• La technologie permet d’automatiser les tâches de contrôle
• La qualité des données n’est pas un problème informatique mais
plutôt un problème métier.
• Suggestion : ajouter un moyen de feedback des utilisateurs finaux.
20
Références
[1] Christophe TOULEMONDE. «Des données de qualité». Livre blanc
de JEMM research, Janvier 2008.
21
22
Merci pour votre attention

Contenu connexe

Tendances

Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehousekhlifi z
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi AfnouchAhmed
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionAmal Brioual
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Cours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURICours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURIMansouri Khalifa
 
Gestion documentaire et utilité de la gestion électronique de documents
Gestion documentaire et utilité de la gestion électronique de documentsGestion documentaire et utilité de la gestion électronique de documents
Gestion documentaire et utilité de la gestion électronique de documentsJibril Touzi
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence Cynapsys It Hotspot
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Cours Base de données relationnelles
Cours Base de données relationnellesCours Base de données relationnelles
Cours Base de données relationnellesAymen Kasmi
 
Mission d'audit des Systéme d'information
Mission d'audit des Systéme d'informationMission d'audit des Systéme d'information
Mission d'audit des Systéme d'informationAymen Foudhaili
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 

Tendances (20)

Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décision
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Cours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURICours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 1 prof. Khalifa MANSOURI
 
Gestion documentaire et utilité de la gestion électronique de documents
Gestion documentaire et utilité de la gestion électronique de documentsGestion documentaire et utilité de la gestion électronique de documents
Gestion documentaire et utilité de la gestion électronique de documents
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Cours Base de données relationnelles
Cours Base de données relationnellesCours Base de données relationnelles
Cours Base de données relationnelles
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Resume de BI
Resume de BIResume de BI
Resume de BI
 
Mission d'audit des Systéme d'information
Mission d'audit des Systéme d'informationMission d'audit des Systéme d'information
Mission d'audit des Systéme d'information
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 

En vedette

Graph and RDF databases
Graph and RDF databasesGraph and RDF databases
Graph and RDF databasesNassim Bahri
 
Scrum (votre guide de poche)
Scrum (votre guide de poche)Scrum (votre guide de poche)
Scrum (votre guide de poche)Nassim Bahri
 
Implémentation d’une solution E-CRM
Implémentation d’une solution E-CRMImplémentation d’une solution E-CRM
Implémentation d’une solution E-CRMNassim Bahri
 
Célèbres pannes du génie logiciel
Célèbres pannes du génie logicielCélèbres pannes du génie logiciel
Célèbres pannes du génie logicielNassim Bahri
 
Le système de versioning git
Le système de versioning gitLe système de versioning git
Le système de versioning gitNassim Bahri
 
Héberger vos applications web grâce à openshift cloud
Héberger vos applications web grâce à openshift cloudHéberger vos applications web grâce à openshift cloud
Héberger vos applications web grâce à openshift cloudNassim Bahri
 
Conception et développement d’une place de marché B2C
Conception et développement d’une place de marché B2CConception et développement d’une place de marché B2C
Conception et développement d’une place de marché B2CNassim Bahri
 
PFE :: Application de gestion des dus d'enseignement
PFE :: Application de gestion des dus d'enseignementPFE :: Application de gestion des dus d'enseignement
PFE :: Application de gestion des dus d'enseignementNassim Bahri
 
Prestashop le leader des cms
Prestashop le leader des cmsPrestashop le leader des cms
Prestashop le leader des cmsNassim Bahri
 

En vedette (12)

Graph and RDF databases
Graph and RDF databasesGraph and RDF databases
Graph and RDF databases
 
Scrum (votre guide de poche)
Scrum (votre guide de poche)Scrum (votre guide de poche)
Scrum (votre guide de poche)
 
Implémentation d’une solution E-CRM
Implémentation d’une solution E-CRMImplémentation d’une solution E-CRM
Implémentation d’une solution E-CRM
 
Célèbres pannes du génie logiciel
Célèbres pannes du génie logicielCélèbres pannes du génie logiciel
Célèbres pannes du génie logiciel
 
RFID
RFIDRFID
RFID
 
Gidsy.com
Gidsy.comGidsy.com
Gidsy.com
 
Le système de versioning git
Le système de versioning gitLe système de versioning git
Le système de versioning git
 
Héberger vos applications web grâce à openshift cloud
Héberger vos applications web grâce à openshift cloudHéberger vos applications web grâce à openshift cloud
Héberger vos applications web grâce à openshift cloud
 
Conception et développement d’une place de marché B2C
Conception et développement d’une place de marché B2CConception et développement d’une place de marché B2C
Conception et développement d’une place de marché B2C
 
PFE :: Application de gestion des dus d'enseignement
PFE :: Application de gestion des dus d'enseignementPFE :: Application de gestion des dus d'enseignement
PFE :: Application de gestion des dus d'enseignement
 
Prestashop le leader des cms
Prestashop le leader des cmsPrestashop le leader des cms
Prestashop le leader des cms
 
Guide talend
Guide talendGuide talend
Guide talend
 

Similaire à DataWerhouse : Données de qualité

Business intelligence 3 eme
Business intelligence 3 eme Business intelligence 3 eme
Business intelligence 3 eme AmeniBoubaker2
 
Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurJean-Michel Franco
 
Introduction aux webanalytiques et KPIs
Introduction aux webanalytiques et KPIsIntroduction aux webanalytiques et KPIs
Introduction aux webanalytiques et KPIsMohammed ALAMI ✅
 
Audit Qualité des Données
Audit Qualité des DonnéesAudit Qualité des Données
Audit Qualité des DonnéesArielleMeffre
 
Atelier relation client 2011
Atelier relation client 2011Atelier relation client 2011
Atelier relation client 2011Uniserv
 
RGPD : Enjeux, Impacts et opportunités
RGPD : Enjeux, Impacts et opportunitésRGPD : Enjeux, Impacts et opportunités
RGPD : Enjeux, Impacts et opportunitésHatime Araki
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseGenève Lab
 
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...
Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...Micropole Group
 
seenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitalesseenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitalesJulie DULOT
 
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Jean-Michel Franco
 
DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
 DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
DATA FORUM MICROPOLE 2015 - Atelier Stibo SystemsMicropole Group
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...Micropole Group
 
Francois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyseFrancois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyseInsurance_Marketing
 
Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Jean-Michel Franco
 
Concrétisez votre transformation digitale avec Minitab et Minitab Connect
Concrétisez votre transformation digitale avec Minitab et Minitab ConnectConcrétisez votre transformation digitale avec Minitab et Minitab Connect
Concrétisez votre transformation digitale avec Minitab et Minitab ConnectMinitab, LLC
 
DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015Micropole Group
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...AQT-presentations
 
Pour votre data quality: Osez le SaaS
Pour votre data quality: Osez le SaaSPour votre data quality: Osez le SaaS
Pour votre data quality: Osez le SaaSUniserv
 

Similaire à DataWerhouse : Données de qualité (20)

Business intelligence 3 eme
Business intelligence 3 eme Business intelligence 3 eme
Business intelligence 3 eme
 
Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeur
 
Introduction aux webanalytiques et KPIs
Introduction aux webanalytiques et KPIsIntroduction aux webanalytiques et KPIs
Introduction aux webanalytiques et KPIs
 
Audit Qualité des Données
Audit Qualité des DonnéesAudit Qualité des Données
Audit Qualité des Données
 
Atelier relation client 2011
Atelier relation client 2011Atelier relation client 2011
Atelier relation client 2011
 
RGPD : Enjeux, Impacts et opportunités
RGPD : Enjeux, Impacts et opportunitésRGPD : Enjeux, Impacts et opportunités
RGPD : Enjeux, Impacts et opportunités
 
M01 avantages strategiques-24- ms
M01 avantages strategiques-24- msM01 avantages strategiques-24- ms
M01 avantages strategiques-24- ms
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entreprise
 
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...
Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...
 
seenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitalesseenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitales
 
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
 
Matinale du MDM 2011
Matinale du MDM 2011Matinale du MDM 2011
Matinale du MDM 2011
 
DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
 DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
 
Francois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyseFrancois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyse
 
Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?
 
Concrétisez votre transformation digitale avec Minitab et Minitab Connect
Concrétisez votre transformation digitale avec Minitab et Minitab ConnectConcrétisez votre transformation digitale avec Minitab et Minitab Connect
Concrétisez votre transformation digitale avec Minitab et Minitab Connect
 
DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
 
Pour votre data quality: Osez le SaaS
Pour votre data quality: Osez le SaaSPour votre data quality: Osez le SaaS
Pour votre data quality: Osez le SaaS
 

Dernier

Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxHadJer61
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 

Dernier (6)

Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptx
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 

DataWerhouse : Données de qualité

  • 1. Des données de qualité Contexte : Cours DataWerhouse Elaboré par : Nassim BAHRI Présenté le 10 Mars 2015
  • 2. Plan de la présentation I. Introduction II. Le coût de la non qualité III. Démarche de qualité IV. Le socle technologique V. Scénarios de mise en œuvre VI. Conclusion and Q&A
  • 3. Introduction • Avoir un capital de données de qualité est une nécessité incontournable pour la réussite de toute entreprise. • La qualité des données collectées • La maitrise de la qualité est un enjeu important 3
  • 4. Introduction 4 Données correctes Complètes À jour cohérentes Indicateurs Compréhensibles Faciles à communiquer Peux coûteux Simples à calculer Une version unifiée et exploitable des informations
  • 5. Introduction 5 Tronquées?Erronées ? Redondantes ? Les données issues de l’application sont :
  • 6. Le coût de la non qualité • Cet article a traité les coût de la non qualité sur trois niveaux: – Lors de la saisie, – Au cours d’exploitation des données, – Lors de l’analyse. 6
  • 7. Le coût de la non qualité 1. Lors de la saisie : • Plus de 600 milliard de dollars perdu chaque année, • Mauvaise qualité due à : erreur de saisie de l’information, fautes d’orthographes, codes incorrectes, abréviation, duplication,… 7 610 000 titres à 1 yen Au lieu de 1 titre à 610 000 yen 286 millions €
  • 8. Le coût de la non qualité 2. Au cours de l’exploitation des données: • Beaucoup d’entreprises négligent la qualité de leurs données,  Exploiter des données fausses ou erronées 8 Détruit pendant sa mise en orbite autour de Mars à une altitude 50km de la surface au lieu de 150 Mars Climate Orbiter Malentendu au niveau de l’unité de mesure  Perte de 125 millions de dollars
  • 9. Le coût de la non qualité 3. Lors de l’analyse: • Lors de l’analyse et la présentation, l’entreprise doit garantir la qualité de ses données • Données de qualité  analyse décisionnelle correcte et de qualité 9 Compagnie d’assurance Décide de fusionner sa base de données client pour avoir une meilleur compréhension Je peux avoir 13 millions de client   5 millions de clients Enregistrement dupliqués
  • 10. Le coût de la non qualité • La direction informatique n’est pas impactée par la mauvaise qualité des données – « Ces données viennent de l’application, elles doivent être correctes » – « voila une technologie qui va me garantir la qualité des données », … Garbage In – Garbage Out 10
  • 11. Démarche de qualité • Dans une démarche qualité il est important de définir les caractéristiques attendu et les critères d’évaluation de la qualité des données 1. Données, informations et connaissances 11 Données • Une description élémentaires d’un objet Informations • Transformation significative des données Connaissances • Le traitement des informations : compréhension et apprentissage
  • 12. Démarche de qualité 1. Données, informations et connaissances • Le but de cette étape est de définir des familles de données 12 Client Numéro compte Nom Adresse Téléphone Transaction Date Quantité Prix
  • 13. Démarche de qualité 2. Qualités des données • Expliquer ce qui fait la qualité des données 13 Qualités des données Utilité Accessibilité Crédibilité Interopérabilité Pertinence Usage Opportunité Disponibilité des systèmes Privilèges Standardisation Cohérence Exactitude Format cohérent et sans Ambiguïté (exemple date)
  • 14. Démarche de qualité 3. Indicateurs et mesures • Les organisations doivent créer leurs propres définitions opérationnelles en fonctions des objectifs et priorités de l’entreprise 14 Critères de qualité des données Caractéristiques Exemples d’indicateurs Cohérence Quelles sont les données sources des informations contradictoires? -Vérification de la plausibilité -Valeur de la déviation standard Exactitude Les valeurs représentent- elles la réalité? -Fréquence de changement des valeurs Duplication Quelles sont les données répétées? -Nombre d’enregistrements dupliqués
  • 15. Démarche de qualité La gouvernance • La direction générale et les directions opérationnelle : doivent être impliqués dans le processus de collecte et de mesure de qualité des données. • La comité qualité des données : qui sera chargé de la suivi et de l’amélioration de la qualité des données 15
  • 16. Le socle technologique • La plupart les solutions technologique de qualités de données intègre des outils qui offre : – Profilage : analyse de la qualité des données – Standardisation : s’assurer que les données sont conformes aux règles de qualité – Rapprochement : comparaison des données – Nettoyage : correction des données (inexactes) – Enrichissement : utilisation des sources externes pour annoter les données – Décomposition : décomposer les éléments par zone de saisie – Surveillance : suivi de la qualité des données dans le temps 16
  • 17. Le socle technologique 17 Un processus de qualité
  • 18. Le socle technologique • Rôle central des services de qualité dans l’architecture globale des données 18
  • 19. Scénarios de mise en œuvre • Parmi les domaines stratégique qui dépondent fortement de la qualité des données: – Le business intelligence – La conformité réglementaire – Les données de référence – Le service aux clients – La consolidation et l’intégration des données 19
  • 20. Conclusion • L’amélioration de la qualité des données passe principalement par une réflexion et une initiative du démarche qualité • La technologie permet d’automatiser les tâches de contrôle • La qualité des données n’est pas un problème informatique mais plutôt un problème métier. • Suggestion : ajouter un moyen de feedback des utilisateurs finaux. 20
  • 21. Références [1] Christophe TOULEMONDE. «Des données de qualité». Livre blanc de JEMM research, Janvier 2008. 21
  • 22. 22 Merci pour votre attention

Notes de l'éditeur

  1. Bonjour à tous et vous êtes les bienvenue. Aujourd’hui nous vous présenterons notre projet qui s’articule autour de la qualité des données dans le contexte du cours Datawerhouse. Cette présentation est élaborée par moi-même Nassim BAHRI … Commençons par présenter les axes importants de notre projet
  2. Nous finirons
  3. Ce qui compte pour les entreprises c’est la qualités des données collectés plutôt que la quantité
  4. Il s’agit donc de fournir des données qui seront : Tout en mettant en place des indicateurs : La direction générale et ses directions doivent disposer : Pour prendre les bonnes décision au moment opportun
  5. Historiquement la gestion des qualité des données était une tache de la direction informatique. Et les direction métiers demandent l’information Tableau / indicateur
  6. Aujourd’hui les entreprise doivent faire face au déferlement des données et d’informations Selon une étude faite au Etat Unis en 2002; plus de 600 milliard de dollars perdu chaque année à cause des données de mauvaises qualité courtier
  7. Ce qui conduit à : En 1999 le NASA a perdu un satellite Mars Climate Orbiter à cause des données erronées
  8. Mauvaise données de départ génère de mauvaise résultat Le problème relevé à ce niveau c’est la démarche à utiliser pour garantir la qualité des données entrées
  9. Comparaison et rapprochement Pour détecter les duplication
  10. ESB : Enterprise service bus (technique informatique interlogicielle)