SlideShare une entreprise Scribd logo

DataWarehouse

N
nzuguem

tous sur les entrepôts de données

1  sur  82
Télécharger pour lire hors ligne
TIC MANAGEMENT
Les Entrepôts de Données (Data Warehouses)
PRÉSENTER PAR :
 NZUGUEM KEVIN
BILONG LEON
MELINGA PATRICK
Institut Africain d’Informatique
7/5/2016
1
DATAWAREHOUSE
PLAN DU TRAVAIL
 INTRODUCTION
 LES ENTREPOTS DE DONNEES
 LES DATAMARTS
 ARCHITECTURE
 MODELISATION
 ALIMENTATION
 LES BASES DE DONNEES MULTIDIMENTIONNELLES
 MARCHE DU DECISIONNEL
 LE DATAMINIG
7/5/2016
2
DATA WAREHOUSE
INTRODUCTION
7/5/2016
3
DATA WAREHOUSE
CONTEXTE
 Besoin : prise de décision stratégiques et tactique;
 Pourquoi : besoin de réactivité;
 Qui : les décideurs (non informaticiens);
 Comment : répondre au demande d’analyse de données, dégager les informations qualitatives
nouvelles.
7/5/2016
4
DATA WAREHOUSE
CONTEXTE
Quels francais
consomment beaucoup le
piossons ?
Quels francais
consomment beaucoup
le piossons ?
Quels francais
consomment beaucoup
le piossons ?
Quels francais
consomment beaucoup
le piossons ?
7/5/2016
5
DATA WAREHOUSE
PROBLEMATIQUE
 Comment repondre aux données des decideurs ? :
 En donnant un acces rapide et simple a l’information strategique;
 En donnant du sens au données.
 mettre en place un systeme d’information dédié aux applications decisionnelles :
un DATA WAREHOUSE.
7/5/2016DATA WAREHOUSE
6

Recommandé

Contenu connexe

Tendances

Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BISaid Sadik
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETLLilia Sfaxi
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouseHassane Dkhissi
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
Integration de donnees_etl
Integration de donnees_etlIntegration de donnees_etl
Integration de donnees_etlhoracio lassey
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Chapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesChapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesMohamed Mkaouar
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence Cynapsys It Hotspot
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsJean-Marc Dupont
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian Lilia Sfaxi
 

Tendances (20)

Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouse
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Integration de donnees_etl
Integration de donnees_etlIntegration de donnees_etl
Integration de donnees_etl
 
Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Les outils OLAP
Les outils OLAPLes outils OLAP
Les outils OLAP
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Chapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesChapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de données
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
presentation_BI
presentation_BIpresentation_BI
presentation_BI
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 

Similaire à DataWarehouse

Présentation/Atelier oxya
Présentation/Atelier oxyaPrésentation/Atelier oxya
Présentation/Atelier oxyaFujitsu France
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Modern Data Stack France
 
Digital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautésDigital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautésNeo4j
 
0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avance
0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avance0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avance
0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avanceCERTyou Formation
 
Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...
Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...
Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...Microsoft Technet France
 
Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Wiiisdom
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
 
Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016Microsoft
 
Prez ia big_data_bruno_v3_finale
Prez ia big_data_bruno_v3_finalePrez ia big_data_bruno_v3_finale
Prez ia big_data_bruno_v3_finaleBruno Seznec
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SASSoft Computing
 
Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...
Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...
Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...Hitachi Data Systems France
 
Business intelligence | State of the art
Business intelligence | State of the artBusiness intelligence | State of the art
Business intelligence | State of the artShubham Sharma
 
Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentCarlos Sanin
 
NetApp PartnersTour 2011 à Lille, mon point de vue
NetApp PartnersTour 2011 à Lille, mon point de vueNetApp PartnersTour 2011 à Lille, mon point de vue
NetApp PartnersTour 2011 à Lille, mon point de vueOlivier (DaffyDuke) Duquesne
 
Marco presentation 30.09.10 5 d's french slide share
Marco presentation 30.09.10   5 d's french slide shareMarco presentation 30.09.10   5 d's french slide share
Marco presentation 30.09.10 5 d's french slide shareMariette TERRISSE
 
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnelsUSI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnelsJoseph Glorieux
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptxSamirAwad14
 

Similaire à DataWarehouse (20)

chap4.pdf
chap4.pdfchap4.pdf
chap4.pdf
 
Présentation/Atelier oxya
Présentation/Atelier oxyaPrésentation/Atelier oxya
Présentation/Atelier oxya
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
 
Digital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautésDigital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautés
 
_2_expo_DW_DM.pdf
_2_expo_DW_DM.pdf_2_expo_DW_DM.pdf
_2_expo_DW_DM.pdf
 
Chapitre 2
Chapitre 2Chapitre 2
Chapitre 2
 
0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avance
0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avance0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avance
0 a055g formation-preparation-des-donnees-avec-ibm-spss-modeler-v16-cours-avance
 
Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...
Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...
Retour d'expérience Bouygues Telecom : Analyse BI à l'aide d'une appliance SQ...
 
Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...
 
Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016
 
Prez ia big_data_bruno_v3_finale
Prez ia big_data_bruno_v3_finalePrez ia big_data_bruno_v3_finale
Prez ia big_data_bruno_v3_finale
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SAS
 
Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...
Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...
Les nouveautés 2012 pour bâtir votre infrastructure Cloud et transformer votr...
 
Business intelligence | State of the art
Business intelligence | State of the artBusiness intelligence | State of the art
Business intelligence | State of the art
 
Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - student
 
NetApp PartnersTour 2011 à Lille, mon point de vue
NetApp PartnersTour 2011 à Lille, mon point de vueNetApp PartnersTour 2011 à Lille, mon point de vue
NetApp PartnersTour 2011 à Lille, mon point de vue
 
Marco presentation 30.09.10 5 d's french slide share
Marco presentation 30.09.10   5 d's french slide shareMarco presentation 30.09.10   5 d's french slide share
Marco presentation 30.09.10 5 d's french slide share
 
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnelsUSI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptx
 

DataWarehouse

  • 1. TIC MANAGEMENT Les Entrepôts de Données (Data Warehouses) PRÉSENTER PAR :  NZUGUEM KEVIN BILONG LEON MELINGA PATRICK Institut Africain d’Informatique 7/5/2016 1 DATAWAREHOUSE
  • 2. PLAN DU TRAVAIL  INTRODUCTION  LES ENTREPOTS DE DONNEES  LES DATAMARTS  ARCHITECTURE  MODELISATION  ALIMENTATION  LES BASES DE DONNEES MULTIDIMENTIONNELLES  MARCHE DU DECISIONNEL  LE DATAMINIG 7/5/2016 2 DATA WAREHOUSE
  • 4. CONTEXTE  Besoin : prise de décision stratégiques et tactique;  Pourquoi : besoin de réactivité;  Qui : les décideurs (non informaticiens);  Comment : répondre au demande d’analyse de données, dégager les informations qualitatives nouvelles. 7/5/2016 4 DATA WAREHOUSE
  • 5. CONTEXTE Quels francais consomment beaucoup le piossons ? Quels francais consomment beaucoup le piossons ? Quels francais consomment beaucoup le piossons ? Quels francais consomment beaucoup le piossons ? 7/5/2016 5 DATA WAREHOUSE
  • 6. PROBLEMATIQUE  Comment repondre aux données des decideurs ? :  En donnant un acces rapide et simple a l’information strategique;  En donnant du sens au données.  mettre en place un systeme d’information dédié aux applications decisionnelles : un DATA WAREHOUSE. 7/5/2016DATA WAREHOUSE 6
  • 7. PROCESSUS DE PRISE DE DECISION 7/5/2016DATA WAREHOUSE 7
  • 8. PROCESSUS DE PRISE DE DECISION 7/5/2016DATA WAREHOUSE 8
  • 9. DOMAINE D’UTILISATION D’UN DW  BANQUE : risque d’un prêt, prime plus precise  SANTE : épidémologie, risque alimentaire  COMMERCE : ciblage de clientèle, determiner des promotions  LOGISTIQUE : adéquation demande/production  ASSURANCE : risque lié au contrat d’assurance(voiture) 7/5/2016DATA WAREHOUSE 9
  • 11. DEFININITION D’UN DW  W.B.Inmon « Le data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision »  PRINCIPE : mettre en place une base de donnée utilisé a des fin d’analyse. 7/5/2016 11 DATA WAREHOUSE
  • 12. LES 4 CARACTERISTIQUES D’UN DW  DONNÉES ORIENTÉES SUJET :  Regroupe les informations des différents métiers  Ne tiens pas compte de l’organisation fonctionnelle des données 7/5/2016 12 DATA WAREHOUSE
  • 13. LES 4 CARACTERISTIQUES D’UN DW 7/5/2016 13 DATA WAREHOUSE  DONNÉES INTÉGRÉES : Normalisation des données Définition d’un référentiel unique
  • 14. LES 4 CARACTERISTIQUES D’UN DW  DONNÉES NON VOLATILES :  Traçabilité des informations et des décisions prises  Copie des données de production 7/5/2016 14 DATA WAREHOUSE
  • 15. LES 4 CARACTERISTIQUES D’UN DW  DONNÉES DATÉES :  Les données persistent dans le temps  Mise en place d’un référentiel temps 7/5/2016 15 DATA WAREHOUSE
  • 16. SGBDR ET DW 7/5/2016 16 DATA WAREHOUSE OLTP: On-Line Transactional Processing OLAP: On-Line Analitical Processing
  • 19. DATA MARTS 7/5/2016 19 DATA WAREHOUSE  SOUS ENSEMBLE D’UN ENTREPOTS DE DONNNEES  DESTINE A REPONDRE AU BESION D’UN SECTEUR OU D’UNE FONCTION PARTICULIERE DE L’ENTREPRISE  POINT DE VUE VUE SPECIFIQUE SELON LES CRITERES METIERS
  • 21. INTERETS DES DATA MARTS 7/5/2016 21 DATA WAREHOUSE  NOUVEL ENVIRONNEMENT STRUCTURE ET FORMATE EN FONCTION DES BESIONS D’UN METIER OU D’UN USAGE PARTICULIER  MOINS DE DONNEES QUE LE DATA WAREHOUSE : plus facile à comprendre et a manipuler, amélioration des temps de réponses  UTILISATEURS PLUS CIBLES : DM PLUS FACILE A DEFINIR
  • 24. FLUX DE DONNEES 7/5/2016 24 DATA WAREHOUSE  FLUX ENTRANTS : - Extraction : multi-source, hétérogene; - Transformation : filter, Trier, homogeiniser, netoyer - Chargement : insertion des données dans l’entrepot  FLUX SORTANTS : - Mise à la disposition des données pour les utilisateurs finaux
  • 25. LES DIFFERENTES ZONES DE L’ARCHITECTURE 7/5/2016 25 DATA WAREHOUSE  ZONE DE PREPARATION (STAGING AREA): - zone temporaire de stockage des données extraites; - Realisation des transformation avant l’insertion dans le DW : nettoyage, normalisation - Données souvent detruites après chargement dans le DW
  • 26. LES DIFFERENTES ZONES DE L’ARCHITECTURE 7/5/2016 26 DATA WAREHOUSE  ZONE DE STOCKAGE (DW, DM): - On y transfert les données nettoyés; - Stockage permanent des données
  • 27. LES DIFFERENTES ZONES DE L’ARCHITECTURE 7/5/2016 27 DATA WAREHOUSE  ZONE DE PRESENTATION : - Donne accès au données contenues dans le DW; - Peut contenir des outils d’analyse programmés: rapports, requetes
  • 29. MODELISATION ENTITE/ ASSOCIATION 7/5/2016 29 DATA WAREHOUSE  AVANTAGES: - Normalisation: éleminer les redondances, preserver la coherence des données. - Optimisation des transactions - Reduction de l’espace de stockage
  • 30. MODELISATION ENTITE/ ASSOCIATION 7/5/2016 30 DATA WAREHOUSE  INCONVENIENTS POUR UTILISATEURS FINAUX: - Shema très et trop complet : contient des tables/champs inutiles pour l’analyse - Pas d’interface graphique capable de rendre utilisable le madèle E/A - Inapdaté pour l’analyse
  • 32. MODELISATION DE DW 7/5/2016 32 DATA WAREHOUSE  NOUVELLES METHODES DE CONCEPTION AUTOUR DES CONCEPTS METIERS : - Ne pas normaliser au maximun  INTRODUCTION DE NOUVEAUX TYPES DE TABLES : - Tables de faits - Tables de dimension  INTRODUCTION DE NOUVEAUX MODELES: - Modèle en etoile - Modèle en flocon
  • 33. TABLE DE FAITS 7/5/2016 33 DATA WAREHOUSE  TABLE PRINCIPALE DU MODELE DIMENSIONNEL  CONTIENT DES DONNEES OBSERVABLE (FAITS) SUR LE SUJET ETUDIE SELON DIVERS AXES D’ANALYSE (LES DIMENSIONS)
  • 35. TABLE DE FAITS 7/5/2016 35 DATA WAREHOUSE  FAIT : - ce que l’on souhaite mésurer : quantité vendue, montant des ventes. - Contient les clés étrangeres des axes d’analyse: date, produit, magasin - Trois types de faits : additif, semi-additif, non additif
  • 36. TYPOLOGIES DES FAITS 7/5/2016 36 DATA WAREHOUSE  ADDITIF : additionnable suivant toutes les dimensions - quantité vendue, chiffre d’affaire - peut etre le resultat d’un calcul : Benefice= montant de ventes – cout
  • 37. TYPOLOGIES DES FAITS 7/5/2016 37 DATA WAREHOUSE  SEMI-ADDITIF: additionable suivant certaines dimensions - solde d’un compte bancaire : pas de sens d’additionner sur les dates car cela represente les instantanés d’un niveau
  • 38. TYPOLOGIES DES FAITS 7/5/2016 38 DATA WAREHOUSE  NON ADDITIF: Fait non additionable quelque soit la dimension - prix unitaire : l’addition sur n’importe quelle dimension donne un nonbre depouvu de sens
  • 39. TABLE DE DIMENSIONS 7/5/2016 39 DATA WAREHOUSE  AXES D’ANALYSE SELON LESQUELS VONT ETRE ETUDIEES LES DONNEES OBSERVABLE (FAITS )  CONTIENT LE DETAIL SUR LES FAITS
  • 41. TABLE DE DIMENSIONS 7/5/2016 41 DATA WAREHOUSE  DIMENSIONS = AXES D’ANALYSE - Client, produit, periode de temps…  CONTIENT SOUVENT UN GRAND NOMBRE DE COLONNE: l’essemble d’information desciptives des faits  CONTIENT EN GENERALE BEAUCOUP MOINS D’INFORMATION Q’UNE TABLE DE FAITS
  • 42. TYPE DE MODELES 7/5/2016 42 DATA WAREHOUSE  MODELE EN ETOILE
  • 43. TYPE DE MODELES 7/5/2016 43 DATA WAREHOUSE  MODELE EN FLOCON
  • 44. MODELE EN ETOILE 7/5/2016 44 DATA WAREHOUSE  UNE TABLE DE FAITS CENTRALE ET DES DIMENSIONS  LES DIMENSIONS N’ONT PAS DE LIAISON ENTRE ELLES  AVANTAGES : facilité de navigation, nombre de jointures limitées  INCONVENIENTS : redondance dans les dimensions, toutes les dimensions ne concernent pas les mesures.
  • 46. MODELE EN FLOCON 7/5/2016 46 DATA WAREHOUSE  UNE TABLE DE FAIT ET DES DIMENSIONS DECOMPOSEES EN SOUS HIERACHIE  ON A UN SEUL NIVEAU HIERACHIQUE DANS UNE TABLE DE DIMENSION  LA TABLE DE DIMENSION HIERACHIQUE LE PLUS BAS EST RELIEE A LA TABLE DE FAITS
  • 47. MODELE EN FLOCON 7/5/2016 47 DATA WAREHOUSE  AVANTAGES : normalisation des dimensions, economie d’espace du disque  INCONVENIENTS : modele plus complexe (jointures ), requetes moins performantes
  • 50. ALIMENTATION/ MISE A JOUR DU DW 7/5/2016 50 DATA WAREHOUSE  ENTREPOT MISE A JOUR REGULIEREMENT  BESION D’OUTIL PERMETTANT D’AUTOMATISER LE CHARGEMENT DANS L’ENTREPOT  UTILISATION D’OUTIL ETL (EXTRACT, TRANSFORM AND LOAD)
  • 51. DEFINITION D’UN ETL 7/5/2016 51 DATA WAREHOUSE  OFFRE UN ENVIRONNEMENT DE DEVELLOPEMENT  OFFRE DES OUTILS DE GESTION DES OPERATIONS ET DE MAINTENANCE  PERMET DE DECOUVRIR, ANALYSER, EXTRAIRE DES DONNEES A PARTIR DE SOURCES HETEROGENES  PERMET DE NETTOYER ET DE STANDADISER LES DONNEES  PERMET DE CHARGER LES DONNEES DANS LE DW
  • 52. EXTRACTION 7/5/2016 52 DATA WAREHOUSE  EXTRAIRE DES DONNEES DE SYSTEME DE PRODUCTION  DIALOGUER AVEC DIFFERENTES SOURCES: Bases de données, fichiers, bases proprietaires  UTILISE DIVERS CONNECTEURS: ODBC, SQL natif, fichiers plats
  • 53. TRANSFORMATION 7/5/2016 53 DATA WAREHOUSE  RENDRE COHERENTES LES DONNEES DE DIFFERENTES SOURCES : - transformer, nettoyer, trier, unifier les données - exemple : unifier le format de date (MM/JJ/AAA en JJ/MM/AAAA)  ETAPE TRES IMPORTANTE: garantir la coherence et le fiabilité des données
  • 54. CHARGEMENT 7/5/2016 54 DATA WAREHOUSE  INSERER OU MODIFIER LES DONNEES DANS L’ENTREPOT  UTILISATION DES CONNECTEURS : ODBC, SQL natif, fichiers plats
  • 58. MANIPULATION DES DONNEES MULTIDIMENSIONNELLES 7/5/2016 58 DATA WAREHOUSE  ROTATION (ROTATE) : presenter une autre face du cube
  • 59. MANIPULATION DES DONNEES MULTIDIMENSIONNELLES 7/5/2016 59 DATA WAREHOUSE  TRANCHAGE (SLICING) : consiste a travailler que sur une tranche du cube. Une des diensions est alors reduite a une seule valeur
  • 60. MANIPULATION DES DONNEES MULTIDIMENSIONNELLES 7/5/2016 60 DATA WAREHOUSE  EXTRACTION D’UN BLOC DE DONNEE(DICING) : ne travailler que sous un sous cube.
  • 61. MANIPULATION DES DONNEES MULTIDIMENSIONNELLES 7/5/2016 61 DATA WAREHOUSE  EXTRACTION D’UN BLOC DE DONNEE(DICING) : ne travailler que sous un sous cube.
  • 62. MANIPULATION DES DONNEES MULTIDIMENSIONNELLES 7/5/2016 62 DATA WAREHOUSE  FORAGE VERS LE HAUT (ROLL-UP): << dezoomer>> obtenir un niveau de granularité superieur, utilisation des fonctions d’agregations  FORAGE VERS LE HAUT (ROLL-UP): <<zoomer>> obtenir un niveau de granularité inferieur, données plus detaillées
  • 64. MDX : MULTIDIMENSIONNAL EXPRESSION 7/5/2016 64 DATA WAREHOUSE  LANGUAGE PERMETTANT DE DEFINIR, D’UTILISER ET DE RECUPERER, DES DONNEES A PARTIR D’OBJETS MULTIDIMENTIONNELLES - Permet de faire des operations decrites precedemment  EQUIVALENT DE SQL POUR LE MONDE OLAP  ORIGINE : MICROSOFT
  • 65. MDX, EXEMPLE 7/5/2016 65 DATA WAREHOUSE  FOURNIR LES EFFECTIFS D’UNE SOCIETE PENDANT LES ANNEES 2004 ET 2005 CROISES PAR LES PAIEMENT
  • 71. INTRODUCTION AU DATAMINING 7/5/2016 71 DATA WAREHOUSE  LA FOUILLE DES DONNÉES  Le DATAMINING est l’ensemble des:  techniques et méthodes  … destinées à l’exploration et l’analyse  … de (souvent) grandes bases de données informatiques  … en vue de détecter dans ces données des règles, des associations, des tendances inconnues (non fixées a priori), dans des structures particulières restituant de façon concise l’essentiel de l’information utile.  … pour l’aide à la décision.  On parle alors d’extraction de l’information dans la donnée
  • 72. INTRODUCTION AU DATAMINING 7/5/2016 72 DATA WAREHOUSE  LA FOUILLE DES DONNÉES  Le DATAMINING est l’ensemble des:  techniques et méthodes  … destinées à l’exploration et l’analyse  … de (souvent) grandes bases de données informatiques  … en vue de détecter dans ces données des règles, des associations, des tendances inconnues (non fixées a priori), dans des structures particulières restituant de façon concise l’essentiel de l’information utile.  … pour l’aide à la décision.  On parle alors d’extraction de l’information dans la donnée
  • 73. APPLICATION DU DATA MINING 7/5/2016 73 DATA WAREHOUSE  Utilité du datamining dans le CRM (gestion de la relation client)  Mieux connaître le client  pour mieux le servir  pour augmenter sa satisfaction  pour augmenter sa fidélité (+ coûteux d’acquérir un client que le conserver)  La connaissance du client est encore plus utile dans le secteur tertiaire :  les produits se ressemblent entre établissements  le prix n’est pas toujours déterminant  ce sont surtout le service et la relation avec le client qui font la différence
  • 74. CRM (GESTION DE LA RELATION CLIENT) 7/5/2016 74 DATA WAREHOUSE  Utilité du datamining dans le CRM (gestion de la relation client)  Mieux connaître le client  pour mieux le servir  pour augmenter sa satisfaction  pour augmenter sa fidélité (+ coûteux d’acquérir un client que le conserver)  La connaissance du client est encore plus utile dans le secteur tertiaire :  les produits se ressemblent entre établissements  le prix n’est pas toujours déterminant  ce sont surtout le service et la relation avec le client qui font la différence
  • 75. CRM (GESTION DE LA RELATION CLIENT) 7/5/2016 75 DATA WAREHOUSE
  • 76. LE DATA MINING DANS LA TELEPHONIE 7/5/2016 76 DATA WAREHOUSE  Deux événements :  ouverture des monopoles nationaux à d’autres opérateurs télécom  arrivée à saturation du marché de la téléphonie mobile  D’où les sujets dominants dans la téléphonie :  score d’attrition (churn = changement d’opérateur)  optimisation des campagnes marketing
  • 77. LE DATA MINING DANS LA TELEPHONIE 7/5/2016 77 DATA WAREHOUSE  text mining (pour analyser les lettres de réclamation)  Problème du churn :  coût d’acquisition moyen en téléphonie mobile : 50,000 frs env  plus d’un million d’utilisateurs changent chaque d’année d’opérateur  En France, la loi Chatel (juin 2008) facilite le changement d’opérateur en diminuant le coût pour ceux qui ont dépassé 12 mois chez l’opérateur  la portabilité du numéro facilite le churn
  • 78. LE DATA MINING DANS LE COMMERCE 7/5/2016 78 DATA WAREHOUSE  Vente Par Correspondance  utilise depuis longtemps des scores d’appétence  pour optimiser ses ciblages et en réduire les coûts  des centaines de millions de documents envoyés par an  e-commerce  personnalisation des pages du site web de l’entreprise, en fonction du profil de chaque internaute  optimisation de la navigation sur un site web
  • 79. LE DATA MINING DANS LE COMMERCE 7/5/2016 79 DATA WAREHOUSE
  • 80. LE DATA MINING DANS LE COMMERCE 7/5/2016 80 DATA WAREHOUSE  Grande distribution  analyse du ticket de caisse  détermination des meilleures implantations (géomarketing)
  • 81. Bibliographie Supports de Cours  Karima Tekaya – « Informatique Décisionnelle » - INSAT  Fatma Baklouti – « Les entrepôts de données (Data Warehouses) » - INSAT  Hweichao Lu – « Online Analytical Processing (OLAP) » - CS157B-02 Spring 2007  Didier Donsez – « Systèmes d’information décisionnels (Data Warehouse / Data Mining) » - Université Joseph Fourier  Jacky Akoka et Isabelle Comyn-Wattiau – « Le Data Warehouse et les Systèmes Multidimentionnels » - Université de Versailles Livres  Ralph Kimball - « Concevoir et déployer un Data Warehouse » - Editions Eyrolles, 2000 7/5/2016 81 DATA WAREHOUSE

Notes de l'éditeur

  1. Rollup: moving from finer-granularity data to coarser granularity Drill-down: opposite to Rollup