Data warehouse

10 951 vues

Publié le

1 commentaire
10 j’aime
Statistiques
Remarques
Aucun téléchargement
Vues
Nombre de vues
10 951
Sur SlideShare
0
Issues des intégrations
0
Intégrations
20
Actions
Partages
0
Téléchargements
844
Commentaires
1
J’aime
10
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Data warehouse

  1. 1. Data Warehouse« Entrepôt de données » Free Powerpoint Templates Page 1
  2. 2. Plan• Introduction• Définition• Objectifs• Historique• Structure du Data Warehouse• Concept du Data Warehouse• Les aspects techniques• SGBD et DW• Conclusion Free Powerpoint Templates Page 2
  3. 3. IntroductionFree Powerpoint Templates Page 3
  4. 4. Introduction• On qualifie dinformatique décisionnelle (en anglais « Business intelligence », parfois appelé tout simplement « le décisionnel ») lexploitation des données de lentreprise dans le but de faciliter la prise de décision par les décideurs, cest-à-dire la compréhension du fonctionnement actuel et lanticipation des actions pour un pilotage éclairé de lentreprise. Free Powerpoint Templates Page 4
  5. 5. Introduction• Les outils décisionnels comme le Data Warehouse et le Data Mining sont basés sur lexploitation dun système dinformation décisionnel alimenté grâce à lextraction de données diverses à partir des données de production, dinformations concernant lentreprise ou son entourage et de données économiques. Free Powerpoint Templates Page 5
  6. 6. DéfinitionFree Powerpoint Templates Page 6
  7. 7. Définition W.B.Inmon « Le data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision » Free Powerpoint Templates Page 7
  8. 8. ObjectifsFree Powerpoint Templates Page 8
  9. 9. Objectifs d’une Data Warehouse • Intégrer différentes bases de données opérationnelles; • Permettre l’accès aux informations historisées; • Fournir des outils d ’analyse sur ces données; • Résumer les données; • Réconcilier des données inconsistantes. Free Powerpoint Templates Page 9
  10. 10. HistoriqueFree Powerpoint Templates Page 10
  11. 11. Historique du Data Warehouse• Années 1960 : Genral Mills et l‘Université Dartmouth, dans un projet conjoint, créent les termes "faits" et "dimensions".• 1983 : Teradata introduit dans sa base de données managériale un système exclusivement destiné à la prise de décision.• 1988 : Barry Devlin et Paul Murphy publient larticle "Une architecture pour les systèmes dinformation financiers" ("An architecture for a business and information systems") où ils utilisent pour la première fois le terme "Datawarehouse". Free Powerpoint Templates Page 11
  12. 12. Historique du Data Warehouse• 1990 : Red Brick Systems crée Red Brick Warehouse, un système spécifiquement dédié à la construction de lEntrepôt de données.• 1991 : Bill Inmon publie Building the Data Warehouse (Construire lEntrepôt de Données).• 1995 : Le Data Warehousing Institute, une organisation à but lucratif destinée à promouvoir le datawarehousing, est fondé.• 1996 : Ralph Kimball publie The Data Warehouse Toolkit (La boîte à outils de lEntrepôt de données). Free Powerpoint Templates Page 12
  13. 13. Structure du Data WarehouseFree Powerpoint Templates Page 13
  14. 14. Structure du DATA WAREHOUSE Le Data Warehouse se structure en quatre classes de données, organisées selon un axe historique est un axe synthétique. Free Powerpoint Templates Page 14
  15. 15. Structure du DATA WAREHOUSE Les données agrégées Les méta- données DATA WAREHOUSE Les données détaillées Les données historisées Free Powerpoint Templates Page 15
  16. 16. Données détaillées• Elles reflètent les évènements les plus récents.• Les données provenant des systèmes de production sont intégrées à ce niveau. Free Powerpoint Templates Page 16
  17. 17. Données agrégées• Elles correspondent à des éléments danalyse représentatifs des besoins des utilisateurs.• Ce sont donc des données déjà traitées par le système et représentant un premier résultat danalyse et de synthèse des données contenues dans les systèmes de production.• Elles doivent être facilement accessibles et compréhensibles. Free Powerpoint Templates Page 17
  18. 18. Données historisées• Chaque nouvelle insertion dans le Data Warehouse ne détruit pas les anciennes valeurs mais cré une nouvelle insertion. Free Powerpoint Templates Page 18
  19. 19. Méta-données• Il sagit « de données sur les données ». Elles décrivent les règles ou processus attachés aux données du système.• Il permet aussi de faciliter la recherche de données. Free Powerpoint Templates Page 19
  20. 20. Concept du Data WarehouseFree Powerpoint Templates Page 20
  21. 21. Concept du Data Warehouse Orientée sujet Données intégrées DATA WAREHOUSEDonnées non volatiles Données datées Free Powerpoint Templates Page 21
  22. 22. Concept du Data Warehouse• Données orientées sujet : • Regroupe les informations des différents métiers • Ne tiens pas compte de l’organisation fonctionnelle des données Ass. Vie Ass. Auto Ass. Santé Client Police Free Powerpoint Templates Page 22
  23. 23. Concept du Data Warehouse• Données intégrées : • Normalisation des données • Définition d’un référentiel unique h,f 1,0 h,f homme, femme GBP EUR CHF USD Free Powerpoint Templates Page 23
  24. 24. Concept du Data Warehouse• Données non volatiles : • Traçabilité des informations et des décisions prises • Copie des données de production Bases de production Entrepôts de données Ajout Suppression Accès Modification Chargement Free Powerpoint Templates Page 24
  25. 25. Concept du Data Warehouse • Données datées : • Les données persistent dans le temps • Mise en place d’un référentiel temps Image de la base en Mai 2005 Image de la base en Juillet 2006 Répertoire RépertoireBase de Nom Ville Nom Villeproduction Dupont Paris Dupont Marseille Durand Lyon Durand Lyon Calendrier Répertoire Entrepôt Code Année Mois Code Année Mois de 1 2005 Mai 1 Dupont Paris données 2 2006 Juillet 1 Durand Lyon Free Powerpoint2Templates Dupont Marseille Page 25
  26. 26. Les aspects techniquesFree Powerpoint Templates Page 26
  27. 27. Les aspects techniques du DW 1. Les bases de données • OLAP (On-Line Analitical Processing) • C’est un mode de stockage prévu pour l’analyse statistique des données contenues dans la base; • Il est appliqué à un modèle virtuel de représentation de donnée appelé cube ou hypercube OLAP. Free Powerpoint Templates Page 27
  28. 28. Les aspects techniques du DW• OLTP (On-Line Transactional Processing) • C’est un mode de stockage fait pour les systèmes opérationnels; • Ils supportent très bien une utilisation transactionnelle de la base de données; • À ce mode de stockage est associé des requêtes type courtes et ne demandant pas beaucoup de ressource du côté du serveur de la base de données. Free Powerpoint Templates Page 28
  29. 29. Les aspects techniques du DW 2. Modélisation• Les tables de dimensions - Elles contiennent les données qui permettent de définir un axe d’une étude. - Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE.• Les tables de faits - Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE. Free Powerpoint Templates Page 29
  30. 30. Les aspects techniques du DW• Les tables dagrégats - Ces tables sont spéciales, elles permettent de simplifier le travail de restitution des logiciels d’analyse; - Elles contiennent des données à un niveau de granularité plus grand que dans les tables de faits; Free Powerpoint Templates Page 30
  31. 31. Les aspects techniques du DW 3. Les types de modèle Modèle en étoile Modèle Free Powerpoint Templates en flocon Page 31
  32. 32. Modèle en étoile• Une table de fait centrale et des dimensions• Les dimensions n’ont pas de liaison entre elles• Avantages – Facilité de navigation – Nombre de jointures limité• Inconvénients – Redondance dans les dimensions – Toutes les dimensions ne concernent pas les mesures Free Powerpoint Templates Page 32
  33. 33. Modèle en étoile Dimension Temps ID temps année mois Dimension produit jour ID produitDimension Magasin … ID magasin nom description code ville Table de faits Achat prix surface ID client poids ID temps groupe … ID magasin famille ID région … ID produit Dimension Region Quantité achetée Dimension Client ID région Montant des achats ID client pays nom description prénom district vente adresse …. Free Powerpoint Templates … Page 33
  34. 34. Modèle en flocon• Une table de fait et des dimensions décomposées en sous hiérarchies.• On a un seul niveau hiérarchique dans une table de dimension.• La table de dimension de niveau hiérarchique le plus bas est reliée à la table de fait. On dit qu’elle a la granularité la plus fine.• Avantages – Normalisation des dimensions – Économie d’espace disque• Inconvénients – Modèle plus complexe (jointure) – Requêtes moins performantes Free Powerpoint Templates Page 34
  35. 35. Dimension produit ID produit Dimension Temps ID groupe ID temps nom annee code mois prixDimension Magasin jour Dimension groupe poids ID magasin … ID groupe … description ID famille ville Table de faits Achat nom surface ID client ID temps … … ID magasin Dimension Region ID région ID région Dimension Famille ID produit ID division vente ID famille Quantité achetée pays Montant des achats nom description … …. Dimension Client Dimension ID client Division vente nomID division vente prénom description Free Powerpoint Templates adresse …. Page 35 …
  36. 36. SGBD et DWFree Powerpoint Templates Page 36
  37. 37. SGBD et DW Service Service ServiceOLTP: On-Line commercial Financier livraisonTransactional BD prod BD prod BD prodProcessing Clientèle H I Data Warehouse S TOLAP: On-Line OAnalitical R Clientèle IProcessing Q U Free Powerpoint Templates E Page 37
  38. 38. SGBD et DWOLTP DWOrienté transaction Orienté analyseOrienté application Orienté sujetDonnées courantes Données historiséesDonnées détaillées Données agrégéesDonnées évolutives Données statiquesUtilisateurs nombreux, Utilisateurs peu nombreux,administrateurs/opérationnels managerTemps d’exécution: court Temps d’exécution: long Free Powerpoint Templates Page 38
  39. 39. SGBD et DW Free Powerpoint Templates Page 39
  40. 40. ConclusionFree Powerpoint Templates Page 40
  41. 41. Conclusion• L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans le monde de l’entreprise, demande qui répond au besoin toujours plus présent des utilisateurs d’avoir les bonnes informations au bon moment. Free Powerpoint Templates Page 41
  42. 42. WebographieFree Powerpoint Templates Page 42
  43. 43. Webographiewww.wikipédia.orgwww.supinfo.com Introdution au DataWareHouse.htm l’auteur Nicolas GUILLOTwww.ultrafluide.comwww.journaldunet.comwww.lincoln.fr Free Powerpoint Templates Page 43
  44. 44. Free Powerpoint Templates Page 44

×