SlideShare une entreprise Scribd logo
1  sur  44
Télécharger pour lire hors ligne
Data Warehouse
« Entrepôt de données »




    Free Powerpoint Templates
                                Page 1
Plan

•   Introduction
•   Définition
•   Objectifs
•   Historique
•   Structure du Data Warehouse
•   Concept du Data Warehouse
•   Les aspects techniques
•   SGBD et DW
•   Conclusion
           Free Powerpoint Templates
                                       Page 2
Introduction




Free Powerpoint Templates
                            Page 3
Introduction
• On qualifie d'informatique décisionnelle (en
 anglais « Business intelligence », parfois
 appelé tout simplement « le décisionnel »)
 l'exploitation des données de l'entreprise dans le
 but de faciliter la prise de décision par les
 décideurs, c'est-à-dire la compréhension du
 fonctionnement      actuel      et    l'anticipation   des
 actions pour un pilotage éclairé de l'entreprise.
               Free Powerpoint Templates
                                                    Page 4
Introduction

• Les outils décisionnels comme le Data
  Warehouse et le Data Mining sont basés
  sur       l'exploitation d'un     système
  d'information décisionnel alimenté grâce à
  l'extraction de données diverses à partir
  des données de production, d'informations
  concernant l'entreprise ou son entourage
  et de données économiques.

             Free Powerpoint Templates
                                         Page 5
Définition




Free Powerpoint Templates
                            Page 6
Définition


 W.B.Inmon
 « Le data Warehouse est une collection
 de données orientées sujet, intégrées,
 non     volatiles     et    historisées,
 organisées pour le support d’un
 processus d’aide à la décision »

          Free Powerpoint Templates
                                      Page 7
Objectifs




Free Powerpoint Templates
                            Page 8
Objectifs d’une Data Warehouse


  • Intégrer différentes bases de données
    opérationnelles;
  • Permettre l’accès aux informations historisées;
  • Fournir des outils d ’analyse sur ces données;
  • Résumer les données;
  • Réconcilier des données inconsistantes.


                 Free Powerpoint Templates
                                             Page 9
Historique




Free Powerpoint Templates
                            Page 10
Historique du Data Warehouse

• Années 1960 : Genral Mills et l‘Université Dartmouth,
  dans un projet conjoint, créent les termes "faits" et
  "dimensions".
• 1983 : Teradata introduit dans sa base de données
  managériale un système exclusivement destiné à la
  prise de décision.
• 1988 : Barry Devlin et Paul Murphy publient l'article
  "Une architecture pour les systèmes d'information
  financiers" ("An architecture for a business and
  information systems") où ils utilisent pour la première fois
  le terme "Datawarehouse".
                   Free Powerpoint Templates
                                                       Page 11
Historique du Data Warehouse

• 1990 : Red Brick Systems crée Red Brick
  Warehouse, un système spécifiquement dédié à la
  construction de l'Entrepôt de données.
• 1991 : Bill Inmon publie Building the Data
  Warehouse (Construire l'Entrepôt de Données).
• 1995 : Le Data Warehousing Institute, une
  organisation à but lucratif destinée à promouvoir le
  datawarehousing, est fondé.
• 1996 : Ralph Kimball publie The Data Warehouse
  Toolkit (La boîte à outils de l'Entrepôt de données).

                 Free Powerpoint Templates
                                                 Page 12
Structure du Data
    Warehouse




Free Powerpoint Templates
                            Page 13
Structure du DATA WAREHOUSE



   Le Data Warehouse se structure en quatre
   classes de données, organisées selon un
   axe historique est un axe synthétique.




             Free Powerpoint Templates
                                         Page 14
Structure du DATA WAREHOUSE


  Les données agrégées                                Les méta- données




                      DATA WAREHOUSE



 Les données détaillées                                 Les données historisées




                          Free Powerpoint Templates
                                                                      Page 15
Données détaillées



• Elles reflètent les évènements les plus
  récents.
• Les données provenant des systèmes
  de production sont intégrées à ce
  niveau.


           Free Powerpoint Templates
                                       Page 16
Données agrégées

• Elles correspondent à des éléments d'analyse
  représentatifs des besoins des utilisateurs.

• Ce sont donc des données déjà traitées par le
  système et représentant un premier résultat
  d'analyse et de synthèse des données
  contenues dans les systèmes de production.

• Elles doivent être facilement accessibles et
  compréhensibles.
            Free Powerpoint Templates
                                        Page 17
Données historisées



• Chaque nouvelle insertion dans le Data
  Warehouse ne détruit pas les anciennes
  valeurs mais cré une nouvelle insertion.




            Free Powerpoint Templates
                                        Page 18
Méta-données


• Il s'agit « de données sur les données ».
  Elles décrivent les règles ou processus
  attachés aux données du système.
• Il permet aussi de faciliter la recherche de
  données.


              Free Powerpoint Templates
                                          Page 19
Concept du Data
  Warehouse




Free Powerpoint Templates
                            Page 20
Concept du Data Warehouse

      Orientée sujet                       Données intégrées




                       DATA WAREHOUSE




Données non volatiles                     Données datées

                        Free Powerpoint Templates
                                                               Page 21
Concept du Data Warehouse

• Données orientées sujet :
    •   Regroupe les informations des différents métiers
    •   Ne tiens pas compte de l’organisation
        fonctionnelle des données

            Ass. Vie       Ass. Auto    Ass. Santé

                                                     Client
                                                     Police




                       Free Powerpoint Templates
                                                              Page 22
Concept du Data Warehouse

• Données intégrées :
    •     Normalisation des données
    •     Définition d’un référentiel unique
    h,f

    1,0                                          h,f

    homme, femme

    GBP
                                                 EUR
    CHF

    USD              Free Powerpoint Templates
                                                       Page 23
Concept du Data Warehouse

• Données non volatiles :
      •   Traçabilité des informations et des décisions
          prises
      •   Copie des données de production
     Bases de production              Entrepôts de données

  Ajout
                Suppression

                                                             Accès
 Modification                     Chargement


                      Free Powerpoint Templates
                                                              Page 24
Concept du Data Warehouse

   • Données datées :
             •    Les données persistent dans le temps
             •    Mise en place d’un référentiel temps
                 Image de la base en Mai 2005        Image de la base en Juillet 2006
                     Répertoire                          Répertoire
Base de              Nom          Ville                 Nom         Ville
production
                       Dupont       Paris               Dupont     Marseille
                       Durand       Lyon                Durand     Lyon

                   Calendrier                       Répertoire
 Entrepôt                                       Code Année        Mois
                   Code Année        Mois
 de
                   1       2005      Mai        1        Dupont   Paris
 données
                   2       2006       Juillet    1     Durand     Lyon
                                  Free Powerpoint2Templates
                                                       Dupont     Marseille    Page 25
Les aspects
   techniques




Free Powerpoint Templates
                            Page 26
Les aspects techniques du DW

         1. Les bases de données

 • OLAP (On-Line Analitical Processing)
     • C’est un mode de stockage prévu pour l’analyse
       statistique des données contenues dans la base;
     • Il est appliqué à un modèle virtuel de
       représentation de donnée     appelé   cube     ou
       hypercube OLAP.


                Free Powerpoint Templates
                                                 Page 27
Les aspects techniques du DW

• OLTP (On-Line Transactional Processing)
    • C’est un mode de stockage fait pour les systèmes
      opérationnels;
    • Ils   supportent  très   bien    une    utilisation
      transactionnelle de la base de données;
    • À ce mode de stockage est associé des requêtes
      type courtes et ne demandant pas beaucoup de
      ressource du côté du serveur de la base de
      données.

               Free Powerpoint Templates
                                                  Page 28
Les aspects techniques du DW

               2. Modélisation
• Les tables de dimensions
    - Elles contiennent les données qui permettent de
    définir un axe d’une étude.
    - Ce type de tables joue le rôle de référentiel au
    DATA WAREHOUSE.
• Les tables de faits
  - Comme leur nom l’indique, Ces tables contiennent
    uniquement les données factuelles du DATA
    WAREHOUSE.
               Free Powerpoint Templates
                                               Page 29
Les aspects techniques du DW


• Les tables d'agrégats
     - Ces tables sont spéciales, elles permettent
       de simplifier le travail de restitution des
       logiciels d’analyse;
     - Elles contiennent des données à un niveau
       de granularité plus grand que dans les
       tables de faits;


               Free Powerpoint Templates
                                            Page 30
Les aspects techniques du DW
           3. Les types de modèle




 Modèle en étoile                      Modèle
                    Free Powerpoint Templates   en flocon
                                                            Page 31
Modèle en étoile

• Une table de fait centrale et des dimensions
• Les dimensions n’ont pas de liaison entre elles
• Avantages
   – Facilité de navigation
   – Nombre de jointures limité
• Inconvénients
   – Redondance dans les dimensions
   – Toutes les dimensions ne concernent pas les
     mesures
               Free Powerpoint Templates
                                           Page 32
Modèle en étoile
                        Dimension Temps
                           ID temps
                            année
                             mois
                                                    Dimension produit
                              jour
                                                       ID produit
Dimension Magasin              …
   ID magasin                                             nom
   description                                            code
       ville            Table de faits Achat               prix
     surface                   ID client                  poids
                              ID temps                  groupe
        …                   ID magasin                   famille
                              ID région                     …
                             ID produit
 Dimension Region        Quantité achetée      Dimension Client
     ID région          Montant des achats        ID client
        pays                                        nom
    description                                    prénom
   district vente                                 adresse
         ….            Free Powerpoint Templates      …
                                                                  Page 33
Modèle en flocon
• Une table de fait et des dimensions décomposées en
  sous hiérarchies.
• On a un seul niveau hiérarchique dans une table de
  dimension.
• La table de dimension de niveau hiérarchique le plus bas
  est reliée à la table de fait. On dit qu’elle a la granularité
  la plus fine.
• Avantages
   – Normalisation des dimensions
   – Économie d’espace disque
• Inconvénients
   – Modèle plus complexe (jointure)
   – Requêtes moins performantes
                    Free Powerpoint Templates
                                                        Page 34
Dimension produit
                                                 ID produit
                        Dimension Temps          ID groupe
                            ID temps                nom
                              annee                code
                               mois                 prix
Dimension Magasin              jour                                   Dimension groupe
                                                   poids
    ID magasin                  …                                        ID groupe
                                                     …
     description                                                         ID famille
         ville                        Table de faits Achat
                                                                            nom
       surface                               ID client
                                            ID temps                         …
          …
                                          ID magasin
               Dimension Region             ID région
                    ID région                                           Dimension Famille
                                           ID produit
                ID division vente                                           ID famille
                                       Quantité achetée
                      pays            Montant des achats                       nom
                   description                                                  …
                       ….                              Dimension Client
   Dimension
                                                           ID client
 Division vente
                                                             nom
ID division vente
                                                           prénom
   description                      Free Powerpoint Templates
                                                           adresse
       ….                                                                        Page 35
                                                              …
SGBD et DW




Free Powerpoint Templates
                            Page 36
SGBD et DW
                  Service           Service         Service
OLTP: On-Line   commercial         Financier       livraison
Transactional    BD prod            BD prod        BD prod
Processing
                                     Clientèle


                                                          H
                                                          I
                               Data Warehouse             S
                                                          T
OLAP: On-Line                                             O
Analitical                                                R
                                    Clientèle             I
Processing
                                                          Q
                                                          U
                       Free Powerpoint Templates          E
                                                           Page 37
SGBD et DW

OLTP                               DW
Orienté transaction                Orienté analyse
Orienté application                Orienté sujet
Données courantes                  Données historisées
Données détaillées                 Données agrégées
Données évolutives                 Données statiques
Utilisateurs nombreux,             Utilisateurs peu nombreux,
administrateurs/opérationnels      manager
Temps d’exécution: court           Temps d’exécution: long
                      Free Powerpoint Templates
                                                         Page 38
SGBD et DW




 Free Powerpoint Templates
                             Page 39
Conclusion




Free Powerpoint Templates
                            Page 40
Conclusion


• L’utilisation des DATAWAREHOUSE est
  aujourd’hui très demandé dans le monde
  de l’entreprise, demande qui répond au
  besoin toujours plus présent des
  utilisateurs d’avoir les bonnes informations
  au bon moment.


              Free Powerpoint Templates
                                          Page 41
Webographie




Free Powerpoint Templates
                            Page 42
Webographie

www.wikipédia.org
www.supinfo.com Introdution au
 DataWareHouse.htm l’auteur Nicolas GUILLOT
www.ultrafluide.com
www.journaldunet.com
www.lincoln.fr

                  Free Powerpoint Templates
                                              Page 43
Free Powerpoint Templates
                            Page 44

Contenu connexe

Tendances

Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olapCynapsys It Hotspot
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouseHassane Dkhissi
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi AfnouchAhmed
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -IliasAEA
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3Amal Abid
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETLLilia Sfaxi
 
Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Ines Ben Kahla
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BISaid Sadik
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 

Tendances (20)

Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouse
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 

En vedette

Business Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingBusiness Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingSamia NACIRI
 
Big Data: Movement, Warehousing, & Virtualization
Big Data: Movement, Warehousing, & VirtualizationBig Data: Movement, Warehousing, & Virtualization
Big Data: Movement, Warehousing, & Virtualizationtervela
 
Objets connectés et quantified self 21082013
Objets connectés et quantified self 21082013Objets connectés et quantified self 21082013
Objets connectés et quantified self 21082013Brice Nadin
 
Vivez plus longtemps et mieux avec le m-health
Vivez plus longtemps et mieux avec le m-healthVivez plus longtemps et mieux avec le m-health
Vivez plus longtemps et mieux avec le m-healthOrange Business Services
 
Data warehousing and data mining
Data warehousing and data miningData warehousing and data mining
Data warehousing and data miningSnehali Chake
 
IESA - Introduction à la Veille Stratégique Digitale
IESA - Introduction à la Veille Stratégique DigitaleIESA - Introduction à la Veille Stratégique Digitale
IESA - Introduction à la Veille Stratégique DigitaleMedhi Corneille Famibelle*
 
Data Warehousing 3 Feet Deep
Data Warehousing 3 Feet DeepData Warehousing 3 Feet Deep
Data Warehousing 3 Feet DeepRien Matthijsse
 
E-HEALTH 2016 - Sierre - Switzerland
E-HEALTH 2016 - Sierre - SwitzerlandE-HEALTH 2016 - Sierre - Switzerland
E-HEALTH 2016 - Sierre - SwitzerlandPascal Cretton
 
Alfresco 4.0 en français
Alfresco 4.0 en françaisAlfresco 4.0 en français
Alfresco 4.0 en françaisMichael Harlaut
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUB INSTITUTE
 
DATA WAREHOUSING
DATA WAREHOUSINGDATA WAREHOUSING
DATA WAREHOUSINGKing Julian
 
Data Warehouse Modeling
Data Warehouse ModelingData Warehouse Modeling
Data Warehouse Modelingvivekjv
 

En vedette (16)

Les usines à logiciels
Les usines à logicielsLes usines à logiciels
Les usines à logiciels
 
Symbian OS
Symbian OSSymbian OS
Symbian OS
 
Business Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingBusiness Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarking
 
Big Data: Movement, Warehousing, & Virtualization
Big Data: Movement, Warehousing, & VirtualizationBig Data: Movement, Warehousing, & Virtualization
Big Data: Movement, Warehousing, & Virtualization
 
Objets connectés et quantified self 21082013
Objets connectés et quantified self 21082013Objets connectés et quantified self 21082013
Objets connectés et quantified self 21082013
 
Vivez plus longtemps et mieux avec le m-health
Vivez plus longtemps et mieux avec le m-healthVivez plus longtemps et mieux avec le m-health
Vivez plus longtemps et mieux avec le m-health
 
IESA culture digitale - cours 2
IESA culture digitale - cours 2IESA culture digitale - cours 2
IESA culture digitale - cours 2
 
Data warehousing and data mining
Data warehousing and data miningData warehousing and data mining
Data warehousing and data mining
 
IESA - culture digitale - cours 1
IESA - culture digitale - cours 1IESA - culture digitale - cours 1
IESA - culture digitale - cours 1
 
IESA - Introduction à la Veille Stratégique Digitale
IESA - Introduction à la Veille Stratégique DigitaleIESA - Introduction à la Veille Stratégique Digitale
IESA - Introduction à la Veille Stratégique Digitale
 
Data Warehousing 3 Feet Deep
Data Warehousing 3 Feet DeepData Warehousing 3 Feet Deep
Data Warehousing 3 Feet Deep
 
E-HEALTH 2016 - Sierre - Switzerland
E-HEALTH 2016 - Sierre - SwitzerlandE-HEALTH 2016 - Sierre - Switzerland
E-HEALTH 2016 - Sierre - Switzerland
 
Alfresco 4.0 en français
Alfresco 4.0 en françaisAlfresco 4.0 en français
Alfresco 4.0 en français
 
HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]HUBREPORT - Future of Data & CRM [EXTRAIT]
HUBREPORT - Future of Data & CRM [EXTRAIT]
 
DATA WAREHOUSING
DATA WAREHOUSINGDATA WAREHOUSING
DATA WAREHOUSING
 
Data Warehouse Modeling
Data Warehouse ModelingData Warehouse Modeling
Data Warehouse Modeling
 

Similaire à Data warehouse

Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentCarlos Sanin
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna Borgi
 
CHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfamine17157
 
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Excelerate Systems
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big DataIdriss22
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprisesAymen ZAAFOURI
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...Micropole Group
 
Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseBEL MRHAR Mohamed Amine
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptxSamirAwad14
 
Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014Laurent LETOURMY
 
Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014Start and Growth
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Denodo
 
Dataw formation-data-warehouse-et-systemes-d-aide-a-la-decision
Dataw formation-data-warehouse-et-systemes-d-aide-a-la-decisionDataw formation-data-warehouse-et-systemes-d-aide-a-la-decision
Dataw formation-data-warehouse-et-systemes-d-aide-a-la-decisionCERTyou Formation
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyOxalide
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 

Similaire à Data warehouse (20)

Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - student
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouse
 
CHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdf
 
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
1-Intro to DB.pptx
1-Intro to DB.pptx1-Intro to DB.pptx
1-Intro to DB.pptx
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
 
Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouse
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptx
 
Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014
 
Big data
Big dataBig data
Big data
 
Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014Ysance - Salon Big Data 2014
Ysance - Salon Big Data 2014
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
Dataw formation-data-warehouse-et-systemes-d-aide-a-la-decision
Dataw formation-data-warehouse-et-systemes-d-aide-a-la-decisionDataw formation-data-warehouse-et-systemes-d-aide-a-la-decision
Dataw formation-data-warehouse-et-systemes-d-aide-a-la-decision
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
 
Business intelligence QLIKVIEW
Business intelligence QLIKVIEWBusiness intelligence QLIKVIEW
Business intelligence QLIKVIEW
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 

Data warehouse

  • 1. Data Warehouse « Entrepôt de données » Free Powerpoint Templates Page 1
  • 2. Plan • Introduction • Définition • Objectifs • Historique • Structure du Data Warehouse • Concept du Data Warehouse • Les aspects techniques • SGBD et DW • Conclusion Free Powerpoint Templates Page 2
  • 4. Introduction • On qualifie d'informatique décisionnelle (en anglais « Business intelligence », parfois appelé tout simplement « le décisionnel ») l'exploitation des données de l'entreprise dans le but de faciliter la prise de décision par les décideurs, c'est-à-dire la compréhension du fonctionnement actuel et l'anticipation des actions pour un pilotage éclairé de l'entreprise. Free Powerpoint Templates Page 4
  • 5. Introduction • Les outils décisionnels comme le Data Warehouse et le Data Mining sont basés sur l'exploitation d'un système d'information décisionnel alimenté grâce à l'extraction de données diverses à partir des données de production, d'informations concernant l'entreprise ou son entourage et de données économiques. Free Powerpoint Templates Page 5
  • 7. Définition  W.B.Inmon « Le data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision » Free Powerpoint Templates Page 7
  • 9. Objectifs d’une Data Warehouse • Intégrer différentes bases de données opérationnelles; • Permettre l’accès aux informations historisées; • Fournir des outils d ’analyse sur ces données; • Résumer les données; • Réconcilier des données inconsistantes. Free Powerpoint Templates Page 9
  • 11. Historique du Data Warehouse • Années 1960 : Genral Mills et l‘Université Dartmouth, dans un projet conjoint, créent les termes "faits" et "dimensions". • 1983 : Teradata introduit dans sa base de données managériale un système exclusivement destiné à la prise de décision. • 1988 : Barry Devlin et Paul Murphy publient l'article "Une architecture pour les systèmes d'information financiers" ("An architecture for a business and information systems") où ils utilisent pour la première fois le terme "Datawarehouse". Free Powerpoint Templates Page 11
  • 12. Historique du Data Warehouse • 1990 : Red Brick Systems crée Red Brick Warehouse, un système spécifiquement dédié à la construction de l'Entrepôt de données. • 1991 : Bill Inmon publie Building the Data Warehouse (Construire l'Entrepôt de Données). • 1995 : Le Data Warehousing Institute, une organisation à but lucratif destinée à promouvoir le datawarehousing, est fondé. • 1996 : Ralph Kimball publie The Data Warehouse Toolkit (La boîte à outils de l'Entrepôt de données). Free Powerpoint Templates Page 12
  • 13. Structure du Data Warehouse Free Powerpoint Templates Page 13
  • 14. Structure du DATA WAREHOUSE Le Data Warehouse se structure en quatre classes de données, organisées selon un axe historique est un axe synthétique. Free Powerpoint Templates Page 14
  • 15. Structure du DATA WAREHOUSE Les données agrégées Les méta- données DATA WAREHOUSE Les données détaillées Les données historisées Free Powerpoint Templates Page 15
  • 16. Données détaillées • Elles reflètent les évènements les plus récents. • Les données provenant des systèmes de production sont intégrées à ce niveau. Free Powerpoint Templates Page 16
  • 17. Données agrégées • Elles correspondent à des éléments d'analyse représentatifs des besoins des utilisateurs. • Ce sont donc des données déjà traitées par le système et représentant un premier résultat d'analyse et de synthèse des données contenues dans les systèmes de production. • Elles doivent être facilement accessibles et compréhensibles. Free Powerpoint Templates Page 17
  • 18. Données historisées • Chaque nouvelle insertion dans le Data Warehouse ne détruit pas les anciennes valeurs mais cré une nouvelle insertion. Free Powerpoint Templates Page 18
  • 19. Méta-données • Il s'agit « de données sur les données ». Elles décrivent les règles ou processus attachés aux données du système. • Il permet aussi de faciliter la recherche de données. Free Powerpoint Templates Page 19
  • 20. Concept du Data Warehouse Free Powerpoint Templates Page 20
  • 21. Concept du Data Warehouse Orientée sujet Données intégrées DATA WAREHOUSE Données non volatiles Données datées Free Powerpoint Templates Page 21
  • 22. Concept du Data Warehouse • Données orientées sujet : • Regroupe les informations des différents métiers • Ne tiens pas compte de l’organisation fonctionnelle des données Ass. Vie Ass. Auto Ass. Santé Client Police Free Powerpoint Templates Page 22
  • 23. Concept du Data Warehouse • Données intégrées : • Normalisation des données • Définition d’un référentiel unique h,f 1,0 h,f homme, femme GBP EUR CHF USD Free Powerpoint Templates Page 23
  • 24. Concept du Data Warehouse • Données non volatiles : • Traçabilité des informations et des décisions prises • Copie des données de production Bases de production Entrepôts de données Ajout Suppression Accès Modification Chargement Free Powerpoint Templates Page 24
  • 25. Concept du Data Warehouse • Données datées : • Les données persistent dans le temps • Mise en place d’un référentiel temps Image de la base en Mai 2005 Image de la base en Juillet 2006 Répertoire Répertoire Base de Nom Ville Nom Ville production Dupont Paris Dupont Marseille Durand Lyon Durand Lyon Calendrier Répertoire Entrepôt Code Année Mois Code Année Mois de 1 2005 Mai 1 Dupont Paris données 2 2006 Juillet 1 Durand Lyon Free Powerpoint2Templates Dupont Marseille Page 25
  • 26. Les aspects techniques Free Powerpoint Templates Page 26
  • 27. Les aspects techniques du DW 1. Les bases de données • OLAP (On-Line Analitical Processing) • C’est un mode de stockage prévu pour l’analyse statistique des données contenues dans la base; • Il est appliqué à un modèle virtuel de représentation de donnée appelé cube ou hypercube OLAP. Free Powerpoint Templates Page 27
  • 28. Les aspects techniques du DW • OLTP (On-Line Transactional Processing) • C’est un mode de stockage fait pour les systèmes opérationnels; • Ils supportent très bien une utilisation transactionnelle de la base de données; • À ce mode de stockage est associé des requêtes type courtes et ne demandant pas beaucoup de ressource du côté du serveur de la base de données. Free Powerpoint Templates Page 28
  • 29. Les aspects techniques du DW 2. Modélisation • Les tables de dimensions - Elles contiennent les données qui permettent de définir un axe d’une étude. - Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE. • Les tables de faits - Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE. Free Powerpoint Templates Page 29
  • 30. Les aspects techniques du DW • Les tables d'agrégats - Ces tables sont spéciales, elles permettent de simplifier le travail de restitution des logiciels d’analyse; - Elles contiennent des données à un niveau de granularité plus grand que dans les tables de faits; Free Powerpoint Templates Page 30
  • 31. Les aspects techniques du DW 3. Les types de modèle Modèle en étoile Modèle Free Powerpoint Templates en flocon Page 31
  • 32. Modèle en étoile • Une table de fait centrale et des dimensions • Les dimensions n’ont pas de liaison entre elles • Avantages – Facilité de navigation – Nombre de jointures limité • Inconvénients – Redondance dans les dimensions – Toutes les dimensions ne concernent pas les mesures Free Powerpoint Templates Page 32
  • 33. Modèle en étoile Dimension Temps ID temps année mois Dimension produit jour ID produit Dimension Magasin … ID magasin nom description code ville Table de faits Achat prix surface ID client poids ID temps groupe … ID magasin famille ID région … ID produit Dimension Region Quantité achetée Dimension Client ID région Montant des achats ID client pays nom description prénom district vente adresse …. Free Powerpoint Templates … Page 33
  • 34. Modèle en flocon • Une table de fait et des dimensions décomposées en sous hiérarchies. • On a un seul niveau hiérarchique dans une table de dimension. • La table de dimension de niveau hiérarchique le plus bas est reliée à la table de fait. On dit qu’elle a la granularité la plus fine. • Avantages – Normalisation des dimensions – Économie d’espace disque • Inconvénients – Modèle plus complexe (jointure) – Requêtes moins performantes Free Powerpoint Templates Page 34
  • 35. Dimension produit ID produit Dimension Temps ID groupe ID temps nom annee code mois prix Dimension Magasin jour Dimension groupe poids ID magasin … ID groupe … description ID famille ville Table de faits Achat nom surface ID client ID temps … … ID magasin Dimension Region ID région ID région Dimension Famille ID produit ID division vente ID famille Quantité achetée pays Montant des achats nom description … …. Dimension Client Dimension ID client Division vente nom ID division vente prénom description Free Powerpoint Templates adresse …. Page 35 …
  • 36. SGBD et DW Free Powerpoint Templates Page 36
  • 37. SGBD et DW Service Service Service OLTP: On-Line commercial Financier livraison Transactional BD prod BD prod BD prod Processing Clientèle H I Data Warehouse S T OLAP: On-Line O Analitical R Clientèle I Processing Q U Free Powerpoint Templates E Page 37
  • 38. SGBD et DW OLTP DW Orienté transaction Orienté analyse Orienté application Orienté sujet Données courantes Données historisées Données détaillées Données agrégées Données évolutives Données statiques Utilisateurs nombreux, Utilisateurs peu nombreux, administrateurs/opérationnels manager Temps d’exécution: court Temps d’exécution: long Free Powerpoint Templates Page 38
  • 39. SGBD et DW Free Powerpoint Templates Page 39
  • 41. Conclusion • L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans le monde de l’entreprise, demande qui répond au besoin toujours plus présent des utilisateurs d’avoir les bonnes informations au bon moment. Free Powerpoint Templates Page 41
  • 43. Webographie www.wikipédia.org www.supinfo.com Introdution au DataWareHouse.htm l’auteur Nicolas GUILLOT www.ultrafluide.com www.journaldunet.com www.lincoln.fr Free Powerpoint Templates Page 43