Cous « Entrepôts de Données »
2ème LIG, parcours EB et BI
Chapitre 1 : Les Entrepôts de Données
Ministère de l’Enseignement Supérieur
Université de Sfax
Institut Supérieur d’Administration des Affaires
Dr. Mohamed Mkaouar
2021-2022
Plan
1. Les Bases de Données
2. Les Entrepôts de Données
3. Architecture d’un système d’information
4. Principe des Systèmes décisionnels
5. Définitions de base pour les Entrepôts de Données
6. Comparatif Bases de Données et Entrepôts de données
7. Vue globale des solutions informatique pour les
Entrepôts de Données
24/01/2022 Dr. Mohamed Mkaouar 2
Une Base de Données (BD) sert comme support de stockage des
données d’une application :
➢ Gestion des ventes (on enregistre les données sur les Clients,
les Fournisseurs, les Factures, …)
➢ Gestion des ressources humaines (on enregistre les données
sur le Personnel, la Paie, les Congés, …)
Dans les Bases de Données, les données sont modélisées selon le
modèle Relationnel ; un ensemble des tables (structurées en
colonnes et lignes) reliées entre elles par des clés primaires et
des clés étrangères.
24/01/2022 Dr. Mohamed Mkaouar 3
1.Les Bases de Données
Ces applications sont dites transactionnelles, OnLine
Transactional Processing (OLTP) en anglais.
Le rôle principal d’une application transactionnelle consiste à
enregistrer et de mettre à jour (modifier ou supprimer) un
ensemble de données.
Une Bases de Données est gérée par un Système de Gestion de
Bases de Données (SGBD). Les SGBD utilisent le langage SQL
(Structured Query Langage) pour créer et mettre à jour les BD.
Les développeurs utilisent SQL directement ou indirectement (à
travers des outils graphiques) pour créer et mettre à jour des BD.
24/01/2022 Dr. Mohamed Mkaouar 4
1.Les Bases de Données
L’interrogation dans une application transactionnelle consiste à
s’informer et à prendre de simples décisions.
Pour une application de vente, on utilise la BD correspondante
pour répondre à des questions comme :
Q1. La liste des produits.
Q2. Les quantités en stock par produit.
Q3. La liste des fournisseurs.
Q4. La liste des clients par région.
Q5. Les factures du mois de janvier.
24/01/2022 Dr. Mohamed Mkaouar 5
1.Les Bases de Données
Un Entrepôt de Données (ED), Data Warehouse en anglais, est
une source de données pour une application décisionnelle,
OnLine Analyticaal Processing (OLAP) en anglais.
Cette source de données est obtenue à partir des Bases de
Données des applications transactionnelles.
La BD est modélisée selon le modèle Relationnel, par contre
l’ED est modélisée selon un modèle Multidimensionnel.
En pratique, les traitements (requêtes) d’une application
décisionnelle ne peuvent pas être exécutées sur des données
structurées selon le modèle Relationnel.
24/01/2022 Dr. Mohamed Mkaouar 6
2. Les Entrepôts de Données
Le rôle principal d’une application décisionnelle consiste à
déterminer (par interrogation) des rapports de synthèse utiles à la
prise de décision.
Un Entrepôt de Données est géré par un Système de Gestion de
d’Entrepôts de Données (SGED) ou un Serveur OLAP.
La plupart des Serveurs OLAP utilisent le langage MDX
(Multidimensional Expression) pour créer et interroger les ED.
Les développeurs utilisent SQL ou MDX pour créer des ED,
mais l’interrogation est souvent effectuée à travers des
manipulations graphiques sans utiliser directement MDX.
24/01/2022 Dr. Mohamed Mkaouar 7
2. Les Entrepôts de Données
L’interrogation dans une application décisionnelle est orientée
vers la prise de décisions profondes.
Dans une activité de vente, par exemple, on utilise l’entrepôt de
données correspondant pour répondre à des questions comme :
Q1.Comment varie le chiffre d’affaires par produit et par
période ?
Q2. Quel est la marge bénéficiaire par produit pour chaque
promotion ?
Q3.Quel est le chiffre d’affaires par vendeur et par jour ?
24/01/2022 Dr. Mohamed Mkaouar 8
2. Les Entrepôts de Données
24/01/2022 Dr. Mohamed Mkaouar 9


BD
Fichiers
plats
Système d’Information
3. Architecture d’un Système d’information (1/3)
Sous-Système Transactionnel : OLTP
Rôle : Stockage et Maj des données
Sous-Système Décisionnel : OLAP
Rôle : Faciliter l’expression et la
compréhension des questions qui
aident à la prise de décision
24/01/2022 Dr. Mohamed Mkaouar 10


BD
Fichiers
plats
Système d’Information
Sous-Système Transactionnel Sous-Système Décisionnel Se basant sur
l’utilisation d’un Entrepôt de Données
Décideurs
Entrepôt de
Données
Outils
d’Alimentation Outils de Restitution
Cubes
OLAP
Extraction-Transformation-Chargement
Chargement
Actualisation Magasin de
Données
3. Architecture d’un Système d’information (2/3)
24/01/2022 Dr. Mohamed Mkaouar 11


BD
Fichiers
plats
Système d’Information
Sous-Système Transactionnel : OLTP
Rôle : Stockage et Maj des données
Sous-Système Décisionnel : OLAP
Rôle : Faciliter l’expression et la
compréhension des questions qui
aident à la prise de décision
Décideurs
Techniques de
Fouille de
Données
Analyse
Explication
Entrepôt de
Données
Outils
d’Alimentation Outils de Restitution
Cubes
OLAP
Extraction-Transformation-Chargement
Chargement
Actualisation Magasin de
Données
3. Architecture d’un Système d’information (3/3)
Les Systèmes Décisionnels (apparus vers les années 2000)
viennent pour pouvoir répondre à des questions
décisionnelles d’une manière simple et pour pouvoir
comprendre rapidement les réponses.
En effet, ces systèmes sont utilisés par les décideurs
(généralement non informaticiens) qui leur assistent dans la
prise de décisions ; l’utilisation de ces systèmes doit ainsi
être simple.
24/01/2022 Dr. Mohamed Mkaouar 12
4. Principe des Systèmes décisionnels (1/3)
Les données d’un Système d’Information Décisionnel (SID)
sont obtenues à partir des données du Système
d’Information Transactionnel (SIT) ; l’objectif étant de
déterminer une source de données permettant d’extraire des
connaissances, et ce, par l’Analyse ou
l’Explication de données.
Avec l’utilisation d’un Entrepôt de Données, les connaissances
sont extraites à partir de valeurs orienté sujets, modélisées
selon le modèle Multidimensionnel.
24/01/2022 Dr. Mohamed Mkaouar 13
4. Principe des Systèmes décisionnels (2/3)
Nous retenons la différence entre donnée et Connaissance
comme suit :
➢ Un donnée représente une information du monde réel :
le nom d’un enseignant, la moyenne d’un étudiant, …
➢ Une Connaissance apporte une information résultante
de l’analyse ou l’explication de données : les
notes en ED s’améliorent d’une année à l’autre, …
La découverte de connaissances est donc assurée par
l’analyse et/ou l’explication de données.
24/01/2022 Dr. Mohamed Mkaouar 14
4. Principe des Systèmes décisionnels (3/3)
« Un entrepôt de données ne s’achète pas, il se
construit. » (à partir des bases de production) -
Citation attribuée à Bill Inmon ; un des précurseurs
de la théorie des Entrepôt de Données.
Informatiquement parlant, un Entrepôt de Données
est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées
pour le support d’un processus d’aide à la décision
(Bill Inmon, 1994).
24/01/2022 Dr. Mohamed Mkaouar 15
5. Définitions de base pour les Entrepôt de
Données (1/5)
❑ Données orientées sujet : les données ne sont pas
enregistrées dans des tables (structure de deux
dimensions), mais plutôt dans des structures à n
dimensions ; ces structures sont utilisées pour
pouvoir analyser les indicateurs de performance
de l’activité concernée (Chiffre d’affaires, Coût
de production, Nbr. Employés, …), selon
plusieurs thèmes d’analyse (Date, Produit,
Clients, Point de vente, Ville, …).
24/01/2022 Dr. Mohamed Mkaouar 16
5. Définitions de base pour les Entrepôt de
Données (2/5)
❑ Données intégrées : les données provenant de différentes sources
hétérogènes doivent être intégrées. Ils doivent ainsi être converties,
reformatées et nettoyées.
❑ Données non volatiles : en lecture seule ; ces données ne
peuvent pas être mises à jour, mais ils peuvent être
actualisées depuis les bases de production (bases sources).
❑ Données historisées : les données d’un ED représentent l’activité
d’une organisation durant une certaine période (plusieurs années) ;
l’actualisation des données, depuis les bases de production, à des
dates différentes permet de conserver l’historique de toutes les
données dans l’ED.
24/01/2022 Dr. Mohamed Mkaouar 17
5. Définitions de base pour les Entrepôt de
Données (3/5)
Dans un SID qui se base sur l’utilisation d’un Entrepôt de Données,
on distingue deux (ou plusieurs) espaces de stockage : un Entrepôt
de Données et un (ou plusieurs) Magasins de Données.
Un Magasin de Données est un espace dédié à un métier ou une
analyse décisionnelle donnée.
Par contre, un Entrepôt de Données intègre l’ensemble des données
sources nécessaires à la prise de décisions.
Un Entrepôt de Données sert de support à l’élaboration de Magasins
de Données.
24/01/2022 Dr. Mohamed Mkaouar 18
5. Définitions de base pour les Entrepôt de
Données (4/5)
❑ Un ETC (Extraction-Transformation-Chargement):
est un Logiciel ou une partie d’un Logiciel, qui
permet d’effectuer l’Extraction des données à partir
des différentes sources, de les Transformer
éventuellement, puis de les Charger dans l’Entrepôt
de Données.
❑ Les outils de restitution permettent une
visualisation et une interprétation très simple des
résultats des requêtes décisionnelles.
24/01/2022 Dr. Mohamed Mkaouar 19
5. Définitions de base pour les Entrepôt de
Données (5/5)
6. Comparatif Bases de Données /
Entrepôts de Données (1/2)
Bases de Données Entrepôts de Données
Objectif
Stockage et MAJ
des Données
Facilite l’expression et la
compréhension des questions
qui aident à la prise de décisions
Sous-Système OLTP OLAP
Type d’accès Lecture / Écriture Lecture (seul)
Stockage Structures à 2
dimensions (tables)
Structures à n dimensions.
Taille Faible
Importante
(comportant l’archive)
Requêtes
Facile à écrire et à
comprendre :
Montant des ventes
d’un produit
de Groupement multiple :
Montant des ventes d’un produit
par vendeur, région, mois, ...
24/01/2022 Dr. Mohamed Mkaouar 20
6. Comparatif Bases de Données /
Entrepôts de Données (2/2)
Bases de Données Entrepôts de Données
Langage de Req. SQL SQL ou MDX
Réponse aux
Requêtes
Immédiate Moins rapide
Utilisateurs
- Nombreux
- Variés
- Concurrents
- Peu nombreux
- Décideurs
- Non Concurrents
Modèle de
données
Entité/Relation
Relationnel
Etoile / Flocon / Constellation
Données Saisies (et MAJ) par
l’utilisateur
Obtenues (et actualisées) depuis
les bases de production.
24/01/2022 Dr. Mohamed Mkaouar 21
7. Vue globale des solutions Informatiques
pour les Entrepôts de Données
Plusieurs solutions informatiques pour les Entrepôts de Données sont fragmentées
dans les différentes étapes du cycle décisionnel. On trouve :
❑ des outils pour la construction et l’administration de l’Entrepôt,
❑ des outils ETL pour l’extraction et le chargement des données (depuis les
sources transactionnelles vers l’Entrepôt),
❑ des outils pour la génération des cubes OLAP,
❑ des outils pour la restitution et la présentation des résultats issues de
l’exécution des questions décisionnels,
❑ etc.
24/01/2022 Dr. Mohamed Mkaouar 22

Chapitre 1 les entrepôts de données

  • 1.
    Cous « Entrepôtsde Données » 2ème LIG, parcours EB et BI Chapitre 1 : Les Entrepôts de Données Ministère de l’Enseignement Supérieur Université de Sfax Institut Supérieur d’Administration des Affaires Dr. Mohamed Mkaouar 2021-2022
  • 2.
    Plan 1. Les Basesde Données 2. Les Entrepôts de Données 3. Architecture d’un système d’information 4. Principe des Systèmes décisionnels 5. Définitions de base pour les Entrepôts de Données 6. Comparatif Bases de Données et Entrepôts de données 7. Vue globale des solutions informatique pour les Entrepôts de Données 24/01/2022 Dr. Mohamed Mkaouar 2
  • 3.
    Une Base deDonnées (BD) sert comme support de stockage des données d’une application : ➢ Gestion des ventes (on enregistre les données sur les Clients, les Fournisseurs, les Factures, …) ➢ Gestion des ressources humaines (on enregistre les données sur le Personnel, la Paie, les Congés, …) Dans les Bases de Données, les données sont modélisées selon le modèle Relationnel ; un ensemble des tables (structurées en colonnes et lignes) reliées entre elles par des clés primaires et des clés étrangères. 24/01/2022 Dr. Mohamed Mkaouar 3 1.Les Bases de Données
  • 4.
    Ces applications sontdites transactionnelles, OnLine Transactional Processing (OLTP) en anglais. Le rôle principal d’une application transactionnelle consiste à enregistrer et de mettre à jour (modifier ou supprimer) un ensemble de données. Une Bases de Données est gérée par un Système de Gestion de Bases de Données (SGBD). Les SGBD utilisent le langage SQL (Structured Query Langage) pour créer et mettre à jour les BD. Les développeurs utilisent SQL directement ou indirectement (à travers des outils graphiques) pour créer et mettre à jour des BD. 24/01/2022 Dr. Mohamed Mkaouar 4 1.Les Bases de Données
  • 5.
    L’interrogation dans uneapplication transactionnelle consiste à s’informer et à prendre de simples décisions. Pour une application de vente, on utilise la BD correspondante pour répondre à des questions comme : Q1. La liste des produits. Q2. Les quantités en stock par produit. Q3. La liste des fournisseurs. Q4. La liste des clients par région. Q5. Les factures du mois de janvier. 24/01/2022 Dr. Mohamed Mkaouar 5 1.Les Bases de Données
  • 6.
    Un Entrepôt deDonnées (ED), Data Warehouse en anglais, est une source de données pour une application décisionnelle, OnLine Analyticaal Processing (OLAP) en anglais. Cette source de données est obtenue à partir des Bases de Données des applications transactionnelles. La BD est modélisée selon le modèle Relationnel, par contre l’ED est modélisée selon un modèle Multidimensionnel. En pratique, les traitements (requêtes) d’une application décisionnelle ne peuvent pas être exécutées sur des données structurées selon le modèle Relationnel. 24/01/2022 Dr. Mohamed Mkaouar 6 2. Les Entrepôts de Données
  • 7.
    Le rôle principald’une application décisionnelle consiste à déterminer (par interrogation) des rapports de synthèse utiles à la prise de décision. Un Entrepôt de Données est géré par un Système de Gestion de d’Entrepôts de Données (SGED) ou un Serveur OLAP. La plupart des Serveurs OLAP utilisent le langage MDX (Multidimensional Expression) pour créer et interroger les ED. Les développeurs utilisent SQL ou MDX pour créer des ED, mais l’interrogation est souvent effectuée à travers des manipulations graphiques sans utiliser directement MDX. 24/01/2022 Dr. Mohamed Mkaouar 7 2. Les Entrepôts de Données
  • 8.
    L’interrogation dans uneapplication décisionnelle est orientée vers la prise de décisions profondes. Dans une activité de vente, par exemple, on utilise l’entrepôt de données correspondant pour répondre à des questions comme : Q1.Comment varie le chiffre d’affaires par produit et par période ? Q2. Quel est la marge bénéficiaire par produit pour chaque promotion ? Q3.Quel est le chiffre d’affaires par vendeur et par jour ? 24/01/2022 Dr. Mohamed Mkaouar 8 2. Les Entrepôts de Données
  • 9.
    24/01/2022 Dr. MohamedMkaouar 9   BD Fichiers plats Système d’Information 3. Architecture d’un Système d’information (1/3) Sous-Système Transactionnel : OLTP Rôle : Stockage et Maj des données Sous-Système Décisionnel : OLAP Rôle : Faciliter l’expression et la compréhension des questions qui aident à la prise de décision
  • 10.
    24/01/2022 Dr. MohamedMkaouar 10   BD Fichiers plats Système d’Information Sous-Système Transactionnel Sous-Système Décisionnel Se basant sur l’utilisation d’un Entrepôt de Données Décideurs Entrepôt de Données Outils d’Alimentation Outils de Restitution Cubes OLAP Extraction-Transformation-Chargement Chargement Actualisation Magasin de Données 3. Architecture d’un Système d’information (2/3)
  • 11.
    24/01/2022 Dr. MohamedMkaouar 11   BD Fichiers plats Système d’Information Sous-Système Transactionnel : OLTP Rôle : Stockage et Maj des données Sous-Système Décisionnel : OLAP Rôle : Faciliter l’expression et la compréhension des questions qui aident à la prise de décision Décideurs Techniques de Fouille de Données Analyse Explication Entrepôt de Données Outils d’Alimentation Outils de Restitution Cubes OLAP Extraction-Transformation-Chargement Chargement Actualisation Magasin de Données 3. Architecture d’un Système d’information (3/3)
  • 12.
    Les Systèmes Décisionnels(apparus vers les années 2000) viennent pour pouvoir répondre à des questions décisionnelles d’une manière simple et pour pouvoir comprendre rapidement les réponses. En effet, ces systèmes sont utilisés par les décideurs (généralement non informaticiens) qui leur assistent dans la prise de décisions ; l’utilisation de ces systèmes doit ainsi être simple. 24/01/2022 Dr. Mohamed Mkaouar 12 4. Principe des Systèmes décisionnels (1/3)
  • 13.
    Les données d’unSystème d’Information Décisionnel (SID) sont obtenues à partir des données du Système d’Information Transactionnel (SIT) ; l’objectif étant de déterminer une source de données permettant d’extraire des connaissances, et ce, par l’Analyse ou l’Explication de données. Avec l’utilisation d’un Entrepôt de Données, les connaissances sont extraites à partir de valeurs orienté sujets, modélisées selon le modèle Multidimensionnel. 24/01/2022 Dr. Mohamed Mkaouar 13 4. Principe des Systèmes décisionnels (2/3)
  • 14.
    Nous retenons ladifférence entre donnée et Connaissance comme suit : ➢ Un donnée représente une information du monde réel : le nom d’un enseignant, la moyenne d’un étudiant, … ➢ Une Connaissance apporte une information résultante de l’analyse ou l’explication de données : les notes en ED s’améliorent d’une année à l’autre, … La découverte de connaissances est donc assurée par l’analyse et/ou l’explication de données. 24/01/2022 Dr. Mohamed Mkaouar 14 4. Principe des Systèmes décisionnels (3/3)
  • 15.
    « Un entrepôtde données ne s’achète pas, il se construit. » (à partir des bases de production) - Citation attribuée à Bill Inmon ; un des précurseurs de la théorie des Entrepôt de Données. Informatiquement parlant, un Entrepôt de Données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision (Bill Inmon, 1994). 24/01/2022 Dr. Mohamed Mkaouar 15 5. Définitions de base pour les Entrepôt de Données (1/5)
  • 16.
    ❑ Données orientéessujet : les données ne sont pas enregistrées dans des tables (structure de deux dimensions), mais plutôt dans des structures à n dimensions ; ces structures sont utilisées pour pouvoir analyser les indicateurs de performance de l’activité concernée (Chiffre d’affaires, Coût de production, Nbr. Employés, …), selon plusieurs thèmes d’analyse (Date, Produit, Clients, Point de vente, Ville, …). 24/01/2022 Dr. Mohamed Mkaouar 16 5. Définitions de base pour les Entrepôt de Données (2/5)
  • 17.
    ❑ Données intégrées: les données provenant de différentes sources hétérogènes doivent être intégrées. Ils doivent ainsi être converties, reformatées et nettoyées. ❑ Données non volatiles : en lecture seule ; ces données ne peuvent pas être mises à jour, mais ils peuvent être actualisées depuis les bases de production (bases sources). ❑ Données historisées : les données d’un ED représentent l’activité d’une organisation durant une certaine période (plusieurs années) ; l’actualisation des données, depuis les bases de production, à des dates différentes permet de conserver l’historique de toutes les données dans l’ED. 24/01/2022 Dr. Mohamed Mkaouar 17 5. Définitions de base pour les Entrepôt de Données (3/5)
  • 18.
    Dans un SIDqui se base sur l’utilisation d’un Entrepôt de Données, on distingue deux (ou plusieurs) espaces de stockage : un Entrepôt de Données et un (ou plusieurs) Magasins de Données. Un Magasin de Données est un espace dédié à un métier ou une analyse décisionnelle donnée. Par contre, un Entrepôt de Données intègre l’ensemble des données sources nécessaires à la prise de décisions. Un Entrepôt de Données sert de support à l’élaboration de Magasins de Données. 24/01/2022 Dr. Mohamed Mkaouar 18 5. Définitions de base pour les Entrepôt de Données (4/5)
  • 19.
    ❑ Un ETC(Extraction-Transformation-Chargement): est un Logiciel ou une partie d’un Logiciel, qui permet d’effectuer l’Extraction des données à partir des différentes sources, de les Transformer éventuellement, puis de les Charger dans l’Entrepôt de Données. ❑ Les outils de restitution permettent une visualisation et une interprétation très simple des résultats des requêtes décisionnelles. 24/01/2022 Dr. Mohamed Mkaouar 19 5. Définitions de base pour les Entrepôt de Données (5/5)
  • 20.
    6. Comparatif Basesde Données / Entrepôts de Données (1/2) Bases de Données Entrepôts de Données Objectif Stockage et MAJ des Données Facilite l’expression et la compréhension des questions qui aident à la prise de décisions Sous-Système OLTP OLAP Type d’accès Lecture / Écriture Lecture (seul) Stockage Structures à 2 dimensions (tables) Structures à n dimensions. Taille Faible Importante (comportant l’archive) Requêtes Facile à écrire et à comprendre : Montant des ventes d’un produit de Groupement multiple : Montant des ventes d’un produit par vendeur, région, mois, ... 24/01/2022 Dr. Mohamed Mkaouar 20
  • 21.
    6. Comparatif Basesde Données / Entrepôts de Données (2/2) Bases de Données Entrepôts de Données Langage de Req. SQL SQL ou MDX Réponse aux Requêtes Immédiate Moins rapide Utilisateurs - Nombreux - Variés - Concurrents - Peu nombreux - Décideurs - Non Concurrents Modèle de données Entité/Relation Relationnel Etoile / Flocon / Constellation Données Saisies (et MAJ) par l’utilisateur Obtenues (et actualisées) depuis les bases de production. 24/01/2022 Dr. Mohamed Mkaouar 21
  • 22.
    7. Vue globaledes solutions Informatiques pour les Entrepôts de Données Plusieurs solutions informatiques pour les Entrepôts de Données sont fragmentées dans les différentes étapes du cycle décisionnel. On trouve : ❑ des outils pour la construction et l’administration de l’Entrepôt, ❑ des outils ETL pour l’extraction et le chargement des données (depuis les sources transactionnelles vers l’Entrepôt), ❑ des outils pour la génération des cubes OLAP, ❑ des outils pour la restitution et la présentation des résultats issues de l’exécution des questions décisionnels, ❑ etc. 24/01/2022 Dr. Mohamed Mkaouar 22