SlideShare une entreprise Scribd logo
1  sur  22
Télécharger pour lire hors ligne
Cous « Entrepôts de Données »
2ème LIG, parcours EB et BI
Chapitre 1 : Les Entrepôts de Données
Ministère de l’Enseignement Supérieur
Université de Sfax
Institut Supérieur d’Administration des Affaires
Dr. Mohamed Mkaouar
2021-2022
Plan
1. Les Bases de Données
2. Les Entrepôts de Données
3. Architecture d’un système d’information
4. Principe des Systèmes décisionnels
5. Définitions de base pour les Entrepôts de Données
6. Comparatif Bases de Données et Entrepôts de données
7. Vue globale des solutions informatique pour les
Entrepôts de Données
24/01/2022 Dr. Mohamed Mkaouar 2
Une Base de Données (BD) sert comme support de stockage des
données d’une application :
➢ Gestion des ventes (on enregistre les données sur les Clients,
les Fournisseurs, les Factures, …)
➢ Gestion des ressources humaines (on enregistre les données
sur le Personnel, la Paie, les Congés, …)
Dans les Bases de Données, les données sont modélisées selon le
modèle Relationnel ; un ensemble des tables (structurées en
colonnes et lignes) reliées entre elles par des clés primaires et
des clés étrangères.
24/01/2022 Dr. Mohamed Mkaouar 3
1.Les Bases de Données
Ces applications sont dites transactionnelles, OnLine
Transactional Processing (OLTP) en anglais.
Le rôle principal d’une application transactionnelle consiste à
enregistrer et de mettre à jour (modifier ou supprimer) un
ensemble de données.
Une Bases de Données est gérée par un Système de Gestion de
Bases de Données (SGBD). Les SGBD utilisent le langage SQL
(Structured Query Langage) pour créer et mettre à jour les BD.
Les développeurs utilisent SQL directement ou indirectement (à
travers des outils graphiques) pour créer et mettre à jour des BD.
24/01/2022 Dr. Mohamed Mkaouar 4
1.Les Bases de Données
L’interrogation dans une application transactionnelle consiste à
s’informer et à prendre de simples décisions.
Pour une application de vente, on utilise la BD correspondante
pour répondre à des questions comme :
Q1. La liste des produits.
Q2. Les quantités en stock par produit.
Q3. La liste des fournisseurs.
Q4. La liste des clients par région.
Q5. Les factures du mois de janvier.
24/01/2022 Dr. Mohamed Mkaouar 5
1.Les Bases de Données
Un Entrepôt de Données (ED), Data Warehouse en anglais, est
une source de données pour une application décisionnelle,
OnLine Analyticaal Processing (OLAP) en anglais.
Cette source de données est obtenue à partir des Bases de
Données des applications transactionnelles.
La BD est modélisée selon le modèle Relationnel, par contre
l’ED est modélisée selon un modèle Multidimensionnel.
En pratique, les traitements (requêtes) d’une application
décisionnelle ne peuvent pas être exécutées sur des données
structurées selon le modèle Relationnel.
24/01/2022 Dr. Mohamed Mkaouar 6
2. Les Entrepôts de Données
Le rôle principal d’une application décisionnelle consiste à
déterminer (par interrogation) des rapports de synthèse utiles à la
prise de décision.
Un Entrepôt de Données est géré par un Système de Gestion de
d’Entrepôts de Données (SGED) ou un Serveur OLAP.
La plupart des Serveurs OLAP utilisent le langage MDX
(Multidimensional Expression) pour créer et interroger les ED.
Les développeurs utilisent SQL ou MDX pour créer des ED,
mais l’interrogation est souvent effectuée à travers des
manipulations graphiques sans utiliser directement MDX.
24/01/2022 Dr. Mohamed Mkaouar 7
2. Les Entrepôts de Données
L’interrogation dans une application décisionnelle est orientée
vers la prise de décisions profondes.
Dans une activité de vente, par exemple, on utilise l’entrepôt de
données correspondant pour répondre à des questions comme :
Q1.Comment varie le chiffre d’affaires par produit et par
période ?
Q2. Quel est la marge bénéficiaire par produit pour chaque
promotion ?
Q3.Quel est le chiffre d’affaires par vendeur et par jour ?
24/01/2022 Dr. Mohamed Mkaouar 8
2. Les Entrepôts de Données
24/01/2022 Dr. Mohamed Mkaouar 9


BD
Fichiers
plats
Système d’Information
3. Architecture d’un Système d’information (1/3)
Sous-Système Transactionnel : OLTP
Rôle : Stockage et Maj des données
Sous-Système Décisionnel : OLAP
Rôle : Faciliter l’expression et la
compréhension des questions qui
aident à la prise de décision
24/01/2022 Dr. Mohamed Mkaouar 10


BD
Fichiers
plats
Système d’Information
Sous-Système Transactionnel Sous-Système Décisionnel Se basant sur
l’utilisation d’un Entrepôt de Données
Décideurs
Entrepôt de
Données
Outils
d’Alimentation Outils de Restitution
Cubes
OLAP
Extraction-Transformation-Chargement
Chargement
Actualisation Magasin de
Données
3. Architecture d’un Système d’information (2/3)
24/01/2022 Dr. Mohamed Mkaouar 11


BD
Fichiers
plats
Système d’Information
Sous-Système Transactionnel : OLTP
Rôle : Stockage et Maj des données
Sous-Système Décisionnel : OLAP
Rôle : Faciliter l’expression et la
compréhension des questions qui
aident à la prise de décision
Décideurs
Techniques de
Fouille de
Données
Analyse
Explication
Entrepôt de
Données
Outils
d’Alimentation Outils de Restitution
Cubes
OLAP
Extraction-Transformation-Chargement
Chargement
Actualisation Magasin de
Données
3. Architecture d’un Système d’information (3/3)
Les Systèmes Décisionnels (apparus vers les années 2000)
viennent pour pouvoir répondre à des questions
décisionnelles d’une manière simple et pour pouvoir
comprendre rapidement les réponses.
En effet, ces systèmes sont utilisés par les décideurs
(généralement non informaticiens) qui leur assistent dans la
prise de décisions ; l’utilisation de ces systèmes doit ainsi
être simple.
24/01/2022 Dr. Mohamed Mkaouar 12
4. Principe des Systèmes décisionnels (1/3)
Les données d’un Système d’Information Décisionnel (SID)
sont obtenues à partir des données du Système
d’Information Transactionnel (SIT) ; l’objectif étant de
déterminer une source de données permettant d’extraire des
connaissances, et ce, par l’Analyse ou
l’Explication de données.
Avec l’utilisation d’un Entrepôt de Données, les connaissances
sont extraites à partir de valeurs orienté sujets, modélisées
selon le modèle Multidimensionnel.
24/01/2022 Dr. Mohamed Mkaouar 13
4. Principe des Systèmes décisionnels (2/3)
Nous retenons la différence entre donnée et Connaissance
comme suit :
➢ Un donnée représente une information du monde réel :
le nom d’un enseignant, la moyenne d’un étudiant, …
➢ Une Connaissance apporte une information résultante
de l’analyse ou l’explication de données : les
notes en ED s’améliorent d’une année à l’autre, …
La découverte de connaissances est donc assurée par
l’analyse et/ou l’explication de données.
24/01/2022 Dr. Mohamed Mkaouar 14
4. Principe des Systèmes décisionnels (3/3)
« Un entrepôt de données ne s’achète pas, il se
construit. » (à partir des bases de production) -
Citation attribuée à Bill Inmon ; un des précurseurs
de la théorie des Entrepôt de Données.
Informatiquement parlant, un Entrepôt de Données
est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées
pour le support d’un processus d’aide à la décision
(Bill Inmon, 1994).
24/01/2022 Dr. Mohamed Mkaouar 15
5. Définitions de base pour les Entrepôt de
Données (1/5)
❑ Données orientées sujet : les données ne sont pas
enregistrées dans des tables (structure de deux
dimensions), mais plutôt dans des structures à n
dimensions ; ces structures sont utilisées pour
pouvoir analyser les indicateurs de performance
de l’activité concernée (Chiffre d’affaires, Coût
de production, Nbr. Employés, …), selon
plusieurs thèmes d’analyse (Date, Produit,
Clients, Point de vente, Ville, …).
24/01/2022 Dr. Mohamed Mkaouar 16
5. Définitions de base pour les Entrepôt de
Données (2/5)
❑ Données intégrées : les données provenant de différentes sources
hétérogènes doivent être intégrées. Ils doivent ainsi être converties,
reformatées et nettoyées.
❑ Données non volatiles : en lecture seule ; ces données ne
peuvent pas être mises à jour, mais ils peuvent être
actualisées depuis les bases de production (bases sources).
❑ Données historisées : les données d’un ED représentent l’activité
d’une organisation durant une certaine période (plusieurs années) ;
l’actualisation des données, depuis les bases de production, à des
dates différentes permet de conserver l’historique de toutes les
données dans l’ED.
24/01/2022 Dr. Mohamed Mkaouar 17
5. Définitions de base pour les Entrepôt de
Données (3/5)
Dans un SID qui se base sur l’utilisation d’un Entrepôt de Données,
on distingue deux (ou plusieurs) espaces de stockage : un Entrepôt
de Données et un (ou plusieurs) Magasins de Données.
Un Magasin de Données est un espace dédié à un métier ou une
analyse décisionnelle donnée.
Par contre, un Entrepôt de Données intègre l’ensemble des données
sources nécessaires à la prise de décisions.
Un Entrepôt de Données sert de support à l’élaboration de Magasins
de Données.
24/01/2022 Dr. Mohamed Mkaouar 18
5. Définitions de base pour les Entrepôt de
Données (4/5)
❑ Un ETC (Extraction-Transformation-Chargement):
est un Logiciel ou une partie d’un Logiciel, qui
permet d’effectuer l’Extraction des données à partir
des différentes sources, de les Transformer
éventuellement, puis de les Charger dans l’Entrepôt
de Données.
❑ Les outils de restitution permettent une
visualisation et une interprétation très simple des
résultats des requêtes décisionnelles.
24/01/2022 Dr. Mohamed Mkaouar 19
5. Définitions de base pour les Entrepôt de
Données (5/5)
6. Comparatif Bases de Données /
Entrepôts de Données (1/2)
Bases de Données Entrepôts de Données
Objectif
Stockage et MAJ
des Données
Facilite l’expression et la
compréhension des questions
qui aident à la prise de décisions
Sous-Système OLTP OLAP
Type d’accès Lecture / Écriture Lecture (seul)
Stockage Structures à 2
dimensions (tables)
Structures à n dimensions.
Taille Faible
Importante
(comportant l’archive)
Requêtes
Facile à écrire et à
comprendre :
Montant des ventes
d’un produit
de Groupement multiple :
Montant des ventes d’un produit
par vendeur, région, mois, ...
24/01/2022 Dr. Mohamed Mkaouar 20
6. Comparatif Bases de Données /
Entrepôts de Données (2/2)
Bases de Données Entrepôts de Données
Langage de Req. SQL SQL ou MDX
Réponse aux
Requêtes
Immédiate Moins rapide
Utilisateurs
- Nombreux
- Variés
- Concurrents
- Peu nombreux
- Décideurs
- Non Concurrents
Modèle de
données
Entité/Relation
Relationnel
Etoile / Flocon / Constellation
Données Saisies (et MAJ) par
l’utilisateur
Obtenues (et actualisées) depuis
les bases de production.
24/01/2022 Dr. Mohamed Mkaouar 21
7. Vue globale des solutions Informatiques
pour les Entrepôts de Données
Plusieurs solutions informatiques pour les Entrepôts de Données sont fragmentées
dans les différentes étapes du cycle décisionnel. On trouve :
❑ des outils pour la construction et l’administration de l’Entrepôt,
❑ des outils ETL pour l’extraction et le chargement des données (depuis les
sources transactionnelles vers l’Entrepôt),
❑ des outils pour la génération des cubes OLAP,
❑ des outils pour la restitution et la présentation des résultats issues de
l’exécution des questions décisionnels,
❑ etc.
24/01/2022 Dr. Mohamed Mkaouar 22

Contenu connexe

Tendances

Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence Cynapsys It Hotspot
 
Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseBEL MRHAR Mohamed Amine
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Projet décisionnel
Projet décisionnelProjet décisionnel
Projet décisionnelSiham JABRI
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision Amal Brioual
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdfOuailChoukhairi
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian Lilia Sfaxi
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkAmal Abid
 

Tendances (20)

Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Bi
BiBi
Bi
 
Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
 
Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouse
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Projet décisionnel
Projet décisionnelProjet décisionnel
Projet décisionnel
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 

Similaire à Chapitre 1 les entrepôts de données

Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.pptBD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.pptmarocdakhla135
 
Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentCarlos Sanin
 
Seance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entrepriseSeance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entreprisesciafrique
 
Introduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfIntroduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfamarasidibeavm
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna Borgi
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Les systèmes d'information et tableau de bord
Les systèmes d'information et tableau de bordLes systèmes d'information et tableau de bord
Les systèmes d'information et tableau de bordTayssirLimem
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big DataTechnofutur TIC
 
Propos sur les si décisionnels.
Propos sur les si décisionnels.Propos sur les si décisionnels.
Propos sur les si décisionnels.Michel Bruley
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big DataIdriss22
 

Similaire à Chapitre 1 les entrepôts de données (20)

Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.pptBD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
 
Rapport final-2
Rapport final-2Rapport final-2
Rapport final-2
 
Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - student
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
projet BI licnence.pdf
projet BI licnence.pdfprojet BI licnence.pdf
projet BI licnence.pdf
 
Seance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entrepriseSeance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entreprise
 
Introduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfIntroduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdf
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouse
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Les systèmes d'information et tableau de bord
Les systèmes d'information et tableau de bordLes systèmes d'information et tableau de bord
Les systèmes d'information et tableau de bord
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big Data
 
Sgbd (1)
Sgbd (1)Sgbd (1)
Sgbd (1)
 
Propos sur les si décisionnels.
Propos sur les si décisionnels.Propos sur les si décisionnels.
Propos sur les si décisionnels.
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Module 02_FR.pdf
Module 02_FR.pdfModule 02_FR.pdf
Module 02_FR.pdf
 
Big data
Big dataBig data
Big data
 
Chap1 2 dw (1)
Chap1 2 dw (1)Chap1 2 dw (1)
Chap1 2 dw (1)
 

Dernier

PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfRiDaHAziz
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSKennel
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 37
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Gilles Le Page
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETMedBechir
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSKennel
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETMedBechir
 
Cours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationCours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationpapediallo3
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsRajiAbdelghani
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeXL Groupe
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSKennel
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSKennel
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSKennel
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .Txaruka
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Alain Marois
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfRiDaHAziz
 

Dernier (20)

PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdf
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSET
 
Cours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationCours de Management des Systèmes d'information
Cours de Management des Systèmes d'information
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 temps
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
DO PALÁCIO À ASSEMBLEIA .
DO PALÁCIO À ASSEMBLEIA                 .DO PALÁCIO À ASSEMBLEIA                 .
DO PALÁCIO À ASSEMBLEIA .
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directe
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdf
 

Chapitre 1 les entrepôts de données

  • 1. Cous « Entrepôts de Données » 2ème LIG, parcours EB et BI Chapitre 1 : Les Entrepôts de Données Ministère de l’Enseignement Supérieur Université de Sfax Institut Supérieur d’Administration des Affaires Dr. Mohamed Mkaouar 2021-2022
  • 2. Plan 1. Les Bases de Données 2. Les Entrepôts de Données 3. Architecture d’un système d’information 4. Principe des Systèmes décisionnels 5. Définitions de base pour les Entrepôts de Données 6. Comparatif Bases de Données et Entrepôts de données 7. Vue globale des solutions informatique pour les Entrepôts de Données 24/01/2022 Dr. Mohamed Mkaouar 2
  • 3. Une Base de Données (BD) sert comme support de stockage des données d’une application : ➢ Gestion des ventes (on enregistre les données sur les Clients, les Fournisseurs, les Factures, …) ➢ Gestion des ressources humaines (on enregistre les données sur le Personnel, la Paie, les Congés, …) Dans les Bases de Données, les données sont modélisées selon le modèle Relationnel ; un ensemble des tables (structurées en colonnes et lignes) reliées entre elles par des clés primaires et des clés étrangères. 24/01/2022 Dr. Mohamed Mkaouar 3 1.Les Bases de Données
  • 4. Ces applications sont dites transactionnelles, OnLine Transactional Processing (OLTP) en anglais. Le rôle principal d’une application transactionnelle consiste à enregistrer et de mettre à jour (modifier ou supprimer) un ensemble de données. Une Bases de Données est gérée par un Système de Gestion de Bases de Données (SGBD). Les SGBD utilisent le langage SQL (Structured Query Langage) pour créer et mettre à jour les BD. Les développeurs utilisent SQL directement ou indirectement (à travers des outils graphiques) pour créer et mettre à jour des BD. 24/01/2022 Dr. Mohamed Mkaouar 4 1.Les Bases de Données
  • 5. L’interrogation dans une application transactionnelle consiste à s’informer et à prendre de simples décisions. Pour une application de vente, on utilise la BD correspondante pour répondre à des questions comme : Q1. La liste des produits. Q2. Les quantités en stock par produit. Q3. La liste des fournisseurs. Q4. La liste des clients par région. Q5. Les factures du mois de janvier. 24/01/2022 Dr. Mohamed Mkaouar 5 1.Les Bases de Données
  • 6. Un Entrepôt de Données (ED), Data Warehouse en anglais, est une source de données pour une application décisionnelle, OnLine Analyticaal Processing (OLAP) en anglais. Cette source de données est obtenue à partir des Bases de Données des applications transactionnelles. La BD est modélisée selon le modèle Relationnel, par contre l’ED est modélisée selon un modèle Multidimensionnel. En pratique, les traitements (requêtes) d’une application décisionnelle ne peuvent pas être exécutées sur des données structurées selon le modèle Relationnel. 24/01/2022 Dr. Mohamed Mkaouar 6 2. Les Entrepôts de Données
  • 7. Le rôle principal d’une application décisionnelle consiste à déterminer (par interrogation) des rapports de synthèse utiles à la prise de décision. Un Entrepôt de Données est géré par un Système de Gestion de d’Entrepôts de Données (SGED) ou un Serveur OLAP. La plupart des Serveurs OLAP utilisent le langage MDX (Multidimensional Expression) pour créer et interroger les ED. Les développeurs utilisent SQL ou MDX pour créer des ED, mais l’interrogation est souvent effectuée à travers des manipulations graphiques sans utiliser directement MDX. 24/01/2022 Dr. Mohamed Mkaouar 7 2. Les Entrepôts de Données
  • 8. L’interrogation dans une application décisionnelle est orientée vers la prise de décisions profondes. Dans une activité de vente, par exemple, on utilise l’entrepôt de données correspondant pour répondre à des questions comme : Q1.Comment varie le chiffre d’affaires par produit et par période ? Q2. Quel est la marge bénéficiaire par produit pour chaque promotion ? Q3.Quel est le chiffre d’affaires par vendeur et par jour ? 24/01/2022 Dr. Mohamed Mkaouar 8 2. Les Entrepôts de Données
  • 9. 24/01/2022 Dr. Mohamed Mkaouar 9   BD Fichiers plats Système d’Information 3. Architecture d’un Système d’information (1/3) Sous-Système Transactionnel : OLTP Rôle : Stockage et Maj des données Sous-Système Décisionnel : OLAP Rôle : Faciliter l’expression et la compréhension des questions qui aident à la prise de décision
  • 10. 24/01/2022 Dr. Mohamed Mkaouar 10   BD Fichiers plats Système d’Information Sous-Système Transactionnel Sous-Système Décisionnel Se basant sur l’utilisation d’un Entrepôt de Données Décideurs Entrepôt de Données Outils d’Alimentation Outils de Restitution Cubes OLAP Extraction-Transformation-Chargement Chargement Actualisation Magasin de Données 3. Architecture d’un Système d’information (2/3)
  • 11. 24/01/2022 Dr. Mohamed Mkaouar 11   BD Fichiers plats Système d’Information Sous-Système Transactionnel : OLTP Rôle : Stockage et Maj des données Sous-Système Décisionnel : OLAP Rôle : Faciliter l’expression et la compréhension des questions qui aident à la prise de décision Décideurs Techniques de Fouille de Données Analyse Explication Entrepôt de Données Outils d’Alimentation Outils de Restitution Cubes OLAP Extraction-Transformation-Chargement Chargement Actualisation Magasin de Données 3. Architecture d’un Système d’information (3/3)
  • 12. Les Systèmes Décisionnels (apparus vers les années 2000) viennent pour pouvoir répondre à des questions décisionnelles d’une manière simple et pour pouvoir comprendre rapidement les réponses. En effet, ces systèmes sont utilisés par les décideurs (généralement non informaticiens) qui leur assistent dans la prise de décisions ; l’utilisation de ces systèmes doit ainsi être simple. 24/01/2022 Dr. Mohamed Mkaouar 12 4. Principe des Systèmes décisionnels (1/3)
  • 13. Les données d’un Système d’Information Décisionnel (SID) sont obtenues à partir des données du Système d’Information Transactionnel (SIT) ; l’objectif étant de déterminer une source de données permettant d’extraire des connaissances, et ce, par l’Analyse ou l’Explication de données. Avec l’utilisation d’un Entrepôt de Données, les connaissances sont extraites à partir de valeurs orienté sujets, modélisées selon le modèle Multidimensionnel. 24/01/2022 Dr. Mohamed Mkaouar 13 4. Principe des Systèmes décisionnels (2/3)
  • 14. Nous retenons la différence entre donnée et Connaissance comme suit : ➢ Un donnée représente une information du monde réel : le nom d’un enseignant, la moyenne d’un étudiant, … ➢ Une Connaissance apporte une information résultante de l’analyse ou l’explication de données : les notes en ED s’améliorent d’une année à l’autre, … La découverte de connaissances est donc assurée par l’analyse et/ou l’explication de données. 24/01/2022 Dr. Mohamed Mkaouar 14 4. Principe des Systèmes décisionnels (3/3)
  • 15. « Un entrepôt de données ne s’achète pas, il se construit. » (à partir des bases de production) - Citation attribuée à Bill Inmon ; un des précurseurs de la théorie des Entrepôt de Données. Informatiquement parlant, un Entrepôt de Données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision (Bill Inmon, 1994). 24/01/2022 Dr. Mohamed Mkaouar 15 5. Définitions de base pour les Entrepôt de Données (1/5)
  • 16. ❑ Données orientées sujet : les données ne sont pas enregistrées dans des tables (structure de deux dimensions), mais plutôt dans des structures à n dimensions ; ces structures sont utilisées pour pouvoir analyser les indicateurs de performance de l’activité concernée (Chiffre d’affaires, Coût de production, Nbr. Employés, …), selon plusieurs thèmes d’analyse (Date, Produit, Clients, Point de vente, Ville, …). 24/01/2022 Dr. Mohamed Mkaouar 16 5. Définitions de base pour les Entrepôt de Données (2/5)
  • 17. ❑ Données intégrées : les données provenant de différentes sources hétérogènes doivent être intégrées. Ils doivent ainsi être converties, reformatées et nettoyées. ❑ Données non volatiles : en lecture seule ; ces données ne peuvent pas être mises à jour, mais ils peuvent être actualisées depuis les bases de production (bases sources). ❑ Données historisées : les données d’un ED représentent l’activité d’une organisation durant une certaine période (plusieurs années) ; l’actualisation des données, depuis les bases de production, à des dates différentes permet de conserver l’historique de toutes les données dans l’ED. 24/01/2022 Dr. Mohamed Mkaouar 17 5. Définitions de base pour les Entrepôt de Données (3/5)
  • 18. Dans un SID qui se base sur l’utilisation d’un Entrepôt de Données, on distingue deux (ou plusieurs) espaces de stockage : un Entrepôt de Données et un (ou plusieurs) Magasins de Données. Un Magasin de Données est un espace dédié à un métier ou une analyse décisionnelle donnée. Par contre, un Entrepôt de Données intègre l’ensemble des données sources nécessaires à la prise de décisions. Un Entrepôt de Données sert de support à l’élaboration de Magasins de Données. 24/01/2022 Dr. Mohamed Mkaouar 18 5. Définitions de base pour les Entrepôt de Données (4/5)
  • 19. ❑ Un ETC (Extraction-Transformation-Chargement): est un Logiciel ou une partie d’un Logiciel, qui permet d’effectuer l’Extraction des données à partir des différentes sources, de les Transformer éventuellement, puis de les Charger dans l’Entrepôt de Données. ❑ Les outils de restitution permettent une visualisation et une interprétation très simple des résultats des requêtes décisionnelles. 24/01/2022 Dr. Mohamed Mkaouar 19 5. Définitions de base pour les Entrepôt de Données (5/5)
  • 20. 6. Comparatif Bases de Données / Entrepôts de Données (1/2) Bases de Données Entrepôts de Données Objectif Stockage et MAJ des Données Facilite l’expression et la compréhension des questions qui aident à la prise de décisions Sous-Système OLTP OLAP Type d’accès Lecture / Écriture Lecture (seul) Stockage Structures à 2 dimensions (tables) Structures à n dimensions. Taille Faible Importante (comportant l’archive) Requêtes Facile à écrire et à comprendre : Montant des ventes d’un produit de Groupement multiple : Montant des ventes d’un produit par vendeur, région, mois, ... 24/01/2022 Dr. Mohamed Mkaouar 20
  • 21. 6. Comparatif Bases de Données / Entrepôts de Données (2/2) Bases de Données Entrepôts de Données Langage de Req. SQL SQL ou MDX Réponse aux Requêtes Immédiate Moins rapide Utilisateurs - Nombreux - Variés - Concurrents - Peu nombreux - Décideurs - Non Concurrents Modèle de données Entité/Relation Relationnel Etoile / Flocon / Constellation Données Saisies (et MAJ) par l’utilisateur Obtenues (et actualisées) depuis les bases de production. 24/01/2022 Dr. Mohamed Mkaouar 21
  • 22. 7. Vue globale des solutions Informatiques pour les Entrepôts de Données Plusieurs solutions informatiques pour les Entrepôts de Données sont fragmentées dans les différentes étapes du cycle décisionnel. On trouve : ❑ des outils pour la construction et l’administration de l’Entrepôt, ❑ des outils ETL pour l’extraction et le chargement des données (depuis les sources transactionnelles vers l’Entrepôt), ❑ des outils pour la génération des cubes OLAP, ❑ des outils pour la restitution et la présentation des résultats issues de l’exécution des questions décisionnels, ❑ etc. 24/01/2022 Dr. Mohamed Mkaouar 22