SlideShare une entreprise Scribd logo
1  sur  39
Télécharger pour lire hors ligne
Plan
Problématique des données dans un système
décisionnel
Architecture fonctionnelle d’un
système décisionnel
DATA WAREHOUSE – Les
entrepôts de donneés
Motivation
 Je ne peux pas trouver la donnée que
je veux: beaucoup de versions
 Je ne peux pas avoir la donnée que je
cherche: besoin d’expert
 Je n’arrive pas à comprendre la
donnée: donnée non documentée
 Je ne peux pas utiliser la donnée que
j’ai trouvé: résultat inattendue
Situation
 Informations importantes
cachée
 Informations historiques
 Informations inconscientes
 Informations limitées
Données globalisées
Ordres des actions perdus
Ambiguïté
Redémarrer la recherche
Problématique
Les décideurs d'une entreprise doivent pouvoir répondre à un
certain nombre de question pour diriger leur entreprise:
 Qui sont mes clients ?
 Pourquoi sont ils mes clients ?
 Comment cibler ma clientèle ?
 Quel est l'évolution de tel produit ?
 Qui sont mes employés ?
L'objectif est donc d'apporter aux décideurs d'une entreprise les
moyens de répondre à ces questions.
Structures de Stockage de Données dans un Système
Décisionnel
Data Marts
(Magasins de données)
Data Warehouse
(Entrepôt de données)
ODS
(Operational Data Store)
Systèmes
Opérationnels
Data Mining
(Extraction de données)
Extraction
Alimentation
Transformation
Synthèse
Ensemble d’outils, méthodes et technologies
d’analyse mises en œuvre pour définir des
tendances, pour segmenter l’information ou pour
établir des corrélations entre les données
Magasin de données orienté sujet, non
volatile, mis à la disposition des utilisateurs
dans un contexte décisionnel décentralisé,
ciblé pour un usage particulier
Entrepôt de données spécifique au monde
décisionnel, destiné principalement à
analyser les leviers business potentiels
ODS: Operational Data Store
o Collection de données orientées sujet,
volatiles, organisées pour le support d’un
processus de décision ponctuel, en support à
une activité opérationnelle particulière
o Donne la vision immédiate et intégrée de
l’état d’un ou plusieurs systèmes opérants
 Entrepôt de données spécifique au monde décisionnel
 Collection de données orientées sujet
 Contenu adapté aux besoins des décideurs
 Structure multidimensionnelle spéciale
 Niveau de détail bien étudié
 Données historiques
Définition
Caractéristiques
 Orienté sujet
 Intégré
 Orienté temps
 Non volatile
L'entrepôt de données contient des données provenant de différentes
sources internes et externes. L'important est la qualité des données, à
savoir l'exactitude et la cohérence.
L'organisation des données est guidé par le point de vue des décideurs
sur des domaines spécifiques de l'entreprise
Les données dans un entrepôt de données a une dimension de temps, à
savoir toutes les valeurs de données et leurs changements dans le temps
peuvent être comparées et analysées long de l'axe de temps.
Contrairement aux bases de données opérationnelles, les données sont
stockées persistantes dans un entrepôt de données. L'accès est par la
lecture des données; analyse ne modifie pas les données.
Améliorant ces caractéristiques par des exemples
Orienté sujet
Systèmes
opérationnels
Systèmes BI
Shopping
Production
Ventes
Clients
Temps
Produits
Intégré
Systèmes
opérationnels
Systèmes BI
H,F
0,1
Homme,Femme
Homme,Femme
Orienté temps
Systèmes
opérationnels
Systèmes BI
Shopping Clients
(60-90 jours) (5-10 ans)
Non volatile
Systèmes
opérationnels
Systèmes BI
Shopping Clients
supprimer
insérer
modifier accès charger
Composants du Data Warehouse
 Le système source : le système d'opération d'enregistrement, dont la fonction
consiste à capturer les transactions liées à l'activité.
 Zone de préparation des données : des processus prépare les données
sources en vue de leur intégration puis de leur exploitation au sein du DW. Elle
ne doit offrir ni service des requêtes, ni service de présentation.
 Serveur de présentation : machine cible sur laquelle l'entrepôt de données est
stocké et organisé pour répondre en accès direct aux requêtes émises par des
utilisateurs.
 Data Mart : sous-ensemble logique d'un DW, destiné à quelques utilisateurs
d'un département.
 Entrepôt de données : C'est tout simplement l'union des Data Marts qui le
composent. Il est alimenté par la zone de préparation des données.
L'administrateur de l'entrepôt de données est également responsable de la zone
de préparation des données.
Composants du Data Warehouse
 OLAP (On Line Analytic Processing) : Activité globale de requêtage et de
présentation de données textuelles et numériques contenues dans l'entrepôt
de données ; style d'interrogation et de présentation spécifiquement
dimensionnel.
 ROLAP (Relational OLAP) : ensemble d'interface utilisateur et d'applications
donnant une vision dimensionnelle des bases de données relationnelles.
 MOLAP (Multidimensional OLAP) : ensemble d'interface utilisateur et
d'applications dont l'aspect dimensionnel est prépondérant.
 Application utilisateur : ensemble d'outils qui présente des informations
répondant à un besoin spécifique sous forme graphique.
 Outil d'accès aux données : client de l'entrepôt de données.
 Outil de requête : types spécifique d'outil d'accès aux données qui invite
l'utilisateur à formuler ses propres requêtes en manipulant directement les
tables et leurs jointures.
 Application de modélisation : type de client de base de données
sophistiqués doté de fonctionnalités analytiques qui transforment ou mettent
en forme les résultats obtenus.
 Métadonnées : toutes informations de l'environnement du Data Warehouse
qui ne constituent pas les données proprement dites.
Composants communs du Data Warehouse
❑ Zone de transit: référentiel de préparation où les données de transaction
peuvent être transformées pour une utilisation dans l'entrepôt de données,
❑ Data Mart: jeu traditionnel modélisé de façon dimensionnelle de tables de
dimension
• Un entrepôt de données est l'union d'un ensemble de data marts
• Data mart indépendant: conçu pour une unité d'affaires stratégique ou d'un
département
❑ Operational Data Store (ODS)
Vs
Hadoop est capable de traiter de très grands volumes de données semi
structurées (fichiers logs, données événementielles…) ou non
structurées (analyse de sentiments basée sur les média sociaux tels que
tweets, blogs ou forums), en s’appuyant sur des jobs MapReduce.
Il ne s’agit pas d’un outil ETL mais plutôt d’une solution capable d’exécuter
des processus ETL en parallèle.
Hadoop ne peut donc être confortablement utilisé comme source
de données d’outils décisionnels pour effectuer des analyses ad-hoc
interactives
Toutefois, une solution décisionnelle telle qu’un data
warehouse demeure encore aujourd’hui la meilleure solution
pour permettre une analyse interactive et performante des
données structurées (qui peuvent être issues des calculs
d’un cluster Hadoop) via des outils décisionnels adaptés tels
que PowerPivot ou PowerView.
Pourquoi les entreprises ont déployé les data warehouse?
 Dans une entreprise, le système d'information constitue
trop souvent une « boîte noire »,
Une entreprise a beaucoup de données, et alors?
Le Data warehouse permet
 le pilotage de l ’entreprise et de ses processus.
 La fédération des données souvent éparpillées dans différentes
bases de données
 Une vision globale et orientée métiers de toutes les données que
manipule l ’entreprise
 Faire face aux changements du marché et de l ’entreprise
 Offre une information compréhensible, utile et rapide.
Ce Qu’il Faut Retenir
 Le data Warehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées (orienté-temps) organisées pour la
prise de décision.
 Dans une entreprise, il existe un seul entrepôt de données mais plusieurs
magasins de données : Finance, Vente…
 Hadoop et Big Data ne peuvent pas être des sources de données pour les
systèmes décisionnels
Architecture
Architecture
Architecture
1) Les Bases de Données
• Bases de production de l’entreprise
• Bases créées par les utilisateurs
• Bases de données externes à l’entreprise
2) Opérations sur les données
EXTRACTION
extraire que les données nécessaires de leurs environnement
d’origine .
TRANSFORMATION
structure ou valeur différente d’une même donnée •
redondances :un même client peut apparaître avec différents attributs
et propriétés selon la source consultée.
Il faut donc épurer et transformer les données.
CHARGEMENT/RAFRAICHISSEMENT
Opérations de calcul et d’agrégation.
Remplacement des certaines bases
procédures de chargement (nocturnes) et de restauration (en cas de
problème).
Architecture
3) Les outils
Extract d’ETI, Genio de Leonard ’s Logic, … •
Le développement d’outils spécifiques est envisageable mais risque
d’alourdir les tâches.
4) Dictionnaire de données
les méta-données : l’ensemble des informations qui permettent de qualifier
une donnée ; sa provenance, sa qualité, l’état de la base à cet instant
Architecture
5) Les Data-Marts
un DW focalisé sur un sujet particulier.
un mini DW lié à un métier particulier de l ’entreprise (finance,
commercial, …). •
Un DW est souvent volumineux avec des performances
inappropriées .
comporte moins de 50 Go, ce qui permet des performances
acceptables. •
La création d’un data-mart peut être un moyen de débuter un
projet de DW (projet pilote).
Architecture
6) Les bases multidimensionnelles et les outils OLAP
Les modèles de données
Modèles d’intégration :unifie les données opérationnelles.
Modèles de diffusion :représente le modèle conceptuel des données. Il
correspond aux bases multidimensionnelles (serveur OLAP). •
Modèles de présentation :est un complément au modèle conceptuel. C’est
à travers ce modèle que l’utilisateur voit les données (les outils clients
OLAP )
Architecture
7) Les outils OLAP (On-Line Analytical Processing)
ensemble des outils multidimensionnels nécessaires à l’accès.
8) Les outils multidimensionnels MOLAP
 l'application physique du concept OLAP
 rapides et performantes.
 fonctionnalités particulièrement évoluées.
 restent limitées au gigaoctet
Les aspects techniques de DataWarehouse
Modélisation
Les tables de dimensions
Elles contiennent les données qui permettent de définir un axe d’une
étude.
Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE
Les tables de faits
Comme leur nom l’indique, Ces tables contiennent uniquement les
données factuelles du DATA WAREHOUSE
Les aspects techniques de DataWarehouse
Les types de modèle
Une table de fait centrale et des dimensions
Les dimensions n’ont pas de liaison entre elles.
Avantages
Facilité de navigation
Nombre de jointures limité
Inconvénients
Redondance dans les dimensions
Les aspects techniques de DataWarehouse
Les types de modèle
Une table de fait et des dimensions décomposées en
sous hiérarchies.
On a un seul niveau hiérarchique dans une table de
dimension.
La table de dimension de niveau hiérarchique le plus bas
est reliée à la table de fait
Avantages
Normalisation des dimensions –
Économie d’espace disque•
Inconvénients
Modèle plus complexe (jointure)
Requêtes moins performantes
ORACLE
Oracle (Oracle Corporation) est une entreprise américaine créée
en 1977 par Larry Ellison. Ses produits phares sont Oracle
Database (un système de gestion de base de données), Oracle
Weblogic Server (un serveur d'applications) et Oracle E-Business
Suite (un progiciel de gestion intégré).
Que représente le terme BI pour ORACLE
 l'ensemble des processus mis en œuvre pour acquérir et gérer
l'ensemble des informations de l'entreprise.
 Une solution Oracle BI doit valoriser les données traitées dans
l'entreprise.
 L'environnement Oracle Business Intelligence s'appuie sur les
technologies OLAP (OnLine Analytical Processing), la fouille
de données ou data mining, et les entrepôts pour satisfaire
aux critères BI.
Oracle warehouse
 C’est une intégration de données, entrepôts de données,
qualité des données, et solution de gestion de métadonnées
conçue pour la base de données Oracle.
 OWB(Warehouse Builder) est complètement intégré avec
l'installation de la base de données Oracle depuis la version
11g Release 1.
Qui sont les acteurs du monde OracleBl ?
L'architecte BI (Data Warehouse Analyst)
définir les structures des bases de données, métadonnées, les
opérations ET L vers l'entrepôt (data warehouse) ou le data-mart. .
Le logiciel OracleBl Warehouse Builder permet de réaliser
l'implantation l'entrepôt.
L'administrateur BI
 superviseur de la construction de DW et/ou des data-mart.
 responsable de l'alimentation des données de DW.
 Organisateur des données au sein du référentiel afin de faciliter les
requêtes émises par les analystes ou les développeurs.
Qui sont les acteurs du monde OracleBl ?
Les utilisateurs BI de l'entreprise
créent des rapports pour mieux cerner l'activité de l'entreprise et
pouvoir répondre à des questions telles que :
-Quels sont les magasins qui réalisent le meilleur chiffre d'affaires ?
Quels sont les meilleurs produits vendus par semaine, par magasin...?
- Quelle est l'évolution du chiffre d'affaires entre l'année n-l
et l'année n ?
-Quelle est la moyenne mobile des ventes des trois derniers mois ?
Qui sont les acteurs du monde OracleBl ?
Les utilisateurs BI de l'entreprise
Pour faciliter l'interrogation des données, Oracle met à la disposition
des utilisateurs de BI les composants suivants :
OracleBl Spreadsheet Add-ln ,
- OracleBl Discoverer.
Le marché du BI
Conclusion
L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans
le monde de l’entreprise, demande qui répond au besoin toujours plus
présent des utilisateurs d’avoir les bonnes informations au bon
moment.
Merci pour votre attention !

Contenu connexe

Tendances

Informatique Décisionnelle décisionnelle
Informatique Décisionnelle décisionnelleInformatique Décisionnelle décisionnelle
Informatique Décisionnelle décisionnelleHajer Trabelsi
 
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiSSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiMicrosoft Technet France
 
Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentCarlos Sanin
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Business Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingBusiness Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingSamia NACIRI
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Orsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - CertificatOrsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - CertificatRégis Bernasconi
 
Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelFrédéric FAURE
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big DataTechnofutur TIC
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence Cynapsys It Hotspot
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olapCynapsys It Hotspot
 
Windows 8, Server 2012 et office 2013
Windows 8, Server 2012 et office 2013Windows 8, Server 2012 et office 2013
Windows 8, Server 2012 et office 2013Patricia NENZI
 
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...Robert Bira
 

Tendances (20)

Informatique Décisionnelle décisionnelle
Informatique Décisionnelle décisionnelleInformatique Décisionnelle décisionnelle
Informatique Décisionnelle décisionnelle
 
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiSSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - student
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Business Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingBusiness Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarking
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Orsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - CertificatOrsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - Certificat
 
Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
ANTIDOT - Antidot information factory
ANTIDOT - Antidot information factoryANTIDOT - Antidot information factory
ANTIDOT - Antidot information factory
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big Data
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Etl -
Etl -Etl -
Etl -
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
Windows 8, Server 2012 et office 2013
Windows 8, Server 2012 et office 2013Windows 8, Server 2012 et office 2013
Windows 8, Server 2012 et office 2013
 
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 

Similaire à Emna borgi mabroukachraita-datawarehouse

Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BISaid Sadik
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big DataIdriss22
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesConverteo
 
CHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfamine17157
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Le m _tier_de_dba_797144552
Le m _tier_de_dba_797144552Le m _tier_de_dba_797144552
Le m _tier_de_dba_797144552Algeria JUG
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptxSamirAwad14
 
Le métier d’administrateur de
Le métier d’administrateur deLe métier d’administrateur de
Le métier d’administrateur deAlgeria JUG
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Wiiisdom
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyOxalide
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
 
Bases de donnees fondamentaux
Bases de donnees fondamentauxBases de donnees fondamentaux
Bases de donnees fondamentauxRokhaya CISSE
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehousekhlifi z
 

Similaire à Emna borgi mabroukachraita-datawarehouse (20)

Big data
Big dataBig data
Big data
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
CHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdf
 
Intro SQL
Intro SQL Intro SQL
Intro SQL
 
Si bdd
Si bddSi bdd
Si bdd
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Le m _tier_de_dba_797144552
Le m _tier_de_dba_797144552Le m _tier_de_dba_797144552
Le m _tier_de_dba_797144552
 
IBM Data lake
IBM Data lakeIBM Data lake
IBM Data lake
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptx
 
Le métier d’administrateur de
Le métier d’administrateur deLe métier d’administrateur de
Le métier d’administrateur de
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...
 
Bases de donnees fondamentaux
Bases de donnees fondamentauxBases de donnees fondamentaux
Bases de donnees fondamentaux
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 

Dernier

BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresidelewebmestre
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueidelewebmestre
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...idelewebmestre
 
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleuridelewebmestre
 
anas transcript 111111111111111111111111
anas transcript 111111111111111111111111anas transcript 111111111111111111111111
anas transcript 111111111111111111111111zaidtaim1214
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresidelewebmestre
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvreidelewebmestre
 
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...idelewebmestre
 
BOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinBOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinidelewebmestre
 

Dernier (10)

BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
 
Webinaire lésions podales_04.04.2024.pptx
Webinaire lésions podales_04.04.2024.pptxWebinaire lésions podales_04.04.2024.pptx
Webinaire lésions podales_04.04.2024.pptx
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
 
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
 
anas transcript 111111111111111111111111
anas transcript 111111111111111111111111anas transcript 111111111111111111111111
anas transcript 111111111111111111111111
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitières
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
 
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
 
BOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinBOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcin
 

Emna borgi mabroukachraita-datawarehouse

  • 1.
  • 2. Plan Problématique des données dans un système décisionnel Architecture fonctionnelle d’un système décisionnel DATA WAREHOUSE – Les entrepôts de donneés
  • 3. Motivation  Je ne peux pas trouver la donnée que je veux: beaucoup de versions  Je ne peux pas avoir la donnée que je cherche: besoin d’expert  Je n’arrive pas à comprendre la donnée: donnée non documentée  Je ne peux pas utiliser la donnée que j’ai trouvé: résultat inattendue
  • 4. Situation  Informations importantes cachée  Informations historiques  Informations inconscientes  Informations limitées Données globalisées Ordres des actions perdus Ambiguïté Redémarrer la recherche
  • 5. Problématique Les décideurs d'une entreprise doivent pouvoir répondre à un certain nombre de question pour diriger leur entreprise:  Qui sont mes clients ?  Pourquoi sont ils mes clients ?  Comment cibler ma clientèle ?  Quel est l'évolution de tel produit ?  Qui sont mes employés ? L'objectif est donc d'apporter aux décideurs d'une entreprise les moyens de répondre à ces questions.
  • 6. Structures de Stockage de Données dans un Système Décisionnel Data Marts (Magasins de données) Data Warehouse (Entrepôt de données) ODS (Operational Data Store) Systèmes Opérationnels Data Mining (Extraction de données) Extraction Alimentation Transformation Synthèse Ensemble d’outils, méthodes et technologies d’analyse mises en œuvre pour définir des tendances, pour segmenter l’information ou pour établir des corrélations entre les données Magasin de données orienté sujet, non volatile, mis à la disposition des utilisateurs dans un contexte décisionnel décentralisé, ciblé pour un usage particulier Entrepôt de données spécifique au monde décisionnel, destiné principalement à analyser les leviers business potentiels ODS: Operational Data Store o Collection de données orientées sujet, volatiles, organisées pour le support d’un processus de décision ponctuel, en support à une activité opérationnelle particulière o Donne la vision immédiate et intégrée de l’état d’un ou plusieurs systèmes opérants
  • 7.  Entrepôt de données spécifique au monde décisionnel  Collection de données orientées sujet  Contenu adapté aux besoins des décideurs  Structure multidimensionnelle spéciale  Niveau de détail bien étudié  Données historiques Définition
  • 8. Caractéristiques  Orienté sujet  Intégré  Orienté temps  Non volatile L'entrepôt de données contient des données provenant de différentes sources internes et externes. L'important est la qualité des données, à savoir l'exactitude et la cohérence. L'organisation des données est guidé par le point de vue des décideurs sur des domaines spécifiques de l'entreprise Les données dans un entrepôt de données a une dimension de temps, à savoir toutes les valeurs de données et leurs changements dans le temps peuvent être comparées et analysées long de l'axe de temps. Contrairement aux bases de données opérationnelles, les données sont stockées persistantes dans un entrepôt de données. L'accès est par la lecture des données; analyse ne modifie pas les données.
  • 13. Non volatile Systèmes opérationnels Systèmes BI Shopping Clients supprimer insérer modifier accès charger
  • 14. Composants du Data Warehouse  Le système source : le système d'opération d'enregistrement, dont la fonction consiste à capturer les transactions liées à l'activité.  Zone de préparation des données : des processus prépare les données sources en vue de leur intégration puis de leur exploitation au sein du DW. Elle ne doit offrir ni service des requêtes, ni service de présentation.  Serveur de présentation : machine cible sur laquelle l'entrepôt de données est stocké et organisé pour répondre en accès direct aux requêtes émises par des utilisateurs.  Data Mart : sous-ensemble logique d'un DW, destiné à quelques utilisateurs d'un département.  Entrepôt de données : C'est tout simplement l'union des Data Marts qui le composent. Il est alimenté par la zone de préparation des données. L'administrateur de l'entrepôt de données est également responsable de la zone de préparation des données. Composants du Data Warehouse  OLAP (On Line Analytic Processing) : Activité globale de requêtage et de présentation de données textuelles et numériques contenues dans l'entrepôt de données ; style d'interrogation et de présentation spécifiquement dimensionnel.  ROLAP (Relational OLAP) : ensemble d'interface utilisateur et d'applications donnant une vision dimensionnelle des bases de données relationnelles.  MOLAP (Multidimensional OLAP) : ensemble d'interface utilisateur et d'applications dont l'aspect dimensionnel est prépondérant.  Application utilisateur : ensemble d'outils qui présente des informations répondant à un besoin spécifique sous forme graphique.  Outil d'accès aux données : client de l'entrepôt de données.  Outil de requête : types spécifique d'outil d'accès aux données qui invite l'utilisateur à formuler ses propres requêtes en manipulant directement les tables et leurs jointures.  Application de modélisation : type de client de base de données sophistiqués doté de fonctionnalités analytiques qui transforment ou mettent en forme les résultats obtenus.  Métadonnées : toutes informations de l'environnement du Data Warehouse qui ne constituent pas les données proprement dites.
  • 15. Composants communs du Data Warehouse ❑ Zone de transit: référentiel de préparation où les données de transaction peuvent être transformées pour une utilisation dans l'entrepôt de données, ❑ Data Mart: jeu traditionnel modélisé de façon dimensionnelle de tables de dimension • Un entrepôt de données est l'union d'un ensemble de data marts • Data mart indépendant: conçu pour une unité d'affaires stratégique ou d'un département ❑ Operational Data Store (ODS)
  • 16.
  • 17. Vs Hadoop est capable de traiter de très grands volumes de données semi structurées (fichiers logs, données événementielles…) ou non structurées (analyse de sentiments basée sur les média sociaux tels que tweets, blogs ou forums), en s’appuyant sur des jobs MapReduce. Il ne s’agit pas d’un outil ETL mais plutôt d’une solution capable d’exécuter des processus ETL en parallèle. Hadoop ne peut donc être confortablement utilisé comme source de données d’outils décisionnels pour effectuer des analyses ad-hoc interactives Toutefois, une solution décisionnelle telle qu’un data warehouse demeure encore aujourd’hui la meilleure solution pour permettre une analyse interactive et performante des données structurées (qui peuvent être issues des calculs d’un cluster Hadoop) via des outils décisionnels adaptés tels que PowerPivot ou PowerView.
  • 18. Pourquoi les entreprises ont déployé les data warehouse?  Dans une entreprise, le système d'information constitue trop souvent une « boîte noire », Une entreprise a beaucoup de données, et alors? Le Data warehouse permet  le pilotage de l ’entreprise et de ses processus.  La fédération des données souvent éparpillées dans différentes bases de données  Une vision globale et orientée métiers de toutes les données que manipule l ’entreprise  Faire face aux changements du marché et de l ’entreprise  Offre une information compréhensible, utile et rapide.
  • 19. Ce Qu’il Faut Retenir  Le data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées (orienté-temps) organisées pour la prise de décision.  Dans une entreprise, il existe un seul entrepôt de données mais plusieurs magasins de données : Finance, Vente…  Hadoop et Big Data ne peuvent pas être des sources de données pour les systèmes décisionnels
  • 22. Architecture 1) Les Bases de Données • Bases de production de l’entreprise • Bases créées par les utilisateurs • Bases de données externes à l’entreprise
  • 23. 2) Opérations sur les données EXTRACTION extraire que les données nécessaires de leurs environnement d’origine . TRANSFORMATION structure ou valeur différente d’une même donnée • redondances :un même client peut apparaître avec différents attributs et propriétés selon la source consultée. Il faut donc épurer et transformer les données. CHARGEMENT/RAFRAICHISSEMENT Opérations de calcul et d’agrégation. Remplacement des certaines bases procédures de chargement (nocturnes) et de restauration (en cas de problème).
  • 24. Architecture 3) Les outils Extract d’ETI, Genio de Leonard ’s Logic, … • Le développement d’outils spécifiques est envisageable mais risque d’alourdir les tâches. 4) Dictionnaire de données les méta-données : l’ensemble des informations qui permettent de qualifier une donnée ; sa provenance, sa qualité, l’état de la base à cet instant
  • 25. Architecture 5) Les Data-Marts un DW focalisé sur un sujet particulier. un mini DW lié à un métier particulier de l ’entreprise (finance, commercial, …). • Un DW est souvent volumineux avec des performances inappropriées . comporte moins de 50 Go, ce qui permet des performances acceptables. • La création d’un data-mart peut être un moyen de débuter un projet de DW (projet pilote).
  • 26. Architecture 6) Les bases multidimensionnelles et les outils OLAP Les modèles de données Modèles d’intégration :unifie les données opérationnelles. Modèles de diffusion :représente le modèle conceptuel des données. Il correspond aux bases multidimensionnelles (serveur OLAP). • Modèles de présentation :est un complément au modèle conceptuel. C’est à travers ce modèle que l’utilisateur voit les données (les outils clients OLAP )
  • 27. Architecture 7) Les outils OLAP (On-Line Analytical Processing) ensemble des outils multidimensionnels nécessaires à l’accès. 8) Les outils multidimensionnels MOLAP  l'application physique du concept OLAP  rapides et performantes.  fonctionnalités particulièrement évoluées.  restent limitées au gigaoctet
  • 28. Les aspects techniques de DataWarehouse Modélisation Les tables de dimensions Elles contiennent les données qui permettent de définir un axe d’une étude. Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE Les tables de faits Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE
  • 29. Les aspects techniques de DataWarehouse Les types de modèle Une table de fait centrale et des dimensions Les dimensions n’ont pas de liaison entre elles. Avantages Facilité de navigation Nombre de jointures limité Inconvénients Redondance dans les dimensions
  • 30. Les aspects techniques de DataWarehouse Les types de modèle Une table de fait et des dimensions décomposées en sous hiérarchies. On a un seul niveau hiérarchique dans une table de dimension. La table de dimension de niveau hiérarchique le plus bas est reliée à la table de fait Avantages Normalisation des dimensions – Économie d’espace disque• Inconvénients Modèle plus complexe (jointure) Requêtes moins performantes
  • 31. ORACLE Oracle (Oracle Corporation) est une entreprise américaine créée en 1977 par Larry Ellison. Ses produits phares sont Oracle Database (un système de gestion de base de données), Oracle Weblogic Server (un serveur d'applications) et Oracle E-Business Suite (un progiciel de gestion intégré).
  • 32. Que représente le terme BI pour ORACLE  l'ensemble des processus mis en œuvre pour acquérir et gérer l'ensemble des informations de l'entreprise.  Une solution Oracle BI doit valoriser les données traitées dans l'entreprise.  L'environnement Oracle Business Intelligence s'appuie sur les technologies OLAP (OnLine Analytical Processing), la fouille de données ou data mining, et les entrepôts pour satisfaire aux critères BI.
  • 33. Oracle warehouse  C’est une intégration de données, entrepôts de données, qualité des données, et solution de gestion de métadonnées conçue pour la base de données Oracle.  OWB(Warehouse Builder) est complètement intégré avec l'installation de la base de données Oracle depuis la version 11g Release 1.
  • 34. Qui sont les acteurs du monde OracleBl ? L'architecte BI (Data Warehouse Analyst) définir les structures des bases de données, métadonnées, les opérations ET L vers l'entrepôt (data warehouse) ou le data-mart. . Le logiciel OracleBl Warehouse Builder permet de réaliser l'implantation l'entrepôt. L'administrateur BI  superviseur de la construction de DW et/ou des data-mart.  responsable de l'alimentation des données de DW.  Organisateur des données au sein du référentiel afin de faciliter les requêtes émises par les analystes ou les développeurs.
  • 35. Qui sont les acteurs du monde OracleBl ? Les utilisateurs BI de l'entreprise créent des rapports pour mieux cerner l'activité de l'entreprise et pouvoir répondre à des questions telles que : -Quels sont les magasins qui réalisent le meilleur chiffre d'affaires ? Quels sont les meilleurs produits vendus par semaine, par magasin...? - Quelle est l'évolution du chiffre d'affaires entre l'année n-l et l'année n ? -Quelle est la moyenne mobile des ventes des trois derniers mois ?
  • 36. Qui sont les acteurs du monde OracleBl ? Les utilisateurs BI de l'entreprise Pour faciliter l'interrogation des données, Oracle met à la disposition des utilisateurs de BI les composants suivants : OracleBl Spreadsheet Add-ln , - OracleBl Discoverer.
  • 38. Conclusion L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans le monde de l’entreprise, demande qui répond au besoin toujours plus présent des utilisateurs d’avoir les bonnes informations au bon moment.
  • 39. Merci pour votre attention !

Notes de l'éditeur

  1. Présenter ma soutenance tournée autour de mon mémoire ayant pour sujet : la démarche d’amélioration continue au sein d’une SSII
  2. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  3. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  4. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  5. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  6. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  7. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  8. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  9. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  10. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  11. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  12. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  13. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  14. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  15. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  16. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  17. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  18. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle