SlideShare une entreprise Scribd logo
1  sur  22
OUTILS
DÉCISIONNELS
DATA-MINING & DATA-WAREHOUSE
BEL MRHAR Mohamed Amine
Introduction
■ On qualifie d'informatique décisionnelle (en anglais «Business
intelligence », parfois appelé tout simplement « le décisionnel »)
l'exploitation des données de l'entreprise dans le but de faciliter la
prise de décision par les décideurs, c'est-à-dire la compréhension
du fonctionnement actuel et l'anticipation des actions pour un
pilotage éclairé de l'entreprise.
■ Les outils décisionnels comme le Data Warehouse et le Data
Mining sont basés sur l'exploitation d'un système d'information
décisionnel alimenté grâce à l'extraction de données diverses à
partir des données de production, d'informations concernant
l'entreprise ou son entourage et de données économiques.
Architecture
1- Qu’est-ce qu’un Data warehouse? L'Entrepôt de
Données
■ Définition de Bill Inmon (1996)
«Le Data Warehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.»
■ Une base de données d’aide à la décision qui est entretenue de
manière séparée de la base de données opérationnelle de
l’organisation
■ Aide au traitement de l’information en fournissant une plateforme de
données historiques consolidées pour l’analyse.
■ Data warehousing: Le processus de construction et d’utilisation du data
warehouse.
2-Caracteristiques du Data-
Warehouse:
■ Base de Données utilisée à des fins d’analyse.
■ Caractéristiques :
• Orientation sujets («métiers»)
• Données intégrées
• Données non volatiles
• Données datées
• Regroupe les informations des différents métiers
• Ne tiens pas compte de l’organisation fonctionnelle des
données
• Définition d’un référentiel unique.
• Normalisation des données
• Traçabilité des informations et des décisions
prises
• Copie des données de production
Les données datées:
■ Les données persistent dans le temps
■ Mise en place d’un référentiel temps
L'Entrepôt de Données (DW)
■ Les datawarehouse sont des systèmes conçus pour l’aide à la prise de
décision. (Mode de travail: OLAP On-Line Analytical Processing)
■ La plupart du temps sont utilisés en lecture (utilisateurs)
■ Les objectifs principaux sont
regrouper, organiser des informations provenant de
■ sources diverses,
■ les intégrer et les stocker pour donner à l’utilisateur une vue orientée
métier,
■ retrouver et analyser l’information facilement et rapidement.
3- Objectifs:
• Les datawarehouse sont des systèmes conçus pour l’aide à la prise de
décision. (Mode de travail: OLAP On-Line Analytical Processing)
• La plupart du temps sont utilisés en lecture (utilisateurs)
• Les objectifs principaux sont
regrouper, organiser des informations provenant de
• sources diverses,
• les intégrer et les stocker pour donner à l’utilisateur une vue orientée
métier,
• retrouver et analyser l’information facilement et rapidement.
Objectifs:
4- Trois modèles de data-Warehouse
■ Entreprise Warehouse:
– Collecte de toutes les informations concernant les sujets traités au niveau de
l’organisation
■ Data Mart:
– Un sous ensemble d’un entreprise warehouse. Il est spécifique à un groupe
d’utilisateurs (ex: data mart du marketing)
■ DataWarehouse virtuel:
– Un ensemble de vues définies à partir de la base opérationnelle
– Seulement un sous ensemble des vues sont matérialisées
5- Architecture des serveurs OLAP
■ Relational OLAP (ROLAP)
– Utilise un SGBD relationnel pour stocker les données ainsi
qu’un middle-ware pour implémenter les opérations
spécifiques de l’OLAP
■ MultidimensionalOLAP (MOLAP)
– Basé sur un stockage par tableaux (techniques des matrices
creuses)
– Indexation rapide de données calculées
5-2- Deux types de traitements: OLAP / OLTP
■ OLTP (on-line transaction processing)
 Tâche majeure des Bdd relationnelles traditionnelles
 Opérations quotidiennes enregistrées.
■ OLAP (on-line analytical processing)
 Tâche majeure des systèmes
de data warehouse
 Analyse de données et décision
II. Data-Mining:
1. Définition du Data Mining:
 Data-Mining est le processus de recherche de modèles dans un
ensemble de données donné. Ces modèles peuvent souvent fournir des
données significatives et perspicaces à quiconque s'intéresse à ces
données. L'exploration de données est utilisée aujourd'hui dans une
grande variété de contextes - dans la détection de la fraude, comme une
aide dans les campagnes de marketing, et même les supermarchés
l'utilisent pour étudier leurs consommateurs.
 Processus inductif, itératif et interactif de découverte dans les BD larges
de modèles de données valides, nouveaux, utiles et compréhensibles.
■ Itératif : nécessite plusieurs passes
■ Interactif : l’utilisateur est dans la boucle du processus
■ Valides : valables dans le futur
■ Nouveaux : non prévisibles
■ Utiles : permettent à l’utilisateur de prendre des décisions
■ Compréhensibles : présentation simple
2- Pourquoi le Data Mining ?
■ Explosion des données:
• Masse importante de données
• Données multi-dimensionnelles
• Collecte de masses importantes de données
• Besoin raitement en temps réel de ces données
■ Améliorer la productivité:
• Forte pression due à la concurrence du marché
• Brièveté́ du cycle de vie des produits
• Besoin de prendre des décisions stratégiques efficaces
- Exploiter le vécu (données historiques) pour prédire le futur et anticiper le marché
- Individualisation des consommateurs (dé-massification).
■ Croissance en puissance/coût des machines capables:
• de supporter de gros volumes de données
• d’exécuter le processus intensif d’exploration
• hétérogénéité des supports de stockage
1. Comprendre l’application
2. Sélectionner un échantillon de données
3. Nettoyage et transformation des données
4. Appliquer les techniques de fouille de données (DM)
5. Visualiser, évaluer et interpréter les modèles découverts
6. Gérer/déployer la connaissance découverte
3- Démarche méthodologique
4- Data Mining et aide à la décision:
5- objectifs:
■ Développer des techniques et systèmes efficaces et extensibles pour l’exploration de :
o BD larges et multi-dimensionnelles
o Données distribuées
■ Faciliter l’utilisation des systèmes de DM
o Limiter l’intervention de l’utilisateur
o Représentation simple de la connaissance
o Visualisation sous forme exploitable
III. Data-mining # Data-Warehouse
■ Data Warehouse: base de données résumant diverses BD
transactionnelles pour servir de support à la prise de décision
■ Data mining : effectué sur des entrepôts de données aussi bien que sur
des BD transactionnelles.
Le DW est un processus qui doit avoir lieu avant que l'exploration de données puisse avoir
lieu. En d'autres termes, DW est le processus de compilation et d'organisation des
données dans une base de données commune, et DM est le processus d'extraction de
données significatives à partir de cette base de données. Le processus DM repose sur les
données compilées dans la phase de stockage de données afin de détecter des modèles
significatifs.
Conclusion:
La conception d'entrepôts de données est donc un processus en
perpétuelle évolution. Sous cet angle, on peut finalement voir l'entrepôt de
données comme une architecture décisionnelle capable à la fois de gérer
l'hétérogénéité et le changement et dont l'enjeu est de transformer
les données en informations directement exploitables par les utilisateurs
du métier concerné.
Bibliographie:
■ Systèmes d’information décisionnels (DataWarehouse / Data Mining) E. GRISLIN-LE
STRUGEON et D. DONSEZ 1996-2006
■ www.programmerinterview.com/.../data-mining-vs-warehousing
■ DatawarehouseC.Vangenot « Laboratoire de Base de données » Database Laboratory
■ Cours d’aide à la décision : Du datawarehouse au datamining « L. Jourdan »
■ Data Mining, fouille de données: Data Mining, fouille de données « Marius Fieschi Faculté de
Médecine de Marseille »
■ https://fr.wikipedia.org/wiki/Entrepôt_de_données

Contenu connexe

Tendances

Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsJean-Marc Dupont
 
Ppt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluationPpt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluationUSIGGENEVE
 
Chap1 systéme d'information
Chap1 systéme d'informationChap1 systéme d'information
Chap1 systéme d'informationGhita Benabdellah
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_amanMehdi Aman
 
10 minutes : Tableaux de bord
10 minutes : Tableaux de bord10 minutes : Tableaux de bord
10 minutes : Tableaux de bordConverteo
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Gestion des connaissances (Knowledge Management)
Gestion des connaissances  (Knowledge Management)Gestion des connaissances  (Knowledge Management)
Gestion des connaissances (Knowledge Management)Hanen Bensaad
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
Projet décisionnel
Projet décisionnelProjet décisionnel
Projet décisionnelSiham JABRI
 
Les positionnements épistémologiques et Outils méthodologiques
Les positionnements épistémologiques et Outils méthodologiquesLes positionnements épistémologiques et Outils méthodologiques
Les positionnements épistémologiques et Outils méthodologiquesbouchra elabbadi
 
présentation soutenance PFE.ppt
présentation soutenance PFE.pptprésentation soutenance PFE.ppt
présentation soutenance PFE.pptMohamed Ben Bouzid
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
LE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUELE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUEKhaled Fayala
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 

Tendances (20)

Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
 
Ppt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluationPpt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluation
 
Km
KmKm
Km
 
Chap1 systéme d'information
Chap1 systéme d'informationChap1 systéme d'information
Chap1 systéme d'information
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
10 minutes : Tableaux de bord
10 minutes : Tableaux de bord10 minutes : Tableaux de bord
10 minutes : Tableaux de bord
 
Big data
Big dataBig data
Big data
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Partie1BI-DW2019
Partie1BI-DW2019Partie1BI-DW2019
Partie1BI-DW2019
 
Gestion des connaissances (Knowledge Management)
Gestion des connaissances  (Knowledge Management)Gestion des connaissances  (Knowledge Management)
Gestion des connaissances (Knowledge Management)
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Projet décisionnel
Projet décisionnelProjet décisionnel
Projet décisionnel
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 
Les positionnements épistémologiques et Outils méthodologiques
Les positionnements épistémologiques et Outils méthodologiquesLes positionnements épistémologiques et Outils méthodologiques
Les positionnements épistémologiques et Outils méthodologiques
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
présentation soutenance PFE.ppt
présentation soutenance PFE.pptprésentation soutenance PFE.ppt
présentation soutenance PFE.ppt
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
LE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUELE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUE
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 

Similaire à Outils décisionnels : Data-Mining and Data-warehouse

Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentCarlos Sanin
 
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.pptBD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.pptmarocdakhla135
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptxSamirAwad14
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big DataIdriss22
 
Chap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdf
Chap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdfChap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdf
Chap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdfIbrahimBenhadhria
 
DESCRIPTIF BIG DATA (1).pptx
DESCRIPTIF BIG DATA (1).pptxDESCRIPTIF BIG DATA (1).pptx
DESCRIPTIF BIG DATA (1).pptxEliasLad
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
 
Chapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesChapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesMohamed Mkaouar
 
20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competiticCOMPETITIC
 
Introduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfIntroduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfamarasidibeavm
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesConverteo
 
Seance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entrepriseSeance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entreprisesciafrique
 

Similaire à Outils décisionnels : Data-Mining and Data-warehouse (20)

Dwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - student
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.pptBD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
 
Data Warehousing.pptx
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptx
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Chap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdf
Chap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdfChap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdf
Chap1et2-IntroED (2 aaaaaaaaaaaaaaaa).pdf
 
DESCRIPTIF BIG DATA (1).pptx
DESCRIPTIF BIG DATA (1).pptxDESCRIPTIF BIG DATA (1).pptx
DESCRIPTIF BIG DATA (1).pptx
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...
 
Chapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesChapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de données
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
projet BI licnence.pdf
projet BI licnence.pdfprojet BI licnence.pdf
projet BI licnence.pdf
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Big data
Big dataBig data
Big data
 
20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic
 
Introduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfIntroduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdf
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
Seance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entrepriseSeance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entreprise
 
IBM Data lake
IBM Data lakeIBM Data lake
IBM Data lake
 
Business intelligence QLIKVIEW
Business intelligence QLIKVIEWBusiness intelligence QLIKVIEW
Business intelligence QLIKVIEW
 

Plus de BEL MRHAR Mohamed Amine

Projet en matière de droit portant sur le contrat de transfer de savoir-faire...
Projet en matière de droit portant sur le contrat de transfer de savoir-faire...Projet en matière de droit portant sur le contrat de transfer de savoir-faire...
Projet en matière de droit portant sur le contrat de transfer de savoir-faire...BEL MRHAR Mohamed Amine
 
Projet en matière de droit: Protection consommateur contre les clauses abusives
Projet en matière de droit: Protection consommateur contre les clauses abusivesProjet en matière de droit: Protection consommateur contre les clauses abusives
Projet en matière de droit: Protection consommateur contre les clauses abusivesBEL MRHAR Mohamed Amine
 
Rapport montage financier - Cas de la titrisation -
Rapport montage financier - Cas de la titrisation - Rapport montage financier - Cas de la titrisation -
Rapport montage financier - Cas de la titrisation - BEL MRHAR Mohamed Amine
 
Etude sur la satisfaction client dans le marketing des services - cas de l'ONCF
Etude sur la satisfaction client dans le marketing des services - cas de l'ONCFEtude sur la satisfaction client dans le marketing des services - cas de l'ONCF
Etude sur la satisfaction client dans le marketing des services - cas de l'ONCFBEL MRHAR Mohamed Amine
 
Projet d'étude - les choix de financement - Cas de SOTHEMA
Projet d'étude - les choix de financement - Cas de SOTHEMAProjet d'étude - les choix de financement - Cas de SOTHEMA
Projet d'étude - les choix de financement - Cas de SOTHEMABEL MRHAR Mohamed Amine
 
PFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROC
PFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROCPFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROC
PFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROCBEL MRHAR Mohamed Amine
 
Stratégie et changement stratégique et organisationnel
Stratégie et changement stratégique et organisationnelStratégie et changement stratégique et organisationnel
Stratégie et changement stratégique et organisationnelBEL MRHAR Mohamed Amine
 

Plus de BEL MRHAR Mohamed Amine (10)

Projet en matière de droit portant sur le contrat de transfer de savoir-faire...
Projet en matière de droit portant sur le contrat de transfer de savoir-faire...Projet en matière de droit portant sur le contrat de transfer de savoir-faire...
Projet en matière de droit portant sur le contrat de transfer de savoir-faire...
 
Projet en matière de droit: Protection consommateur contre les clauses abusives
Projet en matière de droit: Protection consommateur contre les clauses abusivesProjet en matière de droit: Protection consommateur contre les clauses abusives
Projet en matière de droit: Protection consommateur contre les clauses abusives
 
Rapport montage financier - Cas de la titrisation -
Rapport montage financier - Cas de la titrisation - Rapport montage financier - Cas de la titrisation -
Rapport montage financier - Cas de la titrisation -
 
La politique de dividende
La politique de dividende La politique de dividende
La politique de dividende
 
Etude sur la satisfaction client dans le marketing des services - cas de l'ONCF
Etude sur la satisfaction client dans le marketing des services - cas de l'ONCFEtude sur la satisfaction client dans le marketing des services - cas de l'ONCF
Etude sur la satisfaction client dans le marketing des services - cas de l'ONCF
 
Projet d'étude - les choix de financement - Cas de SOTHEMA
Projet d'étude - les choix de financement - Cas de SOTHEMAProjet d'étude - les choix de financement - Cas de SOTHEMA
Projet d'étude - les choix de financement - Cas de SOTHEMA
 
Exemple Blueprint
Exemple Blueprint Exemple Blueprint
Exemple Blueprint
 
PFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROC
PFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROCPFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROC
PFE L’ENTREPRENEURIAT ET LES JEUNES AU MAROC
 
Stratégie et changement stratégique et organisationnel
Stratégie et changement stratégique et organisationnelStratégie et changement stratégique et organisationnel
Stratégie et changement stratégique et organisationnel
 
PFE L'entrepreneuriat social
PFE L'entrepreneuriat socialPFE L'entrepreneuriat social
PFE L'entrepreneuriat social
 

Outils décisionnels : Data-Mining and Data-warehouse

  • 2. Introduction ■ On qualifie d'informatique décisionnelle (en anglais «Business intelligence », parfois appelé tout simplement « le décisionnel ») l'exploitation des données de l'entreprise dans le but de faciliter la prise de décision par les décideurs, c'est-à-dire la compréhension du fonctionnement actuel et l'anticipation des actions pour un pilotage éclairé de l'entreprise. ■ Les outils décisionnels comme le Data Warehouse et le Data Mining sont basés sur l'exploitation d'un système d'information décisionnel alimenté grâce à l'extraction de données diverses à partir des données de production, d'informations concernant l'entreprise ou son entourage et de données économiques.
  • 4. 1- Qu’est-ce qu’un Data warehouse? L'Entrepôt de Données ■ Définition de Bill Inmon (1996) «Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision.» ■ Une base de données d’aide à la décision qui est entretenue de manière séparée de la base de données opérationnelle de l’organisation ■ Aide au traitement de l’information en fournissant une plateforme de données historiques consolidées pour l’analyse. ■ Data warehousing: Le processus de construction et d’utilisation du data warehouse.
  • 5. 2-Caracteristiques du Data- Warehouse: ■ Base de Données utilisée à des fins d’analyse. ■ Caractéristiques : • Orientation sujets («métiers») • Données intégrées • Données non volatiles • Données datées
  • 6. • Regroupe les informations des différents métiers • Ne tiens pas compte de l’organisation fonctionnelle des données
  • 7. • Définition d’un référentiel unique. • Normalisation des données
  • 8. • Traçabilité des informations et des décisions prises • Copie des données de production
  • 9. Les données datées: ■ Les données persistent dans le temps ■ Mise en place d’un référentiel temps
  • 10. L'Entrepôt de Données (DW) ■ Les datawarehouse sont des systèmes conçus pour l’aide à la prise de décision. (Mode de travail: OLAP On-Line Analytical Processing) ■ La plupart du temps sont utilisés en lecture (utilisateurs) ■ Les objectifs principaux sont regrouper, organiser des informations provenant de ■ sources diverses, ■ les intégrer et les stocker pour donner à l’utilisateur une vue orientée métier, ■ retrouver et analyser l’information facilement et rapidement. 3- Objectifs:
  • 11. • Les datawarehouse sont des systèmes conçus pour l’aide à la prise de décision. (Mode de travail: OLAP On-Line Analytical Processing) • La plupart du temps sont utilisés en lecture (utilisateurs) • Les objectifs principaux sont regrouper, organiser des informations provenant de • sources diverses, • les intégrer et les stocker pour donner à l’utilisateur une vue orientée métier, • retrouver et analyser l’information facilement et rapidement. Objectifs:
  • 12. 4- Trois modèles de data-Warehouse ■ Entreprise Warehouse: – Collecte de toutes les informations concernant les sujets traités au niveau de l’organisation ■ Data Mart: – Un sous ensemble d’un entreprise warehouse. Il est spécifique à un groupe d’utilisateurs (ex: data mart du marketing) ■ DataWarehouse virtuel: – Un ensemble de vues définies à partir de la base opérationnelle – Seulement un sous ensemble des vues sont matérialisées
  • 13. 5- Architecture des serveurs OLAP ■ Relational OLAP (ROLAP) – Utilise un SGBD relationnel pour stocker les données ainsi qu’un middle-ware pour implémenter les opérations spécifiques de l’OLAP ■ MultidimensionalOLAP (MOLAP) – Basé sur un stockage par tableaux (techniques des matrices creuses) – Indexation rapide de données calculées
  • 14. 5-2- Deux types de traitements: OLAP / OLTP ■ OLTP (on-line transaction processing)  Tâche majeure des Bdd relationnelles traditionnelles  Opérations quotidiennes enregistrées. ■ OLAP (on-line analytical processing)  Tâche majeure des systèmes de data warehouse  Analyse de données et décision
  • 15. II. Data-Mining: 1. Définition du Data Mining:  Data-Mining est le processus de recherche de modèles dans un ensemble de données donné. Ces modèles peuvent souvent fournir des données significatives et perspicaces à quiconque s'intéresse à ces données. L'exploration de données est utilisée aujourd'hui dans une grande variété de contextes - dans la détection de la fraude, comme une aide dans les campagnes de marketing, et même les supermarchés l'utilisent pour étudier leurs consommateurs.  Processus inductif, itératif et interactif de découverte dans les BD larges de modèles de données valides, nouveaux, utiles et compréhensibles. ■ Itératif : nécessite plusieurs passes ■ Interactif : l’utilisateur est dans la boucle du processus ■ Valides : valables dans le futur ■ Nouveaux : non prévisibles ■ Utiles : permettent à l’utilisateur de prendre des décisions ■ Compréhensibles : présentation simple
  • 16. 2- Pourquoi le Data Mining ? ■ Explosion des données: • Masse importante de données • Données multi-dimensionnelles • Collecte de masses importantes de données • Besoin raitement en temps réel de ces données ■ Améliorer la productivité: • Forte pression due à la concurrence du marché • Brièveté́ du cycle de vie des produits • Besoin de prendre des décisions stratégiques efficaces - Exploiter le vécu (données historiques) pour prédire le futur et anticiper le marché - Individualisation des consommateurs (dé-massification). ■ Croissance en puissance/coût des machines capables: • de supporter de gros volumes de données • d’exécuter le processus intensif d’exploration • hétérogénéité des supports de stockage
  • 17. 1. Comprendre l’application 2. Sélectionner un échantillon de données 3. Nettoyage et transformation des données 4. Appliquer les techniques de fouille de données (DM) 5. Visualiser, évaluer et interpréter les modèles découverts 6. Gérer/déployer la connaissance découverte 3- Démarche méthodologique
  • 18. 4- Data Mining et aide à la décision:
  • 19. 5- objectifs: ■ Développer des techniques et systèmes efficaces et extensibles pour l’exploration de : o BD larges et multi-dimensionnelles o Données distribuées ■ Faciliter l’utilisation des systèmes de DM o Limiter l’intervention de l’utilisateur o Représentation simple de la connaissance o Visualisation sous forme exploitable
  • 20. III. Data-mining # Data-Warehouse ■ Data Warehouse: base de données résumant diverses BD transactionnelles pour servir de support à la prise de décision ■ Data mining : effectué sur des entrepôts de données aussi bien que sur des BD transactionnelles. Le DW est un processus qui doit avoir lieu avant que l'exploration de données puisse avoir lieu. En d'autres termes, DW est le processus de compilation et d'organisation des données dans une base de données commune, et DM est le processus d'extraction de données significatives à partir de cette base de données. Le processus DM repose sur les données compilées dans la phase de stockage de données afin de détecter des modèles significatifs.
  • 21. Conclusion: La conception d'entrepôts de données est donc un processus en perpétuelle évolution. Sous cet angle, on peut finalement voir l'entrepôt de données comme une architecture décisionnelle capable à la fois de gérer l'hétérogénéité et le changement et dont l'enjeu est de transformer les données en informations directement exploitables par les utilisateurs du métier concerné.
  • 22. Bibliographie: ■ Systèmes d’information décisionnels (DataWarehouse / Data Mining) E. GRISLIN-LE STRUGEON et D. DONSEZ 1996-2006 ■ www.programmerinterview.com/.../data-mining-vs-warehousing ■ DatawarehouseC.Vangenot « Laboratoire de Base de données » Database Laboratory ■ Cours d’aide à la décision : Du datawarehouse au datamining « L. Jourdan » ■ Data Mining, fouille de données: Data Mining, fouille de données « Marius Fieschi Faculté de Médecine de Marseille » ■ https://fr.wikipedia.org/wiki/Entrepôt_de_données