2. Introduction
■ On qualifie d'informatique décisionnelle (en anglais «Business
intelligence », parfois appelé tout simplement « le décisionnel »)
l'exploitation des données de l'entreprise dans le but de faciliter la
prise de décision par les décideurs, c'est-à-dire la compréhension
du fonctionnement actuel et l'anticipation des actions pour un
pilotage éclairé de l'entreprise.
■ Les outils décisionnels comme le Data Warehouse et le Data
Mining sont basés sur l'exploitation d'un système d'information
décisionnel alimenté grâce à l'extraction de données diverses à
partir des données de production, d'informations concernant
l'entreprise ou son entourage et de données économiques.
4. 1- Qu’est-ce qu’un Data warehouse? L'Entrepôt de
Données
■ Définition de Bill Inmon (1996)
«Le Data Warehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.»
■ Une base de données d’aide à la décision qui est entretenue de
manière séparée de la base de données opérationnelle de
l’organisation
■ Aide au traitement de l’information en fournissant une plateforme de
données historiques consolidées pour l’analyse.
■ Data warehousing: Le processus de construction et d’utilisation du data
warehouse.
5. 2-Caracteristiques du Data-
Warehouse:
■ Base de Données utilisée à des fins d’analyse.
■ Caractéristiques :
• Orientation sujets («métiers»)
• Données intégrées
• Données non volatiles
• Données datées
6. • Regroupe les informations des différents métiers
• Ne tiens pas compte de l’organisation fonctionnelle des
données
8. • Traçabilité des informations et des décisions
prises
• Copie des données de production
9. Les données datées:
■ Les données persistent dans le temps
■ Mise en place d’un référentiel temps
10. L'Entrepôt de Données (DW)
■ Les datawarehouse sont des systèmes conçus pour l’aide à la prise de
décision. (Mode de travail: OLAP On-Line Analytical Processing)
■ La plupart du temps sont utilisés en lecture (utilisateurs)
■ Les objectifs principaux sont
regrouper, organiser des informations provenant de
■ sources diverses,
■ les intégrer et les stocker pour donner à l’utilisateur une vue orientée
métier,
■ retrouver et analyser l’information facilement et rapidement.
3- Objectifs:
11. • Les datawarehouse sont des systèmes conçus pour l’aide à la prise de
décision. (Mode de travail: OLAP On-Line Analytical Processing)
• La plupart du temps sont utilisés en lecture (utilisateurs)
• Les objectifs principaux sont
regrouper, organiser des informations provenant de
• sources diverses,
• les intégrer et les stocker pour donner à l’utilisateur une vue orientée
métier,
• retrouver et analyser l’information facilement et rapidement.
Objectifs:
12. 4- Trois modèles de data-Warehouse
■ Entreprise Warehouse:
– Collecte de toutes les informations concernant les sujets traités au niveau de
l’organisation
■ Data Mart:
– Un sous ensemble d’un entreprise warehouse. Il est spécifique à un groupe
d’utilisateurs (ex: data mart du marketing)
■ DataWarehouse virtuel:
– Un ensemble de vues définies à partir de la base opérationnelle
– Seulement un sous ensemble des vues sont matérialisées
13. 5- Architecture des serveurs OLAP
■ Relational OLAP (ROLAP)
– Utilise un SGBD relationnel pour stocker les données ainsi
qu’un middle-ware pour implémenter les opérations
spécifiques de l’OLAP
■ MultidimensionalOLAP (MOLAP)
– Basé sur un stockage par tableaux (techniques des matrices
creuses)
– Indexation rapide de données calculées
14. 5-2- Deux types de traitements: OLAP / OLTP
■ OLTP (on-line transaction processing)
Tâche majeure des Bdd relationnelles traditionnelles
Opérations quotidiennes enregistrées.
■ OLAP (on-line analytical processing)
Tâche majeure des systèmes
de data warehouse
Analyse de données et décision
15. II. Data-Mining:
1. Définition du Data Mining:
Data-Mining est le processus de recherche de modèles dans un
ensemble de données donné. Ces modèles peuvent souvent fournir des
données significatives et perspicaces à quiconque s'intéresse à ces
données. L'exploration de données est utilisée aujourd'hui dans une
grande variété de contextes - dans la détection de la fraude, comme une
aide dans les campagnes de marketing, et même les supermarchés
l'utilisent pour étudier leurs consommateurs.
Processus inductif, itératif et interactif de découverte dans les BD larges
de modèles de données valides, nouveaux, utiles et compréhensibles.
■ Itératif : nécessite plusieurs passes
■ Interactif : l’utilisateur est dans la boucle du processus
■ Valides : valables dans le futur
■ Nouveaux : non prévisibles
■ Utiles : permettent à l’utilisateur de prendre des décisions
■ Compréhensibles : présentation simple
16. 2- Pourquoi le Data Mining ?
■ Explosion des données:
• Masse importante de données
• Données multi-dimensionnelles
• Collecte de masses importantes de données
• Besoin raitement en temps réel de ces données
■ Améliorer la productivité:
• Forte pression due à la concurrence du marché
• Brièveté́ du cycle de vie des produits
• Besoin de prendre des décisions stratégiques efficaces
- Exploiter le vécu (données historiques) pour prédire le futur et anticiper le marché
- Individualisation des consommateurs (dé-massification).
■ Croissance en puissance/coût des machines capables:
• de supporter de gros volumes de données
• d’exécuter le processus intensif d’exploration
• hétérogénéité des supports de stockage
17. 1. Comprendre l’application
2. Sélectionner un échantillon de données
3. Nettoyage et transformation des données
4. Appliquer les techniques de fouille de données (DM)
5. Visualiser, évaluer et interpréter les modèles découverts
6. Gérer/déployer la connaissance découverte
3- Démarche méthodologique
19. 5- objectifs:
■ Développer des techniques et systèmes efficaces et extensibles pour l’exploration de :
o BD larges et multi-dimensionnelles
o Données distribuées
■ Faciliter l’utilisation des systèmes de DM
o Limiter l’intervention de l’utilisateur
o Représentation simple de la connaissance
o Visualisation sous forme exploitable
20. III. Data-mining # Data-Warehouse
■ Data Warehouse: base de données résumant diverses BD
transactionnelles pour servir de support à la prise de décision
■ Data mining : effectué sur des entrepôts de données aussi bien que sur
des BD transactionnelles.
Le DW est un processus qui doit avoir lieu avant que l'exploration de données puisse avoir
lieu. En d'autres termes, DW est le processus de compilation et d'organisation des
données dans une base de données commune, et DM est le processus d'extraction de
données significatives à partir de cette base de données. Le processus DM repose sur les
données compilées dans la phase de stockage de données afin de détecter des modèles
significatifs.
21. Conclusion:
La conception d'entrepôts de données est donc un processus en
perpétuelle évolution. Sous cet angle, on peut finalement voir l'entrepôt de
données comme une architecture décisionnelle capable à la fois de gérer
l'hétérogénéité et le changement et dont l'enjeu est de transformer
les données en informations directement exploitables par les utilisateurs
du métier concerné.
22. Bibliographie:
■ Systèmes d’information décisionnels (DataWarehouse / Data Mining) E. GRISLIN-LE
STRUGEON et D. DONSEZ 1996-2006
■ www.programmerinterview.com/.../data-mining-vs-warehousing
■ DatawarehouseC.Vangenot « Laboratoire de Base de données » Database Laboratory
■ Cours d’aide à la décision : Du datawarehouse au datamining « L. Jourdan »
■ Data Mining, fouille de données: Data Mining, fouille de données « Marius Fieschi Faculté de
Médecine de Marseille »
■ https://fr.wikipedia.org/wiki/Entrepôt_de_données