La première partie sur le cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions, n' hésitez pas de me les envoyer via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture
Présentation général des étapes du processus ETL (Extract,Transform, Load) d'un projet décisionnel.
ETL, acronyme de Extraction, Transformation, Loading, est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) jusqu'à l'entrepôt de données (modèles multidimensionnels).
1-Problématique
2-Définition du Big Data
3-Big Data et 3V
4-Data wahrehouse VS Big Data
5-Domaines d’utilisations
6-Les techniques de traitement
7-Big Data et Aspect Mobile
8-Conclusion
C'est la troisième partie du cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions, n'hésitez pas de me les envoyer via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture
La première partie sur le cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions, n' hésitez pas de me les envoyer via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture
Présentation général des étapes du processus ETL (Extract,Transform, Load) d'un projet décisionnel.
ETL, acronyme de Extraction, Transformation, Loading, est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) jusqu'à l'entrepôt de données (modèles multidimensionnels).
1-Problématique
2-Définition du Big Data
3-Big Data et 3V
4-Data wahrehouse VS Big Data
5-Domaines d’utilisations
6-Les techniques de traitement
7-Big Data et Aspect Mobile
8-Conclusion
C'est la troisième partie du cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions, n'hésitez pas de me les envoyer via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture
Business Intelligence : Offres du marché et benchmarkingSamia NACIRI
Editeurs du marché BI
Critères de comparaison des éditeurs BI
Comment choisir le meilleur outil Business Intelligence ?
http://datadictos.site/_media/pdf/BI__tools%20V3.pdf?utm_source=BI_bench_c&utm_medium=social&utm_campaign=init
pour enrichir votre connaissance sur la BI : http://datadictos.site/
Big Data: Movement, Warehousing, & Virtualizationtervela
This presentation was given by Barry Thompson, CTO of Tervela, to TSAM (a financial buy-side technology & operations event) in July 2011. It covers trends in big data and how to solve problems with data movement, warehousing, and virtualization solutions.
Objets connectés et quantified self 21082013Brice Nadin
Etude réalisée en juin 2013 sur le formidable essor des applications mobiles orientées vers le bien être, la nouvelle tendance des objets connectés et le nouveau phénomène du quantified self (mesure de soi).
meaning of data warehousing
needs of data warehousing
applications of data warehousing
architecture of data warehousing
advantages of data warehousing
disadvantages of data warehousing.
meaning of data mining
needs of data mining
applications of data mining
architecture of data mining
advantages of data mining
disadvantages of data mining
Présentation d'Ignilife - Votre coach santé au quotidien.
Le Groupe Mutuel, en collaboration avec Ignilife, offre à l'ensemble de ses assurés une plateforme de prévention santé axée sur 4 domaines: sport, nutrition, santé, émotion.
HUBREPORT - Future of Data & CRM [EXTRAIT]HUB INSTITUTE
Retrouvez la version intégrale ici : http://hubklub.hubinstitute.com/hubreport/future-of-data-crm-2017/
En 2017, nous assistons à une multiplication des flux de données jamais été égalée auparavant. De la même manière que les nouvelles entreprises agiles (acteurs du numérique et startups) qui ont déjà commencé à redéfinir les règles de leurs marchés réceptifs, les grandes entreprises doivent apprendre à actionner dès aujourd’hui le volume d’informations disponibles. La bonne utilisation de ces Data leur permettra en effet de réinventer l’expérience d’achat, séduire une clientèle grandissante et exigeante ainsi qu’optimiser leurs processus de décision.
Les analystes du HUB Institute dévoilent dans cette étude les grandes tendances Data & CRM de l’année et les best practices associées permettant de définir une stratégie efficace :
Au programme de ce HUBREPORT Future of Data & CRM :
- Un rapport PowerPoint multimédia de plus de 115 slides sur 8 thématiques parmi lesquelles la gestion des Data en entreprise, les API, la Dataviz, la sécurité, l’IA ...
- Plus de 50 slides de best practices
- Des avis d’experts
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
Watch full webinar here: https://bit.ly/3pjyzRY
Une initiative de self-service réussie signifie que les utilisateurs métiers ont accès à une vue complète et cohérente des données, indépendamment de leur emplacement, de leur source ou de leur type. Toutefois, les entreprises doivent également veiller à ce que, tout en exploitant le plein potentiel des données pour les utilisateurs métiers, elles respectent les exigences de sécurité.
La virtualisation des données en tant que couche de service de données gouvernée peut non seulement aider les organisations à mettre en place une couche d'accès aux données unifiée qui fournit des vues intégrées des données aux utilisateurs métiers en temps réel, mais permet également à l'organisation d'établir des protocoles de gouvernance et de spécifier des sources faisant autorité.
Les points clés du webinar:
- Les défis auxquels sont confrontés les utilisateurs métiers
- Comment la virtualisation des données permet l’analytique self-service
- Une démo live
- Des études de cas client
Retrouvez Ysance sur le stand E6 à la 3ème édition du Salon Big Data les 1 & 2 avril au CNIT Paris la Défense - Création d'un village technologique et d'un écosystème Big Data avec nos partenaires : Google, MapR Technologies, Talend et Qlik
Quel est l'avenir des stratégies de données?Denodo
Voir: https://bit.ly/31BWK5m
À l'ère du big data, de l'intelligence artificielle et du cloud computing, le volume et la diversité des données ne cessent de croître. Le défi consiste à créer les processus, les normes et les protocoles nécessaires pour mettre l'information au service des entreprises.
Dans ce webinar, nous parlerons des cinq tendances technologiques qui guident les stratégies de données des entreprises du monde entier. Nous verrons comment élever les données au rang d'actif stratégique et avoir une vraie stratégie centrée sur la donnée.
Ne manquez pas ce webinar pour approfondir les points suivants :
- Quelle est l'évolution des architectures d'acquisition et de gestion des données dans les grandes organisations ? En quoi le concept de "data fabric" est-il utile ?
- Comment gérer l'intégration de données distribuées sur plusieurs sites résultant des changements imposés par la migration vers le cloud ?
- Comment les entreprises peuvent-elles monétiser l'infrastructure de données en tant que service construite au cours des dernières années ?
- Comment la data science et l’analytique avancée pilotent et contribuent à accélérer l’acquisition des données ?
- Quel rôle les techniques de NLP et de voice computing peuvent-elles jouer à l'avenir pour l'analyse de données ?
Au delà de ce buzz word :
Les grands concepts
Les étapes clés des projets Big Data et les technologies à utiliser (stockage, ingestion, …)
Les enjeux des architectures Big Data (architecture lambda, …)
L'intelligence artificielle (machine learning, deep learning, …)
Et un cas d'usage du big data sur AWS autour de l'utilisation des données gyroscopiques de vos internautes mobiles.
La deuxième partie sur le cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions afin d’améliorer le contenu et la qualité de ce cours, n' hésitez pas à me contacter via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture.
A. DAROUICHI
2. Plan
• Introduction
• Définition
• Objectifs
• Historique
• Structure du Data Warehouse
• Concept du Data Warehouse
• Les aspects techniques
• SGBD et DW
• Conclusion
Free Powerpoint Templates
Page 2
4. Introduction
• On qualifie d'informatique décisionnelle (en
anglais « Business intelligence », parfois
appelé tout simplement « le décisionnel »)
l'exploitation des données de l'entreprise dans le
but de faciliter la prise de décision par les
décideurs, c'est-à-dire la compréhension du
fonctionnement actuel et l'anticipation des
actions pour un pilotage éclairé de l'entreprise.
Free Powerpoint Templates
Page 4
5. Introduction
• Les outils décisionnels comme le Data
Warehouse et le Data Mining sont basés
sur l'exploitation d'un système
d'information décisionnel alimenté grâce à
l'extraction de données diverses à partir
des données de production, d'informations
concernant l'entreprise ou son entourage
et de données économiques.
Free Powerpoint Templates
Page 5
7. Définition
W.B.Inmon
« Le data Warehouse est une collection
de données orientées sujet, intégrées,
non volatiles et historisées,
organisées pour le support d’un
processus d’aide à la décision »
Free Powerpoint Templates
Page 7
9. Objectifs d’une Data Warehouse
• Intégrer différentes bases de données
opérationnelles;
• Permettre l’accès aux informations historisées;
• Fournir des outils d ’analyse sur ces données;
• Résumer les données;
• Réconcilier des données inconsistantes.
Free Powerpoint Templates
Page 9
11. Historique du Data Warehouse
• Années 1960 : Genral Mills et l‘Université Dartmouth,
dans un projet conjoint, créent les termes "faits" et
"dimensions".
• 1983 : Teradata introduit dans sa base de données
managériale un système exclusivement destiné à la
prise de décision.
• 1988 : Barry Devlin et Paul Murphy publient l'article
"Une architecture pour les systèmes d'information
financiers" ("An architecture for a business and
information systems") où ils utilisent pour la première fois
le terme "Datawarehouse".
Free Powerpoint Templates
Page 11
12. Historique du Data Warehouse
• 1990 : Red Brick Systems crée Red Brick
Warehouse, un système spécifiquement dédié à la
construction de l'Entrepôt de données.
• 1991 : Bill Inmon publie Building the Data
Warehouse (Construire l'Entrepôt de Données).
• 1995 : Le Data Warehousing Institute, une
organisation à but lucratif destinée à promouvoir le
datawarehousing, est fondé.
• 1996 : Ralph Kimball publie The Data Warehouse
Toolkit (La boîte à outils de l'Entrepôt de données).
Free Powerpoint Templates
Page 12
14. Structure du DATA WAREHOUSE
Le Data Warehouse se structure en quatre
classes de données, organisées selon un
axe historique est un axe synthétique.
Free Powerpoint Templates
Page 14
15. Structure du DATA WAREHOUSE
Les données agrégées Les méta- données
DATA WAREHOUSE
Les données détaillées Les données historisées
Free Powerpoint Templates
Page 15
16. Données détaillées
• Elles reflètent les évènements les plus
récents.
• Les données provenant des systèmes
de production sont intégrées à ce
niveau.
Free Powerpoint Templates
Page 16
17. Données agrégées
• Elles correspondent à des éléments d'analyse
représentatifs des besoins des utilisateurs.
• Ce sont donc des données déjà traitées par le
système et représentant un premier résultat
d'analyse et de synthèse des données
contenues dans les systèmes de production.
• Elles doivent être facilement accessibles et
compréhensibles.
Free Powerpoint Templates
Page 17
18. Données historisées
• Chaque nouvelle insertion dans le Data
Warehouse ne détruit pas les anciennes
valeurs mais cré une nouvelle insertion.
Free Powerpoint Templates
Page 18
19. Méta-données
• Il s'agit « de données sur les données ».
Elles décrivent les règles ou processus
attachés aux données du système.
• Il permet aussi de faciliter la recherche de
données.
Free Powerpoint Templates
Page 19
21. Concept du Data Warehouse
Orientée sujet Données intégrées
DATA WAREHOUSE
Données non volatiles Données datées
Free Powerpoint Templates
Page 21
22. Concept du Data Warehouse
• Données orientées sujet :
• Regroupe les informations des différents métiers
• Ne tiens pas compte de l’organisation
fonctionnelle des données
Ass. Vie Ass. Auto Ass. Santé
Client
Police
Free Powerpoint Templates
Page 22
23. Concept du Data Warehouse
• Données intégrées :
• Normalisation des données
• Définition d’un référentiel unique
h,f
1,0 h,f
homme, femme
GBP
EUR
CHF
USD Free Powerpoint Templates
Page 23
24. Concept du Data Warehouse
• Données non volatiles :
• Traçabilité des informations et des décisions
prises
• Copie des données de production
Bases de production Entrepôts de données
Ajout
Suppression
Accès
Modification Chargement
Free Powerpoint Templates
Page 24
25. Concept du Data Warehouse
• Données datées :
• Les données persistent dans le temps
• Mise en place d’un référentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Répertoire Répertoire
Base de Nom Ville Nom Ville
production
Dupont Paris Dupont Marseille
Durand Lyon Durand Lyon
Calendrier Répertoire
Entrepôt Code Année Mois
Code Année Mois
de
1 2005 Mai 1 Dupont Paris
données
2 2006 Juillet 1 Durand Lyon
Free Powerpoint2Templates
Dupont Marseille Page 25
26. Les aspects
techniques
Free Powerpoint Templates
Page 26
27. Les aspects techniques du DW
1. Les bases de données
• OLAP (On-Line Analitical Processing)
• C’est un mode de stockage prévu pour l’analyse
statistique des données contenues dans la base;
• Il est appliqué à un modèle virtuel de
représentation de donnée appelé cube ou
hypercube OLAP.
Free Powerpoint Templates
Page 27
28. Les aspects techniques du DW
• OLTP (On-Line Transactional Processing)
• C’est un mode de stockage fait pour les systèmes
opérationnels;
• Ils supportent très bien une utilisation
transactionnelle de la base de données;
• À ce mode de stockage est associé des requêtes
type courtes et ne demandant pas beaucoup de
ressource du côté du serveur de la base de
données.
Free Powerpoint Templates
Page 28
29. Les aspects techniques du DW
2. Modélisation
• Les tables de dimensions
- Elles contiennent les données qui permettent de
définir un axe d’une étude.
- Ce type de tables joue le rôle de référentiel au
DATA WAREHOUSE.
• Les tables de faits
- Comme leur nom l’indique, Ces tables contiennent
uniquement les données factuelles du DATA
WAREHOUSE.
Free Powerpoint Templates
Page 29
30. Les aspects techniques du DW
• Les tables d'agrégats
- Ces tables sont spéciales, elles permettent
de simplifier le travail de restitution des
logiciels d’analyse;
- Elles contiennent des données à un niveau
de granularité plus grand que dans les
tables de faits;
Free Powerpoint Templates
Page 30
31. Les aspects techniques du DW
3. Les types de modèle
Modèle en étoile Modèle
Free Powerpoint Templates en flocon
Page 31
32. Modèle en étoile
• Une table de fait centrale et des dimensions
• Les dimensions n’ont pas de liaison entre elles
• Avantages
– Facilité de navigation
– Nombre de jointures limité
• Inconvénients
– Redondance dans les dimensions
– Toutes les dimensions ne concernent pas les
mesures
Free Powerpoint Templates
Page 32
33. Modèle en étoile
Dimension Temps
ID temps
année
mois
Dimension produit
jour
ID produit
Dimension Magasin …
ID magasin nom
description code
ville Table de faits Achat prix
surface ID client poids
ID temps groupe
… ID magasin famille
ID région …
ID produit
Dimension Region Quantité achetée Dimension Client
ID région Montant des achats ID client
pays nom
description prénom
district vente adresse
…. Free Powerpoint Templates …
Page 33
34. Modèle en flocon
• Une table de fait et des dimensions décomposées en
sous hiérarchies.
• On a un seul niveau hiérarchique dans une table de
dimension.
• La table de dimension de niveau hiérarchique le plus bas
est reliée à la table de fait. On dit qu’elle a la granularité
la plus fine.
• Avantages
– Normalisation des dimensions
– Économie d’espace disque
• Inconvénients
– Modèle plus complexe (jointure)
– Requêtes moins performantes
Free Powerpoint Templates
Page 34
35. Dimension produit
ID produit
Dimension Temps ID groupe
ID temps nom
annee code
mois prix
Dimension Magasin jour Dimension groupe
poids
ID magasin … ID groupe
…
description ID famille
ville Table de faits Achat
nom
surface ID client
ID temps …
…
ID magasin
Dimension Region ID région
ID région Dimension Famille
ID produit
ID division vente ID famille
Quantité achetée
pays Montant des achats nom
description …
…. Dimension Client
Dimension
ID client
Division vente
nom
ID division vente
prénom
description Free Powerpoint Templates
adresse
…. Page 35
…
37. SGBD et DW
Service Service Service
OLTP: On-Line commercial Financier livraison
Transactional BD prod BD prod BD prod
Processing
Clientèle
H
I
Data Warehouse S
T
OLAP: On-Line O
Analitical R
Clientèle I
Processing
Q
U
Free Powerpoint Templates E
Page 37
38. SGBD et DW
OLTP DW
Orienté transaction Orienté analyse
Orienté application Orienté sujet
Données courantes Données historisées
Données détaillées Données agrégées
Données évolutives Données statiques
Utilisateurs nombreux, Utilisateurs peu nombreux,
administrateurs/opérationnels manager
Temps d’exécution: court Temps d’exécution: long
Free Powerpoint Templates
Page 38
41. Conclusion
• L’utilisation des DATAWAREHOUSE est
aujourd’hui très demandé dans le monde
de l’entreprise, demande qui répond au
besoin toujours plus présent des
utilisateurs d’avoir les bonnes informations
au bon moment.
Free Powerpoint Templates
Page 41