Pourquoi mettre en place un SID ?
Les enjeux du Système d’Information Décisionnel :
Définition des modèles de données décisionnels
- Vues, Faits et Dimensions
- Intégration des vues
- Normalisation des contextes
- La forme dimensionnelle normales et ses conséquences
Formes dimensionnelles complexes
- Etats et flux
- Les représentations du temps
- Dérives dimensionnelles
- Indicateurs qualifiés
- Méthodes de consolidation
2. Pourquoi mettre en place un SID ?
Les enjeux du Système d’Information Décisionnel
Définition des modèles de données décisionnels
Vues, Faits et Dimensions
Intégration des vues
Normalisation des contextes
La forme dimensionnelle normales et ses conséquences
Formes dimensionnelles complexes
Etats et flux
Les représentations du temps
Dérives dimensionnelles
Indicateurs qualifiés
Méthodes de consolidation
DeciLogic – Les modélisations décisionnelles
3. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
L’analyse multidimensionnelle est une approche naturelle :
L’utilisateur raisonne instinctivement suivant l’expression d’un contexte (les dimensions)
et de mesures (les faits) :
« Je souhaiterais connaitre mon chiffre d’affaires, par produit, par agence pour le mois
de décembre ? »
Les clauses « Pour » et « Par » (respectivement « Where » et « Group By » de vos
requêtes) correspondent à vos dimensions, ou axes d’analyse. Le chiffre d’affaires lui
correspond à la mesure, ou au fait.
DeciLogic – Les modélisations décisionnelles
4. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
Une méthode de modélisation faits/dimensions part du processus métier
analysé vers l’analyse :
1
. Identification du processus métier analysé
2. Établissement du niveau de granularité de l’analyse
3. Établissement des dimensions qui s’appliquent à chaque ligne de fait
4. Identification des caractéristiques numériques qui s’appliquent à chaque
ligne de fait
Cette méthode demande une vision complète et décrite du processus
métier et de son implémentation. Elle permet de construire le tableau qui
croise les processus métier et les dimensions :
Approche de type matricielle ou « Bus »
DeciLogic – Les modélisations décisionnelles
5. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
1
. Identification du processus métier analysé :
Il s’agit bien de processus et non de départements ou de services
Quels sont les exemples concrets des décisions qui seraient pris ?
Quels gains ? Meilleure réactivité, hausse de productivité, optimistaion des
couts, accroissement de part de marché…
La mise en place d’un DW a un coût ! Le processus choisi doit être judicieux
2. Établissement du niveau de granularité de l’analyse :
Pour un ticket de caisse, vous souhaitez conserver chaque ligne de produit
d’achat ? Chaque produit différent ? Regrouper un montant par famille ?...
« Je veux tout stocker », mais il faut faire des compromis…
DeciLogic – Les modélisations décisionnelles
6. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
3. Établissement des dimensions qui s’appliquent à chaque ligne
de fait :
Quelques questions pour cerner vos axes d’analyse :
« A qui ces données pourraient-elles être utiles ? »
« Comment les analystes regrouperaient-ils les données ? »
« Comment les filtreraient-ils ? »
« Quels sont les titres de colonnes des rapports existants ? »…
Cette étape doit être faite obligatoirement par une équipe hétérogène.
4. Identification des caractéristiques numériques qui s’appliquent à
chaque ligne de fait :
« Ce qui compte ne peut pas toujours être compté, et ce qui peut être compté
ne compte pas forcément. »
Comment mesurer la satisfaction client ?
Suivre une mesure à un coût qu’il faut juger par rapport à sa pertinence.
DeciLogic – Les modélisations décisionnelles
7. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
Deux type d’informations caractérisent les faits :
Des mesures numériques propre à chaque instance de faits (quantité, prix, …)
Des dimensions caractéristiques plus ou moins complexes (fournisseur,
produit, …)
Les mesures numériques propres à chaque fait sont l’objet de calculs
d’analyse (montant global, moyenne globale, …)
et les dimensions constituent des facteurs de sélection des faits étudiés
(produits de telle ou telle marque, …).
Un processus d’entreprise peut être représenté à l’aide d’une ou
plusieurs tables de fait.
On peut distinguer 3 types de table de faits :
Table de fait de transaction
Table de fait périodique
Table de fait récapitulatif
DeciLogic – Les modélisations décisionnelles
8. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
Table de fait de transaction :
Définir les clés des dimensions de chacune des transactions opérationnelles et extraire
les mesures intéressantes.
Définir la granularité en fonction du contexte, cad de l’ensemble des clés de dimension
Table de fait périodique :
Construite à partir de la table de fait de transaction. Image de synthèse à un instant
« T ».
Une approche peut être de proposer une table de transaction très détaillée sur 6 mois et
une table de fait périodique avec des dimensions moins profondes sur 36 mois.
Table de fait récapitulatif :
Complémentaire mais difficile à maintenir.
Ex : Processus vente = dimension : Temps/Magasin Employé/Produit/Client
Ex : Processus réclamation = dimensions : Temps/Produit
La table de fait récapitulative « Mesure produit » peut avoir du sens pour intégrer les
notions de ventes et réclamation.
DeciLogic – Les modélisations décisionnelles
9. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
« Quels ont été les frais de déplacement et le kilométrage
des commerciaux de la région Midi-Pyrénées ayant des
véhicules de 4 à 8 CV en juillet 2012 ? »
Vue : Frais/Employé/Véhicule/Région/Mois :
Frais de déplacement, kilométrage
par Employé (fonction)
par Véhicule (puissance)
par Région
par Mois
DeciLogic – Les modélisations décisionnelles
10. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
Les propriétés centrales, dont la valeur est déterminée par la combinaison des
quatre entités, sont des faits, et toutes les autres propriétés sont des conditions.
Un fait, une mesure, ou encore un indicateur, est une information déterminée par
la combinaison de deux ou plusieurs entités, susceptible de constituer le résultat
ou un élément du résultat d’une requête.
Une condition est une caractéristique d’entité susceptible d’intervenir comme
critère de définition d’une requête.
Structurellement, une vue comporte donc toujours une association et deux ou
plusieurs entités.
DeciLogic – Les modélisations décisionnelles
11. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
« Je veux la liste des noms des commerciaux de la région Midi-Pyrénées
ayant des véhicules de 4 à 8 CV avec, pour chacun, les frais de
déplacement, le kilométrage et la marque du véhicule, pour juillet 2012. »
Vue enrichie par les nouvelles propriétés :
Frais de déplacement, kilométrage
/ Employé (nom, fonction)
/ Véhicule (marque, puissance)
/ Région
/ Mois
DeciLogic – Les modélisations décisionnelles
12. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
Dimension ou axe d’analyse
Dimensions stables, il s’agit d’une dimension qui n’évolue globalement pas.
Par exemple, la liste des départements français est une « dimension stable » du fait
d’une évolution quasi nulle.
Dimensions à évolution lente, il s’agit d’une dimension dont l’évolution est limitée.
Par exemple, la liste des catégories de produits vendus. (voir schéma)
Dimensions dégénérées, il s’agit d’une table qui ne contenait comme élément que la clé
elle-même, dans ce cas, cette dimension a été supprimée et la dimension est intégrée
directement dans la table de faits.
Dimensions conformes, dans ce cas il s’agit de deux dimensions dont la seconde est un
sous-ensemble de la première. On rencontre ce type de dimension dans le cas de la
modélisation en flocon.
DeciLogic – Les modélisations décisionnelles
13. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
3 types d’évolution lente
1 : Les anciennes valeurs ne sont pas
conservées.
2 : Les anciennes valeurs sont conservées, et
on rajoute une occurrence pour les nouvelles
valeurs. Une nouvelle clé est créée.
3 : La nouvelle valeur est insérée en tant que
nouveau champ, une date d’effet est stipulée.
Le champ d’origine n’est jamais modifié.
DeciLogic – Les modélisations décisionnelles
14. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
« Combien de commerciaux de la région Midi-Pyrénées se sont-ils
déplacés avec des véhicules de 4 à 8 CV en juillet 2012? »
Reformulation :
« Pour combien de commerciaux de la région Midi-Pyrénées existe-t-il un
kilométrage et/ou des frais de déplacement non nuls avec des véhicules
de 4 à 8 CV en juillet 2012? »
Pour se donner une idée intuitive des notions de faits et de conditions, il
suffit d’imaginer la configuration des états de sortie correspondant aux
requêtes.
Les conditions ont naturellement tendance à y apparaître comme libellés
des lignes et des colonnes d’un tableau, alors que les faits remplissent
plutôt les cellules internes du tableau.
DeciLogic – Les modélisations décisionnelles
15. Définition des modèles de données décisionnels
Vues, Faits et Dimensions
Un exemple d’acquisition de données :
Que voulez vous analyser (la dernière ligne du tableau) ? -> les faits
Quels sont vos critères d'analyse (la première ligne du tableau) ? -> les dimensions
Jusqu'à quel niveau de détail voulez-vous aller (les cellules à l'intérieur) ?
Analyse
Employe
Nom
Fonction
Frais déplacement,
Kilométrage, Nombre de
déplacement
Véhicule
Marque
Puissance
Date
Années
Mois
Géographie
Region
DeciLogic – Les modélisations décisionnelles
16. Définition des modèles de données décisionnels
Intégration des vues
L’objectif du SID est de fournir une structure informationnelle
intégrée et non de préparer l’exécution d’un jeu prédéfini de
requêtes.
Ne jamais introduire de chemin complexe ou ambigu.
Rester capable d’intégrer une nouvelle vue sans remise en
cause de la structure.
La notion de contexte :
Une consolidation directe des vues dans la réalité risque d’avoir un
impact important sur la structure.
Le contexte est une solution pour fournir un niveau de modélisation
intermédiaire. Il permet de regrouper un ensemble de faits et de
dimensions en cohérence.
DeciLogic – Les modélisations décisionnelles
17. Définition des modèles de données décisionnels
Intégration des vues
Certaines informations sont dans plusieurs vues.
Certaines entités appartenant à plusieurs vues sont
fonctionnellement liées les unes aux autres.
DeciLogic – Les modélisations décisionnelles
18. Définition des modèles de données décisionnels
Intégration des vues
La notion de hiérarchies
Représentent pour l’utilisateur des chemins de consolidation
DeciLogic – Les modélisations décisionnelles
19. Définition des modèles de données décisionnels
Intégration des vues
Ex : 3 modes de consolidation possible pour l’entité client
CSP = catégorie socio-professionnelle
Lieu de résidence
Structure commerciale
DeciLogic – Les modélisations décisionnelles
20. Définition des modèles de données décisionnels
Intégration des vues
Synthèse des contextes
5 dimensions pour 10 entités
Activité : marge, revenu, ventes
/ Canal : Canal
/ Client : Client
/ Territoire : Région - Pays
/ Temps : Jour - Mois - Trimestre
/ Produit : Produit - Gamme - Marque
Vues par expansion :
marge / Canal / Pays / Produit / Trimestre
revenu / Région / Mois / Produit / Client / Canal
ventes / Client / Gamme / Jour
revenu / Marque / Gamme / Mois / Région
DeciLogic – Les modélisations décisionnelles
21. Définition des modèles de données décisionnels
Normalisation des contextes
Par expérience, un contexte « raisonnable » possède entre 4
et 12 dimensions.
L’assemblage des vues reste spécifiques à chaque projet,
mais le critère suivant reste un bon guide :
« Un contexte est cohérent si toutes les vues qu’il autorise
ont une signification pour l’utilisateur »
Ne pas interdire de combinaisons à priori. Le rapprochement
de variables pas forcément liées est intéressant
Par contre des dimensions trop liées est problématique.
DeciLogic – Les modélisations décisionnelles
22. Définition des modèles de données décisionnels
Normalisation des contextes
Dépendances et influences
Règle 1 : Il ne doit pas y avoir de dépendance fonctionnelle
entre 2 entités appartenant à des dimensions différentes
dans un même contexte.
Dans la pratique on se rend compte qu’une base
décisionnelle contient une forte proportion de valeur nulle.
Le SID met en œuvre des contextes valides, à l’utilisateur de
formuler des requêtes pertinentes.
DeciLogic – Les modélisations décisionnelles
23. Définition des modèles de données décisionnels
Normalisation des contextes
Définition des faits
Règle 2 : Tous les faits d’un contexte doivent être définis d’une
manière cohérente pour toutes les combinaisons dimensionnelles de
ce contexte.
Cohérence des grains
Le grain d’une dimension est le niveau de sélection le plus fin possible
de cette dimension.
Règle 3 : Tous les faits d’un contexte doivent être définis pour le grain
de ce contexte.
Navigation hiérarchique
Règle 4 : Le graphe de chaque dimension doit être acyclique.
DeciLogic – Les modélisations décisionnelles
24. Définition des modèles de données décisionnels
La forme dimensionnelle normales et ses conséquences
Si un contexte respecte les 4 règles, il est FDN : forme
dimensionnelle normale.
Représentation « en galaxie » d’un domaine :
DeciLogic – Les modélisations décisionnelles
25. Formes dimensionnelles complexes
Etats et flux
2 types de d’indicateur cohabitent dans un DW : les
indicateurs dynamiques et statiques.
Dynamique : représente un flux associé à un événement. Il
s’agit d’un agrégat au cours d’une période.
Ex : Plus ou moins value d’un placement.
Statique : représente un indication de situation à un instant
donné.
Ex : Solde d’un compte bancaire.
Les flux statiques sont intéressants pour :
Conserver un état sans pouvoir reconstituer ses flux.
Accélérer la consultation d’un état plutôt que reconstituer sa mémoire.
Figer un état pour le comparer.
DeciLogic – Les modélisations décisionnelles
26. Formes dimensionnelles complexes
Les représentations du temps
Forte distinction entre le SIO et le SID dans ce domaine.
Autant de grain que de situation : journée, mois…seconde…
Irrégularité périodique :
Une période élémentaire d’un contexte est l’intervalle de temps à
l’intérieur duquel il n’est pas utile de tenir compte des variations.
Une période possède au moins 2 attributs : date de début, date de fin.
Trouver un compromis avec les bases sources pour charger
des données cohérentes par rapport à la période de base du
contexte.
Les utilisateurs ont souvent un axe temporel différent :
exercice comptable / exploitation. Il est conseillé d’avoir une
seule période de base qui est ensuite consolidée ou filtrée
pour présenter les résultats.
DeciLogic – Les modélisations décisionnelles
27. Formes dimensionnelles complexes
Les représentations du temps
Périodes et évènements
Le temps n’est pas seulement une période, il peut être perçu
également comme un évènement.
Ex : Mémoriser une série de succession d’évènement
Il peut être judicieux de conserver un état pour des besoins de comparaison.
DeciLogic – Les modélisations décisionnelles
28. Formes dimensionnelles complexes
Dérives dimensionnelles
L’écoulement du temps à des incidences sur les faits et les
dimensions.
Les clients apparaissent, vieillissent, disparaissent, se marient,
déménagent, ont des enfants…
L’entreprise lance de nouveaux produits, en abandonne d’anciens,
modifie son découpage géographique, opère des fusionsacquisition…
2 types de changements potentiels : le contenu et la
structure.
DeciLogic – Les modélisations décisionnelles
29. Formes dimensionnelles complexes
Dérives dimensionnelles
Le contenu :
Gérer les changement d’état par l’ajout d’entité pour ne pas
compliquer le modèle.
Associer des occurrences permanentes et mouvantes.
A noter l’évolution législatif en ce qui concerne l’immatriculation.
DeciLogic – Les modélisations décisionnelles
30. Formes dimensionnelles complexes
Dérives dimensionnelles
Le contenu :
Rattacher des dimensions à des changements d’états.
En fait le SID est intéressé par un client mais par « un client dans un
certain état »
DeciLogic – Les modélisations décisionnelles
31. Formes dimensionnelles complexes
Dérives dimensionnelles
Le périmètre :
Au cours d’une période une zone géographique commerciale peut
changer, il faut alors pouvoir consolider les données à périmètre
constant.
Prise en compte des dimensions changeantes :
Commune de naissance et de résidence appartiennent-elles au même
contexte ?
La commune de naissance est-elle une entité à part entière ?
Invoque-t-on les mêmes attributs conditionnels dans la commune de
naissance et de résidence ?
DeciLogic – Les modélisations décisionnelles
32. Formes dimensionnelles complexes
Dérives dimensionnelles
Le périmètre :
Au cours d’une période une zone géographique commerciale peut
changer, il faut alors pouvoir consolider les données à périmètre
constant.
Prise en compte des dimensions changeantes :
Commune de naissance et de résidence appartiennent-elles au même
contexte ?
La commune de naissance est-elle une entité à part entière ?
Invoque-t-on les mêmes attributs conditionnels dans la commune de
naissance et de résidence ?
DeciLogic – Les modélisations décisionnelles
33. Formes dimensionnelles complexes
Dérives dimensionnelles
Une solution possible, la redondance des informations pour
éviter les boucles et conserver une structure évolutive :
DeciLogic – Les modélisations décisionnelles
34. Formes dimensionnelles complexes
Indicateurs qualifiés
Distinguer un indicateur fondamental d’un indicateur qualifié :
HT et TTC
En francs, en dollars
En valeur prévue, en valeur réalisée
Selon plusieurs unités de mesure…
DeciLogic – Les modélisations décisionnelles
35. Formes dimensionnelles complexes
Méthodes de consolidation
Un indicateur peut être :
Additif (ex : chiffre d’affaires, quantité, chiffre)
Non additif (ex précédent : la moyenne des ventes, niveau de stock )
Semi-additif (cumulable par addition dans certaines hiérarchie
seulement)
Un contexte est donc complètement abouti lorsque la
consolidation de chaque fait dans chaque hiérarchie est
spécifiée.
DeciLogic – Les modélisations décisionnelles
36. DeciLogic, votre partenaire
Une expertise mise à l’épreuve d’un engagement total
DeciLogic – Les modélisations décisionnelles