SlideShare une entreprise Scribd logo
1  sur  8
Télécharger pour lire hors ligne
Institut National des Sciences Appliquées et de Technologie Tunisie

Business Intelligence
2013-2014

TP3- A NALYSE DES DONNEES
AVEC M ONDRIAN
Dr. Lilia SFAXI
Objectifs du TP : Utilisation du serveur OLAP Mondrian pour
l’analyse et l’extraction d’une large quantité de données.
TP3 : Analyse des données avec Mondrian

I. Mondrian & Jasper Report
Mondrian1 est un serveur OLAP qui permet aux utilisateurs d’analyser de larges quantités
de données en temps réel. Les utilisateurs explorent les données métier en exécutant des
requêtes complexes sur des bases volumineuses.
Le serveur JasperReport offre des fonctionnalités d’analyse de données en intégrant
l’engin Mondrian. Il est possible ensuite d’écrire et d’exécuter des requêtes MDX pour
accéder au cube OLAP, dont le schéma est décrit dans un fichier XML.

I.1 Schéma du Cube OLAP
Un schéma représente une base de données multi-dimensionnelle. Il contient un modèle
logique, qui consiste en des cubes, des hiérarchies et des membres, et le mapping de ce
modèle en un modèle physique.
-

Le modèle logique consiste en des structures permettant d’écrire des requêtes en
utilisant le langage MDX: les cubes, dimensions, hiérarchies, niveaux et membres.

-

Le modèle physique est la source de données présentée par le modèle logique.
C’est typiquement un schéma en étoile, représenté par un ensemble de tables
dans une base de données relationnelles.

Dans Mondrian, les schémas sont représentés par des fichiers XML. Pour l’instant, ce
fichier doit être écrit à la main. Nous présentons dans ce qui suit les éléments importants
dans la structure d’un schéma Mondrian:

I.1.1 Cube
Un cube est une collection de mesures et dimensions. Il fait référence à une table des
faits, ainsi que l’ensemble des mesures et des dimensions qui lui sont liées. La table des
faits contient les colonnes à partir desquelles les mesures sont faites, ainsi que des
références aux tables contenant les dimensions.

I.1.2 Mesures
Un cube peut définir une ou plusieurs mesures, chaque mesure ayant un nom, une
colonne dans la table des faits, et un aggregator. Un agrégateur représente le traitement
à faire sur les données, par exemple sum, count, min, max, avg…

1

http://mondrian.pentaho.com

Page 2
TP3 : Analyse des données avec Mondrian
I.1.3 Membre
Un membre est un point dans une dimension, déterminé par un ensemble particulier de
valeurs. Par exemple, ‘Tunis’, ‘Gabes’ et ‘Tunisie’ représentent trois membres de la
hiérachie adresse.

I.1.4 Hiérarchie
Une hiérarchie est un ensemble de membres organisés en une structure pour une analyse
convenable. Par exemple, la hiérarchie adresse contient le numéro, la rue, la ville et le
pays.

La hiérarchie permet de construire des sous-totaux: le sous-total d’un pays

représente la somme des sous-totaux de toutes les villes de ce pays.

I.1.5 Niveau
Un niveau représente la collection des membres qui ont la même distance par rapport à
la racine de la hiérarchie.

I.1.6 Dimension
Une dimension est une collection de hiérarchies pour un même attribut de la table des
faits.

I.2 Les Requêtes d’Exploration MDX
MDX (Multi-Dimensional Expressions) est le langage principal pour les requêtes,
implémenté par Mondrian. Il ressemble un peu au langage SQL, mais sa structure est
différente, vu qu’il traite des données dimensionnelles, pas opérationnelles.
Voici un exemple de requête MDX:
SELECT {[Measures].[Unit Sales], [Measures].[Store Sales]} ON COLUMNS,
{[Product].members} ON ROWS
FROM [Sales]
WHERE [Time].[1997].[Q2]

II. Ma Première Analyse: Issues
Dans ce TP, nous allons faire appel à l’engin Mondrian installé dans Jasper Report. Les
outils et fichiers dont nous aurons besoin sont les suivants :
-

JasperReport Server 5.1.0 : Serveur de reporting qui utilise l’engin Mondrian pour
l’analyse des données.

-

Bug_report.csv : fichier csv contenant les données initiales à traiter.

-

Page 3

Talend TOS 5.2.0 : Pour la transformation des données (phase ETL)
Schema.xml : représente le schéma OLAP de notre base cible.
TP3 : Analyse des données avec Mondrian
-

Mysql-connector-java 5.1.26 : connecteur MySQL pour JasperReport, plusieurs
autres pilotes comme Postgresql, Oracle… étant déjà installés.

Le fichier bug_report.csv représente un fichier délimité contenant plusieurs entrées sur les
problèmes (issues), contenant un millier d’entrées sur les bugs et les réclamations des
clients. Nous désirons mettre ces données dans un cube OLAP pour l’analyser.

II.1 Etape 1: Création de la base de données
La première étape consiste en la copie des données fournies dans le fichier délimité,
dans une base de données de votre choix.
Activité 1.
Utiliser Talend Data Integration pour copier les données du fichier délimité bug_report.csv
dans une base de données appelée issue, contenant une table appelée fact_issue.
Cette table représentera la table des faits de votre cube. A la création de votre table
fact_issue, lui ajouter une clef primaire entière (nommée id), qui s’incrémente
automatiquement.

II.2 Etape 2 : Configuration de JasperReport
JasperReport

intègre

automatiquement

Mondrian

pour

l’analyse

des

données

multidimensionnelles. Il offre une hiérarchie de répertoires pour la configuration des
différents éléments de l’analyse. La figure suivante montre cette hiérarchie:

Page 4
TP3 : Analyse des données avec Mondrian
II.2.1 Source de données
Pour se connecter à la base de données issue créée précédemment, on doit créer une
nouvelle source de données.
Activité 2.
Ajouter une nouvelle source de données dans le répertoire Analysis Data Sources. Faire
référence ici à la base issue créée précédemment. (On vous fournit le pilote pour MySQL
dans le cas où votre SGBD est MySQL).

II.2.2 Création d’un schéma OLAP
Le schéma OLAP représente la structure du cube OLAP. Pour notre exemple, le schéma
est représenté dans le fichier schema.xml, dont la structure est la suivante:
Nom de la table des faits

Dimension Type

Mesure du nombre des id

Activité 3.
Ajouter le schéma OLAP schema.xml dans la répertoire Analysis Schemas.

Page 5
TP3 : Analyse des données avec Mondrian
II.2.3 Connexion à la base issue
Pour parcourir la base issue, nous devons définir une nouvelle connexion de type
Mondrian, et lui attribuer le schéma OLAP ajouté précédemment.
Activité 4.
Ajouter une nouvelle connexion de type Mondrian à cette source de données dans le
répertoire Analysis Connections. Lui associer le schéma OLAP et la source de données
définies précédemment.

II.2.4 Création de la vue
Une vue représente une requête particulière, comme demandée par le décideur. A
partir de cette vue, plusieurs types de sorties peuvent s’afficher, comme des tableaux,
des graphes…
Pour notre exemple, nous allons créer une vue permettant d’afficher le nombre de
problèmes traités par un employé, classés par type de problème. Pour cela, la requête
MDX suivante sera exécutée:
SELECT
Type.Children ON COLUMNS,
Assignee.Children ON ROWS
FROM Issue

Activité 5.
Ajouter une nouvelle vue dans le répertoire Analysis View, exécutant la requête MDX
précédente. Visualiser les différents affichages en sortie. Exporter les différentes sorties
dans un format PDF, et les enregistrer dans un répertoire qui porte votre nom, pour le
donner à votre enseignante.

III. Homework
Créer les vues suivantes :
-

Page 6

Montrer le nombre de statuts par type de problèmes.
TP3 : Analyse des données avec Mondrian

-

-

Page 7

Montrer le nombre de problèmes non résolus (UNRESOLVED) par employé.

Montrer le nombre d’enregistrements dans la table par statut.
TP3 : Analyse des données avec Mondrian

-

Montrer le pourcentage pour chacun des statuts.

Date de remise du travail : prochaine séance de TP.

Page 8

Contenu connexe

Tendances

BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkAmal Abid
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : SparkLilia Sfaxi
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5Amal Abid
 
PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPTriyadadva
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & SparkAlexia Audevart
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsJean-Marc Dupont
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehousekhlifi z
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3Amal Abid
 

Tendances (20)

Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : Spark
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5
 
PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPT
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Resume de BI
Resume de BIResume de BI
Resume de BI
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka StreamsTraitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
 

En vedette

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelFrédéric FAURE
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : CassandraLilia Sfaxi
 
Software Engineering - chp8- deployment
Software Engineering - chp8- deploymentSoftware Engineering - chp8- deployment
Software Engineering - chp8- deploymentLilia Sfaxi
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...Sonny Brabez
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4JLilia Sfaxi
 
BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopLilia Sfaxi
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherLilia Sfaxi
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceLilia Sfaxi
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingLilia Sfaxi
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1 Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1 Lilia Sfaxi
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?Jean-Marc Dupont
 
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015Metro'num 2015
 
Atelier EAI Blue Way
Atelier EAI Blue WayAtelier EAI Blue Way
Atelier EAI Blue Waypimp uncle
 
QCM Droit et documentation
QCM Droit et documentationQCM Droit et documentation
QCM Droit et documentationKarine Novello
 
Comment Choisir Votre Solution BI
Comment Choisir Votre Solution BIComment Choisir Votre Solution BI
Comment Choisir Votre Solution BILASSA Rafik
 

En vedette (19)

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : Cassandra
 
Software Engineering - chp8- deployment
Software Engineering - chp8- deploymentSoftware Engineering - chp8- deployment
Software Engineering - chp8- deployment
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
 
BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans Hadoop
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-Reduce
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data Processing
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1 Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1
 
Rapport Projet de fin d’études
Rapport Projet de fin d’étudesRapport Projet de fin d’études
Rapport Projet de fin d’études
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
 
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
 
Atelier EAI Blue Way
Atelier EAI Blue WayAtelier EAI Blue Way
Atelier EAI Blue Way
 
QCM Droit et documentation
QCM Droit et documentationQCM Droit et documentation
QCM Droit et documentation
 
Comment Choisir Votre Solution BI
Comment Choisir Votre Solution BIComment Choisir Votre Solution BI
Comment Choisir Votre Solution BI
 

Similaire à BI : Analyse des Données avec Mondrian

presentationcoursbd.pdf
presentationcoursbd.pdfpresentationcoursbd.pdf
presentationcoursbd.pdfAabidiHafid
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008Abdelouahed Abdou
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdf00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdfLaaouissiAzed
 
chap3 conception et implementation
chap3 conception et implementation chap3 conception et implementation
chap3 conception et implementation michel martiz
 
Power BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics NavPower BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics NavMaroua Bouhachem
 
S17 adressez vos besoins complexes de reporting avec db2 web query
S17   adressez vos besoins complexes de reporting avec db2 web queryS17   adressez vos besoins complexes de reporting avec db2 web query
S17 adressez vos besoins complexes de reporting avec db2 web queryGautier DUMAS
 
Android-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursAndroid-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursLilia Sfaxi
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfLeonLovensky
 
Performance point.ppt
Performance point.pptPerformance point.ppt
Performance point.pptilyhel
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna Borgi
 
Cours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURICours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURIMansouri Khalifa
 
Cours access
Cours accessCours access
Cours accesskourbali
 
Cours Excel avance
Cours Excel avanceCours Excel avance
Cours Excel avancehassan1488
 
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...Abdelouahed Abdou
 

Similaire à BI : Analyse des Données avec Mondrian (20)

presentationcoursbd.pdf
presentationcoursbd.pdfpresentationcoursbd.pdf
presentationcoursbd.pdf
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
09coursaccess
09coursaccess09coursaccess
09coursaccess
 
Cours 01.pptx
Cours 01.pptxCours 01.pptx
Cours 01.pptx
 
coursaccess.pdf
coursaccess.pdfcoursaccess.pdf
coursaccess.pdf
 
00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdf00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdf
 
chap3 conception et implementation
chap3 conception et implementation chap3 conception et implementation
chap3 conception et implementation
 
Power BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics NavPower BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics Nav
 
S17 adressez vos besoins complexes de reporting avec db2 web query
S17   adressez vos besoins complexes de reporting avec db2 web queryS17   adressez vos besoins complexes de reporting avec db2 web query
S17 adressez vos besoins complexes de reporting avec db2 web query
 
Android-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursAndroid-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateurs
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdf
 
Performance point.ppt
Performance point.pptPerformance point.ppt
Performance point.ppt
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouse
 
Cours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURICours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURI
 
Cours access
Cours accessCours access
Cours access
 
Cours Excel avance
Cours Excel avanceCours Excel avance
Cours Excel avance
 
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
 
Les outils OLAP
Les outils OLAPLes outils OLAP
Les outils OLAP
 

Plus de Lilia Sfaxi

chp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdfchp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdfLilia Sfaxi
 
Plan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdfPlan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdfLilia Sfaxi
 
Lab1-DB-Cassandra
Lab1-DB-CassandraLab1-DB-Cassandra
Lab1-DB-CassandraLilia Sfaxi
 
TP2-UML-Correction
TP2-UML-CorrectionTP2-UML-Correction
TP2-UML-CorrectionLilia Sfaxi
 
TP1-UML-Correction
TP1-UML-CorrectionTP1-UML-Correction
TP1-UML-CorrectionLilia Sfaxi
 
TP0-UML-Correction
TP0-UML-CorrectionTP0-UML-Correction
TP0-UML-CorrectionLilia Sfaxi
 
TD4-UML-Correction
TD4-UML-CorrectionTD4-UML-Correction
TD4-UML-CorrectionLilia Sfaxi
 
TD3-UML-Séquences
TD3-UML-SéquencesTD3-UML-Séquences
TD3-UML-SéquencesLilia Sfaxi
 
TD3-UML-Correction
TD3-UML-CorrectionTD3-UML-Correction
TD3-UML-CorrectionLilia Sfaxi
 
TD2 - UML - Correction
TD2 - UML - CorrectionTD2 - UML - Correction
TD2 - UML - CorrectionLilia Sfaxi
 
TD1-UML-correction
TD1-UML-correctionTD1-UML-correction
TD1-UML-correctionLilia Sfaxi
 
Android - Tp1 - installation et démarrage
Android - Tp1 -   installation et démarrageAndroid - Tp1 -   installation et démarrage
Android - Tp1 - installation et démarrageLilia Sfaxi
 
Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques Lilia Sfaxi
 
Android - Tp3 - intents
Android - Tp3 -  intentsAndroid - Tp3 -  intents
Android - Tp3 - intentsLilia Sfaxi
 
Android - TPBonus - web services
Android - TPBonus - web servicesAndroid - TPBonus - web services
Android - TPBonus - web servicesLilia Sfaxi
 
Android - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancésAndroid - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancésLilia Sfaxi
 

Plus de Lilia Sfaxi (20)

chp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdfchp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdf
 
Plan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdfPlan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdf
 
Lab3-DB_Neo4j
Lab3-DB_Neo4jLab3-DB_Neo4j
Lab3-DB_Neo4j
 
Lab2-DB-Mongodb
Lab2-DB-MongodbLab2-DB-Mongodb
Lab2-DB-Mongodb
 
Lab1-DB-Cassandra
Lab1-DB-CassandraLab1-DB-Cassandra
Lab1-DB-Cassandra
 
TP2-UML-Correction
TP2-UML-CorrectionTP2-UML-Correction
TP2-UML-Correction
 
TP1-UML-Correction
TP1-UML-CorrectionTP1-UML-Correction
TP1-UML-Correction
 
TP0-UML-Correction
TP0-UML-CorrectionTP0-UML-Correction
TP0-UML-Correction
 
TD4-UML
TD4-UMLTD4-UML
TD4-UML
 
TD4-UML-Correction
TD4-UML-CorrectionTD4-UML-Correction
TD4-UML-Correction
 
TD3-UML-Séquences
TD3-UML-SéquencesTD3-UML-Séquences
TD3-UML-Séquences
 
TD3-UML-Correction
TD3-UML-CorrectionTD3-UML-Correction
TD3-UML-Correction
 
TD2 - UML - Correction
TD2 - UML - CorrectionTD2 - UML - Correction
TD2 - UML - Correction
 
TD1 - UML - DCU
TD1 - UML - DCUTD1 - UML - DCU
TD1 - UML - DCU
 
TD1-UML-correction
TD1-UML-correctionTD1-UML-correction
TD1-UML-correction
 
Android - Tp1 - installation et démarrage
Android - Tp1 -   installation et démarrageAndroid - Tp1 -   installation et démarrage
Android - Tp1 - installation et démarrage
 
Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques
 
Android - Tp3 - intents
Android - Tp3 -  intentsAndroid - Tp3 -  intents
Android - Tp3 - intents
 
Android - TPBonus - web services
Android - TPBonus - web servicesAndroid - TPBonus - web services
Android - TPBonus - web services
 
Android - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancésAndroid - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancés
 

BI : Analyse des Données avec Mondrian

  • 1. Institut National des Sciences Appliquées et de Technologie Tunisie Business Intelligence 2013-2014 TP3- A NALYSE DES DONNEES AVEC M ONDRIAN Dr. Lilia SFAXI Objectifs du TP : Utilisation du serveur OLAP Mondrian pour l’analyse et l’extraction d’une large quantité de données.
  • 2. TP3 : Analyse des données avec Mondrian I. Mondrian & Jasper Report Mondrian1 est un serveur OLAP qui permet aux utilisateurs d’analyser de larges quantités de données en temps réel. Les utilisateurs explorent les données métier en exécutant des requêtes complexes sur des bases volumineuses. Le serveur JasperReport offre des fonctionnalités d’analyse de données en intégrant l’engin Mondrian. Il est possible ensuite d’écrire et d’exécuter des requêtes MDX pour accéder au cube OLAP, dont le schéma est décrit dans un fichier XML. I.1 Schéma du Cube OLAP Un schéma représente une base de données multi-dimensionnelle. Il contient un modèle logique, qui consiste en des cubes, des hiérarchies et des membres, et le mapping de ce modèle en un modèle physique. - Le modèle logique consiste en des structures permettant d’écrire des requêtes en utilisant le langage MDX: les cubes, dimensions, hiérarchies, niveaux et membres. - Le modèle physique est la source de données présentée par le modèle logique. C’est typiquement un schéma en étoile, représenté par un ensemble de tables dans une base de données relationnelles. Dans Mondrian, les schémas sont représentés par des fichiers XML. Pour l’instant, ce fichier doit être écrit à la main. Nous présentons dans ce qui suit les éléments importants dans la structure d’un schéma Mondrian: I.1.1 Cube Un cube est une collection de mesures et dimensions. Il fait référence à une table des faits, ainsi que l’ensemble des mesures et des dimensions qui lui sont liées. La table des faits contient les colonnes à partir desquelles les mesures sont faites, ainsi que des références aux tables contenant les dimensions. I.1.2 Mesures Un cube peut définir une ou plusieurs mesures, chaque mesure ayant un nom, une colonne dans la table des faits, et un aggregator. Un agrégateur représente le traitement à faire sur les données, par exemple sum, count, min, max, avg… 1 http://mondrian.pentaho.com Page 2
  • 3. TP3 : Analyse des données avec Mondrian I.1.3 Membre Un membre est un point dans une dimension, déterminé par un ensemble particulier de valeurs. Par exemple, ‘Tunis’, ‘Gabes’ et ‘Tunisie’ représentent trois membres de la hiérachie adresse. I.1.4 Hiérarchie Une hiérarchie est un ensemble de membres organisés en une structure pour une analyse convenable. Par exemple, la hiérarchie adresse contient le numéro, la rue, la ville et le pays. La hiérarchie permet de construire des sous-totaux: le sous-total d’un pays représente la somme des sous-totaux de toutes les villes de ce pays. I.1.5 Niveau Un niveau représente la collection des membres qui ont la même distance par rapport à la racine de la hiérarchie. I.1.6 Dimension Une dimension est une collection de hiérarchies pour un même attribut de la table des faits. I.2 Les Requêtes d’Exploration MDX MDX (Multi-Dimensional Expressions) est le langage principal pour les requêtes, implémenté par Mondrian. Il ressemble un peu au langage SQL, mais sa structure est différente, vu qu’il traite des données dimensionnelles, pas opérationnelles. Voici un exemple de requête MDX: SELECT {[Measures].[Unit Sales], [Measures].[Store Sales]} ON COLUMNS, {[Product].members} ON ROWS FROM [Sales] WHERE [Time].[1997].[Q2] II. Ma Première Analyse: Issues Dans ce TP, nous allons faire appel à l’engin Mondrian installé dans Jasper Report. Les outils et fichiers dont nous aurons besoin sont les suivants : - JasperReport Server 5.1.0 : Serveur de reporting qui utilise l’engin Mondrian pour l’analyse des données. - Bug_report.csv : fichier csv contenant les données initiales à traiter. - Page 3 Talend TOS 5.2.0 : Pour la transformation des données (phase ETL) Schema.xml : représente le schéma OLAP de notre base cible.
  • 4. TP3 : Analyse des données avec Mondrian - Mysql-connector-java 5.1.26 : connecteur MySQL pour JasperReport, plusieurs autres pilotes comme Postgresql, Oracle… étant déjà installés. Le fichier bug_report.csv représente un fichier délimité contenant plusieurs entrées sur les problèmes (issues), contenant un millier d’entrées sur les bugs et les réclamations des clients. Nous désirons mettre ces données dans un cube OLAP pour l’analyser. II.1 Etape 1: Création de la base de données La première étape consiste en la copie des données fournies dans le fichier délimité, dans une base de données de votre choix. Activité 1. Utiliser Talend Data Integration pour copier les données du fichier délimité bug_report.csv dans une base de données appelée issue, contenant une table appelée fact_issue. Cette table représentera la table des faits de votre cube. A la création de votre table fact_issue, lui ajouter une clef primaire entière (nommée id), qui s’incrémente automatiquement. II.2 Etape 2 : Configuration de JasperReport JasperReport intègre automatiquement Mondrian pour l’analyse des données multidimensionnelles. Il offre une hiérarchie de répertoires pour la configuration des différents éléments de l’analyse. La figure suivante montre cette hiérarchie: Page 4
  • 5. TP3 : Analyse des données avec Mondrian II.2.1 Source de données Pour se connecter à la base de données issue créée précédemment, on doit créer une nouvelle source de données. Activité 2. Ajouter une nouvelle source de données dans le répertoire Analysis Data Sources. Faire référence ici à la base issue créée précédemment. (On vous fournit le pilote pour MySQL dans le cas où votre SGBD est MySQL). II.2.2 Création d’un schéma OLAP Le schéma OLAP représente la structure du cube OLAP. Pour notre exemple, le schéma est représenté dans le fichier schema.xml, dont la structure est la suivante: Nom de la table des faits Dimension Type Mesure du nombre des id Activité 3. Ajouter le schéma OLAP schema.xml dans la répertoire Analysis Schemas. Page 5
  • 6. TP3 : Analyse des données avec Mondrian II.2.3 Connexion à la base issue Pour parcourir la base issue, nous devons définir une nouvelle connexion de type Mondrian, et lui attribuer le schéma OLAP ajouté précédemment. Activité 4. Ajouter une nouvelle connexion de type Mondrian à cette source de données dans le répertoire Analysis Connections. Lui associer le schéma OLAP et la source de données définies précédemment. II.2.4 Création de la vue Une vue représente une requête particulière, comme demandée par le décideur. A partir de cette vue, plusieurs types de sorties peuvent s’afficher, comme des tableaux, des graphes… Pour notre exemple, nous allons créer une vue permettant d’afficher le nombre de problèmes traités par un employé, classés par type de problème. Pour cela, la requête MDX suivante sera exécutée: SELECT Type.Children ON COLUMNS, Assignee.Children ON ROWS FROM Issue Activité 5. Ajouter une nouvelle vue dans le répertoire Analysis View, exécutant la requête MDX précédente. Visualiser les différents affichages en sortie. Exporter les différentes sorties dans un format PDF, et les enregistrer dans un répertoire qui porte votre nom, pour le donner à votre enseignante. III. Homework Créer les vues suivantes : - Page 6 Montrer le nombre de statuts par type de problèmes.
  • 7. TP3 : Analyse des données avec Mondrian - - Page 7 Montrer le nombre de problèmes non résolus (UNRESOLVED) par employé. Montrer le nombre d’enregistrements dans la table par statut.
  • 8. TP3 : Analyse des données avec Mondrian - Montrer le pourcentage pour chacun des statuts. Date de remise du travail : prochaine séance de TP. Page 8