SlideShare une entreprise Scribd logo
Institut National des Sciences Appliquées et de Technologie Tunisie

Business Intelligence
2013-2014

TP3- A NALYSE DES DONNEES
AVEC M ONDRIAN
Dr. Lilia SFAXI
Objectifs du TP : Utilisation du serveur OLAP Mondrian pour
l’analyse et l’extraction d’une large quantité de données.
TP3 : Analyse des données avec Mondrian

I. Mondrian & Jasper Report
Mondrian1 est un serveur OLAP qui permet aux utilisateurs d’analyser de larges quantités
de données en temps réel. Les utilisateurs explorent les données métier en exécutant des
requêtes complexes sur des bases volumineuses.
Le serveur JasperReport offre des fonctionnalités d’analyse de données en intégrant
l’engin Mondrian. Il est possible ensuite d’écrire et d’exécuter des requêtes MDX pour
accéder au cube OLAP, dont le schéma est décrit dans un fichier XML.

I.1 Schéma du Cube OLAP
Un schéma représente une base de données multi-dimensionnelle. Il contient un modèle
logique, qui consiste en des cubes, des hiérarchies et des membres, et le mapping de ce
modèle en un modèle physique.
-

Le modèle logique consiste en des structures permettant d’écrire des requêtes en
utilisant le langage MDX: les cubes, dimensions, hiérarchies, niveaux et membres.

-

Le modèle physique est la source de données présentée par le modèle logique.
C’est typiquement un schéma en étoile, représenté par un ensemble de tables
dans une base de données relationnelles.

Dans Mondrian, les schémas sont représentés par des fichiers XML. Pour l’instant, ce
fichier doit être écrit à la main. Nous présentons dans ce qui suit les éléments importants
dans la structure d’un schéma Mondrian:

I.1.1 Cube
Un cube est une collection de mesures et dimensions. Il fait référence à une table des
faits, ainsi que l’ensemble des mesures et des dimensions qui lui sont liées. La table des
faits contient les colonnes à partir desquelles les mesures sont faites, ainsi que des
références aux tables contenant les dimensions.

I.1.2 Mesures
Un cube peut définir une ou plusieurs mesures, chaque mesure ayant un nom, une
colonne dans la table des faits, et un aggregator. Un agrégateur représente le traitement
à faire sur les données, par exemple sum, count, min, max, avg…

1

http://mondrian.pentaho.com

Page 2
TP3 : Analyse des données avec Mondrian
I.1.3 Membre
Un membre est un point dans une dimension, déterminé par un ensemble particulier de
valeurs. Par exemple, ‘Tunis’, ‘Gabes’ et ‘Tunisie’ représentent trois membres de la
hiérachie adresse.

I.1.4 Hiérarchie
Une hiérarchie est un ensemble de membres organisés en une structure pour une analyse
convenable. Par exemple, la hiérarchie adresse contient le numéro, la rue, la ville et le
pays.

La hiérarchie permet de construire des sous-totaux: le sous-total d’un pays

représente la somme des sous-totaux de toutes les villes de ce pays.

I.1.5 Niveau
Un niveau représente la collection des membres qui ont la même distance par rapport à
la racine de la hiérarchie.

I.1.6 Dimension
Une dimension est une collection de hiérarchies pour un même attribut de la table des
faits.

I.2 Les Requêtes d’Exploration MDX
MDX (Multi-Dimensional Expressions) est le langage principal pour les requêtes,
implémenté par Mondrian. Il ressemble un peu au langage SQL, mais sa structure est
différente, vu qu’il traite des données dimensionnelles, pas opérationnelles.
Voici un exemple de requête MDX:
SELECT {[Measures].[Unit Sales], [Measures].[Store Sales]} ON COLUMNS,
{[Product].members} ON ROWS
FROM [Sales]
WHERE [Time].[1997].[Q2]

II. Ma Première Analyse: Issues
Dans ce TP, nous allons faire appel à l’engin Mondrian installé dans Jasper Report. Les
outils et fichiers dont nous aurons besoin sont les suivants :
-

JasperReport Server 5.1.0 : Serveur de reporting qui utilise l’engin Mondrian pour
l’analyse des données.

-

Bug_report.csv : fichier csv contenant les données initiales à traiter.

-

Page 3

Talend TOS 5.2.0 : Pour la transformation des données (phase ETL)
Schema.xml : représente le schéma OLAP de notre base cible.
TP3 : Analyse des données avec Mondrian
-

Mysql-connector-java 5.1.26 : connecteur MySQL pour JasperReport, plusieurs
autres pilotes comme Postgresql, Oracle… étant déjà installés.

Le fichier bug_report.csv représente un fichier délimité contenant plusieurs entrées sur les
problèmes (issues), contenant un millier d’entrées sur les bugs et les réclamations des
clients. Nous désirons mettre ces données dans un cube OLAP pour l’analyser.

II.1 Etape 1: Création de la base de données
La première étape consiste en la copie des données fournies dans le fichier délimité,
dans une base de données de votre choix.
Activité 1.
Utiliser Talend Data Integration pour copier les données du fichier délimité bug_report.csv
dans une base de données appelée issue, contenant une table appelée fact_issue.
Cette table représentera la table des faits de votre cube. A la création de votre table
fact_issue, lui ajouter une clef primaire entière (nommée id), qui s’incrémente
automatiquement.

II.2 Etape 2 : Configuration de JasperReport
JasperReport

intègre

automatiquement

Mondrian

pour

l’analyse

des

données

multidimensionnelles. Il offre une hiérarchie de répertoires pour la configuration des
différents éléments de l’analyse. La figure suivante montre cette hiérarchie:

Page 4
TP3 : Analyse des données avec Mondrian
II.2.1 Source de données
Pour se connecter à la base de données issue créée précédemment, on doit créer une
nouvelle source de données.
Activité 2.
Ajouter une nouvelle source de données dans le répertoire Analysis Data Sources. Faire
référence ici à la base issue créée précédemment. (On vous fournit le pilote pour MySQL
dans le cas où votre SGBD est MySQL).

II.2.2 Création d’un schéma OLAP
Le schéma OLAP représente la structure du cube OLAP. Pour notre exemple, le schéma
est représenté dans le fichier schema.xml, dont la structure est la suivante:
Nom de la table des faits

Dimension Type

Mesure du nombre des id

Activité 3.
Ajouter le schéma OLAP schema.xml dans la répertoire Analysis Schemas.

Page 5
TP3 : Analyse des données avec Mondrian
II.2.3 Connexion à la base issue
Pour parcourir la base issue, nous devons définir une nouvelle connexion de type
Mondrian, et lui attribuer le schéma OLAP ajouté précédemment.
Activité 4.
Ajouter une nouvelle connexion de type Mondrian à cette source de données dans le
répertoire Analysis Connections. Lui associer le schéma OLAP et la source de données
définies précédemment.

II.2.4 Création de la vue
Une vue représente une requête particulière, comme demandée par le décideur. A
partir de cette vue, plusieurs types de sorties peuvent s’afficher, comme des tableaux,
des graphes…
Pour notre exemple, nous allons créer une vue permettant d’afficher le nombre de
problèmes traités par un employé, classés par type de problème. Pour cela, la requête
MDX suivante sera exécutée:
SELECT
Type.Children ON COLUMNS,
Assignee.Children ON ROWS
FROM Issue

Activité 5.
Ajouter une nouvelle vue dans le répertoire Analysis View, exécutant la requête MDX
précédente. Visualiser les différents affichages en sortie. Exporter les différentes sorties
dans un format PDF, et les enregistrer dans un répertoire qui porte votre nom, pour le
donner à votre enseignante.

III. Homework
Créer les vues suivantes :
-

Page 6

Montrer le nombre de statuts par type de problèmes.
TP3 : Analyse des données avec Mondrian

-

-

Page 7

Montrer le nombre de problèmes non résolus (UNRESOLVED) par employé.

Montrer le nombre d’enregistrements dans la table par statut.
TP3 : Analyse des données avec Mondrian

-

Montrer le pourcentage pour chacun des statuts.

Date de remise du travail : prochaine séance de TP.

Page 8

Contenu connexe

Tendances

BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans Hadoop
Lilia Sfaxi
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-Reduce
Lilia Sfaxi
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
Jean-Marc Dupont
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
Cynapsys It Hotspot
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
Lilia Sfaxi
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
Amal Abid
 
Conception et Réalisation d’une application de Gestion SCOLAIRE
Conception et Réalisation d’une application de Gestion SCOLAIREConception et Réalisation d’une application de Gestion SCOLAIRE
Conception et Réalisation d’une application de Gestion SCOLAIRE
Ghizlane ALOZADE
 
Rapport de projet Odoo - gestion de projet et gestion de ressources humaines
Rapport de projet Odoo - gestion de projet et gestion de ressources humainesRapport de projet Odoo - gestion de projet et gestion de ressources humaines
Rapport de projet Odoo - gestion de projet et gestion de ressources humaines
Ayoub Ayyoub
 
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Abdelouahed Abdou
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : Cassandra
Lilia Sfaxi
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
Lilia Sfaxi
 
Reporting avec JasperServer & iReport
Reporting avec JasperServer & iReportReporting avec JasperServer & iReport
Reporting avec JasperServer & iReport
Lilia Sfaxi
 
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka StreamsTraitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
ENSET, Université Hassan II Casablanca
 
Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...
Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...
Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...
Mehdi Hamime
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
Lilia Sfaxi
 
Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019
Aziz Darouichi
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
Lilia Sfaxi
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
Amal Abid
 

Tendances (20)

BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans Hadoop
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-Reduce
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
 
Bi
BiBi
Bi
 
Conception et Réalisation d’une application de Gestion SCOLAIRE
Conception et Réalisation d’une application de Gestion SCOLAIREConception et Réalisation d’une application de Gestion SCOLAIRE
Conception et Réalisation d’une application de Gestion SCOLAIRE
 
Rapport de projet Odoo - gestion de projet et gestion de ressources humaines
Rapport de projet Odoo - gestion de projet et gestion de ressources humainesRapport de projet Odoo - gestion de projet et gestion de ressources humaines
Rapport de projet Odoo - gestion de projet et gestion de ressources humaines
 
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
Développement de modules pour odoo (anciennement OpenERP): exemples et exerci...
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : Cassandra
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
 
Reporting avec JasperServer & iReport
Reporting avec JasperServer & iReportReporting avec JasperServer & iReport
Reporting avec JasperServer & iReport
 
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka StreamsTraitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
 
Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...
Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...
Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019Partie3BI-DW-OLAP2019
Partie3BI-DW-OLAP2019
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 

En vedette

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
Frédéric FAURE
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
Lilia Sfaxi
 
Software Engineering - chp8- deployment
Software Engineering - chp8- deploymentSoftware Engineering - chp8- deployment
Software Engineering - chp8- deployment
Lilia Sfaxi
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
Sonny Brabez
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : Spark
Lilia Sfaxi
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data Processing
Lilia Sfaxi
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
Lilia Sfaxi
 
Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1 Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1
Lilia Sfaxi
 
Rapport Projet de fin d’études
Rapport Projet de fin d’étudesRapport Projet de fin d’études
Rapport Projet de fin d’études
Salah Eddine BENTALBA (+15K Connections)
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
Jean-Marc Dupont
 
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Metro'num 2015
 
Atelier EAI Blue Way
Atelier EAI Blue WayAtelier EAI Blue Way
Atelier EAI Blue Way
pimp uncle
 
QCM Droit et documentation
QCM Droit et documentationQCM Droit et documentation
QCM Droit et documentationKarine Novello
 
Comment Choisir Votre Solution BI
Comment Choisir Votre Solution BIComment Choisir Votre Solution BI
Comment Choisir Votre Solution BI
LASSA Rafik
 

En vedette (16)

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Software Engineering - chp8- deployment
Software Engineering - chp8- deploymentSoftware Engineering - chp8- deployment
Software Engineering - chp8- deployment
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
EAI/ERP - Petit cours sur le principe du EAI/ERP, Microsoft BizTalk 2006 & Mi...
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : Spark
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data Processing
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1 Sécurité des Systèmes Répartis- Partie 1
Sécurité des Systèmes Répartis- Partie 1
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Rapport Projet de fin d’études
Rapport Projet de fin d’étudesRapport Projet de fin d’études
Rapport Projet de fin d’études
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
 
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
Présentation-Analyse-données-aide-décision-Apicube-Metro'num2015
 
Atelier EAI Blue Way
Atelier EAI Blue WayAtelier EAI Blue Way
Atelier EAI Blue Way
 
QCM Droit et documentation
QCM Droit et documentationQCM Droit et documentation
QCM Droit et documentation
 
Comment Choisir Votre Solution BI
Comment Choisir Votre Solution BIComment Choisir Votre Solution BI
Comment Choisir Votre Solution BI
 

Similaire à BI : Analyse des Données avec Mondrian

presentationcoursbd.pdf
presentationcoursbd.pdfpresentationcoursbd.pdf
presentationcoursbd.pdf
AabidiHafid
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008
Abdelouahed Abdou
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Ilan Malka
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
Cours 01.pptx
Cours 01.pptxCours 01.pptx
Cours 01.pptx
azzazrachid1
 
coursaccess.pdf
coursaccess.pdfcoursaccess.pdf
coursaccess.pdf
AyoubElKhatib
 
CSI_COURS_diapo_part1...............ppsx
CSI_COURS_diapo_part1...............ppsxCSI_COURS_diapo_part1...............ppsx
CSI_COURS_diapo_part1...............ppsx
FUR7
 
00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdf00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdf
LaaouissiAzed
 
chap3 conception et implementation
chap3 conception et implementation chap3 conception et implementation
chap3 conception et implementation
michel martiz
 
Power BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics NavPower BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics NavMaroua Bouhachem
 
S17 adressez vos besoins complexes de reporting avec db2 web query
S17   adressez vos besoins complexes de reporting avec db2 web queryS17   adressez vos besoins complexes de reporting avec db2 web query
S17 adressez vos besoins complexes de reporting avec db2 web query
Gautier DUMAS
 
Android-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursAndroid-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateurs
Lilia Sfaxi
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdf
LeonLovensky
 
Performance point.ppt
Performance point.pptPerformance point.ppt
Performance point.pptilyhel
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouse
Emna Borgi
 
Cours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURICours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURI
Mansouri Khalifa
 
Cours access
Cours accessCours access
Cours accesskourbali
 
Cours Excel avance
Cours Excel avanceCours Excel avance
Cours Excel avance
hassan1488
 
Les outils OLAP
Les outils OLAPLes outils OLAP
Les outils OLAP
nadia sassi
 

Similaire à BI : Analyse des Données avec Mondrian (20)

presentationcoursbd.pdf
presentationcoursbd.pdfpresentationcoursbd.pdf
presentationcoursbd.pdf
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
09coursaccess
09coursaccess09coursaccess
09coursaccess
 
Cours 01.pptx
Cours 01.pptxCours 01.pptx
Cours 01.pptx
 
coursaccess.pdf
coursaccess.pdfcoursaccess.pdf
coursaccess.pdf
 
CSI_COURS_diapo_part1...............ppsx
CSI_COURS_diapo_part1...............ppsxCSI_COURS_diapo_part1...............ppsx
CSI_COURS_diapo_part1...............ppsx
 
00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdf00_intro_PrincipRelatConceptOracle.pdf
00_intro_PrincipRelatConceptOracle.pdf
 
chap3 conception et implementation
chap3 conception et implementation chap3 conception et implementation
chap3 conception et implementation
 
Power BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics NavPower BI pour Microsoft Dynamics Nav
Power BI pour Microsoft Dynamics Nav
 
S17 adressez vos besoins complexes de reporting avec db2 web query
S17   adressez vos besoins complexes de reporting avec db2 web queryS17   adressez vos besoins complexes de reporting avec db2 web query
S17 adressez vos besoins complexes de reporting avec db2 web query
 
Android-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursAndroid-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateurs
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdf
 
Performance point.ppt
Performance point.pptPerformance point.ppt
Performance point.ppt
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouse
 
Cours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURICours bases de données partie 1 Prof. Khalifa MANSOURI
Cours bases de données partie 1 Prof. Khalifa MANSOURI
 
Cours access
Cours accessCours access
Cours access
 
Cours Excel avance
Cours Excel avanceCours Excel avance
Cours Excel avance
 
Les outils OLAP
Les outils OLAPLes outils OLAP
Les outils OLAP
 

Plus de Lilia Sfaxi

chp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdfchp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdf
Lilia Sfaxi
 
Plan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdfPlan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdf
Lilia Sfaxi
 
Lab3-DB_Neo4j
Lab3-DB_Neo4jLab3-DB_Neo4j
Lab3-DB_Neo4j
Lilia Sfaxi
 
Lab2-DB-Mongodb
Lab2-DB-MongodbLab2-DB-Mongodb
Lab2-DB-Mongodb
Lilia Sfaxi
 
Lab1-DB-Cassandra
Lab1-DB-CassandraLab1-DB-Cassandra
Lab1-DB-Cassandra
Lilia Sfaxi
 
TP2-UML-Correction
TP2-UML-CorrectionTP2-UML-Correction
TP2-UML-Correction
Lilia Sfaxi
 
TP1-UML-Correction
TP1-UML-CorrectionTP1-UML-Correction
TP1-UML-Correction
Lilia Sfaxi
 
TP0-UML-Correction
TP0-UML-CorrectionTP0-UML-Correction
TP0-UML-Correction
Lilia Sfaxi
 
TD4-UML
TD4-UMLTD4-UML
TD4-UML
Lilia Sfaxi
 
TD4-UML-Correction
TD4-UML-CorrectionTD4-UML-Correction
TD4-UML-Correction
Lilia Sfaxi
 
TD3-UML-Séquences
TD3-UML-SéquencesTD3-UML-Séquences
TD3-UML-Séquences
Lilia Sfaxi
 
TD3-UML-Correction
TD3-UML-CorrectionTD3-UML-Correction
TD3-UML-Correction
Lilia Sfaxi
 
TD2 - UML - Correction
TD2 - UML - CorrectionTD2 - UML - Correction
TD2 - UML - Correction
Lilia Sfaxi
 
TD1 - UML - DCU
TD1 - UML - DCUTD1 - UML - DCU
TD1 - UML - DCU
Lilia Sfaxi
 
TD1-UML-correction
TD1-UML-correctionTD1-UML-correction
TD1-UML-correction
Lilia Sfaxi
 
Android - Tp1 - installation et démarrage
Android - Tp1 -   installation et démarrageAndroid - Tp1 -   installation et démarrage
Android - Tp1 - installation et démarrage
Lilia Sfaxi
 
Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques
Lilia Sfaxi
 
Android - Tp3 - intents
Android - Tp3 -  intentsAndroid - Tp3 -  intents
Android - Tp3 - intents
Lilia Sfaxi
 
Android - TPBonus - web services
Android - TPBonus - web servicesAndroid - TPBonus - web services
Android - TPBonus - web services
Lilia Sfaxi
 
Android - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancésAndroid - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancés
Lilia Sfaxi
 

Plus de Lilia Sfaxi (20)

chp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdfchp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdf
 
Plan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdfPlan d'études_INSAT_2022_2023.pdf
Plan d'études_INSAT_2022_2023.pdf
 
Lab3-DB_Neo4j
Lab3-DB_Neo4jLab3-DB_Neo4j
Lab3-DB_Neo4j
 
Lab2-DB-Mongodb
Lab2-DB-MongodbLab2-DB-Mongodb
Lab2-DB-Mongodb
 
Lab1-DB-Cassandra
Lab1-DB-CassandraLab1-DB-Cassandra
Lab1-DB-Cassandra
 
TP2-UML-Correction
TP2-UML-CorrectionTP2-UML-Correction
TP2-UML-Correction
 
TP1-UML-Correction
TP1-UML-CorrectionTP1-UML-Correction
TP1-UML-Correction
 
TP0-UML-Correction
TP0-UML-CorrectionTP0-UML-Correction
TP0-UML-Correction
 
TD4-UML
TD4-UMLTD4-UML
TD4-UML
 
TD4-UML-Correction
TD4-UML-CorrectionTD4-UML-Correction
TD4-UML-Correction
 
TD3-UML-Séquences
TD3-UML-SéquencesTD3-UML-Séquences
TD3-UML-Séquences
 
TD3-UML-Correction
TD3-UML-CorrectionTD3-UML-Correction
TD3-UML-Correction
 
TD2 - UML - Correction
TD2 - UML - CorrectionTD2 - UML - Correction
TD2 - UML - Correction
 
TD1 - UML - DCU
TD1 - UML - DCUTD1 - UML - DCU
TD1 - UML - DCU
 
TD1-UML-correction
TD1-UML-correctionTD1-UML-correction
TD1-UML-correction
 
Android - Tp1 - installation et démarrage
Android - Tp1 -   installation et démarrageAndroid - Tp1 -   installation et démarrage
Android - Tp1 - installation et démarrage
 
Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques Android - Tp2 - Elements graphiques
Android - Tp2 - Elements graphiques
 
Android - Tp3 - intents
Android - Tp3 -  intentsAndroid - Tp3 -  intents
Android - Tp3 - intents
 
Android - TPBonus - web services
Android - TPBonus - web servicesAndroid - TPBonus - web services
Android - TPBonus - web services
 
Android - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancésAndroid - Tp4 - graphiques avancés
Android - Tp4 - graphiques avancés
 

BI : Analyse des Données avec Mondrian

  • 1. Institut National des Sciences Appliquées et de Technologie Tunisie Business Intelligence 2013-2014 TP3- A NALYSE DES DONNEES AVEC M ONDRIAN Dr. Lilia SFAXI Objectifs du TP : Utilisation du serveur OLAP Mondrian pour l’analyse et l’extraction d’une large quantité de données.
  • 2. TP3 : Analyse des données avec Mondrian I. Mondrian & Jasper Report Mondrian1 est un serveur OLAP qui permet aux utilisateurs d’analyser de larges quantités de données en temps réel. Les utilisateurs explorent les données métier en exécutant des requêtes complexes sur des bases volumineuses. Le serveur JasperReport offre des fonctionnalités d’analyse de données en intégrant l’engin Mondrian. Il est possible ensuite d’écrire et d’exécuter des requêtes MDX pour accéder au cube OLAP, dont le schéma est décrit dans un fichier XML. I.1 Schéma du Cube OLAP Un schéma représente une base de données multi-dimensionnelle. Il contient un modèle logique, qui consiste en des cubes, des hiérarchies et des membres, et le mapping de ce modèle en un modèle physique. - Le modèle logique consiste en des structures permettant d’écrire des requêtes en utilisant le langage MDX: les cubes, dimensions, hiérarchies, niveaux et membres. - Le modèle physique est la source de données présentée par le modèle logique. C’est typiquement un schéma en étoile, représenté par un ensemble de tables dans une base de données relationnelles. Dans Mondrian, les schémas sont représentés par des fichiers XML. Pour l’instant, ce fichier doit être écrit à la main. Nous présentons dans ce qui suit les éléments importants dans la structure d’un schéma Mondrian: I.1.1 Cube Un cube est une collection de mesures et dimensions. Il fait référence à une table des faits, ainsi que l’ensemble des mesures et des dimensions qui lui sont liées. La table des faits contient les colonnes à partir desquelles les mesures sont faites, ainsi que des références aux tables contenant les dimensions. I.1.2 Mesures Un cube peut définir une ou plusieurs mesures, chaque mesure ayant un nom, une colonne dans la table des faits, et un aggregator. Un agrégateur représente le traitement à faire sur les données, par exemple sum, count, min, max, avg… 1 http://mondrian.pentaho.com Page 2
  • 3. TP3 : Analyse des données avec Mondrian I.1.3 Membre Un membre est un point dans une dimension, déterminé par un ensemble particulier de valeurs. Par exemple, ‘Tunis’, ‘Gabes’ et ‘Tunisie’ représentent trois membres de la hiérachie adresse. I.1.4 Hiérarchie Une hiérarchie est un ensemble de membres organisés en une structure pour une analyse convenable. Par exemple, la hiérarchie adresse contient le numéro, la rue, la ville et le pays. La hiérarchie permet de construire des sous-totaux: le sous-total d’un pays représente la somme des sous-totaux de toutes les villes de ce pays. I.1.5 Niveau Un niveau représente la collection des membres qui ont la même distance par rapport à la racine de la hiérarchie. I.1.6 Dimension Une dimension est une collection de hiérarchies pour un même attribut de la table des faits. I.2 Les Requêtes d’Exploration MDX MDX (Multi-Dimensional Expressions) est le langage principal pour les requêtes, implémenté par Mondrian. Il ressemble un peu au langage SQL, mais sa structure est différente, vu qu’il traite des données dimensionnelles, pas opérationnelles. Voici un exemple de requête MDX: SELECT {[Measures].[Unit Sales], [Measures].[Store Sales]} ON COLUMNS, {[Product].members} ON ROWS FROM [Sales] WHERE [Time].[1997].[Q2] II. Ma Première Analyse: Issues Dans ce TP, nous allons faire appel à l’engin Mondrian installé dans Jasper Report. Les outils et fichiers dont nous aurons besoin sont les suivants : - JasperReport Server 5.1.0 : Serveur de reporting qui utilise l’engin Mondrian pour l’analyse des données. - Bug_report.csv : fichier csv contenant les données initiales à traiter. - Page 3 Talend TOS 5.2.0 : Pour la transformation des données (phase ETL) Schema.xml : représente le schéma OLAP de notre base cible.
  • 4. TP3 : Analyse des données avec Mondrian - Mysql-connector-java 5.1.26 : connecteur MySQL pour JasperReport, plusieurs autres pilotes comme Postgresql, Oracle… étant déjà installés. Le fichier bug_report.csv représente un fichier délimité contenant plusieurs entrées sur les problèmes (issues), contenant un millier d’entrées sur les bugs et les réclamations des clients. Nous désirons mettre ces données dans un cube OLAP pour l’analyser. II.1 Etape 1: Création de la base de données La première étape consiste en la copie des données fournies dans le fichier délimité, dans une base de données de votre choix. Activité 1. Utiliser Talend Data Integration pour copier les données du fichier délimité bug_report.csv dans une base de données appelée issue, contenant une table appelée fact_issue. Cette table représentera la table des faits de votre cube. A la création de votre table fact_issue, lui ajouter une clef primaire entière (nommée id), qui s’incrémente automatiquement. II.2 Etape 2 : Configuration de JasperReport JasperReport intègre automatiquement Mondrian pour l’analyse des données multidimensionnelles. Il offre une hiérarchie de répertoires pour la configuration des différents éléments de l’analyse. La figure suivante montre cette hiérarchie: Page 4
  • 5. TP3 : Analyse des données avec Mondrian II.2.1 Source de données Pour se connecter à la base de données issue créée précédemment, on doit créer une nouvelle source de données. Activité 2. Ajouter une nouvelle source de données dans le répertoire Analysis Data Sources. Faire référence ici à la base issue créée précédemment. (On vous fournit le pilote pour MySQL dans le cas où votre SGBD est MySQL). II.2.2 Création d’un schéma OLAP Le schéma OLAP représente la structure du cube OLAP. Pour notre exemple, le schéma est représenté dans le fichier schema.xml, dont la structure est la suivante: Nom de la table des faits Dimension Type Mesure du nombre des id Activité 3. Ajouter le schéma OLAP schema.xml dans la répertoire Analysis Schemas. Page 5
  • 6. TP3 : Analyse des données avec Mondrian II.2.3 Connexion à la base issue Pour parcourir la base issue, nous devons définir une nouvelle connexion de type Mondrian, et lui attribuer le schéma OLAP ajouté précédemment. Activité 4. Ajouter une nouvelle connexion de type Mondrian à cette source de données dans le répertoire Analysis Connections. Lui associer le schéma OLAP et la source de données définies précédemment. II.2.4 Création de la vue Une vue représente une requête particulière, comme demandée par le décideur. A partir de cette vue, plusieurs types de sorties peuvent s’afficher, comme des tableaux, des graphes… Pour notre exemple, nous allons créer une vue permettant d’afficher le nombre de problèmes traités par un employé, classés par type de problème. Pour cela, la requête MDX suivante sera exécutée: SELECT Type.Children ON COLUMNS, Assignee.Children ON ROWS FROM Issue Activité 5. Ajouter une nouvelle vue dans le répertoire Analysis View, exécutant la requête MDX précédente. Visualiser les différents affichages en sortie. Exporter les différentes sorties dans un format PDF, et les enregistrer dans un répertoire qui porte votre nom, pour le donner à votre enseignante. III. Homework Créer les vues suivantes : - Page 6 Montrer le nombre de statuts par type de problèmes.
  • 7. TP3 : Analyse des données avec Mondrian - - Page 7 Montrer le nombre de problèmes non résolus (UNRESOLVED) par employé. Montrer le nombre d’enregistrements dans la table par statut.
  • 8. TP3 : Analyse des données avec Mondrian - Montrer le pourcentage pour chacun des statuts. Date de remise du travail : prochaine séance de TP. Page 8