PENTAHO
Sommaire
Introduction Général
Pentaho Data Integration (ETL)
Reporting
Analyse OLAP : Pentaho Analysis
Les tableaux de bords dans Pentaho
Conclusion Général
INTRODUCTION
Pentaho Data Integration
Définition :
 Pentaho Data Integration (anciennement K.E.T.T.L.E – Kettle ETTL
Environment)
La petite histoire
 KETTLE a été développé il y a 5 ans par Matt CASTERS, un consultant
en Business Intelligence (BI) indépendant, dans un premier temps pour ses
propres besoins
 Le projet a été rendu open Source l’année dernière et PENTAHO l’a
acquis au début de l’année 2006.
 C’est ainsi que KETTLE est devenu Pentaho Data Integration (PDI). Matt
conserve le leadership sur le projet en tant que « Chief Data Integration »
chez PENTAHO.
Fonctionnalités
 PDI permet de créer deux types de processus :
 Les transformations
 Les tâches
Les composants PDI
 SPOON :
 Parmi ses étapes :
 Connexion à n’importe quelle base de données au travers d’un
driver JDBC
 Lecture et écriture dans des fichiers de type XML, XLS,…
 Opérateurs relationnels tel que : Jointure, agrégation,…
 Exécution de SQL directe ou appel de procédures de bases de
données
Les composants PDI
 PAN :
Les composants PDI
 CHEF :
 Introduit une autre notion : La tâche
 Il vous permettra de surveiller l’exécution de
vos transformations.
Les composants PDI
 Kitchen :
 C’est un outil de développement de chaînes ETL,
permet d’ordonnancer les différentes transformations
développées avec Spoon
Les tableaux de bords Pentaho
Pentaho Dashboard
Pentaho CDF & C*tools
 le projet communautaire Pentaho CDF
(Community Dashboard Framework).
 D’autres projets se sont ajoutés à Pentaho
CDF, pour constituer ce qu’on appelle
désormais les « C*tools »:
 CDA (Community Data Access)
 CCC (Community Charting Components)
 CST (Community Startup Tabs)
 CDE (Community Dashboard Editor)
Conclusion de PDI

Pentaho

  • 1.
  • 2.
    Sommaire Introduction Général Pentaho DataIntegration (ETL) Reporting Analyse OLAP : Pentaho Analysis Les tableaux de bords dans Pentaho Conclusion Général
  • 3.
  • 4.
  • 5.
    Définition :  PentahoData Integration (anciennement K.E.T.T.L.E – Kettle ETTL Environment)
  • 6.
    La petite histoire KETTLE a été développé il y a 5 ans par Matt CASTERS, un consultant en Business Intelligence (BI) indépendant, dans un premier temps pour ses propres besoins  Le projet a été rendu open Source l’année dernière et PENTAHO l’a acquis au début de l’année 2006.  C’est ainsi que KETTLE est devenu Pentaho Data Integration (PDI). Matt conserve le leadership sur le projet en tant que « Chief Data Integration » chez PENTAHO.
  • 7.
    Fonctionnalités  PDI permetde créer deux types de processus :  Les transformations  Les tâches
  • 8.
    Les composants PDI SPOON :  Parmi ses étapes :  Connexion à n’importe quelle base de données au travers d’un driver JDBC  Lecture et écriture dans des fichiers de type XML, XLS,…  Opérateurs relationnels tel que : Jointure, agrégation,…  Exécution de SQL directe ou appel de procédures de bases de données
  • 9.
  • 10.
    Les composants PDI CHEF :  Introduit une autre notion : La tâche  Il vous permettra de surveiller l’exécution de vos transformations.
  • 11.
    Les composants PDI Kitchen :  C’est un outil de développement de chaînes ETL, permet d’ordonnancer les différentes transformations développées avec Spoon
  • 12.
    Les tableaux debords Pentaho
  • 13.
  • 16.
    Pentaho CDF &C*tools  le projet communautaire Pentaho CDF (Community Dashboard Framework).  D’autres projets se sont ajoutés à Pentaho CDF, pour constituer ce qu’on appelle désormais les « C*tools »:  CDA (Community Data Access)  CCC (Community Charting Components)  CST (Community Startup Tabs)  CDE (Community Dashboard Editor)
  • 17.