SlideShare une entreprise Scribd logo
1  sur  25
Prez Flash :: Talend Open Studio Auteur : Thibault Chassagnette – Pierre Antoine Schaeffer
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Contexte : intégration dans un SI Projets au cœur d’un écosystème  Différents besoins = différentes applications Architectures et technologies différentes Besoin de communiquer avec les autres applications Mise à jour de référentiels Reprises de données
Comment communiquer ?  Directement entre deux applications Solution simple Performances dégradées en cas d’appels trop nombreux Création d’une dépendance entre les applications Difficile à mettre en œuvre avec des progiciels    Application 2    (serveur)     Application 1    (client) HTTP, SOAP, TCP, etc.
Bus de données    Application 2        Application 1       Application 3    Comment communiquer ? Via un bus de données Solution type EAI complexe à mettre en œuvre Performances dégradées en cas d’appels trop nombreux Pas de dépendances directes entre les applications Difficile à mettre en œuvre avec des progiciels Nécessite un connecteur pour chaque application
Par duplication de données Fonctionne avec tous les logiciels (échange de fichier ou accès direct aux bases de données) Fonctionne avec de gros volumes de données Les applications sont totalement indépendantes    Application 2    (destination)     Application 1    (source) Extraction Chargement Transformation Comment communiquer ?
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Définition ETL : Extract, Transform, Load Recouvre à la fois : Le processus d’alimentation Les outils permettant de mettre en œuvre ce processus Utilisé principalement dans les domaines : Du DataWareHousing  De la Business Intelligence
Utilisations possibles Consolidation de données dans le S.I. Exemple : la reconstruction quotidienne d’un DataWareHouse Propagation de données entre bases Exemple : l’alimentation des bases applicatives à partir des référentiels Chargement ou export de données (fichiers) Exemple : export du chiffre d’affaire de la journée Reprise de données Constitution de jeux de données de tests
Principe général d’utilisation Le paramétrage se fait via une interface graphique Un graphe décrit les traitements à réaliser Un nœud reprend les données du nœud précédent
Fonctionnement en 3 étapes La collecte des données (Extract) Depuis une ou plusieurs applications La préparation et la transformation (Transform) Contrôle des données sources Agrégation de plusieurs informations Transformation des informations Le chargement des données (Load) Vers une ou plusieurs applications
Sources de données (entrée ou sortie) Fichiers : plats : taille fixe, séparateur XML : utilisation d’une transformation XSLT propriétaires : Excel Bases de données : Relationnelles : Oracle, Sybase, SQL Server, … Multidimensionnelles Progiciels : ERP : SAP, Oracle, People Soft, … BI : Business Objects, Cognos, …
Transformations Transformations sur une ligne Formatage, Copie de colonnes, Conversions, Application de fonctions Transformations sur un ensemble de ligne Agrégation, tri, pivot, échantillonage, tableaux croisés Transformations sur plusieurs sources de données Jointure, union, filtre conditionnel, multicast Vérification de la qualité des données Fuzzy matching, remplacement de valeurs, vérification d’intervalles
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Talend : présentation générale Open Source  Version gratuite : Talend Open Studio Versions payantes (outils de supervision, ordonnancement, …) Fonctionnement Génération de code JAVA (ou Perl) Création d’un jar à exécuter
Talend : les possibilités Sources de données Bases de données (Oracle, Postgre, MySQL, SQL Server, …) Fichiers (CSV, XML, possibilité de définir un schéma ligne à ligne) WebServices Flux RSS, FTP, CVS, SVN, SSH, … Transformations possibles Filtre, tri, … Ajout de code JAVA compilé puis exécuté par Talend
Talend : l’interface
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Scénario : chargement de données Chargement d’un fichier CSV Log des lignes traitées Envoi en base de données
Scénario : extraction de données Chargement de données depuis une base Agrégation de données Filtre des données Extraction CSV et XML
Scénario : configuration et exploitation Configuration d’un job Découpage en sous-job Chargement d’un fichier normé Transformations Export dans une base Envoi d’un mail
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Avantages Rapidité et facilité de développement Performances d’exécution Communauté active Réactivité Talend
Inconvénients Mauvaise gestion CVS Pas de génération automatisée des exécutables (payant) Attention aux évolutions des composants Nécessite une machine « musclée »
Questions ? Retrouvez nous sur le blog technique de Klee http://blog.kleegroup.com/teknics teKnics@kleegroup.com @teKnics_Klee

Contenu connexe

Tendances

Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentauxAlphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentauxAlphorm
 
PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPTriyadadva
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence Cynapsys It Hotspot
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
La Business Intelligence
La Business Intelligence La Business Intelligence
La Business Intelligence Khchaf Mouna
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
Business Intelligence Reporting Solution
Business Intelligence Reporting Solution Business Intelligence Reporting Solution
Business Intelligence Reporting Solution Imad ALILAT
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & SparkAlexia Audevart
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BISaid Sadik
 

Tendances (20)

Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?
 
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentauxAlphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
 
PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPT
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
La Business Intelligence
La Business Intelligence La Business Intelligence
La Business Intelligence
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
Pfe
PfePfe
Pfe
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Business Intelligence Reporting Solution
Business Intelligence Reporting Solution Business Intelligence Reporting Solution
Business Intelligence Reporting Solution
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Etl -
Etl -Etl -
Etl -
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
 

En vedette

Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLICedric CARBONE
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data TalendJean-Michel Franco
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réelSmile I.T is open
 
Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm
 
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultantAlphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultantAlphorm
 
alphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationalphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationAlphorm
 
Alphorm.com Formation le langage SQL
Alphorm.com  Formation le langage SQLAlphorm.com  Formation le langage SQL
Alphorm.com Formation le langage SQLAlphorm
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)Alphorm
 
Alphorm.com Formation MySQL Administration(1Z0-883)
Alphorm.com   Formation MySQL Administration(1Z0-883)Alphorm.com   Formation MySQL Administration(1Z0-883)
Alphorm.com Formation MySQL Administration(1Z0-883)Alphorm
 
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute DisponibilitéAlphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute DisponibilitéAlphorm
 
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)Alphorm
 
Alphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQLAlphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQLAlphorm
 

En vedette (13)

Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLI
 
Certificate Talend
Certificate TalendCertificate Talend
Certificate Talend
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
 
Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm.com formation-GNS3
Alphorm.com formation-GNS3
 
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultantAlphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
 
alphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationalphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administration
 
Alphorm.com Formation le langage SQL
Alphorm.com  Formation le langage SQLAlphorm.com  Formation le langage SQL
Alphorm.com Formation le langage SQL
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)
 
Alphorm.com Formation MySQL Administration(1Z0-883)
Alphorm.com   Formation MySQL Administration(1Z0-883)Alphorm.com   Formation MySQL Administration(1Z0-883)
Alphorm.com Formation MySQL Administration(1Z0-883)
 
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute DisponibilitéAlphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
 
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
 
Alphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQLAlphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQL
 

Similaire à Talend

Développement de plug in sous eclipse
Développement de plug in sous eclipseDéveloppement de plug in sous eclipse
Développement de plug in sous eclipseISIG
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs Microsoft
 
Présentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemePrésentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemeStéphane Traumat
 
Les micro orm, alternatives à entity framework
Les micro orm, alternatives à entity frameworkLes micro orm, alternatives à entity framework
Les micro orm, alternatives à entity frameworkMSDEVMTL
 
introductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdfintroductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdfHamdaneAbdelAzizHagg
 
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...CERTyou Formation
 
Présentation de JavaServer Faces
Présentation de JavaServer FacesPrésentation de JavaServer Faces
Présentation de JavaServer FacesJS Bournival
 
Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124Mejdeddine Bouzouita
 
ALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowMathias Kluba
 
Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5Microsoft
 
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...Patrick Guimonet
 
Développement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EEDéveloppement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EESabri Bouchlema
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneCedric CARBONE
 
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !Paris Salesforce Developer Group
 
Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29Elapse Technologies
 
Industrialisez vos projets Php
Industrialisez vos projets Php Industrialisez vos projets Php
Industrialisez vos projets Php ALTER WAY
 

Similaire à Talend (20)

Support cours j2_ee
Support cours j2_eeSupport cours j2_ee
Support cours j2_ee
 
Développement de plug in sous eclipse
Développement de plug in sous eclipseDéveloppement de plug in sous eclipse
Développement de plug in sous eclipse
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs
 
Présentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemePrésentation de JEE et de son écosysteme
Présentation de JEE et de son écosysteme
 
Les micro orm, alternatives à entity framework
Les micro orm, alternatives à entity frameworkLes micro orm, alternatives à entity framework
Les micro orm, alternatives à entity framework
 
introductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdfintroductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdf
 
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
 
Présentation de JavaServer Faces
Présentation de JavaServer FacesPrésentation de JavaServer Faces
Présentation de JavaServer Faces
 
Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124
 
ALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - Specflow
 
Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5
 
Java Entreprise Edition
Java Entreprise EditionJava Entreprise Edition
Java Entreprise Edition
 
OW2 JASMINe
OW2 JASMINeOW2 JASMINe
OW2 JASMINe
 
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
 
Développement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EEDéveloppement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EE
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
 
La plateforme JEE
La plateforme JEELa plateforme JEE
La plateforme JEE
 
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
 
Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29
 
Industrialisez vos projets Php
Industrialisez vos projets Php Industrialisez vos projets Php
Industrialisez vos projets Php
 

Plus de Klee Group

Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked DataKlee Group
 
Introduction AOP
Introduction AOPIntroduction AOP
Introduction AOPKlee Group
 
Panorama d'applications Web
Panorama d'applications WebPanorama d'applications Web
Panorama d'applications WebKlee Group
 
Sécurité des applications Web
Sécurité des applications WebSécurité des applications Web
Sécurité des applications WebKlee Group
 
Application lifecycle management
Application lifecycle managementApplication lifecycle management
Application lifecycle managementKlee Group
 
Intégration continue
Intégration continueIntégration continue
Intégration continueKlee Group
 
Architecture orientée service (SOA)
Architecture orientée service (SOA)Architecture orientée service (SOA)
Architecture orientée service (SOA)Klee Group
 

Plus de Klee Group (11)

HTML5
HTML5HTML5
HTML5
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
 
Introduction AOP
Introduction AOPIntroduction AOP
Introduction AOP
 
Panorama d'applications Web
Panorama d'applications WebPanorama d'applications Web
Panorama d'applications Web
 
Internet@TV
Internet@TVInternet@TV
Internet@TV
 
Sécurité des applications Web
Sécurité des applications WebSécurité des applications Web
Sécurité des applications Web
 
noSQL
noSQLnoSQL
noSQL
 
Drools
DroolsDrools
Drools
 
Application lifecycle management
Application lifecycle managementApplication lifecycle management
Application lifecycle management
 
Intégration continue
Intégration continueIntégration continue
Intégration continue
 
Architecture orientée service (SOA)
Architecture orientée service (SOA)Architecture orientée service (SOA)
Architecture orientée service (SOA)
 

Talend

  • 1. Prez Flash :: Talend Open Studio Auteur : Thibault Chassagnette – Pierre Antoine Schaeffer
  • 2. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 3. Contexte : intégration dans un SI Projets au cœur d’un écosystème Différents besoins = différentes applications Architectures et technologies différentes Besoin de communiquer avec les autres applications Mise à jour de référentiels Reprises de données
  • 4. Comment communiquer ? Directement entre deux applications Solution simple Performances dégradées en cas d’appels trop nombreux Création d’une dépendance entre les applications Difficile à mettre en œuvre avec des progiciels Application 2 (serveur) Application 1 (client) HTTP, SOAP, TCP, etc.
  • 5. Bus de données Application 2 Application 1 Application 3 Comment communiquer ? Via un bus de données Solution type EAI complexe à mettre en œuvre Performances dégradées en cas d’appels trop nombreux Pas de dépendances directes entre les applications Difficile à mettre en œuvre avec des progiciels Nécessite un connecteur pour chaque application
  • 6. Par duplication de données Fonctionne avec tous les logiciels (échange de fichier ou accès direct aux bases de données) Fonctionne avec de gros volumes de données Les applications sont totalement indépendantes Application 2 (destination) Application 1 (source) Extraction Chargement Transformation Comment communiquer ?
  • 7. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 8. Définition ETL : Extract, Transform, Load Recouvre à la fois : Le processus d’alimentation Les outils permettant de mettre en œuvre ce processus Utilisé principalement dans les domaines : Du DataWareHousing De la Business Intelligence
  • 9. Utilisations possibles Consolidation de données dans le S.I. Exemple : la reconstruction quotidienne d’un DataWareHouse Propagation de données entre bases Exemple : l’alimentation des bases applicatives à partir des référentiels Chargement ou export de données (fichiers) Exemple : export du chiffre d’affaire de la journée Reprise de données Constitution de jeux de données de tests
  • 10. Principe général d’utilisation Le paramétrage se fait via une interface graphique Un graphe décrit les traitements à réaliser Un nœud reprend les données du nœud précédent
  • 11. Fonctionnement en 3 étapes La collecte des données (Extract) Depuis une ou plusieurs applications La préparation et la transformation (Transform) Contrôle des données sources Agrégation de plusieurs informations Transformation des informations Le chargement des données (Load) Vers une ou plusieurs applications
  • 12. Sources de données (entrée ou sortie) Fichiers : plats : taille fixe, séparateur XML : utilisation d’une transformation XSLT propriétaires : Excel Bases de données : Relationnelles : Oracle, Sybase, SQL Server, … Multidimensionnelles Progiciels : ERP : SAP, Oracle, People Soft, … BI : Business Objects, Cognos, …
  • 13. Transformations Transformations sur une ligne Formatage, Copie de colonnes, Conversions, Application de fonctions Transformations sur un ensemble de ligne Agrégation, tri, pivot, échantillonage, tableaux croisés Transformations sur plusieurs sources de données Jointure, union, filtre conditionnel, multicast Vérification de la qualité des données Fuzzy matching, remplacement de valeurs, vérification d’intervalles
  • 14. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 15. Talend : présentation générale Open Source Version gratuite : Talend Open Studio Versions payantes (outils de supervision, ordonnancement, …) Fonctionnement Génération de code JAVA (ou Perl) Création d’un jar à exécuter
  • 16. Talend : les possibilités Sources de données Bases de données (Oracle, Postgre, MySQL, SQL Server, …) Fichiers (CSV, XML, possibilité de définir un schéma ligne à ligne) WebServices Flux RSS, FTP, CVS, SVN, SSH, … Transformations possibles Filtre, tri, … Ajout de code JAVA compilé puis exécuté par Talend
  • 18. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 19. Scénario : chargement de données Chargement d’un fichier CSV Log des lignes traitées Envoi en base de données
  • 20. Scénario : extraction de données Chargement de données depuis une base Agrégation de données Filtre des données Extraction CSV et XML
  • 21. Scénario : configuration et exploitation Configuration d’un job Découpage en sous-job Chargement d’un fichier normé Transformations Export dans une base Envoi d’un mail
  • 22. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 23. Avantages Rapidité et facilité de développement Performances d’exécution Communauté active Réactivité Talend
  • 24. Inconvénients Mauvaise gestion CVS Pas de génération automatisée des exécutables (payant) Attention aux évolutions des composants Nécessite une machine « musclée »
  • 25. Questions ? Retrouvez nous sur le blog technique de Klee http://blog.kleegroup.com/teknics teKnics@kleegroup.com @teKnics_Klee