SlideShare une entreprise Scribd logo
Prez Flash :: Talend Open Studio Auteur : Thibault Chassagnette – Pierre Antoine Schaeffer
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Contexte : intégration dans un SI Projets au cœur d’un écosystème  Différents besoins = différentes applications Architectures et technologies différentes Besoin de communiquer avec les autres applications Mise à jour de référentiels Reprises de données
Comment communiquer ?  Directement entre deux applications Solution simple Performances dégradées en cas d’appels trop nombreux Création d’une dépendance entre les applications Difficile à mettre en œuvre avec des progiciels    Application 2    (serveur)     Application 1    (client) HTTP, SOAP, TCP, etc.
Bus de données    Application 2        Application 1       Application 3    Comment communiquer ? Via un bus de données Solution type EAI complexe à mettre en œuvre Performances dégradées en cas d’appels trop nombreux Pas de dépendances directes entre les applications Difficile à mettre en œuvre avec des progiciels Nécessite un connecteur pour chaque application
Par duplication de données Fonctionne avec tous les logiciels (échange de fichier ou accès direct aux bases de données) Fonctionne avec de gros volumes de données Les applications sont totalement indépendantes    Application 2    (destination)     Application 1    (source) Extraction Chargement Transformation Comment communiquer ?
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Définition ETL : Extract, Transform, Load Recouvre à la fois : Le processus d’alimentation Les outils permettant de mettre en œuvre ce processus Utilisé principalement dans les domaines : Du DataWareHousing  De la Business Intelligence
Utilisations possibles Consolidation de données dans le S.I. Exemple : la reconstruction quotidienne d’un DataWareHouse Propagation de données entre bases Exemple : l’alimentation des bases applicatives à partir des référentiels Chargement ou export de données (fichiers) Exemple : export du chiffre d’affaire de la journée Reprise de données Constitution de jeux de données de tests
Principe général d’utilisation Le paramétrage se fait via une interface graphique Un graphe décrit les traitements à réaliser Un nœud reprend les données du nœud précédent
Fonctionnement en 3 étapes La collecte des données (Extract) Depuis une ou plusieurs applications La préparation et la transformation (Transform) Contrôle des données sources Agrégation de plusieurs informations Transformation des informations Le chargement des données (Load) Vers une ou plusieurs applications
Sources de données (entrée ou sortie) Fichiers : plats : taille fixe, séparateur XML : utilisation d’une transformation XSLT propriétaires : Excel Bases de données : Relationnelles : Oracle, Sybase, SQL Server, … Multidimensionnelles Progiciels : ERP : SAP, Oracle, People Soft, … BI : Business Objects, Cognos, …
Transformations Transformations sur une ligne Formatage, Copie de colonnes, Conversions, Application de fonctions Transformations sur un ensemble de ligne Agrégation, tri, pivot, échantillonage, tableaux croisés Transformations sur plusieurs sources de données Jointure, union, filtre conditionnel, multicast Vérification de la qualité des données Fuzzy matching, remplacement de valeurs, vérification d’intervalles
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Talend : présentation générale Open Source  Version gratuite : Talend Open Studio Versions payantes (outils de supervision, ordonnancement, …) Fonctionnement Génération de code JAVA (ou Perl) Création d’un jar à exécuter
Talend : les possibilités Sources de données Bases de données (Oracle, Postgre, MySQL, SQL Server, …) Fichiers (CSV, XML, possibilité de définir un schéma ligne à ligne) WebServices Flux RSS, FTP, CVS, SVN, SSH, … Transformations possibles Filtre, tri, … Ajout de code JAVA compilé puis exécuté par Talend
Talend : l’interface
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Scénario : chargement de données Chargement d’un fichier CSV Log des lignes traitées Envoi en base de données
Scénario : extraction de données Chargement de données depuis une base Agrégation de données Filtre des données Extraction CSV et XML
Scénario : configuration et exploitation Configuration d’un job Découpage en sous-job Chargement d’un fichier normé Transformations Export dans une base Envoi d’un mail
Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio  Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
Avantages Rapidité et facilité de développement Performances d’exécution Communauté active Réactivité Talend
Inconvénients Mauvaise gestion CVS Pas de génération automatisée des exécutables (payant) Attention aux évolutions des composants Nécessite une machine « musclée »
Questions ? Retrouvez nous sur le blog technique de Klee http://blog.kleegroup.com/teknics teKnics@kleegroup.com @teKnics_Klee

Contenu connexe

Tendances

BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
Lilia Sfaxi
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
Amal Abid
 
UML-jamil.pptx
UML-jamil.pptxUML-jamil.pptx
UML-jamil.pptx
kdekde1
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
Cynapsys It Hotspot
 
T1 corrections-qcm
T1 corrections-qcmT1 corrections-qcm
T1 corrections-qcminfcom
 
Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?
Mathieu Lahaye
 
Business Intelligence Reporting Solution
Business Intelligence Reporting Solution Business Intelligence Reporting Solution
Business Intelligence Reporting Solution
Imad ALILAT
 
Architectures orientés services (SOA)
Architectures orientés services (SOA)Architectures orientés services (SOA)
Architectures orientés services (SOA)
Heithem Abbes
 
Plateforme d’e learning
Plateforme d’e learningPlateforme d’e learning
Plateforme d’e learningEl Aber Haythem
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
khlifi z
 
Présentation cloud computing
Présentation cloud computingPrésentation cloud computing
Présentation cloud computing
Cynapsys It Hotspot
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : Cassandra
Lilia Sfaxi
 
Base de données distribuée
Base de données distribuéeBase de données distribuée
Base de données distribuée
kamar MEDDAH
 
Correction examen-java-avancé-1
Correction examen-java-avancé-1Correction examen-java-avancé-1
Correction examen-java-avancé-1
vangogue
 
Cours Base de données relationnelles
Cours Base de données relationnellesCours Base de données relationnelles
Cours Base de données relationnelles
Aymen Kasmi
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
Alexia Audevart
 
Concéption et réalisation d'un processus décisionnel, tableau de bord social.
Concéption et réalisation d'un processus décisionnel, tableau de bord social.Concéption et réalisation d'un processus décisionnel, tableau de bord social.
Concéption et réalisation d'un processus décisionnel, tableau de bord social.
Rim ENNOUR
 

Tendances (20)

BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Pfe
PfePfe
Pfe
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
UML-jamil.pptx
UML-jamil.pptxUML-jamil.pptx
UML-jamil.pptx
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
Bi
BiBi
Bi
 
T1 corrections-qcm
T1 corrections-qcmT1 corrections-qcm
T1 corrections-qcm
 
Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?
 
Business Intelligence Reporting Solution
Business Intelligence Reporting Solution Business Intelligence Reporting Solution
Business Intelligence Reporting Solution
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Architectures orientés services (SOA)
Architectures orientés services (SOA)Architectures orientés services (SOA)
Architectures orientés services (SOA)
 
Plateforme d’e learning
Plateforme d’e learningPlateforme d’e learning
Plateforme d’e learning
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
Présentation cloud computing
Présentation cloud computingPrésentation cloud computing
Présentation cloud computing
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : Cassandra
 
Base de données distribuée
Base de données distribuéeBase de données distribuée
Base de données distribuée
 
Correction examen-java-avancé-1
Correction examen-java-avancé-1Correction examen-java-avancé-1
Correction examen-java-avancé-1
 
Cours Base de données relationnelles
Cours Base de données relationnellesCours Base de données relationnelles
Cours Base de données relationnelles
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Concéption et réalisation d'un processus décisionnel, tableau de bord social.
Concéption et réalisation d'un processus décisionnel, tableau de bord social.Concéption et réalisation d'un processus décisionnel, tableau de bord social.
Concéption et réalisation d'un processus décisionnel, tableau de bord social.
 

En vedette

Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLI
Cedric CARBONE
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
Jean-Michel Franco
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Smile I.T is open
 
Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm.com formation-GNS3
Alphorm.com formation-GNS3
Alphorm
 
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultantAlphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm
 
alphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationalphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administration
Alphorm
 
Alphorm.com Formation le langage SQL
Alphorm.com  Formation le langage SQLAlphorm.com  Formation le langage SQL
Alphorm.com Formation le langage SQL
Alphorm
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)
Alphorm
 
Alphorm.com Formation MySQL Administration(1Z0-883)
Alphorm.com   Formation MySQL Administration(1Z0-883)Alphorm.com   Formation MySQL Administration(1Z0-883)
Alphorm.com Formation MySQL Administration(1Z0-883)
Alphorm
 
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute DisponibilitéAlphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm
 
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm
 
Alphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQLAlphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQL
Alphorm
 

En vedette (13)

Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLI
 
Certificate Talend
Certificate TalendCertificate Talend
Certificate Talend
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
 
Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm.com formation-GNS3
Alphorm.com formation-GNS3
 
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultantAlphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
 
alphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationalphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administration
 
Alphorm.com Formation le langage SQL
Alphorm.com  Formation le langage SQLAlphorm.com  Formation le langage SQL
Alphorm.com Formation le langage SQL
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)
 
Alphorm.com Formation MySQL Administration(1Z0-883)
Alphorm.com   Formation MySQL Administration(1Z0-883)Alphorm.com   Formation MySQL Administration(1Z0-883)
Alphorm.com Formation MySQL Administration(1Z0-883)
 
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute DisponibilitéAlphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
 
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
 
Alphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQLAlphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQL
 

Similaire à Talend

Support cours j2_ee
Support cours j2_eeSupport cours j2_ee
Support cours j2_ee
Christophe Zome
 
Etl -
Etl -Etl -
Développement de plug in sous eclipse
Développement de plug in sous eclipseDéveloppement de plug in sous eclipse
Développement de plug in sous eclipse
ISIG
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
Jean-Marc Dupont
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs
Microsoft
 
Présentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemePrésentation de JEE et de son écosysteme
Présentation de JEE et de son écosysteme
Stéphane Traumat
 
Les micro orm, alternatives à entity framework
Les micro orm, alternatives à entity frameworkLes micro orm, alternatives à entity framework
Les micro orm, alternatives à entity framework
MSDEVMTL
 
introductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdfintroductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdf
HamdaneAbdelAzizHagg
 
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...CERTyou Formation
 
Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124Mejdeddine Bouzouita
 
Présentation de JavaServer Faces
Présentation de JavaServer FacesPrésentation de JavaServer Faces
Présentation de JavaServer Faces
JS Bournival
 
ALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowMathias Kluba
 
Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5
Microsoft
 
Java Entreprise Edition
Java Entreprise EditionJava Entreprise Edition
Java Entreprise Edition
Sabri Bouchlema
 
OW2 JASMINe
OW2 JASMINeOW2 JASMINe
OW2 JASMINe
Guillaume Sauthier
 
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...Patrick Guimonet
 
Développement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EEDéveloppement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EE
Sabri Bouchlema
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Cedric CARBONE
 
La plateforme JEE
La plateforme JEELa plateforme JEE
La plateforme JEE
Sabri Bouchlema
 
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
Paris Salesforce Developer Group
 

Similaire à Talend (20)

Support cours j2_ee
Support cours j2_eeSupport cours j2_ee
Support cours j2_ee
 
Etl -
Etl -Etl -
Etl -
 
Développement de plug in sous eclipse
Développement de plug in sous eclipseDéveloppement de plug in sous eclipse
Développement de plug in sous eclipse
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs
 
Présentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemePrésentation de JEE et de son écosysteme
Présentation de JEE et de son écosysteme
 
Les micro orm, alternatives à entity framework
Les micro orm, alternatives à entity frameworkLes micro orm, alternatives à entity framework
Les micro orm, alternatives à entity framework
 
introductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdfintroductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdf
 
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
 
Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124Prsentation de-javaserver-faces4124
Prsentation de-javaserver-faces4124
 
Présentation de JavaServer Faces
Présentation de JavaServer FacesPrésentation de JavaServer Faces
Présentation de JavaServer Faces
 
ALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - Specflow
 
Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5
 
Java Entreprise Edition
Java Entreprise EditionJava Entreprise Edition
Java Entreprise Edition
 
OW2 JASMINe
OW2 JASMINeOW2 JASMINe
OW2 JASMINe
 
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
 
Développement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EEDéveloppement d'applications pour la plateforme Java EE
Développement d'applications pour la plateforme Java EE
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
 
La plateforme JEE
La plateforme JEELa plateforme JEE
La plateforme JEE
 
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
 

Plus de Klee Group

HTML5
HTML5HTML5
HTML5
Klee Group
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
Klee Group
 
Introduction AOP
Introduction AOPIntroduction AOP
Introduction AOP
Klee Group
 
Panorama d'applications Web
Panorama d'applications WebPanorama d'applications Web
Panorama d'applications Web
Klee Group
 
Internet@TV
Internet@TVInternet@TV
Internet@TV
Klee Group
 
Sécurité des applications Web
Sécurité des applications WebSécurité des applications Web
Sécurité des applications Web
Klee Group
 
noSQL
noSQLnoSQL
noSQL
Klee Group
 
Application lifecycle management
Application lifecycle managementApplication lifecycle management
Application lifecycle management
Klee Group
 
Intégration continue
Intégration continueIntégration continue
Intégration continueKlee Group
 
Architecture orientée service (SOA)
Architecture orientée service (SOA)Architecture orientée service (SOA)
Architecture orientée service (SOA)
Klee Group
 

Plus de Klee Group (11)

HTML5
HTML5HTML5
HTML5
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
 
Introduction AOP
Introduction AOPIntroduction AOP
Introduction AOP
 
Panorama d'applications Web
Panorama d'applications WebPanorama d'applications Web
Panorama d'applications Web
 
Internet@TV
Internet@TVInternet@TV
Internet@TV
 
Sécurité des applications Web
Sécurité des applications WebSécurité des applications Web
Sécurité des applications Web
 
noSQL
noSQLnoSQL
noSQL
 
Drools
DroolsDrools
Drools
 
Application lifecycle management
Application lifecycle managementApplication lifecycle management
Application lifecycle management
 
Intégration continue
Intégration continueIntégration continue
Intégration continue
 
Architecture orientée service (SOA)
Architecture orientée service (SOA)Architecture orientée service (SOA)
Architecture orientée service (SOA)
 

Dernier

De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
Université de Franche-Comté
 
Les écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptxLes écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptx
abderrahimbourimi
 
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
Horgix
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
UNITECBordeaux
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
OCTO Technology
 
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Laurent Speyser
 

Dernier (6)

De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
 
Les écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptxLes écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptx
 
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
 
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
 

Talend

  • 1. Prez Flash :: Talend Open Studio Auteur : Thibault Chassagnette – Pierre Antoine Schaeffer
  • 2. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 3. Contexte : intégration dans un SI Projets au cœur d’un écosystème Différents besoins = différentes applications Architectures et technologies différentes Besoin de communiquer avec les autres applications Mise à jour de référentiels Reprises de données
  • 4. Comment communiquer ? Directement entre deux applications Solution simple Performances dégradées en cas d’appels trop nombreux Création d’une dépendance entre les applications Difficile à mettre en œuvre avec des progiciels Application 2 (serveur) Application 1 (client) HTTP, SOAP, TCP, etc.
  • 5. Bus de données Application 2 Application 1 Application 3 Comment communiquer ? Via un bus de données Solution type EAI complexe à mettre en œuvre Performances dégradées en cas d’appels trop nombreux Pas de dépendances directes entre les applications Difficile à mettre en œuvre avec des progiciels Nécessite un connecteur pour chaque application
  • 6. Par duplication de données Fonctionne avec tous les logiciels (échange de fichier ou accès direct aux bases de données) Fonctionne avec de gros volumes de données Les applications sont totalement indépendantes Application 2 (destination) Application 1 (source) Extraction Chargement Transformation Comment communiquer ?
  • 7. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 8. Définition ETL : Extract, Transform, Load Recouvre à la fois : Le processus d’alimentation Les outils permettant de mettre en œuvre ce processus Utilisé principalement dans les domaines : Du DataWareHousing De la Business Intelligence
  • 9. Utilisations possibles Consolidation de données dans le S.I. Exemple : la reconstruction quotidienne d’un DataWareHouse Propagation de données entre bases Exemple : l’alimentation des bases applicatives à partir des référentiels Chargement ou export de données (fichiers) Exemple : export du chiffre d’affaire de la journée Reprise de données Constitution de jeux de données de tests
  • 10. Principe général d’utilisation Le paramétrage se fait via une interface graphique Un graphe décrit les traitements à réaliser Un nœud reprend les données du nœud précédent
  • 11. Fonctionnement en 3 étapes La collecte des données (Extract) Depuis une ou plusieurs applications La préparation et la transformation (Transform) Contrôle des données sources Agrégation de plusieurs informations Transformation des informations Le chargement des données (Load) Vers une ou plusieurs applications
  • 12. Sources de données (entrée ou sortie) Fichiers : plats : taille fixe, séparateur XML : utilisation d’une transformation XSLT propriétaires : Excel Bases de données : Relationnelles : Oracle, Sybase, SQL Server, … Multidimensionnelles Progiciels : ERP : SAP, Oracle, People Soft, … BI : Business Objects, Cognos, …
  • 13. Transformations Transformations sur une ligne Formatage, Copie de colonnes, Conversions, Application de fonctions Transformations sur un ensemble de ligne Agrégation, tri, pivot, échantillonage, tableaux croisés Transformations sur plusieurs sources de données Jointure, union, filtre conditionnel, multicast Vérification de la qualité des données Fuzzy matching, remplacement de valeurs, vérification d’intervalles
  • 14. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 15. Talend : présentation générale Open Source Version gratuite : Talend Open Studio Versions payantes (outils de supervision, ordonnancement, …) Fonctionnement Génération de code JAVA (ou Perl) Création d’un jar à exécuter
  • 16. Talend : les possibilités Sources de données Bases de données (Oracle, Postgre, MySQL, SQL Server, …) Fichiers (CSV, XML, possibilité de définir un schéma ligne à ligne) WebServices Flux RSS, FTP, CVS, SVN, SSH, … Transformations possibles Filtre, tri, … Ajout de code JAVA compilé puis exécuté par Talend
  • 18. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 19. Scénario : chargement de données Chargement d’un fichier CSV Log des lignes traitées Envoi en base de données
  • 20. Scénario : extraction de données Chargement de données depuis une base Agrégation de données Filtre des données Extraction CSV et XML
  • 21. Scénario : configuration et exploitation Configuration d’un job Découpage en sous-job Chargement d’un fichier normé Transformations Export dans une base Envoi d’un mail
  • 22. Sommaire Contexte Pourquoi utiliser un ETL ? Présentation ETL Qu’est ce qu’un ETL ? Talend Open Studio Présentation, Utilisation Scénarios d’utilisation Charger, exporter, configurer Retours d’expérience Avantages, inconvénients
  • 23. Avantages Rapidité et facilité de développement Performances d’exécution Communauté active Réactivité Talend
  • 24. Inconvénients Mauvaise gestion CVS Pas de génération automatisée des exécutables (payant) Attention aux évolutions des composants Nécessite une machine « musclée »
  • 25. Questions ? Retrouvez nous sur le blog technique de Klee http://blog.kleegroup.com/teknics teKnics@kleegroup.com @teKnics_Klee