2. 2
Point logistique
• Tous les participants sont en mode silencieux
• Vous pouvez poser vos questions en utilisant le panneau question/réponse situé en bas à droite de
votre plateforme GoToWebinar
• Les réponses à vos questions seront fournies à la fin de la démonstration
• Si nous manquons de temps pour répondre à toutes les questions, vous recevrez une réponse par e-
mail
• Pour recevoir les diapositives présentées aujourd’hui, envoyez un email à webinar@talend.com
• Si vous avez des problèmes de connexion, utilisez le panneau question/réponse
4. 4
• Les principaux thèmes de la release Spring ’16
• Le marché du Cloud et du Big Data
• Les challenges de l’entreprise data-driven
• Les principales fonctionnalité de Talend Integration Cloud
• Démonstration
• Prochaines Etapes & Ressources
• Questions/réponses
Agenda
6. 6
Talend Integration Cloud Spring ’16 – Principaux Thèmes
Amazon RedshiftAmazon EMR
Automatiser l’intégration
Big Data sur AWS
Analytique dans le Cloud,
en temps réel
Orchestrer l’Intégration
en mode hybride
7. 7
AWS Redshift et EMR : un engouement certain
Google Trends, Red = Redshift, Blue = EMR
8. 8
Les cas d’usage de Spark qui se multiplient
La trajectoire
d’adoption de Spark
passe par le Cloud
Les principaux fournisseurs
du Cloud ont intégré Spark
Des utilisateurs s’appuient
sur 2 composants Spark
ou plus
1.Infoworld: Why Spark is spikingin the cloud
2. Databricks 2015 Spark Survey
10. 10
Les challenges rencontrés dans l’adoption du Cloud
Big Data En Temps-Réel
• Intégrer le Big Data en temps réel
demande un très haut niveau
d’expertise
• Les déploiements sont freinés par
les prérequis en termes de
ressources
MARKETING
R&D RH
COMMERCE
11. 11
Les coûts
• Même si les plate-formes Cloud
comme AWS ont un modèle de
coûts avantageux, le contrôle des
coûts reste un sujet sensible
• Il est fréquent que les services AWS
soient activés, mais inutilisés, ce
qui augmente inutilement leurs
coûts
Les challenges rencontrés dans l’adoption du Cloud
12. 12
Variété des Données
• Plus l’entreprise progresse, plus la
diversité des données à considérer
augmente
• Il faut gérer les applications SaaS, les
applications existantes, les nouveaux
cas d’usage comme l’Internet des
Objets
• L’IT doit pouvoir de piloter et
d’intégrer toutes ces applications
hétérogènes à partir d’un point de
contrôle homogène
Les challenges rencontrés dans l’adoption du Cloud
13. 13
Qui est concerné, et pour quel enjeu ?
Analystes
Développeur
Hadoop
Architectes
Développeurs
d’applications
Administrateurs base de
données
Coûts CoûtsCoûts
Variété des
données
Big Data
en Temps Réel
14. 14
Automatiser l’intégration Big Data avec EMR & Redshift
• Activer et désactiver automatiquement
les clusters EMR et Redshift
• Réduire drastiquement les coûts liés à
AWS EMR et Redshift en évitant d’utiliser
les clusters en mode 24x7
• Utiliser les clusters uniquement des jobs
d’intégration doivent être exécutés
Amazon Redshift Amazon EMR
15. 15
Un exemple très concret pour illustrer les bénéfices
Source: AWS Simple Monthly Calculator
17. 17
• Payer l’accès au Data Warehouse seulement quand cela est nécessaire
• Chargement de données périodique et incrémentale
• Préparation périodique des données pour l’analyse prédictive
• Payer l’accès au cluster Hadoop seulement quand cela est nécessaire
• Cluster lancé de manière éphémère pour les traitements d’analyse de données
• Terminaison automatique
• Talend Studio & Integration Cloud
• Orchestration des actions
• Rapidité de mise en œuvre
• Automatisation des flux et des processus
Bénéfices attendus
18. 18
Flux de Données et de services
Compte Client
Amazon Redshift
Ingestion des évènements bruts
• Tous les clients
• Données de suivi de clics ou données
de consommation et d’utilisation.
Comportement
par utilisateur
Evénements
Quotidiens
o o o
Recommandations
Data Prep
<chaque nuit>
Recommandations
quotidiennes
Apport | Résultats
Charge incrémentale
et maintenance
<chaque nuit>
Elastic
MapReduce
Service
Cluster éphémère
E
Elastic Start
& Stop
Amazon
EMR
E
Elastic Start
& Stop
Amazon
Redshift
E
Etablir les
recommandations
Spark
Amazon
EMR
19. 19
• Start/Stop = réduction des coûts
• Payer à l’usage
• Accès en Self-service
• Prêt à l’emploi en quelques minutes
• Des actions disponibles dans l’Exchange
• Développer dans le studio, publier dans le cloud
• Agilité améliorée
• Des Cycles itératifs
• Un point unique pour développer et exploiter, facilement accessible
Que doit-on retenir ?
20. 20
L’analytique dans le Cloud, en temps réel & streaming
• Générer et orchestrer l’exécution de programmes Spark, dans le Cloud,
et connecter les flux de données en temps réel avec Kafka
• Elargir les cas d’usage Big Data au temps réel et les démocratiser dans
l’entreprise
• Permettre aux développeurs d’intégrer les flux temps réel Kafka dans
Spark pour des scénarios de machine learning
21. 21
Optimiser l’intégration Hybride
• Orchestrer la montée en puissance
des moteurs de traitement à
distance pour une performance
optimale
• Scheduling, monitoring, et gestion
des erreurs avancées
• L’IT peut automatiser et piloter des
scénarios d’intégration complexe
et hybride à partir d’un point
central
23. 23
• En savoir plus sur Talend Integration Cloud :
https://fr.talend.com/products/integration-cloud
• S’intéresser aux cas d’usage avec Amazon AWS Use Cases :
https://www.talend.com/products/integration-cloud/aws-integration
• Tester la solution : https://integrationcloud.talend.com/
Prochaines étapes & ressources
Questions?