L'environnement Spark change la donne pour les projets Big Data: accélération des prises de décisions et des temps de traitement grâce à l'in-memory ; intégration du décisionnel dans le transactionnel grâce aux architectures lambda ; temps réel et streaming ; machine learning. Le tout dans un environnement intégré. Reste à la prendre en main rapidement, mais aussi à s'en abstraire car il n'est sans doute pas la dernière innovation que l'on peut attendre dans le monde du Big Data en général et de Hadoop en particulier.
2. 2
2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
(Chiffre d’affaires)
Talend en bref
(estimation)
Hadoop 2.0
Cloud
Faits et chiffres
• Créé en 2006
• 500+ employés dans 7 pays
• 1700+ clients
• 2M+ téléchargement open source
• 108% CAGR
Big Data
Application
Integration
Master Data
Management
Data
QualityData
Integration
3. 3
avec Spark et Talend
5 moyens simples et rapides pour exploiter vos Big Data
Spark
Streaming
Architecture
Lambda
In Memory
Machine
Learning
Pas de code
Migration
en 1 click
Analyser avant d’agir, au
bon moment
Transformer les
données en décisions,
prescriptions et actions
Rester à la pointe de la
technologie sans efforts
Supprimer les temps de
latence quels que soient
les traitements à
appliquer
Exploiter la donnée dès
qu’elle vient
4. 4
Disposer de l’information en juste à temps
Supprimer les temps de latence grâce à l’in-memory
Case d’usage : Vers une approche plus dynamique du pricing
Pourquoi Spark et Talend :
· Développer rapidement des traitements massifs de données et augmenter
leur fréquence d’exécution
Augmentation de la performance des traitements batch
Utilisation du caching et du partitionnement
Tirer partie de la mémoire pour accélérer drastiquement les temps
de traitement
Résultats :
· Des ventes augmentées de 9%,
· Des rotations de stocks améliorées de 6%
· Une profitabilité améliorée de 5%.
http://www.blue-yonder.com/blog-e/2014/05/07/dynamic-pricing-critical-todays-multichannel-retailer/
5. 5
Avantage : Transformer les données de l’Internet des Objets en décisions
puis actions prises en temps réel grâce à une seule solution
z NoSQL
Messaging rapide, Ingestion à haut débit, Traitement
de données
Les usages de Spark Streaming pour l’Internet des objets
Exploiterla donnéedèsqu’ellevient
AMQP
6. 6
Les apports de l’architecture Lambda
Analyser avant d’agir, au bon moment
Mobile
Sensors
Web
Mobile App
Analytic App
Web App
Streaming
Batch
Query
Transform
Cleanse
Govern
Transform
Cleanse
Govern
Spark Streaming/Kafka
Spark
Spark
SQL
7. 7
Passer de l’analyse prédictive vers l’analyse prescriptive avec MLlib
• Cas d’usage typique:
personnalisation et
recommandation temps réel
• Bénéfices (source Venture Beat
Survey):
• Cas 1: contenu personnalisé sur site
web pour un nombre de page vues
augmenté de 300 %
• Cas 2: taux de conversion
augmenté de 219 percent.
Transformer les données en Décisions, Actions &
Prescriptions
Don-
nées
Intégrer
Appren
dre
Agir
avec
clairvo-
yance
Valeur
Alimenter
l’apprentissage
Appliquer le
modèle
Talend Big Data
Integration
& Quality
Machine learning et
analyse prédictive
Talend Real Time Big
Data integration
Puissance de
traitement des
données dans Spark
MLlib et Spark R
Spark streaming
et modèle de machine
learning
opérationnalisé
Solution
9. 9
Passer de MapReduce vers Spark en un clic grâce à Talend !
Performance
MapReduce
(fonctionnent sur
disque)
Un
Clic
Performance
Spark
(fonctionnement en mémoire
et sur disc)
5X
plus
rapide
10. 10
Tenez vous prêts pour le « Next Big Thing »
Un
Click
Spark
Next Big Thing
Next Big Thing
la prochaine
innovation