Concrétiser les promesses du Big Data avec Hadoop, le Self-Service, les data lakes et le machine learning. Quels cas d'usage, quels retours d'expérience, quelle plate-forme?
2. 22006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
(Revenue Growth)
Data
Intégration
Master Data
Management
Data
Quality
Big Data
Application
Integration
Hadoop 2.0
Spark &
Cloud
Talend : une Histoire d’Innovation
1ère plate-forme unifiée pour la
data prep & l’intégration Data
Preparation
1er sur Spark
1er sur YARN &
Hadoop 2.0
1er plate-forme unifiée pour
le batch et le temps réel
1er ETL open source
• Notre mission : équiper
l’entreprise pilotée par les
données
• La plate-forme d’intégration
Big Data de référence sur la
marché
• Développement 10X plus
rapide
• Une unique solution pour le
batch et le streaming,
intégrant le machine
learning
3. 3
La transformation digitale s’accélère
Source Gartner 2016
Entreprises Secteur Public
Quel pourcentage de votre chiffre d’affaire est digital ? Quel pourcentage de vos processus est digital ?
16%
25%
37%
22%
31%
41%
Aujourd'hui Dans 2 ans Dans 5 ans
CIO (n = 609) CEO (n = 400)
42%
60%
77%
Aujourd'hui Dans 2 ans Dans 5 ans
CIO (n = 344)
4. 4
“Hier soir encore, vous pensiez être
dans une entreprise industrielle, ce
matin vous vous réveillez dans une
entreprise de software et d’analytique”
Jeff Immelt, chairman and CEO of GE
5. 5
Les moteurs du changement
1. Global data created and copied annually to reach 44 trillion gigabytes by 2020. Source: IDC, 7th Annual IDC Digital Universe Study. April 2015.
2. Worldwide Public IT Cloud Services Revenue in 2019. Source: IDC, Worldwide and Regional Public IT Cloud Services Forecast, 2015-2019. December 2015.
3. “Data scientists spend up to 80% of their time preparing data for analysis.” Source: Sagence Consulting, What is Really Missing in Big Data ROI? February 2015.
4. 82% of organizations are in some phase of adopting real-time analytics or planning to within the next 12 months. Source: IDC, CloudView Survey 2016: Real-Time Analytics Adoption to Grow Rapidly, Especially for IoT,
March 2016.
La proliferation
des données
44
Trillion
Gigabytes1
Le Cloud
$141B
Public Cloud
Spend2
Le Temps réel
82%
Adopting
Real-Time4
Le Self-Service
80%
Time Preparing
Data3
6. 6
Les principaux cas d’usages se précisent
Réinventer
le paysage IT
Rapprocher
le réel et le
numérique
Inventer de
nouveaux
services
Redéfinir
les parcours
clients
Créer de
nouveaux
marchés
Lac de données
Offloading
Maintenance prédictive
Villes et bâtiments intelligents
Monétisation de l’information
Assurance sur mesure
Vues clients 360°
Assistants intelligents
Economie de fonctionnalité
Economie collaborative
7. 7
Un lac de données pour réinventer les
systèmes décisionnels, diminuer leurs
coûts et délais de déploiement, et
démocratiser leur accès, jusque sur le
terrain.
Quand le magasin devient data
driven
Intégrer la Business Intelligence
dans les processus opérationnels
Réinventer le paysage IT
8. 8
Anticiper les pannes, planifier
les interventions et
diagnostiquer les problèmes
en 5 mins vs. 6 heures
24,000 capteurs permettent de
comprendre, de mieux résoudre et
même d’anticiper les pannes, évitant
les interruptions de service non
planifiés et les impacts financiers
associés.
http://www.usinenouvelle.com/article/le-big-data-anticipe-les-pannes-
de-l-a-380.N383711
Maintenance prédictive
dans l’industrie
Transformer les opérations grâce aux données
9. 9
Cas Sidetrade
Permettre aux directions
financières d’optimiser leur
performance en délais de
paiement -accordés ou subis-
dans une approche fondée sur
l’analyse de données et non
sur une intuition.
Prévoir les comportements de paiements de
ses clients en s’appuyant sur le machine
learning et sur un historique détaillé de
plusieurs millions de transactions
Optimiser la gestion du cash-flow
et mieux maîtriser les recouvrements
Inventer de nouveaux services
10. 10
75% de réduction du temps et
des coûts liés pour démarrer
le service chez un nouveau
client
Des assistants santé orientent vers le service
le mieux adapté, selon le profil du patient,
son problème, et les prestataires de services
accessibles contractuellement.
Personnalisation des services santé
et amélioration du parcours patient
Redéfinir les parcours client
11. 11
Des laboratoires mobiles permettent
de collecter les informations multiples
sur le terrain et l’environnement et de
recommander le bon dosage d’engrais
pour optimiser la récolte.
Démocratiser l’adoption des
bonnes pratiques de production
en réduisant leur coût de mise
en œuvre par un facteur 10
Optimiser le rendement des
exploitations agricoles
Créer de nouveaux marchés
12. 12
Accompagner la transformation numérique de l’expérimentation à la généralisation
Trajectoires d’adoption
Initialiser
le data lab
Aménager le
lac de données
Opérer l’entreprise
data-driven
Valeur
Seuil de
rentabilité
Proof of
concept
Projet
approuvé
Généra-
lisation
Transfor-
mation
13. 13
La Plateforme moderne de données
Forrester: Create A Road Map For A Real-Time, Agile, Self-Service Data Platform
December 16, 2015
Phase 1: Supprimer les barrières informationelles
• Intégrer toutes les données
Phase 2: Eliminer les temps de latences
• Réduire les traitements différés et opérer en temps réel
Phase 3: Organiser la plate-forme pour un accès en self-service
• Faire évoluer la data governance
Phase 4: Généraliser l’ accès des données en temps reel et en self service
• Permettre à quiconque d’accéder à l’information en libre service
14. 14
Une plate forme moderne pour le Big Data et le Cloud
Data Fabric
APPLICATION
INTEGRATION
CLOUD
INTEGRATION
DATA
INTEGRATION
DATA
PREPARATION
BIG DATA
INTEGRATION
MASTER DATA
MANAGEMENT
15. 15
Talend Big Data Sandbox
• Un environnement rapide à installer et
prêt à l’emploi
• Un guide pour accompagner la phase de
découverte
• Des cas d’usage concrets pré-paramétrés
utilisant Spark, Kafka, MapReduce &
NoSQL
Le chemin le plus pour Hadoop, Spark et le Machine Learning
16. 16
Analytique pour
l’internet des objets
Recommandations
Temps réel
Analyse
Clickstreams
Modernisation du
data warehouse
Analyse des performance
des joueurs en temps pour
les paris en ligne
Recommandation d’achat
personnalisé en temps
avec Machine Learning
Analyse du trafic web pour
la demand génération et le
placement média en ligne
Migration d’un data
warehouse vers Hadoop pour
augmenter la capacité de
traitement et réduire les coûts
17. 17
Systèmes de suivi vidéo
Une série de caméras vidéos
autour du terrain enregistre les
positions des joueurs et de la balle
EN DIRECT
19. 19
• Les caméras vidéos transmettent 25 images par seconde
• Chaque image enregistre les coordonnées x, y, z de chaque joueur
• Un flux de données sportives en temps réel ? Un vrai cas de Big Data !
Défis
21. 21
A vous de jouer avec Talend Big Data Sandbox
• Un environnement Docker pret à l’emploi
• Un guide pour accompagner la phase de
découverte
• Des scenarios réel utilisant Spark, Kafka,
MapReduce & NoSQL
www.talend.com/BigDataSandbox
Le chemin le plus pour Hadoop, Spark et le Machine Learning