1
©2016 Talend Inc
Big Data : au delà du proof of concept
et de l’expérimentation
Cas d’usage et trajectoires d’adoption
22006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
(Revenue Growth)
Data
Intégration
Master Data
Management
Data
Quality
Big Data
Application
Integration
Hadoop 2.0
Spark &
Cloud
Talend : une Histoire d’Innovation
1ère plate-forme unifiée pour la
data prep & l’intégration Data
Preparation
1er sur Spark
1er sur YARN &
Hadoop 2.0
1er plate-forme unifiée pour
le batch et le temps réel
1er ETL open source
• Notre mission : équiper
l’entreprise pilotée par les
données
• La plate-forme d’intégration
Big Data de référence sur la
marché
• Développement 10X plus
rapide
• Une unique solution pour le
batch et le streaming,
intégrant le machine
learning
3
La transformation digitale s’accélère
Source Gartner 2016
Entreprises Secteur Public
Quel pourcentage de votre chiffre d’affaire est digital ? Quel pourcentage de vos processus est digital ?
16%
25%
37%
22%
31%
41%
Aujourd'hui Dans 2 ans Dans 5 ans
CIO (n = 609) CEO (n = 400)
42%
60%
77%
Aujourd'hui Dans 2 ans Dans 5 ans
CIO (n = 344)
4
“Hier soir encore, vous pensiez être
dans une entreprise industrielle, ce
matin vous vous réveillez dans une
entreprise de software et d’analytique”
Jeff Immelt, chairman and CEO of GE
5
Les moteurs du changement
1. Global data created and copied annually to reach 44 trillion gigabytes by 2020. Source: IDC, 7th Annual IDC Digital Universe Study. April 2015.
2. Worldwide Public IT Cloud Services Revenue in 2019. Source: IDC, Worldwide and Regional Public IT Cloud Services Forecast, 2015-2019. December 2015.
3. “Data scientists spend up to 80% of their time preparing data for analysis.” Source: Sagence Consulting, What is Really Missing in Big Data ROI? February 2015.
4. 82% of organizations are in some phase of adopting real-time analytics or planning to within the next 12 months. Source: IDC, CloudView Survey 2016: Real-Time Analytics Adoption to Grow Rapidly, Especially for IoT,
March 2016.
La proliferation
des données
44
Trillion
Gigabytes1
Le Cloud
$141B
Public Cloud
Spend2
Le Temps réel
82%
Adopting
Real-Time4
Le Self-Service
80%
Time Preparing
Data3
6
Les principaux cas d’usages se précisent
Réinventer
le paysage IT
Rapprocher
le réel et le
numérique
Inventer de
nouveaux
services
Redéfinir
les parcours
clients
Créer de
nouveaux
marchés
 Lac de données
 Offloading
 Maintenance prédictive
 Villes et bâtiments intelligents
 Monétisation de l’information
 Assurance sur mesure
 Vues clients 360°
 Assistants intelligents
 Economie de fonctionnalité
 Economie collaborative
7
Un lac de données pour réinventer les
systèmes décisionnels, diminuer leurs
coûts et délais de déploiement, et
démocratiser leur accès, jusque sur le
terrain.
Quand le magasin devient data
driven
Intégrer la Business Intelligence
dans les processus opérationnels
Réinventer le paysage IT
8
Anticiper les pannes, planifier
les interventions et
diagnostiquer les problèmes
en 5 mins vs. 6 heures
24,000 capteurs permettent de
comprendre, de mieux résoudre et
même d’anticiper les pannes, évitant
les interruptions de service non
planifiés et les impacts financiers
associés.
http://www.usinenouvelle.com/article/le-big-data-anticipe-les-pannes-
de-l-a-380.N383711
Maintenance prédictive
dans l’industrie
Transformer les opérations grâce aux données
9
Cas Sidetrade
Permettre aux directions
financières d’optimiser leur
performance en délais de
paiement -accordés ou subis-
dans une approche fondée sur
l’analyse de données et non
sur une intuition.
Prévoir les comportements de paiements de
ses clients en s’appuyant sur le machine
learning et sur un historique détaillé de
plusieurs millions de transactions
Optimiser la gestion du cash-flow
et mieux maîtriser les recouvrements
Inventer de nouveaux services
10
75% de réduction du temps et
des coûts liés pour démarrer
le service chez un nouveau
client
Des assistants santé orientent vers le service
le mieux adapté, selon le profil du patient,
son problème, et les prestataires de services
accessibles contractuellement.
Personnalisation des services santé
et amélioration du parcours patient
Redéfinir les parcours client
11
Des laboratoires mobiles permettent
de collecter les informations multiples
sur le terrain et l’environnement et de
recommander le bon dosage d’engrais
pour optimiser la récolte.
Démocratiser l’adoption des
bonnes pratiques de production
en réduisant leur coût de mise
en œuvre par un facteur 10
Optimiser le rendement des
exploitations agricoles
Créer de nouveaux marchés
12
Accompagner la transformation numérique de l’expérimentation à la généralisation
Trajectoires d’adoption
Initialiser
le data lab
Aménager le
lac de données
Opérer l’entreprise
data-driven
Valeur
Seuil de
rentabilité
Proof of
concept
Projet
approuvé
Généra-
lisation
Transfor-
mation
13
La Plateforme moderne de données
Forrester: Create A Road Map For A Real-Time, Agile, Self-Service Data Platform
December 16, 2015
Phase 1: Supprimer les barrières informationelles
• Intégrer toutes les données
Phase 2: Eliminer les temps de latences
• Réduire les traitements différés et opérer en temps réel
Phase 3: Organiser la plate-forme pour un accès en self-service
• Faire évoluer la data governance
Phase 4: Généraliser l’ accès des données en temps reel et en self service
• Permettre à quiconque d’accéder à l’information en libre service
14
Une plate forme moderne pour le Big Data et le Cloud
Data Fabric
APPLICATION
INTEGRATION
CLOUD
INTEGRATION
DATA
INTEGRATION
DATA
PREPARATION
BIG DATA
INTEGRATION
MASTER DATA
MANAGEMENT
15
Talend Big Data Sandbox
• Un environnement rapide à installer et
prêt à l’emploi
• Un guide pour accompagner la phase de
découverte
• Des cas d’usage concrets pré-paramétrés
utilisant Spark, Kafka, MapReduce &
NoSQL
Le chemin le plus pour Hadoop, Spark et le Machine Learning
16
Analytique pour
l’internet des objets
Recommandations
Temps réel
Analyse
Clickstreams
Modernisation du
data warehouse
Analyse des performance
des joueurs en temps pour
les paris en ligne
Recommandation d’achat
personnalisé en temps
avec Machine Learning
Analyse du trafic web pour
la demand génération et le
placement média en ligne
Migration d’un data
warehouse vers Hadoop pour
augmenter la capacité de
traitement et réduire les coûts
17
Systèmes de suivi vidéo
Une série de caméras vidéos
autour du terrain enregistre les
positions des joueurs et de la balle
EN DIRECT
18
agréger la vitesse
et la distance
parcourue par
chaque joueur EN
TEMPS RÉEL
Notre but :
19
• Les caméras vidéos transmettent 25 images par seconde
• Chaque image enregistre les coordonnées x, y, z de chaque joueur
• Un flux de données sportives en temps réel ? Un vrai cas de Big Data !
Défis
20
Démonstration : Analytique pour l’internet des objets
Ingest Process Store VisualizeDeliver
Database
21
A vous de jouer avec Talend Big Data Sandbox
• Un environnement Docker pret à l’emploi
• Un guide pour accompagner la phase de
découverte
• Des scenarios réel utilisant Spark, Kafka,
MapReduce & NoSQL
www.talend.com/BigDataSandbox
Le chemin le plus pour Hadoop, Spark et le Machine Learning
22
©2016 Talend Inc
Big Data : au delà du proof of concept
et de l’expérimentation
Cas d’usage et trajectoires d’adoption

Big Data : au delà du proof of concept et de l'expérimentation (Matinale business decision 2016)

  • 1.
    1 ©2016 Talend Inc BigData : au delà du proof of concept et de l’expérimentation Cas d’usage et trajectoires d’adoption
  • 2.
    22006 2007 20082009 2010 2011 2012 2013 2014 2015 2016 (Revenue Growth) Data Intégration Master Data Management Data Quality Big Data Application Integration Hadoop 2.0 Spark & Cloud Talend : une Histoire d’Innovation 1ère plate-forme unifiée pour la data prep & l’intégration Data Preparation 1er sur Spark 1er sur YARN & Hadoop 2.0 1er plate-forme unifiée pour le batch et le temps réel 1er ETL open source • Notre mission : équiper l’entreprise pilotée par les données • La plate-forme d’intégration Big Data de référence sur la marché • Développement 10X plus rapide • Une unique solution pour le batch et le streaming, intégrant le machine learning
  • 3.
    3 La transformation digitales’accélère Source Gartner 2016 Entreprises Secteur Public Quel pourcentage de votre chiffre d’affaire est digital ? Quel pourcentage de vos processus est digital ? 16% 25% 37% 22% 31% 41% Aujourd'hui Dans 2 ans Dans 5 ans CIO (n = 609) CEO (n = 400) 42% 60% 77% Aujourd'hui Dans 2 ans Dans 5 ans CIO (n = 344)
  • 4.
    4 “Hier soir encore,vous pensiez être dans une entreprise industrielle, ce matin vous vous réveillez dans une entreprise de software et d’analytique” Jeff Immelt, chairman and CEO of GE
  • 5.
    5 Les moteurs duchangement 1. Global data created and copied annually to reach 44 trillion gigabytes by 2020. Source: IDC, 7th Annual IDC Digital Universe Study. April 2015. 2. Worldwide Public IT Cloud Services Revenue in 2019. Source: IDC, Worldwide and Regional Public IT Cloud Services Forecast, 2015-2019. December 2015. 3. “Data scientists spend up to 80% of their time preparing data for analysis.” Source: Sagence Consulting, What is Really Missing in Big Data ROI? February 2015. 4. 82% of organizations are in some phase of adopting real-time analytics or planning to within the next 12 months. Source: IDC, CloudView Survey 2016: Real-Time Analytics Adoption to Grow Rapidly, Especially for IoT, March 2016. La proliferation des données 44 Trillion Gigabytes1 Le Cloud $141B Public Cloud Spend2 Le Temps réel 82% Adopting Real-Time4 Le Self-Service 80% Time Preparing Data3
  • 6.
    6 Les principaux casd’usages se précisent Réinventer le paysage IT Rapprocher le réel et le numérique Inventer de nouveaux services Redéfinir les parcours clients Créer de nouveaux marchés  Lac de données  Offloading  Maintenance prédictive  Villes et bâtiments intelligents  Monétisation de l’information  Assurance sur mesure  Vues clients 360°  Assistants intelligents  Economie de fonctionnalité  Economie collaborative
  • 7.
    7 Un lac dedonnées pour réinventer les systèmes décisionnels, diminuer leurs coûts et délais de déploiement, et démocratiser leur accès, jusque sur le terrain. Quand le magasin devient data driven Intégrer la Business Intelligence dans les processus opérationnels Réinventer le paysage IT
  • 8.
    8 Anticiper les pannes,planifier les interventions et diagnostiquer les problèmes en 5 mins vs. 6 heures 24,000 capteurs permettent de comprendre, de mieux résoudre et même d’anticiper les pannes, évitant les interruptions de service non planifiés et les impacts financiers associés. http://www.usinenouvelle.com/article/le-big-data-anticipe-les-pannes- de-l-a-380.N383711 Maintenance prédictive dans l’industrie Transformer les opérations grâce aux données
  • 9.
    9 Cas Sidetrade Permettre auxdirections financières d’optimiser leur performance en délais de paiement -accordés ou subis- dans une approche fondée sur l’analyse de données et non sur une intuition. Prévoir les comportements de paiements de ses clients en s’appuyant sur le machine learning et sur un historique détaillé de plusieurs millions de transactions Optimiser la gestion du cash-flow et mieux maîtriser les recouvrements Inventer de nouveaux services
  • 10.
    10 75% de réductiondu temps et des coûts liés pour démarrer le service chez un nouveau client Des assistants santé orientent vers le service le mieux adapté, selon le profil du patient, son problème, et les prestataires de services accessibles contractuellement. Personnalisation des services santé et amélioration du parcours patient Redéfinir les parcours client
  • 11.
    11 Des laboratoires mobilespermettent de collecter les informations multiples sur le terrain et l’environnement et de recommander le bon dosage d’engrais pour optimiser la récolte. Démocratiser l’adoption des bonnes pratiques de production en réduisant leur coût de mise en œuvre par un facteur 10 Optimiser le rendement des exploitations agricoles Créer de nouveaux marchés
  • 12.
    12 Accompagner la transformationnumérique de l’expérimentation à la généralisation Trajectoires d’adoption Initialiser le data lab Aménager le lac de données Opérer l’entreprise data-driven Valeur Seuil de rentabilité Proof of concept Projet approuvé Généra- lisation Transfor- mation
  • 13.
    13 La Plateforme modernede données Forrester: Create A Road Map For A Real-Time, Agile, Self-Service Data Platform December 16, 2015 Phase 1: Supprimer les barrières informationelles • Intégrer toutes les données Phase 2: Eliminer les temps de latences • Réduire les traitements différés et opérer en temps réel Phase 3: Organiser la plate-forme pour un accès en self-service • Faire évoluer la data governance Phase 4: Généraliser l’ accès des données en temps reel et en self service • Permettre à quiconque d’accéder à l’information en libre service
  • 14.
    14 Une plate formemoderne pour le Big Data et le Cloud Data Fabric APPLICATION INTEGRATION CLOUD INTEGRATION DATA INTEGRATION DATA PREPARATION BIG DATA INTEGRATION MASTER DATA MANAGEMENT
  • 15.
    15 Talend Big DataSandbox • Un environnement rapide à installer et prêt à l’emploi • Un guide pour accompagner la phase de découverte • Des cas d’usage concrets pré-paramétrés utilisant Spark, Kafka, MapReduce & NoSQL Le chemin le plus pour Hadoop, Spark et le Machine Learning
  • 16.
    16 Analytique pour l’internet desobjets Recommandations Temps réel Analyse Clickstreams Modernisation du data warehouse Analyse des performance des joueurs en temps pour les paris en ligne Recommandation d’achat personnalisé en temps avec Machine Learning Analyse du trafic web pour la demand génération et le placement média en ligne Migration d’un data warehouse vers Hadoop pour augmenter la capacité de traitement et réduire les coûts
  • 17.
    17 Systèmes de suivividéo Une série de caméras vidéos autour du terrain enregistre les positions des joueurs et de la balle EN DIRECT
  • 18.
    18 agréger la vitesse etla distance parcourue par chaque joueur EN TEMPS RÉEL Notre but :
  • 19.
    19 • Les camérasvidéos transmettent 25 images par seconde • Chaque image enregistre les coordonnées x, y, z de chaque joueur • Un flux de données sportives en temps réel ? Un vrai cas de Big Data ! Défis
  • 20.
    20 Démonstration : Analytiquepour l’internet des objets Ingest Process Store VisualizeDeliver Database
  • 21.
    21 A vous dejouer avec Talend Big Data Sandbox • Un environnement Docker pret à l’emploi • Un guide pour accompagner la phase de découverte • Des scenarios réel utilisant Spark, Kafka, MapReduce & NoSQL www.talend.com/BigDataSandbox Le chemin le plus pour Hadoop, Spark et le Machine Learning
  • 22.
    22 ©2016 Talend Inc BigData : au delà du proof of concept et de l’expérimentation Cas d’usage et trajectoires d’adoption