SlideShare une entreprise Scribd logo
1  sur  54
Télécharger pour lire hors ligne
© Soft Computing – www.softcomputing.com
Big Data by Soft Computing
Big Data, tout le monde en parle…
Soft Computing le pratique au quotidien : concepts, outils, applications marketing, retours d’expérience.
12/06/2015
© 3
Merci de votre présence
Sylvain BELLIER
Directeur du pôle Marketing
Services Soft Computing
© 4
SOMMAIRESommaire
1. Introduction
2. Big Data : le décor
3. Big Data : quoi de neuf ?
4. Analyses : évolutions des usages et méthodes
5. Organisation et outillage
6. Illustration sur un cas concret
7. Pour conclure
© 5
Compétences InterlocuteursPrestations Modalités Marchés
Data
Science
Information
Technologies
Direction Digital,
Marketing, Data
IT
AMOA
Think
Build
Run
Délégation
d’expertise
Mode projet
Centre de
services
Digital
Marketing
Clients : 80% des
F500 Français
12 pays servis
Expertises
Sectorielles
Retail
FinanceServices
Industrie
Carte d’identité : spécialiste Digital, Big Data & CRM
Spécialiste
Digital : 12,6 M€
Big Data: 11 M€
CRM: 14,5 M€
© 6
Big Data : ça reste à mode
© 7
Oui, mais on aborde la vallée des désillusions
Big Data
© 8
Du vécu métier
2003 2015
Web mining
15 M Clients
5 ans
Recommandations
Temps réel
Réseaux
d’influence
Analyse de
sentiments
50 To+
© 9
Du recul aussi sur le plan technique
© 10
Mais également de l’humilité…
© 11
SOMMAIRESommaire
1. Introduction
2. Big Data : le décor
3. Big Data : quoi de neuf ?
4. Analyses : évolutions des usages et méthodes
5. Organisation et outillage
6. Illustration sur un cas concret
7. Pour conclure
© 12
Défi technique #1 : se préparer à gérer des volumes inimaginables
2005 2015
© 13
Défi technique #2 : sortir de la quadrature du triangle
2005 2015
Disponibilité
« Les données sont
toujours accessibles »
Tolérance
« seul la panne
totale interromp »
Cohérence
« Les commits
rendent
l’ensemble des
données
cohérentes »
Disponibilité
« Les données sont
toujours accessibles »
Tolérance
« seul la panne
totale interromp »
Cohérence
« Les commits
rendent
l’ensemble des
données
cohérentes »
Commit en
2 phases
© 14
Défi technique #3 : exécuter tout calcul en moins de 0,14
secondes
2005 2015
Trading Desk
(ATD)
Editeur de
site
Demand Side
Platform
(DSP)
Ad exchange
(Adex)
Supply Side
Platform
(SSP)
Annonceur
ou Agence
média
Ad Server de
l’éditeur ou
Ad network
RTB &
programmati
que
© 16
Un segment (sur?) peuplé
Xaas
Hardware
Projets Open SourceDistributions
Données AnalyseVisualisation Application
EMR
Bigquery
Professionnal services (tec & biz)
© 17
Les grandes familles NoSQL
SQL
Cohérence
indispensable
Relationnel
Oracle, SQL
Server, DB2…
Clé-
valeur
Structure simple
Stockage clé
valeur
Dynamodb, Redis,
Riak, MS Azure
table, Oracle
NoSQL
Colonnes
Analytique
Stockage en
colonne pour des
recherches
rapides
Bigtable,
Cassandra,
Hbase, Hadoop
Document
Structure
complexe, temps
de réponse
Clé-valeur avec
de multiples
attributs (semi-
structuré (XML…)
Couchdb,
Mongodb
Autres
Hérarchiques
(ldap…), Graph
(Neoj4…), OODB
(Versant…)
Principes techniques :
• Shared-nothing
• Schemaless
• Interfaces Restful simples
Avantages :
• Evolutivité des schémas
• Scalabilité horizontale
• Protocoles simples
Inconvénients :
• Requêtes plus complexes
• Pas de cohérence garantie
• Pas de clé unique garantie
© 18
Les caractéristiques communes
Nosql
Non-
relationnel
Evolutivité
horizontale
Traitement
distribué
Débit rapide
Matériel
banalisé
Haute
disponibilité
Tolérance
Cohérence
éventuelle
© 19
Trouver un nouvel équilibre
« Since the inception of ebay,
not a single data was
deleted ! »
Meg Whitman, DG eBay
« Toute donnée stockée doit
être justifiée par un
traitement »
Mon DSI
« Où mettre le
curseur entre ces
deux extrêmes ? »
© 20
SOMMAIRESommaire
1. Introduction
2. Big Data : le décor
3. Big Data : quoi de neuf ?
4. Analyses : évolutions des usages et méthodes
5. Organisation et outillage
6. Illustration sur un cas concret
7. Pour conclure
© 21
Big data 2015
Démocratisation
© 22
Démocratisation hardware
5 nœuds
1 namenode, 20 cœurs, 192 Go ram
4 datanodes, 64 cœurs, 64 Gb ram, 10 To DD
© 23
Démocratisation : stockage
© 24
Démocratisation : outils de datavisualisation
© 25
Démocratisation : de plus en plus de données en libre service
© 26
Démocratisation : de plus en plus de données à coût modique
© 27
Démocratisation : analytique ML en cloud
© 28
Démocratisation : ML « as a service »
© 29
Impact sur les usages : notre synthèse
+
Données
Détail
Temps réel
Prédictif
Non-
structuré
Ouvert sur
l’extérieur
Autonome
Hybride
© 30
Données Détail
Elément de structure
Région
Segment
Bonne
gamme
Client
Mr XXX
Contrat
Compte
courant
Ecriture
Code
commerçant
© 31
Décisionnel
analytique
Temps réel
Transaction
opérationnelle
Evénements
Traitement
métier
Stockage
données
Interception à
la source
Analyse
Ex : page vue, ….
Ex : display
Résultats AlerteEx : RTB
© 32
Non-structuré
Streams sociaux Weblogs Capteurs E-mails
Détail transactions Pages web Documents scannés Trace GPS
Données boursières Enregistrements
téléphoniques
Video-surveillance Données d’usage
© 33
Autonome
© 34
HybrideSystèmessources
SystèmesbancairesdeproductionExternes
ETL Appliance
Entrepôt
Vision unique
du client
Datamarts
Sandbox
Entrepôt Hadoop
Usages
Reporting
Tableaux de
bord
Cubes OLAP
Statistique
(SAS...)
Systèmes
front-end
Base
métier
Données de référence
Synthèses transactions
Données externes
structurées
Données externes
peu structurées
Données
volumétrie importante
Réintégration données
après pré-traitement
Sasde
sécurité
Accès
Accès
Accès
Données externes
à la demande
Eléments de ciblage (dont scores)
Extractions Métiers (dont scores, segmentations...)
Base
métier
Base
métier
Base
métier
Base
métier
Base
métier
Web Services
Services temps réel
À destination des front-end
© 35
SOMMAIRESommaire
1. Introduction
2. Big Data : le décor
3. Big Data : quoi de neuf ?
4. Analyses : évolutions des usages et méthodes
5. Organisation et outillage
6. Illustration sur un cas concret
7. Pour conclure
© 36
Les nouveaux besoins d’analyse
Améliorer la performance
de détection / de prévision
avec des données exogènes
Agilité, pertinence, auto
apprentissage
Personnalisation one to oneIdentifier et optimiser les
parcours omnicanaux
© 37
Les nouvelles méthodologies utilisées
Random Forest
Boosting Gradient
Machine
Textmining/
Voicemining
Réseau Bayesien
Support Vector
Machines
Sequential Pattern
Analysis
© 38
SOMMAIRESommaire
1. Introduction
2. Big Data : le décor
3. Big Data : quoi de neuf ?
4. Analyses : évolutions des usages et méthodes
5. Organisation et outillage
6. Illustration sur un cas concret
7. Pour conclure
© 39
Où est quoi : architecture générale
Big data : données
chaudes
Big data : données
froides
Dataware : données
structurées
Agrégatsdesignauxforts
DonnéesCRM&mémoirecourte
Historique
Prédictif
Données CRM
Prédictif & signaux forts
© 40
Cohabitation Datawarehouse et big data
Connecteurs
SQL
Loader
(import/export)
© 41
Outillage : exemples
Query BI Dataviz Statistique Machine
learning
Script Langage Environne
ment
Couche d’accès
© 42
Connecteurs
Loader
Couche d’accès
Query
StockerExplorerTransformerModéliserAppliquer
BI Dataviz Statistique Machine
learning
Script Langage Environne
ment
Fonctions * outillage
© 43
Compétences * fonctions
MarketingDatascience Programmation
Stocker
Explorer
Transformer
Modéliser
Appliquer
© 44
SOMMAIRESommaire
1. Introduction
2. Big Data : le décor
3. Big Data : quoi de neuf ?
4. Analyses : évolutions des usages et méthodes
5. Organisation et outillage
6. Illustration sur un cas concret
7. Pour conclure
© 45
Exemple de problématique
© 46
Solution fonctionnelle
Prototyper l’algorithme de
substitution
Produire la matrice
d’association
Suivre et optimiser la
performance l’algorithme
Proposer des susbstitutions
Intégrer l’algorithme de
substitution
Développer l’algorithme de
substitution
algorithme
Algorithme
« industrialisé »
Matrice
d’association
Historique des propositions
Référentiels
produit
Scan list
Programme
de production des
matrices
d’associations
Hub
Produits
éligibles
EAN
substituts
© 47
Architecture
Lab data Large Data Fast Data
Prototyper l’algorithme de
substitution
Produire la matrice
d’association
Suivre et optimiser la
performance l’algorithme
Proposer des substitutions
Intégrer l’algorithme de
substitution
Développer l’algorithme de
substitution
© 48
Lab data Large Data Fast Data
© 49
Planning
Run
Initialisation du centre de services
Conception et réalisation « large »
Maintenance
Monitoring applications
Administration
Gestion des projets de setup
Gestion du centre de servicesProgram Management
Gestion des projets d’évolutions
BusinessIT
Gestiondeprojetet
deservices
Setup
Sprints algorithme sur le
« lab »
Mise en place
architecture
Définition du SLA
Conception et réalisation « fast »
Tests
Sprints d’amélioration algorithme sur le « lab »
Surveillance de la santé de l’algorithme « lab »
Infra
Hard & soft
Hébergement et monitoring
Data
exploration
M1 M2 M3 M4 M5
© 50
SOMMAIRESommaire
1. Introduction
2. Big Data : le décor
3. Big Data : quoi de neuf ?
4. Analyses : évolutions des usages et méthodes
5. Organisation et outillage
6. Illustration sur un cas concret
7. Pour conclure
© 51
R.O.I.
Connaissance Datamining
Assortiments en magasins
Rapports
Rapports industriels
Données : vision 360° client et produit
Campagnes ciblées
Technologies
1
2
3
4
Business Driven
© 52
Best-of-breed intégré et verticalisé avec IBM
Outils
© 53
Cibler des R.O.I. < 6 mois
© 54
Reconsidérer chaque
année les ROI : les
barrières à l’entrée
baissent toujours plus
© 55
Offre de services
S
ensibilisation
tratégie
andbox
R
oadmap
ollout
un
© 56

Contenu connexe

Tendances

Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de RecommandationSoft Computing
 
Outils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation CommercialeOutils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation CommercialeSoft Computing
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SASSoft Computing
 
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...Soft Computing
 
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et DélivrabilitéSoft Computing
 
05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik SenseSoft Computing
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client UniqueSoft Computing
 
Du datamining à la datascience
Du datamining à la datascienceDu datamining à la datascience
Du datamining à la datascienceSoft Computing
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing
 
Du Data Mining à la Data Science
Du Data Mining à la Data ScienceDu Data Mining à la Data Science
Du Data Mining à la Data ScienceSoft Computing
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleSoft Computing
 
25/01/18 Matinale Data Science
25/01/18 Matinale Data Science25/01/18 Matinale Data Science
25/01/18 Matinale Data ScienceSoft Computing
 
06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation ProgramSoft Computing
 
17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation OmnicanalSoft Computing
 
Réseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et DigitalRéseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et DigitalSoft Computing
 
07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience ClientSoft Computing
 

Tendances (20)

Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de Recommandation
 
Outils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation CommercialeOutils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
 
Séminaire RCU
Séminaire RCUSéminaire RCU
Séminaire RCU
 
Données Personnelles
Données PersonnellesDonnées Personnelles
Données Personnelles
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SAS
 
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
 
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
 
05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique
 
Data Science
Data ScienceData Science
Data Science
 
Du datamining à la datascience
Du datamining à la datascienceDu datamining à la datascience
Du datamining à la datascience
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
Du Data Mining à la Data Science
Du Data Mining à la Data ScienceDu Data Mining à la Data Science
Du Data Mining à la Data Science
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence Artificielle
 
25/01/18 Matinale Data Science
25/01/18 Matinale Data Science25/01/18 Matinale Data Science
25/01/18 Matinale Data Science
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
 
06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program
 
17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal
 
Réseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et DigitalRéseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et Digital
 
07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client
 

En vedette

La Terra Chaleco 7 A 5 Y 22
La Terra Chaleco 7 A 5 Y 22La Terra Chaleco 7 A 5 Y 22
La Terra Chaleco 7 A 5 Y 22guest768b206
 
Aplicar género en politicas publicas
Aplicar género en politicas publicasAplicar género en politicas publicas
Aplicar género en politicas publicasTeresa Chara
 
Association oasis-2013
Association oasis-2013Association oasis-2013
Association oasis-2013Hop'Toys
 
AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...
AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...
AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...Javier Buron Cuadrado
 
P R E S E N T A C I O N Reglamento Trabajos De Grado Exp 19 De Junio
P R E S E N T A C I O N  Reglamento Trabajos De Grado Exp 19 De JunioP R E S E N T A C I O N  Reglamento Trabajos De Grado Exp 19 De Junio
P R E S E N T A C I O N Reglamento Trabajos De Grado Exp 19 De JunioSeminario
 
CONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENT
CONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENTCONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENT
CONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENTLuis Chaquea
 
SONIDO DE DIAPOSITIVAS
SONIDO DE DIAPOSITIVASSONIDO DE DIAPOSITIVAS
SONIDO DE DIAPOSITIVASGuiller Vall
 
noraluz.com Floristería
noraluz.com Floristeríanoraluz.com Floristería
noraluz.com Floristeríanoraluzm
 
Estrategia Empresarial
Estrategia EmpresarialEstrategia Empresarial
Estrategia Empresarialguest8386ae
 
SAS Forums Soft Computing Big Data Applications Marketing
SAS Forums Soft Computing Big Data Applications MarketingSAS Forums Soft Computing Big Data Applications Marketing
SAS Forums Soft Computing Big Data Applications MarketingSoft Computing
 
Diapositivas Cetares
Diapositivas CetaresDiapositivas Cetares
Diapositivas CetaresA4g
 

En vedette (20)

La Terra Chaleco 7 A 5 Y 22
La Terra Chaleco 7 A 5 Y 22La Terra Chaleco 7 A 5 Y 22
La Terra Chaleco 7 A 5 Y 22
 
Aplicar género en politicas publicas
Aplicar género en politicas publicasAplicar género en politicas publicas
Aplicar género en politicas publicas
 
Kalos
KalosKalos
Kalos
 
Association oasis-2013
Association oasis-2013Association oasis-2013
Association oasis-2013
 
AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...
AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...
AYUNTAMIENTO ERENTERRIA: ENERGÍA Y AYUNTAMIENTOS: AHORRO Y NUEVOS INGRESOS PU...
 
P R E S E N T A C I O N Reglamento Trabajos De Grado Exp 19 De Junio
P R E S E N T A C I O N  Reglamento Trabajos De Grado Exp 19 De JunioP R E S E N T A C I O N  Reglamento Trabajos De Grado Exp 19 De Junio
P R E S E N T A C I O N Reglamento Trabajos De Grado Exp 19 De Junio
 
practica
practicapractica
practica
 
CONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENT
CONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENTCONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENT
CONOCIENDO LINKEDIN Y MEJORANDO ENGAGEMENT
 
Sin Amor
Sin AmorSin Amor
Sin Amor
 
SONIDO DE DIAPOSITIVAS
SONIDO DE DIAPOSITIVASSONIDO DE DIAPOSITIVAS
SONIDO DE DIAPOSITIVAS
 
noraluz.com Floristería
noraluz.com Floristeríanoraluz.com Floristería
noraluz.com Floristería
 
Liderazgo
LiderazgoLiderazgo
Liderazgo
 
Estrategia Empresarial
Estrategia EmpresarialEstrategia Empresarial
Estrategia Empresarial
 
PresentacióN1
PresentacióN1PresentacióN1
PresentacióN1
 
Sistema De EvaluacióN
Sistema De EvaluacióNSistema De EvaluacióN
Sistema De EvaluacióN
 
Metacognitivas
MetacognitivasMetacognitivas
Metacognitivas
 
Planos DiagnóSticos En SupervisióN 1
Planos DiagnóSticos En SupervisióN 1Planos DiagnóSticos En SupervisióN 1
Planos DiagnóSticos En SupervisióN 1
 
SAS Forums Soft Computing Big Data Applications Marketing
SAS Forums Soft Computing Big Data Applications MarketingSAS Forums Soft Computing Big Data Applications Marketing
SAS Forums Soft Computing Big Data Applications Marketing
 
Diapositivas Cetares
Diapositivas CetaresDiapositivas Cetares
Diapositivas Cetares
 
Tierra
TierraTierra
Tierra
 

Similaire à Big Data by Soft Computing - Lille

29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale PythonSoft Computing
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationDenodo
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Denodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie APIDenodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie APIDenodo
 
Neo4j et ses cas d'usages
Neo4j et ses cas d'usagesNeo4j et ses cas d'usages
Neo4j et ses cas d'usagesNeo4j
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Plateforme digitale services et technologies
Plateforme digitale   services et technologiesPlateforme digitale   services et technologies
Plateforme digitale services et technologiesWilliam Poos
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jNeo4j
 
Neo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métierNeo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métierNeo4j
 
Offrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicOffrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicJean-Michel Franco
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...OCTO Technology
 
compu Base - comment trouver les bon partenaires?
compu Base - comment trouver les bon partenaires?compu Base - comment trouver les bon partenaires?
compu Base - comment trouver les bon partenaires?Jack Mandard
 
SkySight : une nouvelle génération de services d’orchestration des solutions ...
SkySight : une nouvelle génération de services d’orchestration des solutions ...SkySight : une nouvelle génération de services d’orchestration des solutions ...
SkySight : une nouvelle génération de services d’orchestration des solutions ...Microsoft Ideas
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jNeo4j
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Denodo
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...OCTO Technology
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 

Similaire à Big Data by Soft Computing - Lille (20)

29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale Python
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Denodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie APIDenodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie API
 
Neo4j et ses cas d'usages
Neo4j et ses cas d'usagesNeo4j et ses cas d'usages
Neo4j et ses cas d'usages
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Plateforme digitale services et technologies
Plateforme digitale   services et technologiesPlateforme digitale   services et technologies
Plateforme digitale services et technologies
 
Big Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internetBig Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internet
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4j
 
Neo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métierNeo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métier
 
Offrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicOffrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clic
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
 
compu Base - comment trouver les bon partenaires?
compu Base - comment trouver les bon partenaires?compu Base - comment trouver les bon partenaires?
compu Base - comment trouver les bon partenaires?
 
SkySight : une nouvelle génération de services d’orchestration des solutions ...
SkySight : une nouvelle génération de services d’orchestration des solutions ...SkySight : une nouvelle génération de services d’orchestration des solutions ...
SkySight : une nouvelle génération de services d’orchestration des solutions ...
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4j
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 

Plus de Soft Computing

23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS EnrichiSoft Computing
 
28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation ClientSoft Computing
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données PersonnellesSoft Computing
 
Séminaire Expérience Client
Séminaire Expérience ClientSéminaire Expérience Client
Séminaire Expérience ClientSoft Computing
 
La Gouvernance des Données
La Gouvernance des DonnéesLa Gouvernance des Données
La Gouvernance des DonnéesSoft Computing
 
Matinale Technologique Adobe Campaign
Matinale Technologique Adobe CampaignMatinale Technologique Adobe Campaign
Matinale Technologique Adobe CampaignSoft Computing
 
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelCRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelSoft Computing
 

Plus de Soft Computing (10)

23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi
 
28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles
 
Phygital
PhygitalPhygital
Phygital
 
Séminaire Expérience Client
Séminaire Expérience ClientSéminaire Expérience Client
Séminaire Expérience Client
 
La Gouvernance des Données
La Gouvernance des DonnéesLa Gouvernance des Données
La Gouvernance des Données
 
Matinale Technologique Adobe Campaign
Matinale Technologique Adobe CampaignMatinale Technologique Adobe Campaign
Matinale Technologique Adobe Campaign
 
Expérience Client
Expérience ClientExpérience Client
Expérience Client
 
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelCRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
 
Digital In Store
Digital In StoreDigital In Store
Digital In Store
 

Big Data by Soft Computing - Lille

  • 1. © Soft Computing – www.softcomputing.com Big Data by Soft Computing Big Data, tout le monde en parle… Soft Computing le pratique au quotidien : concepts, outils, applications marketing, retours d’expérience. 12/06/2015
  • 2. © 3 Merci de votre présence Sylvain BELLIER Directeur du pôle Marketing Services Soft Computing
  • 3. © 4 SOMMAIRESommaire 1. Introduction 2. Big Data : le décor 3. Big Data : quoi de neuf ? 4. Analyses : évolutions des usages et méthodes 5. Organisation et outillage 6. Illustration sur un cas concret 7. Pour conclure
  • 4. © 5 Compétences InterlocuteursPrestations Modalités Marchés Data Science Information Technologies Direction Digital, Marketing, Data IT AMOA Think Build Run Délégation d’expertise Mode projet Centre de services Digital Marketing Clients : 80% des F500 Français 12 pays servis Expertises Sectorielles Retail FinanceServices Industrie Carte d’identité : spécialiste Digital, Big Data & CRM Spécialiste Digital : 12,6 M€ Big Data: 11 M€ CRM: 14,5 M€
  • 5. © 6 Big Data : ça reste à mode
  • 6. © 7 Oui, mais on aborde la vallée des désillusions Big Data
  • 7. © 8 Du vécu métier 2003 2015 Web mining 15 M Clients 5 ans Recommandations Temps réel Réseaux d’influence Analyse de sentiments 50 To+
  • 8. © 9 Du recul aussi sur le plan technique
  • 9. © 10 Mais également de l’humilité…
  • 10. © 11 SOMMAIRESommaire 1. Introduction 2. Big Data : le décor 3. Big Data : quoi de neuf ? 4. Analyses : évolutions des usages et méthodes 5. Organisation et outillage 6. Illustration sur un cas concret 7. Pour conclure
  • 11. © 12 Défi technique #1 : se préparer à gérer des volumes inimaginables 2005 2015
  • 12. © 13 Défi technique #2 : sortir de la quadrature du triangle 2005 2015 Disponibilité « Les données sont toujours accessibles » Tolérance « seul la panne totale interromp » Cohérence « Les commits rendent l’ensemble des données cohérentes » Disponibilité « Les données sont toujours accessibles » Tolérance « seul la panne totale interromp » Cohérence « Les commits rendent l’ensemble des données cohérentes » Commit en 2 phases
  • 13. © 14 Défi technique #3 : exécuter tout calcul en moins de 0,14 secondes 2005 2015 Trading Desk (ATD) Editeur de site Demand Side Platform (DSP) Ad exchange (Adex) Supply Side Platform (SSP) Annonceur ou Agence média Ad Server de l’éditeur ou Ad network RTB & programmati que
  • 14. © 16 Un segment (sur?) peuplé Xaas Hardware Projets Open SourceDistributions Données AnalyseVisualisation Application EMR Bigquery Professionnal services (tec & biz)
  • 15. © 17 Les grandes familles NoSQL SQL Cohérence indispensable Relationnel Oracle, SQL Server, DB2… Clé- valeur Structure simple Stockage clé valeur Dynamodb, Redis, Riak, MS Azure table, Oracle NoSQL Colonnes Analytique Stockage en colonne pour des recherches rapides Bigtable, Cassandra, Hbase, Hadoop Document Structure complexe, temps de réponse Clé-valeur avec de multiples attributs (semi- structuré (XML…) Couchdb, Mongodb Autres Hérarchiques (ldap…), Graph (Neoj4…), OODB (Versant…) Principes techniques : • Shared-nothing • Schemaless • Interfaces Restful simples Avantages : • Evolutivité des schémas • Scalabilité horizontale • Protocoles simples Inconvénients : • Requêtes plus complexes • Pas de cohérence garantie • Pas de clé unique garantie
  • 16. © 18 Les caractéristiques communes Nosql Non- relationnel Evolutivité horizontale Traitement distribué Débit rapide Matériel banalisé Haute disponibilité Tolérance Cohérence éventuelle
  • 17. © 19 Trouver un nouvel équilibre « Since the inception of ebay, not a single data was deleted ! » Meg Whitman, DG eBay « Toute donnée stockée doit être justifiée par un traitement » Mon DSI « Où mettre le curseur entre ces deux extrêmes ? »
  • 18. © 20 SOMMAIRESommaire 1. Introduction 2. Big Data : le décor 3. Big Data : quoi de neuf ? 4. Analyses : évolutions des usages et méthodes 5. Organisation et outillage 6. Illustration sur un cas concret 7. Pour conclure
  • 19. © 21 Big data 2015 Démocratisation
  • 20. © 22 Démocratisation hardware 5 nœuds 1 namenode, 20 cœurs, 192 Go ram 4 datanodes, 64 cœurs, 64 Gb ram, 10 To DD
  • 22. © 24 Démocratisation : outils de datavisualisation
  • 23. © 25 Démocratisation : de plus en plus de données en libre service
  • 24. © 26 Démocratisation : de plus en plus de données à coût modique
  • 25. © 27 Démocratisation : analytique ML en cloud
  • 26. © 28 Démocratisation : ML « as a service »
  • 27. © 29 Impact sur les usages : notre synthèse + Données Détail Temps réel Prédictif Non- structuré Ouvert sur l’extérieur Autonome Hybride
  • 28. © 30 Données Détail Elément de structure Région Segment Bonne gamme Client Mr XXX Contrat Compte courant Ecriture Code commerçant
  • 30. © 32 Non-structuré Streams sociaux Weblogs Capteurs E-mails Détail transactions Pages web Documents scannés Trace GPS Données boursières Enregistrements téléphoniques Video-surveillance Données d’usage
  • 32. © 34 HybrideSystèmessources SystèmesbancairesdeproductionExternes ETL Appliance Entrepôt Vision unique du client Datamarts Sandbox Entrepôt Hadoop Usages Reporting Tableaux de bord Cubes OLAP Statistique (SAS...) Systèmes front-end Base métier Données de référence Synthèses transactions Données externes structurées Données externes peu structurées Données volumétrie importante Réintégration données après pré-traitement Sasde sécurité Accès Accès Accès Données externes à la demande Eléments de ciblage (dont scores) Extractions Métiers (dont scores, segmentations...) Base métier Base métier Base métier Base métier Base métier Web Services Services temps réel À destination des front-end
  • 33. © 35 SOMMAIRESommaire 1. Introduction 2. Big Data : le décor 3. Big Data : quoi de neuf ? 4. Analyses : évolutions des usages et méthodes 5. Organisation et outillage 6. Illustration sur un cas concret 7. Pour conclure
  • 34. © 36 Les nouveaux besoins d’analyse Améliorer la performance de détection / de prévision avec des données exogènes Agilité, pertinence, auto apprentissage Personnalisation one to oneIdentifier et optimiser les parcours omnicanaux
  • 35. © 37 Les nouvelles méthodologies utilisées Random Forest Boosting Gradient Machine Textmining/ Voicemining Réseau Bayesien Support Vector Machines Sequential Pattern Analysis
  • 36. © 38 SOMMAIRESommaire 1. Introduction 2. Big Data : le décor 3. Big Data : quoi de neuf ? 4. Analyses : évolutions des usages et méthodes 5. Organisation et outillage 6. Illustration sur un cas concret 7. Pour conclure
  • 37. © 39 Où est quoi : architecture générale Big data : données chaudes Big data : données froides Dataware : données structurées Agrégatsdesignauxforts DonnéesCRM&mémoirecourte Historique Prédictif Données CRM Prédictif & signaux forts
  • 38. © 40 Cohabitation Datawarehouse et big data Connecteurs SQL Loader (import/export)
  • 39. © 41 Outillage : exemples Query BI Dataviz Statistique Machine learning Script Langage Environne ment Couche d’accès
  • 40. © 42 Connecteurs Loader Couche d’accès Query StockerExplorerTransformerModéliserAppliquer BI Dataviz Statistique Machine learning Script Langage Environne ment Fonctions * outillage
  • 41. © 43 Compétences * fonctions MarketingDatascience Programmation Stocker Explorer Transformer Modéliser Appliquer
  • 42. © 44 SOMMAIRESommaire 1. Introduction 2. Big Data : le décor 3. Big Data : quoi de neuf ? 4. Analyses : évolutions des usages et méthodes 5. Organisation et outillage 6. Illustration sur un cas concret 7. Pour conclure
  • 43. © 45 Exemple de problématique
  • 44. © 46 Solution fonctionnelle Prototyper l’algorithme de substitution Produire la matrice d’association Suivre et optimiser la performance l’algorithme Proposer des susbstitutions Intégrer l’algorithme de substitution Développer l’algorithme de substitution algorithme Algorithme « industrialisé » Matrice d’association Historique des propositions Référentiels produit Scan list Programme de production des matrices d’associations Hub Produits éligibles EAN substituts
  • 45. © 47 Architecture Lab data Large Data Fast Data Prototyper l’algorithme de substitution Produire la matrice d’association Suivre et optimiser la performance l’algorithme Proposer des substitutions Intégrer l’algorithme de substitution Développer l’algorithme de substitution
  • 46. © 48 Lab data Large Data Fast Data
  • 47. © 49 Planning Run Initialisation du centre de services Conception et réalisation « large » Maintenance Monitoring applications Administration Gestion des projets de setup Gestion du centre de servicesProgram Management Gestion des projets d’évolutions BusinessIT Gestiondeprojetet deservices Setup Sprints algorithme sur le « lab » Mise en place architecture Définition du SLA Conception et réalisation « fast » Tests Sprints d’amélioration algorithme sur le « lab » Surveillance de la santé de l’algorithme « lab » Infra Hard & soft Hébergement et monitoring Data exploration M1 M2 M3 M4 M5
  • 48. © 50 SOMMAIRESommaire 1. Introduction 2. Big Data : le décor 3. Big Data : quoi de neuf ? 4. Analyses : évolutions des usages et méthodes 5. Organisation et outillage 6. Illustration sur un cas concret 7. Pour conclure
  • 49. © 51 R.O.I. Connaissance Datamining Assortiments en magasins Rapports Rapports industriels Données : vision 360° client et produit Campagnes ciblées Technologies 1 2 3 4 Business Driven
  • 50. © 52 Best-of-breed intégré et verticalisé avec IBM Outils
  • 51. © 53 Cibler des R.O.I. < 6 mois
  • 52. © 54 Reconsidérer chaque année les ROI : les barrières à l’entrée baissent toujours plus
  • 53. © 55 Offre de services S ensibilisation tratégie andbox R oadmap ollout un
  • 54. © 56