Big Data
11/12/2014
Big Data
I L’émergence
II Les enjeux
III Les défis
IV Exemples concrets
La big data c’est quoi ?
Les 3 « V » de la big data
Un potentiel phénoménal
libéré par :
• Le Volume des données accessibles
• La capacité à exploiter la Variété des données
• La Vélocité de traitement
I L’émergence de la big data
L’explosion des données
Programmes de fidélité
Internet : search, navigation, achats
Objets connectés
Smartphones
Photos et vidéos
Blogs, Réseaux sociaux
Géolocalisation
Open Data
90% des données produites
ces 2 dernières années
40 Zo à horizon 2020
L’explosion des données
1 Zo = 1 000 000 000 000 000 000 000 octets, soit un milliard de Teraoctets
Produire 5 Mds de Go
L’humanité jusqu’en 2003
1 jour en 2011
10 minutes en 2013
Le stockage des données
Le cloud : des données accessibles de partout
La structuration des données
Structuration ouverte
des données
Bases de données
relationnelles
II Enjeux : colossaux
(et en partie insoupçonnés)
Mieux comprendre pour mieux agir
Météorologie
Santé
Sécurité
Energie
Banque & finance
Relation client
…
Améliorer
l’expérience client
Optimiser la
performance
Mieux gérer
les risques
III Défis posés par la big data
Décisionnel classique et big data
Le changement de paradigme
DECISIONNEL
• Volume limité
• Forte densité d’info
• Info structurée
• Statistiques
descriptives
BIG DATA
• Volume gigantesque
• Faible densité d’info
• Infos non structurées
et hétérogènes
• Statistique
inférentielle
Vers des organisations data-centric
Quelques révolutions en
marche
• Géolocalisation
(smartphones, RFID…)
• Objets connectés
• Open data
• (Législation)
Données internes
• Bases de données
• Emails
• Documents
• Logs
• …
Données externes
• BDD publiques
• Achat
• Web : réseaux sociaux,
search, navigation, favoris
• …
Capturer les
données
Géolocalisation
(smartphones, RFID…)
Objets connectés
Open data
(Législation)
Stocker et
mettre à
disposition
Stockage
Dimensionnement
du réseau
Sécurité
Mettre en
relation les
données
Données et stockages
hétérogènes
Données non
structurées
Identifiants
Tris à plat
Tris croisés
Segmentations
Modèles prédictifs
discontinus
???
Modèles prédictifs
continus
Exploiter les
données
Nouvx modèles et
algos massivement //
Visualisation
/exploration
Ressources humaines
IV Exemples concrets
Ex1 Géolocalisation et géomarketing
• Source : CRA
géolocalisés et
smartphones
• Volumétrie : des To de
données quotidiennes
• Applications : flux de
voyageurs, localisation
du pouvoir d’achat…
Sources de données et algo
CRA
Voix et data
Construction du
profil de la ligne
CSP/démographie…
INSEE
Stats îlots
Détection des lignes
à proximité de
chaque antenne
Référentiel
antennes
Algorithme de
détection du
domicile & travail
Carte géomarketing
dynamique
Apports de l’approche
Ex2 Recommandations personnalisées
Un nouveau modèle d’analyse
Des recommandations plus pertinentes
Variété des sources d’info
Réseaux sociaux
CRM /emailing
E-commerce Service client
Cartes de fidélité
Géolocalisation Données publiques
CSP
Revenus
Pouvoir d’achat
Démographie…
…
J’achète*
le produit 4657
* J’achète, ou je mets au panier, ou je consulte…
donc je suis
de ceux qui
aiment les bonbons
donc je vais
sans doute aimer
les bonbons préférés de
ceux qui aiment les
bonbons
le produit 4657,
8742, 3937, 4182…
L’écueil des profils-types
J’achète*
des « pastilles à la menthe
verte à la gomme très
tendre, très parfumée…»
* J’achète, ou je mets au panier, ou je consulte…
et donc je vais
sans doute aimer
les pastilles à la menthe, les
bonbons à la menthe, les
pastilles à l’eucalyptus,
des « pastilles à la menthe verte à la
gomme très tendre, très parfumée… »,
des « pastilles Frisk à la menthe forte »,
des « pastilles à la menthe de la marque
MenthePastille », et des « gommes à la
menthe verte » et peut-être même… un
spray pour l’haleine fraîche
La pertinence d’Affinity Engine
donc j’aime
Les bonbons,
les pastilles à la menthe,
les pastilles à la menthe forte,
les pastilles, la menthe forte, la
menthe verte…
Merci !
Teddy Malfait, DG
ted@affinity-engine.fr, 09 80 47 24 83

La Big Data et ses applications

  • 1.
  • 2.
    Big Data I L’émergence IILes enjeux III Les défis IV Exemples concrets
  • 3.
    La big datac’est quoi ? Les 3 « V » de la big data Un potentiel phénoménal libéré par : • Le Volume des données accessibles • La capacité à exploiter la Variété des données • La Vélocité de traitement
  • 4.
  • 5.
    L’explosion des données Programmesde fidélité Internet : search, navigation, achats Objets connectés Smartphones Photos et vidéos Blogs, Réseaux sociaux Géolocalisation Open Data
  • 6.
    90% des donnéesproduites ces 2 dernières années 40 Zo à horizon 2020 L’explosion des données 1 Zo = 1 000 000 000 000 000 000 000 octets, soit un milliard de Teraoctets Produire 5 Mds de Go L’humanité jusqu’en 2003 1 jour en 2011 10 minutes en 2013
  • 7.
    Le stockage desdonnées Le cloud : des données accessibles de partout
  • 8.
    La structuration desdonnées Structuration ouverte des données Bases de données relationnelles
  • 9.
    II Enjeux :colossaux (et en partie insoupçonnés)
  • 10.
    Mieux comprendre pourmieux agir Météorologie Santé Sécurité Energie Banque & finance Relation client … Améliorer l’expérience client Optimiser la performance Mieux gérer les risques
  • 11.
    III Défis poséspar la big data
  • 12.
    Décisionnel classique etbig data Le changement de paradigme DECISIONNEL • Volume limité • Forte densité d’info • Info structurée • Statistiques descriptives BIG DATA • Volume gigantesque • Faible densité d’info • Infos non structurées et hétérogènes • Statistique inférentielle Vers des organisations data-centric
  • 13.
    Quelques révolutions en marche •Géolocalisation (smartphones, RFID…) • Objets connectés • Open data • (Législation) Données internes • Bases de données • Emails • Documents • Logs • … Données externes • BDD publiques • Achat • Web : réseaux sociaux, search, navigation, favoris • … Capturer les données Géolocalisation (smartphones, RFID…) Objets connectés Open data (Législation)
  • 14.
  • 15.
    Mettre en relation les données Donnéeset stockages hétérogènes Données non structurées Identifiants
  • 16.
    Tris à plat Triscroisés Segmentations Modèles prédictifs discontinus ??? Modèles prédictifs continus Exploiter les données Nouvx modèles et algos massivement // Visualisation /exploration Ressources humaines
  • 17.
  • 18.
    Ex1 Géolocalisation etgéomarketing • Source : CRA géolocalisés et smartphones • Volumétrie : des To de données quotidiennes • Applications : flux de voyageurs, localisation du pouvoir d’achat…
  • 19.
    Sources de donnéeset algo CRA Voix et data Construction du profil de la ligne CSP/démographie… INSEE Stats îlots Détection des lignes à proximité de chaque antenne Référentiel antennes Algorithme de détection du domicile & travail Carte géomarketing dynamique
  • 20.
  • 21.
  • 22.
    Un nouveau modèled’analyse Des recommandations plus pertinentes
  • 23.
    Variété des sourcesd’info Réseaux sociaux CRM /emailing E-commerce Service client Cartes de fidélité Géolocalisation Données publiques CSP Revenus Pouvoir d’achat Démographie… …
  • 24.
    J’achète* le produit 4657 *J’achète, ou je mets au panier, ou je consulte… donc je suis de ceux qui aiment les bonbons donc je vais sans doute aimer les bonbons préférés de ceux qui aiment les bonbons le produit 4657, 8742, 3937, 4182… L’écueil des profils-types
  • 25.
    J’achète* des « pastillesà la menthe verte à la gomme très tendre, très parfumée…» * J’achète, ou je mets au panier, ou je consulte… et donc je vais sans doute aimer les pastilles à la menthe, les bonbons à la menthe, les pastilles à l’eucalyptus, des « pastilles à la menthe verte à la gomme très tendre, très parfumée… », des « pastilles Frisk à la menthe forte », des « pastilles à la menthe de la marque MenthePastille », et des « gommes à la menthe verte » et peut-être même… un spray pour l’haleine fraîche La pertinence d’Affinity Engine donc j’aime Les bonbons, les pastilles à la menthe, les pastilles à la menthe forte, les pastilles, la menthe forte, la menthe verte…
  • 26.
    Merci ! Teddy Malfait,DG ted@affinity-engine.fr, 09 80 47 24 83