1. Big data, small decisions and
smart organizations
Christophe Benavent – Université Paris Ouest - @benavent
Pour la 7ème université d'été GS1 – 31 Aout 2012
2. La promesse de Leclerc
Quels flux?
- mails et message direct..
- réseaux sociaux
- interactions géolocalisées
- interactions caisses
- reconnaissance faciale (?)
-…
=> 10 millions de clients, 25 achats par clients, 1000 interaction annuelles ????
3. Avertissement
Plus de données ≠ meilleure connaissance
Aucune connaissance se se construit à partir des
données, seule la théorie donne sens au données.
Inutile d'avoir beaucoup de données, de bons
échantillons suffisent (la barre des 10 000).
Plus de données ≠ meilleure prédiction
Ne pas ignorer les auto-prophéties : le risque de
l'instabilité. Prédire c'est modifier ce qu'on prédit
Le volume des données est sans rapport avec leur
qualité : 1/3 des données du net sont sans doute
mensongères. Une très grande fraction est redondante.
La quasi totalité est partielles.
4.
5.
6. 1850 : Navier-stokes
WAVEWATCH III™ (Tolman
1997, 1999a, 2009)
Based on
of the model WAVEWATCH,
as developed at Delft
University of Technology
(Tolman 1989, 1991a)
7. Des 3V au 3S
Volume :
Granularité :
tera, peta
Finesse de
zeta,,hexa.. non l'espace-temps
structurées (POS/j).
Vélocité :
Sémantique :
pas de latence
RDF et linked data
entre acquisition et le sémantique ?
et exploitation
Singularité :
Variété :
une chance pour
de tout sur tout... 10000 est une
régularité.
8. Une nouvelle granularité
Les vertus du grand nombre
Fournir des éléments pour une connaissance locale
L'exception qui devient une règle : le fait probable à
1 pour 10 000 devient une régularité
L'instantanéité
Accroissement de la réflexivité : les effets de
l'action peuvent être immédiatement répercutée
auprès de son auteur
Ubiquité :
La connaissance générale peut être particularisée
Les modèles généraux peuvent être localisés.
9. Granularité : un dimensionnement
Télécom : coordonnées et activités toutes les
minutes : 10 millions de client génèrent 1500
infos par jour ; 15 To/j.
Banques : 1 entretien tous les deux mois, 1
relevé mensuel, 4 coups de tel, 8
consultations : 600 millions de contacts mois
(1ko/1Mo). (6 à 600To/an).
Distribution : 1 achat semaine, 100 items par
tickets, 20 millions de clients. 100 milliards
d'actes d'achats (1ko->100To/an).
12. La qualité et la quantité
Faible : →
Information Etudes & recherche
structurelle
(connaissance)
Panels et baromètres
Degré de
CRM
Spécificité
De l'exploitation de
l'information Big data
Forte : →
Information
Factuelle
(intelligence)
Opinion BB Interactions Experience
Volume des données
13. Les champs des études (retail)
Quelques domaines :
Optimisation des assortiments et linéaires
Optimisation des Prix
Crossselling
Microsegmentation
Analyse du parcours client
Comportement cross-canal
Promotion
Fidélisation
Les nouveautés : l'omniprésence et le faible coût des
capteurs
Modéliser au niveau du point de vente, du rayon...
Réajustement des modèles en temps réels...
14. L'enjeu n'est pas dans les études
La granularité conduit à des décisions locales
et fréquentes qui risquent de dépasser les
capacités humaines des managers
→ Conception d'outils pour les agents :
Systèmes d'alerte
Visualisation
Indicateurs et tableaux de bords
→ Automatisation de la décision :
Les gains se réalisent dans la somme de micro-
décisions automatisée (exemple du pricing, du
filtrage collaboratif)
15. La nécessité de compétences
nouvelles
Rapport McKinsey 2011 : 190 000 emplois aux US pour
2018. près de 2 millions de cadres concernés
Intégration dans l'organisation.
Formation des agents opérationnels aux interfaces
Culture générale (quantitative) des managers
Des grands domaines techniques:
Maîtrise des modèles de données (MapReduce, Hadoop
etc)
Modélisation massive (économétrie, RO,...)
Simulation (des tactiques) et méthode de monte carlo
Intelligence artificielle pour l'automatisation de la décision
Design des interfaces et modes de représentations
16. Conclusion
Big n'est pas smart
Big ne produit pas de décision stratégique,
c'est une stratégie de la micro-décision.
Le goulet d'étranglement est celui de l'analyse
et de l'exploitation
L'art de distribuer l'information dans
l'organisation est la clé du succès
Le big problème : quelle source de
compétence : interne ou externe ?