Leader sur le secteur du traitement et de l’analyse de données depuis plus de 40 ans, la société Socio Data Management sera présente au Printemps des études les 11 et 12 avril 2019 au Palais Brongniart à Paris, stand 25, pour présenter son outil de simulation prédictive : le Simulateur Bayésien.
Cette solution est une exclusivité Socio Data Management, la seule à combiner la modélisation bayésienne avec la Data Visualisation. Elle permet de déterminer l’importance et l’impact des critères d’évaluation sur un indicateur global et de visualiser « en direct » les interactions entre plusieurs critères. Dans le cadre des études marketing, elle s’applique aux indicateurs de satisfaction, de notoriété, de préférence de marques, d’acceptabilité, de recommandation, etc.
« Notre Simulateur Bayésien, unique sur le marché, combine l’expertise R&D des équipes de Socio Data Management avec la technique d’analyse statistique des réseaux bayésiens. Reposant sur des matrices, ces derniers permettent d’accélérer le calcul des correspondances entre les variables. Notre simulateur, lui, permet de faire varier les contributions directes et indirectes pour voir comment les critères impactent un KPI global et s’articulent entre eux. » explique Emmanuel Vandenbesselaer, Directeur de Clientèle chez Socio Data Management.
Comment démontrer la contribution des innovations BI à la performance de votr...
Socio Data Management présente son outil de simulation prédictive au Printemps des Etudes 2019
1. 1
Comment optimiser ses KPIs grâce à la simulation prédictive ?
Le Simulateur Bayésien
Printemps des Etudes 2019
2. 2
Agenda
Questions/Réponses
À propos de Socio Data Management
Quelques repères pour bien situer le cadre et les enjeux
Présentation de la solution
Pour aller plus loin
La présentation
vous sera
envoyée par
e-mail à la suite
du salon
4. 2 cœurs de métier historique depuis plus de 40 ans.
4
Socio Data Management
TRAITEMENT ET
ANALYSE DE DONNÉES
MULTI-SOURCES
APPLICATIONS POUR
EXPLOITER & RESTITUTER
DES DONNÉES
+ de 500 clients
cross-secteurs
+ de 2500 études
traitées par an
Une convergence d’expertises
unique
Statistique & Data
R&D & IT
Marketing
6. 6
Le Groupe Orians
Socio Data Management a rejoint le Groupe Orians en mai 2018.
Cabinet de conseil &
d’expertise en
cybersécurité.
Paris & Rennes
Editeur de logiciels pour
systèmes IBMi (ex
AS/400).
Paris & Dijon
Editeur de logiciel pour
la Gestion Electronique
des Documents.
Paris & Dijon
Société de services en
ingénierie informatique.
Toulouse & Paris
Société de services
spécialisée dans le
traitement de la
donnée.
Paris
120
collaborateurs
5
bureaux
4 grandes villes
8. 8
Les KPIs – De quoi parle-t-on ?
Pour piloter leur activité, les entreprises et institutions utilisent de nombreux indicateurs clés pour mesurer leur performance :
…
• Vente : conversion, fidélisation, TP, CLV
• Clients : nb de clients, satisfaction, NPS
• Emailing : délivrabilité, ouverture, clics
• Marque : notoriété, image, brand equity
…
MARKETING ET VENTES
• Recrutement : nx salariés, rétention
• Performance globale : ETP, CA / ETP
• Engagement : turn-over, absentéisme
• Carrières : coût formation, qualification
…
RESSOURCES HUMAINES
• Évolution du CA
• Marge : MB, MN, seuil de rentabilité
• EBE (Excédent Brut d’Exploitation)
• Bénéfice avant intérêt et impôts
…
FINANCE ET COMPTABILITÉ
• Productivité: TDC, RTY, capacité, pertes
• Équipements : fiabilité, pannes
• Qualité-sécurité : conformité, AT, HS
• Logistique : stocks, service, délais
…
PRODUCTION ET LOGISTIQUE
• Réussite : évaluations, classements
• Performance : inscriptions, diplômés
• Sociétal : compétences, alphabétisation
• Équipements : ancienneté, remplissage
…
ÉDUCATION
• Épidémiologie : prévalence, incidence
• Parcours soins : délai PEC, vaccination
• Démographie : mortalité, esp. de vie
• Hôpitaux : occupation, délai attente
…
SANTÉ
9. 9
Les KPIs – Quels enjeux ?
Choisir les bons indicateurs bien sûr, mais surtout fixer des
objectifs clairs et en évaluer l’atteinte
Avoir un dispositif de mesure et des métriques capables de
rendre compte du réel avec suffisamment de granularité
Identifier les différents leviers, analyser comment ils
s’articulent pour influer sur le KPI
En tirer des actions correctives ou d’optimisation, en tenant
compte de contraintes éventuelles (budgétaires, matérielles,
logistiques…)
Passer de l’information à la connaissance, de la simple
mesure à la compréhension et l’action dans le temps
10. 10
Les KPIs – Complexité dans les études Marketing
Profusion croissante des informations
(qualitatives & quantitatives)
Données de sources et natures différentes
(déclaratives, CRM, transactionnelles, comportementales…)
Techniques de recueil variées
(enquêtes, aspiration web, neuromarketing…)
Enjeu d’hybridation des données
(déclaratif-observation, parole-gestuelle, conscient-inconscient…)
Complexité de l’expérience client et
des points de contacts
(composantes nombreuses, parcours
client non linéaire…)
Co-construire en alliant notre expertise
technique/marketing à la connaissance
métier des clients
Disposer d’insights opérationnels
et/ou stratégiques
11. 11
3 grandes options analytiques
Utilité, portée, limites Méthodes / Techniques Quand les utiliser ?
Analyse
descriptive
et explicative
(diagnostic)
Que s'est-il passé
et pourquoi ?
Instantané du passé
Limité pour décider
Agrégation et
exploration de données
Décrire et résumer
tout ou partie des
données observées
Analyse
prédictive
Que pourrait-il
se passer ?
Compléter ce qui manque
Estimer un résultat futur
Modélisation statistique
Techniques de prévision
1ers niveaux de simulation
Comprendre le résultat
futur le plus probable
/ hypothèses éclairées
Analyse
prescriptive
Que devrait-on
faire ?
Prévision => Prescription
Guider vers une solution
Qualifier et quantifier
l’effet des décisions
Combinaison de règles
métier, contraintes,
modèles d'optimisation,
simulations avancées,
apprentissage machine
Prendre des décisions
importantes complexes
ou sensibles au temps
12. 12
2 grandes approches pour inférer et probabiliser
Causes
Effets
APPROCHE « FRÉQUENTISTE »
Réputée plus objective => loi de l’observation
(fréquences sur événements répétés).
Probabilité = limite d’une fréquence observée,
sans probabiliser les paramètres ni les hypothèses
Inférence valide si, sur le long terme, elle ne mène
que rarement à des conclusions incorrectes
Décisions = p-value (significativité)
Incertitude = intervalle de confiance
APPROCHE « BAYÉSIENNE »
Réputée plus subjective => combine l’information des
données avec les connaissances a priori
Probabilité = degré de confiance dans une hypothèse,
observations / paramètres / hypothèses probabilisées
Inférence "bottom-up" et "top-down", probabilités
conditionnelles sur les causes et les conséquences
Décisions = distribution a posteriori
Incertitude = intervalle de crédibilité
Inférence statistique et probabilités :
Généraliser les résultats d’un échantillon à toute
la population parente (inférer), en tenant compte
d’un degré d’incertitude (probabilités).
13. 13
La lente émergence des statistiques bayésiennes
1763 - 1774
THÉORÈME
DE BAYES
Inférence bayésienne :
probabilités de causes
hypothétiques à partir de
l'observation
d’événements connus
LONGUE TRAVERSÉE DU
DÉSERT DE L’APPROCHE
BAYÉSIENNE
L’école « fréquentiste »
domine largement la
statistique inférentielle et
les probabilités
PENDANT + DE 150 ANS 2È GUERRE MONDIALE
"CRACKAGE" D’ENIGMA
L’approche bayésienne
permet à Alan Turing de
décrypter la machine et le
chiffrement des allemands.
Conflit écourté de 2 ans
1970s-1980s
NAISSANCE DES
"RÉSEAUX BAYÉSIENS"
Modélisation et
représentation graphique
Elle reste néanmoins
cantonnée à la recherche
DÉVELOPPEMENT DE
L’ANALYSE BAYÉSIENNE
Grâce au développement
de l’informatique et des
nouvelles technologies,
l’analyse bayésienne
dispose enfin des outils
pour s’appliquer à de
nombreux domaines
1990s-2010s
14. 14
Les KPIs – Analyse et représentation des leviers – Quelques limites actuelles
Représentations statiques,
qualitatives et univariées
• Matrice stratégique
• Matrice importance / satisfaction
• Matrice Llosa / Bilan d’image
• …
Des résultats parfois compliqués
à expliquer / animer
• Baromètres qui racontent la même histoire
• Évolutions discordantes / actions mises en
place
• …
Complexité visuelle
des réseaux bayésiens "bruts"
• Interprétation graphique des interactions
vite complexe avec beaucoup de variables
• …
16. 16
Principe général du Simulateur Bayésien – Fonctions principales
Mesurer l’influence de critères détaillés (les variables explicatives) sur un KPI global (la variable à
expliquer)
Mesurer les interactions entre critères détaillés
Simuler puis déterminer des plans d’actions visant à améliorer / optimiser un KPI global :
Insights qualitatifs (sur quels leviers agir) & quantitatifs (quel est l’effort nécessaire et suffisant pour
atteindre l’objectif d’amélioration)
Fonctionnalités de filtres et de niveaux de contribution – Permettent la prise en compte de contraintes
(métiers, logistiques, matérielles, d’investissement…)
17. 17
Principe général du Simulateur Bayésien – Techniques et méthodes
Modélisation statistique à partir des réseaux bayésiens, avec une méthode de validation itérative et évolutive
(corrections, enrichissement et validation par les différentes mesures dans le temps)
Process de validation rigoureux :
Élaboration du modèle sur une partie de l’échantillon (échantillon d’apprentissage), puis test sur une autre partie
(échantillon de contrôle)
Capacité du modèle à prédire la variable à expliquer validée en comparant la valeur prédite avec la valeur réelle (très bon
niveau de prédiction >= 75%)
Combiné à un outil de Data Visualisation dynamique et interactif pour visualiser et simuler « en direct » les
résultats et les projections
Le Simulateur Bayésien de Socio Data Management rend intelligible l’analyse complexe des données pour
un public non statisticien
19. 19
Exemples d’application de la solution
Dans le cadre marketing et des études :
Mesurer l’influence d’items de satisfaction sur la recommandation (NPS)
Mesurer l’influence d’items d’image sur une note d’image / réputation globale
Identifier les moments de vérité clés dans le parcours client
Mesurer l’influence des points de contact sur la satisfaction / le taux de conversion / l’image
Mesurer l’influence des investissements publicitaires sur les ventes dans une stratégie cross-media
Définir l’influence de chaque ingrédient / composantes d’un produit ou service sur son liking global
Optimiser un questionnaire en se focalisant sur les variables clés et en éliminant celles qui sont superflues
Et plus généralement :
Tout indicateur de performance que l’on cherche à expliquer et à prédire par des variables explicatives, qu’il
s’agisse d’un score, d’un nombre (de clients…), d’un taux (%), d’un indice…
20. 20
Évolution de la solution - Roadmap
20
Fixer directement l’objectif à atteindre sur le KPI global et obtenir la photographie idéale, le plan d’actions optimal
(toujours en prenant en compte des contraintes éventuelles sur les critères détaillés)
Visualisation complète du Mapping de contribution
(Llosa, bilan d’image…)
Fonctionnalités d’export : PPT, sauvegardes…
Visualisation optimisée des leviers à prendre en compte
(notamment sur les courbes de réponses…)
Bouton de partage avec les collaborateurs
Intégration de Benchmarks
3 grandes options analytiques pour extraire le sens des données et améliorer la prise de décision
Définitions :
Inférer : Tirer, d'un fait ou d'une proposition donné(e), la conséquence qui en résulte. Tirer une conclusion d'un fait ou d'un événement donnés.
Probabiliser : Considérer comme probable. Mesurer par un indice de probabilité. Qu'il est raisonnable de supposer, de conjecturer, de prévoir; qui a beaucoup de chances de se produire.
Une fréquence est une proportion d'observations; une probabilité est la mesure d'une incertitude sur un événement.
On passe des fréquences aux probabilités à l'aide du tirage au sort.
Représentations statiques (on ne peut simuler l’impact d’une évolution des critères), univariées cad qui n’utilisent qu’un seul paramètre (aucune représentation n’intègre les effets indirects de l’évolution d’un critère sur un autre) et uniquement qualitatives (on ne connait pas l’effort nécessaire à produire pour atteindre l’objectif d’amélioration visé).
Il devient donc nécessaire d’adopter une nouvelle approche.
En tenant compte de contraintes métiers (par exemple une grande surface qui a déjà optimisé le temps d’attente en caisse par des caisses en libre-service saura que la marge de manœuvre est limitée sur ce critère) ou matérielles / logistiques (par exemple un budget limité à investir dans une campagne de communication)