Présentation de Mr Joel Rubino, Président et co fondateur de Apicube, sur l'analyse de données et aide à la décision lors de l'événement Metro'num 2015
1. KEDGE Business School
21 – 22 Mai 2015
Joel Rubino
Président et co fondateur Apicube
Analyse de données et aide à la décision.
Où comment garder client et citoyen
au coeur de votre stratégie.
2. Apicube est une société de
conseil spécialisée dans le big
data et l’étude des
conversations publiques sur
internet.
Nous permettons aux
entreprises et aux collectivités
de mieux comprendre les
attentes des consommateurs
et des citoyens afin de mieux
les servir en les gardant au
cœur de leur stratégie.
2
4. Un univers digital en expansion
INSIGHTSACTIONS
90% des données publiques
créées depuis le début de
l’humanité et accessibles
légalement ont été créées ces
2 dernières années
(Source IBM)
Explosion exponentielle de la
quantité de données. Nous ne
sommes qu’au début d’un
phénomène d’ampleur.
Focus sur la valeur pas sur la
donnée
Depuis Adam et Eve
jusqu’en 2011
2012 - 2013
90%
5. Espace maitrisé
Communication institutionnelle
Marque -> clients
Site Corporate
Publicité
Espace semi-maitrisé
Modération du dialogue
entre la marque et ses clients
Page Facebook
Blog Corporate
S.A.V.
Compte Twitter
Chaine Youtube
…
Espace subi
Expression totalement libre
et incontrôlée
Sites Concurrents
Presse en ligne
Forum de discussions
Instagram
Tripadvisor
Twitter
Facebook
Google+
…
Les 3 espaces de communication.
6. …. « A Bordeaux, j’ai acheté un sac Vuitton à mon épouse. C’est sa
marque préférée mais les coutures viennent de lâcher »….
Séman'que
et
sen'ments
Opinion positive sur la marque
Identification du lieu
Identification de la marque Vuitton Homme
Marié
Opinion négative sur le produit
…. « A Bordeaux, j’ai acheté un sac Vuitton à mon épouse. C’est sa
marque préférée mais les coutures viennent de lâcher »….
8. • Stratégie:
– Toulouse
Métropole
a
la
convic'on
que
les
Médias
Sociaux
doivent
être
le
fer
de
lance
de
sa
stratégie
de
communica'on.
• Problème:
– Le
disposi'f
actuel
est
principalement
réac'f
sur
la
base
des
besoins
entrants
et
d’un
radar
ar'sanal
– Difficulté
à
écouter
des
flux
d’informa'on
en
dehors
des
médias
majeurs
– Interven'ons
sur
requête
et
donc
pas
forcément
représenta'ves
des
besoins
du
plus
grand
nombre
– Priorisa'on
des
contenus
éditoriaux
à
créer
et
améliorer
– Difficulté
à
détecter
les
sujets
émergents
avant
qu’ils
ne
deviennent
majeurs
– Incapacité
à
prévenir
d’éventuelles
crises
Toulouse
Métropole:
+700
000
habitants,
37
communes,
460
km²
9. • Développement
à
'tre
expérimental
un
modèle
de
données
qui
analyse
les
grandes
théma'ques
importantes
pour
la
ville,
comme
les
transports,
la
sécurité
ou
la
culture.
• Plus
d’1,6
millions
de
documents
ont
servi
de
base
à
la
1ère
analyse,
le
modèle
étant
maintenant
défini
et
op'misé
il
pourrait
être
alimenté
en
con'nu
et
temps
réel,
au
fil
de
l’appari'on
de
nouvelles
données
et
servir
à
de
nouvelles
analyses.
• Un
rapport
comprenant
des
synthèses
qualita'ves
et
quan'ta'ves
sur
chaque
grand
thème
a
été
transmis
à
la
Direc'on
de
la
Communica'on
afin
d’adapter
leurs
ac'ons
sur
la
base
de
ces
informa'ons,
améliorant
ainsi
l’efficacité
globale
de
leur
travail
et
du
service
aux
citoyens.
Big
Data
Analy'c
Ecouter
les
Toulousains
pour
mieux
les
servir
11. METHODOLOGIE DE L’ETUDE
OUTILSANALYSE
SMA (Social Media Analytics) traite un
large volume de données issues du web.
La technologie sémantique traite et
analyse les conversations selon un
modèle prédéterminé.
Ce modèle d’analyse a été paramétré
afin de faire ressortir toutes les
discussions autour de l’univers de la
metropole Toulousaine en réduisant au
maximum les conversations «
polluantes »
AXESD’ÉTUDE
L’étude analytique va croiser 3
dimensions:
Types: Grandes Thématiques
Concepts: Segmentation des
thématiques principales (Bus, Metro,
Tramway,…)
Hotwords: Sujets transverses et non
spécifiques à une des 4 marques (Ville,
quartier, …)
14. • L‘affaire
Merah
a
maximisé
la
sensa'on
d’insécurité
• Après
dépollu'on
du
modèle
on
retrouve
une
sensa'on
d‘insécurité
comparable
aux
autres
grandes
métropoles
Française
et
en
deçà
de
métropoles
telles
que
Paris/Marseille/
Lyon.
• En
bâ'ssant
le
modèle
de
données,
nous
avons
pu
constater
que
la
théma'que
sécuritaire
est
écrasante
pour
les
Toulousains
qui
ressentent
la
ville
comme
peu
sûre.
(79.559
Documents,74%)
– Pour
Toulouse
Métropole,
ce
sen'ment
est
un
réel
enjeux
car
le
besoin
de
sécurité
est
fondamental
pour
la
popula'on.
L’insécurité
a
une
influence
l’économie,
la
créa'on
d’entreprise,
la
natalité,
le
dynamisme
culturel,
la
santé,
etc...
– En
analysant
les
informa'ons
disponibles,
on
constate
une
prédominance
d’affaires
na'onales,
de
délinquance
ou
de
terrorisme,
qui
n’ont
pas
de
corréla'on
directe
avec
Toulouse.
– Toulouse
acquiert
une
visibilité
mondiale
sur
le
sujet
et
un
matraquage
média'que
quo'dien
s’abat
sur
les
habitants
pendant
plusieurs
mois.
Toulouse
La sensation d’insécurité au centre des débats – 1/2
15. • En
géolocalisant
par
quar'er
les
expressions
des
Toulousains
– Le
sen'ment
d’insécurité
est
globalement
homogène
– Les
quar'ers
pourtant
généralement
considérés
comme
«difficiles»,
ne
sont
pas
différents
• Analyse
par
«
Media
Set
»
spécifique
(c.a.d.
par
typologies
de
sources
d’informa'on)
– La
PQR,
principal
média
local,
traite
énormément
la
théma'que
sécuritaire,
venant
indirectement
renforcer
la
percep'on
néga've
de
la
popula'on.
Toulouse
La sensation d’insécurité au centre des débats – 2/2
16. Quelques
exemples
de
réalisa'ons:
• Ligue
na'onale
de
Football
• Mairie
de
Toulouse
• La
Poste
• SFR
• Seb
• Toulouse
Métrople
• IBM
• PSG
• Dynamo
• …
17. 1) Intérêt business du projet
Démarrez avec des questions (pas avec des données..)
Définissez vos KPI business (Revenu, Croissance, Marge, Satisfaction client, Part de marché, délais de livraison, co^t de recrutement
HR, etc,
2) Établissez une cartographie des données disponibles dans l’entreprise
Objectif: Décloisonner les « silos » qui peuvent exister au sein de chaque organisation pour obtenir une cartographie des données non pas
par département mais par typologie ou usage.
Par
où
commencer
?
source
description
exemples
web • contenu généré par les utilisateurs: réseaux sociaux, stockage de documents,
photos, vidéos, etc.
• e-commerce: historique des transactions et données clients
• Facebook, Twitter, YouTube, LinkedIn, FlickR
• Amazon, Ebay, etc.
machine to machine
(M2M)
et internet des objets
• RFID, capteurs, etc. NFC, QR code…
• log (i.e. mobile, internet, fixe) et données d’appels
• localisation de produits
• localisation d’individus, analyse du trafic en
temps réel, points de vente
données commerciales • CRM: profil des clients, comportements, logs, etc. • historique des transactions
• programmes de fidélité: points d’intérêts
données personnelles • informations légales (identité, statut marital,…), informations médicales, etc. • passeport, dossiers médicaux, casier judiciaire
open data • dossiers des administrations publiques, statistiques, etc. • datapublica.com, data.gouv.fr
3) Identifier des premiers cas d’utilisation faciles à tester
L’objectif est de parvenir rapidement à une mise en application concrète où les données qui ont été retenues comme pertinentes vont
pouvoir être testées, transformées et analysées.
La clef de la réussite est de commencer avec des projets simples impliquant des tailles et une complexité de jeux de données faibles.
Pour apporter un retour d’expérience rapide, ce premier projet doit être effectué avec des données de valeur, faciles à collecter,, être
restreint à un secteur, une filiale ou un pays et porter sur un projet avec un ROI court terme.
18. 4 chantiers en parallèle : Business, opérationnel, technologique et juridique
1. Chantier business
• Intérêt business du projet
• Retour sur investissement
2. Chantier opérationnel.
• Faciliter le partage des données. Les données étant éparpillées au sein des entreprises (ou en externe) , il faut les traiter
de façon globale.
• Création d’une business unit transverse à tous les départements en charge de la Data
• Eventuellement lancer un programme de recrutement :
• des spécialistes technologiques : pour la gestion et la surveillance des outils et des plateformes
• des Data scientists : pour le traitement et l’analyse des données
• des Business managers : pour la compréhension des enjeux data des clients.
3. Chantier technologique: implémenter les bons outils technologiques
• Orienté OPEX : externalisation de la gestion, du traitement et du stockage des données via un achat en mode « as a
service » de services.
• Orienté CAPEX : achat d’une start-up ou d’outils big data à intégrer à votre SI interne
4. Chantier Juridique:
• Trouver le juste milieu entre confidentialité et monétisation des données utilisateurs
• S’entourer des conseils d’un avocat spécialisé « data »
Comment
Con'nuer
?
19. Q
&
A
Joël Rubino
CEO & Co fondateur
Apicube
joel@apicube.com
06 70 47 10 71