Intervention data science starter program - polytechnique
1. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
analyse des
conversations du
web & e-influence
Data Science Starter Program - Polytechnique
2. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
2
Introduction
3. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
3
Plan de l’intervention
La veille digitale
analyse des conversations
autour de la fibre
Le marketing de l’influence
Twitter avec R
Facebook
4. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
4
5. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
5
C’est parti
6. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
6
La veille digitale
7. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
7
Talleyrand se mettait à
son balcon et écoutait la
rumeur de Paris
un sens politique
exceptionnel,
royaliste sous les rois,
révolutionnaire sous la
révolution
napoléonien sous napoléon
républicain sous la
république
a toujours eu un coup
d’avance sur les autres
– « Qui n’a pas les moyens de
son ambitions en a les
problèmes »
8. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
8
Aujourd’hui Talleyrand serait derrière son laptop et
analyserait les conversations
suivre et exploiter en temps
réel l’opinion des français sur
tout sujet,
exemples : la
communication politique, le
lancement des offres de
produits ou de services
Trouver des insights
exploitables à partir des
conversations des internautes,
identifier noyaux de
conversations, des leaders
d’opinion, comprendre de
façon approfondie
9. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
9
1 037 693 messages publiés sur le web au sujet
d’Orange sur les douzes derniers mois
~80 000 messages par mois
~20 000 messages par semaine
~2 messages par minute
10. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
10
Qu’est ce que la veille
stratégique ?
La Veille est le processus par
lequel une entreprise collecte
des informations sur son
environnement pour
comprendre son
environnement, suivre sa
réputation, dégager des
opportunités.
11. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
11
Les différents format de la veille stratégique
veille
commerciale
veille
technologique
veille
marketing
veille juridique
veille
concurentielle
12. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
12
Pour qui l’analyser
Direction Marketing
L’analyse du Buzz permet à une
direction Marketing de savoir en
temps réel ce que pense ses clients,
ses prospects, d’identifier les attentes
par rapport à ses produits et services
Direction de la Communication
L’analyse du buzz permet à une
direction de la communication de
savoir comment est perçue une
marque,
Direction de connaissance clients
rattachée aux directions marketing en
général, la direction de la
connaissance client peut compléter sa
connaissance des clients en prenants
leurs avis à la source
Quels secteurs d’activité : Tous
13. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
13
Exemple de veille pour un
lancement de produit : ex
HomeLive
14. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
14
Exemple de veille pour un lancement de produit : ex
HomeLive
• prendre le pouls des
conversations sur la
domotique
Avant le
lancement
commercial
• suivi des conversations
autour de HomeLive
(retours clients,
premiers tests, avis,
opinions, prendre les
retours du plan de
communication
Pendant le
lancement
commercial • identifier les problèmes
récurrents, les
améliorations
proposées par les
communautés
Après le
lancement
commercial
15. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
15
Les principaux
indicateurs
16. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
16
le volume de données
publiées sur le sujet
monitoré
Le volume doit être
observé sous forme
chronologique de façon à
repérer plus facilement
les pic de conversations
sur un sujet donné.
Indicateur 1 - Le Volume
Pic de conversations
17. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
17
Exemple avec Free Mobile
Quel est le pic de conversation ?
18. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
18
Exemple avec Free Mobile
Zoom sur la journée du 10/3/2015
Courbe de Buzz caractéristique avec pic la veille
Pic lors de la conférence de presse
Résilience après la conférence de presse
19. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
19
la part de
voix est le
volume de
retombées
classé par
marque.
Indicateur 2 - la Part de Voix
20. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
20
Indicateur 2 - la Part de Voix
Un exemple quelle est la part de voix de chacun des opérateurs sur
la journée du 10 Mars
21. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
21
Indicateur 3 - la Tonalité
La tonalité des messages
est analysée par des
moteurs sémantiques
capable de traiter des
milliers de messages à la
fois et capables de donner
la tonalité générale des
messages
22. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
22
Indicateur 3 - la Tonalité
Positive
"Je suis content
de l'arrivé de l'été"
Négative
"Gros #Fail ce
vendeur en boutique,
il m'a vendu le
mauvais produit"
Neutre
"Apparemment
Orange va sortir une
nouvelle offre 4G"
Ambivale
nt
"J'aime bien le débit
de la 4G mais je
n'aime pas le prix"
23. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
23
Indicateur 3 - la Tonalité
Un exemple : quel a été la tonalité associée aux messages publiés le
10/3
24. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
24
Indicateur 4 - la Source des retombées
Les retombées proviennent de sources extrêmement variée mais il
est possible de les catégoriser suivant les grandes familles suivantes.
Un exemple : quel a été la source principale des retombées
associées aux messages publiés le 10/3
25. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
25
Indicateur 5 - les Principaux sujets abordés
Nuage de mots clés
Les grandes catégories de retombées
26. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
26
Etude de cas :
l’analyse des conversations
autour de la Fibre
27. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
27
Analyse des conversations autour de la fibre
optique sur le mois de janvier 2015
Pic de conversation
pour Orange & Bouygues
28. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
28
Zoom sur Bouygues
29. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
29
Analyse
30. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
30
Analyse
31. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
31
Fibre: part de voix des opérateurs.
Les Hauts-de-Seine
réclament 45M € à
SFR Numéricable pour
leur retard sur la
construction du
réseau fibre.
Bouygues
augmente le débit
de sa fibre, qui
passe à 1Gb/S en
FTTH
Lancement des
offres Labox TV
Fibre par SFR
Viralisation d’un tweet
dans lequel un
Youtuber indique être
abonné à la fibre
Orange.
32. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
32
Fibre : forum de discussions
Forum hardware représente >
50% du volume des
conversations entre le 1/1 et
le 30/4/2015
33. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
33
Learnings
34. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
34
Et si vous choississez
de passer à coté du
Social Media
Intelligence ?
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0
International License.
35. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
35
Vous avancez à
l’aveuglette
36. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
36
Orange Social Hub
37. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
37
Twitter avec R
source https://github.com/famibelle/TwitteR
#Get the twitteR package from the CRAN
install.packages("twitteR")
#load the library
library(twitteR)
#load all the needed twitter authentication
setup_twitter_oauth(apikey, apisecret, token,
tokensecret)
Tweets <- searchTwitteR(
"polytechnique", # words to look for
n = 1337) # number of tweets to collect
Tweets <- do.call("rbind", lapply(Tweets, as.data.frame))
38. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
38
A Minimum Viable Twitter Analysis Tool
https://medhi.shinyapps.io/TwitteR/
39. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
39
Le marketing de l’influence
40. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
40
Network analysis
Characterize relationships
among nodes in a graph or
a network, understand the
communities, the influence
of nodes on the others,
understand how information
travels in the network.
Example:
identify key opinion leaders
in a social network,
identify the information flows
in a large company
41. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
41
Le marketing de
l’influence
Comment cibler la bonne
personnes qui saura au
mieux relayer vos
messages de marque ?
42. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
42
Quelques définitions
Les liens
• Les liens entrants
• Les liens sortants
les nœuds
43. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
43
La portée
le nombre de personnes qui
verront le message
aka Reach
la pertinence
niveau de relation
des messages
avec le sujet
Quelques définitions
44. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
44
Quelques définitions
Impressions
Reach
• nombre de fois
que le
message s’est
affiché
• le nombre de
personnes qui
ont vu le
message
45. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
45
Les caractéristiques de l’influence digitale
Faire le bon ciblage.
Pertinence
Portée
46. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
46
Comment faire pour diffuser mon message ?
En ciblant les nœuds
d’une communauté
47. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
47
Communauté
d’influence
nœud isolé
point de passage de la
communauté
48. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
48
49. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
Etude de cas : le réseau des influenceurs sur la big data
source http://www.traackr.com/
50. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
50
Quel est le réseau d’influence de Vijay ?
Qui est ce que Vijay influence ?
source http://www.traackr.com/
51. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
51
Qui est influencé par Vijay ?
source http://www.traackr.com/
52. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
52
Demonstration
http://www.traackr.com/
53. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
Klout : un indicateur de votre score d’influence
54. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
54
Twitter avec R
55. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
55
Twitter avec R
#Get the twitteR package from the CRAN
install.packages("twitteR")
#load the library
library(twitteR)
#load all the needed twitter authentication
setup_twitter_oauth(apikey, apisecret, token,
tokensecret)
Tweets <- searchTwitteR(
"polytechnique", # words to look for
n = 1337) # number of tweets to collect
Tweets <- do.call("rbind", lapply(Tweets, as.data.frame))
56. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
56
A Minimum Viable Twitter Analysis Tool
57. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
57
Facebook
58. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
58
Focus Facebook – rappel quelques chiffres clés
Utilisateurs actifs mensuels (MAU, janvier 2015) : 1,393 milliard.
Statuts partagés chaque seconde : 4100
Likes distribués chaque minute : 1,8 million
Likes distribués chaque jour : 4,5 milliards
Contenus partagés chaque jour : 4,75 milliards
Messages envoyés chaque jour : 10 milliards
Données échangées chaque minute : 350 giga-octets
Temps passé sur Facebook : 6h45 par mois en moyenne.
59. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
59
Comment Facebook fait pour savoir quoi publier sur
votre TimeLine ?
60. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
60
Facebook sait quoi publier sur votre newfeed grâce
aux Math
Chaque utilisateur de
Facebook est connecté à ses
amis au travers de lien.
Ces Liens sont appelés Edge
et possède un indice de
pondération plus ou moins fort
en fonction des liens que vous
avez avec vos amis.
Plus vous likez, commentez,
partagez les contenus de vos
amis, plus le lien sera fort.
Mais attention, cette relation
n’est pas réciproque
61. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
61
EdgeRank – Comment l’algorithme de Facebook
décide de mettre une publications sur votre compte
62. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
62
Définition des variables de la formule du Edge
Rank
Pour chacun de ses utilisateurs Facebook procède à un calcul et définit
un indice de pondération qui décide dans quel ordre il mettra l’action d’un
ami de l’utilisateur. Plus le poids est important, plus la publication sera en
haut du newsfeed.
Affinity = the relationship between you and each individual fan. That is,
how often a fan views and interacts with your Facebook page and
individual posts. Plus, how much you engage with your fans: Facebook
rewards you for building relationships!
Weight = typically, photos receive the highest weight, followed by videos,
links, status updates and apps. Manual posts receive more weight than
posts by apps.
Decay/Time = the more recent your post, the higher your EdgeRank
score. A popular piece of content will stay for a longer period of time in
the News Feed of your fans.
63. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
63
Les Vrais Insigths / sous le capot
Le Reach, ou la Portée représente le nombre de personnes uniques qui ont été
exposées à une publication de la page.
Ces insights sont moins connus mais sont de premières importance pour les
marque.
Le Reach/Portée représente l’audience de la page.
Organic Reach
• La portée naturelle de la publication
Paid Reach
• la portée payée de la publication
Viral Reach
• la portée virale de la publication
« Le Reach est un secret jalousement
gardé par les marques, si vous
connaissez le Reach, vous connaissez
le budget social media de la marque »
« qui contrôle le Reach contrôle
Facebook »
64. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
64
Exemple d’Insights
Achat d’audience
Reach de la publication
Reach moyen par type de
publication
65. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
65
Sachez le !
Lorsque que vous
faites une
publication sur une
page, il n’y a que
5% des personnes
qui verront votre
contenu.
66. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
66
Insights Facebook – encore des insights
Number of fans
Like
Comments
Shares
67. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
67
Insights Facebook – encore des insights
Lifetime: Total number of times your video was viewed for more than 3 seconds.
(Total Count)
Lifetime: Number of times your video started automatically playing and people
viewed it for more than 3 seconds. (Total Count)
Lifetime: Number of times people clicked to play your video and viewed it
more than 3 seconds. (Total Count)
Lifetime: Total number of times your video was viewed for 30 seconds or
viewed to the end, whichever came first. (Total Count)
Lifetime: Number of times your video started automatically playing and people
viewed it for 30 seconds or to the end, whichever came first. (Total Count)
68. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
68
Insights Facebook – encore des insights
Lifetime: Number of times people clicked to play your video and viewed
it for 30 seconds or to the end, whichever came first. (Total Count)
Lifetime: Total number of times your video was viewed to 95% of
its length. (Total Count)
Lifetime: Number of times your video started automatically
playing and people viewed it to 95% of its length. (Total Count)
Lifetime: Number of times people clicked to play your video and
viewed it to 95% of its length. (Total Count)
Lifetime: The number of impressions of your Page post. (Total Count)
69. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
69
Insights Facebook – encore des insights
Lifetime Percentage of auto-...
Lifetime: Total number of times your video was viewed to 95% of
its length. (Total Count)
Lifetime: Number of times your video started automatically
playing and people viewed it to 95% of its length. (Total Count)
Lifetime: Number of times people clicked to play your video and
viewed it to 95% of its length. (Total Count)
Lifetime: The number of impressions of your Page post. (Total Count)
70. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
70
Prédire Facebook
Comment prédire le Reach d’une publication Facebook
A quel moment faut il publier un post sur Facebook ?
Quelle est la bonne fréquence de publication
Peut on modéliser le Reach ?
Il y a t’il une saisonalité dans le reach des publications ?
Quel est le meilleur format (vidéo, texte, photo, etc)
71. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
71
Des Questions ?
72. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. @Médhi
72
Notes de l'éditeur
qui je suis : je me présente, Medhi Famibelle @Médhi , je travaille chez Orange ou je gère le pôle performance web qui mesure l’impact des conversations du web francophone.
développer ma présentation avec + de parcours et passions, ce qui m’éclate, ce que j’ai fait avant Orange + de chaleur et d’humanité