2. SYLVAIN
PEYRONNET
Co-fondateur et responsable des ix-labs
Professeur des Universités (on leave)
Co-fondateur nalrem médias
@speyronnet
http://www.peyronnet.eu
http://live.ix-labs.org
sylvain@ix-labs.org
3. ALGORITHMES ET FACEBOOK
En quelques années,
Facebook est devenu l’un
des acteurs majeurs en
algorithmique pour le web
5. ALGORITHMES ET FACEBOOK
Aujourd’hui :
Créer un fil personnalisé
Chercher le graphe social
Afficher de la pub
Avec des invités :
Alice
Bob
Hector
Juliette
9. Posts des amis
UN FIL PERSONNALISÉ
Sur Facebook, un
inscrit à en
moyenne 300
amis
On ne peut voir que
10% des posts produits par
les amis
10. Posts des amis
UN FIL PERSONNALISÉ
Sur Facebook, un
inscrit à en
moyenne 300
amis
On ne peut voir que
10% des posts produits par
les amis
Comment trouver les meilleurs
pour que Bob soit content ?
11. EDGERANK
score(p) = A ⇥ T ⇥ F
A la création d’un post :
Affinité
!
Fidélité de Bob
envers Alice
!
!
!
Score du post fait par Alice, pour le fil de Bob
Type
!
Une photo ou
vidéo vaut plus
qu’un petit texte
ou qu’un share
d’un buzztruc
!
Fraicheur
!
!
!
!
!
!
!
⇡
1
age du post
12. EDGERANK
A chaque interaction, le score est recalculé
Hector commente le post
Juliette like le post
Chaque interaction créée un lien entre les « interacteurs » et
Bob
!
13. EDGERANK
score(p) =
X
liens l
Al ⇥ Tl ⇥ Fl
Dès que les interactions s’arrêtent, le
score diminue très vite (à cause de la
fraicheur)
On affiche sur le fil de
Bob les posts dans
l’ordre des scores
décroissants
14. UN FIL PERSONNALISÉ
Depuis 2013, l’edgerank a
disparu au profit du
« newsfeed », qui utilise plus de
100k critères différents
15. UN FIL PERSONNALISÉ
!
# de commentaires
!
# de likes
!
« dynamisme »
!
nouveauté (nouveau contenu)
!
interactions
!
appartenance à des groupes
identifiés
post avec liens spammy
!
post avec uniquement du texte
!
contenu publicitaire
!
click et link baiting
!
contenu « memesque »
Quelques critères pour
le newsfeed
16. UN FIL PERSONNALISÉ
!
# de commentaires
!
# de likes
!
« dynamisme »
!
nouveauté (nouveau contenu)
!
interactions
!
appartenance à des groupes
identifiés
post avec liens spammy
!
post avec uniquement du texte
!
contenu publicitaire
!
click et link baiting
!
contenu « memesque »
Quelques critères pour
le newsfeed
17. CHERCHER LE GRAPHE SOCIAL
Comment chercher des
informations dans un
graphe énorme ?
18. CHERCHER LE GRAPHE SOCIAL
Comment chercher des
informations dans un
graphe énorme ?
En utilisant des
signaux sociaux
pour personnaliser
les résultats
20. FACEBOOK GRAPH SEARCH
Moteur de recherche
sémantique
Depuis Mars 2013
Pas encore en France
Cherche dans le graphe de
Facebook, et utilise des
résultats de BING en plus
Alice Bob Hector Juliette
24. FACEBOOK GRAPH SEARCH
Curtiss, Michael, et al. "Unicorn: A system for searching the social graph."
Proceedings of the VLDB Endowment 6.11 (2013): 1150-1161.
Facebook graph search est réalisé
grâce au système Unicorn
25. FACEBOOK GRAPH SEARCH
Curtiss, Michael, et al. "Unicorn: A system for searching the social graph."
Proceedings of the VLDB Endowment 6.11 (2013): 1150-1161.
Facebook graph search est réalisé
grâce au système Unicorn
Il s’agit d’un « outil » qui sélectionne des
parties du « social graph » selon des
requêtes portant sur les connexions
27. FACEBOOK GRAPH SEARCH
Requêtes
(and friend:Alice friend:Bob)
(or friend:Alice friend:Bob)
(difference friend:Alice friend:Bob)
Les amis d’Alice qui
ne sont pas des amis de
Bob
Les amis communs
d’Alice et Bob
Les amis d’Alice et
Bob
28. FACEBOOK GRAPH SEARCH
Requêtes
(weak-end friend:Alice (term friend:Bob :optional-weight 0.2))
(strong-or
(term live-in:Paris :optional-weight 0.1)
(term live-in:Rouen :optional-weight 0.1))
Un groupe d’amis d’Alice dont au moins 80%
sont aussi amis de Bob
Des gens qui vivent à Paris ou Rouen.Au
moins 10% dans chaque ville.
30. FACEBOOK GRAPH SEARCH
Points divers
!
• « we might want to prioritize results for individuals
who are close in age to the user typing the query »
!
• pour la recherche « standard », les algorithmes usuels
sont utilisés
!
• Le graph search est plus une prouesse technique
qu’algorithmique
31. DE LA PUB PERSONNALISÉE
Une pub personnalisé
serait plus efficace
qu’une pub standard
32. DE LA PUB PERSONNALISÉE
Une pub personnalisé
serait plus efficace
qu’une pub standard
Ce n’est pas la
discussion du jour, mais
cette phrase est
largement douteuse
33. DE LA PUB PERSONNALISÉE
On va estimer le
CTR de chaque
pub pour chaque
utilisateur
utilisateur : genre, age, amis, likes, localisation
annonceur : critère de ciblage, bid pour l’enchère
enchère : on classe les pubs par
bid * CTR estimé
+
+
= 10%
= 0,01%
34. DE LA PUB PERSONNALISÉE
On place
l’utilisateur et les
pubs dans l’espace
des concepts
Parfum
Pêche
On crée un
estimateur par
proximité
géométrique
35. DE LA PUB PERSONNALISÉE
On place
l’utilisateur et les
pubs dans l’espace
des concepts
Parfum
Pêche
On crée un
estimateur par
proximité
géométrique
Technique très similaire au Cosinus
de Salton utilisé par les moteurs pour
l’analyse de la pertinence d’un texte
par rapport à une requête
36. DE LA PUB PERSONNALISÉE
Placer l’utilisateur dans
l’espace des concepts :
extraire un modèle
Lecture du statut : « j’aime la
pêche au gros »
Les likes (sur une page sur la
pêche à la mouche)
Les commentaires : « Bob, tu
étais encore à la pêche hier ? »
L’âge, l’endroit, etc.
Les pubs précédemment
cliquées
Etc…
37. DE LA PUB PERSONNALISÉE
Placer la pub dans l’espace des concepts : extraire un
modèle par classification de texte
!
Algos de classification supervisé (Dekel et al. 2004 par
exemple)
Shopping/clothing : 80%
Art/Fashion : 30%
Pêche à la morue : 0%