SlideShare une entreprise Scribd logo
1  sur  57
Télécharger pour lire hors ligne
InstitutMines-Télécom
Les systèmes de
recommandations
Romain Picot-Clémente
Institut Mines-Télécom
Introduction
21/07/2015 Les systèmes de recommandations
2
Origines
Systèmes hypermédia adaptatifs
• Personnalisation de la présentation (feuille de
style, disposition des éléments, etc.)
• Personnalisation de la navigation (modification
du graphe hypermédia)
• Personnalisation du contenu (modification de la
complexité du contenu selon contexte, profil,
etc.)
Systèmes de recommandations
Systèmes hypermédia adaptatifs (Brusilovsky et al., 1996)
Introduit initialement
pour le e-learning
3 Institut Mines-Télécom Les systèmes de recommandations - Introduction
21/07/2015
Origines
Systèmes de recommandations
Systèmes hypermédia adaptatifs
Systèmes de recommandations
Personnalisation de la navigation (modification du
graphe hypermédia)
4 Institut Mines-Télécom Les systèmes de recommandations - Introduction
21/07/2015
Systèmes de recommandations :
A quoi ça sert ?
Pour l’utilisateur
Intérêt utilisateur
• Réduire le temps de recherche d’information
• Découvrir des produits difficiles à trouver
• …
𝐴𝑚é𝑙𝑖𝑜𝑟𝑒𝑟 𝑙′𝑒𝑥𝑝é𝑟𝑖𝑒𝑛𝑐𝑒 𝑢𝑡𝑖𝑙𝑖𝑠𝑎𝑡𝑒𝑢𝑟
Pour le fournisseur
5 Institut Mines-Télécom Les systèmes de recommandations - Introduction
21/07/2015
Pour le fournisseur
Pour l’utilisateur
Intérêt pour fournisseur du service
Systèmes de recommandations :
A quoi ça sert ?
• Garder/engager/fidéliser les clients
• Orienter les clients
• Augmenter les bénéfices
• …
6 Institut Mines-Télécom Les systèmes de recommandations - Introduction
21/07/2015
Applications
Exemples de domaines d’application
• Films (Netflix, Allocine, …)
• Musiques (Deezer, …)
• Jeux vidéo (Steam, Microsoft Xbox Live, ...)
• Livres (Amazon, Fnac, …)
• « Amis » (Facebook, Twitter, Google+, …)
• Tourisme (Expedia, …)
• e-Shopping (Cdiscount, eBay, Amazon, Fnac, …)
• Publicité ciblée (Criteo, …)
• Nutrition/sport/bien-être (Withings, Fitnext, …)
• Médical
• …
7 Institut Mines-Télécom Les systèmes de recommandations - Introduction
21/07/2015
Définitions, types de
systèmes de recommandation
8 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Items, utilisateurs, matrice d’usage
Matrice d’usage
Deux classes d’entités
Items et utilisateurs
• Utilisateurs : individus cibles de la recommandation
• Items : ensemble des éléments possiblement recommandables
aux utilisateurs
9 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Items, utilisateurs, matrice d’usage
Matrice d’usage
SW3
A
B
C
HP1 HP2 HP3 TW SW1 SW2
4 5 1
5 5 4
2 4 5
D 3 3
Valeur inconnue
Utilisateurs
Deux classes d’entités
Matrice d’usage : relie utilisateurs et items par une
matrice de score
Items
Le score peut représenter
différents types d’interaction : une
note, un nombre d’utilisation, une
durée, un « like », etc.
10 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Deux grands groupes de systèmes de
recommandations
Filtrage collaboratif (collaborative filtering)
Basé sur le contenu (content-based)
Systèmes de recommandations basés sur le contenu
Basé sur la similarité du profil de l’utilisateur avec le profil des items
11 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Deux grands groupes de systèmes de
recommandations
Filtrage collaboratif (collaborative filtering)
Basé sur le contenu (content-based)
Systèmes de recommandations par filtrage collaboratif
Basé sur la similarité de comportement (achats, visites, clics, notes, etc.)
entre les utilisateurs
12 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Systèmes de recommandations
basés sur le contenu
13 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Principe général de la recommandation
basée sur le contenu
Profilage items et utilisateur
Recommandation par distance
• Profil items : vecteur de scores sur des attributs/descripteurs
• Profilage utilisateurs :
— Implicite (selon les interactions avec les items)
— Explicite (question directe)
Utilisateur
Profil
utilisateur
(vecteur
d’attributs)
Items
Profilage
items Profils
items
(vecteurs
d’attributs)
Profilage
utilisateur
Interactions
Faire attention aux
échelles entres attributs
14 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Principe général de la recommandation
basée sur le contenu
Profilage items et utilisateur
Recommandation par distance
Utilisateur
Profil
utilisateur
(vecteur
d’attributs)
Items
Profilage
items Profils
items
(vecteurs
d’attributs)
Calcul de
distances
Les items avec
des profils
proches sont
recommandés
Profilage
utilisateur
Interactions
• Calcul de distances entre profils utilisateur-items
(distance cosinus, jaccard (pour 0-1 scores), Pearson, …)
• Recommandation des items les plus proches
15 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
• Bob a aimé A et C
— Vecteur utilisateur:
• Profilage de Bob
— Vecteur profil:
• Recommandation
— Distance de Pearson entre 𝑝 et chaque vecteur film/genre (ligne de 𝐼)
— Recommandation des films dont les distances avec 𝑝 sont les plus proches
Horreur Epouvante Action Romance Comédie Animation Sci-Fi Film
d’auteur
A 1 1 1
B 1 1 1
C 1 1 1
D 1 1
E 1 1
Films
Genre
Matrice 𝐼 =
𝑢 = 1
𝑝 = 𝑢. 𝐼 = 1 0 2 0 2 1 0 0
0 1 0 0
Horreur Epouvante Action Romance Comédie Animation Sci-Fi Film
d’auteur
A B C D E
Autres approches
Approche classique
Approche classique : exemple
16 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches pour la recommandation basée
sur le contenu
Approches pour la recommandation basée
sur le contenu
Approche classique
Autres approches
• Passage dans un espace latent de dimensions plus faibles, pour
augmenter la densité de la matrice item-attribut (classification
non-supervisée des items). Calcul de distance utilisateur-item
dans cet espace.
• Réduction de dimension par utilisation d’ontologies pour relier
des attributs dont les concepts sont plus ou moins éloignés (ex:
maths et physiques en sciences). Toujours dans le but
d’augmenter la densité de la matrice item-attribut.
• Modèle d’apprentissage pour chaque utilisateur (réseau de
neurones, arbre de décision, forêt aléatoire, SVM, etc.) pour
prédire si un item va correspondre à l’utilisateur ou non.
Autres approches
17 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Système de recommandation
basé sur le filtrage collaboratif
18 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Principe de base de la recommandation par
filtrage collaboratif
Interaction utilisateurs
sur items
Matrice d’usage
Similaritésentre
les utilisateurs
sim(Alice, Bob) > sim(Chris,Bob)
Recommandation basée sur la similarité des usages entre
utilisateurs
Matrice d’usage
1 1 0 −1
1 1 −1 1
0 −1 1 0
1 0 −1 0
Les recommandations pour un utilisateur
U sont les items qui sont aimés par les
utilisateurs qui lui sont similaires
19 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches pour la recommandation par
filtrage collaboratif
A 4 5 1
B 5 5 4
C 2 4 5
D 3 3
Utilisateurs
HP1 HP2 HP3 TW SW1 SW2 SW3
A 2/3 5/3 -7/3
B 1/3 1/3 -2/3
C -5/3 1/3 4/3
D 0 0
Utilisateurs
Films
A savoir:
Il existe aussi le
filtrage collaboratif
par voisinageitem
Approche classique : voisinage utilisateur
Exemple 1 : filtrage collaboratif par voisinage utilisateur
Films
HP1 HP2 HP3 TW SW1 SW2 SW3
• Matrice d’usage
• Utilisateur cible 𝐴
• Normalisation par ligne (soustractions de la valeur moyenne)
• Similarités de Pearson
𝑠𝑖𝑚(𝐴, 𝐵) = 0,06 ; 𝑠𝑖𝑚(𝐴, 𝐶) = −0,69 ; 𝑠𝑖𝑚(𝐴, 𝐷) = 0
• Recommandations : 𝑠𝑐𝑜𝑟𝑒 𝐴, 𝑖𝑡𝑒𝑚 = u∈utilisateurs sim A,u × score u,item
u∈utilisateurs sim A,u
𝑠𝑐𝑜𝑟𝑒 𝐴, 𝐻𝑃2 = 0,03 ; 𝑠𝑐𝑜𝑟𝑒 𝐴, 𝐻𝑃3 = −0,05 ;
𝑠𝑐𝑜𝑟𝑒(𝐴, 𝑆𝑊2) = −1,23 ; 𝑠𝑐𝑜𝑟𝑒(𝐴, 𝑆𝑊3) = 0
Inconvénients
-Temps de calcul important s’ily
a beaucoup d’utilisateurs/items
-Difficile de trouver des
similarités dans des matrices
d’usage peu dense (ce qui est
généralement le cas)
Clustering
Factorisation matricielle
Autres
20 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches pour la recommandation par
filtrage collaboratif
• Matrice d’usage
• Regroupement desitems
• Le score d’un utilisateur pour un item est le score pour son cluster. Exemple :
𝑠𝑐𝑜𝑟𝑒(𝐴, 𝐻𝑃2) = 4
• S’il n’y a aucune valeur (ou 𝑠𝑐𝑜𝑟𝑒 = 0) alors calcul du score basé sur similarité des
utilisateurs (comme exemple précédent) sur la matrice de utilisateurs- clusters
HP1 HP2 HP3 TW SW1 SW2 SW3
A 4 5 1
B 5 5 4
C 2 4 5
D 3 3
Utilisateurs
Approche classique : voisinage utilisateur
Clustering
Exemple 2 : filtrage collaboratif par regroupement (clustering)
Films
Le clustering peut se
faire sur les
utilisateurs et/ou
items, et plusieurs fois
si besoin
Factorisation matricielle
Autres
21 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Cluster de films
HP TW SW
A 4 5 1
B 4,67
C 2 4,5
D 3 3
Utilisateurs
Approches pour la recommandation par
filtrage collaboratif
• Soit une matrice d’usage 𝑀 ∶ 𝑈𝑡𝑖𝑙𝑖𝑠𝑎𝑡𝑒𝑢𝑟𝑠 ×𝐼𝑡𝑒𝑚𝑠
• Factorisation matricielle 𝑆𝑉𝐷 (singular value decomposition)
𝑀 = 𝑈𝑆𝑉𝑇
•Les 𝑛 premières valeurs singulières de 𝑆 sont gardées et donne une nouvelle matrice
diagonale 𝑆’
• Nouvelle matrice de score selon les valeurs singulières sélectionnées
𝑀’ = 𝑈𝑆′ 𝑉𝑇
• Les items avec les plus grands scores sont recommandés à l’utilisateur
Approche classique : voisinage utilisateur
Clustering
Factorisation matricielle
Exemple 3: filtrage collaboratif par factorisation matricielle SVD
Autres
Il existe denombreux
autres types de
factorisation
matricielle
22 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches pour la recommandation par
filtrage collaboratif
Autres
Approche classique : voisinage utilisateur
Clustering
Factorisation matricielle
De nombreuses autres approches
• Règles d’association
• Parcours de graphe
• Modèle d’apprentissage
23 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Avantages et inconvénients
des deux approches
24 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Avantages et inconvénients des deux
approches
— Permet des recommandations de nouveaux items
— Un nouvel utilisateur peut recevoir des recommandations
dés ses premières interactions avec le système
• Inconvénient
— Nécessite une quantité importante de descripteurs sur les
items et/ou utilisateurs
SR basé sur le contenu
Systèmes de recommandations basés sur le contenu
• Avantages
SR basé sur le filtrage collaboratif
25 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
• Avantage
— Pas besoin de descripteurs sur les items/utilisateurs
• Inconvénient
— Problème de démarrage à froid, pas de recommandations
possibles s’il n’y a pas eu suffisamment d’interactions
utilisateurs/items
SR basé sur le contenu
Systèmes de recommandations basés sur le filtrage collaboratif
SR basé sur le filtrage collaboratif
26 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Avantages et inconvénients des deux
approches
SR basé sur le contenu
SR basé sur le filtrage collaboratif
Ces deux approches ne sont pas
disjointes et sont la plupart du temps
combinées
Avantages et inconvénients des deux
approches
27 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Recommandation tenant compte
d’informations additionnelles
28 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
De nombreuses informations additionnelles
Sur utilisateurs/items
Informations additionnelles sur utilisateurs/items
• Informations personnels (âge, métier, genre, …)
• Réseau social
• Tags
• Positions géographiques
• Commentaires, avis textuels
Sur interactions U-I
29 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
De nombreuses informations additionnelles
Sur interactions U-I
Sur utilisateurs/items
Informations contextuelles associées aux interactions U-I
• Temps (Heure)
• Météo
• Humeur
• Position géographique
30 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
De nombreuses informations additionnelles
Sur utilisateurs/items
Sur interactions U-I
Vers des systèmes de plus en plus sensibles au
contexte, au temps, aux habitudes, aux
interactions sociales, aux sentiments, …
31 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
Matrice
U-I
Voisinage
utilisateur/item
Informations
additionnelles
utilisateurs
Voisinage
utilisateur
Voisinage
item
Information
additionnelles
items
Recommandations
Voisinages
Approches par voisinages
Modèles d’apprentissage
Modèles à facteurs latents
Graphes
32 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
Modèles à facteurs latents
Graphes
Matrice
U-I
Paramètres
Informations
additionnelles
utilisateurs
Informations
additionnelles
items
Apprentissage d’un
modèle prédictif
basé sur les
paramètres
Paramètres
Paramètres
Recommandations
Voisinages
Modèles d’apprentissage
Approches par modèles d’apprentissage
33 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
Graphes
Modèle prédictif
Matrice
U-I U
Informations
additionnelles
utilisateurs
Informations
additionnelles
items
Recommandations
V
U
P
V
Q
Factorisation de U-I sous contrainte
des informations additionnelles
Voisinages
Modèles d’apprentissage
Modèles à facteurs latents
Approches par modèles à facteurs latents
34 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
Graphes
Voisinages
Modèles d’apprentissage
Modèles à facteurs latents
Approches par graphes
Matrice
U-I
Informations
additionnelles
utilisateurs
Informations
additionnelles
items
Approches par
exploration du
graphe
Recommandations
Graphe incluant
utilisateurs, items,
entités issues des
informations
additionnelles, et
leurs relations
35 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches
Complexité du
modèle
Complexité
spatiale
Complexité
temporelle
Explicabilité
des résultats
Voisinages Moyenne Importante Importante Importante
Modèles Importante Faible Importante Faible
Graphes Faible Moyenne Importante Moyenne
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
Propriétés succinctes des approches
36 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
Factorisation tensorielle
« Factorization Machines »
Graphes
Dépendantes du temps
Méthodes par filtrage collaboratif dépendantes du temps
Méthodes qui favorisent les interactions plus récentes afin
de proposer des recommandations plus en phase avec les
profils courants.
Méthodes très spécifiques à
l’information temporelle, ne sont
pas généralisable aux autres
données contextuelles
37 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
« Factorization Machines »
Graphes
Dépendantes du temps
Factorisation tensorielle
Méthodes par factorisation tensorielle
Matrice
U-I
Informations
contextuelles
liées aux
interactions
Tenseur
Utilisateurs
Items
U
V
Modèle
prédictif
Recommandations
38 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
Graphes
Dépendantes du temps
Factorisation tensorielle
« Factorization Machines »
Méthodes par « Factorization Machines » [Rendle, 2010]
• Est une généralisation des méthodes
à base de factorisation
• Permet de considérer à la fois les
informations de contexte et les
informations en rapport avec
items/utilisateurs
« one-hot encoding »
Où il s’agit de déterminer
39 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Factorization machine de degré 2:
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
Graphes
Dépendantes du temps
Factorisation tensorielle
« Factorization Machines »
Méthodes par graphes
Matrice
U-I
Informations
additionnelles
Approches par
exploration du
graphe
Recommandations
Graphe incluant
utilisateurs, items,
entités issues des
informations
additionnelles, et
leurs relations
Permet de considérer à la fois les
informations de contexte et les
informations en rapport avec
items/utilisateurs
40 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches
Complexité du
modèle
Complexité
spatiale
Complexité
temporelle
Explicabilité
des résultats
Tenseurs Importante Faible Importante Faible
Factorization
machines
Importante Faible Importante Faible
Graphes Faible Moyenne Importante Moyenne
Les méthodes FC dépendantes du temps ne sont pas pertinentes dans cette comparaison
elles ne représentent pas un framework général d’utilisation d’information contextuelle pour la recommandation, elles se
limitent à l’utilisation du temps
Propriétés succinctes des approches
41 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
Quelques contributions
42 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Recommandation de lieux pour des réseaux
sociaux géographiques
Informations
géographiques
Réseau social
Réseau social de partage de lieux
(Location-Based SocialNetwork)
Réseau social géographique ?
43 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
𝜶𝑺
𝜷𝑭𝑻
Places
𝜷𝑭
𝜸𝑮
Users
𝑪 =
Places
Users
⋯ ⋯ ⋯
⋮ ⋱ ⋮
⋯ ⋯ ⋯
F=
Users
Places
Graphe de fréquentation (matrice d’usage)
S=
Users
Users
0 ⋯ ⋯
⋮ ⋱ ⋮
⋯ ⋯ 0
Graphe social
Graphe géographique?
Graphe considérant frequentations, social et positions
géographiques (des lieux)
44 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
𝜶𝑺
𝜷𝑭𝑻
𝜷𝑭
𝜸𝑮
Places
Users
𝑪 =
Places
Users
0 ⋯
⋯ 0
⋯ ⋯
⋯ ⋯
⋯ ⋯
Places
⋯ ⋯ ⋯
⋯ ⋯ ⋯
0 ⋯ ⋯
⋯ 0 ⋯
⋯ ⋯ 0
G =
Places
𝑓(𝑥) = 𝑎𝑥𝑏
𝑓(𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒(𝑃𝑙𝑎𝑐𝑒𝑖,𝑃𝑙𝑎𝑐𝑒𝑗))
Global distribution of all users visits
according to the mutual distances
Low distances between places gives
high values in G, and inversely
Scores are computed according to
the distances between places
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
Graphe géographique
45 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
𝐾𝑎𝑡𝑧 𝐶 = 𝛽𝐶 + 𝛽2𝐶2 + 𝛽3𝐶3 + ⋯
converge pour 0 ≤ 𝛽 <
1
max( 𝜆 𝐶 )
max( 𝜆 𝐶 ) est la plus grande valeur propre de 𝐶 (appelé rayonspectral)
𝐹′
Matrice des scores de prédiction
après propagation de Katz
Users
𝐾𝑎𝑡𝑧(𝐶) =
Places
Users Places
⋯
⋯ ⋯
Complexité algorithmique:
𝑂 𝑁𝑢 × 𝑛𝑛𝑧 , avec 𝑁𝑢, le nombre de
d’utilisateurs et 𝑛𝑛𝑧, le nombre de
« non-zero » dans 𝐹𝐹𝑇 𝑘
𝐾𝑎𝑡𝑧 𝐶 12 = 𝛽 𝐹 + 𝛽2 𝑆𝐹 + 𝐹𝐺
+ 𝛽3 𝑆2𝐹 + 𝐹𝐹𝑇𝐹 + 𝑆𝐹𝐺 + 𝐹𝐺2 + ⋯
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
Centralité de Katz [Katz, 1953]
Permet d’identifier des relations
distantes entre des nœuds d’un
graphe
46 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
𝐾𝑎𝑡𝑧 𝐶 12 = 𝛽 𝐹 + 𝛽2 𝑆𝐹 + 𝐹𝐺
+ 𝛽3 𝑆2𝐹 +𝐹𝐹𝑇𝐹 + 𝑆𝐹𝐺 + 𝐹𝐺2 + ⋯
Places visited by friends
Places close to the
visited places
Places visited by friends
of friends
Places visited by users
that have visited the
same places
Places close to places
visited by friends
Places close to places
close to the visited
places
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
Les chemins considérés dans 𝑲𝒂𝒕𝒛 𝑪 𝟏𝟐
47 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Context and social based recommender
system using association rules
DB History
Learningpart
Offline
Recommendation part
Online
Association rules
mining
All users' past
visitingsessions
Rules selection
DB
Association
Rules
Rules scoring
Items selection
- visiting session
- position
- desired TOR
- friends
Profile
selected rules
with scores
recommendations
Recommandation contextuelle et sociale de lieux qui dépend du type de
recommandation désiré par l’utilisateur
• Contexte:
— Session de visites
— Positioncourante
— Type de recommandation
désiré (veut-il des
recommandationsévidentes
? surprenantes ? rares ?
populaires ?)
• Visites passées des amis
48 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Context and social based recommender
system using association rules
Learning part
Partie hors-ligne, apprentissage
de règles d’association
Recommendation part
• Transaction : session de visites
(ensemble de lieux)
• Extraction de toutes les règles
d’association
49 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Context and social based recommender
system using association rules
Learning part
Partie en-ligne, temps-réelle,
moteur de recommandation
Recommendation part
• Sélection de règles
correspondantes à la session de
visites de l’utilisateur
• Calcul de scores de pertinences
pour chaque règles sélectionnées
selon une mesure de pertinence
• Pondération et sélection des
items à recommander
𝑀𝑝 𝑟𝑖 = 𝑀𝑔 𝑟𝑖 𝛼𝑀𝑖 𝑟𝑖+ 1 − 𝛼 𝑀𝑠 𝑟𝑖
• 𝑴𝒊 dépend du type de recommandation désiré:
Confiance, Surprise, Rareté, Popularité
• 𝑴𝐠 dépend de la position géographique courante de
l’utilisateur. Elle met en avant les règles dont le lieu
conséquent n’est pas trop éloigné de l’utilisateur.
• 𝑴𝐬 dépend des visites des utilisateurs amis. Elle met en
avant les règles qui se sont vérifiées souvent chez les
amis de l’utilisateur courant.
50 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Institut Mines-Télécom
Evaluation de la qualité des
recommandations
21/07/2015 Les systèmes de recommandations
51
Hors ligne
Evaluation hors ligne
• Jeux d’apprentissage et de test
— Pas de convention pour définir ces jeux
• Algorithme de recommandation sur jeu d’apprentissage
• Matrice de score prédis ou k-recommandations
• Mesures de qualité
— RMSE entre scores prédis et scores réels
— Rappel, Précision, F1-Score, ROC
En ligne
Problème
Chercher à « améliorer la prédiction des
futures scores/actions des utilisateurs »,
diffère de « améliorer la qualité des
recommandations »
52 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Evaluation de la qualité des recommandations
Evaluation de la qualité des recommandations
Hors ligne
Evaluation en ligne
• A/B testing
— Test de recommandations différentes sur un groupe A et un groupe B
d’individus
— Validation méthode dont les recommandations ont amélioré une fonction
objectif (augmentation du nombre d’achat, du bénéfice, du temps passé par
les utilisateurs sur les pages, satisfaction des utilisateur, etc.)
En ligne
Problème
Très couteux à mettre en place
53 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Quelques perspectives du
domaine
54 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Quelles pistes pour améliorer les
recommandations ?
Quelques perspectives du domaine
55 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
o Social
• Identification d’utilisateurs plus enclins à la recommandation sociale
• Quelle est la nature exacte de la corrélation entre les intérêts utilisateurs et les relations sociales ?
Quel impact sur les recommandations ?
• Recommandation considérant les relations sociales négatives
o Recommandation pour un groupe
• Etude de la structure/dynamique d’un groupe pour la recommandation (qui est le chef ? qui est
influençable ? comment se propage l’information ?)
o Recommandations interactives
• Profilage interactif de l’utilisateur par des questions/propositions explicites
o Profilage plus précis par analyse textuelle
o Intégration des interactions textuelles, analyse de sentiments
o Acquisition et intégration des tendances relatives aux habitudes
o Méthodes à apprentissage profond, deep learning
o Formalisation des conditions d’évaluation des systèmes de
recommandation selon les caractéristiques du jeu de données et les
objectifs de recommandation
o Recommandation combinatoire (cf. ma thèse)
o Est-ce que les recommandations fournies par mon modèle tendent à
uniformiser les profils des utilisateurs ? Quelle est sa convergence ?
o Plus généralement : systèmes de recommandation sensibles au temps
(TARS) et sensibles au contexte (CARS)
Conclusion
56 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
Conclusion
57 Institut Mines-Télécom Les systèmes de recommandations
21/07/2015
o Un système de recommandation demande un(e):
• Analyse/modélisation des interactions, comportements
• Analyse/profilage des utilisateurs, items
• Méthode/algorithme de recommandation basé sur ces analyses/modèles et
dépendante des contraintes, objectifs de recommandation
• Méthode d’évaluation détaillée, comparaison avec d’autres méthodes dans les
mêmes conditions
o De nombreuses pistes à développer dans le domaine

Contenu connexe

Similaire à presentationdecide.pptx

Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning Novagen Conseil
 
Movie Recommendation system
Movie Recommendation systemMovie Recommendation system
Movie Recommendation systemSakher BELOUADAH
 
Les tests utilisateurs pour les petits budgets
Les tests utilisateurs pour les petits budgetsLes tests utilisateurs pour les petits budgets
Les tests utilisateurs pour les petits budgetsL_Demontiers
 
UX Design - Soutenance 2016 Marie Glandus
UX Design - Soutenance 2016 Marie GlandusUX Design - Soutenance 2016 Marie Glandus
UX Design - Soutenance 2016 Marie GlandusMarie Glandus
 
Dicen Tagging Mars2010
Dicen Tagging Mars2010Dicen Tagging Mars2010
Dicen Tagging Mars2010Freddy Limpens
 
Introduction à l'ergonomie - Drupal Lyon
Introduction à l'ergonomie - Drupal LyonIntroduction à l'ergonomie - Drupal Lyon
Introduction à l'ergonomie - Drupal LyonOlivier Lorrain
 
Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...
Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...
Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...Olivier Orfila
 
Algorithme de suggestion: Vos données au service de Netflix
Algorithme de suggestion: Vos données au service de NetflixAlgorithme de suggestion: Vos données au service de Netflix
Algorithme de suggestion: Vos données au service de Netflixlaurence allard
 
Main recsys factorisation
Main recsys factorisationMain recsys factorisation
Main recsys factorisationStéphane Canu
 
L'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cherL'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cherHubert Maisonneuve
 
Learning analytics, projet Hubble
Learning analytics, projet HubbleLearning analytics, projet Hubble
Learning analytics, projet HubbleVanda Luengo
 
i.a et droit - données d'apprentissage - village de la legaltech
i.a et droit - données d'apprentissage - village de la legaltechi.a et droit - données d'apprentissage - village de la legaltech
i.a et droit - données d'apprentissage - village de la legaltechLaurane Coudriet
 
ENSEIRB - Stage 3A @IIT Chicago
ENSEIRB - Stage 3A @IIT ChicagoENSEIRB - Stage 3A @IIT Chicago
ENSEIRB - Stage 3A @IIT ChicagoArnaud Lempereur
 
Social network metrics and trust based recommendation
Social network metrics and trust based recommendationSocial network metrics and trust based recommendation
Social network metrics and trust based recommendationJimmy Siméon
 
FLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caretFLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caretjfeudeline
 
L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...
L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...
L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...CARLsurvey2010
 

Similaire à presentationdecide.pptx (20)

Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning
 
Movie Recommendation system
Movie Recommendation systemMovie Recommendation system
Movie Recommendation system
 
Les tests utilisateurs pour les petits budgets
Les tests utilisateurs pour les petits budgetsLes tests utilisateurs pour les petits budgets
Les tests utilisateurs pour les petits budgets
 
Mahout clustering
Mahout clusteringMahout clustering
Mahout clustering
 
UX Design - Soutenance 2016 Marie Glandus
UX Design - Soutenance 2016 Marie GlandusUX Design - Soutenance 2016 Marie Glandus
UX Design - Soutenance 2016 Marie Glandus
 
Dicen Tagging Mars2010
Dicen Tagging Mars2010Dicen Tagging Mars2010
Dicen Tagging Mars2010
 
Extreme Data Science
Extreme Data ScienceExtreme Data Science
Extreme Data Science
 
Introduction à l'ergonomie - Drupal Lyon
Introduction à l'ergonomie - Drupal LyonIntroduction à l'ergonomie - Drupal Lyon
Introduction à l'ergonomie - Drupal Lyon
 
Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...
Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...
Influence de l’infrastructure routière sur l’occurrence des pertes de contrôl...
 
Algorithme de suggestion: Vos données au service de Netflix
Algorithme de suggestion: Vos données au service de NetflixAlgorithme de suggestion: Vos données au service de Netflix
Algorithme de suggestion: Vos données au service de Netflix
 
Main recsys factorisation
Main recsys factorisationMain recsys factorisation
Main recsys factorisation
 
L'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cherL'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cher
 
Webinaire: ROBIS
Webinaire: ROBISWebinaire: ROBIS
Webinaire: ROBIS
 
Learning analytics, projet Hubble
Learning analytics, projet HubbleLearning analytics, projet Hubble
Learning analytics, projet Hubble
 
i.a et droit - données d'apprentissage - village de la legaltech
i.a et droit - données d'apprentissage - village de la legaltechi.a et droit - données d'apprentissage - village de la legaltech
i.a et droit - données d'apprentissage - village de la legaltech
 
ENSEIRB - Stage 3A @IIT Chicago
ENSEIRB - Stage 3A @IIT ChicagoENSEIRB - Stage 3A @IIT Chicago
ENSEIRB - Stage 3A @IIT Chicago
 
Social network metrics and trust based recommendation
Social network metrics and trust based recommendationSocial network metrics and trust based recommendation
Social network metrics and trust based recommendation
 
CM patterns
CM patternsCM patterns
CM patterns
 
FLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caretFLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caret
 
L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...
L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...
L'utilisation des médias sociaux dans les bibliothèques universitaires canadi...
 

Plus de WijdenBenothmen1

MovieRecommenderSystem.pptx
MovieRecommenderSystem.pptxMovieRecommenderSystem.pptx
MovieRecommenderSystem.pptxWijdenBenothmen1
 
Kolesnikova_Machine_Learning_for_.NET_developers.pptx
Kolesnikova_Machine_Learning_for_.NET_developers.pptxKolesnikova_Machine_Learning_for_.NET_developers.pptx
Kolesnikova_Machine_Learning_for_.NET_developers.pptxWijdenBenothmen1
 
Machine Learning for Mind sharpeners.pptx
Machine Learning for Mind sharpeners.pptxMachine Learning for Mind sharpeners.pptx
Machine Learning for Mind sharpeners.pptxWijdenBenothmen1
 
EthereumBlockchainMarch3 (1).pptx
EthereumBlockchainMarch3 (1).pptxEthereumBlockchainMarch3 (1).pptx
EthereumBlockchainMarch3 (1).pptxWijdenBenothmen1
 
OMB_Blockchain_Les_principes_fonctionnement.pptx
OMB_Blockchain_Les_principes_fonctionnement.pptxOMB_Blockchain_Les_principes_fonctionnement.pptx
OMB_Blockchain_Les_principes_fonctionnement.pptxWijdenBenothmen1
 
Introduction_to_Blockchain_&_Ethereum.pptx
Introduction_to_Blockchain_&_Ethereum.pptxIntroduction_to_Blockchain_&_Ethereum.pptx
Introduction_to_Blockchain_&_Ethereum.pptxWijdenBenothmen1
 

Plus de WijdenBenothmen1 (8)

MovieRecommenderSystem.pptx
MovieRecommenderSystem.pptxMovieRecommenderSystem.pptx
MovieRecommenderSystem.pptx
 
Kolesnikova_Machine_Learning_for_.NET_developers.pptx
Kolesnikova_Machine_Learning_for_.NET_developers.pptxKolesnikova_Machine_Learning_for_.NET_developers.pptx
Kolesnikova_Machine_Learning_for_.NET_developers.pptx
 
Machine Learning for Mind sharpeners.pptx
Machine Learning for Mind sharpeners.pptxMachine Learning for Mind sharpeners.pptx
Machine Learning for Mind sharpeners.pptx
 
Chapter 4--converted.pptx
Chapter 4--converted.pptxChapter 4--converted.pptx
Chapter 4--converted.pptx
 
EthereumBlockchainMarch3 (1).pptx
EthereumBlockchainMarch3 (1).pptxEthereumBlockchainMarch3 (1).pptx
EthereumBlockchainMarch3 (1).pptx
 
OMB_Blockchain_Les_principes_fonctionnement.pptx
OMB_Blockchain_Les_principes_fonctionnement.pptxOMB_Blockchain_Les_principes_fonctionnement.pptx
OMB_Blockchain_Les_principes_fonctionnement.pptx
 
Introduction_to_Blockchain_&_Ethereum.pptx
Introduction_to_Blockchain_&_Ethereum.pptxIntroduction_to_Blockchain_&_Ethereum.pptx
Introduction_to_Blockchain_&_Ethereum.pptx
 
blockchain
blockchainblockchain
blockchain
 

presentationdecide.pptx

  • 3. Origines Systèmes hypermédia adaptatifs • Personnalisation de la présentation (feuille de style, disposition des éléments, etc.) • Personnalisation de la navigation (modification du graphe hypermédia) • Personnalisation du contenu (modification de la complexité du contenu selon contexte, profil, etc.) Systèmes de recommandations Systèmes hypermédia adaptatifs (Brusilovsky et al., 1996) Introduit initialement pour le e-learning 3 Institut Mines-Télécom Les systèmes de recommandations - Introduction 21/07/2015
  • 4. Origines Systèmes de recommandations Systèmes hypermédia adaptatifs Systèmes de recommandations Personnalisation de la navigation (modification du graphe hypermédia) 4 Institut Mines-Télécom Les systèmes de recommandations - Introduction 21/07/2015
  • 5. Systèmes de recommandations : A quoi ça sert ? Pour l’utilisateur Intérêt utilisateur • Réduire le temps de recherche d’information • Découvrir des produits difficiles à trouver • … 𝐴𝑚é𝑙𝑖𝑜𝑟𝑒𝑟 𝑙′𝑒𝑥𝑝é𝑟𝑖𝑒𝑛𝑐𝑒 𝑢𝑡𝑖𝑙𝑖𝑠𝑎𝑡𝑒𝑢𝑟 Pour le fournisseur 5 Institut Mines-Télécom Les systèmes de recommandations - Introduction 21/07/2015
  • 6. Pour le fournisseur Pour l’utilisateur Intérêt pour fournisseur du service Systèmes de recommandations : A quoi ça sert ? • Garder/engager/fidéliser les clients • Orienter les clients • Augmenter les bénéfices • … 6 Institut Mines-Télécom Les systèmes de recommandations - Introduction 21/07/2015
  • 7. Applications Exemples de domaines d’application • Films (Netflix, Allocine, …) • Musiques (Deezer, …) • Jeux vidéo (Steam, Microsoft Xbox Live, ...) • Livres (Amazon, Fnac, …) • « Amis » (Facebook, Twitter, Google+, …) • Tourisme (Expedia, …) • e-Shopping (Cdiscount, eBay, Amazon, Fnac, …) • Publicité ciblée (Criteo, …) • Nutrition/sport/bien-être (Withings, Fitnext, …) • Médical • … 7 Institut Mines-Télécom Les systèmes de recommandations - Introduction 21/07/2015
  • 8. Définitions, types de systèmes de recommandation 8 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 9. Items, utilisateurs, matrice d’usage Matrice d’usage Deux classes d’entités Items et utilisateurs • Utilisateurs : individus cibles de la recommandation • Items : ensemble des éléments possiblement recommandables aux utilisateurs 9 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 10. Items, utilisateurs, matrice d’usage Matrice d’usage SW3 A B C HP1 HP2 HP3 TW SW1 SW2 4 5 1 5 5 4 2 4 5 D 3 3 Valeur inconnue Utilisateurs Deux classes d’entités Matrice d’usage : relie utilisateurs et items par une matrice de score Items Le score peut représenter différents types d’interaction : une note, un nombre d’utilisation, une durée, un « like », etc. 10 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 11. Deux grands groupes de systèmes de recommandations Filtrage collaboratif (collaborative filtering) Basé sur le contenu (content-based) Systèmes de recommandations basés sur le contenu Basé sur la similarité du profil de l’utilisateur avec le profil des items 11 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 12. Deux grands groupes de systèmes de recommandations Filtrage collaboratif (collaborative filtering) Basé sur le contenu (content-based) Systèmes de recommandations par filtrage collaboratif Basé sur la similarité de comportement (achats, visites, clics, notes, etc.) entre les utilisateurs 12 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 13. Systèmes de recommandations basés sur le contenu 13 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 14. Principe général de la recommandation basée sur le contenu Profilage items et utilisateur Recommandation par distance • Profil items : vecteur de scores sur des attributs/descripteurs • Profilage utilisateurs : — Implicite (selon les interactions avec les items) — Explicite (question directe) Utilisateur Profil utilisateur (vecteur d’attributs) Items Profilage items Profils items (vecteurs d’attributs) Profilage utilisateur Interactions Faire attention aux échelles entres attributs 14 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 15. Principe général de la recommandation basée sur le contenu Profilage items et utilisateur Recommandation par distance Utilisateur Profil utilisateur (vecteur d’attributs) Items Profilage items Profils items (vecteurs d’attributs) Calcul de distances Les items avec des profils proches sont recommandés Profilage utilisateur Interactions • Calcul de distances entre profils utilisateur-items (distance cosinus, jaccard (pour 0-1 scores), Pearson, …) • Recommandation des items les plus proches 15 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 16. • Bob a aimé A et C — Vecteur utilisateur: • Profilage de Bob — Vecteur profil: • Recommandation — Distance de Pearson entre 𝑝 et chaque vecteur film/genre (ligne de 𝐼) — Recommandation des films dont les distances avec 𝑝 sont les plus proches Horreur Epouvante Action Romance Comédie Animation Sci-Fi Film d’auteur A 1 1 1 B 1 1 1 C 1 1 1 D 1 1 E 1 1 Films Genre Matrice 𝐼 = 𝑢 = 1 𝑝 = 𝑢. 𝐼 = 1 0 2 0 2 1 0 0 0 1 0 0 Horreur Epouvante Action Romance Comédie Animation Sci-Fi Film d’auteur A B C D E Autres approches Approche classique Approche classique : exemple 16 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 Approches pour la recommandation basée sur le contenu
  • 17. Approches pour la recommandation basée sur le contenu Approche classique Autres approches • Passage dans un espace latent de dimensions plus faibles, pour augmenter la densité de la matrice item-attribut (classification non-supervisée des items). Calcul de distance utilisateur-item dans cet espace. • Réduction de dimension par utilisation d’ontologies pour relier des attributs dont les concepts sont plus ou moins éloignés (ex: maths et physiques en sciences). Toujours dans le but d’augmenter la densité de la matrice item-attribut. • Modèle d’apprentissage pour chaque utilisateur (réseau de neurones, arbre de décision, forêt aléatoire, SVM, etc.) pour prédire si un item va correspondre à l’utilisateur ou non. Autres approches 17 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 18. Système de recommandation basé sur le filtrage collaboratif 18 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 19. Principe de base de la recommandation par filtrage collaboratif Interaction utilisateurs sur items Matrice d’usage Similaritésentre les utilisateurs sim(Alice, Bob) > sim(Chris,Bob) Recommandation basée sur la similarité des usages entre utilisateurs Matrice d’usage 1 1 0 −1 1 1 −1 1 0 −1 1 0 1 0 −1 0 Les recommandations pour un utilisateur U sont les items qui sont aimés par les utilisateurs qui lui sont similaires 19 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 20. Approches pour la recommandation par filtrage collaboratif A 4 5 1 B 5 5 4 C 2 4 5 D 3 3 Utilisateurs HP1 HP2 HP3 TW SW1 SW2 SW3 A 2/3 5/3 -7/3 B 1/3 1/3 -2/3 C -5/3 1/3 4/3 D 0 0 Utilisateurs Films A savoir: Il existe aussi le filtrage collaboratif par voisinageitem Approche classique : voisinage utilisateur Exemple 1 : filtrage collaboratif par voisinage utilisateur Films HP1 HP2 HP3 TW SW1 SW2 SW3 • Matrice d’usage • Utilisateur cible 𝐴 • Normalisation par ligne (soustractions de la valeur moyenne) • Similarités de Pearson 𝑠𝑖𝑚(𝐴, 𝐵) = 0,06 ; 𝑠𝑖𝑚(𝐴, 𝐶) = −0,69 ; 𝑠𝑖𝑚(𝐴, 𝐷) = 0 • Recommandations : 𝑠𝑐𝑜𝑟𝑒 𝐴, 𝑖𝑡𝑒𝑚 = u∈utilisateurs sim A,u × score u,item u∈utilisateurs sim A,u 𝑠𝑐𝑜𝑟𝑒 𝐴, 𝐻𝑃2 = 0,03 ; 𝑠𝑐𝑜𝑟𝑒 𝐴, 𝐻𝑃3 = −0,05 ; 𝑠𝑐𝑜𝑟𝑒(𝐴, 𝑆𝑊2) = −1,23 ; 𝑠𝑐𝑜𝑟𝑒(𝐴, 𝑆𝑊3) = 0 Inconvénients -Temps de calcul important s’ily a beaucoup d’utilisateurs/items -Difficile de trouver des similarités dans des matrices d’usage peu dense (ce qui est généralement le cas) Clustering Factorisation matricielle Autres 20 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 21. Approches pour la recommandation par filtrage collaboratif • Matrice d’usage • Regroupement desitems • Le score d’un utilisateur pour un item est le score pour son cluster. Exemple : 𝑠𝑐𝑜𝑟𝑒(𝐴, 𝐻𝑃2) = 4 • S’il n’y a aucune valeur (ou 𝑠𝑐𝑜𝑟𝑒 = 0) alors calcul du score basé sur similarité des utilisateurs (comme exemple précédent) sur la matrice de utilisateurs- clusters HP1 HP2 HP3 TW SW1 SW2 SW3 A 4 5 1 B 5 5 4 C 2 4 5 D 3 3 Utilisateurs Approche classique : voisinage utilisateur Clustering Exemple 2 : filtrage collaboratif par regroupement (clustering) Films Le clustering peut se faire sur les utilisateurs et/ou items, et plusieurs fois si besoin Factorisation matricielle Autres 21 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 Cluster de films HP TW SW A 4 5 1 B 4,67 C 2 4,5 D 3 3 Utilisateurs
  • 22. Approches pour la recommandation par filtrage collaboratif • Soit une matrice d’usage 𝑀 ∶ 𝑈𝑡𝑖𝑙𝑖𝑠𝑎𝑡𝑒𝑢𝑟𝑠 ×𝐼𝑡𝑒𝑚𝑠 • Factorisation matricielle 𝑆𝑉𝐷 (singular value decomposition) 𝑀 = 𝑈𝑆𝑉𝑇 •Les 𝑛 premières valeurs singulières de 𝑆 sont gardées et donne une nouvelle matrice diagonale 𝑆’ • Nouvelle matrice de score selon les valeurs singulières sélectionnées 𝑀’ = 𝑈𝑆′ 𝑉𝑇 • Les items avec les plus grands scores sont recommandés à l’utilisateur Approche classique : voisinage utilisateur Clustering Factorisation matricielle Exemple 3: filtrage collaboratif par factorisation matricielle SVD Autres Il existe denombreux autres types de factorisation matricielle 22 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 23. Approches pour la recommandation par filtrage collaboratif Autres Approche classique : voisinage utilisateur Clustering Factorisation matricielle De nombreuses autres approches • Règles d’association • Parcours de graphe • Modèle d’apprentissage 23 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 24. Avantages et inconvénients des deux approches 24 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 25. Avantages et inconvénients des deux approches — Permet des recommandations de nouveaux items — Un nouvel utilisateur peut recevoir des recommandations dés ses premières interactions avec le système • Inconvénient — Nécessite une quantité importante de descripteurs sur les items et/ou utilisateurs SR basé sur le contenu Systèmes de recommandations basés sur le contenu • Avantages SR basé sur le filtrage collaboratif 25 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 26. • Avantage — Pas besoin de descripteurs sur les items/utilisateurs • Inconvénient — Problème de démarrage à froid, pas de recommandations possibles s’il n’y a pas eu suffisamment d’interactions utilisateurs/items SR basé sur le contenu Systèmes de recommandations basés sur le filtrage collaboratif SR basé sur le filtrage collaboratif 26 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 Avantages et inconvénients des deux approches
  • 27. SR basé sur le contenu SR basé sur le filtrage collaboratif Ces deux approches ne sont pas disjointes et sont la plupart du temps combinées Avantages et inconvénients des deux approches 27 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 28. Recommandation tenant compte d’informations additionnelles 28 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 29. De nombreuses informations additionnelles Sur utilisateurs/items Informations additionnelles sur utilisateurs/items • Informations personnels (âge, métier, genre, …) • Réseau social • Tags • Positions géographiques • Commentaires, avis textuels Sur interactions U-I 29 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 30. De nombreuses informations additionnelles Sur interactions U-I Sur utilisateurs/items Informations contextuelles associées aux interactions U-I • Temps (Heure) • Météo • Humeur • Position géographique 30 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 31. De nombreuses informations additionnelles Sur utilisateurs/items Sur interactions U-I Vers des systèmes de plus en plus sensibles au contexte, au temps, aux habitudes, aux interactions sociales, aux sentiments, … 31 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 32. Approches tenant compte d’informations additionnelles sur utilisateurs/items Matrice U-I Voisinage utilisateur/item Informations additionnelles utilisateurs Voisinage utilisateur Voisinage item Information additionnelles items Recommandations Voisinages Approches par voisinages Modèles d’apprentissage Modèles à facteurs latents Graphes 32 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 33. Approches tenant compte d’informations additionnelles sur utilisateurs/items Modèles à facteurs latents Graphes Matrice U-I Paramètres Informations additionnelles utilisateurs Informations additionnelles items Apprentissage d’un modèle prédictif basé sur les paramètres Paramètres Paramètres Recommandations Voisinages Modèles d’apprentissage Approches par modèles d’apprentissage 33 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 34. Approches tenant compte d’informations additionnelles sur utilisateurs/items Graphes Modèle prédictif Matrice U-I U Informations additionnelles utilisateurs Informations additionnelles items Recommandations V U P V Q Factorisation de U-I sous contrainte des informations additionnelles Voisinages Modèles d’apprentissage Modèles à facteurs latents Approches par modèles à facteurs latents 34 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 35. Approches tenant compte d’informations additionnelles sur utilisateurs/items Graphes Voisinages Modèles d’apprentissage Modèles à facteurs latents Approches par graphes Matrice U-I Informations additionnelles utilisateurs Informations additionnelles items Approches par exploration du graphe Recommandations Graphe incluant utilisateurs, items, entités issues des informations additionnelles, et leurs relations 35 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 36. Approches Complexité du modèle Complexité spatiale Complexité temporelle Explicabilité des résultats Voisinages Moyenne Importante Importante Importante Modèles Importante Faible Importante Faible Graphes Faible Moyenne Importante Moyenne Approches tenant compte d’informations additionnelles sur utilisateurs/items Propriétés succinctes des approches 36 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 37. Approches tenant compte d’informations contextuelles liées aux interactions U-I Factorisation tensorielle « Factorization Machines » Graphes Dépendantes du temps Méthodes par filtrage collaboratif dépendantes du temps Méthodes qui favorisent les interactions plus récentes afin de proposer des recommandations plus en phase avec les profils courants. Méthodes très spécifiques à l’information temporelle, ne sont pas généralisable aux autres données contextuelles 37 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 38. Approches tenant compte d’informations contextuelles liées aux interactions U-I « Factorization Machines » Graphes Dépendantes du temps Factorisation tensorielle Méthodes par factorisation tensorielle Matrice U-I Informations contextuelles liées aux interactions Tenseur Utilisateurs Items U V Modèle prédictif Recommandations 38 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 39. Approches tenant compte d’informations contextuelles liées aux interactions U-I Graphes Dépendantes du temps Factorisation tensorielle « Factorization Machines » Méthodes par « Factorization Machines » [Rendle, 2010] • Est une généralisation des méthodes à base de factorisation • Permet de considérer à la fois les informations de contexte et les informations en rapport avec items/utilisateurs « one-hot encoding » Où il s’agit de déterminer 39 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 Factorization machine de degré 2:
  • 40. Approches tenant compte d’informations contextuelles liées aux interactions U-I Graphes Dépendantes du temps Factorisation tensorielle « Factorization Machines » Méthodes par graphes Matrice U-I Informations additionnelles Approches par exploration du graphe Recommandations Graphe incluant utilisateurs, items, entités issues des informations additionnelles, et leurs relations Permet de considérer à la fois les informations de contexte et les informations en rapport avec items/utilisateurs 40 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 41. Approches Complexité du modèle Complexité spatiale Complexité temporelle Explicabilité des résultats Tenseurs Importante Faible Importante Faible Factorization machines Importante Faible Importante Faible Graphes Faible Moyenne Importante Moyenne Les méthodes FC dépendantes du temps ne sont pas pertinentes dans cette comparaison elles ne représentent pas un framework général d’utilisation d’information contextuelle pour la recommandation, elles se limitent à l’utilisation du temps Propriétés succinctes des approches 41 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 Approches tenant compte d’informations contextuelles liées aux interactions U-I
  • 42. Quelques contributions 42 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 43. Recommandation de lieux pour des réseaux sociaux géographiques Informations géographiques Réseau social Réseau social de partage de lieux (Location-Based SocialNetwork) Réseau social géographique ? 43 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 44. Graph-based approach for location recommendation in LBSNs using Katz Centrality 𝜶𝑺 𝜷𝑭𝑻 Places 𝜷𝑭 𝜸𝑮 Users 𝑪 = Places Users ⋯ ⋯ ⋯ ⋮ ⋱ ⋮ ⋯ ⋯ ⋯ F= Users Places Graphe de fréquentation (matrice d’usage) S= Users Users 0 ⋯ ⋯ ⋮ ⋱ ⋮ ⋯ ⋯ 0 Graphe social Graphe géographique? Graphe considérant frequentations, social et positions géographiques (des lieux) 44 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 45. 𝜶𝑺 𝜷𝑭𝑻 𝜷𝑭 𝜸𝑮 Places Users 𝑪 = Places Users 0 ⋯ ⋯ 0 ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ Places ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ 0 ⋯ ⋯ ⋯ 0 ⋯ ⋯ ⋯ 0 G = Places 𝑓(𝑥) = 𝑎𝑥𝑏 𝑓(𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒(𝑃𝑙𝑎𝑐𝑒𝑖,𝑃𝑙𝑎𝑐𝑒𝑗)) Global distribution of all users visits according to the mutual distances Low distances between places gives high values in G, and inversely Scores are computed according to the distances between places Graph-based approach for location recommendation in LBSNs using Katz Centrality Graphe géographique 45 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 46. 𝐾𝑎𝑡𝑧 𝐶 = 𝛽𝐶 + 𝛽2𝐶2 + 𝛽3𝐶3 + ⋯ converge pour 0 ≤ 𝛽 < 1 max( 𝜆 𝐶 ) max( 𝜆 𝐶 ) est la plus grande valeur propre de 𝐶 (appelé rayonspectral) 𝐹′ Matrice des scores de prédiction après propagation de Katz Users 𝐾𝑎𝑡𝑧(𝐶) = Places Users Places ⋯ ⋯ ⋯ Complexité algorithmique: 𝑂 𝑁𝑢 × 𝑛𝑛𝑧 , avec 𝑁𝑢, le nombre de d’utilisateurs et 𝑛𝑛𝑧, le nombre de « non-zero » dans 𝐹𝐹𝑇 𝑘 𝐾𝑎𝑡𝑧 𝐶 12 = 𝛽 𝐹 + 𝛽2 𝑆𝐹 + 𝐹𝐺 + 𝛽3 𝑆2𝐹 + 𝐹𝐹𝑇𝐹 + 𝑆𝐹𝐺 + 𝐹𝐺2 + ⋯ Graph-based approach for location recommendation in LBSNs using Katz Centrality Centralité de Katz [Katz, 1953] Permet d’identifier des relations distantes entre des nœuds d’un graphe 46 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 47. 𝐾𝑎𝑡𝑧 𝐶 12 = 𝛽 𝐹 + 𝛽2 𝑆𝐹 + 𝐹𝐺 + 𝛽3 𝑆2𝐹 +𝐹𝐹𝑇𝐹 + 𝑆𝐹𝐺 + 𝐹𝐺2 + ⋯ Places visited by friends Places close to the visited places Places visited by friends of friends Places visited by users that have visited the same places Places close to places visited by friends Places close to places close to the visited places Graph-based approach for location recommendation in LBSNs using Katz Centrality Les chemins considérés dans 𝑲𝒂𝒕𝒛 𝑪 𝟏𝟐 47 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 48. Context and social based recommender system using association rules DB History Learningpart Offline Recommendation part Online Association rules mining All users' past visitingsessions Rules selection DB Association Rules Rules scoring Items selection - visiting session - position - desired TOR - friends Profile selected rules with scores recommendations Recommandation contextuelle et sociale de lieux qui dépend du type de recommandation désiré par l’utilisateur • Contexte: — Session de visites — Positioncourante — Type de recommandation désiré (veut-il des recommandationsévidentes ? surprenantes ? rares ? populaires ?) • Visites passées des amis 48 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 49. Context and social based recommender system using association rules Learning part Partie hors-ligne, apprentissage de règles d’association Recommendation part • Transaction : session de visites (ensemble de lieux) • Extraction de toutes les règles d’association 49 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 50. Context and social based recommender system using association rules Learning part Partie en-ligne, temps-réelle, moteur de recommandation Recommendation part • Sélection de règles correspondantes à la session de visites de l’utilisateur • Calcul de scores de pertinences pour chaque règles sélectionnées selon une mesure de pertinence • Pondération et sélection des items à recommander 𝑀𝑝 𝑟𝑖 = 𝑀𝑔 𝑟𝑖 𝛼𝑀𝑖 𝑟𝑖+ 1 − 𝛼 𝑀𝑠 𝑟𝑖 • 𝑴𝒊 dépend du type de recommandation désiré: Confiance, Surprise, Rareté, Popularité • 𝑴𝐠 dépend de la position géographique courante de l’utilisateur. Elle met en avant les règles dont le lieu conséquent n’est pas trop éloigné de l’utilisateur. • 𝑴𝐬 dépend des visites des utilisateurs amis. Elle met en avant les règles qui se sont vérifiées souvent chez les amis de l’utilisateur courant. 50 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 51. Institut Mines-Télécom Evaluation de la qualité des recommandations 21/07/2015 Les systèmes de recommandations 51
  • 52. Hors ligne Evaluation hors ligne • Jeux d’apprentissage et de test — Pas de convention pour définir ces jeux • Algorithme de recommandation sur jeu d’apprentissage • Matrice de score prédis ou k-recommandations • Mesures de qualité — RMSE entre scores prédis et scores réels — Rappel, Précision, F1-Score, ROC En ligne Problème Chercher à « améliorer la prédiction des futures scores/actions des utilisateurs », diffère de « améliorer la qualité des recommandations » 52 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 Evaluation de la qualité des recommandations
  • 53. Evaluation de la qualité des recommandations Hors ligne Evaluation en ligne • A/B testing — Test de recommandations différentes sur un groupe A et un groupe B d’individus — Validation méthode dont les recommandations ont amélioré une fonction objectif (augmentation du nombre d’achat, du bénéfice, du temps passé par les utilisateurs sur les pages, satisfaction des utilisateur, etc.) En ligne Problème Très couteux à mettre en place 53 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 54. Quelques perspectives du domaine 54 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 Quelles pistes pour améliorer les recommandations ?
  • 55. Quelques perspectives du domaine 55 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 o Social • Identification d’utilisateurs plus enclins à la recommandation sociale • Quelle est la nature exacte de la corrélation entre les intérêts utilisateurs et les relations sociales ? Quel impact sur les recommandations ? • Recommandation considérant les relations sociales négatives o Recommandation pour un groupe • Etude de la structure/dynamique d’un groupe pour la recommandation (qui est le chef ? qui est influençable ? comment se propage l’information ?) o Recommandations interactives • Profilage interactif de l’utilisateur par des questions/propositions explicites o Profilage plus précis par analyse textuelle o Intégration des interactions textuelles, analyse de sentiments o Acquisition et intégration des tendances relatives aux habitudes o Méthodes à apprentissage profond, deep learning o Formalisation des conditions d’évaluation des systèmes de recommandation selon les caractéristiques du jeu de données et les objectifs de recommandation o Recommandation combinatoire (cf. ma thèse) o Est-ce que les recommandations fournies par mon modèle tendent à uniformiser les profils des utilisateurs ? Quelle est sa convergence ? o Plus généralement : systèmes de recommandation sensibles au temps (TARS) et sensibles au contexte (CARS)
  • 56. Conclusion 56 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015
  • 57. Conclusion 57 Institut Mines-Télécom Les systèmes de recommandations 21/07/2015 o Un système de recommandation demande un(e): • Analyse/modélisation des interactions, comportements • Analyse/profilage des utilisateurs, items • Méthode/algorithme de recommandation basé sur ces analyses/modèles et dépendante des contraintes, objectifs de recommandation • Méthode d’évaluation détaillée, comparaison avec d’autres méthodes dans les mêmes conditions o De nombreuses pistes à développer dans le domaine