Introduction aux systèmes de recommandation part 2.pptx
1. Introduction aux systèmes
de recommandation(part 2)
Réalisé par :
BABZINE BAHIJA
ER-RAHMOUNY ZOHAYR
Encadré par :
Mr. El-fenaouy Reda
Mr. Gardelle Bertin
4. 4
Filtrage
Collaboratif
Filtrage Basé
sur le Contenu
système de
recommandation
Traitement du
Langage Naturel
(NLP).
o Text Similarity
o Named Entity Recognition
o Topic Extraction
Fournir des
Recommandations
Personnalisées et Précises
aux Utilisateurs
Rappel
9. 9
Un système de recommandation hybride est un type de système de
recommandation qui combine plusieurs approches de recommandation pour
fournir des suggestions personnalisées aux utilisateurs
Définition
recommandation basée
sur le contenu
recommandation
collaborative
recommandation basée
sur les connaissances
Recommedation
Hybride
10. 10
Types de données pour générer un système de recommandation
Nous pouvons diviser les données en deux types à l'aide desquels nous pouvons générer un système de recommandation
02
Feedback implicite
souvent recueilli à travers l'analyse des
comportements des utilisateurs sur la
plateforme, tels que les clics, les achats, les
recherches ou le temps passé sur une page
01
Feedback explicite
Souvent recueilli à travers des
questionnaires, des évaluations
et des notations fournies
directement par les utilisateurs
Exemple, sur un site de streaming vidéo, les
utilisateurs peuvent donner une note à une série
qu'ils ont regardée ou écrire un commentaire pour
la recommander ou la déconseiller.
exemple, si un utilisateur a regardé plusieurs
épisodes d'une série en particulier, le système de
recommandation peut en déduire qu'il aime cette
série et lui recommander d'autres séries similaires
11. 11
Pertes utilisées par les systèmes de recommandation
Perte par paires du
classement personnalisé
bayésien (BPR)
Lorsque les utilisateurs interagissent
de manière positive avec les
données, nous voulons maximiser la
performance du modèle en termes de
ROC AUC. Pour ce faire, nous
utilisons une technique appelée
perte par paires. Cette technique
vise à maximiser la différence de
prédiction entre la rétroaction
positive de l'utilisateur et une
rétroaction négative sélectionnée au
hasard.
Perte de rang approximatif
pondéré par paires (WARP)
Cette technique est utile lorsque des
commentaires positifs sont
disponibles et que nous cherchons à
optimiser les meilleures
recommandations possibles. Pour y
parvenir, nous échantillonnons
plusieurs fois des rétroactions
négatives jusqu'à ce que nous
trouvions celle qui viole le rang et
ainsi maximisons le rang de la
rétroaction positive.
12. 12
Principales caractéristiques des données implicites
Données
implicites
Pas de
commentaires
négatifs
Intrinsèquement
bruyant
Intrinsèquement
bruyant
13. 13
Apprentissage des systèmes de recommandation
Model
Loss/utility
function
Optimization
algorithm
Output
Parameters
(o)
Training
data
14. 14
Apprentissage des systèmes de recommandation
Nous pouvons choisir n'importe
quel algorithme d'optimisation
qui correspond à notre
objectif. Pour les données
implicites, l'un des meilleurs
algorithmes d'optimisation est
l'alternance des moindres carrés
C'est comme n'importe quelle
autre fonction de perte que nous
avons dans un algorithme
d'apprentissage automatique et
sera minimisée pour arriver à
une solution optimale
Le système de
recommandation est un
modèle basé sur une
factorisation matricielle ou
une régression linéaire avec
des paramètres à optimiser
pour fournir des
recommandations.
Optimization algorithm
Model Loss/utility function
16. 16
Définition
LightFM est une bibliothèque open-source de machine learning pour la
recommandation de contenu qui combine des techniques de factorisation
de matrice pour la recommandation collaborative avec des techniques de
traitement de texte pour la recommandation de contenu.
17. 17
Le fonctionnement de LightFM
Le fonctionnement de LightFM peut être décrit en trois étapes principales:
01
Construction de la matrice d'interaction utilisateur-article : LightFM
construit une matrice d'interaction utilisateur-article en utilisant les
données d'historique d'interaction utilisateur-article disponibles. Cette
matrice peut être vue comme une représentation matricielle de l'ensemble
des préférences des utilisateurs pour les articles.
18. 18
Le fonctionnement de LightFM
Le fonctionnement de LightFM peut être décrit en trois étapes principales:
02
Décomposition de la matrice d'interaction utilisateur-article : LightFM
décompose la matrice d'interaction utilisateur-article en deux matrices de
facteurs latents : une pour les utilisateurs et une pour les articles. Cette
décomposition permet de réduire la dimensionnalité de la matrice d'interaction
et de représenter chaque utilisateur et chaque article dans un espace latent de
facteurs.
19. 19
Le fonctionnement de LightFM
Le fonctionnement de LightFM peut être décrit en trois étapes principales:
03
Prédiction des préférences utilisateur : Pour prédire les préférences d'un
utilisateur pour un article donné, LightFM utilise la similitude entre l'utilisateur
et l'article dans l'espace latent de facteurs. LightFM utilise également des
informations de contenu supplémentaires sur les articles, telles que les mots
clés ou les tags, pour améliorer la précision des prédictions de recommandation
20. 20
Avantages de LightFM
Rapidité et efficacité dans la
génération de recommandations
Capacité à gérer différents types de
données
Flexibilité dans la personnalisation des
recommandations
Possibilité de générer des
recommandations pour les nouveaux
utilisateurs et les nouveaux articles
01
03
02
04
21. 21
LightFM python library
01 Traiter nos données et créer un dataset de lightFM en utilisant son api
02 Créer une matrice d’interaction, user/item features
03 Faire un modèle et l'entraîner
04 Évaluer le modèle
05 Faire des prédictions
Les étapes pour construire un modèle en utilisant la bibliothèque LightFM:
On a déjà vu que Il existe deux méthodes populaires utilisées pour filtrer les recommandations, le filtrage basé sur le contenu et le filtrage collaboratif
Ces méthodes sont confrontées au problème lorsqu'il n'y a pas assez de données pour apprendre la relation entre l'utilisateur et les éléments. Dans de tels cas, le troisième type d'approche est utilisé pour construire les systèmes de recommandation nommé système de recommandation hybride
On a déjà vu que Il existe deux méthodes populaires utilisées pour filtrer les recommandations, le filtrage basé sur le contenu et le filtrage collaboratif
Ces méthodes sont confrontées au problème lorsqu'il n'y a pas assez de données pour apprendre la relation entre l'utilisateur et les éléments. Dans de tels cas, le troisième type d'approche est utilisé pour construire les systèmes de recommandation nommé système de recommandation hybride
La recommandation basée sur le contenu : qui analyse les caractéristiques des éléments recommandés pour trouver des éléments similaires ou complémentaires.
La recommandation collaborative : qui utilise l'historique d'interaction de l'utilisateur pour identifier les préférences et les intérêts communs avec d'autres utilisateurs et recommander des éléments en fonction de ces similitudes.
La recommandation basée sur les connaissances : qui utilise des connaissances expertes pour recommander des éléments en fonction de leur pertinence pour l'utilisateur.
Nous pouvons construire des systèmes de recommandation de deux manières en utilisant deux approches de perte différentes :
Θ : Paramètres de notre modèle de recommandation comme les matrices d'utilisateurs et d'articles dans la factorisation matricielle.
g(θ) : fonction de perte que nous essayons de minimiser