3. Dataset et pre-processing :
MovieLens 100K
UserId MovieId Rating Timestamp
3 1 4.5 1256677221
409 1 3.5 1256677456
62 1 4 1256677471
198 1 5 1256677260
MovieId Title Genres
1 Toy Story (1995)
Adventure|Animation|
Children|Comedy|Fantasy
2 Jumanji (1995) Adventure|Children|Fantasy
3
Grumpier Old
Men (1995)
Comedy|Romance
4
Waiting to Exhale
(1995)
Comedy|Drama|Romance
Notes Films
Primary Key
4. Notre dataset :
MovieLens 100K
Ratings 100 004
Users 671
Movies 6 323
Dates 1996-2018
Notes Films
Movies 6 323
Genres 20
Years 1902-2017
5. Meilleur modèle :
Factorisation matricielle - Singular Value
Decomposition
?
?
?
?
?
?
?
?
?
?
Films
Utilisateurs
R
Crédit image : Google Developpers
6. Meilleur modèle :
Factorisation matricielle - Singular Value
Decomposition
R = U 𝛴 MT
(n x m) (n x n) (m x m)(n x m)
Avec :
- m, le nombre de films
- n, le nombre d’utilisateurs
9. Meilleur modèle :
Factorisation matricielle - Singular Value
Decomposition
R = U 𝛴 MT
(n x m) (n x n) (m x m)(n x m)
Avec : 𝛴 =
où 𝜎i
sont les valeurs singulières.
10. Meilleur modèle :
Factorisation matricielle - Singular Value
Decomposition
R =
0.1
0.2
0.1
0.1
0.3
0.7
Utilisateurs
U
0.5
0.3 0.6
0.6
0.4
0.3
𝛴
Action Drame Comédie
Latent features
des utilisateurs
0.2
0.1
0.1
MT
0.3
0.2 0.2
0.4
0.2
0.5
Action
Comédie
Films
Drame
0.4
0.3
0.1
Latentfeatures
desfilms
𝜎1
0
0
0
𝜎r
11. Meilleur modèle :
Factorisation matricielle - Singular Value
Decomposition
SGD
ALS
Stochastic
Gradient Descent
Alternating Least
Square
M
M
U, M tq
12. Meilleur modèle :
Factorisation matricielle - Singular Value
Decomposition
SGD
ALS
Stochastic
Gradient Descent
Alternating Least
Square
M
M
U, M tq
RMSE = 0.89
13. 4 grandes méthodes de création d’un
système de recommandations
Approche content-based
Le filtrage collaboratif
Approche model-based
Le Deep Learning
Crédit image : Towards Data Science
14. 4 grandes méthodes de création d’un
système de recommandations
Approche content-based
Le filtrage collaboratif
Approche model-based
Le Deep Learning
Crédit image : Towards Data Science
15. 4 grandes méthodes de création d’un
système de recommandations
Approche content-based
Le filtrage collaboratif
Approche model-based
Le Deep Learning
?
?
?
?
?
?
?
?
?
?
Films
Utilisateurs
16. 4 grandes méthodes de création d’un
système de recommandations
Approche content-based
Le filtrage collaboratif
Approche model-based
Le Deep Learning
20. Performances :
Comparaison des modèles testés avec une
nouvelle utilisatrice
TOP 10 DE SARAH
Approche contenu Filtrage collaboratif SVD
21. Performances :
Comparaison des modèles testés avec une
nouvelle utilisatrice
TOP 10 DE SARAH
Approche contenu Filtrage collaboratif SVD
Novelty
Over-specialization
Diversity
Novelty
Novelty
Diversity
22. Conclusion et pistes d’amélioration
Modèles hybrides
De nouvelles avancées à explorer : mise en
scène recommendations, etc.
A chaque problème, son modèle, ses metrics