SlideShare une entreprise Scribd logo
1  sur  10
Télécharger pour lire hors ligne
ALEXANDRE
NATAF
AUTOMATISER
LA
CLASSIFICATION
D'UN
JEUX-VIDÉOS
Goal
GOAL
à partir de sa description
Prédire la réussite (vente)
d'un jeux depuis un résumé
écrit.
Générer des résumés de
jeux en "accord" avec les
ventes actuelles des jeux.
PRÉDIRE LE GENRE
D'UN JEUX
LONG-TERM
GOAL
Comment ?
LES DIFFÉRENTES ÉTAPES
Idée Deep 
learning
Nettoyage
data
Récolte
data
Machine
learning
{
VM instance
Google Cloud
METACRITICS.COM
Base de données 
(22000x2)
Récole des données
SCRAPING
Nettoyage NETTOYAGE
Ces mots sont : "of", "is",
"the" ...
E N L E V E R S T O P
W O R D S
Réduit chaque mot à sa
racine.
"prediction" : "pred"
S T E M M E R
Permet à la machine de
distinguer les différents
formes grammaticales d'un
mot (verbe, nom, etc...)
L E M M A T I Z A T I O N P O N C T U A T I O N S
& M A J U S C U L E S
0 0,2 0,4 0,6
Gradient boosting
SVM
KNN
Naive Bayes
Random Forest
Bagging
Decision tree
MACHINE LEARNING
APPROCHE
MACHINE LEARNING
RACING
SPORTS
STRATEGY
ADVENTURE
~48%
ACC
/8 LABELS
DEEPLEARNING
NLP - WORD EMBEDDING
" Fight against
the dark force"
fight = [1,0,0,0,0]
against = [0,1,0,0,0]
the = [0,0,1,0,0]
dark = [0,0,0,1,0]
force = [0,0,0,0,1]
Word2Vec
Créer une matrice
de mot en
entraînement sur la
prédiction des mots
aux alentours. 
GloVe
Créer une matrice
à de co-occurence
Pourquoi ?
Pouvoir mettre des
phrases en input
d'un modèle.
Ajouter le contexte
en plus du mot.
0 0,25 0,5 0,75 1 1,25
CNN + Word2Vec
RNN + Word2Vec
CNN + GloVe
DNN + GloVe
NLP
APPROCHE
DEEP LEARNING
AMÉLIORATION
APPRENTISSAGE
PRÉDICTIONS
~50%
ACC
use case
USE CASE
Idée de jeux Description
du jeux
Idée affinéeReco de
changement
potentiels
Prédiction
de fit avec le
marché
MERCI À VOUS !
Alexandre Nataf

Contenu connexe

Plus de Jedha Bootcamp

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisJedha Bootcamp
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonJedha Bootcamp
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp
 
Prédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data SciencePrédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data ScienceJedha Bootcamp
 
Le Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientLe Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientJedha Bootcamp
 
Prédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data SciencePrédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data ScienceJedha Bootcamp
 
Prédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data SciencePrédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data ScienceJedha Bootcamp
 
Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?Jedha Bootcamp
 
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtStarbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtJedha Bootcamp
 
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistDesign & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistJedha Bootcamp
 
Construire un moteur de recommandation avec la Data Science - Aurélie Mutschler
Construire un moteur de recommandation avec la Data Science - Aurélie MutschlerConstruire un moteur de recommandation avec la Data Science - Aurélie Mutschler
Construire un moteur de recommandation avec la Data Science - Aurélie MutschlerJedha Bootcamp
 

Plus de Jedha Bootcamp (20)

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data Science
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
 
Prédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data SciencePrédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data Science
 
Le Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientLe Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un client
 
Prédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data SciencePrédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data Science
 
Prédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data SciencePrédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data Science
 
Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?
 
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtStarbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
 
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistDesign & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
 
Construire un moteur de recommandation avec la Data Science - Aurélie Mutschler
Construire un moteur de recommandation avec la Data Science - Aurélie MutschlerConstruire un moteur de recommandation avec la Data Science - Aurélie Mutschler
Construire un moteur de recommandation avec la Data Science - Aurélie Mutschler
 

Automatiser la classification d'un jeu vidéo

  • 2. Goal GOAL à partir de sa description Prédire la réussite (vente) d'un jeux depuis un résumé écrit. Générer des résumés de jeux en "accord" avec les ventes actuelles des jeux. PRÉDIRE LE GENRE D'UN JEUX LONG-TERM GOAL
  • 3. Comment ? LES DIFFÉRENTES ÉTAPES Idée Deep  learning Nettoyage data Récolte data Machine learning { VM instance Google Cloud
  • 5. Nettoyage NETTOYAGE Ces mots sont : "of", "is", "the" ... E N L E V E R S T O P W O R D S Réduit chaque mot à sa racine. "prediction" : "pred" S T E M M E R Permet à la machine de distinguer les différents formes grammaticales d'un mot (verbe, nom, etc...) L E M M A T I Z A T I O N P O N C T U A T I O N S & M A J U S C U L E S
  • 6. 0 0,2 0,4 0,6 Gradient boosting SVM KNN Naive Bayes Random Forest Bagging Decision tree MACHINE LEARNING APPROCHE MACHINE LEARNING RACING SPORTS STRATEGY ADVENTURE ~48% ACC /8 LABELS
  • 7. DEEPLEARNING NLP - WORD EMBEDDING " Fight against the dark force" fight = [1,0,0,0,0] against = [0,1,0,0,0] the = [0,0,1,0,0] dark = [0,0,0,1,0] force = [0,0,0,0,1] Word2Vec Créer une matrice de mot en entraînement sur la prédiction des mots aux alentours.  GloVe Créer une matrice à de co-occurence Pourquoi ? Pouvoir mettre des phrases en input d'un modèle. Ajouter le contexte en plus du mot.
  • 8. 0 0,25 0,5 0,75 1 1,25 CNN + Word2Vec RNN + Word2Vec CNN + GloVe DNN + GloVe NLP APPROCHE DEEP LEARNING AMÉLIORATION APPRENTISSAGE PRÉDICTIONS ~50% ACC
  • 9. use case USE CASE Idée de jeux Description du jeux Idée affinéeReco de changement potentiels Prédiction de fit avec le marché
  • 10. MERCI À VOUS ! Alexandre Nataf