SlideShare une entreprise Scribd logo
1  sur  13
Télécharger pour lire hors ligne
Data Science
Bootcamp
Brice Ngouana
Trouver des offres d’emploi grâce au traitement de texte
Les données
❑ Données liées aux offres d’emplois
• Experience.csv1
• Job_Views.csv1
• Position_Of_interest.csv1
• Combined_Jobs_Final.csv1
• Train_rev1.csv2
❑ Données liées aux candidats
1. https://www.kaggle.com/kandij/job-recommendation-datasets
2. https://www.kaggle.com/chadalee/text-analytics-explained-job-description-data/data
Objectif
Recommander des offres d’emploi
Analyser les textes et identifier les offres d’emploi dont la description se
rapproche le plus du profil
Expériences professionnelles
Postes visés
Offres d’emploi vues
Titre du poste
Fiche de poste
Profils Emplois
Modèles
TFIDF vectorization
Doc2Vec
Données input = listes de mots
• Valeur TFIDF calculée pour chaque mot
• Vecteur généré pour chaque document (texte)
• Les composantes du vecteur sont les valeurs TFIDF de chaque mot
• Vecteur généré pour chaque mot
• Vecteur généré pour chaque document
• Modèle entrainé dans un réseau de neurones
similarité cosinus
Preprocessing…
• Imputer les valeurs manquantes
• Tous les textes en minuscule
• Suppression des signes de ponctuation
• Suppression des mots de liaison, articles…
• Tokenisation
• Lemmisation (pour TFIDF)
• Créer un corpus avec tous les textes des offres d’emploi
• Déterminer les paramètres de chaque mot dans le corpus
• Transformer les textes des profils des candidats suivant les paramètres obtenus
…et entrainement des modèles
Résultats Recommandations basées sur toutes les informations du profil
Profil
TFIDF
Doc2Vec
Résultats
TFIDF
Doc2Vec
Profil
Recommandations basées sur les postes précédemment occupés
Résultats
Profil
TFIDF
Recommandations basées sur les offres d’emploi vues
Doc2Vec
Résultats Recommandations basées sur le poste visé
Profil
TFIDF
Doc2Vec
Résultats
Résultats
Pour aller plus loin…
➢ Avoir une base de données dynamique
➢ Filtrer les offres recommandées en fonction de la localisation
géographique
Data Science
Bootcamp
Des questions ?

Contenu connexe

Plus de Jedha Bootcamp

L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisJedha Bootcamp
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonJedha Bootcamp
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoJedha Bootcamp
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp
 
Prédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data SciencePrédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data ScienceJedha Bootcamp
 

Plus de Jedha Bootcamp (20)

L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
 
Slide portes ouvertes
Slide portes ouvertesSlide portes ouvertes
Slide portes ouvertes
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data Science
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéo
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
 
Prédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data SciencePrédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data Science
 

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli