Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

•

0 j'aime•70 vues

Nos formations : https://www.jedha.co Ici, ce sont 2 modèles que Brice expérimente pour parvenir à matcher candidats et offres d'emploi grâce à l'analyse de texte (NLP)

Données & analyses

Data Science
Bootcamp
Brice Ngouana
Trouver des offres d’emploi grâce au traitement de texte

Les données
❑ Données liées aux offres d’emplois
• Experience.csv1
• Job_Views.csv1
• Position_Of_interest.csv1
• Combined_Jobs_Final.csv1
• Train_rev1.csv2
❑ Données liées aux candidats
1. https://www.kaggle.com/kandij/job-recommendation-datasets
2. https://www.kaggle.com/chadalee/text-analytics-explained-job-description-data/data

Objectif
Recommander des offres d’emploi
Analyser les textes et identifier les offres d’emploi dont la description se
rapproche le plus du profil
Expériences professionnelles
Postes visés
Offres d’emploi vues
Titre du poste
Fiche de poste
Profils Emplois

Modèles
TFIDF vectorization
Doc2Vec
Données input = listes de mots
• Valeur TFIDF calculée pour chaque mot
• Vecteur généré pour chaque document (texte)
• Les composantes du vecteur sont les valeurs TFIDF de chaque mot
• Vecteur généré pour chaque mot
• Vecteur généré pour chaque document
• Modèle entrainé dans un réseau de neurones
similarité cosinus

Preprocessing…
• Imputer les valeurs manquantes
• Tous les textes en minuscule
• Suppression des signes de ponctuation
• Suppression des mots de liaison, articles…
• Tokenisation
• Lemmisation (pour TFIDF)
• Créer un corpus avec tous les textes des offres d’emploi
• Déterminer les paramètres de chaque mot dans le corpus
• Transformer les textes des profils des candidats suivant les paramètres obtenus
…et entrainement des modèles

Résultats Recommandations basées sur toutes les informations du profil
Profil
TFIDF
Doc2Vec

Résultats
TFIDF
Doc2Vec
Profil
Recommandations basées sur les postes précédemment occupés

Résultats
Profil
TFIDF
Recommandations basées sur les offres d’emploi vues
Doc2Vec

Résultats Recommandations basées sur le poste visé
Profil
TFIDF
Doc2Vec

Recommandé

Boostez votre recherche SharePoint grâce aux Microsoft Cognitive Services!Franck Cornu

Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...Expernova

Comment faire parler les data des candidats ?Jeremy Greze

Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...Mehdi Hamime

Découverte de Elastic searchJEMLI Fathi

Tice.pptxslimane13

Outils de veille informationnelle - Hiver 2017Promotion du développement des compétences informationnelles (PDCI)

DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp

Recommandé

Boostez votre recherche SharePoint grâce aux Microsoft Cognitive Services!Franck Cornu

Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...Expernova

Comment faire parler les data des candidats ?Jeremy Greze

Ecole ESMA : Projet Fin de semestre - Application de gestion d'une école - Di...Mehdi Hamime

Découverte de Elastic searchJEMLI Fathi

Tice.pptxslimane13

Outils de veille informationnelle - Hiver 2017Promotion du développement des compétences informationnelles (PDCI)

DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp

L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp

Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp

Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp

Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp

Slide portes ouvertesJedha Bootcamp

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp

Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp

Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp

Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp

Workshop Data Visualisation - Jedha ParisJedha Bootcamp

Les applications du Deep Learning - Jedha LyonJedha Bootcamp

Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp

Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp

Automatiser la classification d'un jeu vidéoJedha Bootcamp

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp

Prédire les ventes d'un hôtel grâce à la Data ScienceJedha Bootcamp

Contenu connexe

Plus de Jedha Bootcamp

L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp

Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp

Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp

Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp

Slide portes ouvertesJedha Bootcamp

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp

Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp

Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp

Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp

Workshop Data Visualisation - Jedha ParisJedha Bootcamp

Les applications du Deep Learning - Jedha LyonJedha Bootcamp

Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp

Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp

Automatiser la classification d'un jeu vidéoJedha Bootcamp

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp

Prédire les ventes d'un hôtel grâce à la Data ScienceJedha Bootcamp

Plus de Jedha Bootcamp (20)

L'IA face à l'épreuve du covid-19 - Jedha x Kardinal

Générer une image à partir d'un texte - Fullstack Paris #5

Recommander des films - Andreea - Fullstack Lyon #1

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1

Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack

Slide portes ouvertes

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Workshop Data Visualisation - Jedha Paris

Les applications du Deep Learning - Jedha Lyon

Optimiser ses publicités grâce à la Data Science

Connaître son audience grâce à la Data - Parisa MAjlessi

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

Automatiser la classification d'un jeu vidéo

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

Prédire les ventes d'un hôtel grâce à la Data Science

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

1. Data Science Bootcamp Brice Ngouana Trouver des offres d’emploi grâce au traitement de texte

2. Les données ❑ Données liées aux offres d’emplois • Experience.csv1 • Job_Views.csv1 • Position_Of_interest.csv1 • Combined_Jobs_Final.csv1 • Train_rev1.csv2 ❑ Données liées aux candidats 1. https://www.kaggle.com/kandij/job-recommendation-datasets 2. https://www.kaggle.com/chadalee/text-analytics-explained-job-description-data/data

3. Objectif Recommander des offres d’emploi Analyser les textes et identifier les offres d’emploi dont la description se rapproche le plus du profil Expériences professionnelles Postes visés Offres d’emploi vues Titre du poste Fiche de poste Profils Emplois

4. Modèles TFIDF vectorization Doc2Vec Données input = listes de mots • Valeur TFIDF calculée pour chaque mot • Vecteur généré pour chaque document (texte) • Les composantes du vecteur sont les valeurs TFIDF de chaque mot • Vecteur généré pour chaque mot • Vecteur généré pour chaque document • Modèle entrainé dans un réseau de neurones similarité cosinus

5. Preprocessing… • Imputer les valeurs manquantes • Tous les textes en minuscule • Suppression des signes de ponctuation • Suppression des mots de liaison, articles… • Tokenisation • Lemmisation (pour TFIDF) • Créer un corpus avec tous les textes des offres d’emploi • Déterminer les paramètres de chaque mot dans le corpus • Transformer les textes des profils des candidats suivant les paramètres obtenus …et entrainement des modèles

6. Résultats Recommandations basées sur toutes les informations du profil Profil TFIDF Doc2Vec

7. Résultats TFIDF Doc2Vec Profil Recommandations basées sur les postes précédemment occupés

8. Résultats Profil TFIDF Recommandations basées sur les offres d’emploi vues Doc2Vec

9. Résultats Recommandations basées sur le poste visé Profil TFIDF Doc2Vec

10. Résultats

11. Résultats

12. Pour aller plus loin… ➢ Avoir une base de données dynamique ➢ Filtrer les offres recommandées en fonction de la localisation géographique

13. Data Science Bootcamp Des questions ?