Présentation FADEL Wiam sur le nlp et machine learning

Proposition d’un modèle Text Mining
pour un système de résolution automatique des problèmes détectés
à partir des échanges par messageries entre collaborateurs
Soutenu par:
Wiam FADEL
Année Universitaire: 2019-2020
Membres de Jury :
Présidente : Dr. Badia ETTAKI, Prof à L’ESI.
Encadrant : Dr. Ing. Walid CHERIF, Prof à l’ESI.
Tuteur : Ing. Imane BELLA, Chef de projet Junior à Soft Centre.
Royaume du Maroc
Haut-Commissariat au Plan
Ecole Des Sciences de l’Information
Projet de fin d’étude pour l’obtention du titre:
Ingénieur d’Etat
En Ingénierie des Connaissances et Données

“Le Graal du 20ème siècle, c'était le pétrole. Le 21ème est celui des données,”Jalil Bensouda
3

“ La « data » est au cœur de l’IA,” Ghita Ammor
4

Contexte général
Présentation
de l’organisme
Conception du projet Réalisation Conclusion
Etude de l’existant Problématique Etude de besoins
Objectif du projet
Président Mr
Azzelarab HASSIBI
Directeur Général
Mr Jamal
BENHAMOU
26 donneurs
d’ordre clients Comité de Projet
Chef de projet
junior Mme.
Imane BELLA
Développeurs
Ingénieurs PFE
Ingénieurs
Permanents
Chercheurs Thésards
Développement
logiciel
Centre de
services partagés
Valorisation des
activités R&D
Services
mobiles
Monétique
Progiciels
Multimédia
Big Data
Analytic
5

Contexte général
Présentation
de l’organisme
Etude de l’Existant Problématique
 Profil
 Connaissances
 Discussion
 Commentaire
 Publication
 Communautés
SoulChain est une plateforme sociale d’échange et de
partage.
Etude de besoins
Objectif du projet
Messages
6

Contexte général
Présentation
de l’organisme
Etude de l’existant Problématique
La plateforme SoulChain doit être intelligente, de
manière qu’elle va comprendre les problèmes d’un
membre via ses messages qui sont liés au monde
professionnel, et cela, pour qu’elle soit capable de
recommander des solutions pertinentes.
Etude de besoins
Objectif du projet
Quels sont les opérations à réaliser pour recommander
la bonne solution, automatiquement et instantanément,
pour un problème exprimé dans les messages d’un
utilisateur
7

Contexte général
Présentation
de l’organisme
Etude de l’existant Problématique Objectif du projet
L’objectif principal est d’aider les utilisateurs de la
plateforme ayant des problèmes en leur proposant des
ressources (vidéos tutoriels, articles, …) afin de les consulter
pour en ressortir des pistes utiles, ainsi que d’optimiser le
temps de la recherche et la lecture d’une panoplie des pages
web.
Etude de besoins
8

MESSAGES
Q W R U I P
S D F H J K L
Z X C V B
SPACE
SEN
D
Hi, I have a good accuracy for
my ML model, but prediction
is random,what’s problem?
Y O
N
E
M ‘
G
T
.
A
Message :
Hi, I have a good accuracy for my ML model, but
prediction is random,what’s problem?
Il s’agit d’un problème
professionnel
I don’t have ideas, check at
stackoverflow!
User is Writing….
Contexte général Conception du projet Réalisation Conclusion
Etude
de besoins
Récupération
de message
Prétraitement
de message
Classification
de message
Reformulation
de message en
une requête de
recherche
Questions de la recherche
9

MESSAGES
Q W R U I P
S D F H J K L
Z X C V B
SPACE
ROBOT : www.solute.... SEN
D
We are Happy to help you, I
will send a url where you can
find solution for your
problem
Y O
N
E
M ‘
G
T
.
A
www.solute....
Etude
de besoins
Choisir
la meilleur solution
Recommander
la solution
10

Etude
de besoins
11

“En 1956 , Newel, Simon & Shaw écrivent Logic Theorist, le premier programme délibérément
conçu pour imiter les capacités de résolution des problèmes d'un être humain. ”
12

Contexte général
Conception Général
Conception phase 1 Conception phase 2
13
Phase 4
Phase 3
Phase 2
Phase 1

Contexte général
Conception phase 2
Conception phase 1
14

Contexte général
Conception phase 2
Conception phase 1
Acquisition
de messages
Nettoyage
de messages
Vectorisation
de messages
Entrainement
du modèle
Evaluation
du modèle
15

Contexte général
Conception phase 2
Conception phase 1
Acquisition
de messages
Nettoyage
de messages
Vectorisation
de messages
Entrainement
du modèle
Evaluation
du modèle
16

Contexte général
Conception phase 2
Conception phase 1
Acquisition
de messages
Nettoyage
de messages
Vectorisation
de messages
Entrainement
du modèle
Evaluation
du modèle
17
1
2
3

Contexte général
Conception phase 2
Conception phase 1
Acquisition
de messages
Nettoyage
de messages
Vectorisation
de messages
Entrainement
du modèle
Evaluation
du modèle
18

Contexte général
Conception phase 2
Conception phase 1
Acquisition
de messages
Nettoyage
de messages
Vectorisation
de messages
Entrainement
du modèle
Evaluation
du modèle
19

Contexte général
20

21i
Contexte général
Input: message
Prétraitement
Un mot de message est trouvé dans le
dictionnaire
Comparer le score total de chaque
catégorie
Dictionnaire
de la vie
privée
Output: message classifié
Si oui Sinon
Augmenter le score
de la catégorie ‘privé’
Augmenter le score de la
catégorie ‘professionnel’

22
“ …tout tourne autour de la Data.”

Contexte général
Outils et technologies
Simulation du projet
Langage de programmation Outils de développement Environnement de Travail
23

Contexte général
Outils et technologies
Simulation du projet
24

25
“Le grand paradoxe de l'automatisation est que le désir d'éliminer le travail
humain génère toujours de nouvelles tâches pour les humains.” Mary
L.Gray

Pour classifier les messages en deux catégories, on a
opté pour deux approches:
 L’approche basée sur le Machine Learning pour la
classification en message problème et message
non-problème.
 L’approche basée sur le dictionnaire pour filtrer les
messages professionnels des messages privés.
 Améliorer la pertinence de sélection des messages
problèmes professionnels.
 Trouver la bonne solution au problème du message
et la recommander aux utilisateurs.
Perspectives
26

Merci Pour Votre
Attention !
27

Présentation FADEL Wiam sur le nlp et machine learning

Contenu connexe

Tendances

Similaire à Présentation FADEL Wiam sur le nlp et machine learning

Présentation FADEL Wiam sur le nlp et machine learning

Notes de l'éditeur