1. Développement d’un Outil
Collaboratif de Désambiguïsation
Morphologique en Langue Arabe
Réalisé par :
Heithem MOUMNI
Hedi EL MABROUK
Encadré par :
Mme Raja AYED
Mme Aicha KAMOUN
Organisme d’accueil: Laboratoire RIADI
Responsable de stage: Ibrahim Bounhas 1
2. Plan
• Etude de l’existant2
• Spécification des besoins3
• Conception4
• Réalisation et tests5
• Conclusion et perspectives6
• Introduction1 Objectif
Cadre
Motivation- Procédure
actuelle
- Produits
similaires
- Solutions
existantes
2
3. • Introduction1
المدرسة الى الطفل ذهب
َهَذَب
َهَذب
VERB/ فعل
NOUN/ اسم
3
LOCALISATION
Techniques
Outils
Outils
Les outils d’analyse linguistiqueOutil collaboratif de désambiguïsation morphologique
en langue arabe
سعيد أحمد
عَسيد
عَسيد
ADJ/ صفة
NOUN/ اسمVolume d’information
4. • Parmi la fonctionnalité de Nooj en peut :
o Charger un corpus ou un document .
o Savoir la fréquence de chaque caractère dans un document .
o Savoir la fréquence des mots .
o Citer les mots inconnus .
o Afficher un graphe de structure d’annotation.
• Etude de l’existant2
4
Nooj, est un environnement de développement linguistique utilisé
comme outil de formalisation des langues naturelles (TALN).
NOOJ :
6. • La plateforme GATE fournit :
o Un adaptateur permettant d’utiliser sous forme de PR
(Processing Resource1) dans GATE un TAE (Text Analysis
Engine) primitif ou composé d’UIMA2
o Un adaptateur permettant d’utiliser sous forme de TAE dans
UIMA un pipeline de traitement de GATE (Corpus Controller).
• Etude de l’existant2
6
GATE est une infrastructure permettant le développement et le
déploiement de composants pour le traitement de la langue naturelle.
GATE :
GATE offrent des outils très variés afin de traiter le plus de
problème de linguistique possible.
8. Avantage :
o Simplicité d'utilisation.
Inconvénient :
o Ne traité pas les mots ambigu,
o Ne traité pas les mots inconnu,
• Etude de l’existant2
8
9. Acteurs principaux :
• Spécification des besoins3
9
Consulter
les mots
traités
Traiter les
mots
Consulter
son
historique
Gérer les
rapports des
collaborateurs
10. Besoins fonctionnels :
• Spécification des besoins3
10
Donner la possibilité a l’expert de vérifier et modifier la
segmentation et l’Identification des attributs morphologiques
manuellement
Outil de désambiguïsation morphologique
Donner la possibilité à un collaborateur de vérifier tous les
mots analysés
Donner la possibilité à un administrateur de confirmer tous les
rapports d’un collaborateur et donner les rôles.
Afficher l’historique des modifications précédentes pour
l’expert,
Portail
Afficher les mots signalés par le collaborateur pour
l’administrateur pour les traiter,,
11. Besoins non fonctionnels :
• Spécification des besoins3
11
Interface claire et simple
L’application doivent être compatibles avec la plupart des
navigateurs web
Traitement optimal pour réduire le temps de chargement
Navigation entre les mots avec la sourie ou avec les flèches
du clavier
Garder une trace de l’étape de l’analyse avec une barre de
progression
Design compatible avec des différents plateforme
12. • Conception4
12
Nous avons utilisés MVC comme implémentation de cette
architecture
Un avantage apporté par ce modèle est la clarté de
l'architecture qu'il impose. Cela simplifie notre la tâche du
développeur qui tenterait d'effectuer une maintenance ou
une amélioration sur le projet.
20. • Réalisation et tests5
20
Plateformes :
Java Hibernate Spring MVC
Outil linguistique :
o Aramorph
Twitter Bootstrap JQuery
21. • Réalisation et tests5
21
• Préparation du la création de base de donnée
22. • Réalisation et tests5
22
Les documents :
• Exemple de Hadith au format du fichier de base:
• Exemple de Hadith au format TREC (Arabe):
23. • Réalisation et tests5
23
• Exemple de Hadith sépare avec deux séparateurs « * » et « # »
• Exemple des identifiants du chaque Hadith
• Exemple de segmentation du chaque mot avec ca mesure possibiliste
24. • Réalisation et tests5
24
• Exemple de résulta de 14 attribues
• Exemple de requête Final
25. Pour conclure,
• Conclusion et perspectives6
25
Perspectives :
• Réaliser une visite guidé afin d’aider l’expert a mieux
exploiter les différentes fonctionnalité de notre system,
• Intégrer les acteurs dans le plateforme,
• Développer un algorithme pour exploiter les résultats
validés par l’expert afin de traité des mots similaires
automatiquement,
• Optimiser l’affichage des attribut au niveau de son
identifications,