Traduction des sms

1 201 vues

Publié le

L'essor des technologies de l'information et de la communication (TIC) a marqué de façon
décisive le vingtième siècle: par la radiodiffusion, la télévision, la téléphonie ou Internet. La communication entre les personnes a subi une véritable évolution.Cette évolution, notamment dans le domaine de l’informatique, a donné naissance à des nouvelles formes de communication entre locuteurs tel que le SMS. Ce rapport présente une application de traduction des SMS.

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 201
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
8
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Traduction des sms

  1. 1. Université de Tunis ECOLE SUPERIEURE DES SCIENCES ET TECHNIQUES DE TUNIS Projet du cours « TAL » 1ère année Mastère de recherche en Informatique Traduction DES SMS Réalisé par l’équipe N°2 composée de : Khaled Fayala Taieb Sadem Yosra Hasnaoui Asma Mdaini Balkiss Hamad Takwa Laamiri Année universitaire 2012 – 2013
  2. 2. i Table des matières Table des Figures............................................................................................................................. iii Liste des Tableaux ........................................................................................................................... iv Introduction générale ..................................................................................................................1 ............................................................................................................1Partie 1 : Etude théorique chapitre1 : Etude Préalable ......................................................................................................2 1. Introduction...........................................................................................................................................2 2. Emergence des TIC...............................................................................................................................2 3. Définition de SMS ................................................................................................................................2 4. Historique .............................................................................................................................................2 5. Utilisation des SMS ..............................................................................................................................3 6. Les bénéfices de l’utilisation des SMS.................................................................................................3 7. Les limites de l’utilisation des SMS .....................................................................................................3 8. Conclusion............................................................................................................................................4 Chapitre 2 : Le langage SMS.......................................................................................................5 1. Introduction...........................................................................................................................................5 2. Définition du langage SMS...................................................................................................................5 3. Les procédés utilisés dans le langage SMS...........................................................................................5 3.1. La phonétique ...............................................................................................................................5 3.2. Le rébus typographique ................................................................................................................6 3.3. L’abréviation.................................................................................................................................6 3.4. Les émotions.................................................................................................................................7 4. Le langage SMS entre approbation et rejet...........................................................................................7 4.1. Les risques de langage SMS .........................................................................................................8 4.2. Les intérêts de langage SMS.........................................................................................................8 5. Conclusion............................................................................................................................................8 Chapitre 3 : Les dictionnaires et les corpus SMS..........................................................9 1. Introduction...........................................................................................................................................9 2. Les Dictionnaires des SMS...................................................................................................................9 2.1. Le dictionnaire-sms.......................................................................................................................9 2.2. Le dictionnaire deblok ................................................................................................................10
  3. 3. ii 2.3. Le dictionnaire mobilou..............................................................................................................10 2.4. Le dictionnaire langageSMS.......................................................................................................11 3. Corpus SMS........................................................................................................................................11 3.1. Corpus SMS de Caroline Tagg ...................................................................................................12 3.2. Corpus du DELI..........................................................................................................................12 3.3. Projet « SMS4science »..............................................................................................................12 4. Conclusion..........................................................................................................................................12 Chapitre 4 : Les traducteurs SMS existants ..................................................................13 1. Introduction.........................................................................................................................................13 2. Les différents traducteurs SMS...........................................................................................................13 2.1. Le traducteur du site « www.TraducteurSMS.com ».................................................................13 2.2. Le traducteur du site « www.aidoweb.com » .............................................................................14 2.3. Le traducteur du site « www.1fo.co ».........................................................................................15 3. Conclusion..........................................................................................................................................15 ............................................................................................................13Partie 2 : Etude Pratique Chapitre 1 : Analyse et spécification des besoins.......................................................14 1. Introduction.........................................................................................................................................16 2. L’objectif du projet.............................................................................................................................16 3. Analyse des besoins............................................................................................................................16 3.1. Définition des besoins fonctionnels.................................................................................................16 3.2. Définition des besoins non fonctionnels..........................................................................................16 4. Vue des cas d’utilisation.....................................................................................................................17 4.1. Identification des acteurs ............................................................................................................17 4.2. Identification des cas d’utilisations.............................................................................................17 5. Conclusion..........................................................................................................................................18 Chapitre 2 : Construction des dictionnaires .................................................................19 1. Introduction.........................................................................................................................................19 2. Environnement et outils de travail......................................................................................................19 2.1. Environnement logiciel...............................................................................................................19 2.2. Environnement matériel..............................................................................................................19 3. Construction des dictionnaires............................................................................................................20 3.1. Pourquoi XML ?.........................................................................................................................20 3.2. Les étapes d’élaboration des dictionnaires .................................................................................20 3.2.1. Le fichier « traduction.xml » ..............................................................................................21 3.2.2. Le fichier « dico-fr.xml » .....................................................................................................23
  4. 4. iii 3.2.3. Le fichier « dico-fo.xml ».....................................................................................................24 4. Conclusion..........................................................................................................................................24 Chapitre 3 : Interfaces de l’application...........................................................................19 1. Introduction.........................................................................................................................................25 2. Les interfaces réalisées .......................................................................................................................25 2.1. Le découpage en tokens..............................................................................................................25 2.2. La traduction des mots SMS connus...........................................................................................26 2.2.1. L’identification des mots.....................................................................................................26 2.2.2. La traduction.......................................................................................................................27 2.3. La traduction des mots SMS inconnus........................................................................................28 3. Conclusion..........................................................................................................................................29 Chapitre 4 : Evaluation de l’application ..........................................................................20 1. Introduction.........................................................................................................................................30 2. Evaluation par rapport au « corpus-sms-test.txt » ..............................................................................30 3. Comparaison par rapport aux autres traducteurs ................................................................................33 3.1. Le résultat de notre traducteur SMS ...........................................................................................33 3.2. Le résultat du traducteur « www.1fo.co »...................................................................................34 3.3. Le résultat du traducteur « www.TraducteurSMS.com » ...........................................................34 4. Conclusion..........................................................................................................................................35 Chapitre 5 : Gestion du projet.................................................................................................30 1. Introduction.........................................................................................................................................36 2. Démarche utilisé pour organiser le projet...........................................................................................36 3. Répartion des tâches de rédaction du rapport .....................................................................................37 4. Les apports de projet...........................................................................................................................38 5. Les problèmes rencontrés et solutions proposées ...............................................................................38 6. Conclusion..........................................................................................................................................38 Conclusion générale....................................................................................................................39 Références .........................................................................................................................................40 Annexes.................................................................................................................................................41
  5. 5. iv
  6. 6. Table des Figures Figure 1 : Le dictionnaire-sms......................................................................................................................9 Figure 2 : Le dictionnaire deblok................................................................................................................10 Figure 3 : Le dictionnaire mobilou .............................................................................................................10 Figure 4 : Le dictionnaire langageSMS ......................................................................................................11 Figure 5 : Le traducteurSMS.com...............................................................................................................13 Figure 6 : Le traducteur SMS AidoWeb.....................................................................................................14 Figure 7 : Le traducteur SMS 1fo...............................................................................................................15 Figure 8 : Diagramme de cas d’utilisation générale ...................................................................................17 Figure 9 : Extrait du dictionnaire « traduction.xml »..................................................................................21 Figure 10 : Structure de la balise <Dictionnaire>.......................................................................................22 Figure 11 : Extrait du dictionnaire « dico-fr.xml ».....................................................................................23 Figure 12 : Extrait du dictionnaire « dico-fr.xml ».....................................................................................24 Figure 13 : Interface de découpage en tokens.............................................................................................25 Figure 14 : Interface de détection de locution ............................................................................................27 Figure 15 : Interface de traduction des mots SMS connus .........................................................................28 Figure 16 : Interface de traduction des mots SMS inconnus ......................................................................29 Figure 17 : Traduction de la phrase 1 de corpus-sms-test...........................................................................30 Figure 18 : Traduction de la phrase 47 de corpus-sms-test.........................................................................31 Figure 19 : Traduction d'une phrase avec mot inconnu ..............................................................................32 Figure 20 : Interface de traduction de notre Traducteur SMS ....................................................................33 Figure 21 : Interface de traduction du traducteur www.1fo.co...................................................................34 Figure 22 : Interface de traduction de traducteur www. TraducteurSMS.com...........................................34
  7. 7. Liste des Tableaux Tableau 1 : Exemples de phonétisation ........................................................................................................5 Tableau 2 : Exemples du rébus typographique.............................................................................................6 Tableau 3 : Exemples d'abréviation..............................................................................................................6 Tableau 4 : Exemple des émotions ...............................................................................................................7 Tableau 5 : Avantage et inconvénients de l'outil TraducteurSMS.com......................................................14 Tableau 6 : Avantages et inconvénients de l’outil AidoWeb .....................................................................14 Tableau 7 : Avantages et inconvénients de l’outil 1fo................................................................................15 Tableau 8 : Un tableau comparatif de traducteurs SMS .............................................................................35 Tableau 9: Répartition des tâches ...............................................................................................................37
  8. 8. Introduction générale
  9. 9. Introduction générale 1 L'essor des technologies de l'information et de la communication (TIC) a marqué de façon décisive le vingtième siècle: par la radiodiffusion, la télévision, la téléphonie ou Internet. La communication entre les personnes a subi une véritable évolution [1]. Cette évolution, notamment dans le domaine de l’informatique, a donné naissance à des nouvelles formes de communication entre locuteurs tel que le SMS. Ce dernier est un moyen de contact rapide et moins coûteux. Cependant, le SMS adopte une écriture qui s’affranchisse de la norme orthographique. Il amène l’utilisateur à abréger les mots de sa langue française et à utiliser des émotions. Ces modifications du langage naturel permettent de ne pas dépasser le nombre de caractères prévu par le message SMS et pour accélérer la saisie de celui-ci. Ceci fait l'apparition d'un nouvel langage : langage SMS. Or, l’émergence de ce nouveau langage à donner lieu à deux opinions opposées : Certains favorise l'utilisation de ce langage à cause de sa simplicité et les bénéficies associe. D’autre le considère comme une source de danger parce que les usagers de ce langage ignorent les normes orthographiques et grammaticales. Dans ce cadre, le Traitement Automatique du Langage (TAL) s'intéresse à étudier ce phénomène en raison des diverses applications possibles: synthèse vocale, traduction automatique SMS, etc. [2] Dans le cadre de ce projet, il nous a été confié d'étudier le langage SMS et de développer un traducteur de langage SMS. Ce rapport présente donc le travail réalisé à cet effet. L’élaboration du projet a été fondée sur deux axes, axe théorique et axe pratique. La première partie est constituée de quatre chapitres alors que la deuxième partie est constituée de 5 chapitres.
  10. 10. Partie 1 : Etude théorique
  11. 11. chapitre1 : Etude Préalable
  12. 12. Chapitre 1 : Etude préalable 2 1. Introduction Lorsque les premiers téléphones mobiles ont été lancés, ils étaient surtout destinés à passer des appels par les utilisateurs. Aujourd'hui, l'appel n'est plus le moyen de communication le plus utilisé, il a cédé sa place au SMS, qui est devenu le moyen de communication le plus privilégié pour les usagers. Dans ce chapitre, nous définissons en premier lieu le SMS, et nous présentons un petit aperçu sur leur historique. Ensuite, nous présentons l’utilisation des SMS en Tunisie. Finalement nous citons les bénéfices de l’utilisation des SMS, et leurs limites. 2. Emergence des TIC La technologie et les vagues d'innovations qui sont succédé durant les dernières décennies dans le domaine des technologies de l’information et de la communication, ont profondément modifié la nature de la communication entre les correspondants en contact. Les concepts de temps et de distance ont perdu leur significativité. Cette évolution a rendu la transmission des informations plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS. 3. Définition de SMS Un SMS (Short Message Service) également appelé texto est une suite de caractères transmis d’un téléphone mobile ou un terminal informatique vers un ou plusieurs autres téléphones. La longueur d’un SMS est limitée, la ponctuation et les espaces sont comptés. Le SMS semble correspondre à des besoins de communication rapide. C’est un service accessible depuis tous les terminaux mobiles et qui connaît un très fort développement notamment chez les jeunes qui n’hésitent pas à y consacrer des sommes d’argent importante pour échanger les messages entre eux. [3] 4. Historique Le premier message court de l'Histoire ("Merry Christmas!") a en effet été envoyé le 3 décembre 1992 par un ingénieur anglais de la société Sema Group à un collègue de l'opérateur Vodafone. Neil Papworth est donc à l'origine de cette invention. Mais il ne s'agissait de mettre en place un service grand public. Au contraire ! Exploité par Vodafone, ce système était au départ réservé à un usage interne, notamment pour permettre aux dirigeants de communiquer avec leurs secrétaires. Bien qu'au début, cette innovation n’est pas destinée au grand public, les SMS ont fini par faire partie intégrante de la vie quotidienne des gens notamment les jeunes utilisateurs. [4]
  13. 13. Chapitre 1 : Etude préalable 3 5. Utilisation des SMS Le SMS prend aujourd’hui un ascendant significatif en termes d’utilisation. En Tunisie, l’utilisation des SMS a connu une véritable explosion, même les candidats du baccalauréat peuvent obtenir leurs résultats via SMS. Les jeunes ont beaucoup profités de cette évolution pour envoyer énormément des SMS chaque jour, pour participer à des concours ou des jeux télévisés, avoir des informations sur le trafic des transports, etc. Heureusement pour eux tous les opérateurs ont intégré les SMS illimités dans la plupart de leurs offres téléphoniques. Par contre la majorité de personnes âgées préfère toujours la communication directe par téléphone parce qu’ils ont beaucoup de mal avec les nouveaux téléphones portables. Cela veut dire que le SMS à des avantages d’une coté et des inconvénients de l’autre côté. 6. Les bénéfices de l’utilisation des SMS Le SMS est un service très pratique, dans la partie suivante nous allons mettre l’accent sur les principaux points forts des SMS : [3]  Il permet une communication silencieuse, et rapide  La réception des SMS est gratuite, elle n’induit pas donc aucune charge financière pour le récepteur, et peuvent être consultés malgré un forfait épuisé.  Pour transmettre un message bref, le SMS est le moyen de communication le moins cher, si on le compare au prix d’une communication courte sur un mobile.  Il est possible, d’utiliser un terminal informatique connecté à l’internet pour envoyer des SMS de façon gratuit depuis des sites Web.  Il est mieux de transmettre un message à une personne sans vouloir la déranger (réunion, heure tardive…) ou bien lorsque son environnement immédiat ne permet pas une conversation téléphonique dans de bonnes conditions (bus, train, lieux bruyants). 7. Les limites de l’utilisation des SMS Nous allons maintenant se concentrer sur les faiblesses, et les limites des SMS. Parmi les problèmes principaux des SMS : [3]
  14. 14. Chapitre 1 : Etude préalable 4  L’écriture d’un texte sur un téléphone mobile n’est pas très simple pour les personnes utilisant peu ce mode de communication. Un peu d’entraînement semble nécessaire, surtout chez les plus âgés et malgré les efforts des constructeurs pour proposer des interfaces conviviales et intuitives par rapport au format réduit du terminal.  A l’inverse d’un courrier papier ou d’un message courriel, la longueur du message SMS est limitée. 8. Conclusion La limitation du nombre de caractères, le coût, et les difficultés de saisie ont conduit les jeunes à simplifier les règles orthographiques et chercher à réduire la longueur de ses messages. Ils ont donc réinventé un langage propre à eux : le langage SMS.
  15. 15. Chapitre 2 : Le langage SMS
  16. 16. Chapitre 2 : Le langage SMS 5 1. Introduction Le SMS a connu un grand succès aux prés de ses usagers. Cependant, ils présentent des lacunes en termes de limitation de nombres de caractères. Pour combler ces lacunes, un nouveau langage, langage SMS, a été réinventé. Dans ce chapitre, nous allons présenter le langage SMS avec toutes ses spécificités. Par la suite, nous citons les apports et les limites de ce langage. 2. Définition du langage SMS Le langage SMS est un moyen de communication qui modifie les caractéristiques orthographiques voire grammaticales de la langue française. Il permet de réduire la longueur des messages écrits afin de diminuer la durée requise pour composer un texto. Ce langage vise aussi à respecter le seuil maximum des caractères imposé par le système de la téléphonie mobile. [5] 3. Les procédés utilisés dans le langage SMS Le langage SMS fait recours à certains procédés pour réduire le nombre de caractères dans un message : la phonétique, le rébus typographique, l’abréviation et les émotions [6] [7]. 3.1.La phonétique La phonétique est l’étude scientifique des sons du langage humain [8]. Cette technique consiste à écrire les mots comme ils se prononcent toute on négligeant les règles orthographiques. Elle remplace un son par une lettre ou chiffre dont ils ont la même valeur sonore. Cependant, elle assure une transcription1 phonétique claire et nette, ce qui facilite la compréhension d’un texto. Le tableau ci-dessous montre des exemples de phonétisation. Langage SMS Langage naturel Kdo cadeau swaré soirée KC casser D100 descend 7 Cet(te) G J’ai C cho C'est chaud Tableau 1 : Exemples de phonétisation 1 Pouravoir plus sur la transcription, veuillez consultez ce lien : http://post.queensu.ca/~lessardg/Cours/215/chap2.html
  17. 17. Chapitre 2 : Le langage SMS 6 Au niveau de mot cadeau, la lettre « o » remplace le son de la séquence de lettre « eau » et la lettre « k » remplace le son de « ca ». D’après ce qui qui précède, on remarque que la transcription phonétique est encore lisible. (Tableau 1) 3.2.Le rébus typographique « Le rébus typographique est le procédé par lequel certaines séquences de lettres, d’un mot ou d’une suite de mots, sont remplacées par un arrangement de chiffres, de lettres et signes divers. Ce procédé est basé essentiellement sur la phonétique » [6]. Le tableau ci-dessous illustre des exemples de rébus typographique. Langage SMS Langage naturel ab1to A bientôt a2m1 A demain D100 descend jtm Je t’aime C cho C'est chaud // parallèle 5* Cinq étoiles Tableau 2 : Exemples du rébus typographique Dans l’exemple « A bientôt », on a remplacé la suite de caractère « ien » par le chiffre « 1 » et les caractères « ôt » par l’alphabet « o ». Ceci explique que le chiffre « 1 » et la lettre « o » ont respectivement la même valeur phonétique que « ien » et « ôt ». (Tableau 2) 3.3.L’abréviation Une abréviation est la réduction d'un mot par retranchement des lettres moins pertinentes [9], tout en gardant un mot clair et compréhensible [6]. Le tableau suivant contient quelques exemples des mots en langage SMS et leurs équivalents en langage naturel. Langage SMS Langage naturel tt tout TAL Traitement Automatique des Langues Télé Télévision net internet Tableau 3 : Exemples d'abréviation
  18. 18. Chapitre 2 : Le langage SMS 7 Comme le montre le Tableau 3, l'abréviation a réduit la taille des mots. Dans le cas du mot tout, on a éliminé les alphabets « o » et « u » et on a gardé les deux alphabets les plus informatives « t » et « t ». Dans le deuxième exemple, on a abrégé le mot Traitement Automatique des Langues en un groupe des lettres initiales « TAL ». Pour raccourcir les mots télévision et Internet, on a appliqué la technique de troncation2 . Cette technique fait recours à deux phénomènes : « apocope » et « aphérèse » [7]. L’apocope c’est la suppression de la dernière partie d’un mot (le cas de mot télévision). L’aphérèse consiste à supprimer le début d’un mot (internet devient net). 3.4. Les émotions Les émotions est la combinaison de plusieurs caractères outre que les chiffres et les lettres. Il s’agit des petits visages exprimant l’état de l’esprit d’une personne. Le tableau suivant montre des exemples des émotions. Tableau 4 : Exemple des émotions Note :  La répétition des ponctuations et lettres d’un mot exprime l’intensité des émotions. Par exemple « je t’aiiiiiiiiiiiiiiiiime !!!!!!!! »  Il est possible de combiner plusieurs procédés simultanément comme le montre l’exemple suivant : j'ai passé la plus belle nuit de ma vie --> g pac la plu bel nui 2 ma vi. 4. Le langage SMS entre approbation et rejet Le langage SMS est de plus en plus utilisé par les jeunes. En revanche, il utilise des procédés qui visent à abréger les mots tout en négligeant les normes orthographiques. De ce fait, l’usage d’un tel langage angoisse particulièrement les linguistes. Les questions qui se posent ici : Pourquoi ce langage est considéré comme étant une source d'inquiétude ? Ce moyen de communication présente- il des apports pour ses utilisateurs ? 2 La troncation consiste à supprimer certaines parties de mots. Langage SMS Signification :-) Sourire :-( Triste :’( Une larme :-* bisou
  19. 19. Chapitre 2 : Le langage SMS 8 4.1.Les risques de langage SMS Le langage SMS représente une menace contre les fondamentaux de la langue française. D’après Danièle Manesse3 « le niveau d’orthographe des jeunes est beaucoup plus faible aujourd’hui qu’il y a vingt ans » [10]. En fait, Les personnes qui s’expriment trop par le langage SMS risquent d’oublier graduellement les règles de grammaire et d'orthographe. Devant un tel constat, ces personnes commencent à ne plus distinguer entre le langage SMS et la langue française. Par ailleurs, ceux qui ne maitrisent pas convenablement la langue française trouvent peinent à déchiffrer le langage SMS. Pour les raisons énoncés précédemment, un comité4 de lutte contre le langage SMS et les fautes volontaires sur Internet a d’ailleurs vu le jour. En fait, ce comité interdit l’utilisation de ce mode de communication, langage SMS, sur Internet. 4.2.Les intérêts de langage SMS Plusieurs arguments appuient l’utilisation du langage SMS. Parmi ceci, la simplicité et la rapidité de la communication vu que ce langage n’exige pas le respect des normes linguistiques. En outre, il renforce le sentiment d’appartenance à un groupe social. Ainsi, Le langage SMS offre à chaque scripteur5 la possibilité de créer son propre langage et de jouer avec les mots. Ceci procure un sentiment de plaisir lors de rédaction des messages. Il permet aussi d’enrichir le contenu d’un message tout en respectant le seuil maximum de caractère autorisé par les SMS. 5. Conclusion Le langage SMS se manifeste comme étant une véritable révolution de langue. Il propose une écriture indépendante des normes de la langue française. Ce langage a donné lieu à plusieurs romans6 , entièrement rédigés en langage SMS. Outre que l’apparition des dictionnaires spécifiques à ce langage. Pour les usagers de ce langage, il suffit de consulter un dictionnaire répertoriant ces nouveautés pour s’habituer rapidement à leur lecture. 3 Danièle Manesse professeure de sciences du langage à la Sorbonne 4 http://sms.informatiquefrance.com/ 5 Un scripteur : Personne qui a écrit un texte 6 Exemple du livre « Pa sage a taba vo SMS » http://livre.fnac.com/a1572830/Phil-Marso-Pa-sage-a-taba- vo-SMS
  20. 20. Chapitre 3 : Les dictionnaires et les corpus SMS
  21. 21. Chapitre 3 : Les dictionnaires et les corpus SMS 9 1. Introduction Le langage SMS est très pratique et rapide pour échanger des textos entres personnes. Cependant, il n’est pas toujours évident d’appréhende tous les procédés auxquels a recours ce langage. C'est la raison pour laquelle des dictionnaires et des corpus du langage SMS sont accessibles depuis internet. Nous verrons dans ce chapitre, quelques exemples de dictionnaires et corpus de SMS. 2. Les Dictionnaires des SMS La partie suivante est consacrée à la présentation de quelques dictionnaires de langage SMS. L’évaluation7 de ces traducteurs est faite à l’aide de quelques exemples écrits en langage SMS. 2.1. Le dictionnaire-sms Le dictionnaire-sms8 propose 300 mots français, classés par ordre alphabétique et traduits en langage SMS [11]. Il est caractérisé par une interface conviviale et claire avec des couleurs agréables. (Figure 1) Figure 1 : Le dictionnaire-sms 7 Voir Annexe B 8 http://www.dictionnaire-sms.com
  22. 22. Chapitre 3 : Les dictionnaires et les corpus SMS 10 2.2. Le dictionnaire deblok Le dictionnaire deblok9 permet d’obtenir la signification d’un mot écrit en langage SMS. Il utilise un classement par lettre et par catégories (émotions, loisirs etc.). Ce qui permet d’offrir aux internautes une navigation libre. (Figure 2) Figure 2 : Le dictionnaire deblok 2.3. Le dictionnaire mobilou Le dictionnaire mobilou10 est réalisé par Phil Marso [11]. Il présente les mots français dans l'ordre alphabétique accompagnés de leur traduction en langage SMS. L’interface du site n’est pas trop ergonomique. (Figure 3) Figure 3 : Le dictionnaire mobilou 9 http://www.deblok.net/dicosms/ 10 www.mobilou.info/ 10kosms.htm
  23. 23. Chapitre 3 : Les dictionnaires et les corpus SMS 11 2.4.Le dictionnaire langageSMS Le dictionnaire langageSMS11 offre une liste limitée des mots traduit en langage texto. Il possède une interface simple et claire. (Figure 4) Figure 4 : Le dictionnaire langageSMS D’après ce qui précède, on peut constater que tous les dictionnaires proposent des listes non exhaustives des mots traduit en langage SMS. Ainsi, le langage SMS évolue rapidement ce qui pose des problèmes de mise à jour. De plus, ces dictionnaires se limitent à quelques variantes d’un mot : exemple pour « demain » : 2m1, dmin, dem1, 2min. Pour résumé, Il existe sur Internet plusieurs dictionnaires12 de langage SMS mais on ne trouve pas pour l'instant un dictionnaire officiel de langage SMS. 3. Corpus SMS Le corpus SMS est une collection d’un grand nombre des SMS rédigés par un grand nombre de personnes différentes. Le but d’un corpus est de constituer une référence qui puisse servir pour des études linguistiques. Dans cette partie on va présenter quelques exemples de corpus SMS. 11 http://www.langagesms.com/dictionnaire.html 12 Voir Annexe A
  24. 24. Chapitre 3 : Les dictionnaires et les corpus SMS 12 3.1. Corpus SMS de Caroline Tagg Caroline Tagg, de l’université de Birmingham en Angleterre, a analysé l’orthographe, la grammaire et les abréviations dans les SMS. Pour son étude, elle a demandé à ses amis et aux membres de sa famille de lui renvoyer tous les messages qu’ils recevaient ou envoyaient. Elle a ainsi récolté environ 11 000 SMS, soit près de 190 000 mots. [12] 3.2.Corpus du DELI Ce corpus compte 13 400 SMS pour environ 156 620 mots. Une partie des SMS ont été récoltés entre 2000 et 2004 par des étudiants de l’université de Provence en France, dans le cadre de travaux pratiques ou mémoires. Se sont rajoutés des SMS provenant d’utilisateurs ayant donné leur accord à Orange pour que leurs SMS soient utilisés à des fin de recherche. [12] 3.3.Projet « SMS4science » Le projet, qui se veut international, a débuté en Belgique en 2004. Il a permis de récolter plus de 75 000 SMS grâce à 3200 participants. Parmi ces participants, 2775 ont acceptés de répondre à un questionnaire « portant sur leur profil et leurs pratiques ». Le corpus constitué est à la fois homogène concerne seulement les SMS et diversifié puisque les participants sont différents donc leur utilisation des SMS l’est aussi. En effet, les participants ont entre 12 et 73 ans et appartiennent à des catégories différentes (étudiants, employés, etc.). [13] La récolte des SMS s’est faite par un numéro spécial. Les participants envoyaient leurs SMS directement à ce numéro gratuit. Ce procédé a évité des erreurs de saisie ou d’interprétation en recopiant manuellement les SMS. C’est un problème qui a été observé dans des projets d’analyse de SMS qui se sont réalisés dans différentes universités. [12] 4. Conclusion La limite majeure de la collecte des messages est qu’elle est réalisée dans un cercle proche des universités, de la famille, des amis, ou un nombre limité des personnes. Elle ne concerne donc qu'une partie restreinte du public utilisateur des SMS et par ailleurs, elle implique généralement une phase de recopiage des messages qui peut être la source d'erreurs. [14]
  25. 25. Chapitre 4 : Les traducteurs SMS existants
  26. 26. Chapitre 4 : Les traducteurs SMS existants 13 1. Introduction La recherche dans la traduction des SMS a mené a réalisé des logiciels de traduction des SMS. Ces traducteurs se sont des outils intéressants qui permettent de traduire des SMS envoyés avec un téléphone portable. Ils traduits les mots en langage SMS et les remplaces par les mots correspondants, mais ils ne corrigent pas les éventuelles fautes de français. L’objectif de ce chapitre et de présenter et tester quelque applications de traduction du langage SMS vers le langage naturel. 2. Les différents traducteurs SMS Il existe sur Internet différents sites qui proposent des traducteurs du langage SMS vers le français. 2.1. Le traducteur du site « www.TraducteurSMS.com » Le site www.TraducteurSMS.com13 met à la disposition de ses utilisateurs un traducteur en ligne gratuit du langage SMS vers la langue française. De plus il contient un dictionnaire du langage SMS et la signification des smileys. (Figure 5) Figure 5 : Le traducteurSMS.com 13 http://www.TraducteurSMS.com
  27. 27. Chapitre 4 : Les traducteurs SMS existants 14  Avantages et inconvénients Le tableau ci-dessous montre les avantages et les inconvénients associé à ce traducteur. Avantages Inconvénients + Bonne ergonomie + Reconnaissance des Smiley + Disponibilité d’un dictionnaire pour le langage SMS et la signification des Smileys - Outil faible - Le dictionnaire utilisé ne contient pas beaucoup de mot même les plus utilisés SLT -> Salut RDV -> Rendez-Vous ss -> Sous Tableau 5 : Avantage et inconvénients de l'outil TraducteurSMS.com 2.2.Le traducteur du site « www.aidoweb.com » Le site web www.aidoweb.com14 , met à notre disposition un outil de traduction SMS, nous permettant de décrypter un texte écrit en langage SMS vers du français correcte. Il comporte pour le moment 6350 mots. [16] (Figure 6) Figure 6 : Le traducteur SMS AidoWeb  Avantages et inconvénients Le tableau suivant montre les avantages et les inconvénients associé à ce traducteur. Avantages Inconvénients - Outil simple - Reconnait beaucoup de Rébus Typographique : tel que C C’est, auj aujourd’hui, svoi se voit Malgré le fait qu’il soit puissant, le dictionnaire qu’il utilise n’est pas implémenter par tous les rébus (normale vu le fait que chaque jour de nouveaux mots naissent) Exemple : Raf  Rien à faire 12C4  Un de ces quatre jTappel Je t’appel Tableau 6 : Avantages et inconvénients de l’outil AidoWeb 14 http:// www.aidoweb.com
  28. 28. Chapitre 4 : Les traducteurs SMS existants 15 2.3.Le traducteur du site « www.1fo.co » Le site web www.1fo.co15 , met à notre disposition un outil de traduction SMS qui se base sur tous les mots présents dans le dictionnaire SMS du site lui-même. Ce dictionnaire comporte plus de 400 abréviations SMS. [17] (Figure 7) Figure 7 : Le traducteur SMS 1fo  Avantages et inconvénients Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur. Avantage Inconvénients - Outil un peu puissant - Reconnait un certain nombre de Rébus typographique Mais il reste tout de même assez incomplet. Son dictionnaire ne contient pas beaucoup de mots (400 mots reste vraiment peu suffisant pour une base lexicale qui peut faire le poids) Tableau 7 : Avantages et inconvénients de l’outil 1fo 3. Conclusion Dans ce chapitre nous avons ouvert une fenêtre sur les outils que l’on trouve sur internet et qui peuvent nous aider à faire une traduction du langage SMS vers un Français classique. Cela a été riche en enseignement, vu le nombre assez grand de ce genre de logiciel sur la toile, nous avons testé quelque uns, qui étaient soit peu ou très performant. 15 http : // www.1fo.co
  29. 29. Partie 2 : Etude Pratique
  30. 30. Chapitre 1 : Analyse et spécification des besoins
  31. 31. Chapitre 1 : Analyse et spécification des besoins 16 1. Introduction La phase d’analyse et de spécification et des besoins est sans doute l’une des plus importantes phases dans le cycle de développement de toute application informatique. Ce chapitre est consacré à la description des différents besoins fonctionnels et non fonctionnels dégagés lors de la phase d’analyse. Ainsi que la description de modèle de cas d’utilisation prévus pour bien comprendre le fonctionnement de l’application. 2. L’objectif du projet L’objectif de ce projet est de concevoir un logiciel permettant de traduire un texte écrit en langage SMS vers la langue française. 3. Analyse des besoins Nous présentons dans cette partie les besoins fonctionnels et non fonctionnels de notre système. 3.1. Définition des besoins fonctionnels Le système à mettre en place doit offrir à l’utilisateur les fonctionnalités suivantes :  Saisir le texte en langage SMS  Traduire le texte saisi en langage SMS vers la langue française  Voir le pourcentage de traduction correcte 3.2. Définition des besoins non fonctionnels Outre que les besoins fonctionnels, il faut tenir compte de certains besoins non fonctionnels nécessaires pour une exploitation simple et consistante de notre système. Nous distinguons essentiellement les trois points suivants :  Simplicité : l’application doit offrir une interface simple avec des fonctionnalités compréhensibles.  Ergonomie : l’interface doit être ergonomique proche de la réalité du domaine d’application, facile à utiliser.  Rapidité : l’application doit offrir un temps de réponse acceptable qui dépend en grande partie de la complexité du code implémenté.
  32. 32. Chapitre 1 : Analyse et spécification des besoins 17 4. Vue des cas d’utilisation Pour bien spécifier les besoins de notre application, nous avons recours au langage de modélisation unifié UML. Nous allons décrire les différents acteurs ainsi que les cas d'utilisation. Cette activité permet d'obtenir une vue interne idéale du système. 4.1.Identification des acteurs Un acteur représente un ensemble cohérant de rôles joués par des entités externes (utilisateurs, dispositifs matériels ou autres systèmes) qui interagissent directement avec l’application. De ce fait, le seul acteur de notre application est un utilisateur quelconque tel que : un élève, un étudiant, un professeur, etc… 4.2.Identification des cas d’utilisations Les cas d’utilisation représentent un élément essentiel de la modélisation : c’est une étape primordiale assurant la conception et la construction d’un système adapté aux besoins fonctionnels de l’utilisateur. La figure ci-dessous décrit les fonctionnalités pouvant être effectué par l’utilisateur. Figure 8 : Diagramme de cas d’utilisation générale <<include>> <<include>> Utilisateur Traduire le texte saisi du langage SMS vers la langue française Consulter l'interface Saisir le texte en langage SMS Consulter le résultat de la traduction
  33. 33. Chapitre 1 : Analyse et spécification des besoins 18 En consultant notre interface, l’utilisateur a le pouvoir de saisir le texte, en langage SMS, qu’il veut traduire. Ainsi, la traduction du langage SMS en langue française sera effectuée et notre client pourra par la suite consulter le résultat de sa traduction. La première relation de type « include » entre « traduire le texte saisi du langage sms vers langue française » et « saisir le texte en langage sms » exige la saisie du texte par l’utilisateur avant de faire toute traduction possible. La deuxième relation de type « include » entre « traduire le texte saisi du langage sms vers langue française » et « consulter le résultat de la traduction » exige de la part de l’utilisateur une traduction du texte saisie, sinon la consultation du résultat et logiquement impossible à percevoir. 5. Conclusion Dans ce chapitre, nous avons essayé de présenter des différents besoins fonctionnels et non fonctionnels dégagés lors de la phase d’analyse. Dans le chapitre qui va suivre, nous entamerons la phase de la réalisation. Nous allons énumérer les différentes technologies que nous avons adoptées pour la réalisation de notre application et les différentes étapes de création du notre base de donnée (en XML).
  34. 34. Chapitre 2 : Construction des dictionnaires
  35. 35. Chapitre 2 : Construction des dictionnaires 19 1. Introduction Après avoir achevé l'étape d’analyse et spécification des besoins, nous entamons dans ce chapitre la partie réalisation qui constitue le dernier volet de ce rapport et qui a pour objectif d'exposer le travail réalisé. Pour ce faire, nous allons commencer, tout d'abord, par préciser l'environnement matériel et logiciel de notre travail. Ensuite nous allons présenter les différentes étapes de construction des dictionnaires. 2. Environnement et outils de travail Dans cette partie nous allons présenter l’environnement logiciel et matériel de notre travail. 2.1. Environnement logiciel Notre projet a été développé avec le langage de programmations C#. Pour cela, nous avons utilisé l’outil Microsoft Visual C# 2010 Express. Pour la création des dictionnaires, nous avons utilisé le langage XML (Extensible Markup Language) qui peut être traduit en français par langage de balisage extensible. 2.2.Environnement matériel Lors de la réalisation de ce projet, nous avons utilisé six micro-ordinateurs dont nous allons citer les caractéristiques du certains parmi eux:  Micro-ordinateur 1 : - Processeur : Pentium ® DualCore CPU T4200 @ 2.00 GHz. - Mémoire vive RAM: 4,00 Go. - Disque dur: 370 Go. - Système d'exploitation : Windows Vista.  Micro-ordinateur 2 : - Processeur : Pentium [R] 4 CPU 2.8 GHz. - Mémoire vive RAM: 1,OO Go. - Disque dur: 160 Go. - Système d'exploitation : SE XP sweet.
  36. 36. Chapitre 2 : Construction des dictionnaires 20 3. Construction des dictionnaires L’évolution rapide du langage SMS a donné lieu à l’apparition des dictionnaires spécifiques à ce langage. Ces dictionnaires servent principalement à répertorier les nouveautés du ce langage et prendre en charge la vaste quantité de variant que peut avoir un même mot. Par exemple le mot bonne nuit, il peut être exprimé sous forme (bn8, bn, BN, bn8…). Donc ces dictionnaires peuvent être utiles pour traduire un SMS à condition qu’ils soient mis à jour régulièrement et que le problème des formes multiples soit résolu. 3.1.Pourquoi XML ? Le langage XML (Extensible Markup Language) présente plusieurs avantages par rapport aux autres moyens de stockage des données tel que le fichier texte ou base de données. Un fichier XML est : [18]  Lisible : Aucun pré requis n’est nécessaire pour comprendre un fichier XML.  Auto descriptif et bien structuré.  Extensible : un document XML peut être utilisable dans toute applications possibles.  Présente une structure arborescente : structurant et hiérarchisant tout problème informatique possible.  Portabilité.  Dé ployable : il peut être facilement distribué par n'importe quels protocoles à même de transporter du texte, comme http.  Intégrabilité : un document XML est utilisable par toute application pourvue d'un parseur (c'est-à-dire un logiciel permettant d'analyser un code XML).  Accès plus rapide. 3.2.Les étapes d’élaboration des dictionnaires Dans cette partie nous allons explorer nos 3 fichiers XML, afin de décrire l'architecture de nos fichiers et la logique qu'ils expriment. Chacune des balises transcrites dans ces fichiers seront expliquées et éclaircies.
  37. 37. Chapitre 2 : Construction des dictionnaires 21 3.2.1.Le fichier « traduction.xml » Ce dictionnaire a pour objectif de traduire des mots SMS en leur équivalent en français. (Figure 9) Figure 9 : Extrait du dictionnaire « traduction.xml » Il faut spécifier à celui qui va lire le fichier que ce soit un logiciel ou un navigateur WEB que le fichier présent est en langage XML. Donc il faut ajouter la syntaxe ci-dessus en en-tête de fichier. <dictionnaire> c'est la balise mère. Chaque fichier XML doit impérativement avoir une balise mère pour pouvoir être lu.
  38. 38. Chapitre 2 : Construction des dictionnaires 22 La figure ci-dessus montre un extrait du fichier « traduction.xml » qui décrit la structure de la balise <Dictionnaire>. Figure 10 : Structure de la balise <Dictionnaire>  La balise mot contient un attribut « valeur » qui représente le mot en langage sms.  La balise signification indique l’équivalent de mot « bnjr » dans la langue française.  Le type : cet attribut permet d’indiquer le type de mot 0 : sans type 1 : un mot masculin singulier. 2 : un mot féminin singulier. 3 : un mot masculin pluriel. 4 : un mot féminin pluriel. 5 : un mot au pluriel. 6 : un mot au singulier. Comme le montre l’exemple ci-dessous, le mot « pom de ter » saisi en langage SMS peut être traduit de plusieurs manières vers la langue française. En effet, l’accord orthographique du mot SMS « pom de ter » change selon le type qui lui correspond. Autrement dit, si le type associé est égale à 1, c'est-à-dire « masculin singulier » donc on aura pomme de terre sans ‘s’. si le type associé est égale à zéro. Dans ce cas, il s’agit d’un type inconnu, on lui affecte donc tous les traductions possibles (pomme ou pommes de terre).
  39. 39. Chapitre 2 : Construction des dictionnaires 23 3.2.2.Le fichier « dico-fr.xml » Le fichier « dico-fr.xml » représente le dictionnaire français. Il contient des mots en français avec leurs types. La figure suivante présente un extrait du dictionnaire français. Dans l’entête, on remarque l’utilisation de balise mère <dictionnaireFrancais>. Chaque fichier XML doit impérativement avoir une balise mère pour pouvoir être lu. Figure 11 : Extrait du dictionnaire « dico-fr.xml » L’exemple suivant illustre l’utilisation de type pour identifier la valeur correspondante au mot SMS.  Le mot « enfants » est un mot masculin pluriel.  Le mot « enfant » est un mot au masculin singulier
  40. 40. Chapitre 2 : Construction des dictionnaires 24 3.2.3.Le fichier « dico-fo.xml » C’est un dictionnaire phonétique qui permet de traduire les mots du langage SMS vers la langue française selon leurs transcriptions phonétiques, c’est-à-dire la manière dont ils se prononcent. La figure ci-dessous décrit un extrait du fichier XML « dico-fr.xml ». (Figure 12) Figure 12 : Extrait du dictionnaire « dico-fr.xml » Dans cet exemple le mot SMS « k » peut être traduit en plusieurs mots selon la manière dont il est prononcé. 4. Conclusion Nous avons décrit dans cette partie l’environnement du travail et les différentes étapes de construction des trois dictionnaires. Dans la partie suivante, nous détaillons notre application.
  41. 41. Chapitre 3 : Interfaces de l’application
  42. 42. Chapitre 3 : Interfaces de l’application 25 1. Introduction Dans ce chapitre nous décrivons le travail accompli tout au long de ce projet pour achever avec une exposition des problèmes rencontrés. 2. Les interfaces réalisées Au cours de cette section, nous nous attachons à présenter les étapes de réalisation de notre traducteur SMS à travers quelques interfaces. Au niveau de chaque étape nous allons décrire les problèmes rencontrés et les solutions envisagés. Les étapes à mettre en œuvre sont les suivantes :  Le découpage en tokens  La traduction des mots SMS connus  La traduction des mots inconnus  L’évaluation (cette étape sera décrite dans le chapitre suivant) 2.1.Le découpage en tokens Le rôle de cette étape est de convertir une chaîne de caractères représentant une phrase SMS en une suite de tokens. La figure suivante prouve que notre traducteur SMS a bien segmenté la phrase. Figure 13 : Interface de découpage en tokens
  43. 43. Chapitre 3 : Interfaces de l’application 26  Les problèmes rencontrés et les solutions proposées Le type de séparateur à utiliser ? Est-ce que nous allons utiliser les ponctuations « . , ; : ! ? » comme séparateur ou bien nous allons utiliser l’espace seulement.  Nous avons choisi donc comme délimiteur des tokens les points, les virgules, les espaces et le retour chariot car ils sont les plus utilisés. Les autres ponctuations vont être considérées comme des mots. En outre, si nous allons considérer les : ; comme des séparateurs notre logiciel ne peut pas distinguer les émotions. 2.2.La traduction des mots SMS connus Le but de cette étape est de remplacer les séquences de caractères correspondant à un mot SMS présent dans le fichier « traductions.xml » en sa traduction en français. Pour cela, nous procéderons en deux étapes : l’identification des mots et la traduction. 2.2.1.L’identification des mots Cette étape16 consiste à détecter les tokens correspondant à un mot SMS présent dans le dictionnaire. Cette étape doit détecter aussi les tokens qui correspondent à des mots du français à l’aide de « dico-fr.xml ».  Les problèmes rencontrés et les solutions proposées Comment nous allons détecter les locutions ? Certains mots (SMS ou français) sont composés de plusieurs tokens. Dans ce cas, ces différents tokens devront être regroupés ensemble.  Après la phase de segmentation, notre traducteur prend le premier token (pom) et le combine avec le deuxième token (de) pour construire un nouveau mot (pom de). Puis il consulte le dictionnaire (dico-fr.xml ou traductions.xml) pour vérifier si ce dernier existe ou non. Si le nouveau mot existe dans le dictionnaire, le traducteur va le conserver dans une variable temporaire et le concatène avec le troisième token (pom de ter). Ensuite, le traducteur consulte de nouveau le dictionnaire si le mot existe il va écraser l’ancien contenu de la variable temporaire et mettre ce nouveau mot (pom de ter). De même, le traducteur combine le nouveau mot (pom de ter) avec le quatrième token (pom de ter ). Si le mot existe, il va l’afficher sinon le traducteur affiche le contenu de la variable temporaire (pom de ter) car nous avons limité le nombre de combinaison permis à quatre. 16 Enoncé de projet « traduction des SMS »
  44. 44. Chapitre 3 : Interfaces de l’application 27 La figure ci-dessous montre la détection de la locution « pomme de terre » par notre traducteur. Figure 14 : Interface de détection de locution 2.2.2.La traduction La dernière étape consiste à effectuer la traduction des mots SMS en leur équivalent en français, tel qu’ils sont décrit dans le fichier « traduction.xml ». Cette étape ne va traduire que les mots de type sms.  Les problèmes rencontrés et les solutions proposées Il arrive dans certains cas, que notre logiciel ne reconnait pas les mots SMS car ils n’existent pas dans le dictionnaire « traductions.xml ». Donc on a recours à enrichir manuellement notre dictionnaire pour augmenter la performance du notre système. Plus qu’on alimente notre dictionnaire, plus que le logiciel reconnait correctement les mots SMS. En revanche, le temps de réponse augmente et la performance du logiciel diminue. • Pour traiter le cas d’étirement, nous avons fixé le nombre maximum de répétition des lettres à deux. Le logiciel essaie de faire toute les combinaisons possibles des mots par exemple, les combinaisons du mot « sllllttttttt » engendre ces nouveaux mots « slt », « sllt » et « sltt ».
  45. 45. Chapitre 3 : Interfaces de l’application 28 Le traducteur consulte le dictionnaire pour valider l’un des nouveaux mots. Il vérifie l’existence de l’un de ces mots dans le dictionnaire français en premier lieu après dans le dictionnaire SMS en deuxième lieu. S’il l’a trouvé, il l’affiche sinon il affiche le premier mot rencontré « slt ». L’exemple choisie combines plusieurs procèdes (Abréviation, phonétique). Notre traducteur a su identifié les mots SMS et les traduire en langue française. (Figure 14) Figure 15 : Interface de traduction des mots SMS connus 2.3.La traduction des mots SMS inconnus Le but de cette étape17 est d’essayer de « déchiffrer » des mots SMS absents dans le dictionnaire « traduction.xml ».  Les problèmes rencontrés et les solutions proposées - Le dictionnaire « traduction.xml » ne comporte qu’une partie du vocabulaire SMS. Pour cela, on va utiliser la transcription phonétique des mots (la manière dont ils se prononcent) pour essayer de retrouver des mots français correspondants. Nous avons créé un dictionnaire phonétique « dico-fo.xml » à travers lequel nous allons traduire les mots inconnus. 17 Enoncé de projet « traduction des SMS »
  46. 46. Chapitre 3 : Interfaces de l’application 29 - Plus qu’on augmente la taille du mot, plus que le nombre de combinaison possible ce qui influe sur la durée du traitement. Nous avons fixé un seuil pour le nombre de caractère du mot inconnu qui égale à cinq. Par exemple le mot « klke » donne 432 combinaisons possibles dont le « k » possède six valeurs dans le dictionnaire phonétique, pour « l » quatre valeurs et trois valeurs pour « e ». La multiplication nous donne 6*4*6*3 combinaisons. -Plus qu’on augmente la taille du dictionnaire plus que le temps de réponse augmente et la performance diminue  Pour optimiser les dictionnaires utilisés, nous avons alimenté nos dictionnaires que par des mots minuscules. Lors de la traduction, nous avons converti tous les mots SMS vers la minuscule d’une manière transparente pour l’utilisateur. La figure suivante montre que notre traducteur a réussi l’opération de déchiffrement des mots inconnu. Figure 16 : Interface de traduction des mots SMS inconnus 3. Conclusion Nous avons achevé dans ce chapitre, la description des interfaces les plus significatives de notre application. Il semble indispensable de critiquer notre travail et de l’évaluer. Ceci sera détaillé dans le chapitre suivant.
  47. 47. Chapitre 4 : Evaluation de l’application
  48. 48. Chapitre 4 : Evaluation de l’application 30 1. Introduction L’évaluation de l’application consiste à vérifier si elle a atteint ses objectifs et de déterminer quelles sont leurs forces et leurs faiblesses pour émettre des recommandations pour une amélioration future. C’est dans ce cadre s’inscrit ce chapitre qui est composé de deux parties, premièrement nous allons évaluer l’application par rapport à un corpus de test, ensuite, nous allons comparer notre système avec d’autres traducteurs existants sur Internet. 2. Evaluation par rapport au « corpus-sms-test.txt » Cette partie est consacrée à l’évaluation de l'efficacité du notre traducteur SMS. Elle nous indique si nous avons atteint nos objectifs ou non. Pour cela, nous procédons d’abord par traduire quelques phrases du fichier « corpus-sms-test.txt » à l’aide de notre application. Puis, nous comparons-les aux phrases de « corpus-fr-test.txt ».  Exemple 1 La figure suivante présente le résultat de traduction de la phrase " Mais pq t debout ? nan j’éteind jamais mon gsm :-)". Figure 17 : Traduction de la phrase 1 de corpus-sms-test
  49. 49. Chapitre 4 : Evaluation de l’application 31 La comparaison de notre résultat et celle de « corpus-fr-test.txt » " Mais pourquoi t'es debout? Non, j'éteins jamais mon GSM :-) " permet de faire les constatations suivantes :  La traduction des mots SMS connus (pq ,nan ) est correcte et identique aux résultats de « corpus-fr-test.txt » .  Notre traducteur connaît le sigle GSM.  L’apport de notre application est la signification des smileys :-) : sourire  Exemple 2 La figure ci-dessous présente la traduction de la phrase "Lol... Pk pa vnu today? Probleme derection ??". Figure 18 : Traduction de la phrase 47 de corpus-sms-test Notre traducteur SMS donne un résultat pareil au résultat de corpus "Lol... Pourquoi pas venu today? Problème d'érection ??". Ainsi, notre traducteur donne la signification de l’abréviation Lol.
  50. 50. Chapitre 4 : Evaluation de l’application 32  Exemple 3 La figure ci-dessous illustre la traduction de la phrase "g né pas bocop aimé cette piece de théâtre. Il faut dire que g lé vue dans de mauvaises conditions: le rideau était levé...". Figure 19 : Traduction d'une phrase avec mot inconnu Notre application a atteint son but de déchiffrer des mots SMS inconnus en utilisant la transcription phonétique des mots pour essayer de retrouver des mots français correspondants comme le montre le mot « bocop».  Comparaison entre les différentes approches Dans la réalisation de notre projet nous avons opté à utiliser une approche hybride qui applique d’abord le dictionnaire puis traite les mots restants à l’aide de leur prononciation. Vu que l’utilisation unique d’un dictionnaire de traduction a plusieurs limites : il représente une ressource limitée puisque le langage SMS évolue rapidement .Il ne prend pas en compte la totalité des mécanismes de création d’un mot SMS (un même mot possède plusieurs écriture possible). De même, l’approche qui considère tous les mots comme inconnus et passe par leur phonétisation n’apporte pas une solution optimale puisque un seul mot peut avoir plusieurs formes.
  51. 51. Chapitre 4 : Evaluation de l’application 33 3. Comparaison par rapport aux autres traducteurs Au niveau de cette partie, nous allons comparer le résultat de traduction du notre logiciel par rapport aux traducteurs SMS existants : - Le traducteur 1 de site : www.1fo.co - Le traducteur 2 de site : www.TraducteurSMS.com - Les traducteurs des sites : www.Traducteur-sms.com et www.aidoweb.com18 Nous a avons fixé le choix sur l’exemple suivant car il combine plusieurs procédés simultanément (étirement, phonétique, abréviation) : - Exemple : lé enfon manj dé pom de terrrrrrrrrr elles sont bn ;) - Traduction : les enfants mangent des pommes de terre elles sont bonnes ;) 3.1.Le résultat de notre traducteur SMS L’interface suivante illustre la traduction de l’exemple cité auparavant. Figure 20 : Interface de traduction de notre Traducteur SMS Notre application a traduit correctement l’exemple écrit en langage SMS. En effet, elle a appliqué les règles de conjugaison (manj  mangent) et les règles d’orthographes (des pommes, elles sont bonnes). Ainsi, notre traducteur est capable d’éliminer l’étirement (terrrrrrrrrrrr  terre). Outre qu’il a réussi la traduction de l’émotion ;)  (clin d’œil) (Figure 19) 18 Consulter Annexe C pour voir le résultat de traduction des Traducteur-sms.com et www.aidoweb.com
  52. 52. Chapitre 4 : Evaluation de l’application 34 3.2.Le résultat du traducteur « www.1fo.co » Ce traducteur a échoué la traduction. Il n’a traité aucun mot SMS. (Figure 20) Figure 21 : Interface de traduction du traducteur www.1fo.co 3.3.Le résultat du traducteur « www.TraducteurSMS.com » Ce traducteur n’a traduit qu’un seul mot SMS sachant que cette traduction est erronée. Autrement dit, il a considéré le mot SMS « bn » comme étant « bonne nuit » alors qu’il s’agit de l’adjectif « bon ». (Figure 21) Figure 22 : Interface de traduction de traducteur www. TraducteurSMS.com
  53. 53. Chapitre 4 : Evaluation de l’application 35 4. Un tableau comparatif de traducteurs SMS19 Le tableau suivant résume l’étude comparative entre notre logiciel et les autres traducteurs SMS. La case cochée montre que le traducteur en question a réussi la gestion du procèdes correspondant et la case vide reflet le cas d’échéance. Nom des traducteurs Procédés utilisés dans l’exemple Notreapplication www.1fo.co www.TraducteurS MS.com www.Traducteur- sms.com www.aidoweb.com Phonétique    Abréviation    Elimination d’étirement   Conjugaison  Accord orthographique  émotion  Tableau 8 : Un tableau comparatif de traducteurs SMS 4. Conclusion A travers ce chapitre, nous avons remarqué d’après la comparaison de notre système avec les autres traducteurs qu’aucun d’entre eux n’a pas réussi à faire la traduction total es mot SM. Ceci montre que la traduction des SMS n’est pas une tâche simple, et l’évaluation est une étape primordiale pour ce type d’application pour savoir surtout les limites de l’application. 19 Consulter Annexe C pour voir le résultat de traduction d’autres traducteurs
  54. 54. Chapitre 5 : Gestion du projet
  55. 55. Chapitre 5 : Gestion de projet 36 1. Introduction Ce chapitre décrit la répartition des tâches entre les membres de l’équipe et les difficultés rencontrés au cours de la réalisation de ce projet. Ainsi, nous allons critiquer notre démarche de gestion de projet et proposer des solutions pour ne pas commettre ces erreurs dans le futur. 2. Démarche utilisé pour organiser le projet Le choix de chef d’équipe est réalisé à travers un vote sur notre groupe Facebook. Tous les membres de l’équipe ont participé dans l’élection de chef du groupe. Après le vote, le chef d’équipe élu a proposé la démarche suivante pour organiser le travail tout au long de ce projet. Pour l’étude théorique, tous les membres de l’équipe ont commencé la recherche bibliographique du sujet d’une manière individuel pendant quelques jours. Ceci a pour objectif de bien comprendre le sujet et fixer une idée préalable sur les points clé du plan du rapport. Par la suite, le chef d’équipe propose des réunions régulières pour collecter les idées de recherches et fixer un plan final. L’étape suivante consiste à affecter à chaque membre de l’équipe une partie de rédaction du rapport. Cette affectation a été basée sur l’avancement des recherches bibliographiques déjà réalisées et selon le désir de chaque membre de l’équipe. Après cette phase, une réunion a été fixée pour valider le travail. Pour l’étude pratique, le chef d’équipe a fixé une réunion pour déterminer l’environnement de travail et bien comprendre les différentes étapes de l’application. Contrairement à l’étude théorique, cette partie est plus délicate car les tâches sont dépendantes et le développement de l’application parait difficile. C’est pourquoi nous avons décidé de ne pas partager les tâches de développement. Donc, chaque membre de l’équipe a prescrit les solutions possibles pour résoudre les problèmes associés à chaque étape de l’application. Lors des réunions, nous avons partagé les idées et choisir les meilleurs solutions. Avec cette démarche, tous les membres de l’équipe contribuent au développement de l’application toute en gardant l’esprit collaboratif. Chaque réunion a été clôturée par un compte rendu20 rédigé par le chef d’équipe ainsi que la fusion et la validation de la copie finale du rapport. L’échange des informations a été effectué à travers notre groupe de discussion Facebook. 20 Consulter l’annexe D pour voir un exemple de compte rendu
  56. 56. Chapitre 5 : Gestion de projet 37 3. Répartion des tâches de rédaction du rapport Le tableau suivant résume l’affectation des taches de rédaction du rapport entre les membres d’équipe. Yosra Asma Balkiss Takwa Taieb khaled Partie 1 : Etude théorique Introduction générale       Chapitre 1    Chapitre 2    Chapitre 3: Dictionnaires   Coprus   Chapitre 4   Partie 2 : Etude Pratique Chapitre 1   Chapitre 2     Chapitre 3    Chapitre 4 : Evaluation   Comparaison  Chapitre 5       Conclusion générale Conclusion générale       Tableau 9: Répartition des tâches
  57. 57. Chapitre 5 : Gestion de projet 38 4. Les apports de projet Nous allons citer dans cette partie les différents apports associés au chef du projet et les autres membres de l’équipe.  Les apports de projet pour le chef d’équipe : - Diriger une équipe - Assurer le bon fonctionnement d'une équipe de travail pour mener à bien une production dans le respect des objectifs fixés. - Clarifier les objectifs - Essayer de ne pas donner un avis critique publiquement - Encourager et apprécier le rendement de chaque membre de l’équipe  Les apports de projet pour les membres d’équipe : - Echanger les informations - Apprendre à écouter - Créer des décisions plus pertinentes - Respecter les délais et répondre à des problèmes plus rapidement - Partager les bonnes pratiques Le domaine du TAL est très vaste et intéressent. Cependant, en pratique nous avons confrontés des problèmes dus principalement à nos connaissances limitées. Ce projet nous a permis d’améliorer nos compétences et d’approfondir nos connaissances. 5. Les problèmes rencontrés et solutions proposées Parmi les problèmes rencontrés au cours de la réalisation de ce projet, nous citons la difficulté de construction des dictionnaires et la correction d’orthographe et de conjugaison mais nous avons surmonté ce problème grâce à la coopération des membres d’équipe. 6. Conclusion Au cours de ce projet, nous avons décrit la démarche suivie par l’équipe pour bien planifier le projet et respecter les délais des livrables.
  58. 58. Conclusion générale
  59. 59. Conclusion générale 39 Nous avons eu l’opportunité au cours de ce projet, de participer à la conception et à la mise en place d’un système informatique de traduction des SMS en langue française sous le langage C# de Microsoft. Durant ce projet, nous avons rencontré des difficultés dues à nos connaissances minimes dans le domaine de langage SMS. Néanmoins, nous avons pu surmonter ces difficultés grâce à beaucoup de documentation et de persévérance. La plus grande difficulté à laquelle nous nous somme confrontées est l’inexpérience dans le domaine du « Traitement Automatique des Langages », les technologies que nous avons utilisées tel que le langage XML avec qui nous avons développé des dictionnaires sur lesquels repose tout notre travail. Il faut tout de même mentionner que cette expérience a été bénéfique pour notre formation. En effet, nous avons eu l’occasion d’utiliser de nouvelles technologies tel que Microsoft Visual C# ainsi que la mise en œuvre de différents outils acquis durant notre cursus universitaires à l’Ecole Supérieure des Sciences et Techniques de Tunis. En guise de perspective, nous pouvons évoquer l’augmentation de la taille du notre dictionnaire pour qu'il puisse gérer le maximum de mots écris en langage SMS et ainsi essayer de couvrir le plus de mots possible utilisé. On peut aussi prévoir un dictionnaire automatique qui s’alimente au fur et à mesure disposant d’un outil d’apprentissage pour lui permettre d’évoluer à chaque utilisation. Nous espérons, durant ce projet, avoir réalisé un travail sérieux et convenable tout en ayant laissé une bonne impression.
  60. 60. 40 Références [1] http://www.linguistik-online.de/48_11/cougnonFrancois.pdf (Consulté le 19/03/2013) [2] http://sebastien.fessard.free.fr/documents/RapportDeStageSebastienFessard.pdf (Consulté le 19/03/2013) [3] http://outils.diesenet.conseil-recherche-innovation.net/doc/Etude-Telephone-Mobile- Insertion.pdf (Consulté le 19/03/2013) [4] http://www.zdnet.fr/actualites/20-ans-du-sms-une-invention-qui-au-depart-n-etait-pas- destinee-au-grand-public-39785028.htm (Consulté le 19/03/2013) [5] http://fr.wikipedia.org/wiki/Orthographes_alternatives_du_fran%C3%A7ais [6] https://forge.info.unicaen.fr/attachments/382/Rapport_final.pdf (Consulté le 18/03/2013) [7] http://books.google.fr/books?id=bjNjfL-Z01kC&pg=PA61&lpg=PA61&dq=sms+et+ tal&source=bl&ots=9zHhJoNVZh&sig=7CzLLdslMP3a7gc8CoqUl4VeQg0&hl=fr&sa= X&ei=mT9HUbymD8Xl4QTZlYCgDw&ved=0CD0Q6AEwADgK#v=onepage&q=sms%20et% 20tal&f=false (Consulté le 08/03/2013) [8] http://post.queensu.ca/~lessardg/Cours/215/chap2.html (Consulté le 19/03/2013) [9] http://www.linternaute.com/dictionnaire/fr/definition/abreviation/ (Consulté le 18/03/2013) [10] http://www.projet-voltaire.fr/blog/actualite/l%E2%80%99ecriture-sms-est-elle-reellement- un-danger-pour-l%E2%80%99orthographe (Consulté le 19/03/2013) [11] http://www.texto.exionnaire.com/annuaire-sites-sms.php (Consulté le 19/03/2013) [12] http://dumas.ccsd.cnrs.fr/docs/00/56/19/95/PDF/CHABERT_Gaelle_M2R.pdf (Consulté le 19/03/2013) [13] http://www.sms4science.org/?q=fr/node/2 (Consulté le 19/03/2013) [14] http://www.sms4science.org/userfiles/le%20langage%20SMS%20r%C3%A9v%C3% A9lateur%20d%271comp%C3%A9tence.pdf (Consulté le 19/03/2013) [15] http://www.traducteur-sms.com/ (Consulté le 19/03/2013) [16] http://www.aidoweb.com/outils/traducteur-sms/ (Consulté le 19/03/2013) [17] http://www.1fo.co/traducteur-sms-francais.php (Consulté le 19/03/2013) [18] http://glossaire.infowebmaster.fr/xml/ (Consulté le 25/04/2013)
  61. 61. Annexes
  62. 62. Annexes 42 Annexe A Les dictionnaires SMS 1. Les dictionnaires SMS Il existe plusieurs sites qui proposent des dictionnaires SMS. 1.1. Le dictionnaire de site «www.maison-facile.com » Le site «www.maison-facile.com » propose un dictionnaire d’abréviations françaises qui permet de décoder le langage SMS. (Figure 1) Figure 1 : Dictionnaire de site «www.maison-facile.com »
  63. 63. Annexes 43 1.2.Le dictionnaire de site « www.1fo.co » Le site « www.1fo.co » met à la disposition des internautes un petit dictionnaire du langage SMS. Ce dictionnaire est sous la forme d’un petit tableau trié dans l'ordre alphabétique avec les expressions et termes sms les plus courants. (Figure 2) Figure 2 : Le dictionnaire de site « www.1fo.co » 2. Le dictionnaire des émotions Le langage SMS permet aussi de passer des émotions via un message. Il existe alors des dictionnaires des smileys qui permettent de décoder ces petits symboles. La figure suivante présente un exemple de dictionnaire des smileys (appelés aussi binettes). (Figure 3) Figure 3 : Le dictionnaire de smileys
  64. 64. Annexes 44 Annexe B Les traducteurs SMS 1. Le traducteur « TraducteurSMS.com » L’outil est simple à utiliser, il suffit d’entrer le message que nous voulons traduire et appuyer sur le bouton « traduire » pour avoir la traduction du texte entré. Pour vérifier la fiabilité de cet outil, nous avons entré quelques phrases pour les traduire. (Tableau 1). Tableau 1 : Test de l'outil TraducteurSMS.com
  65. 65. Annexes 45 2. Le traducteur « Traducteur-sms.com » L’utilisation de cet outil est simple, il suffit d’entrer le texte à traduire puis appuyer sur le bouton « Traduire ». Pour vérifier l’efficacité de cet traducteur, nous avons entré quelques exemples en langages SMS pour les traduire. (Tableau 2) Langage SMS Traduction SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! On svoi 2m1 ou 12C4 et on sfé un 6né C cho auj , on par a la mer Raf auj, rdv ds 5 min ss la tour Tableau 2 : Test de l'outil Traducteur-SMS.com 3. Le traducteur du site « Aidoweb » Grâce à des phrases en langage SMS, nous effectuerons quelques essaie pour vérifier la fiabilité de ce traducteur. (Tableau 3) SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! On svoi 2m1 ou 12C4 et on sfé un 6né C choauj , on par a la mer Raf auj, rdv ds 5 min ss la tour Tableau 3: Teste de l’outil AidoWeb 4. Le traducteur du site « 1fo » L’outil que nous propose « 1fo.co » est assez intéressant. Il nous permet non seulement de traduire du langage SMS en français classique, mais l’inverse aussi, (Français  SMS). Maintenant, grâce aux phrases tests, que nous avons utilisé tout au long de ce chapitre, nous effectuerons quelques essaie pour vérifier la fiabilité de ce traducteur. (Tableau 4)
  66. 66. Annexes 46 Langage SMS Traduction SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! salut, jtapldemainsi t'esdispo on sboiun cafe ! On svoi 2m1 ou 12C4 et on sfé un 6né on svoidemain ou 12c4 et on sfé un ciné C choauj, on par a la mer c'est chaud aujourd'hui, on par a la mer Raf auj, rdv ds 5 min ss la tour rien à faire aujourd'hui, rendez-vous dans 5 min ss la tour Tableau 4 : Teste de l’outil 1fo 5. Le Traducteur du site « WebJunior » Le site www.webjunior.com met à notre disposition un traducteur SMS capable de traduire les abréviations, l'épelure21 et les rébus typographique que l’on lui donne [3]. L’interface du logiciel est sous la forme d’un téléphone portable avec un champ texte et un bouton traduire. (Figure 4) Figure 4 : Traducteur SMS WebJunior Grâce à des phrase écrit en langage SMS, nous effectuerons quelques essaie pour vérifier la fiabilité de ce traducteur. (Tableau 5) 21 L'épelure, résultat de l'épellation des lettres d'un mot. Valeur épellative des lettres, des chiffres et des caractères : G pour « j'ai », C pour « c'est », NRJ pour « énergie », a12c4 pour « À un de ces quatre » 2m1, « demain », bi1, « bien », koi 2 9, « quoi de neuf »
  67. 67. Annexes 47 Langage SMS Traduction SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! On svoi 2m1 ou 12C4 et on sfé un 6né C choauj , on par a la mer Raf auj, rdv ds 5 min ss la tour Tableau 5 : Teste de l’outil WebJunior Avantages et inconvénients Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur. Avantage Inconvénients Malgré ça simplicité, il reste un outil assez intéressant, capable de résoudre quelque rébus typographique. Il reste quand même très loin d’être performant, son dictionnaire n’est pas assez riche en mot Par exemple : 6né  Cinéma raf  Rien à faire Tableau 6 : Avantages et Inconvénients de l’outil WebJunior 6. Le traducteur du site « www.Traducteur-sms.com » Le site www.Traducteur-SMS.com met à la disposition de ses utilisateurs un outil de traduction SMS, ce traducteur contient plus que 9900 mots en mémoire et des nombreuses règles logiques. [15] (Figure 5)
  68. 68. Annexes 48 Figure 5: Le Traducteur-SMS.com  Avantages et inconvénients Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur. Avantages Inconvénients + Bonne ergonomie + Outil très puissant + Possibilité d’ajouter des mots dans le dictionnaire + Application des règles grammaticales - Quelques mots ne sont pas traduits correctement on part -> on par disponible -> dispo Tableau 7 : Avantage et Inconvénients de l'outil Traducteur-SMS.com
  69. 69. Annexes 49 Annexe C Comparaison avec les traducteurs SMS existant 1. Le résultat de traducteur « www.Traducteur-sms.com » Ce traducteur a presque su traduire tous les mots SMS. Il n’a pas reconnu le mot ‘enfon’. Autrement dit, il a bien géré l’étirement (terrrrrrrrr -> terre), l’abréviation (pom -> pomme et bn- >bon) et la phonétique (manj -> mange). Cependant, il n’a pas respecté les règles de conjugaison et d’orthographe et il n’a pas traité l’émotion. (Figure 6) Figure 6: Interface de comparaison de traducteur www.Traducteur-sms.com
  70. 70. Annexes 50 2. Le résultat de traducteur « www.aidoweb.com » Ce traducteur a réussi la traduction de certains mots SMS ( lé -> les, mang -> mange, dé -> des, pom -> pomme et bn->bon) tandis qu’il n’a pas reconnu le mot terrrrr et enfon ni l’émotions. (Figure 7) Figure 7: Interface de comparaison de traducteur www.aidoweb.com
  71. 71. Annexes 51 Annexe D Exemple de compte rendu Discussion de projet TAL [Date de la réunion : 04-03-2013] [Heure de la réunion : 12:30] [Lieu de la réunion : ESSTT] REUNION ORGANISEE PAR Yosra HASNAOUI TYPE DE REUNION Réunion d’information et de prise de décision PARTICIPANTS Taieb SADDEM , Khaled FAYALA, Balkiss HAMAD, Asma MDAINI, Takwa LAAMIRI DISCUSSION Etude de l’art (les thèmes) * Le langage SMS * Traduction du langage SMS - Définition du terme SMS - Les étapes de traduction des SMS - Définition de langage SMS et son intérêt - Les dictionnaires existants (les + et les -) - Pourquoi la traduction des SMS ? - Les corpus existants (avantages et limites) - Les domaines d’utilisations de ce langage * Applications de traduction SMS - Avantages et inconvénients de ce langage - Les applications existants - Les utilisateurs de ce langage - Avantages et inconvénients des applications Développement de l’application - Le langage de programmation : C# - Interface de l’application : Sous la forme d’un téléphone pour le moment (voir ce lien http://www.traducteur-sms.com/) - Un dictionnaire sous forme d’une base de données ou sous la forme d’un fichier XML. - Utilisation de l’analyseur lexical : gplex
  72. 72. Annexes 52 Rédaction du Rapport - Conforme au modèle déposé par notre enseignante sur la plateforme. - Chacun rédige sa partie avec les mises en formes appropriés et dépose une copie sur le groupe pour la valider. - Il faut mettre la bibliographie. - La copie finale va être fusionnée et validée par le chef d’équipe CONCLUSIONS - Commencer la recherche bibliographie - Choisir le dictionnaire nécessaire pour commencer le développement de l’application - Ajouter d’autres thèmes si c’est possible pour enrichir l’étude de l’art. Chacun des membres de l’équipe dois laisser une trace sur la validation des copies des autres membres. C’est-à-dire le membre qui vérifie la copie doit laisser son nom (de même pour les autres membres). Une copie qui ne contient pas tous les noms des membres de l’équipe ne sera pas validée. Lors de dépôt d’une nouvelle copie il faut marquer tous les noms des membres pour les notifier qu’il existe une copie à vérifier. MESURES A PRENDRE PERSONNE RESPONSABLE DELAI A RESPECTER Certains membres proposent de diviser les thèmes de recherches. La répartition des thèmes est affectée par un tirage au sort. Les autres membres préfèrent une recherche exhaustive. On réparti alors les thèmes et les membres qui veulent une recherches exhaustive communique les modifications ajoutées au chef d’équipe. La décision finale sera faite par le chef d’équipe (ou peut-être on fait recours à des votes si on a plus de temps). Tous les membres vont participer pour faire la recherche bibliographie La validation des parties séparées doit être faite avant 20 Mars 2013. La copie finale doit être prête avant 21 Mars 2013.
  73. 73. Annexes 53

×