Traduction des SMS

8 183 vues

Publié le

L’évolution des technologie de l’information et de la communication a modifié la nature de la communication.
Transmission des informations plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS.

Publié dans : Technologie
0 commentaire
3 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
8 183
Sur SlideShare
0
Issues des intégrations
0
Intégrations
448
Actions
Partages
0
Téléchargements
24
Commentaires
0
J’aime
3
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Traduction des SMS

  1. 1. Ecole Supérieure des Sciences et Techniques de Tunis Département : INFORMATIQUE Traduction des SMS Réalisé Par équipe n 2: khaled FAYALA Yosra HASNAOUI Blakiss HAMAD Encadré par: Taeib SADDEM Asma MDAINI Takwa LAAMIRI 2012-2013 Emna SOUISSI
  2. 2. Plan 1 Introduction 2 Problématique 3 Le langage SMS 4 Dictionnaires et corpus 5 Spécification des besoins 6 Réalisation 7 Evaluation 8 Conclusion et perspectives 2
  3. 3. Introduction  L’évolution des technologie de l’information et de la communication a modifié la nature de la communication.  Transmission des informations plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS.  SMS « Short Message Service » appelé aussi texto.  Suite de caractères transmis d’un téléphone mobiles ou un terminal informatique vers un ou plusieurs autres téléphones. 3
  4. 4. Introduction Contexte du projet  Besoin d’un outil pour la traduction des mots SMS  Permet d’eclaircir la signification du message Traducteur SMS 4
  5. 5. Plan 1 Introduction 2 Problématique 5
  6. 6. Problématique  La longueur d’un SMS est limitée  Nombre de caractères réduits  La ponctuation et les espaces sont comptés  Le coût en terme du temps et d’argent  Les difficultés de saisie  Chaque touche correspond à un ensemble de caractères. Langage SMS 6
  7. 7. Problématique Objectif du projet  Etude théorique du langage SMS  Développement d’un traducteur SMS 7
  8. 8. Plan 1 Introduction 2 Problématique 3 Langage SMS 8
  9. 9. Langage SMS Définition du langage SMS  Modifie les caractéristiques orthographiques voire grammaticales de la langue française.  Réduit la longueur des messages écrits.  Vise à respecter le seuil maximum des caractères imposé par le système de la téléphonie. 9
  10. 10. Langage SMS Les procédés utilisés par le langage SMS La phonétique Le rebus typographique Procédés L’abréviation Les émotions Etirement 10
  11. 11. Langage SMS Les procédés utilisés par le langage SMS  Phonétique  Etude scientifique des sons du langage humain.  Remplace un son par une lettre ou chiffre dont ils ont la même valeur sonore 11
  12. 12. Langage SMS Les procédés utilisés par le langage SMS  Le rebus typographique  Remplace les séquences de lettres par un arrangement de chiffres, de lettres et signes divers.  Basé essentiellement sur la phonétique 12
  13. 13. Langage SMS Les procédés utilisés par le langage SMS  L’abréviation  Réduire les mots par retranchement des lettres moins pertinentes.  Les mots restent clairs et compréhensibles. 13
  14. 14. Langage SMS Les procédés utilisés par le langage SMS  Les émotions  Les émotions est la combinaison de plusieurs caractères  Exprime l’état de l’esprit d’une personne 14
  15. 15. Langage SMS Les procédés utilisés par le langage SMS  Etirement  Répétition des ponctuations et lettres  Exprime l’intensité des émotions je t’aiiiiiiiiiiiiiiiiime !!!!!!!! 15
  16. 16. Langage SMS  Les intérêts du langage SMS  La simplicité d’écriture  La rapidité de la communication  Procure un sentiment de plaisir lors de rédaction des messages. Les risques du langage SMS  Affaiblit le niveau d’orthographe.  L’oublie graduelle des règles de grammaire.  Problème de distinction entre le langage SMS et la langue française.  Difficulté de déchiffrer le langage SMS. 16
  17. 17. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Dictionnaires et corpus 17
  18. 18. Dictionnaires et corpus Les dictionnaires SMS  Le langage SMS a donné lieu à plusieurs dictionnaires spécifiques.  Un dictionnaire permet d’obtenir la signification d’un mot écrit en langage SMS.  Il existe différents dictionnaires qui sont accessibles depuis internet :  Le dictionnaires langage SMS  Le dictionnaire-sms  Le dictionnaire deblok 18
  19. 19. Dictionnaires et corpus Le dictionnaire-sms  Propose 300 mots français.  Classe par ordre alphabétique. 19
  20. 20. Dictionnaires et corpus Le dictionnaires  Interface simple et claire  Liste limitée des mots traduit 20
  21. 21. Dictionnaires et corpus Les corpus SMS  Le corpus SMS est une collection d’un grand nombre des SMS.  Rédigés par un grand nombre de personnes différentes.  Constitue une référence qui puisse servir pour des études linguistiques  Il existe différents corpus :  Le Corpus SMS de Caroline Tagg  Le Corpus du DELI  Le Projet « SMS4science » 21
  22. 22. Langage SMS Les corpus SMS  Corpus SMS de Caroline Tagg  Analyser l’orthographe, la grammaire et les abréviations dans les SMS.  Contient environ 11 000 SMS soit près de 190 000 mots.  Projet « du DELI Corpus SMS4science »  Il compte plus de 75 000 SMS grâce à 3200 participants. Ce corpus compte 13 400 SMS pour environ 156 620 mots.  Il est partie des SMS ont été récoltés par des étudiants et l’autre partie Une homogène concerne seulement les SMS d’utilisateurs d’Orange  Il est diversifié puisque les participants sont différents. 22
  23. 23. Plan 1 Introduction 2 Problématique 3 Langage SMS 3 Dictionnaires et corpus 5 Spécification des besoins 23
  24. 24. Spécification des besoins Objectif de l’application  L’application permet de traduire un SMS vers la langue française.  Permet de visualiser le pourcentage de traduction correcte.  Elle doit être  Simple  Ergonomique  Rapide 24
  25. 25. Spécification des besoins Analyse Consulter l'interface Saisir le texte en langage SMS <<include>> Utilisateur T raduire le texte saisi du langage SMS vers la langue française <<include>> Consulter le résultat de la traduction 25
  26. 26. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Dictionnaires et corpus 5 Spécification des besoins 6 Réalisation 26
  27. 27. Réalisation  La phase de réalisation consiste à : Réalisation Construction des dictionnaires Traduction.xml Dico-fr.xml Dico-fo.xml Interfaces de l’application Etapes: Découpage en tokens Traduction mots connus Traduction mots inconnus 27
  28. 28. Réalisation La construction des dictionnaires  Traduction.xml  Contient des mots SMS et leurs équivalents en français.  Dico-fr.xml  Contient que des mots français.  Dico-fo.xml  Contient des caractères alphabétiques et leurs transcriptions phonétique. 28
  29. 29. Réalisation Interfaces de l’application  Les étapes du développement de l’application sont :  Le découpage en tokens  La traduction des mots SMS connus  La traduction des mots inconnus 29
  30. 30. Réalisation Interfaces de l’application  Découpage en tokens  Le rôle de cette étape est de convertir la phrase SMS en une suite de tokens. 30
  31. 31. Réalisation Interfaces de l’application  Traduction des mots connus  Remplacer les séquences des caractères correspondant à un mot SMS présent dans le fichier « traductions.xml » en sa traduction en français.  Contient 2 étapes :  Identifier les mots  Traduire les mots 31
  32. 32. Réalisation Interfaces de l’application  Traduction des mots inconnus  Essayer de « déchiffrer » des mots SMS absents de « traduction.xml ». 32
  33. 33. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Analyse des besoins 5 Réalisation 6 Evaluation 33
  34. 34. Evaluation Objectif de l’évaluation  Evaluer le taux de réussite de traduction de notre application.  Vérifier si le projet a Objectif objectifs atteint ses  Déterminer quelles sont les forces et faiblesses de l’application. Pourquoi évaluer notre traducteur SMS ?  Émettre des recommandations pour une amélioration future 34
  35. 35. Evaluation Démarche d’évaluation  Evaluation par rapport au corpus  Utilisation d’un corpus de test « corpus-sms-test.txt » Objectif  Comparaison par rapport aux autres traducteurs existants  Traducteur 1 de site : www.TraducteurSMS.com  Traducteur 2 de site : www.Traducteur-sms.com  Traducteur 3 de site : www.aidoweb.com  Traducteur 4 de site : www.1fo.co 35
  36. 36. Evaluation Démarche d’évaluation  Evaluation par rapport au corpus Le « corpus-fr-test.txt » donne comme résultat " Mais pourquoi t'es debout? Non, j'éteins jamais mon GSM :-) " La comparaison de notre résultat et celle de corpus permet de faire les constatations suivantes :  La traduction des mots SMS connus (pq ,nan ) est correcte et identique aux résultats de « corpus-frtest.txt» .  L’apport de notre application est la signification des smileys :-) : sourire  Notre traducteur connaît le sigle GSM. 36
  37. 37. Evaluation Démarche d’évaluation  Evaluation par rapport au corpus Le « corpus-fr-test.txt » donne comme résultat "Lol... Pourquoi pas venu today? Problème d'érection ??". Notre traducteur donne :  un résultat pareil au résultat de corpus  La signification de l’abréviation lol(lot of laugh) 37
  38. 38. Evaluation  Comparaison par rapport aux autres traducteurs existants  Exemple: lé enfon manj dé pom de terrrrrrrrrr elles sont bn ;)  Traduction: les enfants mangent des pommes de terre elles sont bonnes ;) Objectif 38
  39. 39. Evaluation  Comparaison par rapport aux autres traducteurs existants  www.1fo.co  www.TraducteurSMS.com www.aidoweb.com  www.Traducteur-sms.com Observation: Observation: Traduction érronée Aucune traduction de mot « bn » des mots. Objectif 39
  40. 40. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Analyse des besoins 5 Réalisation 6 Evaluation 7 Conclusion et perspectives 40
  41. 41. Conclusion et Perspectives  Le SMS a connu un grand succès aux prés de ses usagers.  Le langage SMS est très pratique pour échanger des textos entres personnes.  Les traducteurs SMS permettent de traduire des SMS vers langage naturel.  Pas de traducteur performant jusqu’à maintenant 41
  42. 42. Conclusion et Perspectives Perspectives  Optimisation de la construction des dictionnaires  Automatisation de la construction des dictionnaires  Traitement de tous les règles orthographiques voire grammaticales. 42
  43. 43. Bibliographie http://www.linguistik-online.de/48_11/cougnonFrancois.pdf http://outils.diesenet.conseil-recherche-innovation.net/doc/Etude-Telephone-Mobile-Insertion.pdf http://dumas.ccsd.cnrs.fr/docs/00/56/19/95/PDF/CHABERT_Gaelle_M2R.pdf http://fr.wikipedia.org/wiki/Orthographes_alternatives_du_français https://forge.info.unicaen.fr/attachments/382/Rapport_final.pdf http://post.queensu.ca/~lessardg/Cours/215/chap2.html http://www.linternaute.com/dictionnaire/fr/definition/abreviation/ http://www.texto.exionnaire.com/annuaire-sites-sms.php http://www.sms4science.org/?q=fr%2Fnode%2F2 43
  44. 44. Merci Pour Votre Attention 44

×