L’évolution des technologie de l’information et de la communication a modifié la nature de la communication.
Transmission des informations plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS.
1. Ecole Supérieure des Sciences et Techniques de Tunis
Département : INFORMATIQUE
Traduction des SMS
Réalisé Par équipe n 2:
khaled FAYALA
Yosra HASNAOUI
Blakiss HAMAD
Encadré par:
Taeib SADDEM
Asma MDAINI
Takwa LAAMIRI
2012-2013
Emna SOUISSI
3. Introduction
L’évolution des technologie de l’information et de la communication a
modifié la nature de la communication.
Transmission des informations plus facile grâce aux diversités des moyens
de communications utilisés tel que le SMS.
SMS « Short Message Service » appelé aussi texto.
Suite de caractères transmis d’un téléphone mobiles ou un terminal
informatique vers un ou plusieurs autres téléphones.
3
4. Introduction
Contexte du projet
Besoin d’un outil pour la traduction des mots SMS
Permet d’eclaircir la signification du message
Traducteur SMS
4
6. Problématique
La longueur d’un SMS est limitée
Nombre de caractères réduits
La ponctuation et les espaces sont comptés
Le coût en terme du temps et d’argent
Les difficultés de saisie
Chaque touche correspond à un ensemble de caractères.
Langage SMS
6
9. Langage SMS
Définition du langage SMS
Modifie les caractéristiques orthographiques voire grammaticales de
la langue française.
Réduit la longueur des messages écrits.
Vise à respecter le seuil maximum des caractères imposé par le
système de la téléphonie.
9
10. Langage SMS
Les procédés utilisés par le langage SMS
La phonétique
Le rebus
typographique
Procédés
L’abréviation
Les émotions
Etirement
10
11. Langage SMS
Les procédés utilisés par le langage SMS
Phonétique
Etude scientifique des sons du langage humain.
Remplace un son par une lettre ou chiffre dont ils ont la même valeur
sonore
11
12. Langage SMS
Les procédés utilisés par le langage SMS
Le rebus typographique
Remplace les séquences de lettres par un arrangement de chiffres, de
lettres et signes divers.
Basé essentiellement sur la phonétique
12
13. Langage SMS
Les procédés utilisés par le langage SMS
L’abréviation
Réduire les mots par retranchement des lettres moins pertinentes.
Les mots restent clairs et compréhensibles.
13
14. Langage SMS
Les procédés utilisés par le langage SMS
Les émotions
Les émotions est la combinaison de plusieurs caractères
Exprime l’état de l’esprit d’une personne
14
15. Langage SMS
Les procédés utilisés par le langage SMS
Etirement
Répétition des ponctuations et lettres
Exprime l’intensité des émotions
je t’aiiiiiiiiiiiiiiiiime !!!!!!!!
15
16. Langage SMS
Les intérêts du langage SMS
La simplicité d’écriture
La rapidité de la communication
Procure un sentiment de plaisir lors de rédaction des messages.
Les risques du langage SMS
Affaiblit le niveau d’orthographe.
L’oublie graduelle des règles de grammaire.
Problème de distinction entre le langage SMS et la langue française.
Difficulté de déchiffrer le langage SMS.
16
18. Dictionnaires et corpus
Les dictionnaires SMS
Le langage SMS a donné lieu à plusieurs dictionnaires spécifiques.
Un dictionnaire permet d’obtenir la signification d’un mot écrit en
langage SMS.
Il existe différents dictionnaires qui sont accessibles depuis internet :
Le dictionnaires langage SMS
Le dictionnaire-sms
Le dictionnaire deblok
18
19. Dictionnaires et corpus
Le dictionnaire-sms
Propose 300 mots français.
Classe par ordre alphabétique.
19
21. Dictionnaires et corpus
Les corpus SMS
Le corpus SMS est une collection d’un grand nombre des SMS.
Rédigés par un grand nombre de personnes différentes.
Constitue une référence qui puisse servir pour des études linguistiques
Il existe différents corpus :
Le Corpus SMS de Caroline Tagg
Le Corpus du DELI
Le Projet « SMS4science »
21
22. Langage SMS
Les corpus SMS
Corpus SMS de Caroline Tagg
Analyser l’orthographe, la grammaire et les abréviations dans les SMS.
Contient environ 11 000 SMS soit près de 190 000 mots.
Projet « du DELI
Corpus SMS4science »
Il compte plus de 75 000 SMS grâce à 3200 participants.
Ce corpus compte 13 400 SMS pour environ 156 620 mots.
Il est partie des SMS ont été récoltés par des étudiants et l’autre partie
Une homogène concerne seulement les SMS
d’utilisateurs d’Orange
Il est diversifié puisque les participants sont différents.
22
24. Spécification des besoins
Objectif de l’application
L’application permet de traduire un SMS vers la langue française.
Permet de visualiser le pourcentage de traduction correcte.
Elle doit être
Simple
Ergonomique
Rapide
24
25. Spécification des besoins
Analyse
Consulter l'interface
Saisir le texte en langage SMS
<<include>>
Utilisateur
T raduire le texte saisi du langage
SMS vers la langue française
<<include>>
Consulter le résultat de la traduction
25
27. Réalisation
La phase de réalisation consiste à :
Réalisation
Construction
des dictionnaires
Traduction.xml
Dico-fr.xml
Dico-fo.xml
Interfaces
de l’application
Etapes:
Découpage en tokens
Traduction mots connus
Traduction mots inconnus
27
28. Réalisation
La construction des dictionnaires
Traduction.xml
Contient des mots SMS et leurs équivalents en français.
Dico-fr.xml
Contient que des mots français.
Dico-fo.xml
Contient des caractères alphabétiques et leurs transcriptions
phonétique.
28
29. Réalisation
Interfaces de l’application
Les étapes du développement de l’application sont :
Le découpage en tokens
La traduction des mots SMS connus
La traduction des mots inconnus
29
31. Réalisation
Interfaces de l’application
Traduction des mots connus
Remplacer les séquences des caractères correspondant à un mot SMS
présent dans le fichier « traductions.xml » en sa traduction en français.
Contient 2 étapes :
Identifier les mots
Traduire les mots
31
34. Evaluation
Objectif de l’évaluation
Evaluer le taux de réussite de traduction de notre application.
Vérifier si le projet a Objectif objectifs
atteint ses
Déterminer quelles sont les forces et faiblesses de l’application.
Pourquoi évaluer notre traducteur SMS ?
Émettre des recommandations pour une amélioration future
34
35. Evaluation
Démarche d’évaluation
Evaluation par rapport au corpus
Utilisation d’un corpus de test « corpus-sms-test.txt »
Objectif
Comparaison par rapport aux autres traducteurs existants
Traducteur 1 de site : www.TraducteurSMS.com
Traducteur 2 de site : www.Traducteur-sms.com
Traducteur 3 de site : www.aidoweb.com
Traducteur 4 de site : www.1fo.co
35
36. Evaluation
Démarche d’évaluation
Evaluation par rapport au corpus
Le « corpus-fr-test.txt » donne comme résultat " Mais pourquoi t'es debout?
Non, j'éteins jamais mon GSM :-) "
La comparaison de notre résultat et celle de corpus permet de faire les
constatations suivantes :
La traduction des mots SMS connus (pq ,nan ) est correcte et identique
aux résultats de « corpus-frtest.txt» .
L’apport de notre application est la signification des smileys :-) : sourire
Notre traducteur connaît le sigle GSM.
36
37. Evaluation
Démarche d’évaluation
Evaluation par rapport au corpus
Le « corpus-fr-test.txt » donne comme résultat "Lol... Pourquoi pas venu
today? Problème d'érection ??".
Notre traducteur donne :
un résultat pareil au résultat de corpus
La signification de l’abréviation lol(lot of laugh)
37
38. Evaluation
Comparaison par rapport aux autres traducteurs existants
Exemple:
lé enfon manj dé pom de terrrrrrrrrr elles sont bn ;)
Traduction: les enfants mangent des pommes de terre elles sont
bonnes ;)
Objectif
38
39. Evaluation
Comparaison par rapport aux autres traducteurs existants
www.1fo.co
www.TraducteurSMS.com
www.aidoweb.com
www.Traducteur-sms.com
Observation:
Observation:
Traduction érronée
Aucune traduction
de mot « bn »
des mots.
Objectif
39
41. Conclusion et Perspectives
Le SMS a connu un grand succès aux prés de ses usagers.
Le langage SMS est très pratique pour échanger des textos entres personnes.
Les traducteurs SMS permettent de traduire des SMS vers langage naturel.
Pas de traducteur performant jusqu’à maintenant
41
42. Conclusion et Perspectives
Perspectives
Optimisation de la construction des dictionnaires
Automatisation de la construction des dictionnaires
Traitement de tous les règles orthographiques voire grammaticales.
42