Ecole Supérieure des Sciences et Techniques de Tunis
Département : INFORMATIQUE

Traduction des SMS
Réalisé Par équipe n 2:

khaled FAYALA
Yosra HASNAOUI
Blakiss HAMAD

Encadré par:

Taeib SADDEM
Asma MDAINI
Takwa LAAMIRI
2012-2013

Emna SOUISSI
Plan
1

Introduction

2

Problématique

3

Le langage SMS

4

Dictionnaires et corpus

5

Spécification des besoins

6

Réalisation

7

Evaluation

8

Conclusion et perspectives
2
Introduction
 L’évolution des technologie de l’information et de la communication a
modifié la nature de la communication.
 Transmission des informations plus facile grâce aux diversités des moyens
de communications utilisés tel que le SMS.

 SMS « Short Message Service » appelé aussi texto.
 Suite de caractères transmis d’un téléphone mobiles ou un terminal
informatique vers un ou plusieurs autres téléphones.

3
Introduction
Contexte du projet
 Besoin d’un outil pour la traduction des mots SMS
 Permet d’eclaircir la signification du message

Traducteur SMS

4
Plan
1

Introduction

2

Problématique

5
Problématique
 La longueur d’un SMS est limitée
 Nombre de caractères réduits
 La ponctuation et les espaces sont comptés

 Le coût en terme du temps et d’argent
 Les difficultés de saisie
 Chaque touche correspond à un ensemble de caractères.

Langage SMS
6
Problématique
Objectif du projet
 Etude théorique du langage SMS
 Développement d’un traducteur SMS

7
Plan
1

Introduction

2

Problématique

3

Langage SMS

8
Langage SMS
Définition du langage SMS


Modifie les caractéristiques orthographiques voire grammaticales de
la langue française.



Réduit la longueur des messages écrits.



Vise à respecter le seuil maximum des caractères imposé par le
système de la téléphonie.

9
Langage SMS
Les procédés utilisés par le langage SMS
La phonétique
Le rebus
typographique

Procédés

L’abréviation

Les émotions

Etirement
10
Langage SMS
Les procédés utilisés par le langage SMS
 Phonétique


Etude scientifique des sons du langage humain.



Remplace un son par une lettre ou chiffre dont ils ont la même valeur
sonore

11
Langage SMS
Les procédés utilisés par le langage SMS
 Le rebus typographique


Remplace les séquences de lettres par un arrangement de chiffres, de
lettres et signes divers.



Basé essentiellement sur la phonétique

12
Langage SMS
Les procédés utilisés par le langage SMS
 L’abréviation


Réduire les mots par retranchement des lettres moins pertinentes.



Les mots restent clairs et compréhensibles.

13
Langage SMS
Les procédés utilisés par le langage SMS
 Les émotions


Les émotions est la combinaison de plusieurs caractères



Exprime l’état de l’esprit d’une personne

14
Langage SMS
Les procédés utilisés par le langage SMS
 Etirement
 Répétition des ponctuations et lettres
 Exprime l’intensité des émotions

je t’aiiiiiiiiiiiiiiiiime !!!!!!!!

15
Langage SMS
 Les intérêts du langage SMS
 La simplicité d’écriture
 La rapidité de la communication

 Procure un sentiment de plaisir lors de rédaction des messages.

Les risques du langage SMS
 Affaiblit le niveau d’orthographe.
 L’oublie graduelle des règles de grammaire.

 Problème de distinction entre le langage SMS et la langue française.
 Difficulté de déchiffrer le langage SMS.
16
Plan
1

Introduction

2

Problématique

3

Langage SMS

4

Dictionnaires et corpus

17
Dictionnaires et corpus
Les dictionnaires SMS
 Le langage SMS a donné lieu à plusieurs dictionnaires spécifiques.
 Un dictionnaire permet d’obtenir la signification d’un mot écrit en
langage SMS.
 Il existe différents dictionnaires qui sont accessibles depuis internet :


Le dictionnaires langage SMS



Le dictionnaire-sms



Le dictionnaire deblok
18
Dictionnaires et corpus
Le dictionnaire-sms

 Propose 300 mots français.
 Classe par ordre alphabétique.

19
Dictionnaires et corpus
Le dictionnaires

 Interface simple et claire
 Liste limitée des mots
traduit

20
Dictionnaires et corpus
Les corpus SMS
 Le corpus SMS est une collection d’un grand nombre des SMS.
 Rédigés par un grand nombre de personnes différentes.
 Constitue une référence qui puisse servir pour des études linguistiques
 Il existe différents corpus :


Le Corpus SMS de Caroline Tagg



Le Corpus du DELI



Le Projet « SMS4science »
21
Langage SMS
Les corpus SMS
 Corpus SMS de Caroline Tagg

 Analyser l’orthographe, la grammaire et les abréviations dans les SMS.
 Contient environ 11 000 SMS soit près de 190 000 mots.

 Projet « du DELI
Corpus SMS4science »

 Il compte plus de 75 000 SMS grâce à 3200 participants.
Ce corpus compte 13 400 SMS pour environ 156 620 mots.
 Il est partie des SMS ont été récoltés par des étudiants et l’autre partie
Une homogène concerne seulement les SMS
d’utilisateurs d’Orange
 Il est diversifié puisque les participants sont différents.
22
Plan
1

Introduction

2

Problématique

3

Langage SMS

3

Dictionnaires et corpus

5

Spécification des besoins

23
Spécification des besoins
Objectif de l’application
 L’application permet de traduire un SMS vers la langue française.
 Permet de visualiser le pourcentage de traduction correcte.
 Elle doit être


Simple



Ergonomique



Rapide

24
Spécification des besoins
Analyse
Consulter l'interface

Saisir le texte en langage SMS

<<include>>

Utilisateur
T raduire le texte saisi du langage
SMS vers la langue française

<<include>>

Consulter le résultat de la traduction

25
Plan
1

Introduction

2

Problématique

3

Langage SMS

4

Dictionnaires et corpus

5

Spécification des besoins

6

Réalisation

26
Réalisation
 La phase de réalisation consiste à :
Réalisation

Construction
des dictionnaires

Traduction.xml
Dico-fr.xml
Dico-fo.xml

Interfaces
de l’application

Etapes:
Découpage en tokens
Traduction mots connus
Traduction mots inconnus
27
Réalisation
La construction des dictionnaires
 Traduction.xml
 Contient des mots SMS et leurs équivalents en français.
 Dico-fr.xml

 Contient que des mots français.
 Dico-fo.xml
 Contient des caractères alphabétiques et leurs transcriptions
phonétique.
28
Réalisation
Interfaces de l’application
 Les étapes du développement de l’application sont :


Le découpage en tokens



La traduction des mots SMS connus



La traduction des mots inconnus

29
Réalisation
Interfaces de l’application


Découpage en tokens

 Le rôle de cette étape est de convertir la phrase SMS en une suite de
tokens.

30
Réalisation
Interfaces de l’application


Traduction des mots connus

 Remplacer les séquences des caractères correspondant à un mot SMS
présent dans le fichier « traductions.xml » en sa traduction en français.


Contient 2 étapes :


Identifier les mots



Traduire les mots

31
Réalisation
Interfaces de l’application


Traduction des mots inconnus

 Essayer de « déchiffrer » des mots SMS absents de « traduction.xml ».

32
Plan
1

Introduction

2

Problématique

3

Langage SMS

4

Analyse des besoins

5

Réalisation

6

Evaluation

33
Evaluation
Objectif de l’évaluation
 Evaluer le taux de réussite de traduction de notre application.



Vérifier si le projet a Objectif objectifs
atteint ses

 Déterminer quelles sont les forces et faiblesses de l’application.
Pourquoi évaluer notre traducteur SMS ?


Émettre des recommandations pour une amélioration future

34
Evaluation
Démarche d’évaluation


Evaluation par rapport au corpus
 Utilisation d’un corpus de test « corpus-sms-test.txt »

Objectif


Comparaison par rapport aux autres traducteurs existants
 Traducteur 1 de site : www.TraducteurSMS.com

 Traducteur 2 de site : www.Traducteur-sms.com
 Traducteur 3 de site : www.aidoweb.com
 Traducteur 4 de site : www.1fo.co
35
Evaluation
Démarche d’évaluation


Evaluation par rapport au corpus
Le « corpus-fr-test.txt » donne comme résultat " Mais pourquoi t'es debout?
Non, j'éteins jamais mon GSM :-) "
La comparaison de notre résultat et celle de corpus permet de faire les
constatations suivantes :
 La traduction des mots SMS connus (pq ,nan ) est correcte et identique
aux résultats de « corpus-frtest.txt» .
 L’apport de notre application est la signification des smileys :-) : sourire
 Notre traducteur connaît le sigle GSM.
36
Evaluation
Démarche d’évaluation


Evaluation par rapport au corpus
Le « corpus-fr-test.txt » donne comme résultat "Lol... Pourquoi pas venu
today? Problème d'érection ??".
Notre traducteur donne :
 un résultat pareil au résultat de corpus
 La signification de l’abréviation lol(lot of laugh)

37
Evaluation


Comparaison par rapport aux autres traducteurs existants

 Exemple:

lé enfon manj dé pom de terrrrrrrrrr elles sont bn ;)

 Traduction: les enfants mangent des pommes de terre elles sont
bonnes ;)

Objectif

38
Evaluation


Comparaison par rapport aux autres traducteurs existants

 www.1fo.co
 www.TraducteurSMS.com
www.aidoweb.com
 www.Traducteur-sms.com
Observation:
Observation:
Traduction érronée
Aucune traduction
de mot « bn »
des mots.

Objectif

39
Plan
1

Introduction

2

Problématique

3

Langage SMS

4

Analyse des besoins

5

Réalisation

6

Evaluation

7

Conclusion et perspectives
40
Conclusion et Perspectives
 Le SMS a connu un grand succès aux prés de ses usagers.
 Le langage SMS est très pratique pour échanger des textos entres personnes.
 Les traducteurs SMS permettent de traduire des SMS vers langage naturel.
 Pas de traducteur performant jusqu’à maintenant

41
Conclusion et Perspectives
Perspectives
 Optimisation de la construction des dictionnaires
 Automatisation de la construction des dictionnaires
 Traitement de tous les règles orthographiques voire grammaticales.

42
Bibliographie
http://www.linguistik-online.de/48_11/cougnonFrancois.pdf

http://outils.diesenet.conseil-recherche-innovation.net/doc/Etude-Telephone-Mobile-Insertion.pdf
http://dumas.ccsd.cnrs.fr/docs/00/56/19/95/PDF/CHABERT_Gaelle_M2R.pdf
http://fr.wikipedia.org/wiki/Orthographes_alternatives_du_français

https://forge.info.unicaen.fr/attachments/382/Rapport_final.pdf
http://post.queensu.ca/~lessardg/Cours/215/chap2.html
http://www.linternaute.com/dictionnaire/fr/definition/abreviation/
http://www.texto.exionnaire.com/annuaire-sites-sms.php
http://www.sms4science.org/?q=fr%2Fnode%2F2
43
Merci Pour Votre
Attention

44

Traduction des SMS