Alphorm.com Formation Data science avec R - Prise en main des IDE
Traitement Automatique Langade Naturel -TP1.pdf
1. Le Traitement Automatique des Langues
Le Traitement Automatique des Langues
Naturelles (TALN)
Naturelles (TALN)
Emna SOUISSI
Cours destiné aux étudiants du Mastère
d’Informatique
d’Informatique
École Supérieure des Sciences et Techniques de Tunis
2011-2012
2. Présentation du module de TALN
Volume horaire :
21 heures de cours et 10,5 heures de TP et TD
Nombre de crédits :
3
TAL 2
2011-2012
3
Coefficient :
1,5
Modalité d’évaluation :
Contrôle continu
3. Présentation du module de TALN
Objectif général :
Le module a pour but de présenter les applications du
Traitement Automatique des Langues Naturelles, les
problématiques qu’elles soulèvent et les solutions les plus
répandues ou en cours de développement.
TAL 3
2011-2012
Méthodes pédagogiques :
cours magistral
petits travaux de groupes
travaux pratiques
démonstrations de logiciels
lectures obligatoires
4. Présentation du module de TALN
Évaluation :
Travaux pratiques (50%)
– Ils se font seuls ou en équipe de deux personnes.
– Pour les travaux réalisés en équipe, on se réserve le droit
d’évaluer séparément chaque membre d’une équipe.
– Un TP parmi plusieurs sera sélectionné pour être noté
Travail de recherche (50%) : Un dossier bibliographique
+ un exposé : une recherche portant sur un thème du cours.
– Présentation orale 25%
– Rapport écrit 25%
TAL 4
2011-2012
5. Présentation du module de TALN
• Le plagiat – la copie du travail autrui sans citation des sources
– est interdit et passible de sanctions.
• Le plagiat aux TP entraîne la note 0.
• Ceci s’applique tant aux textes écrits qu’aux programmes
• Ceci s’applique tant aux textes écrits qu’aux programmes
TAL 5
2011-2012
6. Présentation du module de TALN
QUELQUES SITES PRATIQUES :
– ATALA http://www.atala.org/
– APIL (Association des Professionnels des Industries de la Langue) :
http://www.apil.asso.fr/
– portail des technologies de la langue : http://www.technolangue.net
– axe TAL de l’équipe CLLE-ERSS : http://w3.erss.univ-
tlse2.fr/textes/operations/operation5.html
– Language Technology World : http://www.lt-world.org/
– ACL (Association for Computational Linguistics) :
http://www.aclweb.org/
– Site AAAI (assoc. for the Advancement of AI) :
http://www.aaai.org/AITopics/html/natlang.html
TAL 6
2011-2012
7. Plan général du module
• Introduction : Concepts de base
– Problématique, Définitions, Historique,
Niveaux de traitements
– Motivation, principales applications
– Vocabulaires : Ambiguïtés lexicales et
structurales, synonymie, polysémie,
paraphrase, ellipse...
• Analyses morphologique,
syntaxique, syntaxico-sémantique
– Gestion synchrone de dictionnaires électroniques
– Analyse interactive
• Multilinguisme :
– Appariement de mots et de phrases
– Dictionnaires multilingues
– Ontologies
• Applications :
– Documentation automatique (indexation ; l’interrogation
TAL 7
2011-2012
syntaxique, syntaxico-sémantique
– Analyse morphologique (découpage,
reconnaissance des locutions, analyse)
– Étiquetage grammatical
– Lemmatisation
– Accentuation du français et Voyellation
de l’arabe
• Confection de ressources
dictionnairiques et textuelles
– Lexiques monolingues et multilingues
– Synthèse lexicographique assistée
– Documentation automatique (indexation ; l’interrogation
en langage naturel ; l’analyse de la question, la
comparaison question document ; la reformulation ; la
réponse hiérarchisée, le multilinguisme…) ;
– Traduction automatique ;
– Résumé automatique ;
– Filtrage et extraction d’informations textuelles ;
– La bureautique intelligente (correcteurs orthographiques,
grammaires, lexiques et conjugueurs, ...);
– Détection des erreurs et correction ;
– Enseignement assisté par ordinateur.
• Évaluation, mesure de performances.
8. Introduire la problématique du TALN
Traduction automatique : Nous avons le choix entre trois
traducteurs :
• T1 traducteur Babel Fish de Systran utilisé par Alta-Vista :
(http://babelfish.altavista.com/tr)
(http://babelfish.altavista.com/tr)
• T2 traducteur de Google
(http://www.google.ch/language_tools?hl=fr)
• T3 traducteur Reverso de Softissimo
(http://www.reverso.net/text_translation.asp?lang=FR).
TAL 8
2011-2012
9. Introduire la problématique du TALN
Remplir un tableau :
Phrase LangSrc-
LangCib*
T1 T2 T3 Commentaire
je mange
des
pommes
F-E I eat
apples
je mange
des
pommes
I eat
apples
je mange
des
pommes
I eat apples je mange
des
pommes
ِ
َْ
ْا ُ ِ
َ A-F Une
او Un
Commencez par quelques essais personnels dans les langues
que vous souhaitez.
* A: Arabe, F: Français, E: Anglais
TAL 9
2011-2012
ِ
َْ
ْا ُ ِ
َ A-F Une
récente
او
اة
Un
entretien
avec
l‘accord
اق
…
10. Introduire la problématique du TALN
Exemples de phrases à traduire :
• « Le cuisinier sale la note »
• « Il tombe/pleut des cordes » it is raining cats and dogs
• « Sophie sent la rose », Sophie est-elle en train de respirer l’odeur de la
fleur, ou est-ce le parfum que Sophie porte qui sent la rose?
fleur, ou est-ce le parfum que Sophie porte qui sent la rose?
• « They are flying planes »
• « In such a case, you can make a very good case for wooden cases »,
c'est-à-dire : « En pareil cas, on peut produire une argumentation très
convaincante en faveur des caisses en bois »
• « ِ
فُو
ّ
ُ
ا ّ
ِ ُ
آ ِ
َ
كِ
َْ
ِ
ِ
»
• « ّ آ ّ أر أآ »
TAL 10
2011-2012
11. Autre travail demandé
• Quelles applications du TAL connaissez-vous ?
– ...
– ...
– ...
– …
– …
– …
• De quelles applications rêvez-vous ?
– ...
– ...
– …
– …
– …
TAL 11
2011-2012