SlideShare une entreprise Scribd logo
1  sur  11
Télécharger pour lire hors ligne
Le Traitement Automatique des Langues
Le Traitement Automatique des Langues
Naturelles (TALN)
Naturelles (TALN)
Emna SOUISSI
Cours destiné aux étudiants du Mastère
d’Informatique
d’Informatique
École Supérieure des Sciences et Techniques de Tunis
2011-2012
Présentation du module de TALN
Volume horaire :
21 heures de cours et 10,5 heures de TP et TD
Nombre de crédits :
3
TAL 2
2011-2012
3
Coefficient :
1,5
Modalité d’évaluation :
Contrôle continu
Présentation du module de TALN
Objectif général :
Le module a pour but de présenter les applications du
Traitement Automatique des Langues Naturelles, les
problématiques qu’elles soulèvent et les solutions les plus
répandues ou en cours de développement.
TAL 3
2011-2012
Méthodes pédagogiques :
cours magistral
petits travaux de groupes
travaux pratiques
démonstrations de logiciels
lectures obligatoires
Présentation du module de TALN
Évaluation :
Travaux pratiques (50%)
– Ils se font seuls ou en équipe de deux personnes.
– Pour les travaux réalisés en équipe, on se réserve le droit
d’évaluer séparément chaque membre d’une équipe.
– Un TP parmi plusieurs sera sélectionné pour être noté
Travail de recherche (50%) : Un dossier bibliographique
+ un exposé : une recherche portant sur un thème du cours.
– Présentation orale 25%
– Rapport écrit 25%
TAL 4
2011-2012
Présentation du module de TALN
• Le plagiat – la copie du travail autrui sans citation des sources
– est interdit et passible de sanctions.
• Le plagiat aux TP entraîne la note 0.
• Ceci s’applique tant aux textes écrits qu’aux programmes
• Ceci s’applique tant aux textes écrits qu’aux programmes
TAL 5
2011-2012
Présentation du module de TALN
QUELQUES SITES PRATIQUES :
– ATALA http://www.atala.org/
– APIL (Association des Professionnels des Industries de la Langue) :
http://www.apil.asso.fr/
– portail des technologies de la langue : http://www.technolangue.net
– axe TAL de l’équipe CLLE-ERSS : http://w3.erss.univ-
tlse2.fr/textes/operations/operation5.html
– Language Technology World : http://www.lt-world.org/
– ACL (Association for Computational Linguistics) :
http://www.aclweb.org/
– Site AAAI (assoc. for the Advancement of AI) :
http://www.aaai.org/AITopics/html/natlang.html
TAL 6
2011-2012
Plan général du module
• Introduction : Concepts de base
– Problématique, Définitions, Historique,
Niveaux de traitements
– Motivation, principales applications
– Vocabulaires : Ambiguïtés lexicales et
structurales, synonymie, polysémie,
paraphrase, ellipse...
• Analyses morphologique,
syntaxique, syntaxico-sémantique
– Gestion synchrone de dictionnaires électroniques
– Analyse interactive
• Multilinguisme :
– Appariement de mots et de phrases
– Dictionnaires multilingues
– Ontologies
• Applications :
– Documentation automatique (indexation ; l’interrogation
TAL 7
2011-2012
syntaxique, syntaxico-sémantique
– Analyse morphologique (découpage,
reconnaissance des locutions, analyse)
– Étiquetage grammatical
– Lemmatisation
– Accentuation du français et Voyellation
de l’arabe
• Confection de ressources
dictionnairiques et textuelles
– Lexiques monolingues et multilingues
– Synthèse lexicographique assistée
– Documentation automatique (indexation ; l’interrogation
en langage naturel ; l’analyse de la question, la
comparaison question document ; la reformulation ; la
réponse hiérarchisée, le multilinguisme…) ;
– Traduction automatique ;
– Résumé automatique ;
– Filtrage et extraction d’informations textuelles ;
– La bureautique intelligente (correcteurs orthographiques,
grammaires, lexiques et conjugueurs, ...);
– Détection des erreurs et correction ;
– Enseignement assisté par ordinateur.
• Évaluation, mesure de performances.
Introduire la problématique du TALN
Traduction automatique : Nous avons le choix entre trois
traducteurs :
• T1  traducteur Babel Fish de Systran utilisé par Alta-Vista :
(http://babelfish.altavista.com/tr)
(http://babelfish.altavista.com/tr)
• T2  traducteur de Google
(http://www.google.ch/language_tools?hl=fr)
• T3  traducteur Reverso de Softissimo
(http://www.reverso.net/text_translation.asp?lang=FR).
TAL 8
2011-2012
Introduire la problématique du TALN
Remplir un tableau :
Phrase LangSrc-
LangCib*
T1 T2 T3 Commentaire
je mange
des
pommes
F-E I eat
apples
je mange
des
pommes
I eat
apples
je mange
des
pommes
I eat apples je mange
des
pommes
ِ
َْ
ْ‫ا‬ ُ ِ
َ A-F Une 
‫او‬ Un  
Commencez par quelques essais personnels dans les langues
que vous souhaitez.
* A: Arabe, F: Français, E: Anglais
TAL 9
2011-2012
ِ
َْ
ْ‫ا‬ ُ ِ
َ A-F Une
récente

‫او‬
‫اة‬
Un
entretien
avec
l‘accord
 
‫اق‬
…
Introduire la problématique du TALN
Exemples de phrases à traduire :
• « Le cuisinier sale la note »
• « Il tombe/pleut des cordes »  it is raining cats and dogs
• « Sophie sent la rose », Sophie est-elle en train de respirer l’odeur de la
fleur, ou est-ce le parfum que Sophie porte qui sent la rose?
fleur, ou est-ce le parfum que Sophie porte qui sent la rose?
• « They are flying planes »
• « In such a case, you can make a very good case for wooden cases »,
c'est-à-dire : « En pareil cas, on peut produire une argumentation très
convaincante en faveur des caisses en bois »
• « ِ
‫ف‬‫ُو‬
ّ
ُ
‫ا‬ ّ
ِ ُ
‫آ‬ ِ
 َ
‫ك‬ِ
َْ
ِ
 ِ
 »
• « ّ ‫آ‬ ّ ‫أر‬ ‫أآ‬ »
TAL 10
2011-2012
Autre travail demandé
• Quelles applications du TAL connaissez-vous ?
– ...
– ...
– ...
– …
– …
– …
• De quelles applications rêvez-vous ?
– ...
– ...
– …
– …
– …
TAL 11
2011-2012

Contenu connexe

Similaire à Traitement Automatique Langade Naturel -TP1.pdf

29juin2009
29juin200929juin2009
29juin2009Dubreucq
 
XML & Java - Raphaël Tagliani - March 2008
XML & Java - Raphaël Tagliani - March 2008XML & Java - Raphaël Tagliani - March 2008
XML & Java - Raphaël Tagliani - March 2008JUG Lausanne
 
Ressources pour les élèves...
Ressources pour les élèves...Ressources pour les élèves...
Ressources pour les élèves...aalosmiranda
 
Plume Solutions Linux 2009
Plume Solutions Linux 2009Plume Solutions Linux 2009
Plume Solutions Linux 2009Alexis Monville
 
Journée PluriTAL 2012 - présentation d'Estelle Delpech
Journée PluriTAL 2012 - présentation d'Estelle DelpechJournée PluriTAL 2012 - présentation d'Estelle Delpech
Journée PluriTAL 2012 - présentation d'Estelle DelpechAFTAL
 
Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)
Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)
Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)Raphael De Robiano
 
Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing.
Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing. Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing.
Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing. Patrick Tremblay
 
LILAMA, Language Policy Network for Employability
LILAMA, Language Policy Network for EmployabilityLILAMA, Language Policy Network for Employability
LILAMA, Language Policy Network for EmployabilityAnne-Marie Barrault-Methy
 
Module Avril
Module AvrilModule Avril
Module AvrilDubreucq
 
Module Avril
Module AvrilModule Avril
Module AvrilDubreucq
 
Présentation du projet Plume / Plénière System@Tic, janvier 2010
Présentation du projet Plume / Plénière System@Tic, janvier 2010Présentation du projet Plume / Plénière System@Tic, janvier 2010
Présentation du projet Plume / Plénière System@Tic, janvier 2010Stefane Fermigier
 
Algo vol.2 sujets
Algo vol.2   sujetsAlgo vol.2   sujets
Algo vol.2 sujetschrisdilane
 
Présentation de thèse Haithem AFLI
Présentation de thèse Haithem AFLIPrésentation de thèse Haithem AFLI
Présentation de thèse Haithem AFLIHaithem Afli
 
Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?
Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?
Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?Chris DENIAUD
 
Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...
Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...
Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...Aref Jdey
 
Alphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDEAlphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDEAlphorm
 

Similaire à Traitement Automatique Langade Naturel -TP1.pdf (20)

29juin2009
29juin200929juin2009
29juin2009
 
Machine Translation
Machine TranslationMachine Translation
Machine Translation
 
XML & Java - Raphaël Tagliani - March 2008
XML & Java - Raphaël Tagliani - March 2008XML & Java - Raphaël Tagliani - March 2008
XML & Java - Raphaël Tagliani - March 2008
 
Ressources pour les élèves...
Ressources pour les élèves...Ressources pour les élèves...
Ressources pour les élèves...
 
Plume Solutions Linux 2009
Plume Solutions Linux 2009Plume Solutions Linux 2009
Plume Solutions Linux 2009
 
Journée PluriTAL 2012 - présentation d'Estelle Delpech
Journée PluriTAL 2012 - présentation d'Estelle DelpechJournée PluriTAL 2012 - présentation d'Estelle Delpech
Journée PluriTAL 2012 - présentation d'Estelle Delpech
 
Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)
Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)
Booster l'Ergonomie et Expérience Utilisateur Digitale (web & mobile)
 
Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing.
Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing. Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing.
Maîtrise / Soutien phonétique / Soutenance Patrick Tremblay, ing., M.Ing.
 
Ressources fle
Ressources fleRessources fle
Ressources fle
 
Ressources fle
Ressources fleRessources fle
Ressources fle
 
LILAMA, Language Policy Network for Employability
LILAMA, Language Policy Network for EmployabilityLILAMA, Language Policy Network for Employability
LILAMA, Language Policy Network for Employability
 
Module Avril
Module AvrilModule Avril
Module Avril
 
Module Avril
Module AvrilModule Avril
Module Avril
 
Présentation du projet Plume / Plénière System@Tic, janvier 2010
Présentation du projet Plume / Plénière System@Tic, janvier 2010Présentation du projet Plume / Plénière System@Tic, janvier 2010
Présentation du projet Plume / Plénière System@Tic, janvier 2010
 
Algo vol.2 sujets
Algo vol.2   sujetsAlgo vol.2   sujets
Algo vol.2 sujets
 
Présentation de thèse Haithem AFLI
Présentation de thèse Haithem AFLIPrésentation de thèse Haithem AFLI
Présentation de thèse Haithem AFLI
 
Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?
Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?
Agile tour de bordeaux 2013 - L’âge d’une technologique est-il une excuse ?
 
Tutoriel : "Gestion d’ontologies"
Tutoriel : "Gestion d’ontologies"Tutoriel : "Gestion d’ontologies"
Tutoriel : "Gestion d’ontologies"
 
Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...
Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...
Structures hybrides : l'apport des infrastructures libres aux moteurs de rech...
 
Alphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDEAlphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDE
 

Traitement Automatique Langade Naturel -TP1.pdf

  • 1. Le Traitement Automatique des Langues Le Traitement Automatique des Langues Naturelles (TALN) Naturelles (TALN) Emna SOUISSI Cours destiné aux étudiants du Mastère d’Informatique d’Informatique École Supérieure des Sciences et Techniques de Tunis 2011-2012
  • 2. Présentation du module de TALN Volume horaire : 21 heures de cours et 10,5 heures de TP et TD Nombre de crédits : 3 TAL 2 2011-2012 3 Coefficient : 1,5 Modalité d’évaluation : Contrôle continu
  • 3. Présentation du module de TALN Objectif général : Le module a pour but de présenter les applications du Traitement Automatique des Langues Naturelles, les problématiques qu’elles soulèvent et les solutions les plus répandues ou en cours de développement. TAL 3 2011-2012 Méthodes pédagogiques : cours magistral petits travaux de groupes travaux pratiques démonstrations de logiciels lectures obligatoires
  • 4. Présentation du module de TALN Évaluation : Travaux pratiques (50%) – Ils se font seuls ou en équipe de deux personnes. – Pour les travaux réalisés en équipe, on se réserve le droit d’évaluer séparément chaque membre d’une équipe. – Un TP parmi plusieurs sera sélectionné pour être noté Travail de recherche (50%) : Un dossier bibliographique + un exposé : une recherche portant sur un thème du cours. – Présentation orale 25% – Rapport écrit 25% TAL 4 2011-2012
  • 5. Présentation du module de TALN • Le plagiat – la copie du travail autrui sans citation des sources – est interdit et passible de sanctions. • Le plagiat aux TP entraîne la note 0. • Ceci s’applique tant aux textes écrits qu’aux programmes • Ceci s’applique tant aux textes écrits qu’aux programmes TAL 5 2011-2012
  • 6. Présentation du module de TALN QUELQUES SITES PRATIQUES : – ATALA http://www.atala.org/ – APIL (Association des Professionnels des Industries de la Langue) : http://www.apil.asso.fr/ – portail des technologies de la langue : http://www.technolangue.net – axe TAL de l’équipe CLLE-ERSS : http://w3.erss.univ- tlse2.fr/textes/operations/operation5.html – Language Technology World : http://www.lt-world.org/ – ACL (Association for Computational Linguistics) : http://www.aclweb.org/ – Site AAAI (assoc. for the Advancement of AI) : http://www.aaai.org/AITopics/html/natlang.html TAL 6 2011-2012
  • 7. Plan général du module • Introduction : Concepts de base – Problématique, Définitions, Historique, Niveaux de traitements – Motivation, principales applications – Vocabulaires : Ambiguïtés lexicales et structurales, synonymie, polysémie, paraphrase, ellipse... • Analyses morphologique, syntaxique, syntaxico-sémantique – Gestion synchrone de dictionnaires électroniques – Analyse interactive • Multilinguisme : – Appariement de mots et de phrases – Dictionnaires multilingues – Ontologies • Applications : – Documentation automatique (indexation ; l’interrogation TAL 7 2011-2012 syntaxique, syntaxico-sémantique – Analyse morphologique (découpage, reconnaissance des locutions, analyse) – Étiquetage grammatical – Lemmatisation – Accentuation du français et Voyellation de l’arabe • Confection de ressources dictionnairiques et textuelles – Lexiques monolingues et multilingues – Synthèse lexicographique assistée – Documentation automatique (indexation ; l’interrogation en langage naturel ; l’analyse de la question, la comparaison question document ; la reformulation ; la réponse hiérarchisée, le multilinguisme…) ; – Traduction automatique ; – Résumé automatique ; – Filtrage et extraction d’informations textuelles ; – La bureautique intelligente (correcteurs orthographiques, grammaires, lexiques et conjugueurs, ...); – Détection des erreurs et correction ; – Enseignement assisté par ordinateur. • Évaluation, mesure de performances.
  • 8. Introduire la problématique du TALN Traduction automatique : Nous avons le choix entre trois traducteurs : • T1 traducteur Babel Fish de Systran utilisé par Alta-Vista : (http://babelfish.altavista.com/tr) (http://babelfish.altavista.com/tr) • T2 traducteur de Google (http://www.google.ch/language_tools?hl=fr) • T3 traducteur Reverso de Softissimo (http://www.reverso.net/text_translation.asp?lang=FR). TAL 8 2011-2012
  • 9. Introduire la problématique du TALN Remplir un tableau : Phrase LangSrc- LangCib* T1 T2 T3 Commentaire je mange des pommes F-E I eat apples je mange des pommes I eat apples je mange des pommes I eat apples je mange des pommes ِ َْ ْ‫ا‬ ُ ِ َ A-F Une ‫او‬ Un Commencez par quelques essais personnels dans les langues que vous souhaitez. * A: Arabe, F: Français, E: Anglais TAL 9 2011-2012 ِ َْ ْ‫ا‬ ُ ِ َ A-F Une récente ‫او‬ ‫اة‬ Un entretien avec l‘accord ‫اق‬ …
  • 10. Introduire la problématique du TALN Exemples de phrases à traduire : • « Le cuisinier sale la note » • « Il tombe/pleut des cordes » it is raining cats and dogs • « Sophie sent la rose », Sophie est-elle en train de respirer l’odeur de la fleur, ou est-ce le parfum que Sophie porte qui sent la rose? fleur, ou est-ce le parfum que Sophie porte qui sent la rose? • « They are flying planes » • « In such a case, you can make a very good case for wooden cases », c'est-à-dire : « En pareil cas, on peut produire une argumentation très convaincante en faveur des caisses en bois » • « ِ ‫ف‬‫ُو‬ ّ ُ ‫ا‬ ّ ِ ُ ‫آ‬ ِ َ ‫ك‬ِ َْ ِ ِ » • « ّ ‫آ‬ ّ ‫أر‬ ‫أآ‬ » TAL 10 2011-2012
  • 11. Autre travail demandé • Quelles applications du TAL connaissez-vous ? – ... – ... – ... – … – … – … • De quelles applications rêvez-vous ? – ... – ... – … – … – … TAL 11 2011-2012