SlideShare une entreprise Scribd logo
1  sur  23
Télécharger pour lire hors ligne
Les défis des langues 
au traitement automatique 
du langage (TAL) 
Jorge Baptista 
U. Algarve - FCHS/CECL et INESC-ID Lisboa/L2T 
jbaptis@ualg.pt 
Université Nationale de Taurida, Departement de Philologie Romane et Classique, 16-septembre-2014 
BMU-MID Eramus+ Programme 
Terça-feira, 16 de Setembro de 14 1
resumé 
Dans cette présentation, nous introduisons des concepts-clés du 
domaine du traitement automatique de langues (TAL): 
• qu'est-ce qu'un texte pour une machine? 
• comment identifier des unités linguistiques à plusieurs niveaux? 
• la segmentation et l'analyse lexicale; 
• la désambiguation automatique; 
• comment relier les mots entre elles? 
• les structures syntaxiques minimales (chunks) et les relations 
syntaxique d'haute niveau (SUJET, OBJECT DIRECT, etc.); 
• des relations ou rôles sémantiques entre les constituants de la 
phrase; 
• l'unité sémantique à travers des catégories morphosyntaxiques 
et sa représentation dans les lexiques électroniques. 
Terça-feira, 16 de Setembro de 14 2
“comprendre”? 
Turing machines 
Terça-feira, 16 de Setembro de 14 3
Turing test 
Terça-feira, 16 de Setembro de 14 4
Terça-feira, 16 de Setembro de 14 5
qu'est-ce qu'un texte pour une machine? 
• un texte n’est qu’une suite de 
caractères entre en début et 
un fin de fichier 
• il faut le diviser (=analiser) en 
morceaux pour qu’on puisse 
faire en sorte que l’ordinateur 
le “comprends” son contenu 
Terça-feira, 16 de Setembro de 14 6
segmentation de textes 
Terça-feira, 16 de Setembro de 14 7
segmentation de textes 
Au commencement, Dieu créa les cieux et la terre. 
/à_le/ 
et il sépara les eaux qui sont au-dessous de 
l'étendue d'avec les eaux qui sont au-dessus de 
l'étendue. 
au/-/dessous/ /de 
Terça-feira, 16 de Setembro de 14 8
segmentation de textes 
Terça-feira, 16 de Setembro de 14 9
Terça-feira, 16 de Setembro de 14 10
comment relier les mots entre elles? 
Au commencement, Dieu créa les cieux et la terre. 
Au commencement , Dieu créa 
les cieux et la terre . 
Terça-feira, 16 de Setembro de 14 11
les structures syntaxiques minimales (chunks) 
Au commencement , Dieu créa 
adv pnc n v 
les cieux et la terre . 
det n det n pnc 
Terça-feira, 16 de Setembro de 14 12
Au commencement , Dieu créa 
adv pnc n v 
les cieux et la terre . 
det n cnj 
det n pnc 
det det 
coord-g coord-d 
sujet 
TOP 
cod 
cod 
mod-P 
Terça-feira, 16 de Setembro de 14 13
les relation (rôles) semantiques 
Au commencement , 
adv 
agent obj 
Dieu créa les cieux et la terre . 
n 
pnc 
v det n det n pnc 
m-tmps 
Terça-feira, 16 de Setembro de 14 14
l'unité sémantique à travers des catégories morphosyntaxiques 
voler 
Luc a volé un stylo 
vol 
Luc a commis un vol 
voler 
L’avion vole 
<sur l’Atlantique> 
vol 
L’avion fait un vol 
<sur l’Atlantique 
Terça-feira, 16 de Setembro de 14 15
l'unité sémantique à travers des catégories morphosyntaxiques 
voler 
32C 36DT 
Luc a volé un stylo 
vol 
F2 F1L 
Luc a commis un vol 
voler 
L’avion vole 
<sur l’Atlantique> 
vol 
L’avion fait un vol 
<sur l’Atlantique 
voleur 
Luc est un voleur 
Nprf1 volante 
Anh0 
une machine volante 
Terça-feira, 16 de Setembro de 14 16
Terça-feira, 16 de Setembro de 14 17
jbaptis[5:09] 
echo 
"Missão 
Roseta 
vai 
aterrar 
na 
cabeça 
do 
cometa 
67P/Churyumov-­‐Gerasimenko." 
| 
xip/string.sh 
-­‐t 
-­‐tr 
-­‐f 
-­‐indent 
-­‐tl 
90 
TOP 
+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐ 
| 
| 
| 
| 
| 
| 
NP 
NP 
VTEMP 
VINF 
PP 
PP 
+ 
+ 
+ 
+ 
+-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐+ 
+-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐+ 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
NOUN 
NOUN 
VERB 
VERB 
PREP 
ART 
NOUN 
PREP 
ART 
NOUN 
+ 
+ 
+ 
+-­‐ 
+ 
+-­‐ 
+ 
+ 
+ 
+ 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
Missão 
Roseta 
vai 
aterrar 
em 
a 
cabeça 
de 
o 
cometa 
-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+ 
| 
| 
| 
| 
NP 
PUNCT 
NP 
PUNCT 
+-­‐-­‐-­‐-­‐-­‐+ 
+ 
+ 
+-­‐ 
| 
| 
| 
| 
| 
NUM 
NOUN 
/ 
NOUN 
. 
+ 
+-­‐ 
+-­‐ 
| 
| 
| 
67 
P 
Churyumov-­‐Gerasimenko 
MAIN(aterrar) 
QUANTD(P,67) 
DETD(cabeça,a) 
DETD(cometa,o) 
VDOMAIN(vai,aterrar) 
MOD_POST(cabeça,cometa) 
MOD_POST(aterrar,cabeça) 
SUBJ_PRE(aterrar,Roseta) 
CDIR_POST(aterrar,P) 
NE_QUANT_NUM(67 
P) 
EVENT_OTHER(aterrar) 
https://string.l2f.inesc-id.pt/demo 
Terça-feira, 16 de Setembro de 14 18
un autre 
formalisme ... 
http://beta.visl.sdu.dk/ 
Terça-feira, 16 de Setembro de 14 19
un autre 
formalisme ... 
http://lxcenter.di.fc.ul.pt/services/en/LXServicesParserDep.html 
Terça-feira, 16 de Setembro de 14 20
Applications 
Terça-feira, 16 de Setembro de 14 21
bionote 
Jorge Baptista est “Professor Associado” à l'Université de l'Algarve, à Faro, Portugal, où il est 
enseignant de Linguistique (Syntaxe, Phonologie, Morphologie et Histoire du Portugais) et 
Linguistique-Informatique, depuis 1992. Il fait aussi partie du Laboratoire du Language (L2F) du 
centre de recherche INESC-ID Lisboa, dès 2005. 
Il s'est dédié à la construction de resources linguistiques, notamment des dictionaire et des 
grammaires électroniques pour le TAL, depuis 1990. En Linguistique même, ses travaux couvrent 
plusieurs aspects du lexique et la grammaire du Portugais: les constructions à verb-suport, le 
figement, la determination et la syntaxe de l'adverbe. Du coté TAL, il a développé des dictionnaires 
de mots composés et des dictionnaires syntaxiques (ou lexiques-grammaires) de noms prédicatifs, 
de verbs distributionnels, d'adverbes (simples et composés) et de phrases verbales figées (ou 
expressions idiomatiques), qui comptent dans son ensemble, plusieurs milliers d’expressions/mots. 
Au Laboratoire de Language, il coordonne les aspects linguistique pour le développement d'un 
système hybride (statistique et avec règles) de traitement automatique du Portugais, appellé 
STRING(**). Ce système est pourvue de toutes les fonctionnalités essentielles d'un system de TAL 
(segmentation, analyse lexicale et levée d'ambiguïté (hybride) automatiques, analyse syntaxique de 
surface (chunking) et profonde (deep parsing). Les plus récents développements sont la 
reconnaissance des entités nommées (NER), l'identification des événements, leurs participants et 
circumstances (rôles sémantiques), l'ordination relative des événements 
D'autre part, il est aussi engagé dans la construction d'un système tutoriel d'apprentissage du 
Portugais Langue Etrangère - REAP.PT (***), ciblé sur le lexique, mais aussi avec des enjeux dans la 
grammaire. Il s'agit des exercices générés et corrigés automatiquement, à partir de textes réels, 
sélectionnés en fonction du niveau de competence langagière de l’étudiant. 
(*) 
Furhter details at : https://www.researchgate.net/profile/Jorge_Baptista 
(**) 
string.l2f.inesc-id.pt/ 
(***) 
www.l2f.inesc-id.pt/wiki/index.php/REAP.PT_(Computer_Aided_Language_Learning_-_Reading_Practice) 
Terça-feira, 16 de Setembro de 14 22
Спасибо ! 
Terça-feira, 16 de Setembro de 14 23

Contenu connexe

En vedette

Arquitectura del pc
Arquitectura del pcArquitectura del pc
Arquitectura del pc
caancaho
 
Etude explosion demogaphique sanglier elo 02 07 2012 final 2
Etude explosion demogaphique sanglier elo 02 07 2012 final 2Etude explosion demogaphique sanglier elo 02 07 2012 final 2
Etude explosion demogaphique sanglier elo 02 07 2012 final 2
elyaneforet
 
Vêtements géant H & M Défend ‘Perfect’ Modèles virtuels
Vêtements géant H & M Défend ‘Perfect’ Modèles virtuelsVêtements géant H & M Défend ‘Perfect’ Modèles virtuels
Vêtements géant H & M Défend ‘Perfect’ Modèles virtuels
angelcaicai
 
Mjcpt4
Mjcpt4Mjcpt4
Mjcpt4
majucp
 
Vientos y tempestades de la vida
Vientos y tempestades de la vidaVientos y tempestades de la vida
Vientos y tempestades de la vida
LUZ M.
 
Seguridad en internet{milton
Seguridad en internet{miltonSeguridad en internet{milton
Seguridad en internet{milton
Milton Cantero
 
Cascadas de amor
Cascadas de amor Cascadas de amor
Cascadas de amor
LUZ M.
 

En vedette (19)

Analyse de sentiment - Charte des valeurs québécoises
Analyse de sentiment - Charte des valeurs québécoisesAnalyse de sentiment - Charte des valeurs québécoises
Analyse de sentiment - Charte des valeurs québécoises
 
03 Apprentissage statistique
03 Apprentissage statistique03 Apprentissage statistique
03 Apprentissage statistique
 
05 Sélection de modèle linéaire
05 Sélection de modèle linéaire05 Sélection de modèle linéaire
05 Sélection de modèle linéaire
 
CURSO PARA ASISTENTES DE ALTA DIRECCION
CURSO PARA ASISTENTES DE ALTA DIRECCIONCURSO PARA ASISTENTES DE ALTA DIRECCION
CURSO PARA ASISTENTES DE ALTA DIRECCION
 
( #Femme #vin…) & (#Women #Wine…) : deux sphères culturelles 2.0 de la fémin...
( #Femme #vin…) & (#Women #Wine…) : deux sphères culturelles 2.0 de la fémin...( #Femme #vin…) & (#Women #Wine…) : deux sphères culturelles 2.0 de la fémin...
( #Femme #vin…) & (#Women #Wine…) : deux sphères culturelles 2.0 de la fémin...
 
Fortunata y jacinta
Fortunata y jacintaFortunata y jacinta
Fortunata y jacinta
 
Mi mejor pc tic2 2011 word
Mi  mejor pc tic2 2011 wordMi  mejor pc tic2 2011 word
Mi mejor pc tic2 2011 word
 
Grupo alfa 3
Grupo alfa 3Grupo alfa 3
Grupo alfa 3
 
Arquitectura del pc
Arquitectura del pcArquitectura del pc
Arquitectura del pc
 
Dalmau. tabaco, encuentro expertos
Dalmau. tabaco, encuentro expertosDalmau. tabaco, encuentro expertos
Dalmau. tabaco, encuentro expertos
 
Etude explosion demogaphique sanglier elo 02 07 2012 final 2
Etude explosion demogaphique sanglier elo 02 07 2012 final 2Etude explosion demogaphique sanglier elo 02 07 2012 final 2
Etude explosion demogaphique sanglier elo 02 07 2012 final 2
 
Vêtements géant H & M Défend ‘Perfect’ Modèles virtuels
Vêtements géant H & M Défend ‘Perfect’ Modèles virtuelsVêtements géant H & M Défend ‘Perfect’ Modèles virtuels
Vêtements géant H & M Défend ‘Perfect’ Modèles virtuels
 
Los gañanes
Los gañanesLos gañanes
Los gañanes
 
Preikestolen pulpito de_piedra
Preikestolen pulpito de_piedraPreikestolen pulpito de_piedra
Preikestolen pulpito de_piedra
 
Mjcpt4
Mjcpt4Mjcpt4
Mjcpt4
 
Vientos y tempestades de la vida
Vientos y tempestades de la vidaVientos y tempestades de la vida
Vientos y tempestades de la vida
 
Seguridad en internet{milton
Seguridad en internet{miltonSeguridad en internet{milton
Seguridad en internet{milton
 
Cascadas de amor
Cascadas de amor Cascadas de amor
Cascadas de amor
 
Dulce
DulceDulce
Dulce
 

Dernier

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 

Dernier (20)

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénients
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfSTRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 

Les défis des_langue-pour_le_tal

  • 1. Les défis des langues au traitement automatique du langage (TAL) Jorge Baptista U. Algarve - FCHS/CECL et INESC-ID Lisboa/L2T jbaptis@ualg.pt Université Nationale de Taurida, Departement de Philologie Romane et Classique, 16-septembre-2014 BMU-MID Eramus+ Programme Terça-feira, 16 de Setembro de 14 1
  • 2. resumé Dans cette présentation, nous introduisons des concepts-clés du domaine du traitement automatique de langues (TAL): • qu'est-ce qu'un texte pour une machine? • comment identifier des unités linguistiques à plusieurs niveaux? • la segmentation et l'analyse lexicale; • la désambiguation automatique; • comment relier les mots entre elles? • les structures syntaxiques minimales (chunks) et les relations syntaxique d'haute niveau (SUJET, OBJECT DIRECT, etc.); • des relations ou rôles sémantiques entre les constituants de la phrase; • l'unité sémantique à travers des catégories morphosyntaxiques et sa représentation dans les lexiques électroniques. Terça-feira, 16 de Setembro de 14 2
  • 3. “comprendre”? Turing machines Terça-feira, 16 de Setembro de 14 3
  • 4. Turing test Terça-feira, 16 de Setembro de 14 4
  • 5. Terça-feira, 16 de Setembro de 14 5
  • 6. qu'est-ce qu'un texte pour une machine? • un texte n’est qu’une suite de caractères entre en début et un fin de fichier • il faut le diviser (=analiser) en morceaux pour qu’on puisse faire en sorte que l’ordinateur le “comprends” son contenu Terça-feira, 16 de Setembro de 14 6
  • 7. segmentation de textes Terça-feira, 16 de Setembro de 14 7
  • 8. segmentation de textes Au commencement, Dieu créa les cieux et la terre. /à_le/ et il sépara les eaux qui sont au-dessous de l'étendue d'avec les eaux qui sont au-dessus de l'étendue. au/-/dessous/ /de Terça-feira, 16 de Setembro de 14 8
  • 9. segmentation de textes Terça-feira, 16 de Setembro de 14 9
  • 10. Terça-feira, 16 de Setembro de 14 10
  • 11. comment relier les mots entre elles? Au commencement, Dieu créa les cieux et la terre. Au commencement , Dieu créa les cieux et la terre . Terça-feira, 16 de Setembro de 14 11
  • 12. les structures syntaxiques minimales (chunks) Au commencement , Dieu créa adv pnc n v les cieux et la terre . det n det n pnc Terça-feira, 16 de Setembro de 14 12
  • 13. Au commencement , Dieu créa adv pnc n v les cieux et la terre . det n cnj det n pnc det det coord-g coord-d sujet TOP cod cod mod-P Terça-feira, 16 de Setembro de 14 13
  • 14. les relation (rôles) semantiques Au commencement , adv agent obj Dieu créa les cieux et la terre . n pnc v det n det n pnc m-tmps Terça-feira, 16 de Setembro de 14 14
  • 15. l'unité sémantique à travers des catégories morphosyntaxiques voler Luc a volé un stylo vol Luc a commis un vol voler L’avion vole <sur l’Atlantique> vol L’avion fait un vol <sur l’Atlantique Terça-feira, 16 de Setembro de 14 15
  • 16. l'unité sémantique à travers des catégories morphosyntaxiques voler 32C 36DT Luc a volé un stylo vol F2 F1L Luc a commis un vol voler L’avion vole <sur l’Atlantique> vol L’avion fait un vol <sur l’Atlantique voleur Luc est un voleur Nprf1 volante Anh0 une machine volante Terça-feira, 16 de Setembro de 14 16
  • 17. Terça-feira, 16 de Setembro de 14 17
  • 18. jbaptis[5:09] echo "Missão Roseta vai aterrar na cabeça do cometa 67P/Churyumov-­‐Gerasimenko." | xip/string.sh -­‐t -­‐tr -­‐f -­‐indent -­‐tl 90 TOP +-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐ | | | | | | NP NP VTEMP VINF PP PP + + + + +-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐+ +-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐+ | | | | | | | | | | NOUN NOUN VERB VERB PREP ART NOUN PREP ART NOUN + + + +-­‐ + +-­‐ + + + + | | | | | | | | | | Missão Roseta vai aterrar em a cabeça de o cometa -­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐+ | | | | NP PUNCT NP PUNCT +-­‐-­‐-­‐-­‐-­‐+ + + +-­‐ | | | | | NUM NOUN / NOUN . + +-­‐ +-­‐ | | | 67 P Churyumov-­‐Gerasimenko MAIN(aterrar) QUANTD(P,67) DETD(cabeça,a) DETD(cometa,o) VDOMAIN(vai,aterrar) MOD_POST(cabeça,cometa) MOD_POST(aterrar,cabeça) SUBJ_PRE(aterrar,Roseta) CDIR_POST(aterrar,P) NE_QUANT_NUM(67 P) EVENT_OTHER(aterrar) https://string.l2f.inesc-id.pt/demo Terça-feira, 16 de Setembro de 14 18
  • 19. un autre formalisme ... http://beta.visl.sdu.dk/ Terça-feira, 16 de Setembro de 14 19
  • 20. un autre formalisme ... http://lxcenter.di.fc.ul.pt/services/en/LXServicesParserDep.html Terça-feira, 16 de Setembro de 14 20
  • 21. Applications Terça-feira, 16 de Setembro de 14 21
  • 22. bionote Jorge Baptista est “Professor Associado” à l'Université de l'Algarve, à Faro, Portugal, où il est enseignant de Linguistique (Syntaxe, Phonologie, Morphologie et Histoire du Portugais) et Linguistique-Informatique, depuis 1992. Il fait aussi partie du Laboratoire du Language (L2F) du centre de recherche INESC-ID Lisboa, dès 2005. Il s'est dédié à la construction de resources linguistiques, notamment des dictionaire et des grammaires électroniques pour le TAL, depuis 1990. En Linguistique même, ses travaux couvrent plusieurs aspects du lexique et la grammaire du Portugais: les constructions à verb-suport, le figement, la determination et la syntaxe de l'adverbe. Du coté TAL, il a développé des dictionnaires de mots composés et des dictionnaires syntaxiques (ou lexiques-grammaires) de noms prédicatifs, de verbs distributionnels, d'adverbes (simples et composés) et de phrases verbales figées (ou expressions idiomatiques), qui comptent dans son ensemble, plusieurs milliers d’expressions/mots. Au Laboratoire de Language, il coordonne les aspects linguistique pour le développement d'un système hybride (statistique et avec règles) de traitement automatique du Portugais, appellé STRING(**). Ce système est pourvue de toutes les fonctionnalités essentielles d'un system de TAL (segmentation, analyse lexicale et levée d'ambiguïté (hybride) automatiques, analyse syntaxique de surface (chunking) et profonde (deep parsing). Les plus récents développements sont la reconnaissance des entités nommées (NER), l'identification des événements, leurs participants et circumstances (rôles sémantiques), l'ordination relative des événements D'autre part, il est aussi engagé dans la construction d'un système tutoriel d'apprentissage du Portugais Langue Etrangère - REAP.PT (***), ciblé sur le lexique, mais aussi avec des enjeux dans la grammaire. Il s'agit des exercices générés et corrigés automatiquement, à partir de textes réels, sélectionnés en fonction du niveau de competence langagière de l’étudiant. (*) Furhter details at : https://www.researchgate.net/profile/Jorge_Baptista (**) string.l2f.inesc-id.pt/ (***) www.l2f.inesc-id.pt/wiki/index.php/REAP.PT_(Computer_Aided_Language_Learning_-_Reading_Practice) Terça-feira, 16 de Setembro de 14 22
  • 23. Спасибо ! Terça-feira, 16 de Setembro de 14 23