SlideShare une entreprise Scribd logo
1  sur  33
Télécharger pour lire hors ligne
Évaluation applicative des
terminologies destinées
à la traduction spécialisée
Estelle Delpech
Atelier EvalECD
25/01/2011

1
Plan
1. Contexte, problématiques
2. Protocole d'évaluation
3. Expérimentation et résultats
4. Conclusions

2
Plan
1. Contexte, problématiques
2. Protocole d'évaluation
3. Expérimentation et résultats
4. Conclusions

3
Contexte
• Lingua et Machina
– commercialise des outils de TAO :
• mémoires de traduction
• extraction terminologique bilingue
• gestion de terminologie

• Metricc
– exploitation des corpus comparables pour :
• outils de TAO
• RI interlingue
4
Problématique
• Comment évaluer ces lexiques bilingues
issus de corpus comparables ?
• Souhaits :
– ne pas se contenter d'une évaluation par
rapport à une référence
– mesurer le véritable apport en contexte
d'utilisation

5
Contextes d'utilisation comparés

6
Questions soulevées
• Comment évaluer la qualité d'une
traduction ?
• Faut-il évaluer la qualité de la traduction
dans son entier ou uniquement la
traduction des termes techniques ?
• Comment évaluer une traduction
technique sans expert ?
7
Comment évaluer la qualité de la
traduction ?
• Mesures objectives TA
– avantage de la reproductibilité faible

• Grilles d'évaluation Traductologie
– trop complexes, peu documentées

• Évaluation subjective style TA
– jugement de qualité sur 3 catégories
– classement

8
Évaluer toute la traduction ?
• Qualité d'une traduction = interaction
complexe de nombreux paramètres
• Proposition :
– isoler les éléments sur lesquels les lexiques
sont censés aider
– n'évaluer que la traduction de ces éléments

9
Comment pallier l'absence
d'expert ?
• Pas d'expert du domaine qui puisse valider
les traductions
• Emploi d'une référence
– les textes à traduire doivent avoir une traduction
existante
• résumés d'articles scientiques
• textes de sites web bilingues (vulgarisation)

10
Plan
1. Contexte, problématiques
2. Protocole d'évaluation
3. Expérimentation et résultats
4. Conclusions

11
Protocole (1)

12
Protocole (2)
cancer du sein

sciences de l'eau

non-traducteur

non-traducteur

SITUATION 1
ress. gén. + lexique CC

traducteur 1

traducteur 2

SITUATION 2
ress. gén. + Web

traducteur 2

traducteur 1

BASE LINE
ress. gén.

13
Protocole (3)
• Le traducteur traduit un texte spécialisé à
l'aide d'une ressource donnée
• Une fois le texte traduit :
– indique les termes ou expressions pour
lesquels il a eu besoin d'une ressource
– indique la traduction retenue
– indique les ressources utilisées

14
Protocole (4)
• Traduction anonymisées, mélangées
• Jugement qualité
– exact : terme ou expression consacrée
– acceptable : sens maintenu

• Classement
– de la meilleure à la moins bonne
– égalités possibles
15
Plan
1. Contexte, problématiques
2. Protocole d'évaluation
3. Expérimentation et résultats
4. Conclusions

16
Données
cancer du sein

sciences de l'eau

Corpus acquisition

~400k par langue
portail Elsevier

~2 M par langue
revues Siences de l'eau,
Water Science and
Technology

textes scientifiques

3 résumés d'articles
508 mots
portal Elsevier

3 résumés d'articles
499 mots
revue Sciences de l'eau

textes vulgarisation

1 page web
613 mots
site Société canadienne
du cancer

1 page web
425 mots
site Lenntech
17
Expérimentation de la méthodologie
• Impressions des traducteurs
En gros, 75% des mots techniques ne figurent pas dans le
glossaire Metricc, et sur les 25% restants, 99% ont entre 10 et
20 traductions candidates, mais aucune de validée. Du coup,
dans le meilleur des cas on est "à peu près sûr", mais jamais
totalement. Et dans le pire des cas (très fréquemment,
malheureusement) on y va "à l'instinct"

• traducteurs pas préparés
• problème d'adéquation du lexique
18
Adéquation du lexique aux textes à
traduire
• Estimation avec ratio :
mots lexique∪mots textes à traduire
mots textes à traduire
cancer du sein
400k mots

sciences de l'eau
2M mots

Langue source – EN

0,94

0,14

Langue cible – FR

0,67

0,78

• mieux vaut une thématique précise qu'un
gros corpus
19
Accord inter-annotateur
• Mesure de l'accord

P  A−P  E 
Kappa=
1− P  E 

P(A) : accord observé
P(E) : accord dû au hasard

20
Accord inter-annotateur
• Mode d'évaluation
– classement : 0, 65
– jugement : 0,36

• Type de textes
– vulgarisés : 0,57
– scientifques 0,48

21
Jugement de qualité
• Cancer du sein
– proportion de
traductions fausses
équivalente
– traductions sont
jugées plus exactes
avec le Web, puis
avec Corpus Comp.

Cancer Du Sein
K = 0,25
100%
90%

20%

19%

18%

42%

38%

35%

38%

43%

47%

80%
70%
60%
50%
40%
30%
20%
10%
0%

ress. gén

ress. gén. + TBCC
ress. gén. + Web

22
Jugement de qualité
• Sciences de l'eau
– traductions
nettement mieux
jugées pour le Web
– Corpus Comp.
produit des
traductions de moins
bonne qualité

Sciences de l'eau
K = 0,42

100%

18%

21%

23%

23%

90%
80%

7%

70%

16%

60%
50%
40%

77%
59%

30%

56%

20%
10%
0%
ress. gén

ress. gén. + TBCC

23

ress. gén. + Web
Problème dans l'utilisation des
ressources
• les traductions de la
situation 1 moins
bonnes que celles de
la situation 0
• Or disposent du
même socle de
ressources générales

lexique
Metricc
ressources
générales

ressources
générales

Situation 0

Situation 1

24
Problème dans l'utilisation des
ressources
• Les traducteurs des situations 1 et 2 ont
très peu utilisé les ressources générales
S0
Ress. Générale
Ress. Spécialisée
Intuition

S1

S2

43%

14%

3%

-

25%

56%

79%

77%

44%

25
Classement des traductions
Cancer du sein
K=0,69

42%

47%

45

32%

40
35
30

28%

26%

26%

25
20
15
10
5
0

TBCC vs. ress. gén.

TBCC vs. Web.

26
Classement des traductions
Sciences de l'eau
K=0,63

49%
90

41% 43%

80

33%

70
60
50
40

18%

16%

30
20
10
0

TBCC vs. ress. gén.

TBCC vs. Web

27
Plan
1. Contexte, problématiques
2. Protocole d'évaluation
3. Expérimentation et résultats
4. Conclusions

28
Conclusion sur la méthodologie
• dépendance entre :
– apport du lexique bilingue
– adéquation lexique/textes à traduire

• toute mesure de l'apport doit aussi indiquer
l'adéquation entre lexique et textes à traduire
• comment mesurer cette adéquation ? faut-il
une adéquation minimale ?

29
Conclusion sur la méthodologie
• Problèmes dans l'utilisation des
ressources
– mieux préparer les traducteurs
– revoir les situations de traductions :
lexique
Metricc

Situation 0

Web

Situation 1

Situation 2

30
Conclusion sur la méthodologie
• Faire une traduction « de chauffe » ?
• Idéalement, obtenir plus de données :
– plus de textes à traduire
– plus de domaines
– plus de traducteurs

• Juges distincts des traducteurs !

31
Conclusion sur les lexiques
• Utiles si construits à partir d'un corpus à
thématique « fine »
• Web plus vaste, contiendra toujours plus
de solutions de traductions
• L'idéal :
– associer le lexique à des routines qui
traduisent à la volée et/ou vont chercher les
traductions sur le Web
32
Remerciements
Ce travail a été financé par :
– ANR, subvention n° ANR-08-CORD-009
– Lingua et Machina, www.lingua-et-machina.com

Annotateurs :
– Clémence De Baudus
– Mathieu Delage
33

Contenu connexe

En vedette

Publicate baja california
Publicate baja californiaPublicate baja california
Publicate baja californiagarden92
 
Tecnologia
TecnologiaTecnologia
Tecnologialudiviko
 
Projecte grupinformal
Projecte grupinformalProjecte grupinformal
Projecte grupinformalemarinetuoc
 
Ciencia, tecnologia y educacion para no expertos
Ciencia, tecnologia y educacion para no expertosCiencia, tecnologia y educacion para no expertos
Ciencia, tecnologia y educacion para no expertosCamilo Cardenas
 
Presentacion nitcs ludi
Presentacion nitcs ludiPresentacion nitcs ludi
Presentacion nitcs ludiludiviko
 
Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009
Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009
Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009JUG Lausanne
 
Dupligenerale juillet2013 hp
Dupligenerale juillet2013 hpDupligenerale juillet2013 hp
Dupligenerale juillet2013 hpgeorges75
 
Contexto misiones de centro de investigación histórica guillermo furlong
Contexto misiones de   centro de investigación histórica guillermo furlongContexto misiones de   centro de investigación histórica guillermo furlong
Contexto misiones de centro de investigación histórica guillermo furlongsusanabartz
 
Maidelys Alvares (Literatura-Griega)
Maidelys Alvares (Literatura-Griega)Maidelys Alvares (Literatura-Griega)
Maidelys Alvares (Literatura-Griega)Ken Poet
 
Producción yerbatera
Producción yerbateraProducción yerbatera
Producción yerbaterasusanabartz
 

En vedette (19)

Publicate baja california
Publicate baja californiaPublicate baja california
Publicate baja california
 
Cars 3
Cars 3Cars 3
Cars 3
 
Du/Des/Dela
Du/Des/DelaDu/Des/Dela
Du/Des/Dela
 
Plaquette Comarch ERP
Plaquette Comarch ERPPlaquette Comarch ERP
Plaquette Comarch ERP
 
Las TIC en el aula
Las TIC en el aulaLas TIC en el aula
Las TIC en el aula
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
Colegio sudamericano
Colegio sudamericanoColegio sudamericano
Colegio sudamericano
 
Colegio san francisco
Colegio san franciscoColegio san francisco
Colegio san francisco
 
Projecte grupinformal
Projecte grupinformalProjecte grupinformal
Projecte grupinformal
 
Ciencia, tecnologia y educacion para no expertos
Ciencia, tecnologia y educacion para no expertosCiencia, tecnologia y educacion para no expertos
Ciencia, tecnologia y educacion para no expertos
 
Presentacion nitcs ludi
Presentacion nitcs ludiPresentacion nitcs ludi
Presentacion nitcs ludi
 
Face parts
Face partsFace parts
Face parts
 
Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009
Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009
Introduction à Google Web Toolkit (GWT) - Philippe Kernevez - February 2009
 
Dupligenerale juillet2013 hp
Dupligenerale juillet2013 hpDupligenerale juillet2013 hp
Dupligenerale juillet2013 hp
 
Contexto misiones de centro de investigación histórica guillermo furlong
Contexto misiones de   centro de investigación histórica guillermo furlongContexto misiones de   centro de investigación histórica guillermo furlong
Contexto misiones de centro de investigación histórica guillermo furlong
 
Como el agua
Como el aguaComo el agua
Como el agua
 
Maidelys Alvares (Literatura-Griega)
Maidelys Alvares (Literatura-Griega)Maidelys Alvares (Literatura-Griega)
Maidelys Alvares (Literatura-Griega)
 
Roxy
RoxyRoxy
Roxy
 
Producción yerbatera
Producción yerbateraProducción yerbatera
Producción yerbatera
 

Similaire à Évaluation applicative des terminologies destinées à la traduction spécialisée

Particularités du Monitoring International - ClinTec - Rencontres de la Reche...
Particularités du Monitoring International - ClinTec - Rencontres de la Reche...Particularités du Monitoring International - ClinTec - Rencontres de la Reche...
Particularités du Monitoring International - ClinTec - Rencontres de la Reche...PharmaSuccess
 
20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...
20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...
20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...ASIP Santé
 
VOCLok: Une solution gagnante pour la collecte des solvants en laboratoire
VOCLok: Une solution gagnante pour la collecte des solvants en laboratoireVOCLok: Une solution gagnante pour la collecte des solvants en laboratoire
VOCLok: Une solution gagnante pour la collecte des solvants en laboratoireTriumvirate Environmental
 
Service sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatialesService sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatialesACSG Section Montréal
 
Plateforme e-learning PHP
Plateforme e-learning PHP Plateforme e-learning PHP
Plateforme e-learning PHP Saâd Zerhouni
 
JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...
JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...
JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...ABES
 
Conception assistée de documents structurés - Cas client Eurocopter
Conception assistée de documents structurés - Cas client EurocopterConception assistée de documents structurés - Cas client Eurocopter
Conception assistée de documents structurés - Cas client EurocopterSollan France
 
Corpus comparables et traduction assistée par ordinateur, contributions à la ...
Corpus comparables et traduction assistée par ordinateur, contributions à la ...Corpus comparables et traduction assistée par ordinateur, contributions à la ...
Corpus comparables et traduction assistée par ordinateur, contributions à la ...Estelle Delpech
 
Normalisation : perspectives de développement de référentiels métier et compé...
Normalisation : perspectives de développement de référentiels métier et compé...Normalisation : perspectives de développement de référentiels métier et compé...
Normalisation : perspectives de développement de référentiels métier et compé...idealconnaissances
 

Similaire à Évaluation applicative des terminologies destinées à la traduction spécialisée (11)

Particularités du Monitoring International - ClinTec - Rencontres de la Reche...
Particularités du Monitoring International - ClinTec - Rencontres de la Reche...Particularités du Monitoring International - ClinTec - Rencontres de la Reche...
Particularités du Monitoring International - ClinTec - Rencontres de la Reche...
 
20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...
20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...
20171123 3 intégration des résultats d'examens terr-e_santé_séminaire interop...
 
CV Adam Fra V4
CV Adam Fra V4CV Adam Fra V4
CV Adam Fra V4
 
VOCLok: Une solution gagnante pour la collecte des solvants en laboratoire
VOCLok: Une solution gagnante pour la collecte des solvants en laboratoireVOCLok: Une solution gagnante pour la collecte des solvants en laboratoire
VOCLok: Une solution gagnante pour la collecte des solvants en laboratoire
 
Service sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatialesService sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatiales
 
Plateforme e-learning PHP
Plateforme e-learning PHP Plateforme e-learning PHP
Plateforme e-learning PHP
 
JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...
JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...
JABES 2018 - Atelier : bien se préparer aux prochaines évolutions de consigne...
 
Conception assistée de documents structurés - Cas client Eurocopter
Conception assistée de documents structurés - Cas client EurocopterConception assistée de documents structurés - Cas client Eurocopter
Conception assistée de documents structurés - Cas client Eurocopter
 
Corpus comparables et traduction assistée par ordinateur, contributions à la ...
Corpus comparables et traduction assistée par ordinateur, contributions à la ...Corpus comparables et traduction assistée par ordinateur, contributions à la ...
Corpus comparables et traduction assistée par ordinateur, contributions à la ...
 
Normalisation : perspectives de développement de référentiels métier et compé...
Normalisation : perspectives de développement de référentiels métier et compé...Normalisation : perspectives de développement de référentiels métier et compé...
Normalisation : perspectives de développement de référentiels métier et compé...
 
Presentation Dess Ebi
Presentation Dess EbiPresentation Dess Ebi
Presentation Dess Ebi
 

Plus de Estelle Delpech

Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texteEstelle Delpech
 
Identification de compatibilités entre tages descriptifs de lieux
Identification de compatibilités entre tages descriptifs de lieuxIdentification de compatibilités entre tages descriptifs de lieux
Identification de compatibilités entre tages descriptifs de lieuxEstelle Delpech
 
Découverte du Traitement Automatique des Langues
Découverte du Traitement Automatique des LanguesDécouverte du Traitement Automatique des Langues
Découverte du Traitement Automatique des LanguesEstelle Delpech
 
Invited speaker, ATALA 2014 Ph. D. Thesis award
Invited speaker, ATALA 2014 Ph. D. Thesis awardInvited speaker, ATALA 2014 Ph. D. Thesis award
Invited speaker, ATALA 2014 Ph. D. Thesis awardEstelle Delpech
 
Identification de compatibilites sémantiques entre descripteurs de lieux
Identification de compatibilites sémantiques entre descripteurs de lieuxIdentification de compatibilites sémantiques entre descripteurs de lieux
Identification de compatibilites sémantiques entre descripteurs de lieuxEstelle Delpech
 
Usage du TAL dans des applications industrielles : gestion des contenus multi...
Usage du TAL dans des applications industrielles : gestion des contenus multi...Usage du TAL dans des applications industrielles : gestion des contenus multi...
Usage du TAL dans des applications industrielles : gestion des contenus multi...Estelle Delpech
 
Nomao: data analysis for personalized local search
Nomao: data analysis for personalized local searchNomao: data analysis for personalized local search
Nomao: data analysis for personalized local searchEstelle Delpech
 
Nomao: carnet de bonnes adresses (entre amis)
Nomao: carnet de bonnes adresses (entre amis)Nomao: carnet de bonnes adresses (entre amis)
Nomao: carnet de bonnes adresses (entre amis)Estelle Delpech
 
Nomao: local search and recommendation engine
Nomao: local search and recommendation engineNomao: local search and recommendation engine
Nomao: local search and recommendation engineEstelle Delpech
 
Extraction of domain-specific bilingual lexicon from comparable corpora: comp...
Extraction of domain-specific bilingual lexicon from comparable corpora: comp...Extraction of domain-specific bilingual lexicon from comparable corpora: comp...
Extraction of domain-specific bilingual lexicon from comparable corpora: comp...Estelle Delpech
 
Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...
Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...
Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...Estelle Delpech
 
Applicative evaluation of bilingual terminologies
Applicative evaluation of bilingual terminologiesApplicative evaluation of bilingual terminologies
Applicative evaluation of bilingual terminologiesEstelle Delpech
 
Dealing with Lexicon Acquired from Comparable Corpora: post-edition and exchange
Dealing with Lexicon Acquired from Comparable Corpora: post-edition and exchangeDealing with Lexicon Acquired from Comparable Corpora: post-edition and exchange
Dealing with Lexicon Acquired from Comparable Corpora: post-edition and exchangeEstelle Delpech
 
Bilingual terminology mining
Bilingual terminology miningBilingual terminology mining
Bilingual terminology miningEstelle Delpech
 
Robust rule-based parsing
Robust rule-based parsingRobust rule-based parsing
Robust rule-based parsingEstelle Delpech
 
Experimenting the TextTiling Algorithm
Experimenting the TextTiling AlgorithmExperimenting the TextTiling Algorithm
Experimenting the TextTiling AlgorithmEstelle Delpech
 
Text Processing for Procedural Question Answering
Text Processing for Procedural Question AnsweringText Processing for Procedural Question Answering
Text Processing for Procedural Question AnsweringEstelle Delpech
 

Plus de Estelle Delpech (18)

Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texte
 
Identification de compatibilités entre tages descriptifs de lieux
Identification de compatibilités entre tages descriptifs de lieuxIdentification de compatibilités entre tages descriptifs de lieux
Identification de compatibilités entre tages descriptifs de lieux
 
Découverte du Traitement Automatique des Langues
Découverte du Traitement Automatique des LanguesDécouverte du Traitement Automatique des Langues
Découverte du Traitement Automatique des Langues
 
Invited speaker, ATALA 2014 Ph. D. Thesis award
Invited speaker, ATALA 2014 Ph. D. Thesis awardInvited speaker, ATALA 2014 Ph. D. Thesis award
Invited speaker, ATALA 2014 Ph. D. Thesis award
 
Identification de compatibilites sémantiques entre descripteurs de lieux
Identification de compatibilites sémantiques entre descripteurs de lieuxIdentification de compatibilites sémantiques entre descripteurs de lieux
Identification de compatibilites sémantiques entre descripteurs de lieux
 
Usage du TAL dans des applications industrielles : gestion des contenus multi...
Usage du TAL dans des applications industrielles : gestion des contenus multi...Usage du TAL dans des applications industrielles : gestion des contenus multi...
Usage du TAL dans des applications industrielles : gestion des contenus multi...
 
Nomao: data analysis for personalized local search
Nomao: data analysis for personalized local searchNomao: data analysis for personalized local search
Nomao: data analysis for personalized local search
 
Nomao: carnet de bonnes adresses (entre amis)
Nomao: carnet de bonnes adresses (entre amis)Nomao: carnet de bonnes adresses (entre amis)
Nomao: carnet de bonnes adresses (entre amis)
 
Nomao: local search and recommendation engine
Nomao: local search and recommendation engineNomao: local search and recommendation engine
Nomao: local search and recommendation engine
 
Extraction of domain-specific bilingual lexicon from comparable corpora: comp...
Extraction of domain-specific bilingual lexicon from comparable corpora: comp...Extraction of domain-specific bilingual lexicon from comparable corpora: comp...
Extraction of domain-specific bilingual lexicon from comparable corpora: comp...
 
Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...
Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...
Identification of Fertile Translations in Comparable Corpora: a Morpho-Compos...
 
Applicative evaluation of bilingual terminologies
Applicative evaluation of bilingual terminologiesApplicative evaluation of bilingual terminologies
Applicative evaluation of bilingual terminologies
 
Dealing with Lexicon Acquired from Comparable Corpora: post-edition and exchange
Dealing with Lexicon Acquired from Comparable Corpora: post-edition and exchangeDealing with Lexicon Acquired from Comparable Corpora: post-edition and exchange
Dealing with Lexicon Acquired from Comparable Corpora: post-edition and exchange
 
R&D Lingua et Machina
R&D Lingua et MachinaR&D Lingua et Machina
R&D Lingua et Machina
 
Bilingual terminology mining
Bilingual terminology miningBilingual terminology mining
Bilingual terminology mining
 
Robust rule-based parsing
Robust rule-based parsingRobust rule-based parsing
Robust rule-based parsing
 
Experimenting the TextTiling Algorithm
Experimenting the TextTiling AlgorithmExperimenting the TextTiling Algorithm
Experimenting the TextTiling Algorithm
 
Text Processing for Procedural Question Answering
Text Processing for Procedural Question AnsweringText Processing for Procedural Question Answering
Text Processing for Procedural Question Answering
 

Évaluation applicative des terminologies destinées à la traduction spécialisée

  • 1. Évaluation applicative des terminologies destinées à la traduction spécialisée Estelle Delpech Atelier EvalECD 25/01/2011 1
  • 2. Plan 1. Contexte, problématiques 2. Protocole d'évaluation 3. Expérimentation et résultats 4. Conclusions 2
  • 3. Plan 1. Contexte, problématiques 2. Protocole d'évaluation 3. Expérimentation et résultats 4. Conclusions 3
  • 4. Contexte • Lingua et Machina – commercialise des outils de TAO : • mémoires de traduction • extraction terminologique bilingue • gestion de terminologie • Metricc – exploitation des corpus comparables pour : • outils de TAO • RI interlingue 4
  • 5. Problématique • Comment évaluer ces lexiques bilingues issus de corpus comparables ? • Souhaits : – ne pas se contenter d'une évaluation par rapport à une référence – mesurer le véritable apport en contexte d'utilisation 5
  • 7. Questions soulevées • Comment évaluer la qualité d'une traduction ? • Faut-il évaluer la qualité de la traduction dans son entier ou uniquement la traduction des termes techniques ? • Comment évaluer une traduction technique sans expert ? 7
  • 8. Comment évaluer la qualité de la traduction ? • Mesures objectives TA – avantage de la reproductibilité faible • Grilles d'évaluation Traductologie – trop complexes, peu documentées • Évaluation subjective style TA – jugement de qualité sur 3 catégories – classement 8
  • 9. Évaluer toute la traduction ? • Qualité d'une traduction = interaction complexe de nombreux paramètres • Proposition : – isoler les éléments sur lesquels les lexiques sont censés aider – n'évaluer que la traduction de ces éléments 9
  • 10. Comment pallier l'absence d'expert ? • Pas d'expert du domaine qui puisse valider les traductions • Emploi d'une référence – les textes à traduire doivent avoir une traduction existante • résumés d'articles scientiques • textes de sites web bilingues (vulgarisation) 10
  • 11. Plan 1. Contexte, problématiques 2. Protocole d'évaluation 3. Expérimentation et résultats 4. Conclusions 11
  • 13. Protocole (2) cancer du sein sciences de l'eau non-traducteur non-traducteur SITUATION 1 ress. gén. + lexique CC traducteur 1 traducteur 2 SITUATION 2 ress. gén. + Web traducteur 2 traducteur 1 BASE LINE ress. gén. 13
  • 14. Protocole (3) • Le traducteur traduit un texte spécialisé à l'aide d'une ressource donnée • Une fois le texte traduit : – indique les termes ou expressions pour lesquels il a eu besoin d'une ressource – indique la traduction retenue – indique les ressources utilisées 14
  • 15. Protocole (4) • Traduction anonymisées, mélangées • Jugement qualité – exact : terme ou expression consacrée – acceptable : sens maintenu • Classement – de la meilleure à la moins bonne – égalités possibles 15
  • 16. Plan 1. Contexte, problématiques 2. Protocole d'évaluation 3. Expérimentation et résultats 4. Conclusions 16
  • 17. Données cancer du sein sciences de l'eau Corpus acquisition ~400k par langue portail Elsevier ~2 M par langue revues Siences de l'eau, Water Science and Technology textes scientifiques 3 résumés d'articles 508 mots portal Elsevier 3 résumés d'articles 499 mots revue Sciences de l'eau textes vulgarisation 1 page web 613 mots site Société canadienne du cancer 1 page web 425 mots site Lenntech 17
  • 18. Expérimentation de la méthodologie • Impressions des traducteurs En gros, 75% des mots techniques ne figurent pas dans le glossaire Metricc, et sur les 25% restants, 99% ont entre 10 et 20 traductions candidates, mais aucune de validée. Du coup, dans le meilleur des cas on est "à peu près sûr", mais jamais totalement. Et dans le pire des cas (très fréquemment, malheureusement) on y va "à l'instinct" • traducteurs pas préparés • problème d'adéquation du lexique 18
  • 19. Adéquation du lexique aux textes à traduire • Estimation avec ratio : mots lexique∪mots textes à traduire mots textes à traduire cancer du sein 400k mots sciences de l'eau 2M mots Langue source – EN 0,94 0,14 Langue cible – FR 0,67 0,78 • mieux vaut une thématique précise qu'un gros corpus 19
  • 20. Accord inter-annotateur • Mesure de l'accord P  A−P  E  Kappa= 1− P  E  P(A) : accord observé P(E) : accord dû au hasard 20
  • 21. Accord inter-annotateur • Mode d'évaluation – classement : 0, 65 – jugement : 0,36 • Type de textes – vulgarisés : 0,57 – scientifques 0,48 21
  • 22. Jugement de qualité • Cancer du sein – proportion de traductions fausses équivalente – traductions sont jugées plus exactes avec le Web, puis avec Corpus Comp. Cancer Du Sein K = 0,25 100% 90% 20% 19% 18% 42% 38% 35% 38% 43% 47% 80% 70% 60% 50% 40% 30% 20% 10% 0% ress. gén ress. gén. + TBCC ress. gén. + Web 22
  • 23. Jugement de qualité • Sciences de l'eau – traductions nettement mieux jugées pour le Web – Corpus Comp. produit des traductions de moins bonne qualité Sciences de l'eau K = 0,42 100% 18% 21% 23% 23% 90% 80% 7% 70% 16% 60% 50% 40% 77% 59% 30% 56% 20% 10% 0% ress. gén ress. gén. + TBCC 23 ress. gén. + Web
  • 24. Problème dans l'utilisation des ressources • les traductions de la situation 1 moins bonnes que celles de la situation 0 • Or disposent du même socle de ressources générales lexique Metricc ressources générales ressources générales Situation 0 Situation 1 24
  • 25. Problème dans l'utilisation des ressources • Les traducteurs des situations 1 et 2 ont très peu utilisé les ressources générales S0 Ress. Générale Ress. Spécialisée Intuition S1 S2 43% 14% 3% - 25% 56% 79% 77% 44% 25
  • 26. Classement des traductions Cancer du sein K=0,69 42% 47% 45 32% 40 35 30 28% 26% 26% 25 20 15 10 5 0 TBCC vs. ress. gén. TBCC vs. Web. 26
  • 27. Classement des traductions Sciences de l'eau K=0,63 49% 90 41% 43% 80 33% 70 60 50 40 18% 16% 30 20 10 0 TBCC vs. ress. gén. TBCC vs. Web 27
  • 28. Plan 1. Contexte, problématiques 2. Protocole d'évaluation 3. Expérimentation et résultats 4. Conclusions 28
  • 29. Conclusion sur la méthodologie • dépendance entre : – apport du lexique bilingue – adéquation lexique/textes à traduire • toute mesure de l'apport doit aussi indiquer l'adéquation entre lexique et textes à traduire • comment mesurer cette adéquation ? faut-il une adéquation minimale ? 29
  • 30. Conclusion sur la méthodologie • Problèmes dans l'utilisation des ressources – mieux préparer les traducteurs – revoir les situations de traductions : lexique Metricc Situation 0 Web Situation 1 Situation 2 30
  • 31. Conclusion sur la méthodologie • Faire une traduction « de chauffe » ? • Idéalement, obtenir plus de données : – plus de textes à traduire – plus de domaines – plus de traducteurs • Juges distincts des traducteurs ! 31
  • 32. Conclusion sur les lexiques • Utiles si construits à partir d'un corpus à thématique « fine » • Web plus vaste, contiendra toujours plus de solutions de traductions • L'idéal : – associer le lexique à des routines qui traduisent à la volée et/ou vont chercher les traductions sur le Web 32
  • 33. Remerciements Ce travail a été financé par : – ANR, subvention n° ANR-08-CORD-009 – Lingua et Machina, www.lingua-et-machina.com Annotateurs : – Clémence De Baudus – Mathieu Delage 33