Catégories populaires, catégories cachées et prototypes : approches des taxin...
Ontologies étendues pour l'annotation sémantique
1. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Ontologies ´tendues pour l’annotation s´mantique
e e
Yue Ma, Laurent Audibert, Adeline Nazarenko
Laboratoire d’Informatique de Paris-Nord (UMR CNRS 7030)
Institut Galil´e - Universit´ Paris-Nord
e e
99, avenue Jean-Baptiste Cl´ment
e
93430 Villetaneuse, France
29 mai 2009
Ce travail a ´t´ r´alis´ dans le cadre du programme Quaero,
ee e e
financ´ par OSEO, agence nationale de valorisation de la recherche.
e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 1 / 23
2. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Introduction
Annotation s´mantique
e
Mettre des fragments de texte en correspondance avec les ´lements
e
d’une ontologie
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 2 / 23
3. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Introduction
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 3 / 23
4. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Introduction
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 4 / 23
5. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Sommaire
1 Annotation s´mantique
e
2 Une extension ` base de r`gles d’annotation
a e
3 Conclusion et perspectives
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 5 / 23
6. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Types d’annotation
Concepts
Certains mots ou expressions
d´notent des concepts
e
Exemple : pi`ce de th´ˆtre
e ea
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 6 / 23
7. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Types d’annotation
Instances de concepts
Certains mots ou expressions
renvoient ` des instances de
a
concepts
Exemple : entit´s nomm´es comme
e e
Marie et Moli`re
e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 7 / 23
8. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Types d’annotation
Rˆles conceptuels
o
Certains mots ou expressions
d´notent des rˆles conceptuels
e o
Exemple : lit
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 8 / 23
9. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Types d’annotation
Relations entre instances
Certains fragments de texte
renvoient ` des relations entre
a
instances
Exemple : une pi`ce de th´ˆtre de
e ea
Moli`re
e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 9 / 23
10. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Types d’annotation
Axiomes ontologiques
Certains fragments textuels expriment des axiomes
ontologiques
Exemple : les g`nes sont des entit´s biologiques
e e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 10 / 23
11. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Extension lexicale
Syst`me LingInfo
e
LingInfo [Buitelaar, Sintek & Kiesel, 2006] associe une d´composition
e
linguistique d´taill´e aux classes et aux propri´t´s de l’ontologie
e e ee
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 11 / 23
12. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Extension lexicale
Syst`me LexOnto
e
LexOnto [Cimiano, Haase, Herold, Mantel & Buitelaar, 2007] utilise une
meta-ontologie permettant de repr´senter des relations simples entre
e
termes et concepts, ainsi que des structures linguistiques complexes de
type pr´dicat-argument (cadres de sous-cat´gorisation).
e e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 12 / 23
13. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Contexte de mise en oeuvre
Plateforme d’annotation linguistique
Contexte :
Plateforme d’annotation
linguistique
Int´gration d’outils h´t´rog`nes
e ee e
Probl`me dans la plateforme Alvis :
e
Repr´sentation s´mantique
e e
r´partie sur plusieurs niveaux
e
probl`mes de coh´rence
e e
forte d´pendance avec les outils
e
utilis´s en amont
e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 13 / 23
14. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Contexte de mise en oeuvre
Extensions lexicales existantes ?
L’ontologie rassemble en un lieu unique
et coh´rent ce qui est du ressort de la
e
s´mantique
e
Inconv´nients du niveau terminologique
e
pivot des syst`mes pr´sent´s :
e e e
Constitution manuelle ou assist´e
e
Double-emploi avec les annotations
des niveaux inf´rieurs de la
e
plateforme
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 14 / 23
15. Annotation s´mantique
e Diff´rents types d’annotation
e
Une extension ` base de r`gles d’annotation
a e Les extensions lexicales
Conclusion et perspectives Contexte de mise en oeuvre
Contexte de mise en oeuvre
Extension ` base de r`gles
a e
Objectifs de l’extension :
Permettre l’annotation s´mantique
e
automatique
S’appuyer sur les annotations des
modules situ´s en amont
e
Compr´hensible et modifiable par
e
un ˆtre humain
e
ˆ
Etre inf´rable
e
(semi-)automatiquement ` partir
a
d’un corpus s´mantiquement
e
annot´e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 15 / 23
16. Annotation s´mantique
e Extension ` base de r`gles
a e
Une extension ` base de r`gles d’annotation
a e Expression des r`gles
e
Conclusion et perspectives Op´rations sur une ontologie ´tendue
e e
Ontologie et R`gles
e
Ontologie
O = C , R, I ?, RI ?, A compos´e d’un ensemble de concepts (C ),
e
de rˆles (R), d’instances (I ), de relations entre instances (RI ) et
o
d’axiomes (A)
R`gles
e
Une r`gle est la donn´e d’un couple (P, C ) o` P (Pr´misse) d´crit
e e u e e
les conditions qu’un segment de texte doit v´rifier pour ˆtre annot´
e e e
et C (Conclusion) indique comment annoter le segment.
Exemple de r`gle pour annoter le segment de texte « personne » :
e
(P, C ) = ([lemme={personne}], PERSONNE )
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 16 / 23
17. Annotation s´mantique
e Extension ` base de r`gles
a e
Une extension ` base de r`gles d’annotation
a e Expression des r`gles
e
Conclusion et perspectives Op´rations sur une ontologie ´tendue
e e
D´finition de l’extension
e
Extension
R = RC , RR , RI , RRI , RA , un ensemble de r`gles permettant
e
d’annoter des fragments de textes en les reliant ` des concepts
a
(RC ), des rˆles (RR ), des instances (RI ), des relations entre
o
instances (RRI ) ou des axiomes (RA )
Pour chaque concept c de C il existe un couple de r`gles
e
(ρc , ρci ) concluant sur c et telles que ρc ∈ RC et ρci ∈ RI
pour chaque rˆle r de R il existe un couple de r`gles (ρr , ρri )
o e
concluant sur r et telles que ρr ∈ RI et ρri ∈ RRI
pour chaque axiome a de A il existe une r`gle ρa ∈ RA
e
concluant sur a
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 17 / 23
18. Annotation s´mantique
e Extension ` base de r`gles
a e
Une extension ` base de r`gles d’annotation
a e Expression des r`gles
e
Conclusion et perspectives Op´rations sur une ontologie ´tendue
e e
Exemple de couple de r`gles
e
R`gle d’annotation ontologique pour annoter « personne » :
e
ρc ∈ RC = ([lemme={personne}], PERSONNE )
R`gle de peuplement ontologique pour annoter « Marie » :
e
ρci ∈ RI = ([entit´_nomm´e={personne}], PERSONNE )
e e
Si l’objectif n’est pas de peupler l’ontologie :
on peut ignorer les r`gles de peuplement
e
on peut les interpr´ter comme des r`gles conceptuelles
e e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 18 / 23
19. Annotation s´mantique
e Extension ` base de r`gles
a e
Une extension ` base de r`gles d’annotation
a e Expression des r`gles
e
Conclusion et perspectives Op´rations sur une ontologie ´tendue
e e
Formalisme des patrons
La pr´misse P d’une r`gle (P, C ) peut ˆtre repr´sent´e par un
e e e e e
ensemble de patrons
Pour exprimer des contraintes de d´sambigu¨
e ısation portant sur son
contexte, un patron pourrait s’´crire sous la forme d’un triplet :
e
P = (LC ?, T , RC ?)
Formalismes candidats :
XPath pour des annotations en XML (sous forme de triplets)
ou XQuery (pas besoin de triplets)
SQL pour des annotations dans une base de donn´es e
JDOQL pour des annotations g´r´es par la librairie JDO
ee
HQL pour des annotations g´r´es par la librairie Hibernate
ee
...
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 19 / 23
20. Annotation s´mantique
e Extension ` base de r`gles
a e
Une extension ` base de r`gles d’annotation
a e Expression des r`gles
e
Conclusion et perspectives Op´rations sur une ontologie ´tendue
e e
Op´rations sur une ontologie ´tendue
e e
L’ajout d’un concept implique de pr´ciser les patrons associ´s :
e e
1 selon une proposition spontan´e de l’utilisateur
e
2 ou en les inf´rant ` partir d’annotations manuelles sur un
e a
corpus repr´sentatif
e
La d´composition d’un concept impose la d´composition de son
e e
extension :
1 qui peut ˆtre r´alis´e manuellement
e e e
2 ou inf´r´e apr`s avoir annot´ un corpus repr´sentatif et
ee e e e
r´parti manuellement les annotations
e
La fusion de deux concepts c1 et c2 a comme extension
(ρc1 ∨ ρc2 , ρi1 ∨ ρi2 )
La suppression d’un concept entraˆ la suppression de son
ıne
extension, ou son absorption par le ou les concepts qui le
subsument
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 20 / 23
21. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Conclusion
Solution au probl`me de l’annotation s´mantique au regard d’une
e e
ontologie dans le cadre d’une plateforme d’annotation
Tire parti des outils de TAL situ´s en amont
e
Distinction claire entre processus d’analyse linguistique et
interpr´tation ontologique
e
Int´rˆt des patrons :
ee
Grand pouvoir expressif
Compr´hensibles et modifiables par une personne
e
Interpr´tables, voire calculables, par un ordinateur
e
Nombreux formalismes connus et standardis´s existants
e
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 21 / 23
22. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Perspectives
D´termination du formalisme des patrons
e
D´veloppement et exp´rimentations d’un module d’annotation
e e
s´mantique dans une plateforme d’annotation
e
Probl´matique prom´tteuse du champs de recherche
e e
concernant l’acquisition des r`gles (apprentissage incr´mental,
e e
active learning. . . )
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 22 / 23
23. Annotation s´mantique
e
Une extension ` base de r`gles d’annotation
a e
Conclusion et perspectives
Paul Buitelaar, Michael Sintek, and Malte Kiesel.
A multilingual/multimedia lexicon model for ontologies.
In ESWC, pages 502–513, 2006.
Philipp Cimiano, Peter Haase, Matthias Herold, Matthias Mantel, and
Paul Buitelaar.
Lexonto : A model for ontology lexicons for ontology-based nlp.
In Proceedings of OntoLex - From Text to Knowledge : The
Lexicon/Ontology Interface, 2007.
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies ´tendues pour l’annotation s´mantique
e e 23 / 23