SlideShare une entreprise Scribd logo
1  sur  8
Télécharger pour lire hors ligne
Ontologies et alignement d’ontologies : notes de cours
                                               Adrien Coulet
           (inspir´ des cours de R. Dieng, J. Euzenat, A. G´ mez-P´ rez, J. Lieber et A. Napoli)
                  e                                        o      e

                                            derni` re version : 19/11/07
                                                 e
                                              (version pr´ liminaire)
                                                           e


Table des mati` res
              e
1   Introduction                                                                                                                                                                          1

2   Les ontologies                                                                                                                                                                        2
    2.1 D´ finitions . . . . . . . . . . . .
           e                                  .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   2
    2.2 Origine . . . . . . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   2
    2.3 Les diff´ rents types d’ontologies
                 e                            .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   2
    2.4 Le partage d’ontologies . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   3

3   Les m´ thodes de construction
         e                                                                                                                                                                                3

4   Les languages de repr´ sentation
                         e                                                                                                                                                                3
    4.1 Les logiques de descriptions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                                            3
    4.2 OWL : Web Ontology Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                                                 4
    4.3 Les m´ canismes de raisonnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
              e                                                                                                                                                                           6

5   Les applications des ontologies                                                                                                                                                       6
    5.1 Le Web S´ mantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
                   e                                                                                                                                                                      6
    5.2 La classification automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                                            6
    5.3 L’int´ gration de donn´ es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
              e               e                                                                                                                                                           6

6   L’alignement d’ontologies                                                                                                                                                             7
    6.1 D´ finitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
           e                                                                                                                                                                              7
    6.2 Techniques de bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .                                                                           7
    6.3 Les strat´ gies d’alignement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
                 e                                                                                                                                                                        8

7   Pour aller plus loin                                                                                                                                                                  8


1    Introduction
     Ce cours est une br` ve pr´ sentation des ontologies et notamment des ontologies OWL, format recommend´
                        e      e                                                                           e
par le W3C pour le Web S´ mantique. Nous evoquerons les principales applications des ontologies, ainsi que
                             e                  ´
l’alignement d’ontologies comme enjeu principal au d´ veloppement de ces applications.
                                                        e




                                                                          1
2     Les ontologies
2.1     D´ finitions
         e
En philosophie l’ontologie est une branche de la m´ taphysique qui s’int´ resse a l’´ tude des propri´ t´ s de l’ˆ tre
                                                  e                     e       ` e                  ee          e
     (au sens de ce qui existe).
En informatique une ontologie est une repr´ sentation de connaissances. Une d´ finition plus explicite est :
                                          e                                  e
              “Une ontologie est une specification formelle et explicite d’une conceptualisation partag´ e” [4].
                                                                                                      e
        –   Sp´ cification formelle : compr´ hensible par une machine,
              e                              e
        –   Sp´ cification explicite : les concepts, relations, fonctions, contraintes, axiomes sont explicitement d´ finis,
              e                                                                                                    e
        –   Partag´ e : les connaissances repr´ sent´ es sont partag´ es par une communaut´ ,
                   e                           e     e               e                       e
        –   Conceptualisation : mod` le abstrait d’une partie du monde que l’on veut repr´ senter.
                                       e                                                     e
Plus formellement une ontologie O est un syst` me de symboles consistant en :
                                                  e
      – Un ensemble Sc de concepts, et un ensemble Sr de relation binaires (D,R), entre domaines et co-domaines
        (qui sont deux sous-ensembles de Sc )
        N.B. : Un concept repr´ sente un ensemble (fini ou infini). Ainsi le concept de chat noir repr´ sente (intui-
                                e                                                                         e
        tivement) l’ensemble de tous les chats noirs.
      – Une hierarchie H, o` les concepts et relations sont hi´ rarchiquement reli´ s par la relation de subsomption,
                             u                                e                   e
        i.e. une relation d’ordre partiel not´ ⊑ , o` C1 ⊑ C2 signifie que C1 est un sous-concept de C2 , et r1 ⊑ r2
                                             e      u
        signifie que r1 est une sous-relation de r2 .
      – Un ensemble d’axiomes A qui introduisent les concepts et les relations.

2.2     Origine
     L’´ mergence de la notion d’ontologie en informatique r´ sulte en partie des travaux de recherches en intelli-
       e                                                        e
gence artificielle. Comment formaliser des connaissances pour qu’elles puissent etre interpr´ t´ es par les machines
                                                                                    ˆ           ee
est une probl´ matique centrale de ce domaine qui a motiv´ de nombreux travaux sur les repr´ sentations par objets.
              e                                              e                                  e
L’utilisation conjointe des syst` mes a bases d’objets et de logiques a men´ a la constitution d’ontologies formelles.
                                e       `                                  e`
Depuis 2001, l’´ mulation autour du Web S´ mantique participe au d´ veloppement de standards pour les ontologies
                 e                           e                         e
et a la multiplication de leur utilisation.
   `

2.3     Les diff´ rents types d’ontologies
                e
      – Lightweight Ontologies vs. Heavyweight Ontologies. Voir Figure 1.




                                  F IG . 1 – Classification de Lassila et McGuinness [6].

      – Task Ontology vs Domain Ontology




                                                             2
– Representation ⇒ Generic ⇒ Domain ⇒ Application Ontologies
        Equilibre entre utilisabilit´ et r´ utilisabilit´ : lors de la construction ou du choix d’une ontologie, il est im-
                                     e     e            e
        portant d’avoir a l’esprit que plus le niveau d’abstraction choisi est proche de l’application moins l’ontologie
                           `
        est r´ utilisable, mais plus elle est utilisable.
             e

2.4     Le partage d’ontologies
    Une caract´ ristique principales des ontologies est de devoir etre disponible, pour pouvoir (1) etre partag´ es par
               e                                                    ˆ                               ˆ          e
une communaut´ et (2) etre accessibles aux machines.
                 e       ˆ
    Selon leur d´ finition, les ontologies doivent correspondre a une conceptualisation paratag´ e par une commu-
                 e                                                `                              e
naut´ . Pour cela, il existe des biblioth` ques d’ontologies qui permettent le partage d’ontologies et servent de
    e                                    e
support a un affinement communautaire des conceptualisations de mani` re collaborative. Par exemple, les ontolo-
         `                                                                 e
gies biom´ dicales sont partag´ es sur le site OBO Foundry [8] qui regroupe des ontologies concernant diff´ rents
           e                   e                                                                                e
domaines de la biologie (comme Gene Ontology pour les fonctions des g` nes, Disease Ontology pour les mala-
                                                                              e
dies) afin de permettre leur raffinement et leur validation. Il existe par ailleurs, des outils comme Swoogle [16]
ou Ontology Lookup Service [9] qui sont des moteurs de recherche qui indexent les concepts inclus dans les
ontologies disponibles pour favoriser la r´ utilisation des ontologies existantes.
                                           e



3      Les m´ thodes de construction
            e
   Diff´ rentes m´ thodes de construction d’ontologies ont et´ propos´ es (par exemple : METHONTOLOGY,
       e          e                                            ´e         e
NeOn). Elles s’inspirent des m´ thodes de d´ veloppement logiciel (voir Figure 2) [2]. Avec notamment :
                              e             e
   – Une phase de conceptualisation men´ e en etroite collaboration avec des experts du domain repr´ sent´ . La
                                            e      ´                                                   e  e
     conceptualisation peut se faire a l’aide des m´ thodes de mod´ lisation comme l’UML ou les Ontology Design
                                     `              e             e
     Patterns.
   – Une phase d’´ valuation.
                    e
   – Un cycle pour perp´ tuellement am´ liorer les ontologies.
                          e               e




                                        F IG . 2 – Cycle de vie d’une ontologie [2].




4      Les languages de repr´ sentation
                            e
4.1     Les logiques de descriptions
    les logiques de descriptions (LD) sont des langages de repr´ sentation de connaissances classiques dont le
                                                                  e
formalisme s’appuye sur les notions de concepts, de rˆ le et d’instance.
                                                     o

                                                             3
Les LD sont apparent´ es, en particulier, aux formalismes de repr´ sentation des connaissances par objets. La
                             e                                              e
s´ mantique d’une telle logique s’exprime grˆ ce a des notions ensemblistes.
 e                                              a `
    Ainsi, etant donn´ une interpr´ tation I, un concept C s’interpr` te comme un ensemble I (C), un rˆ le r s’in-
            ´          e             e                                    e                                 o
terpr` te comme une relation binaire
     e                                 I (r) et une instance a comme un individu I (a).

    Les op´ rations ∩, ∪, etc., sur les ensembles sont repr´ sent´ s par les connecteurs ⊓, ⊔, etc., sur les concepts.
            e                                                  e     e
Par exemple, etant donn´ deux concepts C et D et une interpr´ tation I, on a (C ⊓ D)I () =I (C) ∩I (D).
               ´           e                                      e
    Il existe plusieurs LD dont les diff´ rences sont de poss´ der plus ou moins de constructeurs et de type d’axiomes.
                                          e                    e
Nous pr´ sentons dans le Tableau 1 les principaux constructeurs des LD.La logique qui est contenue dans le langage
         e
OWL (OWL DL pour etre exact) est SHOIN (D).
                         ˆ
    ⊤ et ⊥ sont deux concepts particuliers repr´ sentant respectivement le concept le plus g´ n´ ral et le concept
                                                     e                                              e e
insatisfiable (qui est aussi le concept le plus sp´ cifique).
                                                   e
    Par exemple, le concept “ tarte aux pommes et aux noix dont toutes les pˆ tes sont feuillet´ es ou bris´ es (elle
                                                                                    a                e         e
peut ne pas avoir de pˆ te, en avoir 1, 2, etc.) ” peut etre repr´ sent´ sous la forme suivante en LD :
                        a                               ˆ        e     e

            Tarte ⊓ ∃ingr´dient.Pomme ⊓ ∃ingr´dient.Noix ⊓ ∀p^te.(Feuillet´e ⊔ Bris´e)
                         e                   e               a            e        e
                                                                        `
     Ce concept s’appuie sur la base de connaissances du Tableau ??. A titre d’exemples, l’axiome [Ax1] indique
qu’une Tarte est une Pr´parationCulinaire, l’axiome [Ax7], que Pomme et Noix sont des concepts incompa-
                           e
tibles (il n’existe pas d’objet qui soit a la fois une pomme et une noix) et l’axiome [Ax8], qu’une TarteSucr´e
                                         `                                                                   e
est une Tarte ayant au moins un ingr´dient qui soit un ProduitSucr´.
                                           e                               e

    Une base de connaissances BC en LD est g´ n´ ralement compos´ e de deux parties : une TBox et une ABox.
                                                 e e                  e
La TBox, ou base terminologique, est un ensemble d’axiomes terminologiques, qui peuvent etre de la forme C ⊑ D
                                                                                              ˆ
ou de la forme C ≡ D, C et D etant deux concepts. La ABox est un ensemble d’assertions qui peuvent etre de la
                              ´                                                                            ˆ
forme C(a) ou r(a, b) o` a et b sont deux instances, C est un concept et r est un rˆ le. Le premier type d’assertion
                       u                                                            o
correspond a une instanciation de concept, le second, a une instanciation de rˆ le.
            `                                         `                       o


4.2   OWL : Web Ontology Language
    OWL est une recommendation du W3C qui a et´ adopt´ par un grand nombre d’utilisateur comme le principal
                                                  ´e e
langage de repr´ sentation de connaissances [15].
               e




                                     F IG . 3 – Le “Semantic Web Layer Cake”.


     OWL est bas´ sur RDF lui mˆ me bas´ sur XML. Le language RDF permet de repr´ senter des triplets <Sujet,
                 e               e       e                                              e
Pr´ dicat, Objet>. Le language OWL contient, en plus, une s´ ntique standard qui facilite les possiblit´ s de raison-
   e                                                           e                                       e
nement. Le Tableau 1 pr´ sente la correspondance ente les op´ rateurs de LD et les mots cl´ s de OWL.
                         e                                     e                           e
N.B. : Alors qu’en LD on parle de concept, rˆ le et instance, en OWL, on parle respectivement de classe, propri´ t´
                                            o                                                                     ee
et individu.

                                                          4
nom                 syntaxe LD      syntaxe abstraite           s´ mantique
                                                                     e
    Nom de classe            C          C (URI)                     CI ⊆ ∆I
    Top, Thing               ⊤          owl:Thing                   ⊤I = ∆I
    Bottom, Nothing          ⊥          owl:Nothing                 ⊥I = ∅
    Intersection           C⊓D          intersectionOf(C D)         (C ⊓ D)I = CI ∩ DI
    Union                  C⊔D          unionOf(C D)                (C ⊔ D)I = CI ∪ DI
    N´ gation
      e                     ¬C          complementOf(C)             (¬C)I = ∆I  CI
    Enum´ ration
           e             {a, b . . .}   oneOf(a b . . . )           {a, b . . .}I = {aI , bI . . .}
    Quantificateur          ∃p.C         restriction(p               (∃p.C)I = {x|∃y, (x, y) ∈ pI
        existentiel                       someValuesFrom(C))                                         et y ∈ CI }
    Quantificateur          ∀p.C         restriction(p               (∀p.C)I = {x|si ∀y, (x, y) ∈ pI
        universel                           allValuesFrom(C))                                       alors y ∈ CI }
    Restriction a`         ∋ p.a        restriction(p               (∋ p.a)I = {x|(x, aI ) ∈ pI }
        une valeur                                hasValue(a))
                           =np          restriction(p               (= n p)I = {x| card{y|(x, y) ∈ pI } = n}
    Restriction                               cardinality(C))
      non qualifi´ e
                 e            np        restriction(p               (   n p)I = {x| card{y|(x, y) ∈ pI }       n}
      de cardinalit´
                   e                      minCardinality(C))
                              np        restriction(p               (   n p)I = {x| card{y|(x, y) ∈ pI }       n}
                                          maxCardinality(C))
    Quantificateur          ∃d.T         restriction(d               (∃d.T)I = {x|∃y, (x, y) ∈ dI
      existentiel                         someValuesFrom(T ))                                   ∧ y ∈ TD }
    Quantificateur          ∀d.T         restriction(d               (∀d.T)I = {x|∀y, (x, y) ∈ dI
      universel                             allValuesFrom(T ))                                 → y ∈ TD }
    Restriction a
                `          ∋ d.a        restriction(d               (∋ d.a)I = {x|(x, aD ) ∈ dI }

      une valeur                                  hasValue(a))
                           =nd          restriction(d               (= n d)I = {x| card{y|(x, y) ∈ dI } = n}
    Restriction                               cardinality(T ))
      non qualifi´ e
                 e            nd        restriction(d               (   n d)I = {x| card{y|(x, y) ∈ dI }       n}
      de cardinalit´
                   e                      minCardinality(T ))
                              nd        restriction(d               (   n d)I = {x| card{y|(x, y) ∈ dI }       n}
                                          maxCardinality(T ))

TAB . 1 – Constructeurs de classes OWL et leur correspondances en LD. C et D sont des classes, T est un type de
donn´ e, n est un nombre, a et b sont des individus, p une propri´ t´ d’objet (ObjectProperty) et d une propri´ t´ de
     e                                                           ee                                           ee
donn´ es (DatatypeProperty).
     e



 (Ax1) Tarte ⊑ Pr´parationCulinaire
                 e                                      (Ax7) Pomme ⊓ Noix ⊑⊥
 (Ax2) Dessert ⊑ Pr´parationCulinaire
                   e                                    (Ax8) TarteSucr´e ≡ Tarte⊓∃ingr´dient.ProduitSucr´e
                                                                         e              e                e
 (Ax3) ProduitSucr´ ⊑ Produit
                   e                                    (Ax9) TarteSal´e ≡ Tarte ⊓ ¬TarteSucr´e
                                                                       e                     e
 (Ax4) Fruit ⊑ ProduitSucr´
                          e                             (Ax10) TarteSucr´e ⊑ Dessert
                                                                         e
 (Ax5) Pomme ⊑ Fruit
 (Ax6) Noix ⊑ Fruit
                                 (a)TBox
 (A1) (Tarte ⊓ ∃ingr´dient.Pomme)(tarte1)
                     e                                  (A3)    ingr´dient(tarte1,noix1)
                                                                    e
 (A2) Noix(noix1)
                                 (b)ABox

                                  TAB . 2 – Une base de connaissance ecrite en LD.
                                                                     ´



                                                         5
Les deux principaux outils pour construire des ontologies OWL sont :
Prot´ g´ -OWL : D´ velopp´ en Java par l’Universit´ de Stanford. Disponible gratuitement [12].
    e e          e       e                        e
Swoop : D´ velopp´ en Java par le MINDSWAP (Maryland Information and Network Dynamics Lab Semantic
         e       e
    Web Agents Project). Disponible gratuitement [17].
      D´ mo : construction d’une ontologie avec Prot´ g´ qui correspond a la BC de l’exemple.
       e                                            e e                 `

4.3     Les m´ canismes de raisonnement
             e
   les principaux type de raisonnement
   – V´ rification de la coh´ rence (consistency checking)
        e                    e
   – Classification de concepts
   – Classification d’instances
   D´ mo : les mechanismes de raisonnement avec Prot´ g´ .
     e                                                   e e
Remarque importante : Les LD, et par cons´ quent les ontologies ecrites en OWL, s’appuient sur l’hypoth` se du
                                             e                      ´                                         e
monde ouvert. Cela signifie que si une relation entre deux concepts (ou un concept et une instance) n’est pas
connue/d´ duite par la base de connaissance, ce n’est pas pour autant que celle ci n’existe pas. Prenons un exemple.
         e
Supposons qu’on ait l’ABox suivante :

                         estParentDe(anakine, luke)           estParentDe(padm´, leia)
                                                                              e

et une TBox vide. On cherche a savoir si Anakine est un des parents de Leila en faisant le test
                                     `
  BC estParentDe(anakine, leila). La r´ ponse a ce test est faux : il existe des mod` les I de BC pour lesquels
                                          e        `                                e
(anakine I , leiaI )    ∈    estParentDe   I . En revanche, il existe des mod` les I pour lesquels
                                                                                       e
(anakineI , leiaI ) ∈ estParentDeI . Autrement dit, une r´ ponse n´ gative a ce test de subsomption indique
                                                               e      e       `
simplement que le syst` me ignore si Anakine est le p` re de Leia.
                      e                              e


5      Les applications des ontologies
5.1     Le Web S´ mantique
                e
     Le Web S´ mantique est souvent pr´ sent´ comme une “vision” de Tim Berners Lee. Le Web S´ mantique est
                e                         e    e                                                      e
une extension du Web actuel pour lequel le contenu du Web peut non seulement etre exprim´ en langage naturel,
                                                                                   ˆ          e
mais egalement en un format qui peut etre lu et utilis´ par des agents logiciels pour permettre de trouver, partager
      ´                                  ˆ            e
et int´ grer de l’information plus facilement.
      e
Par exemple, trouver des pages Web qui parlent d’un certain M. Fish qui travaille dans une entreprise qui construit
des tanks.

5.2     La classification automatique
    La mise en oeuvre de m´ canismes de raisonnement sur des bases de connaissances peut tirer parti de la
                             e
s´ mantique disponible dans une ontologies pour classifier de mani` re automatique des instances en fonction de
 e                                                                  e
leur propri´ t´ s.
           ee
Exemple de classification de proteines en familles et sous-familles en fonction de leur domaines.

5.3     L’int´ gration de donn´ es
             e                e
    L’int´ gration de donn´ es est une probl` matique majeur en informatique. Les ontologies sont des outils parti-
          e                e                 e
culi´ rment interessants pour reconcilier les repr´ sentations h´ t´ rog` nes des donn´ es. Comme elles proposent une
    e                                             e             ee e                  e
s´ mantique en plus des donn´ es (des donn´ es aux connaissances) il existe des m´ canismes qui proposent d’iden-
 e                            e              e                                        e
tifier les choses identiques.
Exemples.


                                                         6
6     L’alignement d’ontologies
    Il est crucial de disposer de m´ thodes pour articuler les diff´ rentes ontologies ensembles car :
                                   e                               e
1) Il n’existe pas une ontologie unique de l’univers. Il existe des ontologies pour des petites parties de l’univers.
2) Il n’existe pas d’ontologie universelle pour un domaine. Il doit pouvoir exister plusieurs visions d’un mˆ me e
domaine.

6.1   D´ finitions
       e
La correspondance Soit deux ontologies O et O′ , une correspondance M entre O et O′ est un quintuplet :
     < id, e, e′ , R, n > tel que :
     – id est un identifiant unique de l’´ lement de mapping,
                                           e
     – e et e ′ sont des entit´ s de O et O ′ (des concepts ou des rˆ les par exemple),
                              e                                     o
     – R est une relation (par exemple d’´ quivalence (≡) ; de g´ n´ ralisation ( ⊒ ) ; de sp´ cialisation (⊑) ; de
                                                e                      e e                   e
        disjonction (⊥)),
     – n est une mesure de confiance contenue dans une structure math´ matique (typiquement dans l’intervalle
                                                                              e
        [0,1]).
L’alignement Soit deux ontologies O et O′ , l’alignement A entre O et O′ est :
      – Un ensemble de correspondances entre O et O′ ,
      – Associ´ es a une multiplicit´ : 1-1, 1-*, etc.
              e `                   e
      – Associ´ es a des meta-donn´ es additionelles (une m´ thode, une date, des propri´ t´ s, etc.)
              e `                   e                      e                            ee
Le processus d’alignement. Il peut etre vu comme une fonction f qui, a partir de deux ontologies O et O′ , un
                                    ˆ                                  `
     alignement de d´ part A, un ensemble p de param` tres et un ensemble e de sources d’informations externes,
                    e                               e
     donne un alignement A′ entre ces deux ontologies :

                                                  A’ = f (O, O′ , A, p, e)

6.2   Techniques de bases
    Nous distinguons les techniques dont l’objectif est d’´ tablir un alignement entre deux ontologies en fonction
                                                             e
de deux choses :
    – est-ce que les elements compar´ s sont consid´ r´ s comme deux elements isol´ s ou comme deux parties d’une
                     ´               e             ee                   ´          e
      structure plus grande ?
    – quelle est le type d’information qui va nous permettre de d´ terminer la similarit´ entre les elements : la
                                                                     e                    e          ´
      syntaxe, une source d’information externe, ou la s´ mantique ?
                                                           e
En fonction de ces deux informations la classification suivante peut etre propos´ e :
                                                                      ˆ         e

                 e           ´
Techniques fond´ es sur les elements isol´ s
                                         e
     – Techniques syntaxiques
       – Techniques fond´ es sur les chaˆnes de caract` res
                            e            ı              e
       – Techniques fond´ es sur le langage
                            e
       – Techniques a base de contraintes
                       `
     – Techniques utilisant des sources externes
       – des ressources linguistiques : lexiques, th´ saurus
                                                    e
       – r´ utilisation d’alignements
          e
       – d’ontologies : upper-level ou domain-specific ontologies
Techniques fond´ es sur la structure
                 e
     – Techniques syntaxiques
       – Techniques fond´ es sur l’analyse de donn´ es et les statistiques : fr´ quence de distribution
                            e                       e                          e
       – Techniques fond´ es sur les graphes : recherche d’homomorphismes, de chemins
                            e
       – Techniques fond´ es sur des taxonomies
                            e
     – Techniques utilisant des sources externes

                                                          7
– Techniques fond´ es sur des librairies de structures
                            e
        – Techniques s´ mantiques
                      e
          – Techniques fond´ es sur le mod` le des donn´ es : m´ canismes de raisonement en LD
                            e              e             e       e

6.3     Les strat´ gies d’alignement
                 e
     En pratique, aucune des techniques de bases pr´ sent´ es ci-dessus n’est appliqu´ e seule. Elles sont combin´ es
                                                      e   e                           e                          e
comme des briques de bases pour d´ finir une strat´ gie d’alignement fonction de l’objectif.
                                      e             e
L’int´ gration de diff´ rentes correspondances entre de mˆ mes entit´ es ainsi que la combinaison des correspon-
      e               e                                     e          e
dances pour constituer l’alignement global n´ cessite de mettre en œuvre des m´ thodes particuli` res.
                                               e                                 e                 e
     Aucune strat´ gie d’alignement n’est appliqu´ e de facon purement automatique. l’expert du domaine doit tou-
                  e                               e       ¸
jours valider les correspondances. Ceci est d’autant plus crucial lorsque des donn´ es sont critiques comme c’est le
                                                                                   e
cas dans le domaine biom´ dical.
                            e
Il existe de nombreux travaux et outils proposant des processus diff´ rents pour l’alignement [3].
                                                                      e
Par exemple, Prompt [11] se pr´ sente sous la forme d’un plug-in de Prot´ g´ qui prends en entr´ e 2 ontologies et
                                  e                                        e e                     e
propose a l’utilisateur de valider les correspondances d’un alignement automatiquement g´ n´ r´ .
          `                                                                                  e ee
D´ mo de Prompt.
  e


7      Pour aller plus loin
      Jetez un coup d’oeil a la bibliographie.
                           `


Bibliographie
[1] Baader (F.), Calvanese (D.), McGuinness (D.), Nardi (D.) et Patel-Schneider (P.). – The description logic
    handbook. Cambridge, UK, Cambridge University Press, 2003.
[2] Dieng (R.), Olivier Corby (O.), Giboin (A.) et Ribi` re (M.). – Methods and Tools for Corporate Knowledge
                                                       e
    Management. Rapport de recherche nRR 3314, INRIA, 1997.
[3] Euzenat (J.) et Shvaiko (P.). – Ontology matching. Heidelberg, DE, Springer-Verlag, 2007.
[4] Gruber (T.). – Towards Principles for the Design of Ontologies Used for Knowledge Sharing. Formal Ontology
    in Conceptual Analysis and Knowledge Representation, Kluwer Academic Publishers, 1993.
[5] Doan (A.) et Halevy (A.). – Semantic Integration Research in the Database Community : A Brief Survey . AI
    Magazine, Special Issue on Semantic Integration, 2005.
[6] Lassila (O.) et McGuinness (D.). – The Role of Frame-Based Representation on the Semantic Web. Electronic
    Transactions on Artificial Intelligence 6(5) :1403-2031, 2001.
[7] Napoli (A.). – Une introduction aux logiques de descriptions. Rapport de recherche nRR 3314, INRIA, 1997.
[8] OBO Foundry – [http ://www.obofoundry.org].
[9] Ontology Lookup Service – [http ://www.ebi.ac.uk/ontology-lookup/].
[10] Ontology Matching – [http ://www.ontologymatching.org/index.html].
[11] Prompt – [http ://protege.stanford.edu/plugins/prompt/prompt.html].
[12] Prot´ g´ – [http ://protege.stanford.edu/].
         e e
[13] Knowledge Web – [http ://knowledgeweb.semanticweb.org/].
[14] European Association for Semantic Web Education – [http ://ease.semanticweb.org/].
[15] OWL : Recommendation du W3C en francais – [http ://www.yoyodesign.org/doc/w3c/owl-ref-20040210/].
                                        ¸
[16] Swoogle Semantic Web Search Engine – [http ://swoogle.umbc.edu/index.php].
[17] Swoop – [http ://code.google.com/p/swoop/].


                                                         8

Contenu connexe

Tendances

Génération automatique de questions à partir de textes en français
Génération automatique de questions à partir de textes en françaisGénération automatique de questions à partir de textes en français
Génération automatique de questions à partir de textes en françaislouisdv
 
Cours statistique descriptive
Cours statistique descriptiveCours statistique descriptive
Cours statistique descriptiveMouna Ettahiri
 
Les moteurs physiques en temps réel
Les moteurs physiques en temps réelLes moteurs physiques en temps réel
Les moteurs physiques en temps réelSteren Giannini
 
Polycope java enseignant
Polycope java enseignantPolycope java enseignant
Polycope java enseignanthnsfr
 
εκπαιδευτικό σενάριο Σύνθεση - Aνάλυση - Ισορροπία δυνάμεων
εκπαιδευτικό σενάριο Σύνθεση  - Aνάλυση - Ισορροπία δυνάμεωνεκπαιδευτικό σενάριο Σύνθεση  - Aνάλυση - Ισορροπία δυνάμεων
εκπαιδευτικό σενάριο Σύνθεση - Aνάλυση - Ισορροπία δυνάμεωνChristos Gotzaridis
 
Chapitre5
Chapitre5Chapitre5
Chapitre5printif
 
Sout3
Sout3Sout3
Sout33on
 
Cours processus- production
Cours processus- productionCours processus- production
Cours processus- productionAmine Chahed
 
Annexes Logiciel Pl7
Annexes Logiciel Pl7Annexes Logiciel Pl7
Annexes Logiciel Pl7youri59490
 

Tendances (19)

Génération automatique de questions à partir de textes en français
Génération automatique de questions à partir de textes en françaisGénération automatique de questions à partir de textes en français
Génération automatique de questions à partir de textes en français
 
Analyse s1
Analyse s1Analyse s1
Analyse s1
 
Autisme et practiques
Autisme et practiquesAutisme et practiques
Autisme et practiques
 
Cours statistique descriptive
Cours statistique descriptiveCours statistique descriptive
Cours statistique descriptive
 
cours-plaques
cours-plaquescours-plaques
cours-plaques
 
Les moteurs physiques en temps réel
Les moteurs physiques en temps réelLes moteurs physiques en temps réel
Les moteurs physiques en temps réel
 
Analyse numérique
Analyse numériqueAnalyse numérique
Analyse numérique
 
Mmc
MmcMmc
Mmc
 
Polycope java enseignant
Polycope java enseignantPolycope java enseignant
Polycope java enseignant
 
Cours java-swingpdf
Cours java-swingpdfCours java-swingpdf
Cours java-swingpdf
 
defour phd
defour phddefour phd
defour phd
 
C66
C66C66
C66
 
εκπαιδευτικό σενάριο Σύνθεση - Aνάλυση - Ισορροπία δυνάμεων
εκπαιδευτικό σενάριο Σύνθεση  - Aνάλυση - Ισορροπία δυνάμεωνεκπαιδευτικό σενάριο Σύνθεση  - Aνάλυση - Ισορροπία δυνάμεων
εκπαιδευτικό σενάριο Σύνθεση - Aνάλυση - Ισορροπία δυνάμεων
 
Chapitre5
Chapitre5Chapitre5
Chapitre5
 
Sout3
Sout3Sout3
Sout3
 
Krigeage
KrigeageKrigeage
Krigeage
 
Cours processus- production
Cours processus- productionCours processus- production
Cours processus- production
 
Bclogo Doc
Bclogo DocBclogo Doc
Bclogo Doc
 
Annexes Logiciel Pl7
Annexes Logiciel Pl7Annexes Logiciel Pl7
Annexes Logiciel Pl7
 

En vedette

2008 Mg Banquet
2008 Mg Banquet2008 Mg Banquet
2008 Mg Banquetdwhanusi
 
Crééz une carte Google
Crééz une carte GoogleCrééz une carte Google
Crééz une carte GoogleAEPHR
 
Quelle est la nature des services d’information au développement
Quelle est la nature des services d’information au développementQuelle est la nature des services d’information au développement
Quelle est la nature des services d’information au développementl_sergeant
 
Tribus De L Omo
Tribus De L OmoTribus De L Omo
Tribus De L OmoBrigitteP
 
OJD de la PHR 2009
OJD de la PHR 2009OJD de la PHR 2009
OJD de la PHR 2009AEPHR
 
Conf web & creation 2012 CCI de Lyon
Conf web & creation 2012 CCI de LyonConf web & creation 2012 CCI de Lyon
Conf web & creation 2012 CCI de Lyoncharlenemarliac
 
Peintures Sur Chats
Peintures Sur ChatsPeintures Sur Chats
Peintures Sur ChatsBrigitteP
 
L' Art Gourmand, le chocolat
L' Art Gourmand, le chocolatL' Art Gourmand, le chocolat
L' Art Gourmand, le chocolatBrigitteP
 
The Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaThe Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaChris Lema
 

En vedette (9)

2008 Mg Banquet
2008 Mg Banquet2008 Mg Banquet
2008 Mg Banquet
 
Crééz une carte Google
Crééz une carte GoogleCrééz une carte Google
Crééz une carte Google
 
Quelle est la nature des services d’information au développement
Quelle est la nature des services d’information au développementQuelle est la nature des services d’information au développement
Quelle est la nature des services d’information au développement
 
Tribus De L Omo
Tribus De L OmoTribus De L Omo
Tribus De L Omo
 
OJD de la PHR 2009
OJD de la PHR 2009OJD de la PHR 2009
OJD de la PHR 2009
 
Conf web & creation 2012 CCI de Lyon
Conf web & creation 2012 CCI de LyonConf web & creation 2012 CCI de Lyon
Conf web & creation 2012 CCI de Lyon
 
Peintures Sur Chats
Peintures Sur ChatsPeintures Sur Chats
Peintures Sur Chats
 
L' Art Gourmand, le chocolat
L' Art Gourmand, le chocolatL' Art Gourmand, le chocolat
L' Art Gourmand, le chocolat
 
The Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaThe Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris Lema
 

Similaire à . Poly ac.dvi

Similaire à . Poly ac.dvi (20)

Jmc habile
Jmc habileJmc habile
Jmc habile
 
Langage c
Langage cLangage c
Langage c
 
Maaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stageMaaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stage
 
Resolution de F(X) = 0 SIDIBE Ali
Resolution de F(X) = 0 SIDIBE AliResolution de F(X) = 0 SIDIBE Ali
Resolution de F(X) = 0 SIDIBE Ali
 
Facteur re
Facteur reFacteur re
Facteur re
 
Guide projet Iset
Guide projet IsetGuide projet Iset
Guide projet Iset
 
Extraction de sous-trajectoires d’abeilles.pdf
Extraction de sous-trajectoires d’abeilles.pdfExtraction de sous-trajectoires d’abeilles.pdf
Extraction de sous-trajectoires d’abeilles.pdf
 
Poly
PolyPoly
Poly
 
cours de Matlab
 cours de Matlab cours de Matlab
cours de Matlab
 
Rapport
RapportRapport
Rapport
 
courspython3.pdf
courspython3.pdfcourspython3.pdf
courspython3.pdf
 
Conception bd 2
Conception bd 2Conception bd 2
Conception bd 2
 
Les serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
Les serious games - Mémoire de master en Sc. Educ de Bernard LamaillouxLes serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
Les serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
 
dugas-phd
dugas-phddugas-phd
dugas-phd
 
Arbelaez these
Arbelaez theseArbelaez these
Arbelaez these
 
Deep Learning : Application à la reconnaissance d’objets de classes multiples...
Deep Learning : Application à la reconnaissance d’objets de classes multiples...Deep Learning : Application à la reconnaissance d’objets de classes multiples...
Deep Learning : Application à la reconnaissance d’objets de classes multiples...
 
Cours ensembles
Cours ensemblesCours ensembles
Cours ensembles
 
Recherche de citations
Recherche de citationsRecherche de citations
Recherche de citations
 
Coursdethermodynamique
CoursdethermodynamiqueCoursdethermodynamique
Coursdethermodynamique
 
Rapport de stage
Rapport de stageRapport de stage
Rapport de stage
 

. Poly ac.dvi

  • 1. Ontologies et alignement d’ontologies : notes de cours Adrien Coulet (inspir´ des cours de R. Dieng, J. Euzenat, A. G´ mez-P´ rez, J. Lieber et A. Napoli) e o e derni` re version : 19/11/07 e (version pr´ liminaire) e Table des mati` res e 1 Introduction 1 2 Les ontologies 2 2.1 D´ finitions . . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.2 Origine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.3 Les diff´ rents types d’ontologies e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.4 Le partage d’ontologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 Les m´ thodes de construction e 3 4 Les languages de repr´ sentation e 3 4.1 Les logiques de descriptions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4.2 OWL : Web Ontology Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4.3 Les m´ canismes de raisonnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 6 5 Les applications des ontologies 6 5.1 Le Web S´ mantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 6 5.2 La classification automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 5.3 L’int´ gration de donn´ es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e e 6 6 L’alignement d’ontologies 7 6.1 D´ finitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 7 6.2 Techniques de bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 6.3 Les strat´ gies d’alignement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 8 7 Pour aller plus loin 8 1 Introduction Ce cours est une br` ve pr´ sentation des ontologies et notamment des ontologies OWL, format recommend´ e e e par le W3C pour le Web S´ mantique. Nous evoquerons les principales applications des ontologies, ainsi que e ´ l’alignement d’ontologies comme enjeu principal au d´ veloppement de ces applications. e 1
  • 2. 2 Les ontologies 2.1 D´ finitions e En philosophie l’ontologie est une branche de la m´ taphysique qui s’int´ resse a l’´ tude des propri´ t´ s de l’ˆ tre e e ` e ee e (au sens de ce qui existe). En informatique une ontologie est une repr´ sentation de connaissances. Une d´ finition plus explicite est : e e “Une ontologie est une specification formelle et explicite d’une conceptualisation partag´ e” [4]. e – Sp´ cification formelle : compr´ hensible par une machine, e e – Sp´ cification explicite : les concepts, relations, fonctions, contraintes, axiomes sont explicitement d´ finis, e e – Partag´ e : les connaissances repr´ sent´ es sont partag´ es par une communaut´ , e e e e e – Conceptualisation : mod` le abstrait d’une partie du monde que l’on veut repr´ senter. e e Plus formellement une ontologie O est un syst` me de symboles consistant en : e – Un ensemble Sc de concepts, et un ensemble Sr de relation binaires (D,R), entre domaines et co-domaines (qui sont deux sous-ensembles de Sc ) N.B. : Un concept repr´ sente un ensemble (fini ou infini). Ainsi le concept de chat noir repr´ sente (intui- e e tivement) l’ensemble de tous les chats noirs. – Une hierarchie H, o` les concepts et relations sont hi´ rarchiquement reli´ s par la relation de subsomption, u e e i.e. une relation d’ordre partiel not´ ⊑ , o` C1 ⊑ C2 signifie que C1 est un sous-concept de C2 , et r1 ⊑ r2 e u signifie que r1 est une sous-relation de r2 . – Un ensemble d’axiomes A qui introduisent les concepts et les relations. 2.2 Origine L’´ mergence de la notion d’ontologie en informatique r´ sulte en partie des travaux de recherches en intelli- e e gence artificielle. Comment formaliser des connaissances pour qu’elles puissent etre interpr´ t´ es par les machines ˆ ee est une probl´ matique centrale de ce domaine qui a motiv´ de nombreux travaux sur les repr´ sentations par objets. e e e L’utilisation conjointe des syst` mes a bases d’objets et de logiques a men´ a la constitution d’ontologies formelles. e ` e` Depuis 2001, l’´ mulation autour du Web S´ mantique participe au d´ veloppement de standards pour les ontologies e e e et a la multiplication de leur utilisation. ` 2.3 Les diff´ rents types d’ontologies e – Lightweight Ontologies vs. Heavyweight Ontologies. Voir Figure 1. F IG . 1 – Classification de Lassila et McGuinness [6]. – Task Ontology vs Domain Ontology 2
  • 3. – Representation ⇒ Generic ⇒ Domain ⇒ Application Ontologies Equilibre entre utilisabilit´ et r´ utilisabilit´ : lors de la construction ou du choix d’une ontologie, il est im- e e e portant d’avoir a l’esprit que plus le niveau d’abstraction choisi est proche de l’application moins l’ontologie ` est r´ utilisable, mais plus elle est utilisable. e 2.4 Le partage d’ontologies Une caract´ ristique principales des ontologies est de devoir etre disponible, pour pouvoir (1) etre partag´ es par e ˆ ˆ e une communaut´ et (2) etre accessibles aux machines. e ˆ Selon leur d´ finition, les ontologies doivent correspondre a une conceptualisation paratag´ e par une commu- e ` e naut´ . Pour cela, il existe des biblioth` ques d’ontologies qui permettent le partage d’ontologies et servent de e e support a un affinement communautaire des conceptualisations de mani` re collaborative. Par exemple, les ontolo- ` e gies biom´ dicales sont partag´ es sur le site OBO Foundry [8] qui regroupe des ontologies concernant diff´ rents e e e domaines de la biologie (comme Gene Ontology pour les fonctions des g` nes, Disease Ontology pour les mala- e dies) afin de permettre leur raffinement et leur validation. Il existe par ailleurs, des outils comme Swoogle [16] ou Ontology Lookup Service [9] qui sont des moteurs de recherche qui indexent les concepts inclus dans les ontologies disponibles pour favoriser la r´ utilisation des ontologies existantes. e 3 Les m´ thodes de construction e Diff´ rentes m´ thodes de construction d’ontologies ont et´ propos´ es (par exemple : METHONTOLOGY, e e ´e e NeOn). Elles s’inspirent des m´ thodes de d´ veloppement logiciel (voir Figure 2) [2]. Avec notamment : e e – Une phase de conceptualisation men´ e en etroite collaboration avec des experts du domain repr´ sent´ . La e ´ e e conceptualisation peut se faire a l’aide des m´ thodes de mod´ lisation comme l’UML ou les Ontology Design ` e e Patterns. – Une phase d’´ valuation. e – Un cycle pour perp´ tuellement am´ liorer les ontologies. e e F IG . 2 – Cycle de vie d’une ontologie [2]. 4 Les languages de repr´ sentation e 4.1 Les logiques de descriptions les logiques de descriptions (LD) sont des langages de repr´ sentation de connaissances classiques dont le e formalisme s’appuye sur les notions de concepts, de rˆ le et d’instance. o 3
  • 4. Les LD sont apparent´ es, en particulier, aux formalismes de repr´ sentation des connaissances par objets. La e e s´ mantique d’une telle logique s’exprime grˆ ce a des notions ensemblistes. e a ` Ainsi, etant donn´ une interpr´ tation I, un concept C s’interpr` te comme un ensemble I (C), un rˆ le r s’in- ´ e e e o terpr` te comme une relation binaire e I (r) et une instance a comme un individu I (a). Les op´ rations ∩, ∪, etc., sur les ensembles sont repr´ sent´ s par les connecteurs ⊓, ⊔, etc., sur les concepts. e e e Par exemple, etant donn´ deux concepts C et D et une interpr´ tation I, on a (C ⊓ D)I () =I (C) ∩I (D). ´ e e Il existe plusieurs LD dont les diff´ rences sont de poss´ der plus ou moins de constructeurs et de type d’axiomes. e e Nous pr´ sentons dans le Tableau 1 les principaux constructeurs des LD.La logique qui est contenue dans le langage e OWL (OWL DL pour etre exact) est SHOIN (D). ˆ ⊤ et ⊥ sont deux concepts particuliers repr´ sentant respectivement le concept le plus g´ n´ ral et le concept e e e insatisfiable (qui est aussi le concept le plus sp´ cifique). e Par exemple, le concept “ tarte aux pommes et aux noix dont toutes les pˆ tes sont feuillet´ es ou bris´ es (elle a e e peut ne pas avoir de pˆ te, en avoir 1, 2, etc.) ” peut etre repr´ sent´ sous la forme suivante en LD : a ˆ e e Tarte ⊓ ∃ingr´dient.Pomme ⊓ ∃ingr´dient.Noix ⊓ ∀p^te.(Feuillet´e ⊔ Bris´e) e e a e e ` Ce concept s’appuie sur la base de connaissances du Tableau ??. A titre d’exemples, l’axiome [Ax1] indique qu’une Tarte est une Pr´parationCulinaire, l’axiome [Ax7], que Pomme et Noix sont des concepts incompa- e tibles (il n’existe pas d’objet qui soit a la fois une pomme et une noix) et l’axiome [Ax8], qu’une TarteSucr´e ` e est une Tarte ayant au moins un ingr´dient qui soit un ProduitSucr´. e e Une base de connaissances BC en LD est g´ n´ ralement compos´ e de deux parties : une TBox et une ABox. e e e La TBox, ou base terminologique, est un ensemble d’axiomes terminologiques, qui peuvent etre de la forme C ⊑ D ˆ ou de la forme C ≡ D, C et D etant deux concepts. La ABox est un ensemble d’assertions qui peuvent etre de la ´ ˆ forme C(a) ou r(a, b) o` a et b sont deux instances, C est un concept et r est un rˆ le. Le premier type d’assertion u o correspond a une instanciation de concept, le second, a une instanciation de rˆ le. ` ` o 4.2 OWL : Web Ontology Language OWL est une recommendation du W3C qui a et´ adopt´ par un grand nombre d’utilisateur comme le principal ´e e langage de repr´ sentation de connaissances [15]. e F IG . 3 – Le “Semantic Web Layer Cake”. OWL est bas´ sur RDF lui mˆ me bas´ sur XML. Le language RDF permet de repr´ senter des triplets <Sujet, e e e e Pr´ dicat, Objet>. Le language OWL contient, en plus, une s´ ntique standard qui facilite les possiblit´ s de raison- e e e nement. Le Tableau 1 pr´ sente la correspondance ente les op´ rateurs de LD et les mots cl´ s de OWL. e e e N.B. : Alors qu’en LD on parle de concept, rˆ le et instance, en OWL, on parle respectivement de classe, propri´ t´ o ee et individu. 4
  • 5. nom syntaxe LD syntaxe abstraite s´ mantique e Nom de classe C C (URI) CI ⊆ ∆I Top, Thing ⊤ owl:Thing ⊤I = ∆I Bottom, Nothing ⊥ owl:Nothing ⊥I = ∅ Intersection C⊓D intersectionOf(C D) (C ⊓ D)I = CI ∩ DI Union C⊔D unionOf(C D) (C ⊔ D)I = CI ∪ DI N´ gation e ¬C complementOf(C) (¬C)I = ∆I CI Enum´ ration e {a, b . . .} oneOf(a b . . . ) {a, b . . .}I = {aI , bI . . .} Quantificateur ∃p.C restriction(p (∃p.C)I = {x|∃y, (x, y) ∈ pI existentiel someValuesFrom(C)) et y ∈ CI } Quantificateur ∀p.C restriction(p (∀p.C)I = {x|si ∀y, (x, y) ∈ pI universel allValuesFrom(C)) alors y ∈ CI } Restriction a` ∋ p.a restriction(p (∋ p.a)I = {x|(x, aI ) ∈ pI } une valeur hasValue(a)) =np restriction(p (= n p)I = {x| card{y|(x, y) ∈ pI } = n} Restriction cardinality(C)) non qualifi´ e e np restriction(p ( n p)I = {x| card{y|(x, y) ∈ pI } n} de cardinalit´ e minCardinality(C)) np restriction(p ( n p)I = {x| card{y|(x, y) ∈ pI } n} maxCardinality(C)) Quantificateur ∃d.T restriction(d (∃d.T)I = {x|∃y, (x, y) ∈ dI existentiel someValuesFrom(T )) ∧ y ∈ TD } Quantificateur ∀d.T restriction(d (∀d.T)I = {x|∀y, (x, y) ∈ dI universel allValuesFrom(T )) → y ∈ TD } Restriction a ` ∋ d.a restriction(d (∋ d.a)I = {x|(x, aD ) ∈ dI } une valeur hasValue(a)) =nd restriction(d (= n d)I = {x| card{y|(x, y) ∈ dI } = n} Restriction cardinality(T )) non qualifi´ e e nd restriction(d ( n d)I = {x| card{y|(x, y) ∈ dI } n} de cardinalit´ e minCardinality(T )) nd restriction(d ( n d)I = {x| card{y|(x, y) ∈ dI } n} maxCardinality(T )) TAB . 1 – Constructeurs de classes OWL et leur correspondances en LD. C et D sont des classes, T est un type de donn´ e, n est un nombre, a et b sont des individus, p une propri´ t´ d’objet (ObjectProperty) et d une propri´ t´ de e ee ee donn´ es (DatatypeProperty). e (Ax1) Tarte ⊑ Pr´parationCulinaire e (Ax7) Pomme ⊓ Noix ⊑⊥ (Ax2) Dessert ⊑ Pr´parationCulinaire e (Ax8) TarteSucr´e ≡ Tarte⊓∃ingr´dient.ProduitSucr´e e e e (Ax3) ProduitSucr´ ⊑ Produit e (Ax9) TarteSal´e ≡ Tarte ⊓ ¬TarteSucr´e e e (Ax4) Fruit ⊑ ProduitSucr´ e (Ax10) TarteSucr´e ⊑ Dessert e (Ax5) Pomme ⊑ Fruit (Ax6) Noix ⊑ Fruit (a)TBox (A1) (Tarte ⊓ ∃ingr´dient.Pomme)(tarte1) e (A3) ingr´dient(tarte1,noix1) e (A2) Noix(noix1) (b)ABox TAB . 2 – Une base de connaissance ecrite en LD. ´ 5
  • 6. Les deux principaux outils pour construire des ontologies OWL sont : Prot´ g´ -OWL : D´ velopp´ en Java par l’Universit´ de Stanford. Disponible gratuitement [12]. e e e e e Swoop : D´ velopp´ en Java par le MINDSWAP (Maryland Information and Network Dynamics Lab Semantic e e Web Agents Project). Disponible gratuitement [17]. D´ mo : construction d’une ontologie avec Prot´ g´ qui correspond a la BC de l’exemple. e e e ` 4.3 Les m´ canismes de raisonnement e les principaux type de raisonnement – V´ rification de la coh´ rence (consistency checking) e e – Classification de concepts – Classification d’instances D´ mo : les mechanismes de raisonnement avec Prot´ g´ . e e e Remarque importante : Les LD, et par cons´ quent les ontologies ecrites en OWL, s’appuient sur l’hypoth` se du e ´ e monde ouvert. Cela signifie que si une relation entre deux concepts (ou un concept et une instance) n’est pas connue/d´ duite par la base de connaissance, ce n’est pas pour autant que celle ci n’existe pas. Prenons un exemple. e Supposons qu’on ait l’ABox suivante : estParentDe(anakine, luke) estParentDe(padm´, leia) e et une TBox vide. On cherche a savoir si Anakine est un des parents de Leila en faisant le test ` BC estParentDe(anakine, leila). La r´ ponse a ce test est faux : il existe des mod` les I de BC pour lesquels e ` e (anakine I , leiaI ) ∈ estParentDe I . En revanche, il existe des mod` les I pour lesquels e (anakineI , leiaI ) ∈ estParentDeI . Autrement dit, une r´ ponse n´ gative a ce test de subsomption indique e e ` simplement que le syst` me ignore si Anakine est le p` re de Leia. e e 5 Les applications des ontologies 5.1 Le Web S´ mantique e Le Web S´ mantique est souvent pr´ sent´ comme une “vision” de Tim Berners Lee. Le Web S´ mantique est e e e e une extension du Web actuel pour lequel le contenu du Web peut non seulement etre exprim´ en langage naturel, ˆ e mais egalement en un format qui peut etre lu et utilis´ par des agents logiciels pour permettre de trouver, partager ´ ˆ e et int´ grer de l’information plus facilement. e Par exemple, trouver des pages Web qui parlent d’un certain M. Fish qui travaille dans une entreprise qui construit des tanks. 5.2 La classification automatique La mise en oeuvre de m´ canismes de raisonnement sur des bases de connaissances peut tirer parti de la e s´ mantique disponible dans une ontologies pour classifier de mani` re automatique des instances en fonction de e e leur propri´ t´ s. ee Exemple de classification de proteines en familles et sous-familles en fonction de leur domaines. 5.3 L’int´ gration de donn´ es e e L’int´ gration de donn´ es est une probl` matique majeur en informatique. Les ontologies sont des outils parti- e e e culi´ rment interessants pour reconcilier les repr´ sentations h´ t´ rog` nes des donn´ es. Comme elles proposent une e e ee e e s´ mantique en plus des donn´ es (des donn´ es aux connaissances) il existe des m´ canismes qui proposent d’iden- e e e e tifier les choses identiques. Exemples. 6
  • 7. 6 L’alignement d’ontologies Il est crucial de disposer de m´ thodes pour articuler les diff´ rentes ontologies ensembles car : e e 1) Il n’existe pas une ontologie unique de l’univers. Il existe des ontologies pour des petites parties de l’univers. 2) Il n’existe pas d’ontologie universelle pour un domaine. Il doit pouvoir exister plusieurs visions d’un mˆ me e domaine. 6.1 D´ finitions e La correspondance Soit deux ontologies O et O′ , une correspondance M entre O et O′ est un quintuplet : < id, e, e′ , R, n > tel que : – id est un identifiant unique de l’´ lement de mapping, e – e et e ′ sont des entit´ s de O et O ′ (des concepts ou des rˆ les par exemple), e o – R est une relation (par exemple d’´ quivalence (≡) ; de g´ n´ ralisation ( ⊒ ) ; de sp´ cialisation (⊑) ; de e e e e disjonction (⊥)), – n est une mesure de confiance contenue dans une structure math´ matique (typiquement dans l’intervalle e [0,1]). L’alignement Soit deux ontologies O et O′ , l’alignement A entre O et O′ est : – Un ensemble de correspondances entre O et O′ , – Associ´ es a une multiplicit´ : 1-1, 1-*, etc. e ` e – Associ´ es a des meta-donn´ es additionelles (une m´ thode, une date, des propri´ t´ s, etc.) e ` e e ee Le processus d’alignement. Il peut etre vu comme une fonction f qui, a partir de deux ontologies O et O′ , un ˆ ` alignement de d´ part A, un ensemble p de param` tres et un ensemble e de sources d’informations externes, e e donne un alignement A′ entre ces deux ontologies : A’ = f (O, O′ , A, p, e) 6.2 Techniques de bases Nous distinguons les techniques dont l’objectif est d’´ tablir un alignement entre deux ontologies en fonction e de deux choses : – est-ce que les elements compar´ s sont consid´ r´ s comme deux elements isol´ s ou comme deux parties d’une ´ e ee ´ e structure plus grande ? – quelle est le type d’information qui va nous permettre de d´ terminer la similarit´ entre les elements : la e e ´ syntaxe, une source d’information externe, ou la s´ mantique ? e En fonction de ces deux informations la classification suivante peut etre propos´ e : ˆ e e ´ Techniques fond´ es sur les elements isol´ s e – Techniques syntaxiques – Techniques fond´ es sur les chaˆnes de caract` res e ı e – Techniques fond´ es sur le langage e – Techniques a base de contraintes ` – Techniques utilisant des sources externes – des ressources linguistiques : lexiques, th´ saurus e – r´ utilisation d’alignements e – d’ontologies : upper-level ou domain-specific ontologies Techniques fond´ es sur la structure e – Techniques syntaxiques – Techniques fond´ es sur l’analyse de donn´ es et les statistiques : fr´ quence de distribution e e e – Techniques fond´ es sur les graphes : recherche d’homomorphismes, de chemins e – Techniques fond´ es sur des taxonomies e – Techniques utilisant des sources externes 7
  • 8. – Techniques fond´ es sur des librairies de structures e – Techniques s´ mantiques e – Techniques fond´ es sur le mod` le des donn´ es : m´ canismes de raisonement en LD e e e e 6.3 Les strat´ gies d’alignement e En pratique, aucune des techniques de bases pr´ sent´ es ci-dessus n’est appliqu´ e seule. Elles sont combin´ es e e e e comme des briques de bases pour d´ finir une strat´ gie d’alignement fonction de l’objectif. e e L’int´ gration de diff´ rentes correspondances entre de mˆ mes entit´ es ainsi que la combinaison des correspon- e e e e dances pour constituer l’alignement global n´ cessite de mettre en œuvre des m´ thodes particuli` res. e e e Aucune strat´ gie d’alignement n’est appliqu´ e de facon purement automatique. l’expert du domaine doit tou- e e ¸ jours valider les correspondances. Ceci est d’autant plus crucial lorsque des donn´ es sont critiques comme c’est le e cas dans le domaine biom´ dical. e Il existe de nombreux travaux et outils proposant des processus diff´ rents pour l’alignement [3]. e Par exemple, Prompt [11] se pr´ sente sous la forme d’un plug-in de Prot´ g´ qui prends en entr´ e 2 ontologies et e e e e propose a l’utilisateur de valider les correspondances d’un alignement automatiquement g´ n´ r´ . ` e ee D´ mo de Prompt. e 7 Pour aller plus loin Jetez un coup d’oeil a la bibliographie. ` Bibliographie [1] Baader (F.), Calvanese (D.), McGuinness (D.), Nardi (D.) et Patel-Schneider (P.). – The description logic handbook. Cambridge, UK, Cambridge University Press, 2003. [2] Dieng (R.), Olivier Corby (O.), Giboin (A.) et Ribi` re (M.). – Methods and Tools for Corporate Knowledge e Management. Rapport de recherche nRR 3314, INRIA, 1997. [3] Euzenat (J.) et Shvaiko (P.). – Ontology matching. Heidelberg, DE, Springer-Verlag, 2007. [4] Gruber (T.). – Towards Principles for the Design of Ontologies Used for Knowledge Sharing. Formal Ontology in Conceptual Analysis and Knowledge Representation, Kluwer Academic Publishers, 1993. [5] Doan (A.) et Halevy (A.). – Semantic Integration Research in the Database Community : A Brief Survey . AI Magazine, Special Issue on Semantic Integration, 2005. [6] Lassila (O.) et McGuinness (D.). – The Role of Frame-Based Representation on the Semantic Web. Electronic Transactions on Artificial Intelligence 6(5) :1403-2031, 2001. [7] Napoli (A.). – Une introduction aux logiques de descriptions. Rapport de recherche nRR 3314, INRIA, 1997. [8] OBO Foundry – [http ://www.obofoundry.org]. [9] Ontology Lookup Service – [http ://www.ebi.ac.uk/ontology-lookup/]. [10] Ontology Matching – [http ://www.ontologymatching.org/index.html]. [11] Prompt – [http ://protege.stanford.edu/plugins/prompt/prompt.html]. [12] Prot´ g´ – [http ://protege.stanford.edu/]. e e [13] Knowledge Web – [http ://knowledgeweb.semanticweb.org/]. [14] European Association for Semantic Web Education – [http ://ease.semanticweb.org/]. [15] OWL : Recommendation du W3C en francais – [http ://www.yoyodesign.org/doc/w3c/owl-ref-20040210/]. ¸ [16] Swoogle Semantic Web Search Engine – [http ://swoogle.umbc.edu/index.php]. [17] Swoop – [http ://code.google.com/p/swoop/]. 8