SlideShare une entreprise Scribd logo
1  sur  32
Télécharger pour lire hors ligne
SEMIOSEM : une mesure de similarité
conceptuelle fondée sur une approche
             sémiotique

   X. AIME, F. FURST, P. KUNTZ & F. TRICHET

                xaime@tennaxia.com
             frederic.furst@u-picardie.fr
     pascale.kuntz,francky.trichet@univ-nantes.fr

   LINA - UMR CNRS 6241 – Université de Nantes – FRANCE
            MIS – Université d’Amiens – FRANCE
               TENNAXIA – Paris – FRANCE
Approche sémiotique

                                                 Intension
                                                       ( propriétés )




                      Expression                                        Extension
                                    ( termes )                                ( instances )




IC'09 – Hammamet, Mai 2009 - 2/32
Mesures de type intensionnel (1/3)

                                    hiérarchie de concepts
                                         = graphe orienté

              Rada (1989) :
                                                 Moyen de paiement


                                         Carte                          Monnaie        = 0,33


                                            c                       e              f
             Carte débit différé                       d

                                    Le plus court chemin dans la hiérarchie is-a

IC'09 – Hammamet, Mai 2009 - 3/32
Mesures de type intensionnel (2/3)


              Resnik (1995) :
                                         racine                     Leacock (1998) :
                                                  b


                                                Moyen de paiement
                                    a

                                        Carte                       Monnaie
                                                                                      = 0,42
                                                                g             h
                                          e           f
             Carte débit différé

              Le plus court chemin dans la hiérarchie is-a associé à la profondeur maximale

IC'09 – Hammamet, Mai 2009 - 4/32
Mesures de type intensionnel (3/3)


           Wu & Palmer (1994) :
                                         racine

                                                  b


                                                Moyen de paiement                   = 0,57
                                    a

                                        Carte                       Monnaie


                                          d                     g             h
             Carte débit différé                      f


                 Similarité entre deux concepts basée sur le PPPC (Plus Petit Père Commun)

IC'09 – Hammamet, Mai 2009 - 5/32
Mesures de type extensionnel (1/3)


         Jaccard (1901) :



                                    Ic1
                                          Ic1 ∩ Ic2   Ic2




IC'09 – Hammamet, Mai 2009 - 6/32
Mesures de type extensionnel (2/3)

              SimDice (c1 ,c2) =                      | Ic1 ∩ Ic2 |
                                                  Moy ( | Ic1 | , | Ic2 | )

                                    Ic1 ∩ Ic2   Ic2              Moy (Ic1 , Ic2)
                   Ic1

                                                                      Ic1 ∩ Ic2




              Plus régulier, même ordre et intervalle [0,1]

IC'09 – Hammamet, Mai 2009 - 7/32
Mesures de type extensionnel (3/3)

       d’Amato & Staab (2008) :


            I

                                                Ipppc (c1,c2)



                                    Ic1
                                          Ic1 ∩ Ic2             Ic2




IC'09 – Hammamet, Mai 2009 - 8/32
Mesures de type expressionnel (1/4)


              Resnik :


                       t1............
                       ……. t2...
                       ….t2……                 ..............                    t1............
                                              ……. t2...                         ……. t1...                         ............
                       ………….                                                                                      ……. ....
                                              ….t2……                            ….t1……                                                                                      ..............
                       …………                                                                                       ….t2……
                                              ………….                             ……t1….                                                                                      ……. t1...
                                                                                                                  ………….                   t1............                    ….t2……
                                              …………                              …………
                                                                                                                  …………                    t1…. .....                        ………….
                                                                                                                                          ….t1……                            …………
                                                                                                                                          ………….
                             t2............                                                                                               ………t2
                             ……. t2...                                                                                   ..............
                                                                                                 t2............
                             ….t1……                            ..............                                            ……. ...
                                                                                                 ……. t2...                                                 ..............
                             ………….                             ……. ...                                                   ………
                                                                                                 ….t2……                                                    ……. .....
                             ……t1……                            ….……                                                      ………….
                                                                                                 …t2…….                                                    …………
                                                               ………….                                                     …………
                                                                                                 ………t2                                                     ………….
                                                               …………
                                                                                                                                                           …………




IC'09 – Hammamet, Mai 2009 - 9/32
Mesures de type expressionnel (2/4)

              Resnik 2 :

                                            racine

                                           Objet de commerce


                                                   Moyen de paiement
                                      a

                                           Carte                         Monnaie


                                             d                       g             h
             Carte débit différé                        f


                           Combinaison chemin dans la hiérarchie is-a + contenu information

IC'09 – Hammamet, Mai 2009 - 10/32
Mesures de type expressionnel (3/4)

              Lin (1998) :

                                          racine

                                         Objet de commerce


                                                 Moyen de paiement
                                     a

                                         Carte                     Monnaie


                                           d                   g             h
             Carte débit différé                    f


              Combinaison plus court chemin dans la hiérarchie is-a + contenu information

IC'09 – Hammamet, Mai 2009 - 11/32
Mesures de type expressionnel (4/4)

             Jiang (1997) :


                                           Objet de commerce


                                                   Moyen de paiement
                                      a

                                           Carte                         Monnaie


                                             d                       g             h
             Carte débit différé                        f


                           Combinaison chemin dans la hiérarchie is-a + contenu information

IC'09 – Hammamet, Mai 2009 - 12/32
Approche sémiotique

                                                  Intension
                                                        ( propriétés )


                                                                Zoologue




                      Expression                                         Extension
                                     ( termes )                                ( instances )




IC'09 – Hammamet, Mai 2009 - 13/32
Approche sémiotique

                                                  Intension
                                                        ( propriétés )




                                                                     Visiteur d’un zoo




                      Expression                                         Extension
                                     ( termes )                                ( instances )




IC'09 – Hammamet, Mai 2009 - 14/32
Mesure de similarité à base sémiotique


              SEMIOSEM(c1,c2) = (α . intension (c1,c2)
                                         + β . expression (c1,c2)
                                     + γ . extension (c1,c2)) δ
              Avec :
                      α + β + γ = 1, α ∈ [0,1], β ∈ [0,1], γ∈ [0,1]
                      α , β , γ pondération de l’influence des 3 composantes
                      δ ∈ ]0,+ ∝ [ pondération de l’état émotionnel
IC'09 – Hammamet, Mai 2009 - 15/32
Facteur émotionnel


                                             delta < 1
                       S
                       E
                       M
                       I
                       O
                       S
                       E
                       m                                                                delta > 1


                             alpha . intension + bêta . expression + gamma . extension




                           Un état mental négatif affaiblit la similarité                Un état mental positif atténue la force de
                                                                                                      dissimilarité.
     delta > 1
                                                                            delta < 1
IC'09 – Hammamet, Mai 2009 - 16/32
Composante Intensionnelle (1/7)
Pondération des propriétés (Au Yeung 2006)

            Propriété “peut flotter”




            Comment pouvons-nous déterminer l’importance de
            cette propriété quand nous définissons ces concepts ?


IC'09 – Hammamet, Mai 2009 - 17/32
Composante Intensionnelle (2/7)
Pondération des propriétés

              Propriété “peut flotter”




            0                                  0.75                   1
        Peu important                                       Très important

        !!! Possibilité d’une pondération binaire : 0 ou 1 pour possède ou ne possède pas

IC'09 – Hammamet, Mai 2009 - 18/32
Composante Intensionnelle (3/7)
Vecteur caractéristique


              Concept “Canard”


                            (… , 0.3 , 0.75 , 0.8, 0.4 , …)

        A des plumes                 Peut flotter   Peut voler   Pond un oeuf




IC'09 – Hammamet, Mai 2009 - 19/32
Composante Intensionnelle (4/7)
Vecteur caractéristique

                                          Sous concepts de cp
                                     p1
                                                 =
                                           Nuage de points




                                             p0



             p2

IC'09 – Hammamet, Mai 2009 - 20/32
Composante Intensionnelle (5/7)
Vecteur prototype

                                              Prototype de bateau
                                     p1                 ~
                                          Barycentre du nuage de points




                                                p0



             p2

IC'09 – Hammamet, Mai 2009 - 21/32
Composante Intensionnelle (6/7)
Vecteur prototype

                                               Prototype de canard
                                     p1                 ~
                                          Barycentre du nuage de points




                                                p0



             p2

IC'09 – Hammamet, Mai 2009 - 22/32
Composante Intensionnelle (7/7)
Intension

                                                       Intension ( c1 , c2 )
                                     p1                         =
                                          1 – distance ( prototype(c1) , prototype(c2) )

                                                                    Distance euclidienne normée




                                                     p0



             p2

IC'09 – Hammamet, Mai 2009 - 23/32
Composante Extensionnelle (1/2)
Initialement

                                                                       Jacca
                                                                            rd
              Extension (c1 ,c2) =                     | Ic1 ∩ Ic2 |
                                                 | Ic1 | + | Ic2 | - | Ic1 ∩ Ic2 |



                                     Ic1
                                           Ic1 ∩ Ic2        Ic2



IC'09 – Hammamet, Mai 2009 - 24/32
Composante Extensionnelle (2/2)
Aujourd’hui
                                                                                    Dice
              Extension (c1 ,c2) =                       | Ic1 ∩ Ic2 |
                                                   Moy ( | Ic1 | , | Ic2 | )

                                     Ic1 ∩ Ic2   Ic2              Moy (Ic1 , Ic2)
                   Ic1

                                                                    Ic1 ∩ Ic2




              Plus régulier, même ordre et intervalle [0,1]

IC'09 – Hammamet, Mai 2009 - 25/32
Composante Expressionnelle (1/2)

              Fondée sur le nombre d’occurrences des termes



                       t1............
                       ……. t2...
                       ….t2……                 ..............                    t1............
                                              ……. t2...                         ……. t1...                         ............
                       ………….
                                              ….t2……                            ….t1……                            ……. ....                                                  ..............
                       …………
                                              ………….                             ……t1….                            ….t2……                                                    ……. t1...
                                                                                                                  ………….                   t1............                    ….t2……
                                              …………                              …………
                                                                                                                  …………                    t1…. .....                        ………….
                                                                                                                                          ….t1……                            …………
                                                                                                                                          ………….
                             t2............                                                                                               ………t2
                             ……. t2...                                                                                   ..............
                                                                                                 t2............          ……. ...
                             ….t1……                            ..............                    ……. t2...
                                                               ……. ...                                                   ………                               ..............
                             ………….                                                               ….t2……                  ………….                             ……. .....
                             ……t1……                            ….……                              …t2…….                  …………                              …………
                                                               ………….                             ………t2
                                                               …………                                                                                        ………….
                                                                                                                                                           …………




IC'09 – Hammamet, Mai 2009 - 26/32
Composante Expressionnelle (2/2)



    Avec :
           t1∈terms(c1) , t2∈terms(c2) et terms(c) l’ensemble des termes désignant le
          concept c ou un de ses descendants (direct ou non)
          count(ti) est le nombre d’occurrences du terme ti dans les documents du
          corpus
          count(t1, t2) est le nombre de documents du corpus où les termes t1 et t2
          apparaissent simultanément
          Ndoc est le nombre total de documents du corpus
          Nocc est la somme de tous les nombres d’occurrences de tous les termes du
          corpus

IC'09 – Hammamet, Mai 2009 - 27/32
Proximité ou Similarité ?
Faux jumeaux et vrais jumeaux

              Composante Intensionnelle
                      Comparaison des propriétés descriptives et fonctionnelles           aa
                                                                                          A a
                      similarité
              Composante Extensionnelle
                      Comparaison de la quantité d’individus extensions des deux concepts
                      simultanément                                                    aa
                      similarité                                                          A a
              Composante Expressionnelle
                      ~ probabilité d’avoir l’expression des deux concepts dans le même
                      document
                      proximité

IC'09 – Hammamet, Mai 2009 - 28/32
Expérimentations




                                       A (alpha = 0.7, bêta= 0.2 , gamma= 0.1, delta = 1)
                                       B (alpha = 0.2 , bêta= 0.7, gamma= 0.1, delta = 1)
                                       C (alpha = 0.2 , bêta= 0.1, gamma= 0.7, delta = 1)


                                     D (alpha = 0.33 , bêta= 0.33, gamma= 0.33, delta = 1)


                                      E (alpha = 0.7, bêta=0.2 , gamma=0.1 , delta = 0.1)
                                      F (alpha = 0.7 , bêta= 0.2 , gamma= 0.1, delta = 5)




IC'09 – Hammamet, Mai 2009 - 29/32
Limites

              Composante Intensionnelle
                      La pondération des propriétés est assez chronophage (pour les
                      ontologies volumineuses)


              Composante Expressionnelle
                      Termes ambiguës
                      Contexte autour du terme (“ni m1 ni …”, “opposé de m1”…)
                      Anaphores (“Pierre a une voiture, c’est la même que la mienne”)


              Facteur Émotionnel
                      Pondération de l’état émotionnel de l’utilisateur
IC'09 – Hammamet, Mai 2009 - 30/32
Conclusion

              SEMIOSEM, une mesure de (quasi-)similarité :
                      Adaptée au profil de l’utilisateur via
                              la pondération des propriétés ;
                              la définition d’un corpus caractéristique ;
                              l’état émotionnel.

                      Couvrant les trois dimensions d’une conceptualisation
                      Qui n’est pas une distance (pas d’inégalité triangulaire)
                      Indépendante du Plus Petit Père Commun, et par conséquent des choix
                      de modélisation.




IC'09 – Hammamet, Mai 2009 - 31/32
SEMIOSEM : une mesure de similarité
conceptuelle fondée sur une approche
             sémiotique

   X. AIME, F. FURST, P. KUNTZ & F. TRICHET

                xaime@tennaxia.com
             frederic.furst@u-picardie.fr
     pascale.kuntz,francky.trichet@univ-nantes.fr

   LINA - UMR CNRS 6241 - Université de Nantes – FRANCE
            MIS – Université d’Amiens – FRANCE
               TENNAXIA – Paris – FRANCE

Contenu connexe

En vedette

5.1 K plus proches voisins
5.1 K plus proches voisins5.1 K plus proches voisins
5.1 K plus proches voisinsBoris Guarisma
 
6580.Rosario.H Presentacion.
6580.Rosario.H  Presentacion.6580.Rosario.H  Presentacion.
6580.Rosario.H Presentacion.clasesdecalimano
 
Comment lancer une entreprise
Comment lancer une entrepriseComment lancer une entreprise
Comment lancer une entrepriseSoukaina Boujadi
 
Rome I Regulation - A First Approach
Rome I Regulation - A First ApproachRome I Regulation - A First Approach
Rome I Regulation - A First Approachpatrickwautelet
 
Un peu d'histoire. Isabel Peña. 2º Avancé
Un peu d'histoire. Isabel Peña. 2º AvancéUn peu d'histoire. Isabel Peña. 2º Avancé
Un peu d'histoire. Isabel Peña. 2º Avancéasola
 
Primera Guerra Mundial MRF
Primera Guerra Mundial MRFPrimera Guerra Mundial MRF
Primera Guerra Mundial MRFMANGELESROMAN
 
Presentacion sobre Duhem
Presentacion sobre DuhemPresentacion sobre Duhem
Presentacion sobre DuhemNeo Consulting
 
Social Mediagrama Ax Summit
Social Mediagrama Ax SummitSocial Mediagrama Ax Summit
Social Mediagrama Ax SummitAxeleratum
 
Contribution au cigref réseaux hauts débits et multimédia
Contribution au cigref   réseaux hauts débits et multimédiaContribution au cigref   réseaux hauts débits et multimédia
Contribution au cigref réseaux hauts débits et multimédiaopfagot
 
El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...
El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...
El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...Eileen Cruz
 
Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07
Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07
Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07A3C - Expert Comptable à Dunkerque
 

En vedette (20)

5.1 K plus proches voisins
5.1 K plus proches voisins5.1 K plus proches voisins
5.1 K plus proches voisins
 
Cours cluster si2e
Cours cluster si2eCours cluster si2e
Cours cluster si2e
 
Algorithme knn
Algorithme knnAlgorithme knn
Algorithme knn
 
Recherche semantique
Recherche semantique Recherche semantique
Recherche semantique
 
Los Fenomenos Naturales
Los Fenomenos NaturalesLos Fenomenos Naturales
Los Fenomenos Naturales
 
6580.Rosario.H Presentacion.
6580.Rosario.H  Presentacion.6580.Rosario.H  Presentacion.
6580.Rosario.H Presentacion.
 
Comment lancer une entreprise
Comment lancer une entrepriseComment lancer une entreprise
Comment lancer une entreprise
 
Rome I Regulation - A First Approach
Rome I Regulation - A First ApproachRome I Regulation - A First Approach
Rome I Regulation - A First Approach
 
ETS
ETSETS
ETS
 
Un peu d'histoire. Isabel Peña. 2º Avancé
Un peu d'histoire. Isabel Peña. 2º AvancéUn peu d'histoire. Isabel Peña. 2º Avancé
Un peu d'histoire. Isabel Peña. 2º Avancé
 
Primera Guerra Mundial MRF
Primera Guerra Mundial MRFPrimera Guerra Mundial MRF
Primera Guerra Mundial MRF
 
Presentacion sobre Duhem
Presentacion sobre DuhemPresentacion sobre Duhem
Presentacion sobre Duhem
 
Social Mediagrama Ax Summit
Social Mediagrama Ax SummitSocial Mediagrama Ax Summit
Social Mediagrama Ax Summit
 
Brochure bonampak-2015
Brochure bonampak-2015Brochure bonampak-2015
Brochure bonampak-2015
 
Dynamiser le télétravail
Dynamiser le télétravailDynamiser le télétravail
Dynamiser le télétravail
 
Contribution au cigref réseaux hauts débits et multimédia
Contribution au cigref   réseaux hauts débits et multimédiaContribution au cigref   réseaux hauts débits et multimédia
Contribution au cigref réseaux hauts débits et multimédia
 
El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...
El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...
El modelo constructivista con las nuevas tecnologías aplicado en el proceso d...
 
Cartadeunbebe
CartadeunbebeCartadeunbebe
Cartadeunbebe
 
Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07
Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07
Bureau Etudes Techniques : mutuelle obligatoire - accord 2015 10 07
 
Guide croissanceexterne
Guide croissanceexterneGuide croissanceexterne
Guide croissanceexterne
 

Plus de Conférence IC 2009

Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conférence IC 2009
 
Sémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeSémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeConférence IC 2009
 
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Conférence IC 2009
 
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Conférence IC 2009
 
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...Conférence IC 2009
 
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Conférence IC 2009
 
Evaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineEvaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineConférence IC 2009
 
Ontologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueOntologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueConférence IC 2009
 
Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Conférence IC 2009
 
Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Conférence IC 2009
 
Patrons de gestion des changements OWL
Patrons de gestion des changements OWLPatrons de gestion des changements OWL
Patrons de gestion des changements OWLConférence IC 2009
 
Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Conférence IC 2009
 
Indexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsIndexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsConférence IC 2009
 
Gradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologiesGradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologiesConférence IC 2009
 
Démarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebDémarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebConférence IC 2009
 
Méta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesMéta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesConférence IC 2009
 
COBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesCOBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesConférence IC 2009
 
Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...Conférence IC 2009
 
Alignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casAlignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casConférence IC 2009
 
Explorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesExplorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesConférence IC 2009
 

Plus de Conférence IC 2009 (20)

Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
 
Sémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeSémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistée
 
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
 
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
 
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
Du texte à la connaissance : annotation sémantique et peuplement d'ontologie ...
 
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
 
Evaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineEvaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaine
 
Ontologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueOntologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantique
 
Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...
 
Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...
 
Patrons de gestion des changements OWL
Patrons de gestion des changements OWLPatrons de gestion des changements OWL
Patrons de gestion des changements OWL
 
Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...
 
Indexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsIndexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de concepts
 
Gradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologiesGradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologies
 
Démarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebDémarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le Web
 
Méta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesMéta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiques
 
COBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesCOBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologies
 
Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...Construction automatique d'ontologies à partir de spécifications de bases de ...
Construction automatique d'ontologies à partir de spécifications de bases de ...
 
Alignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casAlignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de cas
 
Explorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesExplorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de données
 

SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémiotique

  • 1. SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémiotique X. AIME, F. FURST, P. KUNTZ & F. TRICHET xaime@tennaxia.com frederic.furst@u-picardie.fr pascale.kuntz,francky.trichet@univ-nantes.fr LINA - UMR CNRS 6241 – Université de Nantes – FRANCE MIS – Université d’Amiens – FRANCE TENNAXIA – Paris – FRANCE
  • 2. Approche sémiotique Intension ( propriétés ) Expression Extension ( termes ) ( instances ) IC'09 – Hammamet, Mai 2009 - 2/32
  • 3. Mesures de type intensionnel (1/3) hiérarchie de concepts = graphe orienté Rada (1989) : Moyen de paiement Carte Monnaie = 0,33 c e f Carte débit différé d Le plus court chemin dans la hiérarchie is-a IC'09 – Hammamet, Mai 2009 - 3/32
  • 4. Mesures de type intensionnel (2/3) Resnik (1995) : racine Leacock (1998) : b Moyen de paiement a Carte Monnaie = 0,42 g h e f Carte débit différé Le plus court chemin dans la hiérarchie is-a associé à la profondeur maximale IC'09 – Hammamet, Mai 2009 - 4/32
  • 5. Mesures de type intensionnel (3/3) Wu & Palmer (1994) : racine b Moyen de paiement = 0,57 a Carte Monnaie d g h Carte débit différé f Similarité entre deux concepts basée sur le PPPC (Plus Petit Père Commun) IC'09 – Hammamet, Mai 2009 - 5/32
  • 6. Mesures de type extensionnel (1/3) Jaccard (1901) : Ic1 Ic1 ∩ Ic2 Ic2 IC'09 – Hammamet, Mai 2009 - 6/32
  • 7. Mesures de type extensionnel (2/3) SimDice (c1 ,c2) = | Ic1 ∩ Ic2 | Moy ( | Ic1 | , | Ic2 | ) Ic1 ∩ Ic2 Ic2 Moy (Ic1 , Ic2) Ic1 Ic1 ∩ Ic2 Plus régulier, même ordre et intervalle [0,1] IC'09 – Hammamet, Mai 2009 - 7/32
  • 8. Mesures de type extensionnel (3/3) d’Amato & Staab (2008) : I Ipppc (c1,c2) Ic1 Ic1 ∩ Ic2 Ic2 IC'09 – Hammamet, Mai 2009 - 8/32
  • 9. Mesures de type expressionnel (1/4) Resnik : t1............ ……. t2... ….t2…… .............. t1............ ……. t2... ……. t1... ............ …………. ……. .... ….t2…… ….t1…… .............. ………… ….t2…… …………. ……t1…. ……. t1... …………. t1............ ….t2…… ………… ………… ………… t1…. ..... …………. ….t1…… ………… …………. t2............ ………t2 ……. t2... .............. t2............ ….t1…… .............. ……. ... ……. t2... .............. …………. ……. ... ……… ….t2…… ……. ..... ……t1…… ….…… …………. …t2……. ………… …………. ………… ………t2 …………. ………… ………… IC'09 – Hammamet, Mai 2009 - 9/32
  • 10. Mesures de type expressionnel (2/4) Resnik 2 : racine Objet de commerce Moyen de paiement a Carte Monnaie d g h Carte débit différé f Combinaison chemin dans la hiérarchie is-a + contenu information IC'09 – Hammamet, Mai 2009 - 10/32
  • 11. Mesures de type expressionnel (3/4) Lin (1998) : racine Objet de commerce Moyen de paiement a Carte Monnaie d g h Carte débit différé f Combinaison plus court chemin dans la hiérarchie is-a + contenu information IC'09 – Hammamet, Mai 2009 - 11/32
  • 12. Mesures de type expressionnel (4/4) Jiang (1997) : Objet de commerce Moyen de paiement a Carte Monnaie d g h Carte débit différé f Combinaison chemin dans la hiérarchie is-a + contenu information IC'09 – Hammamet, Mai 2009 - 12/32
  • 13. Approche sémiotique Intension ( propriétés ) Zoologue Expression Extension ( termes ) ( instances ) IC'09 – Hammamet, Mai 2009 - 13/32
  • 14. Approche sémiotique Intension ( propriétés ) Visiteur d’un zoo Expression Extension ( termes ) ( instances ) IC'09 – Hammamet, Mai 2009 - 14/32
  • 15. Mesure de similarité à base sémiotique SEMIOSEM(c1,c2) = (α . intension (c1,c2) + β . expression (c1,c2) + γ . extension (c1,c2)) δ Avec : α + β + γ = 1, α ∈ [0,1], β ∈ [0,1], γ∈ [0,1] α , β , γ pondération de l’influence des 3 composantes δ ∈ ]0,+ ∝ [ pondération de l’état émotionnel IC'09 – Hammamet, Mai 2009 - 15/32
  • 16. Facteur émotionnel delta < 1 S E M I O S E m delta > 1 alpha . intension + bêta . expression + gamma . extension Un état mental négatif affaiblit la similarité Un état mental positif atténue la force de dissimilarité. delta > 1 delta < 1 IC'09 – Hammamet, Mai 2009 - 16/32
  • 17. Composante Intensionnelle (1/7) Pondération des propriétés (Au Yeung 2006) Propriété “peut flotter” Comment pouvons-nous déterminer l’importance de cette propriété quand nous définissons ces concepts ? IC'09 – Hammamet, Mai 2009 - 17/32
  • 18. Composante Intensionnelle (2/7) Pondération des propriétés Propriété “peut flotter” 0 0.75 1 Peu important Très important !!! Possibilité d’une pondération binaire : 0 ou 1 pour possède ou ne possède pas IC'09 – Hammamet, Mai 2009 - 18/32
  • 19. Composante Intensionnelle (3/7) Vecteur caractéristique Concept “Canard” (… , 0.3 , 0.75 , 0.8, 0.4 , …) A des plumes Peut flotter Peut voler Pond un oeuf IC'09 – Hammamet, Mai 2009 - 19/32
  • 20. Composante Intensionnelle (4/7) Vecteur caractéristique Sous concepts de cp p1 = Nuage de points p0 p2 IC'09 – Hammamet, Mai 2009 - 20/32
  • 21. Composante Intensionnelle (5/7) Vecteur prototype Prototype de bateau p1 ~ Barycentre du nuage de points p0 p2 IC'09 – Hammamet, Mai 2009 - 21/32
  • 22. Composante Intensionnelle (6/7) Vecteur prototype Prototype de canard p1 ~ Barycentre du nuage de points p0 p2 IC'09 – Hammamet, Mai 2009 - 22/32
  • 23. Composante Intensionnelle (7/7) Intension Intension ( c1 , c2 ) p1 = 1 – distance ( prototype(c1) , prototype(c2) ) Distance euclidienne normée p0 p2 IC'09 – Hammamet, Mai 2009 - 23/32
  • 24. Composante Extensionnelle (1/2) Initialement Jacca rd Extension (c1 ,c2) = | Ic1 ∩ Ic2 | | Ic1 | + | Ic2 | - | Ic1 ∩ Ic2 | Ic1 Ic1 ∩ Ic2 Ic2 IC'09 – Hammamet, Mai 2009 - 24/32
  • 25. Composante Extensionnelle (2/2) Aujourd’hui Dice Extension (c1 ,c2) = | Ic1 ∩ Ic2 | Moy ( | Ic1 | , | Ic2 | ) Ic1 ∩ Ic2 Ic2 Moy (Ic1 , Ic2) Ic1 Ic1 ∩ Ic2 Plus régulier, même ordre et intervalle [0,1] IC'09 – Hammamet, Mai 2009 - 25/32
  • 26. Composante Expressionnelle (1/2) Fondée sur le nombre d’occurrences des termes t1............ ……. t2... ….t2…… .............. t1............ ……. t2... ……. t1... ............ …………. ….t2…… ….t1…… ……. .... .............. ………… …………. ……t1…. ….t2…… ……. t1... …………. t1............ ….t2…… ………… ………… ………… t1…. ..... …………. ….t1…… ………… …………. t2............ ………t2 ……. t2... .............. t2............ ……. ... ….t1…… .............. ……. t2... ……. ... ……… .............. …………. ….t2…… …………. ……. ..... ……t1…… ….…… …t2……. ………… ………… …………. ………t2 ………… …………. ………… IC'09 – Hammamet, Mai 2009 - 26/32
  • 27. Composante Expressionnelle (2/2) Avec : t1∈terms(c1) , t2∈terms(c2) et terms(c) l’ensemble des termes désignant le concept c ou un de ses descendants (direct ou non) count(ti) est le nombre d’occurrences du terme ti dans les documents du corpus count(t1, t2) est le nombre de documents du corpus où les termes t1 et t2 apparaissent simultanément Ndoc est le nombre total de documents du corpus Nocc est la somme de tous les nombres d’occurrences de tous les termes du corpus IC'09 – Hammamet, Mai 2009 - 27/32
  • 28. Proximité ou Similarité ? Faux jumeaux et vrais jumeaux Composante Intensionnelle Comparaison des propriétés descriptives et fonctionnelles aa A a similarité Composante Extensionnelle Comparaison de la quantité d’individus extensions des deux concepts simultanément aa similarité A a Composante Expressionnelle ~ probabilité d’avoir l’expression des deux concepts dans le même document proximité IC'09 – Hammamet, Mai 2009 - 28/32
  • 29. Expérimentations A (alpha = 0.7, bêta= 0.2 , gamma= 0.1, delta = 1) B (alpha = 0.2 , bêta= 0.7, gamma= 0.1, delta = 1) C (alpha = 0.2 , bêta= 0.1, gamma= 0.7, delta = 1) D (alpha = 0.33 , bêta= 0.33, gamma= 0.33, delta = 1) E (alpha = 0.7, bêta=0.2 , gamma=0.1 , delta = 0.1) F (alpha = 0.7 , bêta= 0.2 , gamma= 0.1, delta = 5) IC'09 – Hammamet, Mai 2009 - 29/32
  • 30. Limites Composante Intensionnelle La pondération des propriétés est assez chronophage (pour les ontologies volumineuses) Composante Expressionnelle Termes ambiguës Contexte autour du terme (“ni m1 ni …”, “opposé de m1”…) Anaphores (“Pierre a une voiture, c’est la même que la mienne”) Facteur Émotionnel Pondération de l’état émotionnel de l’utilisateur IC'09 – Hammamet, Mai 2009 - 30/32
  • 31. Conclusion SEMIOSEM, une mesure de (quasi-)similarité : Adaptée au profil de l’utilisateur via la pondération des propriétés ; la définition d’un corpus caractéristique ; l’état émotionnel. Couvrant les trois dimensions d’une conceptualisation Qui n’est pas une distance (pas d’inégalité triangulaire) Indépendante du Plus Petit Père Commun, et par conséquent des choix de modélisation. IC'09 – Hammamet, Mai 2009 - 31/32
  • 32. SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémiotique X. AIME, F. FURST, P. KUNTZ & F. TRICHET xaime@tennaxia.com frederic.furst@u-picardie.fr pascale.kuntz,francky.trichet@univ-nantes.fr LINA - UMR CNRS 6241 - Université de Nantes – FRANCE MIS – Université d’Amiens – FRANCE TENNAXIA – Paris – FRANCE