Un modèle de Recherche d’Information  orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pie...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Contexte Correspondance Ob...
Contexte <ul><li>Contexte de recherche : utilisateur décrit un besoin précis </li></ul><ul><ul><li>Milieux professionnels ...
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Uni...
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Uni...
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Uni...
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Uni...
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Uni...
Vers une RI basée sur les dimensions 18 juillet 2008 © S.  Radhouani <ul><li>ex. </li></ul><ul><ul><li>Politique :  person...
Objectifs et besoins <ul><li>Résoudre des requ êtes précises </li></ul><ul><ul><li>Interpréter le contenu sémantique véhic...
Plan <ul><li>Introduction </li></ul><ul><li>État  de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexa...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dime...
Indexation conceptuelle <ul><li>Représentation  par des concepts au lieu de mots ambigus [Baziz05, Biemann05, Vallet05, Ma...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dime...
Expansion de requ êtes <ul><li>Utiliser les relations    enrichir le contenu de la requ ête [ Voorhees94, Mihalcea00, Baz...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dime...
RI & dimensions de domaine <ul><li>Paradigme de recherche multi-facette [S. R. Ranganathan 1931] </li></ul><ul><li>Interfa...
Synthèse <ul><li>Approches existantes : insuffisantes devant les exigences présentées </li></ul><ul><li>Résoudre des requ ...
Plan <ul><li>Introduction </li></ul><ul><li>État  de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexa...
La logique descriptive <ul><li>Logique Descriptive (DL)  = Logique Terminologique  </li></ul><ul><li>ALCQ  :  Attribute La...
Logique descriptive & RI  18 juillet 2008 © S.  Radhouani q  : une requête doc  : un document DL RI <ul><li>Introduction <...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Modèle de connaissances Co...
Modèle de connaissances <ul><li>Ressource externe :  K  = ( C ,  R ,  Dim ,  T ) </li></ul><ul><ul><li>Concepts : C = { c ...
Modèle de connaissances : exemple <ul><li>T </li></ul><ul><li>Événement  ⊑   T </li></ul><ul><li>Conflit des Balkans  ⊑  E...
Unité d’indexation <ul><li>Produire une représentation précise du contenu sémantique des documents (requ êtes) </li></ul><...
Unité d’indexation : élément de dimension   <ul><li>Tout concept d’une dimension est susceptible de constituer un élément ...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Représentation des documen...
Représentation des documents <ul><li>document :  doc     représenté par des éléments de dimension </li></ul><ul><ul><li>R...
Exemple <ul><li>edim 1   ≡  Philippe Morillon </li></ul><ul><li>edim 2   ≡  Zone_de_Sécurité  ⊓   ∃ créé_pendant .Guerre c...
Exemple 18 juillet 2008 © S.  Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art   </li></ul><ul><li>Modèle </...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Représentation des requ êt...
Représentation des requ êtes <ul><li>requ ête  :  q     représentée par des éléments de dimension </li></ul><ul><ul><li>R...
Exemple <ul><li>edim 7   ≡  Général  ⊓   ∃ orginaire_de .France </li></ul><ul><li>edim 8   ≡  Zone de Sécurité  ⊓   ∃ créé...
Exemple 18 juillet 2008 © S.  Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art   </li></ul><ul><li>Modèle </...
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Correspondance Corresponda...
La fonction de correspondance  f Sel <ul><li>f Sel ( doc ,  q ) : respecter les contraintes imposées par l’utilisateur   <...
La fonction de correspondance  f Sel 18 juillet 2008 © S.  Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art ...
La fonction de correspondance  f Sel 18 juillet 2008 © S.  Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art ...
La fonction de correspondance  f Sel 18 juillet 2008 © S.  Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art ...
La fonction d’ordonnancement  f Ord <ul><li>f Ord ( doc ,  q ) : classer les documents dans leur ordre de pertinence par r...
Plan <ul><li>Introduction </li></ul><ul><li>État  de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexa...
Expériences <ul><li>Résoudre des requêtes précises      évaluer l’apport de l’usage des dimensions </li></ul><ul><ul><li>...
Données et ressources <ul><li>Collection ImageCLEFmed-2005 </li></ul><ul><ul><li>50,026 documents (Anglais, Français, Alle...
Indexation <ul><li>Construction manuelle des dimensions </li></ul><ul><ul><li>Anatomie  : &quot;Anatomical Structure&quot;...
Interrogation <ul><li>T1 : Un document est considéré pertinent s'il contient les trois dimensions présentes dans la requ ê...
Apport de l’usage des dimensions 18 juillet 2008 © S.  Radhouani % à 10 docs % à 5 docs % Moyenne Précision Test +32.78 0....
Mise en œuvre du modèle <ul><li>Identification des éléments de dimension </li></ul><ul><ul><li>document    Traitement Aut...
Plan <ul><li>Introduction </li></ul><ul><li>État  de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexa...
Conclusion <ul><li>Modèle de RI capable de résoudre des requêtes précises </li></ul><ul><ul><li>Fondé sur les dimensions d...
Conclusion <ul><li>Modélisation à base de la Logique Descriptive </li></ul><ul><ul><li>Représentation uniforme des documen...
Perspectives <ul><li>Quantifier l’apport de l’approche    mise en œuvre de l’intégralité du modèle </li></ul><ul><ul><li>...
Un modèle de Recherche d’Information  orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pie...
Prochain SlideShare
Chargement dans…5
×

PhD Defense Presentation - Soutenance de thèse

5 891 vues

Publié le

Information retrieval, search, vertical search, domain-specific search, faceted search, ontology, Description Logics, Medical Search, CLEF, precision-oriented search

  • Soyez le premier à commenter

PhD Defense Presentation - Soutenance de thèse

  1. 1. Un modèle de Recherche d’Information orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe Saïd Radhouani 18 juillet 2008
  2. 2. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Contexte Correspondance Objectif : Sélectionner les documents pertinents qui traitent du thème de la requête. Indexation Interrogation Requ ête ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- --------
  3. 3. Contexte <ul><li>Contexte de recherche : utilisateur décrit un besoin précis </li></ul><ul><ul><li>Milieux professionnels (médecine, physique, etc.) </li></ul></ul><ul><li>Requête précise </li></ul><ul><ul><li>Terminologie spécifique </li></ul></ul><ul><ul><ul><li>ex. &quot;Un compte-rendu sur le type de traitements à effectuer en cas d’un cancer du sein de stade M0 &quot; </li></ul></ul></ul><ul><ul><li>Structure sémantique complexe </li></ul></ul><ul><ul><ul><li>Relations sémantiques </li></ul></ul></ul><ul><ul><ul><li>ex. &quot;Les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans&quot; </li></ul></ul></ul><ul><ul><ul><li>Opérateurs </li></ul></ul></ul><ul><ul><ul><li>ex. &quot;Des images de la peau de la main sans aucune pathologie&quot; </li></ul></ul></ul><ul><ul><ul><li>Quantificateurs </li></ul></ul></ul><ul><ul><ul><li>ex. &quot;Une image qui contient Zinedine Zidane tout seul &quot; </li></ul></ul></ul>18 juillet 2008 © S. Radhouani
  4. 4. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans.
  5. 5. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
  6. 6. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Le SRI a besoin de connaissances, autres que celles présentes dans le texte . Y a-t-il des éléments, autres que les descripteurs , qu’un document doit partager avec la requ ête pour qu’il soit considéré pertinent ? Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
  7. 7. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Conflit des Balkans est_un créé_pendant Balkans partie_de Zone de sécurité Ex-Yougoslavie Général est_un originaire_de Philippe Morillon France a_lieu_à Guerre civile d’Ex-Yougoslavie Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
  8. 8. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Personne Lieu Géographique Evénement Conflit des Balkans est_un créé_pendant Balkans partie_de Zone de sécurité Ex-Yougoslavie Général est_un originaire_de Philippe Morillon France a_lieu_à Guerre civile d’Ex-Yougoslavie Guerre civile d’Ex-Yougoslavie Conflit des Balkans Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Général Français Zone de sécurité Balkans
  9. 9. Vers une RI basée sur les dimensions 18 juillet 2008 © S. Radhouani <ul><li>ex. </li></ul><ul><ul><li>Politique : personne , lieu géographique , époque , événement , etc. </li></ul></ul><ul><ul><li>Médecine : anatomie , pathologie , stade de la maladie , etc. </li></ul></ul><ul><li>Idée de notre approche </li></ul><ul><ul><li>Domaine : un thème peut être développé en faisant référence à un ensemble de dimensions de ce domaine </li></ul></ul><ul><ul><li>Auteur  domaine  thème  dimensions  termes  document </li></ul></ul><ul><ul><li>Médecin  médecine  image médicale  anatomie  fémur  compte rendu </li></ul></ul>Une dimension d’un domaine est un concept utilisé pour exprimer des thèmes dans ce domaine
  10. 10. Objectifs et besoins <ul><li>Résoudre des requ êtes précises </li></ul><ul><ul><li>Interpréter le contenu sémantique véhiculé par la structure extraite des documents et des requ êtes </li></ul></ul><ul><ul><li>Tenir compte de la complexité de la structure sémantique des requêtes </li></ul></ul><ul><ul><li>Tenir compte des dimensions de domaine </li></ul></ul><ul><li>Ressources externes (ontologie, thésaurus, taxonomie, etc.) </li></ul><ul><ul><li>Définition des dimensions </li></ul></ul><ul><ul><li>Terminologie spécifique </li></ul></ul><ul><ul><li>Relations sémantiques </li></ul></ul><ul><li>Langage de document expressif </li></ul><ul><ul><li>Indexation précise du contenu sémantique (dimensions, relations) </li></ul></ul><ul><li>Langage de requête expressif </li></ul><ul><ul><li>Expression de besoin précis (opérateurs, relations, etc.) </li></ul></ul>18 juillet 2008 © S. Radhouani
  11. 11. Plan <ul><li>Introduction </li></ul><ul><li>État de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexation </li></ul></ul><ul><ul><li>Interrogation </li></ul></ul><ul><ul><li>Dimensions </li></ul></ul><ul><ul><li>Synthèse </li></ul></ul><ul><li>Modèle de RI fondé sur les dimensions de domaine </li></ul><ul><ul><li>Formalisme de représentation de connaissances </li></ul></ul><ul><ul><li>Modèle de connaissances </li></ul></ul><ul><ul><li>Unité d’indexation </li></ul></ul><ul><ul><li>Modèle de document </li></ul></ul><ul><ul><li>Modèle de requ ête </li></ul></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusion </li></ul>18 juillet 2008 © S. Radhouani
  12. 12. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dimensions Correspondance Indexation Interrogation Requ ête <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Indexation </li></ul><ul><li>Interrogation </li></ul><ul><li>Dimensions </li></ul><ul><li>Synthèse </li></ul>---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- Ressources externes
  13. 13. Indexation conceptuelle <ul><li>Représentation par des concepts au lieu de mots ambigus [Baziz05, Biemann05, Vallet05, Maisonnasse08] </li></ul><ul><ul><li>Représentation : sac de concepts </li></ul></ul><ul><ul><li>Correspondance : partage de concepts entre document et requ ête </li></ul></ul><ul><ul><li>Relations sémantiques non exploitées </li></ul></ul><ul><ul><li>Utilisation des relations seulement pour la désambigu ïsation [ Baziz05] </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Indexation </li></ul><ul><li>Interrogation </li></ul><ul><li>Dimensions </li></ul><ul><li>Synthèse </li></ul>Un concept est un objet mental défini comme une abstraction généralisée à partir de propriétés communes à des objets concrets. Général C01 Officier de l’armée C02 Chef d’un ordre religieux C03 Ce qui concerne le tout
  14. 14. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dimensions Correspondance Indexation Interrogation Requ ête <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Indexation </li></ul><ul><li>Interrogation </li></ul><ul><li>Dimensions </li></ul><ul><li>Synthèse </li></ul>---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- Ressources externes
  15. 15. Expansion de requ êtes <ul><li>Utiliser les relations  enrichir le contenu de la requ ête [ Voorhees94, Mihalcea00, Baziz et al.03] </li></ul><ul><ul><li>Représentation de la requête étendue : sac de concepts </li></ul></ul><ul><ul><li>Correspondance : partage de concepts entre document et requ ête étendue </li></ul></ul><ul><ul><li>Utilisation des relations seulement pour l’expansion </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Indexation </li></ul><ul><li>Interrogation </li></ul><ul><li>Dimensions </li></ul><ul><li>Synthèse </li></ul>Relations Exemples Généralisation/spécialisation { voiture } est_un {véhicule à moteur} Composition { voiture } est_composé_de {{porte}, {moteur}}
  16. 16. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dimensions Correspondance Indexation Interrogation Requ ête <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Indexation </li></ul><ul><li>Interrogation </li></ul><ul><li>Dimensions </li></ul><ul><li>Synthèse </li></ul>---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- Ressources externes
  17. 17. RI & dimensions de domaine <ul><li>Paradigme de recherche multi-facette [S. R. Ranganathan 1931] </li></ul><ul><li>Interface pour la navigation dans une collection [Yee 03, Hearst 06, M äkelä 06] </li></ul><ul><li>Construction manuelle des facettes/dimensions : hiérarchies de concepts </li></ul><ul><li>Pas d’évaluation en termes de performance de recherche </li></ul><ul><li>Tests d’utilisabilité : approches prometteuses mais limitées à petite échelle [Yee 03, Diederich 06] </li></ul><ul><ul><li>Annotée manuellement </li></ul></ul><ul><ul><li>Statique, de petite taille </li></ul></ul><ul><li>Difficulté à résoudre des requ êtes précises </li></ul><ul><ul><li>Structure sémantique complexe (opérateurs) </li></ul></ul><ul><ul><li>Terminologie spécialisée : navigation profonde dans les hiérarchies de concepts  lourde surcharge cognitive </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Indexation </li></ul><ul><li>Interrogation </li></ul><ul><li>Dimensions </li></ul><ul><li>Synthèse </li></ul>
  18. 18. Synthèse <ul><li>Approches existantes : insuffisantes devant les exigences présentées </li></ul><ul><li>Résoudre des requ êtes précises </li></ul><ul><ul><li>Interpréter la sémantique véhiculée par la structure extraite des documents et des requ êtes </li></ul></ul><ul><ul><ul><li>Tenir compte des dimensions </li></ul></ul></ul><ul><ul><ul><li>Utiliser les relations sémantiques </li></ul></ul></ul><ul><li>Besoin de ressources externes </li></ul><ul><ul><li>Représentation uniforme des documents, requ êtes, et ressources externes </li></ul></ul><ul><ul><li>=> Formalisme de représentation de connaissances commun à ces trois éléments </li></ul></ul><ul><ul><ul><li>Opération de comparaison  fonction de correspondance </li></ul></ul></ul><ul><ul><ul><li>Prendre en compte les exigences des utilisateurs en termes d’opérateurs (booléens, quantificateurs, etc.) </li></ul></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Indexation </li></ul><ul><li>Interrogation </li></ul><ul><li>Dimensions </li></ul><ul><li>Synthèse </li></ul>
  19. 19. Plan <ul><li>Introduction </li></ul><ul><li>État de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexation </li></ul></ul><ul><ul><li>Interrogation </li></ul></ul><ul><ul><li>Dimensions </li></ul></ul><ul><ul><li>Synthèse </li></ul></ul><ul><li>Modèle de RI fondé sur les dimensions de domaine </li></ul><ul><ul><li>Formalisme de représentation de connaissances </li></ul></ul><ul><ul><li>Modèle de connaissances </li></ul></ul><ul><ul><li>Unité d’indexation </li></ul></ul><ul><ul><li>Modèle de document </li></ul></ul><ul><ul><li>Modèle de requ ête </li></ul></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusion </li></ul>18 juillet 2008 © S. Radhouani
  20. 20. La logique descriptive <ul><li>Logique Descriptive (DL) = Logique Terminologique </li></ul><ul><li>ALCQ : Attribute Language with Complements and Qualified number restriction </li></ul><ul><ul><li>Modéliser les connaissances d’un domaine (concepts et relations ) </li></ul></ul><ul><ul><li>Satisfait les exigences de notre modèle (opérateurs : ⊓, ⊔ ; quantificateurs : ∃, ≥) </li></ul></ul><ul><li>T(erminological)-Box : ensemble d’axiomes terminologiques de la forme </li></ul><ul><ul><li>C ≡ D ou </li></ul></ul><ul><ul><li>C ⊑ D </li></ul></ul><ul><li>Algorithme de calcul de subsomption : déduire des connaissances implicites </li></ul><ul><ul><li>Général ⊑ Personne </li></ul></ul><ul><ul><li>Philippe Morillon ⊑ Général </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>=> Philippe Morillon ⊑ Personne
  21. 21. Logique descriptive & RI 18 juillet 2008 © S. Radhouani q  : une requête doc  : un document DL RI <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>correspondance ⊑ T Physical query Physical query Physical query Physical query Physical query Physical query Physical query R doc R q Physical document Physical document Physical document Physical document Physical document Physical document Physical document
  22. 22. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Modèle de connaissances Correspondance Indexation Interrogation Requ ête <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul>Ressources externes <ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- --------
  23. 23. Modèle de connaissances <ul><li>Ressource externe : K = ( C , R , Dim , T ) </li></ul><ul><ul><li>Concepts : C = { c 1 , …, c nc } </li></ul></ul><ul><ul><li>R ôles : R = { R 1 , …, R nr } </li></ul></ul><ul><ul><li>Dimensions : Dim = { dim 1 , …, dim nd } </li></ul></ul><ul><ul><ul><li>dim i = ( rac_dim i , C i ) </li></ul></ul></ul><ul><ul><ul><ul><li>rac_dim i  C : racine de la hiérarchie définissant dim i </li></ul></ul></ul></ul><ul><ul><ul><ul><li>C i = { c  C | c ⊑ rac_dim i } </li></ul></ul></ul></ul><ul><ul><li>T-Box : T (connaissances du domaine) </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  24. 24. Modèle de connaissances : exemple <ul><li>T </li></ul><ul><li>Événement ⊑ T </li></ul><ul><li>Conflit des Balkans ⊑ Evénement </li></ul><ul><li>Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans </li></ul><ul><li>Conflit des Balkans ≡ ∃ a_lieu_à .Balkans </li></ul><ul><li>Lieu géographique ⊑ T </li></ul><ul><li>France ⊑ Lieu géographique </li></ul><ul><li>Balkans ⊑ Lieu géographique </li></ul><ul><li>Ex-Yougoslavie ⊑ Lieu géographique </li></ul><ul><li>Ex-Yougoslavie ≡ ∃ partie_de .Balkans </li></ul><ul><li>Zone de sécurité ⊑ Lieu géographique </li></ul><ul><li>Serbie ⊑ Ex-Yougoslavie </li></ul><ul><li>Slovénie ⊑ Ex-Yougoslavie </li></ul><ul><li>Zone de sécurité ≡ ∃ créé_pendant .Conflit des Balkans </li></ul><ul><li>Personne ⊑ T </li></ul><ul><li>Général ⊑ Personne </li></ul><ul><li>Philippe Morillon ⊑ Général </li></ul><ul><li>Philippe Morillon ≡ ∃ originaire_de .France </li></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul>C = {Evénement, Personne, etc.} R = { originaire_de , partie_de , etc.} Dim = { Événement , Lieu géographique, Personne } dim Personne = (Personne, {Général, Philippe Morillon, …}) T-Box <ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  25. 25. Unité d’indexation <ul><li>Produire une représentation précise du contenu sémantique des documents (requ êtes) </li></ul><ul><li>Interpréter la sémantique véhiculée par la structure extraite des documents (requ êtes) </li></ul><ul><ul><li>Se détacher de l’aspect sac de concepts </li></ul></ul><ul><ul><li>Utiliser les dimensions , concepts , et relations </li></ul></ul><ul><li>ex. Interprétation de &quot;Général français&quot; </li></ul><ul><ul><li>élément de la dimension &quot;Personne&quot; </li></ul></ul><ul><ul><li>est &quot;Général&quot; </li></ul></ul><ul><ul><li>originaire de &quot;France&quot; </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  26. 26. Unité d’indexation : élément de dimension <ul><li>Tout concept d’une dimension est susceptible de constituer un élément de cette dimension lorsqu’il est utilisé dans un document ou une requ ête </li></ul>18 juillet 2008 © S. Radhouani <ul><ul><li>c idf  dim : identifier edim </li></ul></ul><ul><ul><li>c des  dim : décrire edim </li></ul></ul><ul><ul><li>décrit_par : relation générique pour la modélisation </li></ul></ul><ul><li>ex. edim ≡ Général ⊓ ∃ originaire_de . France </li></ul>Un élément d’une dimension dim est une expression ALCQ qui cherche à correspondre le plus précisément possible au concept de dim auquel il est fait référence dans un document ou une requ ête. <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul>edim ≡ c idf_1 ⊓ … ⊓ c idf_n ⊓ ∃ décrit_par . c des_1 ⊓ … ⊓ ∃ décrit_par . c des_m <ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  27. 27. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Représentation des documents Correspondance Indexation Interrogation Requ ête <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- Ressources externes
  28. 28. Représentation des documents <ul><li>document : doc  représenté par des éléments de dimension </li></ul><ul><ul><li>R doc : expression ALCQ = conjonction d’éléments de dimension </li></ul></ul><ul><ul><li>indexé_par : r ôle pour associer un élément de dimension à un document </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Un élément de dimension peut être pondéré (ne fait pas partie de la DL) </li></ul><ul><li>R doc est ajouté à la T-Box </li></ul>R doc ≡ ∃ indexé_par . edim 1 ⊓ … ⊓ ∃ indexé_par . edim n <ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  29. 29. Exemple <ul><li>edim 1 ≡ Philippe Morillon </li></ul><ul><li>edim 2 ≡ Zone_de_Sécurité ⊓ ∃ créé_pendant .Guerre civile d’Ex-Yougoslavie </li></ul><ul><li>edim 3 ≡ Ex-Yougoslavie </li></ul><ul><li>edim 4 ≡ Serbie </li></ul><ul><li>edim 5 ≡ Slovénie </li></ul><ul><li>edim 6 ≡ Guerre civile d’Ex-Yougoslavie </li></ul><ul><li>R doc ≡ ∃ indexé_par . edim 1 ⊓ ∃ indexé_par . edim 2 ⊓ ∃ indexé_par . edim 3 ⊓ ∃ indexé_par . edim 4 ⊓ ∃ indexé_par . edim 5 ⊓ ∃ indexé_par . edim 6 </li></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  30. 30. Exemple 18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>T-Box R doc T Événement ⊑ T Conflit des Balkans ⊑ Evénement Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Conflit des Balkans ≡ ∃ a_lieu_à .Balkans Lieu géographique ⊑ T France ⊑ Lieu géographique Balkans ⊑ Lieu géographique Ex-Yougoslavie ⊑ Lieu géographique Ex-Yougoslavie ≡ ∃ partie_de .Balkans Zone de sécurité ⊑ Lieu géographique Serbie ⊑ Ex-Yougoslavie Slovénie ⊑ Ex-Yougoslavie Zone de sécurité ≡ ∃ créé_pendant .Conflit des Balkans Personne ⊑ T Général ⊑ Personne Philippe Morillon ⊑ Général Philippe Morillon ≡ ∃ originaire_de .France
  31. 31. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Représentation des requ êtes Correspondance Indexation Interrogation Requ ête <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- Ressources externes
  32. 32. Représentation des requ êtes <ul><li>requ ête : q  représentée par des éléments de dimension </li></ul><ul><ul><li>R q : expression ALCQ = combinaison d’éléments de dimensions et d’ opérateurs </li></ul></ul><ul><ul><li>indexé_par : r ôle pour associer un élément de dimension à une requ ête </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Un élément de dimension peut être pondéré (ne fait pas partie de la DL) </li></ul><ul><li>R q est ajouté à la T-Box </li></ul>R q ≡ ∃ indexé_par . edim 1 ⊓ … ⊓ ∃ indexé_par . edim n <ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  33. 33. Exemple <ul><li>edim 7 ≡ Général ⊓ ∃ orginaire_de .France </li></ul><ul><li>edim 8 ≡ Zone de Sécurité ⊓ ∃ créé_pendant .Conflit des Balkans </li></ul><ul><li>edim 9 ≡ Conflit des Balkans </li></ul><ul><li>R q ≡ ∃ indexé_par . edim 7 ⊓ ∃ indexé_par . edim 8 ⊓ ∃ indexé_par . edim 9 </li></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  34. 34. Exemple 18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>T-Box R doc T Événement ⊑ T Conflit des Balkans ⊑ Evénement Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Conflit des Balkans ≡ ∃ a_lieu_à .Balkans Lieu géographique ⊑ T France ⊑ Lieu géographique Balkans ⊑ Lieu géographique Ex-Yougoslavie ⊑ Lieu géographique Ex-Yougoslavie ≡ ∃ partie_de .Balkans Zone de sécurité ⊑ Lieu géographique Serbie ⊑ Ex-Yougoslavie Slovénie ⊑ Ex-Yougoslavie Zone de sécurité ≡ ∃ créé_pendant .Conflit des Balkans Personne ⊑ T Général ⊑ Personne Philippe Morillon ⊑ Général Philippe Morillon ≡ ∃ originaire_de .France R q
  35. 35. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Correspondance Correspondance Indexation Interrogation Requ ête <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- Ressources externes
  36. 36. La fonction de correspondance f Sel <ul><li>f Sel ( doc , q ) : respecter les contraintes imposées par l’utilisateur </li></ul><ul><ul><li>Calcul de la subsomption dans la T-Box </li></ul></ul><ul><ul><li>D pert = { doc | R doc ⊑ T R q } </li></ul></ul>18 juillet 2008 © S. Radhouani q  : une requête R doc doc  : un document R q <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>T-Box correspondance ⊑ T Physical query Physical query Physical query Physical query Physical query Physical query Physical query Physical document Physical document Physical document Physical document Physical document Physical document Physical document Physical document
  37. 37. La fonction de correspondance f Sel 18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>T-Box <ul><ul><ul><li>T </li></ul></ul></ul><ul><ul><ul><li>Événement ⊑ T </li></ul></ul></ul><ul><ul><ul><li>Conflit des Balkans ⊑ Evénement </li></ul></ul></ul><ul><ul><ul><li>Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans </li></ul></ul></ul><ul><ul><ul><li>Conflit des Balkans ≡ ∃ a_lieu_à .Balkans </li></ul></ul></ul><ul><ul><ul><li>Lieu géographique ⊑ T </li></ul></ul></ul><ul><ul><ul><li>France ⊑ Lieu géographique </li></ul></ul></ul><ul><ul><ul><li>Balkans ⊑ Lieu géographique </li></ul></ul></ul><ul><ul><ul><li>Ex-Yougoslavie ⊑ Lieu géographique </li></ul></ul></ul><ul><ul><ul><li>Ex-Yougoslavie ≡ ∃ partie_de .Balkans </li></ul></ul></ul><ul><ul><ul><li>Zone de sécurité ⊑ Lieu géographique </li></ul></ul></ul><ul><ul><ul><li>Serbie ⊑ Ex-Yougoslavie </li></ul></ul></ul><ul><ul><ul><li>Slovénie ⊑ Ex-Yougoslavie </li></ul></ul></ul><ul><ul><ul><li>Zone de sécurité ≡ ∃ créé_pendant .Conflit des Balkans </li></ul></ul></ul><ul><ul><ul><li>Personne ⊑ T </li></ul></ul></ul><ul><ul><ul><li>Général ⊑ Personne </li></ul></ul></ul><ul><ul><ul><li>Philippe Morillon ⊑ Général </li></ul></ul></ul><ul><ul><ul><li>Philippe Morillon ≡ ∃ originaire_de .France </li></ul></ul></ul>R doc R q
  38. 38. La fonction de correspondance f Sel 18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>T-Box R doc R q Philippe Morillon ⊑ Général Zone de sécurité ≡ ∃ créé_pendant .Conflit des Balkans Philippe Morillon ≡ ∃ originaire_de .France Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Philippe Morillon Zone de sécurité ⊓ ∃ créé_pendant .Guerre civile d’Ex-Yougoslavie Général ⊓ ∃ originaire_de .France Conflit des Balkans Guerre civile d’Ex-Yougoslavie Zone de sécurité ⊓ ∃ créé_pendant .Conflit des Balkans
  39. 39. La fonction de correspondance f Sel 18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>T-Box R doc R q Philippe Morillon ⊑ Général Zone de sécurité ≡ ∃ créé_pendant .Conflit des Balkans Philippe Morillon ≡ ∃ originaire_de .France Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Philippe Morillon Zone de sécurité ⊓ ∃ créé_pendant .Guerre civile d’Ex-Yougoslavie Général ⊓ ∃ originaire_de .France Conflit des Balkans Guerre civile d’Ex-Yougoslavie Zone de sécurité ⊓ ∃ créé_pendant .Conflit des Balkans R doc ⊑ T R q
  40. 40. La fonction d’ordonnancement f Ord <ul><li>f Ord ( doc , q ) : classer les documents dans leur ordre de pertinence par rapport à q </li></ul><ul><ul><li>Les poids des éléments de dimension dans doc </li></ul></ul><ul><ul><li>Les poids des éléments de dimension dans q </li></ul></ul><ul><ul><li>Les valeurs de priorité des éléments de dimension dans q </li></ul></ul><ul><li>N’est pas modélisée en DL </li></ul><ul><li>Utiliser une métrique existante </li></ul><ul><ul><li>Notre expérience : modèle vectoriel </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Formalisme </li></ul><ul><li>Connaissances </li></ul><ul><li>Unité d’indexation </li></ul><ul><li>Document </li></ul><ul><li>Req uête </li></ul>
  41. 41. Plan <ul><li>Introduction </li></ul><ul><li>État de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexation </li></ul></ul><ul><ul><li>Interrogation </li></ul></ul><ul><ul><li>Dimensions </li></ul></ul><ul><ul><li>Synthèse </li></ul></ul><ul><li>Modèle de RI fondé sur les dimensions de domaine </li></ul><ul><ul><li>Formalisme de représentation de connaissances </li></ul></ul><ul><ul><li>Modèle de connaissances </li></ul></ul><ul><ul><li>Unité d’indexation </li></ul></ul><ul><ul><li>Modèle de document </li></ul></ul><ul><ul><li>Modèle de requ ête </li></ul></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusion </li></ul>18 juillet 2008 © S. Radhouani
  42. 42. Expériences <ul><li>Résoudre des requêtes précises  évaluer l’apport de l’usage des dimensions </li></ul><ul><ul><li>Performances de recherche </li></ul></ul><ul><ul><li>Résultat de référence : modèle vectoriel sans dimensions </li></ul></ul><ul><li>Mise en œuvre du modèle basé sur la DL </li></ul><ul><ul><li>Tester la faisabilité de notre approche </li></ul></ul><ul><ul><li>Évaluer les limites du modèle </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Objectifs </li></ul><ul><li>Données </li></ul><ul><li>Réalisations </li></ul><ul><li>Résultats </li></ul>
  43. 43. Données et ressources <ul><li>Collection ImageCLEFmed-2005 </li></ul><ul><ul><li>50,026 documents (Anglais, Français, Allemand) </li></ul></ul><ul><ul><li>25 requ êtes </li></ul></ul><ul><li>ex. &quot;show me x-ray images with fracture of the femur&quot; </li></ul><ul><li>Dimensions : Modalité, Pathologie, Anatomie </li></ul><ul><li>Ressource externe : UMLS </li></ul><ul><ul><li>Meta thésaurus (≥ 1 million d’entrées) </li></ul></ul><ul><ul><li>Réseau sémantique (135 Types sémantiques) </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Objectifs </li></ul><ul><li>Données </li></ul><ul><li>Réalisations </li></ul><ul><li>Résultats </li></ul>
  44. 44. Indexation <ul><li>Construction manuelle des dimensions </li></ul><ul><ul><li>Anatomie : &quot;Anatomical Structure&quot; + &quot;Body System&quot; + &quot;Body Space or Junction&quot; + &quot;Body Location or Region&quot; ; </li></ul></ul><ul><ul><li>Pathologie : &quot;Pathologic Function&quot; + &quot;Finding&quot; + &quot;Injury or Poisoning&quot; ; </li></ul></ul><ul><ul><li>Modalité : &quot;Diagnostic Procedure&quot; + &quot;Manufactured Object&quot;. </li></ul></ul><ul><li>Indexation conceptuelle </li></ul><ul><ul><li>Outil adapté aux documents en anglais </li></ul></ul><ul><li>Identification des éléments de dimension </li></ul><ul><ul><li>Défini par un concept </li></ul></ul><ul><ul><li>Si c  dim , alors c est un élément de la dimension dim </li></ul></ul><ul><li>Pondération des éléments de dimension </li></ul><ul><ul><li>Modèle vectoriel : variante du tf*idf (LTC) </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Objectifs </li></ul><ul><li>Données </li></ul><ul><li>Réalisations </li></ul><ul><li>Résultats </li></ul>
  45. 45. Interrogation <ul><li>T1 : Un document est considéré pertinent s'il contient les trois dimensions présentes dans la requ ê te </li></ul><ul><li>Anatomie ⊓ Pathologie ⊓ Modalité </li></ul><ul><li>T2 : Un document est considéré pertinent s'il contient au moins une des dimensions de la requ ê te </li></ul><ul><li>Anatomie ⊔ Pathologie ⊔ Modalité </li></ul><ul><li>T3 : Un document pertinent doit contenir l'anatomie, sinon la pathologie, sinon la modalité </li></ul><ul><li>Anatomie Priorité=1 Pathologie Priorité=2 Modalité Priorité=3 </li></ul><ul><li>T4 : Un document est considéré pertinent s'il contient les dimensions anatomie et pathologie </li></ul><ul><li>(Anatomie ⊓ Pathologie) ⊔ Modalité </li></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Objectifs </li></ul><ul><li>Données </li></ul><ul><li>Réalisations </li></ul><ul><li>Résultats </li></ul>
  46. 46. Apport de l’usage des dimensions 18 juillet 2008 © S. Radhouani % à 10 docs % à 5 docs % Moyenne Précision Test +32.78 0.3240 +29.41 0.3520 +8.82 0.1579 T3 +60.65 0.3920 +44.11 0.3920 +20.05 0.1742 T4 +27.86 0.3120 +23.52 0.3360 +5.72 0.1534 T2 +36.59 0.3333 +29.55 0.3524 -1.61 0.1428 T1 <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Objectifs </li></ul><ul><li>Données </li></ul><ul><li>Réalisations </li></ul><ul><li>Résultats </li></ul><ul><li>Baseline : modèle vectoriel </li></ul><ul><ul><li>Variante du tf*idf (LTC) </li></ul></ul><ul><ul><li>Sac de concepts </li></ul></ul><ul><li>Notre approche </li></ul>Précision Test Moyenne à 5 docs à 10 docs Baseline 0.1451 0.2720 0.2440
  47. 47. Mise en œuvre du modèle <ul><li>Identification des éléments de dimension </li></ul><ul><ul><li>document  Traitement Automatique des Langues </li></ul></ul><ul><ul><li>requête  interface </li></ul></ul><ul><li>Construction de la T-Box </li></ul><ul><ul><li>être humain  DL vs. Machine  langage adéquat (OWL) </li></ul></ul><ul><ul><li>outil basé sur des heuristiques </li></ul></ul><ul><li>Fonction de Correspondance  calcul de la subsomption </li></ul><ul><ul><li>raisonneur existant </li></ul></ul><ul><ul><ul><li>Pellet [Sirin et al. 04] </li></ul></ul></ul><ul><li>Ordonnancement des documents </li></ul><ul><ul><li>modèle vectoriel </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Objectifs </li></ul><ul><li>Données </li></ul><ul><li>Réalisations </li></ul><ul><li>Résultats </li></ul>
  48. 48. Plan <ul><li>Introduction </li></ul><ul><li>État de l’art : ressources externes & dimensions </li></ul><ul><ul><li>Indexation </li></ul></ul><ul><ul><li>Interrogation </li></ul></ul><ul><ul><li>Dimensions </li></ul></ul><ul><ul><li>Synthèse </li></ul></ul><ul><li>Modèle de RI fondé sur les dimensions de domaine </li></ul><ul><ul><li>Formalisme de représentation de connaissances </li></ul></ul><ul><ul><li>Modèle de connaissances </li></ul></ul><ul><ul><li>Unité d’indexation </li></ul></ul><ul><ul><li>Modèle de document </li></ul></ul><ul><ul><li>Modèle de requ ête </li></ul></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusion </li></ul>18 juillet 2008 © S. Radhouani
  49. 49. Conclusion <ul><li>Modèle de RI capable de résoudre des requêtes précises </li></ul><ul><ul><li>Fondé sur les dimensions de domaine </li></ul></ul><ul><ul><ul><li>Mettre en exergue les éléments pertinents dans un domaine particulier </li></ul></ul></ul><ul><ul><li>Nouvelle unité d’indexation : l’élément de dimension </li></ul></ul><ul><ul><ul><li>Définie par des dimensions, concepts, et relations </li></ul></ul></ul><ul><ul><li>Langages de document et de requ ête expressifs </li></ul></ul><ul><ul><ul><li>Représenter la sémantique véhiculée par la structure extraite des documents (requ êtes) </li></ul></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Bilan </li></ul><ul><li>Perspectives </li></ul>
  50. 50. Conclusion <ul><li>Modélisation à base de la Logique Descriptive </li></ul><ul><ul><li>Représentation uniforme des documents, requ êtes, et connaissances </li></ul></ul><ul><ul><li>Fonction de correspondance </li></ul></ul><ul><ul><ul><li>Correspondance entre un document et une requ ête qui ne partagent pas les mêmes termes </li></ul></ul></ul><ul><ul><ul><li>La subsomption n’est pas suffisante  définir des propriétés transitives </li></ul></ul></ul><ul><ul><ul><li>Flexibilité : utiliser n’importe quelle relation … mais </li></ul></ul></ul><ul><li>Résultats expérimentaux </li></ul><ul><ul><li>Prise en compte des dimensions  améliore les performances de recherche </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Bilan </li></ul><ul><li>Perspectives </li></ul>
  51. 51. Perspectives <ul><li>Quantifier l’apport de l’approche  mise en œuvre de l’intégralité du modèle </li></ul><ul><ul><li>Extraction des éléments de dimension </li></ul></ul><ul><ul><ul><li>Traitement automatique de la langue </li></ul></ul></ul><ul><li>Fonction d'ordonnancement adéquate au contexte de RI orientée précision </li></ul><ul><ul><li>Étudier la notion de pertinence </li></ul></ul><ul><ul><ul><li>Collaboration avec des utilisateurs professionnels (ex. médecins) </li></ul></ul></ul><ul><ul><li>Intégrer les pondérations dans le modèle </li></ul></ul><ul><li>Construction automatique des dimensions [Radhouani 07] </li></ul><ul><ul><li>Évaluation [Dakka et al.06, Stoica et al.06] </li></ul></ul><ul><li>Développement d’une interface interactive </li></ul><ul><ul><li>Test d’utilisabilité </li></ul></ul>18 juillet 2008 © S. Radhouani <ul><li>Introduction </li></ul><ul><li>Etat de l’art </li></ul><ul><li>Modèle </li></ul><ul><li>Expérimentations </li></ul><ul><li>Conclusions </li></ul><ul><li>Bilan </li></ul><ul><li>Perspectives </li></ul>
  52. 52. Un modèle de Recherche d’Information orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe Saïd Radhouani 18 juillet 2008

×