SlideShare une entreprise Scribd logo
1  sur  52
Un modèle de Recherche d’Information  orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe Saïd Radhouani 18 juillet 2008
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Contexte Correspondance Objectif :  Sélectionner les documents pertinents  qui traitent du thème de la requête. Indexation Interrogation Requ ête ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- --------
Contexte ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête   [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans.
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête   [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête   [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Le SRI a besoin de connaissances,  autres que celles présentes dans le texte . Y a-t-il des éléments,  autres que les descripteurs , qu’un document doit partager avec la requ ête pour qu’il soit considéré pertinent ? Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête   [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Conflit des Balkans est_un créé_pendant Balkans partie_de Zone de sécurité Ex-Yougoslavie Général est_un originaire_de Philippe Morillon France a_lieu_à Guerre civile d’Ex-Yougoslavie Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
Problématique 18 juillet 2008 © S.  Radhouani …  pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête   [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Personne Lieu Géographique Evénement   Conflit des Balkans est_un créé_pendant Balkans partie_de Zone de sécurité Ex-Yougoslavie Général est_un originaire_de Philippe Morillon France a_lieu_à Guerre civile d’Ex-Yougoslavie Guerre civile d’Ex-Yougoslavie Conflit des Balkans Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Général Français Zone de sécurité Balkans
Vers une RI basée sur les dimensions 18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Une dimension d’un domaine est un concept utilisé pour exprimer des thèmes dans ce domaine
Objectifs et besoins ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dimensions Correspondance Indexation Interrogation Requ ête ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- Ressources  externes
Indexation conceptuelle ,[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Un concept est un objet mental défini comme une abstraction généralisée à partir de propriétés communes à des objets concrets.   Général C01 Officier de l’armée C02 Chef d’un ordre religieux C03 Ce qui concerne le tout
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dimensions Correspondance Indexation Interrogation Requ ête ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- Ressources  externes
Expansion de requ êtes ,[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Relations  Exemples Généralisation/spécialisation { voiture }  est_un  {véhicule à moteur} Composition { voiture }  est_composé_de  {{porte}, {moteur}}
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Ressources externes & dimensions Correspondance Indexation Interrogation Requ ête ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- Ressources  externes
RI & dimensions de domaine ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Synthèse ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani
La logique descriptive ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],=>  Philippe Morillon  ⊑  Personne
Logique descriptive & RI  18 juillet 2008 © S.  Radhouani q  : une requête doc  : un document DL RI ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],correspondance ⊑ T Physical query Physical query Physical query Physical query Physical query Physical query Physical query R doc R q Physical document Physical document Physical document Physical document Physical document Physical document Physical document
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Modèle de connaissances Correspondance Indexation Interrogation Requ ête ,[object Object],[object Object],[object Object],[object Object],[object Object],Ressources  externes ,[object Object],[object Object],[object Object],[object Object],[object Object],---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- --------
Modèle de connaissances ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Modèle de connaissances : exemple ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],C =  {Evénement, Personne, etc.} R  = { originaire_de ,  partie_de , etc.} Dim  = { Événement ,  Lieu géographique,  Personne } dim Personne   = (Personne, {Général,  Philippe Morillon, …}) T-Box ,[object Object],[object Object],[object Object],[object Object],[object Object]
Unité d’indexation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Unité d’indexation : élément de dimension   ,[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],Un élément d’une dimension  dim  est une expression  ALCQ  qui cherche à correspondre le plus précisément possible au concept de  dim  auquel il est fait référence dans un document ou une requ ête. ,[object Object],[object Object],[object Object],[object Object],[object Object],edim   ≡   c idf_1   ⊓ … ⊓  c idf_n  ⊓  ∃ décrit_par . c des_1  ⊓ … ⊓  ∃ décrit_par . c des_m ,[object Object],[object Object],[object Object],[object Object],[object Object]
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Représentation des documents Correspondance Indexation Interrogation Requ ête ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- Ressources  externes
Représentation des documents ,[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],R doc   ≡   ∃ indexé_par . edim 1   ⊓   …  ⊓   ∃ indexé_par . edim n ,[object Object],[object Object],[object Object],[object Object],[object Object]
Exemple ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Exemple 18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],T-Box R doc T Événement  ⊑   T Conflit des Balkans  ⊑  Evénement Guerre civile d’Ex-Yougoslavie  ⊑  Conflit des Balkans Conflit des Balkans  ≡   ∃ a_lieu_à .Balkans Lieu géographique  ⊑   T France  ⊑  Lieu géographique Balkans  ⊑  Lieu géographique Ex-Yougoslavie  ⊑  Lieu géographique Ex-Yougoslavie  ≡   ∃ partie_de .Balkans Zone de sécurité  ⊑  Lieu géographique Serbie  ⊑  Ex-Yougoslavie Slovénie  ⊑  Ex-Yougoslavie Zone de sécurité  ≡   ∃ créé_pendant .Conflit des Balkans Personne  ⊑   T Général  ⊑  Personne Philippe Morillon  ⊑  Général Philippe Morillon  ≡   ∃ originaire_de .France
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Représentation des requ êtes Correspondance Indexation Interrogation Requ ête ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- Ressources  externes
Représentation des requ êtes ,[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],R q   ≡   ∃ indexé_par . edim 1   ⊓   …  ⊓   ∃ indexé_par . edim n ,[object Object],[object Object],[object Object],[object Object],[object Object]
Exemple ,[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Exemple 18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],T-Box R doc T Événement  ⊑   T Conflit des Balkans  ⊑  Evénement Guerre civile d’Ex-Yougoslavie  ⊑  Conflit des Balkans Conflit des Balkans  ≡   ∃ a_lieu_à .Balkans Lieu géographique  ⊑   T France  ⊑  Lieu géographique Balkans  ⊑  Lieu géographique Ex-Yougoslavie  ⊑  Lieu géographique Ex-Yougoslavie  ≡   ∃ partie_de .Balkans Zone de sécurité  ⊑  Lieu géographique Serbie  ⊑  Ex-Yougoslavie Slovénie  ⊑  Ex-Yougoslavie Zone de sécurité  ≡   ∃ créé_pendant .Conflit des Balkans Personne  ⊑   T Général  ⊑  Personne Philippe Morillon  ⊑  Général Philippe Morillon  ≡   ∃ originaire_de .France R q
18 juillet 2008 © S.  Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Correspondance Correspondance Indexation Interrogation Requ ête ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- ---- ---  -------- ----- -------- Ressources  externes
La fonction de correspondance  f Sel ,[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani q  : une requête R doc doc  : un document R q ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],T-Box correspondance ⊑ T Physical query Physical query Physical query Physical query Physical query Physical query Physical query Physical document Physical document Physical document Physical document Physical document Physical document Physical document Physical document
La fonction de correspondance  f Sel 18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],T-Box ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],R doc R q
La fonction de correspondance  f Sel 18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],T-Box R doc R q Philippe Morillon  ⊑  Général Zone de sécurité  ≡   ∃ créé_pendant .Conflit des Balkans Philippe Morillon  ≡   ∃ originaire_de .France Guerre civile d’Ex-Yougoslavie  ⊑  Conflit des Balkans  Philippe Morillon Zone de sécurité  ⊓  ∃ créé_pendant .Guerre civile d’Ex-Yougoslavie Général  ⊓   ∃ originaire_de .France Conflit des Balkans Guerre civile d’Ex-Yougoslavie   Zone de sécurité  ⊓   ∃ créé_pendant .Conflit des Balkans
La fonction de correspondance  f Sel 18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],T-Box R doc R q Philippe Morillon  ⊑  Général Zone de sécurité  ≡   ∃ créé_pendant .Conflit des Balkans Philippe Morillon  ≡   ∃ originaire_de .France Guerre civile d’Ex-Yougoslavie  ⊑  Conflit des Balkans  Philippe Morillon Zone de sécurité  ⊓  ∃ créé_pendant .Guerre civile d’Ex-Yougoslavie Général  ⊓   ∃ originaire_de .France Conflit des Balkans Guerre civile d’Ex-Yougoslavie   Zone de sécurité  ⊓   ∃ créé_pendant .Conflit des Balkans R doc   ⊑ T   R q
La fonction d’ordonnancement  f Ord ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani
Expériences ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Données et ressources ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Indexation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Interrogation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Apport de l’usage des dimensions 18 juillet 2008 © S.  Radhouani % à 10 docs % à 5 docs % Moyenne Précision Test +32.78 0.3240 +29.41 0.3520 +8.82 0.1579 T3 +60.65 0.3920 +44.11 0.3920 +20.05 0.1742 T4 +27.86 0.3120 +23.52 0.3360 +5.72 0.1534 T2 +36.59 0.3333 +29.55 0.3524 -1.61 0.1428 T1 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Précision Test Moyenne à 5 docs à 10 docs Baseline 0.1451 0.2720 0.2440
Mise en œuvre du modèle ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani
Conclusion ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Conclusion ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Perspectives ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],18 juillet 2008 © S.  Radhouani ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Un modèle de Recherche d’Information  orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe Saïd Radhouani 18 juillet 2008

Contenu connexe

Tendances

APPROBATION PLANS DE POSTE.pptx
APPROBATION PLANS DE POSTE.pptxAPPROBATION PLANS DE POSTE.pptx
APPROBATION PLANS DE POSTE.pptxmohamed896991
 
Méthodologie recherche action participative
Méthodologie recherche action participativeMéthodologie recherche action participative
Méthodologie recherche action participativeGCAF
 
Smart intelligent aircraft structures
Smart intelligent aircraft structuresSmart intelligent aircraft structures
Smart intelligent aircraft structuresvikalpdongre
 
Hypothèse et cadre opératoire
Hypothèse et cadre opératoireHypothèse et cadre opératoire
Hypothèse et cadre opératoireHervé Stecq
 
PillarHall Test Chip introduction update 2018
PillarHall Test Chip introduction update 2018PillarHall Test Chip introduction update 2018
PillarHall Test Chip introduction update 2018Mikko Utriainen
 
Projet efficacité-version-finale
Projet efficacité-version-finaleProjet efficacité-version-finale
Projet efficacité-version-finaleomar bllaouhamou
 

Tendances (8)

APPROBATION PLANS DE POSTE.pptx
APPROBATION PLANS DE POSTE.pptxAPPROBATION PLANS DE POSTE.pptx
APPROBATION PLANS DE POSTE.pptx
 
Méthodologie recherche action participative
Méthodologie recherche action participativeMéthodologie recherche action participative
Méthodologie recherche action participative
 
Thesis Defense
Thesis DefenseThesis Defense
Thesis Defense
 
Smart intelligent aircraft structures
Smart intelligent aircraft structuresSmart intelligent aircraft structures
Smart intelligent aircraft structures
 
Hypothèse et cadre opératoire
Hypothèse et cadre opératoireHypothèse et cadre opératoire
Hypothèse et cadre opératoire
 
PillarHall Test Chip introduction update 2018
PillarHall Test Chip introduction update 2018PillarHall Test Chip introduction update 2018
PillarHall Test Chip introduction update 2018
 
La conduction
La conductionLa conduction
La conduction
 
Projet efficacité-version-finale
Projet efficacité-version-finaleProjet efficacité-version-finale
Projet efficacité-version-finale
 

Plus de Saïd Radhouani

Anatomy of Search Relevance: From Data To Action
Anatomy of Search Relevance: From Data To ActionAnatomy of Search Relevance: From Data To Action
Anatomy of Search Relevance: From Data To ActionSaïd Radhouani
 
PhD Dissertation - Manuscrit de thèse de doctorat
PhD Dissertation - Manuscrit de thèse de doctoratPhD Dissertation - Manuscrit de thèse de doctorat
PhD Dissertation - Manuscrit de thèse de doctoratSaïd Radhouani
 
Publication de documents sur le Web
Publication de documents sur le WebPublication de documents sur le Web
Publication de documents sur le WebSaïd Radhouani
 
Introduction à l\'e-learnining
Introduction à l\'e-learniningIntroduction à l\'e-learnining
Introduction à l\'e-learniningSaïd Radhouani
 
Active Server Pages (ASP)
Active Server Pages (ASP)Active Server Pages (ASP)
Active Server Pages (ASP)Saïd Radhouani
 
Introduction aux technologies du Web (2)
Introduction aux technologies du Web (2)Introduction aux technologies du Web (2)
Introduction aux technologies du Web (2)Saïd Radhouani
 
Introduction aux technologies du Web (1)
Introduction aux technologies du Web (1)Introduction aux technologies du Web (1)
Introduction aux technologies du Web (1)Saïd Radhouani
 
Apprendre Solr en deux heures
Apprendre Solr en deux heuresApprendre Solr en deux heures
Apprendre Solr en deux heuresSaïd Radhouani
 
Introduction à la Recherche d'information
Introduction à la Recherche d'informationIntroduction à la Recherche d'information
Introduction à la Recherche d'informationSaïd Radhouani
 

Plus de Saïd Radhouani (18)

Anatomy of Search Relevance: From Data To Action
Anatomy of Search Relevance: From Data To ActionAnatomy of Search Relevance: From Data To Action
Anatomy of Search Relevance: From Data To Action
 
PhD Dissertation - Manuscrit de thèse de doctorat
PhD Dissertation - Manuscrit de thèse de doctoratPhD Dissertation - Manuscrit de thèse de doctorat
PhD Dissertation - Manuscrit de thèse de doctorat
 
Conception de sites Web
Conception de sites WebConception de sites Web
Conception de sites Web
 
Publication de documents sur le Web
Publication de documents sur le WebPublication de documents sur le Web
Publication de documents sur le Web
 
Introduction à XML
Introduction à XMLIntroduction à XML
Introduction à XML
 
Introduction à l\'e-learnining
Introduction à l\'e-learniningIntroduction à l\'e-learnining
Introduction à l\'e-learnining
 
Documents intéractifs
Documents intéractifsDocuments intéractifs
Documents intéractifs
 
Introduction à XML
Introduction à XMLIntroduction à XML
Introduction à XML
 
Active Server Pages (ASP)
Active Server Pages (ASP)Active Server Pages (ASP)
Active Server Pages (ASP)
 
Serveur Web (1)
Serveur Web (1)Serveur Web (1)
Serveur Web (1)
 
Serveur Web (2)
Serveur Web (2)Serveur Web (2)
Serveur Web (2)
 
SPIP
SPIPSPIP
SPIP
 
PHP & MySQL
PHP & MySQLPHP & MySQL
PHP & MySQL
 
Introduction à PHP
Introduction à PHPIntroduction à PHP
Introduction à PHP
 
Introduction aux technologies du Web (2)
Introduction aux technologies du Web (2)Introduction aux technologies du Web (2)
Introduction aux technologies du Web (2)
 
Introduction aux technologies du Web (1)
Introduction aux technologies du Web (1)Introduction aux technologies du Web (1)
Introduction aux technologies du Web (1)
 
Apprendre Solr en deux heures
Apprendre Solr en deux heuresApprendre Solr en deux heures
Apprendre Solr en deux heures
 
Introduction à la Recherche d'information
Introduction à la Recherche d'informationIntroduction à la Recherche d'information
Introduction à la Recherche d'information
 

PhD Defense Presentation - Soutenance de thèse

  • 1. Un modèle de Recherche d’Information orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe Saïd Radhouani 18 juillet 2008
  • 2. 18 juillet 2008 © S. Radhouani Langage d’interrogation Langage d’indexation Documents ordonnés Contexte Correspondance Objectif : Sélectionner les documents pertinents qui traitent du thème de la requête. Indexation Interrogation Requ ête ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- -------- ---- --- -------- ----- --------
  • 3.
  • 4. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans.
  • 5. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
  • 6. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Le SRI a besoin de connaissances, autres que celles présentes dans le texte . Y a-t-il des éléments, autres que les descripteurs , qu’un document doit partager avec la requ ête pour qu’il soit considéré pertinent ? Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
  • 7. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Conflit des Balkans est_un créé_pendant Balkans partie_de Zone de sécurité Ex-Yougoslavie Général est_un originaire_de Philippe Morillon France a_lieu_à Guerre civile d’Ex-Yougoslavie Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Zone de sécurité Balkans Conflit des Balkans
  • 8. Problématique 18 juillet 2008 © S. Radhouani … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Document Requête [CLEF05] Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Personne Lieu Géographique Evénement Conflit des Balkans est_un créé_pendant Balkans partie_de Zone de sécurité Ex-Yougoslavie Général est_un originaire_de Philippe Morillon France a_lieu_à Guerre civile d’Ex-Yougoslavie Guerre civile d’Ex-Yougoslavie Conflit des Balkans Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Général Français Zone de sécurité Balkans
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52. Un modèle de Recherche d’Information orienté précision fondé sur les dimensions de domaine Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe Saïd Radhouani 18 juillet 2008

Notes de l'éditeur

  1. L’objectif de la RI est de sélectionner les documents qui traitent le mieux possible du thème de la requ ête Une phase d’indexation => créer une représentation du contenu des documents en se basant sur un langage d’indexation Une phase d’interrogation => créer une représentation du contenu de la requête en se basant sur un langage d’interrogation Une phase de correspondance qui permet de retrouver les documents pertinents pour la requête. cette phase contient une fonction de sélection et une fonction d’ordonnancement des documents en fonction de leur ordre de pertinence par rapport à la requête.
  2. Nous nous plaçons dans un contexte de recherche o ù l’utilisateur décrit un besoin précis. Ce contexte est typiquement celui des milieux professionnels… RI dans un milieu professionnel o ù la tâche de RI fait partie de la tâche professionnelle. Durant leur recherche, les professionnels exprimes un besoin à travers une requête précise. « Précise » dénote une requête qui a les deux caractéristiques suivante : Terminologie spécialisée & Structure sémantique complexe Comment satisfaire, à partir de l’information brute, une requ ête Précise formulée par un utilisateur qui s’intéresse à un domaine particulier ?
  3. 1er problème : intersection nulle => utiliser des relations, définies à travers des ressources externes 2ème problème : sac de concepts => utiliser les dimensions pour avoir une nouvelle intersection Pour atteindre l’objectif de la RI, les approches existantes s'appuient sur des méthodes purement statistiques basées sur la distribution des mots-clés, pour calculer la similarité entre la requ ête et les documents. la pertinence d’un document par rapport à une requête est calculée en fonction de la similarité vocabulaire et non pas en fonction de la similarité thématique qui existe entre le document et la requête. !!!!!! La compréhension est vue comme un processus d'inférence visant à expliciter tout l'implicite présent d'un texte en le retrouvant à partir des connaissances sémantiques et pragmatiques dont disposait la machine. Cela présupposait une modélisation préalable de ces connaissances. Besoin de RE pour inférer que Philippe Morillon est un général originaire de France Approches de la RI classique : méthodes statistiques RI basé sur les mots-clés Documents et requêtes représentés par une liste de mots; Chercher les documents qui contiennent les mêmes mots que la requête : Approches sac de mots; Pertinence: document partager les m êmes mots avec la requête RI basé sur les concepts documents et requ êtes : représentés dans le même référentiel Partager les m êmes concepts Les relations sémantiques qui peuvent exister entre les concepts ne sont pas exploitées => Fossé entre l’objectif et la méthode : Ne cherche pas les documents ayant une certaine signification. => Hypothèse implicite de la RI classique : Il y a une correspondance stricte entre les mots et les sens.
  4. 1er problème : intersection nulle => utiliser des relations, définies à travers des ressources externes 2ème problème : sac de concepts => utiliser les dimensions pour avoir une nouvelle intersection Pour atteindre l’objectif de la RI, les approches existantes s'appuient sur des méthodes purement statistiques basées sur la distribution des mots-clés, pour calculer la similarité entre la requ ête et les documents. la pertinence d’un document par rapport à une requête est calculée en fonction de la similarité vocabulaire et non pas en fonction de la similarité thématique qui existe entre le document et la requête. !!!!!! La compréhension est vue comme un processus d'inférence visant à expliciter tout l'implicite présent d'un texte en le retrouvant à partir des connaissances sémantiques et pragmatiques dont disposait la machine. Cela présupposait une modélisation préalable de ces connaissances. Besoin de RE pour inférer que Philippe Morillon est un général originaire de France Approches de la RI classique : méthodes statistiques RI basé sur les mots-clés Documents et requêtes représentés par une liste de mots; Chercher les documents qui contiennent les mêmes mots que la requête : Approches sac de mots; Pertinence: document partager les m êmes mots avec la requête RI basé sur les concepts documents et requ êtes : représentés dans le même référentiel Partager les m êmes concepts Les relations sémantiques qui peuvent exister entre les concepts ne sont pas exploitées => Fossé entre l’objectif et la méthode : Ne cherche pas les documents ayant une certaine signification. => Hypothèse implicite de la RI classique : Il y a une correspondance stricte entre les mots et les sens.
  5. 1er problème : intersection nulle => utiliser des relations, définies à travers des ressources externes 2ème problème : sac de concepts => utiliser les dimensions pour avoir une nouvelle intersection Pour atteindre l’objectif de la RI, les approches existantes s'appuient sur des méthodes purement statistiques basées sur la distribution des mots-clés, pour calculer la similarité entre la requ ête et les documents. la pertinence d’un document par rapport à une requête est calculée en fonction de la similarité vocabulaire et non pas en fonction de la similarité thématique qui existe entre le document et la requête. !!!!!! La compréhension est vue comme un processus d'inférence visant à expliciter tout l'implicite présent d'un texte en le retrouvant à partir des connaissances sémantiques et pragmatiques dont disposait la machine. Cela présupposait une modélisation préalable de ces connaissances. Besoin de RE pour inférer que Philippe Morillon est un général originaire de France Approches de la RI classique : méthodes statistiques RI basé sur les mots-clés Documents et requêtes représentés par une liste de mots; Chercher les documents qui contiennent les mêmes mots que la requête : Approches sac de mots; Pertinence: document partager les m êmes mots avec la requête RI basé sur les concepts documents et requ êtes : représentés dans le même référentiel Partager les m êmes concepts Les relations sémantiques qui peuvent exister entre les concepts ne sont pas exploitées => Fossé entre l’objectif et la méthode : Ne cherche pas les documents ayant une certaine signification. => Hypothèse implicite de la RI classique : Il y a une correspondance stricte entre les mots et les sens.
  6. 1er problème : intersection nulle => utiliser des relations, définies à travers des ressources externes 2ème problème : sac de concepts => utiliser les dimensions pour avoir une nouvelle intersection Pour atteindre l’objectif de la RI, les approches existantes s'appuient sur des méthodes purement statistiques basées sur la distribution des mots-clés, pour calculer la similarité entre la requ ête et les documents. la pertinence d’un document par rapport à une requête est calculée en fonction de la similarité vocabulaire et non pas en fonction de la similarité thématique qui existe entre le document et la requête. !!!!!! La compréhension est vue comme un processus d'inférence visant à expliciter tout l'implicite présent d'un texte en le retrouvant à partir des connaissances sémantiques et pragmatiques dont disposait la machine. Cela présupposait une modélisation préalable de ces connaissances. Besoin de RE pour inférer que Philippe Morillon est un général originaire de France Approches de la RI classique : méthodes statistiques RI basé sur les mots-clés Documents et requêtes représentés par une liste de mots; Chercher les documents qui contiennent les mêmes mots que la requête : Approches sac de mots; Pertinence: document partager les m êmes mots avec la requête RI basé sur les concepts documents et requ êtes : représentés dans le même référentiel Partager les m êmes concepts Les relations sémantiques qui peuvent exister entre les concepts ne sont pas exploitées => Fossé entre l’objectif et la méthode : Ne cherche pas les documents ayant une certaine signification. => Hypothèse implicite de la RI classique : Il y a une correspondance stricte entre les mots et les sens.
  7. 1er problème : intersection nulle => utiliser des relations, définies à travers des ressources externes 2ème problème : sac de concepts => utiliser les dimensions pour avoir une nouvelle intersection Pour atteindre l’objectif de la RI, les approches existantes s'appuient sur des méthodes purement statistiques basées sur la distribution des mots-clés, pour calculer la similarité entre la requ ête et les documents. la pertinence d’un document par rapport à une requête est calculée en fonction de la similarité vocabulaire et non pas en fonction de la similarité thématique qui existe entre le document et la requête. !!!!!! La compréhension est vue comme un processus d'inférence visant à expliciter tout l'implicite présent d'un texte en le retrouvant à partir des connaissances sémantiques et pragmatiques dont disposait la machine. Cela présupposait une modélisation préalable de ces connaissances. Besoin de RE pour inférer que Philippe Morillon est un général originaire de France Approches de la RI classique : méthodes statistiques RI basé sur les mots-clés Documents et requêtes représentés par une liste de mots; Chercher les documents qui contiennent les mêmes mots que la requête : Approches sac de mots; Pertinence: document partager les m êmes mots avec la requête RI basé sur les concepts documents et requ êtes : représentés dans le même référentiel Partager les m êmes concepts Les relations sémantiques qui peuvent exister entre les concepts ne sont pas exploitées => Fossé entre l’objectif et la méthode : Ne cherche pas les documents ayant une certaine signification. => Hypothèse implicite de la RI classique : Il y a une correspondance stricte entre les mots et les sens.
  8. Formalisme de représentation de connaissances pour représenter plus de sémantique lors de l’indexation Avoir une représentation uniforme des documents, requ êtes, et de la ressource externe Ceci peu être atteint en utilisant un formalisme de représentation de connaissances permettant de représenter les documents, requêtes, et les connaissances du système Ce formalisme doit proposer une opération de comparaison jouant le rôle de la fonction de correspondance Doit prendre en compte les exigences des utilisateurs en termes d’opérateurs (booléens, quantificateur, jauge, etc.)
  9. Expansion  "aveugle"[ Voorhees94, Mihalcea00, Baziz et al.03] -- Expansion "prudente" [Qiu et Frei93, Baziz05] ++
  10. 1 - Utilisation des RE pour la RI Trois facteurs: Qualité de la RE Qualité du désambigu ïseur Modèle RI (comment interpréter le contenu sémantique du document/requête? comment calculer la correspondance) Notre contribution se situe au niveau du troisième facteur 2 - Utilisation des dimensions Principalement des interfaces Construction de dimensions Notre contribution: langage de document/requ ête expressif
  11. Besoin des ressources externes Souhaitable d’avoir une représentation uniforme des documents, requ êtes, et la ressource externe Ceci peut être atteint en utilisant un formalisme de représentation de connaissances commun à ces trois éléments Doit proposer une opération de comparaison jouant le r ôle de la fonction de correspondance Doit prendre en compte les exigences des utilisateurs en termes d’opérateurs (booléens, quantificateurs, etc.)
  12. Il existe plusieurs formalismes tels que les aborescences sémantiques et les Graphes conceptuels. Pourquoi pas les GC ? les quantificateurs sont très difficiles à implémenter dans les GC - les GC sont très difficiles à construire à partir du texte; - l’interprétation ensembliste des LD est très simple à implmenter et => moins de complexité que les GC - Le méchanisme de maching est plus simple dans les DL que dans les GC L’ALCQ est une logique parmi d’autres. Nous l’avons choisi parce quelle satisfait nos besoins. Former des concepts/r ôles  utiliser des constructeurs conjonction ( ⊓ ), disjonction ( ⊔ ) ; quantificateurs : existentiel ( ∃ R.C), universel ( ∀ R.C) ; etc. les personnes originaires de France : Personne ⊓ ∃ originaire_de . France toutes les personnes dont les enfants sont des filles : Personne ⊓ ∀ a-enfant. Féminin les mères qui ont au moins trois enfants : Femme ⊓ ≥ 3a - enfant .Personne Les DLs adoptent toutes une sémantique reposant sur une interprétation ensembliste des termes. Ce procédé est connu sous l’appellation de sémantique dénotationnelle (denotational semantics). Ils introduisent ainsi une interprétation I = (  I , . I ) qui consiste en un ensemble non vide  I appelé le domaine de discours de I , et en une fonction . I qui associe pour chaque nom de concept C un ensemble C I ⊆  I , et pour chaque nom de rôle R , une relation binaire R I ⊆  I x  I . Une interprétation I satisfait le GCI C ⊑ D si C I ⊆ D I . I satisfait la T-Box T , si I satisfait tous les GCIs dans T . Dans ce cas, I est appelé modèle de T . Un élément d  C I est appelé une instance de C . Pour deux individus d et e , si ( d, e )  R I , alors e est appelé un R-successeur de d . DLs ~ sémantique reposant sur une interprétation ensembliste ( sémantique dénotationnelle ) Une interprétation I = (  I , . I )  I : domaine de discours de I . I : une fonction assignant Concept C --> ensemble C I ⊆  I ; R ôle R --> relation binaire R I ⊆  I x  I ex. Général ⊓ ∃ originaire_de . France => Général I  originaire_de I . France I Général I = { c   I | c ⊑ Général} originaire_de I . France I = { c   I | ( c, France)  originaire_de I } I satisfait C ⊑ D si C I ⊆ D I I est un modèle de T si I satisfait tous les axiomes de la T-Box T
  13. DL & RI Corpus = sous-ensemble du domaine de discours document/requ ête = concept Un document d ( q ) sera représenté dans un domaine de discours K par son index dI ( qI ) qui est une expression ALCQ . dI est une abstraction (représentation) d’un ensemble de documents qui ont le même contenu Les documents physiques représentent alors les instances de dI Conformément à la terminologie des DL , la correspondance entre une requête q et un document d se calcule par la relation de subsomption: Le concept dI est subsumé par le concept qI : dI ⊑ K qI Ainsi, le SRI extrait les documents dont l’index est subsumé par le concept qI .
  14. Notre modèle est basé sur l’utilisateur. Pour cette raison, il faut prendre en compte ses besoin d’information lors m ême de l’indexation.
  15. Re-parler de la définition des dimensions et l’idée derrière leur utilisation !!!
  16. Afin de représenter la base des documents avec des éléments de dimensions, nous utilisons la T-Box T où chaque document sera représenté par un concept qui représente la conjonction d’un ensemble d’éléments de dimensions. Nous proposons le rôle indexé_par qui permet d’associer un élément de dimension à un document.
  17. Opérateurs d’interrogation booléen : conjonction, disjonction, négation obligatoire, optionnel, priorité quantificateurs
  18. expliquer l'algorithme de calcul de subsomption, comment il marche, sa complexité, les problèmes que ça pose, quelles sont les limites et qui est-ce qu'il faut faire pour que ça marche sur une grande échelle. Illustrer son fonctionnement sur cette exemple.
  19. expliquer l'algorithme de calcul de subsomption, comment il marche, sa complexité, les problèmes que ça pose, quelles sont les limites et qui est-ce qu'il faut faire pour que ça marche sur une grande échelle. Illustrer son fonctionnement sur cette exemple.
  20. expliquer l'algorithme de calcul de subsomption, comment il marche, sa complexité, les problèmes que ça pose, quelles sont les limites et qui est-ce qu'il faut faire pour que ça marche sur une grande échelle. Illustrer son fonctionnement sur cette exemple.
  21. expliquer l'algorithme de calcul de subsomption, comment il marche, sa complexité, les problèmes que ça pose, quelles sont les limites et qui est-ce qu'il faut faire pour que ça marche sur une grande échelle. Illustrer son fonctionnement sur cette exemple.
  22. Les poids des éléments de dimension dans doc  : plus le poids des éléments de dimension partagés par q et doc est grand, plus la valeur de pertinence de doc est élevée par rapport à q  ; Les poids des éléments de dimension dans q  : plus doc contient des éléments de dimension dont le poids est élevé dans q , plus la valeur de pertinence de doc est grande ; Les valeurs de priorité des éléments de dimension dans q  : un document contenant un élément de dimension dont la valeur de priorité est égale à  est plus pertinent qu’un document contenant un élément de dimension dont la valeur de priorité est égale à  +1.
  23. Ça ne remplace pas le modèle vectoriel!
  24. On ne peut pas comparer nos résultats avec ceux des participants à CLEF vu que l’on travaille seulement sur la partie en anglais, en faisant l’indexation conceptuelle
  25. Le faite de structurer une ressource externe en dimensions permet d’enrichir son contenu en créant des catégories sémantiques de concepts au sein d’un domaine. ceci permet de mettre en exergue les éléments pertinents dans un domaine particulier Indexation: structurer le contenu de document et permettre ainsi d’indexer le document en extrayant les éléments pertinents pour l’utilisateur Interrogation: ca permet de structure le contenu d’une requ ête ce qui permet d’extraire les éléments nécessaires à sa compréhiension et favoriser ainsi une interprétation précise de son contenu sémantique Un langage de requêtes expressif permettant à l’utilisateur d’exprimer des requêtes précises. utiliser des dimensions, des concepts, des relations, et des opérateurs pour détailler davantage son besoin en information. Afin de définir notre modèle, nous avons choisi un formalisme de représentation de connaissances adéquat qui permet la représentation précise des documents et des requêtes. Il s’agit de la logique descriptive. C’est une solution parmi d’autres, comme elle a ses avantages, elle a aussi ses limites
  26. Fonction de correspondance Correspondance entre un document et une requ ête qui ne partagent pas les mêmes termes ++ Performances ~ dépendent de la qualité de la conception de la ressource externe La subsomption n’est pas suffisante ex. fracture de la jambe vs. fracture de la hanche => Définir des propriétés transitives edim 1 ≡ Fracture ⊓ ∃ affect. ∃ partie_de. Jambe edim 2 ≡ Fracture ⊓ ∃ affect. ∃ partie_de. Hanche Si Partie_de est transitive et Hanche ≡  "… ⊓ partie_de .Jambe" => edim 1 ⊑ edim 2 Flexibilité : utiliser n’importe quelle relation … mais La négation ≠ absence => indexer explicitement la négation
  27. Éventuellement donner quelques pistes : comment construire les éléments de dimensions Fonction d’ordonnancement Correspondance entre un document et une requ ête qui ne partagent pas les mêmes concepts => RSV nulle ex. Général français <=> Philippe Morillon Est-ce que l’ordonnancement est indispensable dans un contexte de RI précise ? La correspondance est censée ne retourner que des documents très pertinents Est-ce que la notion de pertinence est la même que celle qui est utilisée dans la RI générale ? ex. "la liste des joueurs de l’équipe de Rugby de France" Définir la notion de pertinence dans un contexte de RI précise Collaborer avec des professionnels d’un domaine particulier