HDR

3 974 vues

Publié le

Habilitation à Diriger les Recherches Fabien Gandon

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
3 974
Sur SlideShare
0
Issues des intégrations
0
Intégrations
10
Actions
Partages
0
Téléchargements
111
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

HDR

  1. 1. Graphes RDF et leur Manipulation  pour la Gestion de Connaissances soutenance d’Habilitation à Diriger les Recherches. Fabien L. Gandon, Edelweiss, Inria n² n n
  2. 2. µCV INSA : ingénieur maths appliquées et DEA images & SB connaissances. ACACIA, INRIA : doctorant IA distribuée  & web sémantique pour mémoires  d’entreprises à base d’ontologies. Carnegie‐Mellon University : post‐doc  sur accès mobiles aux services & vie  privée. EDELWEISS, INRIA : CR, communautés. 2
  3. 3. matérialiser et utiliser des mémoires collectives •hybrides : documents‐représentations •intrawebs sémantiques, communautés •représentations et traitements à base de graphes •serveurs de connaissances distribué(e)s •utilisation et interaction 3
  4. 4. 1, mémoires numériques collectives 4
  5. 5. cube(x) cube(y) cube(z) couleur(x, bleu) couleur(y, jaune) couleur(z, rouge) droite(z, y)   droite(y, x) ontologie: o cube() couleur(,) gauche(,) o cube(?a)⇒objet(?a) o gauche(?a,?b)⇔droite(?b,?a) 5
  6. 6. • conceptualisation partielle • propriétés de catégories • formalisation pour traitement ontologie 6
  7. 7. = personnalisés  accès mobiles à des services de CMU  [NSF & DARPA] 7
  8. 8. 8
  9. 9. [INRIA & I3S] un wiki dans le web sémantique 9
  10. 10. 10
  11. 11. Knowledge Management Platform pour la gestion des partenariats sur Sophia [RNRT] 11
  12. 12. 12
  13. 13. 2, représenter des connaissances et  les doter d’une  inscription numérique 13
  14. 14. W3C© 14
  15. 15. W3C© 15
  16. 16. W3C® 16
  17. 17. RDF, toute connaissance est décomposée en triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud ) 17
  18. 18. ex : doc.html a pour auteur Fabien et a pour thème la Musique 18
  19. 19. doc.html a pour auteur Fabien doc.html a pour thème Musique 19
  20. 20. Fabien auteur doc.html  thème Musique 20
  21. 21. graphes du web sémantique 21
  22. 22. GRIWES [COLOR, LIRMM, I3S] Graphes dans les Représentations et les  Inférences sur le Web et Systèmes symboliques 22
  23. 23. ERGraph G=(EG, RG, nG, lG) • EG entités • RG hyperarcs • nG : RG → EG* arguments • lG : EG ∪ RG → L étiquettes 23
  24. 24. EMapping une relation binaire qui associe chaque  élément d’un ERGraph EH avec au plus un élément d’un ERGraph EG 24
  25. 25. vissés(x,y) soudés(z,v) vissés(y,z) soudés(z,u) * vissés vissés soudés(u,v) x z y vissés vissés vissés(x,?p)   vissés(?p,z) x z soudés soudés u v 25
  26. 26. langage de requête SPARQL SELECT ... FROM ... WHERE { ... } 26
  27. 27. RDFS pour définir les classes de  ressources et organiser leur  hiérarchie Document Rapport 27
  28. 28. RDFS pour définir les relations,  leur hiérarchie et leurs  signatures créateur auteur Document Personne 28
  29. 29. véhicule véhicule GR O voiture(x)⇒véhicule(x) voiture voiture GF F∧Omodulo une ontologie F ≤ GR mapping →R⇔G 29
  30. 30. EMapping opération centrale : interroger, raisonner, visualiser, …   30
  31. 31. extension de RDF/XML pour déclarer la  http://.../rdfsource.html provenance dc:title dc:creator http://...#me RDF Source foaf:mbox rdf:type foaf:name mailto:fgandon@inria.fr foaf:Person Fabien Gandon 31
  32. 32. extension de RDF/XML pour déclarer la  http://.../rdfsource.html provenance dc:title http://www.w3.org dc:creator http://www.w3.org http://...#me RDF Source foaf:mbox rdf:type foaf:name http:// www.inria.fr http:// www.inria.fr http:// www.inria.fr mailto:fgandon@inria.fr foaf:Person Fabien Gandon 32
  33. 33. 3, espaces métriques des graphes de  connaissances 33
  34. 34. distances sémantiques métaphore mathématique pour une comparaison  intuitive 34
  35. 35. simuler la mémoire sémantique est une idée ancienne (Quillian, 1968) (Collins & Loftus, 1975) mais avec de nouveaux besoins 35
  36. 36. ma montre n'a qu'une aiguille mais elle n'est pas cassée. de l'intérêt d'un à peu près 36
  37. 37. projection  classique véhicule voiture(x)⇒véhicule(x) voiture t1 < t2 i.e.     t1(x)⇒t2(x)     T1 ⊂ T2 37
  38. 38. relaxer  une contrainte de typage voiture voiture(x) .... camion(x) camion t1(x)⇒t2(x)    → d(t1,t2)<seuil ( ∀(t1 , t2 ) ∈ H c on a dist (t1 , t2 ) = min{t ≥t1 ,t ≥t 2 } lH c (t1 , t ) + lH c (t2 , t ) 2 ) ⎡ 1 ⎤ ∀(t1 , t 2 ) ∈ H c ; t1 ≤ t 2 on a l H c (t1 , t 2 ) = ∑{t∈ t ,t 2 ,t ≠ t1 } ⎢ depth ( t ) ⎥ 1 2 ⎣2 ⎦ 38
  39. 39. organiser un tas d'objets 39
  40. 40. Clusters (groups of bubbles) represent complementary competencies i.e. similar from technology stand point Market : Telecoms Bubbles (circles) represent similar competences ; their size represent their frequency Market : SI Market : IT Applications organiser des compétences Prof. 2 Racines (38 termes) Prof. 2 Compétences (36 termes) Echanges (70 termes) Actions (116 termes) Délivrables (145 termes) Prof. 12 Sys. Offres (120 termes) Ressources (616 termes) +3 +41 +43 +180 40
  41. 41. distCH (t1, t2 ) = max ∀st ≤ lcst ( t1 , t 2 ) (dist(st, lcst(t1, t2 ))) quand t1 ≠ t2 distCH (t1 , t2 ) = 0 quand t1 = t2 1.7 5 1 1 1 dist (t1 , t2 ) = depth ( lcst ( t ,t )) − 2 − depth ( t ) −1 − depth ( t 2 ) −1 2 1 2 2 2 1 .75 .5 .25 A B C D E F G H I J K L M N 0 organiser des compétences Prof. 2 Racines (38 termes) Prof. 2 Compétences (36 termes) Echanges (70 termes) Actions (116 termes) Délivrables (145 termes) Prof. 12 Sys. Offres (120 termes) Ressources (616 termes) +3 +41 +43 +180 41
  42. 42. 42
  43. 43. séparer deux aspects   métaphore mathématique les « distances » au naturel  simulations informatiques espaces & métriques, double conception 43
  44. 44. tester    les « distances » au naturel  44
  45. 45. tester    les distances au naturel  camion... 45
  46. 46. intension & intention d'usage utilisables dans un même graphe concis sous‐type‐et‐signature Technologie Réseau Appareil Sans-fil Téléphone connexion GSM Wifi Cellulaire Définition formelle de l’espace (métrique) : domain(Tp, Tx) ⇒ sous‐type‐et‐signature (Tp, Tx, wsig) range(Tp, Tx) ⇒ sous‐type‐et‐signature (Tp, Tx, wsig) subClassOf(Ty, Tx) ⇒ sous‐type‐et‐signature(Ty, Tx, wclass) subPropertyOf(Ty, Tx) ⇒ sous‐type‐et‐signature(Ty, Tx, wprop) sous‐type‐et‐signature(Tx,Ty, w) ⇔ sous‐type‐et‐signature(Tx,Ty, w) 46
  47. 47. intension & intention d'usage désambigüiser l'extraction de termes 90,00 80,00 70,00 60,00 50,00 [Khelif et al.] wclass 0.2 wprop 0.4 wsig 0.4 Définition formelle de l’espace (métrique) : domain(Tp, Tx) ⇒ sous‐type‐et‐signature (Tp, Tx, wsig) range(Tp, Tx) ⇒ sous‐type‐et‐signature (Tp, Tx, wsig) subClassOf(Ty, Tx) ⇒ sous‐type‐et‐signature(Ty, Tx, wclass) subPropertyOf(Ty, Tx) ⇒ sous‐type‐et‐signature(Ty, Tx, wprop) sous‐type‐et‐signature(Tx,Ty, w) ⇔ sous‐type‐et‐signature(Tx,Ty, w) 47
  48. 48. 4, le problème des ressources distribuées 48
  49. 49. graphes distribués 49
  50. 50. quelques serveurs identiques RDF RDF service web service web SPARQL service web application web RDF RDF 50
  51. 51. éviter le  broadcast 51
  52. 52. 52
  53. 53. index de serveur caractériser son contenu :  les étoiles et les chemins 53
  54. 54. annotation ex:A rdf:type idg:Car . ex:A es:includes ex:B . ex:B rdf:type id:Door . ex:B es:includes ex:C . ex:C rdf:type id:Window . ex:C es:fixedBy ex:D . ex:A es:height quot;1.219quot; . ex:A es:width quot;1.497quot; . ex:A es:madeOf ex:E . 54
  55. 55. étoile ex:A rdf:type idg:Car . ex:A es:includes ex:B . ex:B ex:B rdf:type id:Door . es:includes ex:C . ex:A ex:C rdf:type id:Window . ex:C es:fixedBy ex:D . ex:A es:height quot;1.219quot; . ex:A es:width quot;1.497quot; . ex:A es:madeOf ex:E . 55
  56. 56. chemin ex:A rdf:type idg:Car . ex:A ex:A es:includes ex:B . ex:B ex:B rdf:type id:Door . es:includes ex:C . ex:B ex:C rdf:type id:Window . ex:C es:fixedBy ex:D . ex:A ex:A es:height quot;1.219quot; . es:width quot;1.497quot; . ex:C ex:A es:madeOf ex:E . ex:D 56
  57. 57. 57
  58. 58. chemin d'index CI(x,y) =<t0, p0, t1, p1, t2..., pn‐1, tn> étoile d'index E(x) = ((tx, p0, t0), (tx, p1, t2)... (tx, pn, tn)) 58
  59. 59. Car A includes Door D fixedBy Bolt B madeOf Steel S 59
  60. 60. Car * includes Door * fixedBy Bolt * madeOf Steel * 60
  61. 61. parcours en profondeur à partir de chemins /  étoiles de taille 1 ; écrit en SPARQL 61
  62. 62. l’index des chemins et étoiles est une annotation RDF 62
  63. 63. connaître les autres serveurs RDF RDF RDF RDF 63
  64. 64. découpage en sous requêtes (étoiles/chemins) 64
  65. 65. 0.3% es:Bolt67 precision length unit value inch 1.3 ?x filter(!isBLANK(?x)) 65
  66. 66. • gestion de connaissances • gestion de ressources • intégration d’applications • services distribués web • des ressources comme les autres services sémantiques 66
  67. 67. services annotés et recherchés sémantiquement annuaire 2 1 3 demandeur client service fournisseur 67
  68. 68. nom Téléphone Assistante tel Téléphone → Nom nom employé assistante 68
  69. 69. ?s1 rdf:type proc:Process ?s2 rdf:type proc:Process ?s1 proc:hasInput ?input ?s2 proc:hasOutput ?output ?input sawsdl:modelRef ?inType inType ?output sawsdl:modelRef ?outType ?outType rdfs:subPropertyOf ?inType ⇒ ?s2 proc:composable ?s1 outType composable ! 69
  70. 70. ?s1 all::proc:composable[4] ?s2 ?s1 proc:hasInput ?param1 ?s2 proc:hasOutput ?param2 ?param1 sawsdl:modelRef c:employeeName ?param2 sawsdl:modelRef c:assistantName composable ? 70
  71. 71. 5, l’importance de la présentation 71
  72. 72. groupement A C N inférence & ontologie B L D M E D N F L K M G H I J E D F L K G J E F L K E G J K J 72
  73. 73. 73
  74. 74. secteurs angulaires dans le squelette taxinomique 74
  75. 75. 75
  76. 76. substituts en recherche d’information 76
  77. 77. conditions d’identité… φ(x)∧φ(y) → ( ρ(x,y) ↔ x = y ) ∀x (x ∈ α ⊃ nec (x ∈ α)) …minimales Minimal(ρ) ↔ [ρ(x,y) ↔ ∧i ti(x,y)] ∧ [ ¬∃ ρ' ; IC (ρ') ∧ [ρ'(x,y) ↔ ∧j tj(x,y)] ∧ {tj}⊂{ti}] et substitut d’affichage Minimal(ρ) ∧ [ [ρ(x,y) ↔ ∧i ti(x,y)] → ∃ S; Surrogate (S) ∧ S≡{property pj ; pj used in ti(x,y)} ] 77
  78. 78. équivalences ou définitions sous forme de  règles 01 IF [Person: ?p1]->(name)->?n 02 ->(firstname)->?f 03 ->(birthdate)->?d 04 AND [Person: ?p2]->(name)->?n 05 ->(firstname)->?f 06 ->(birthdate)->?d 07 THEN [Person:?p1]->(equivalent)- 01 IF [Person: ?p]-(govern)-[Republic: 02 THEN [President:?p] 78
  79. 79. ouvrages & auteurs ?d rdf:type ex:Document ?d ex:author ?a ?a rdf:type ex:Person ?a ex:name ?n FILTER( regex( ?n, quot;.*aiman.*quot;)) 79
  80. 80. réponse avant… • Novel (http://isbn.nu/0380789035) author Man (http://www.neilgaiman.com/) name: Gaiman • Article (http://www.asee.org/jee/papers/content.cfm?name=STEPHEN-209.pdf) author Woman (http://www.mgt.ncsu.edu/faculty/busmgt/laiman-smith.html) name: Aiman-Smith 80
  81. 81. réponse après… • Novel (http://isbn.nu/0380789035) title: American Gods date: April 30, 2002 author Man (http://www.neilgaiman.com/) name: Gaiman first name: Neil • Article (http://www.asee.org/jee/papers/content.cfm?name=STEPHEN-209.pdf) title: Algorithm for High Technology Engineering and Management Education author Woman (http://www.mgt.ncsu.edu/faculty/busmgt/laiman-smith.html) name: Aiman-Smith first name: Lynda e-mail: lynda_aiman-smith@ncsu.edu 81
  82. 82. User Interaction Agent FIPA ACL messages and OWL Content Directory Facilitator Agent (FIPA) Agent Management Agent (FIPA) e-Wallet Manager Agent Ontologist Agent Task-Specific Agents JADE platform 82
  83. 83. User Interaction Agent FIPA ACL messages and OWL Content Directory Facilitator Agent (FIPA) Agent Management Agent (FIPA) XSLT OWL (ontologies, annotations) Rules (definitions, services, privacy) Queries JESS e-Wallet Manager edition Agent results Ontologist Agent Task-Specific Agents JADE platform 83
  84. 84. • connaissance statique et dynamique • services & règles d’invocation • règles contrôle d’accès • règles de révision par abstraction ou falsification interactions minimales & confidentialité 84
  85. 85. Déclarer  Déclarer besoins élémentaires en  Faire appel  Requête contexte  Pré‐vérification  information et connaissances  des autorisations  requête  autorisations nécessaires  locales  e- Faire appel services  personnels /  Résultat Assertion Application règles Post‐vérification des  publics  connaissance autorisée de révision  autorisations  Exemple: Norman demande la position géographique de Fabien 1‐ quot;l’expéditeur de la requête est Normanquot;, quot;requête arrivée à 15H34quot; 2‐ besoins = quot;où se trouve Fabienquot; + autorisation accès localisation  3‐ (a) Norman peut‐il demander à localiser Fabien d’après ce que l’on sait? (b) quot;mes collègues de travail peuvent connaître le bâtiment où je me trouve, lorsque je suis sur le campusquot; (c) Norman est‐il un collègue de travail? Oui 4‐ Pas de réponse dans les connaissances statiques / locales. 5‐ Règles= le réseau sans‐fil permet localisation; champ ‘lieu’ de l’agenda 6‐ Fabien est‐il sur le campus?  Oui 7‐ Fabien n'est disposé à révéler que le bâtiment où il se trouve 8‐ “Fabien est dans le bâtiment Borel” 85
  86. 86. condensé • plusieurs projets de mémoires • utilisation web sémantique et contributions (RDF source) • modèles de graphes (Griwes) et  caractérisation de leurs espaces  métriques  • requêtes et services distribués  • interfaces et interactions intelligentes 86
  87. 87. présentation filtrée • gestion des connaissances et des  ontologies • gestion de sources externes  distribuées ; GRDDL • serveurs (Sewese) et applications  (SweetWiki) web sémantique ; RDFa • web sémantique & web social 87
  88. 88. • publications : Journal of Web Semantics, IEEE Intelligent  Systems, ICCS,  EKAW, ICIW, WWW/Internet, WWWC Dev  track, WikiSym ACM, ISWC, WI IEEE/ACM, AMKM AAAI,… • enseignements : Master Polytech’Nice, Licence Pro, UGB Saint Louis (Sénégal), tutoriel EGC • encadrements : 3 doctorants, 1 post‐doc, 3 ingénieurs, 9 masters • conférencier : Centrale Paris, Ecole des Mines St Etienne  Univ. Liège, W3C Seminar,  IST • standardisation : W3C: SWBPD (2004‐2006), GRDDL  (2006‐2007), SWD / RDFa TF (2006‐2008) • comités internationaux : 12 journaux, 10 conf., 13 ateliers diffusion sur 6 ans… 88
  89. 89. perspectives • continuum de schémas & ontologies  à l’état sauvage        [Limpens] • compositionײ d’espaces métriques  • index par motifs quelconques     [Basse] • sémantique–sémiotique (Fresnel ) • sémantique & réseaux sociaux  [Erétéo] • ANR ISICIL 2009‐2011 89
  90. 90. WEB science 90
  91. 91. des dizaines de milliards  de triplets en ligne, RDF a pris son envol (e.g. http://sindice.com/ ) 91
  92. 92. pour gérer une diversité rien de tel que d’utiliser une autre diversité 92
  93. 93. diversité des métadonnées pour gérer les diversités des ressources, et permettre les passages à l’échelle. … nombre des ressources, … hétérogénéité des représentations, … foule des utilisateurs, … diversité des matériels,  … multiplication des applications/services, … accélération des cycles de vie. 93
  94. 94. demain, celui qui contrôlera les métadonnées, contrôlera informations & services à toutes les échelles. 94
  95. 95. 95

×