1
CEDAR : Un système de raisonnement à grande
échelle
14/03/2016
Samir Amir
2
 2005 : Ingénieur, Université de Blida
 2006 : Master, Université de Rennes 1
 2007 : Ingénieur R&D, Thomson Corporat...
3
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualisation.
- ...
Le Web d...
4
Le Web d'aujourd'hui
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualis...
5
Le Web d'aujourd'hui
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualis...
6
Le Web d'aujourd'hui
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualis...
7
The Semantic Web is an extension of the current web in which information
is given well defined meaning, better enabling ...
8
The Semantic Web is an extension of the current web in which information
is given well defined meaning, better enabling ...
9
personne
personnalité
politique
musicien…..
ministre
président
…..
localisation
capitale
musicienpays…..
Président de
ca...
10
personne
personnalité
politique
musicien…..
ministre
président
…..
localisation
capitale
musicienpays…..
Président de
c...
11
Le Web Sémantique
personne
personnalité
politique
musicien…..
ministre
président
…..
localisation
capitale
musicienpays...
12
Comment exprimer les conaissances ?
- KL-ONE
- Order-Sorted Feature (OSF)
- Logique de Description (DL)
- …..
Web Ontol...
13
Comment exprimer les conaissances ?
Le Web Sémantique
ABox : RDF (Ressource Desciption Framawork)
Jacob Zuma président
...
14
La sémantique de OWL-DL
- Logique décidable
15
Exemple (OWL-DL)
16
Raisonneurs (DL)
- Pellet 1
- FaCT++ 2
- Racer 3
- HermiT 4
- RacerPro 3
1 : https://www.w3.org/2001/sw/wiki/Pellet
2 :...
17
Raisonnement à très grande échelle
Linked-Data : Objets connectés sous forme de graphes
Le Web de données (Linked Data)
18
Le Web de données (Linked Data)
Peut on passer à l'échelle ?
19
Algorithme de Tableau (Réponse Théorique)
- Construction explicite du modèle
- Décidable (modèle fini).
- Test de satis...
20
Algorithme de Tableau (Réponse Théorique)
21
Algorithme de Tableau (Réponse Théorique)
22
Contraintes et Évènements Dirigeant
l'Automatisation du Raisonnement
Coordinateur du projet : Hassan AIT-KACI
Objectif ...
23
Projet CEDAR (Chaire d'excellence ANR)
Contraintes et Évènements Dirigeant
l'Automatisation du Raisonnement
Coordinateu...
24
1) Order-Sorted Feature (OSF)
- Pouvoir expressif important.
- Compatible avec RDF (Web sémantique)
- Méthode de raison...
25
Order-Sorted Feature (OSF)
26
OSF (sémantique)
27
OSF (Exemples)
28
Mapping OSF - RDF
29
OSF (Sémantique)
- Conjonction
- Disjonction
- Négation
- Agrégats
- Expressions régulières
- Cardinalité
- ...
30
Dissolution des termes OSF
31
Exemple :
Dissolution des termes OSF
32
Dissolution des termes OSF
33
Règles de normalisation (raisonnement)
34
Règles de normalisation (raisonnement)
35
Méthodes de Tableaux
OSF VS Tableaux (DL)
Règles OSF
- Construction explicite du modèle
- Décidable (modèle fini).
- Pa...
36
Encodage binaire des contraintes
- Chaque concept sera représenté par un code binaire.
- Les opérations logiques sont a...
37
Encodage binaire des contraintes
- teacher est un teacher (sorte 6 )⇒
- professor est un teacher (sorte 4)⇒ teacher (00...
38
- teacher est un teacher (sorte 6 )⇒
- professor est un teacher (sorte 4)⇒ teacher (00101000)
- teacher and researcher ...
39
person (teachesAt => institution, doesResearch => laboratory)
professor (teachesAt => university, doesResearch => labor...
40
X : person (teachesAt => institution, doesResearch => laboratory)
X : professor (teachesAt => university, doesResearch ...
41
Architecture de CEDAR
42
Expérimentations
Ontologies
- NCBI, MESH, CPO jusqu'à 1 million de concepts⇒
Triplets RDF
- 1 milliard
Requêtes
- 1 à 1...
43
Expérimentations (classification)
44
Expérimentations (requêtes déductives)
45
Critiques
Décidabilité
- A quel prix ?
- Implémentation de la partie décidable.
Monde ouvert VS monde fermé
- On raison...
46
Distribution
47
Distribution (Architecture)
SPARQL
- Passage à l'échelle
- Efficacité : pas toujours le cas !
48
Distribution (MapReduce)
49
- Partitionnement intelligent de données
- Réduire la corrélation entre les données.
- Indexation multidimensionnelle.
...
50
CEDAR (utilisation)
- Grand Lyon (prototype)
Monitoring, gestion de données.
- Press'Innov (en cours)
Enrichissement de...
51
Questions
52
Prochain SlideShare
Chargement dans…5
×

Seminaire

135 vues

Publié le

Utilisation du formalisme OSF pour le Web sémantique

Publié dans : Données & analyses
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
135
Sur SlideShare
0
Issues des intégrations
0
Intégrations
4
Actions
Partages
0
Téléchargements
4
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Seminaire

  1. 1. 1 CEDAR : Un système de raisonnement à grande échelle 14/03/2016 Samir Amir
  2. 2. 2  2005 : Ingénieur, Université de Blida  2006 : Master, Université de Rennes 1  2007 : Ingénieur R&D, Thomson Corporate Research  2008-2011 : Doctorat, Université de Lille 1  2011-2012 : ATER, Université de Lille 1  2013-2015 : Post-doc, Université de Lyon 1  10/2015 - … : Responsable Pôle R&D, Press'Innov A propos de moi 2
  3. 3. 3 Données structurées (html) - Requête sur des données structurées. - Moteur de recherche. - Visualisation. - ... Le Web d'aujourd'hui
  4. 4. 4 Le Web d'aujourd'hui Données structurées (html) - Requête sur des données structurées. - Moteur de recherche. - Visualisation. - ... Pas de raisonnement
  5. 5. 5 Le Web d'aujourd'hui Données structurées (html) - Requête sur des données structurées. - Moteur de recherche. - Visualisation. - ... Pas de raisonnement Q1 : Trouver les personnalités africaines ayant visité la France La visite de Jacob Zuma à la COP21
  6. 6. 6 Le Web d'aujourd'hui Données structurées (html) - Requête sur des données structurées. - Moteur de recherche. - Visualisation. - ... Pas de raisonnement Q1 : Trouver les personnalités africaines ayant visité la France La visite de Jacob Zuma à la COP21 NULL
  7. 7. 7 The Semantic Web is an extension of the current web in which information is given well defined meaning, better enabling computers and people to work in co-operation [Tim Berners-Lee] Le Web Sémantique
  8. 8. 8 The Semantic Web is an extension of the current web in which information is given well defined meaning, better enabling computers and people to work in co-operation [Tim Berners-Lee] Le Web Sémantique Comment ? - Sémantique + contraintes + méthode de raisonement Comment exprimer les conaissances ? - Langage de decription (basé sur une logique) Exemple ?
  9. 9. 9 personne personnalité politique musicien….. ministre président ….. localisation capitale musicienpays….. Président de capitale de événement musicienécologique….. lieu TBox (Ontology) Exemple (déduction) politique Disjoints
  10. 10. 10 personne personnalité politique musicien….. ministre président ….. localisation capitale musicienpays….. Président de capitale de événement musicienécologique….. lieu TBox (Ontology) ABox (Instances) - Jacob Zuma est un président - Jacob Zuma a participé à la COP21 - COP21 est un évenement - …......... Exemple (déduction) politique TBox + Abox = base de connaissances Disjoint
  11. 11. 11 Le Web Sémantique personne personnalité politique musicien….. ministre président ….. localisation capitale musicienpays….. Président de capitale de événement musicienécologique….. lieu TBox (Ontology) ABox (Instances) Exemple (déduction) politique TBox + ABox = Base de connaissances Q1 : Trouver les personnalités africaines ayant visité la France Jacob Zuma Disjoint - Jacob Zuma est un président - Jacob Zuma a participé à la COP21 - COP21 est un évenement - ….........
  12. 12. 12 Comment exprimer les conaissances ? - KL-ONE - Order-Sorted Feature (OSF) - Logique de Description (DL) - ….. Web Ontology Language (OWL) W3C Le Web Sémantique
  13. 13. 13 Comment exprimer les conaissances ? Le Web Sémantique ABox : RDF (Ressource Desciption Framawork) Jacob Zuma président Type AssistéA COP21 Type événement - KL-ONE - Order-Sorted Feature (OSF) - Logique de Description (DL) - ….. W3C Web Ontology Language (OWL) <rdf:Description rdf:about="#JacobZuma"> <rdf:type><foaf:Président></rdf:type> <ex:AssistéA>COP21</AssistéA> </rdf:Description> ………………...
  14. 14. 14 La sémantique de OWL-DL - Logique décidable
  15. 15. 15 Exemple (OWL-DL)
  16. 16. 16 Raisonneurs (DL) - Pellet 1 - FaCT++ 2 - Racer 3 - HermiT 4 - RacerPro 3 1 : https://www.w3.org/2001/sw/wiki/Pellet 2 : http://owl.man.ac.uk/factplusplus/ 3 : http://franz.com/agraph/racer/ 4 : http://www.hermit-reasoner.com/ Approches DL (bottom-up)
  17. 17. 17 Raisonnement à très grande échelle Linked-Data : Objets connectés sous forme de graphes Le Web de données (Linked Data)
  18. 18. 18 Le Web de données (Linked Data) Peut on passer à l'échelle ?
  19. 19. 19 Algorithme de Tableau (Réponse Théorique) - Construction explicite du modèle - Décidable (modèle fini). - Test de satisfaction. Règles :
  20. 20. 20 Algorithme de Tableau (Réponse Théorique)
  21. 21. 21 Algorithme de Tableau (Réponse Théorique)
  22. 22. 22 Contraintes et Évènements Dirigeant l'Automatisation du Raisonnement Coordinateur du projet : Hassan AIT-KACI Objectif : - Montrer les limites des systèmes de raisonnement existants - Montrer qu'il y a un autre formalise capable de passer à l'échelle Projet CEDAR (Chaire d'excellence ANR)
  23. 23. 23 Projet CEDAR (Chaire d'excellence ANR) Contraintes et Évènements Dirigeant l'Automatisation du Raisonnement Coordinateur du projet : Hassan AIT-KACI Order-Sorted Feature (OSF) Objectif : - Montrer les limites des systèmes de raisonnement existants - Montrer qu'il y a un autre formalise capable de passer à l'échelle
  24. 24. 24 1) Order-Sorted Feature (OSF) - Pouvoir expressif important. - Compatible avec RDF (Web sémantique) - Méthode de raisonnement paresseuse et incrémentale 2) Optimisation - Encodage binaire des contraintes 3) Distribution - Calcul parallèle. - Passage à l'échelle. CEDAR
  25. 25. 25 Order-Sorted Feature (OSF)
  26. 26. 26 OSF (sémantique)
  27. 27. 27 OSF (Exemples)
  28. 28. 28 Mapping OSF - RDF
  29. 29. 29 OSF (Sémantique) - Conjonction - Disjonction - Négation - Agrégats - Expressions régulières - Cardinalité - ...
  30. 30. 30 Dissolution des termes OSF
  31. 31. 31 Exemple : Dissolution des termes OSF
  32. 32. 32 Dissolution des termes OSF
  33. 33. 33 Règles de normalisation (raisonnement)
  34. 34. 34 Règles de normalisation (raisonnement)
  35. 35. 35 Méthodes de Tableaux OSF VS Tableaux (DL) Règles OSF - Construction explicite du modèle - Décidable (modèle fini). - Paresseux. - Élimination. - Incrémental.
  36. 36. 36 Encodage binaire des contraintes - Chaque concept sera représenté par un code binaire. - Les opérations logiques sont applicables sur les codes. - Navigation facile entre concepts. - Optimisation.
  37. 37. 37 Encodage binaire des contraintes - teacher est un teacher (sorte 6 )⇒ - professor est un teacher (sorte 4)⇒ teacher (00101000)
  38. 38. 38 - teacher est un teacher (sorte 6 )⇒ - professor est un teacher (sorte 4)⇒ teacher (00101000) - teacher and researcher = 00101000 and 00011000 = 00001000 ⇒ professor Encodage binaire des contraintes
  39. 39. 39 person (teachesAt => institution, doesResearch => laboratory) professor (teachesAt => university, doesResearch => laboratory)
  40. 40. 40 X : person (teachesAt => institution, doesResearch => laboratory) X : professor (teachesAt => university, doesResearch => laboratory) Marie type medecin teachesAt Lyon 1 Dupont type professor teachesAt Lyon 1 RDF doesReaseach LIRIS type university type laboratory Select ?x where { ?x type professor. ?x teachesAt ?y. ?y type university. ?x doesResearch ?z. ?z type laboratry } OSF2SPARQL
  41. 41. 41 Architecture de CEDAR
  42. 42. 42 Expérimentations Ontologies - NCBI, MESH, CPO jusqu'à 1 million de concepts⇒ Triplets RDF - 1 milliard Requêtes - 1 à 100 concepts Comparaison - Hermit, TrOWL, RacerPro, Pellet, ………...
  43. 43. 43 Expérimentations (classification)
  44. 44. 44 Expérimentations (requêtes déductives)
  45. 45. 45 Critiques Décidabilité - A quel prix ? - Implémentation de la partie décidable. Monde ouvert VS monde fermé - On raisonne par ce qu'on connaît. - La plupart des cas sont concernés par la SMF. Même avec une SMF, les résultats restent les mêmes
  46. 46. 46 Distribution
  47. 47. 47 Distribution (Architecture) SPARQL - Passage à l'échelle - Efficacité : pas toujours le cas !
  48. 48. 48 Distribution (MapReduce)
  49. 49. 49 - Partitionnement intelligent de données - Réduire la corrélation entre les données. - Indexation multidimensionnelle. - Projection sur type, propriété, etc. Distribution
  50. 50. 50 CEDAR (utilisation) - Grand Lyon (prototype) Monitoring, gestion de données. - Press'Innov (en cours) Enrichissement des ontologies depuis un texte brut. Site : http://cedar.liris.cnrs.fr/
  51. 51. 51 Questions
  52. 52. 52

×