SlideShare une entreprise Scribd logo
1  sur  29
Mondeca                                              hacene.cherfi@mondeca.com
                                                             26/10/2011


Enrichissement des moteurs de recherche à partir de connaissances métier


 LERUDI : consultation du dossier patient en
 situation d’urgence
Partenaires industriels


Intégrateur



Moteur de recherche



Analyse linguistique


Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Partenaires médicaux


INSERM



LERTIM



CiSMeF


Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Ecran d’accueil du prototype




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Objectifs

•     Cinq exigences
      1. Extraire des connaissances à partir de documents médicaux plus ou moins
         structurés ;
      2. Extraire les informations en quelques secondes et permettre d’effectuer
         des requêtes complémentaires pour explorer le contenu du dossier ;
      3. Extraire uniquement des informations exactes (éviter les contresens) ;
      4. Minimiser le silence : ne pas oublier une information importante pour
         l’urgentiste ;
      5. Minimiser le bruit : ne pas « noyer » l’urgentiste avec des informations
         exactes, mais non déterminantes.


•     Amélioration de l’accès au dossier médical patient
      – Base de connaissances médicale ;
      – Règles d’indexation des documents médicaux ;
      – Interface efficace de visualisation.

Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Schéma général

             ITM                                                                                     SDK



                                  Terminologies +
                                  hiérarchies
                                                                             Index

                                                                                                 AFS

                               Graphe + Règles
                               d’indexation




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Plan

           Base de connaissances (BC) médicale

           Utilisation de la BC dans le prototype

           Règles d’indexation

           Démo




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Nombre de termes dans BC

• Termes concepts médicaux (30 806)
      – Médicaments (5 513)
      – Etats pathologiques (5 092)
      – Actes médicaux (3 146)
      – Divers (~ 150)


• Termes relations (59)
      – Sujet : abcès mésentérique
      – Prédicat : « est une maladie de la spécialité médicale »
      – Objet : chirurgie



Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Etats pathologiques




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Actes médicaux




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Traitements




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Autres termes médicaux #1
Autres termes médicaux #2




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Facteurs sociaux




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
relations




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Exemple d’utilisation d’une relation




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Mise à jour de la base de connaissances




                                                                                                  Non lié :
                                                                                                         – Réanimation




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Schéma général

             ITM                                                                                     SDK



                                  Terminologies +
                                  hiérarchies
                                                                             Index

                                                                                               AFS

                               Graphe + Règles
                               d’indexation




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Plan

           Base de connaissances (BC) médicale

           Utilisation de la BC dans le prototype

           Règles d’indexation

           Démo



Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Annotations




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Utilisation de la BC dans le prototype

                              Trois grandes classifications




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
BC dans le prototype



• Vue hiérarchique
   – 12 documents pour
     « Abcès de foie »
   – 9 documents pour
     « Choc septique »
   – …
Utilisation de la BC dans le prototype




Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Plan

           Base de connaissances médicale

           Utilisation de la BC dans le prototype

           Règles d’indexation

           Démo



Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Règles d’indexation en SPARQL
R1 : Conserver la pathologie la plus précise
Si deux concepts A et B sont présents dans un document.
A et B sont tous deux fils du concept « Etat pathologique ».
B est lui-même fils de A.
B a la propriété « Concept terminologique » à vrai)
alors (seul B est marqué avec la propriété « Instance importante »).




 Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Règles d’indexation en SPARQL

R1 : Conserver la pathologie la plus précise
Si deux concepts A et B sont présents dans un document.
A et B sont tous deux fils du concept « Etat pathologique ».
B est lui-même fils de A.
B a la propriété « Concept terminologique » à vrai)
alors (seul B est marqué avec la propriété « Instance importante »).


R2 : Ne pas conserver une annotation quand le concept est précédé
  de « absence de » ou d'une expression équivalente
Si une Instance a une propriété « a Patron » qui la lie à la classe « Absence de »,
alors l'instance ne doit pas être marquée avec la propriété « Instance
   importante ».



Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Plan

           Base de connaissances médicale

           Utilisation de la BC dans le prototype

           Règles d’indexation

           Démo



Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Conclusion

• Référentiels métier
      – Base de connaissances  Organiser des vues du données
      – Règles d’indexation  Hiérarchiser par niveaux de granularité
      – Portail sémantique  Visibilité améliorée




• Tout cela est difficile à réaliser sur un portail /
  moteur de recherche / analyseur fondé sur une
  indexation / traitement classique



Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
Questions ?




  info@mondeca.com

Contenu connexe

Plus de mondeca

Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...mondeca
 
Rendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audienceRendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audiencemondeca
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?mondeca
 
Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012mondeca
 
Smart Content Factory
Smart Content FactorySmart Content Factory
Smart Content Factorymondeca
 
Raisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examplesRaisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examplesmondeca
 

Plus de mondeca (6)

Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
 
Rendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audienceRendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audience
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?
 
Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012
 
Smart Content Factory
Smart Content FactorySmart Content Factory
Smart Content Factory
 
Raisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examplesRaisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examples
 

Enrichissement des moteurs de recherche: example

  • 1. Mondeca hacene.cherfi@mondeca.com 26/10/2011 Enrichissement des moteurs de recherche à partir de connaissances métier LERUDI : consultation du dossier patient en situation d’urgence
  • 2. Partenaires industriels Intégrateur Moteur de recherche Analyse linguistique Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 3. Partenaires médicaux INSERM LERTIM CiSMeF Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 4. Ecran d’accueil du prototype Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 5. Objectifs • Cinq exigences 1. Extraire des connaissances à partir de documents médicaux plus ou moins structurés ; 2. Extraire les informations en quelques secondes et permettre d’effectuer des requêtes complémentaires pour explorer le contenu du dossier ; 3. Extraire uniquement des informations exactes (éviter les contresens) ; 4. Minimiser le silence : ne pas oublier une information importante pour l’urgentiste ; 5. Minimiser le bruit : ne pas « noyer » l’urgentiste avec des informations exactes, mais non déterminantes. • Amélioration de l’accès au dossier médical patient – Base de connaissances médicale ; – Règles d’indexation des documents médicaux ; – Interface efficace de visualisation. Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 6. Schéma général ITM SDK Terminologies + hiérarchies Index AFS Graphe + Règles d’indexation Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 7. Plan Base de connaissances (BC) médicale Utilisation de la BC dans le prototype Règles d’indexation Démo Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 8. Nombre de termes dans BC • Termes concepts médicaux (30 806) – Médicaments (5 513) – Etats pathologiques (5 092) – Actes médicaux (3 146) – Divers (~ 150) • Termes relations (59) – Sujet : abcès mésentérique – Prédicat : « est une maladie de la spécialité médicale » – Objet : chirurgie Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 9. Etats pathologiques Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 10. Actes médicaux Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 11. Traitements Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 13. Autres termes médicaux #2 Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 14. Facteurs sociaux Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 15. relations Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 16. Exemple d’utilisation d’une relation Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 17. Mise à jour de la base de connaissances Non lié : – Réanimation Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 18. Schéma général ITM SDK Terminologies + hiérarchies Index AFS Graphe + Règles d’indexation Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 19. Plan Base de connaissances (BC) médicale Utilisation de la BC dans le prototype Règles d’indexation Démo Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 20. Annotations Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 21. Utilisation de la BC dans le prototype Trois grandes classifications Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 22. BC dans le prototype • Vue hiérarchique – 12 documents pour « Abcès de foie » – 9 documents pour « Choc septique » – …
  • 23. Utilisation de la BC dans le prototype Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 24. Plan Base de connaissances médicale Utilisation de la BC dans le prototype Règles d’indexation Démo Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 25. Règles d’indexation en SPARQL R1 : Conserver la pathologie la plus précise Si deux concepts A et B sont présents dans un document. A et B sont tous deux fils du concept « Etat pathologique ». B est lui-même fils de A. B a la propriété « Concept terminologique » à vrai) alors (seul B est marqué avec la propriété « Instance importante »). Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 26. Règles d’indexation en SPARQL R1 : Conserver la pathologie la plus précise Si deux concepts A et B sont présents dans un document. A et B sont tous deux fils du concept « Etat pathologique ». B est lui-même fils de A. B a la propriété « Concept terminologique » à vrai) alors (seul B est marqué avec la propriété « Instance importante »). R2 : Ne pas conserver une annotation quand le concept est précédé de « absence de » ou d'une expression équivalente Si une Instance a une propriété « a Patron » qui la lie à la classe « Absence de », alors l'instance ne doit pas être marquée avec la propriété « Instance importante ». Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 27. Plan Base de connaissances médicale Utilisation de la BC dans le prototype Règles d’indexation Démo Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 28. Conclusion • Référentiels métier – Base de connaissances  Organiser des vues du données – Règles d’indexation  Hiérarchiser par niveaux de granularité – Portail sémantique  Visibilité améliorée • Tout cela est difficile à réaliser sur un portail / moteur de recherche / analyseur fondé sur une indexation / traitement classique Hacène Cherfi - Cas d’application - enrichissement des moteurs de recherche à partir de connaissances métier
  • 29. Questions ? info@mondeca.com