Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.
En partant de cas de projets réels dans des domaines aussi variés que la santé, l'industrie, l'édition, la défense, les médias... nous tenterons de dresser une cartographie des besoins exprimés, des technologies et des méthodes mises en œuvre. A partir des cas sélectionnés, nous ferons un retour à la communauté scientifique sur des problématiques ouvertes en terme de recherche.
Présentation invitée de Jean Delahousse (CEO, Mondeca) à IC 2009
Similaire à Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.
Similaire à Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances. (20)
Une démarche de conception de services d’information et de communication dédi...
Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.
1. Tentatives de cartographies des
besoins, solutions et sujets de recherche
ouverts dans le domaine de l’ingénierie des
connaissances et du web sémantique
2. • 2000-2009 : une chronologie
• Une cartographie par fonctions
• Une cartographie par domaines d’utilisation
• Conclusion
3. DMOZ
Grand Ancêtre Wikipedia
Projets gestion des connaissances Usinor
5. 2001
• Collaboration Labri (Université
Bordeaux) et Cams (Ehess) – Thèse
de Pascal Auillans sur la théorie des
graphes et réseaux sémantiques
• 1er version logiciel gestion de base de
connaissance
• Tentative de modélisation d’une base
de connaissance sur la musique
classique
6. 2003
• Editeur Juridique : Wolters Kluwer
Belgium
• OWL : participation de Bernard
Vatant à la norme
• Projet européen Strabon:
culture, tourisme, multilinguisme
7. 2004
• Collaboration avec Temis (text mining)
• Collaboration Lalicc Paris IV – Thèse
Florence Amardeilh sur l’acquisition
automatique de connaissances et
annotations des contenus
• Contrat Hachette
8. 2005
• Collaboration Lirmm (Université Montpellier)
Thèse Olivier Carloni sur le raisonnement à
partir de graphes conceptuels
• Collaboration Leden (Paris 8) Thèse Laurence
Noël sur la publication multimédia de
contenus et connaissances
• Contrat avec Lexis Nexis France
• Partenariat avec moteur de recherche
Antidot – projet Eiffel
9. 2006
• SKOS – participation à la norme
• Projet européen TAO – Transitionning
Application to Ontology - SOA
10. 2007
• Travail avec GeoNames
• LOD (Linking Open Data) project
• Projet SMTS Serveur
Multiterminologies de santé
11. 2008
• Collaboration Inserm Thèse Pierre Yves
Vandenbusche : modélisation d’ontologie
pour des serveurs de terminologies
médicales
• Normes CTS2 (Web service pour la gestion
des référentiels)
• Contrat pour la gestion de 3 thésaurus de la
commission européenne (26 langues)
• Utilisation de Triple Stores pour des services
avancées de recherche / suggestion
12. 2009
• Contrat AP-HP : serveur de terminologies médicales
• Contrat BNF / TenPlus - Europeana : recherche
sémantique multilingue – alignement
• Collaboration Modyco Paris X – thèse de Charles
Tesseire sur la gestion de la temporalité
• Projet Voyages-sncf : fusion de ressources hétérogènes
– ontologie tourisme – enrichissement par inférence
• Travail avec Knowledge consult pour construire une
méthodologie
13. Une confrontation continue entre les standards, la
recherche et les demandes de l’industrie
L’exigence de répondre à des besoins opérationnels
présents ou anticipés
14. Bases de
connaissances
Portails
sémantiques
Référentiels
Terminologies
Thésaurus
Taxonomies
Annotation
Linking Open
sémantique
Data
des contenus
15. Référentiels
Terminologies
Thésaurus
Taxonomies
• Modélisation ontologie pour supporter plusieurs référentiels aux modélisations
hétérogènes
• Alignements
– Intersection de référentiels
– Recouvrement multilingues
• Serveurs d’alignements
• Mise à jour partielle et incrémentale des serveurs multi-terminologies
• Multilinguisme : Gestion des concepts et des vocabulaires multilingues
• SKOS, CTS2, End-Point SparQL
• Construction de référentiels/ontologies à partir de ressources hétérogènes
16. Annotation
sémantique
des contenus
• Classification
• Text mining
• Annotation par ontologie interne et ressources externes (LOD)
• Enrichissement de l’ontologie / enrichissement des annotations
• RDF / MicroFormats / RDF-A
• Schemas d’annotation complexes (Event ML, NewsML)
• Annotation multilingue
• Annotation images
• Semantic mashup
17. Linking Open
Data
• Alignement d’URI
• Multilinguisme
• Serveurs d’alignement entre référentiels
• Création de services basés sur les contenus
ouverts et les contenus propriétaires
18. Bases de
connaissances
Portails
sémantiques
• Modélisation d’ontologie de domaines
• Réutilisation de modélisations
• Evolution des modélisations
• Acquisition automatique des connaissances
• Contrôle automatique à base de règles
• Interface utilisateurs de contribution et consultation (simplicité des interfaces versus
complexité de la modélisation)
• Web 2.0
• Moteur de recherche texte, métadonnées, relations sémantiques
• Inférence – suggestion par raisonnement
• Semantic mashup
• Méthodologie
20. • Juridique
• Administration
publique
• Exigence de mise à disposition des
données publiques : rôle des pouvoirs
publics nationaux et européens
• Exigence d’information des citoyens
• Compétitions pour des services avancés
d’accès aux contenus et connaissances :
– grands groupes internationaux
– administrations publiques
21. • Juridique
• Science Sociale • Administration
publique
• Formalisme et traditions historiques
• Culture nationale
• Plusieurs domaines du droit avec des traditions
différentes
• -> difficulté de modélisation, difficulté de
réutilisation
• Droit comparé -> Alignement de modélisations
d’ontologies
• Construction européenne
– Multilinguisme
– Multiculturalisme
• Accès personnalisé à l’information
– Professionnels
– Citoyens engagés
– Citoyens
22. • Santé
• Médical
• Enjeux économiques sur la gestion du dossier patient
– Codage
– Interopérabilité, transportabilité
– Meilleurs soins
• Enjeux politiques
– Accès à l’information
• médecins,
• assurances sociales,
• patients…
• Un projet mondial (Projet devenu prioritaire aux USA)
23. • Santé
• Médical
• Des modélisations d’ontologies, des organisations de
terminologies partageables au niveau international
• Des besoins de traduction et multilinguisme
• Un travail international et collaboratif de mise à jour des
ontologies / terminologies de référence
24. • Santé
• Médical
• Des besoins d’alignement
• Granularité différente des descriptions de concepts dans les
différentes terminologies
• Ponts entre différents type de codage
– Économique, clinique, gestion
• Simplicité du codage vs complexité des référentiels
• Des accès simples et uniformisés aux
ontologies/terminologies par les applications utilisatrices
25. • Médias
• Temps réel
• Ontologies / terminologies pour décrire des domaines
très hétérogènes
• Mélanger des ontologies très souples et des ontologies
très détaillées
• Temporalité
• Localisation
• Vers une annotation à partir de bases d’événements
(EventML)
• Du local au global
• Du global au local
• Interopérabilité / échanges
• Semantic mashup de ressources internes et externes
26. • Médias • Santé • Juridique
• Médical • Administration
publique
• Spécialisation des tâches
– Modélisation
– Edition, enrichissement
d’ontologies/terminologies
– Annotation
– Utilisation des contenus et connaissances
27. • Organisations
collaboratives
• Lafarge
• Fédération Nationale des Parcs Régionaux
• INRA
• Directions de la SNCF – conduite du changement
• Fédération des centres de gestion des collectivités
territoriales
• Groupe ADEO / Leroy Merlin
• PSA : conception véhicules
• DGA : renseignement
• Analyse Images satellitaires
28. • Organisations
collaboratives
• Capitaliser et partager des connaissances
• Portail sémantique
• Formaliser des connaissances
• Partager des concepts métiers (éventuellement dans
différentes langues)
• Travail collaboratif sur la
modélisation, l’enrichissement, l’accès, les retours
• Modélisation de domaines très spécifiques - coût
• Terminologies métiers spécifiques et locales - coût
29.
30. Vers une industrialisation
Une insertion en cours des outils de l’ingénierie des connaissances
dans les systèmes d’information en s’appuyant sur les standards
développés dans le cadre du web sémantique