Ontologies et Web 2.0 : une Expérimentation en Entreprise

3 163 vues

Publié le

Journee OHGS @ IC2007 - http://apassant.net/publications/ontologies-et-web-20-une-expérimentation-en-entreprise

Publié dans : Technologie, Business
1 commentaire
1 j’aime
Statistiques
Remarques
Aucun téléchargement
Vues
Nombre de vues
3 163
Sur SlideShare
0
Issues des intégrations
0
Intégrations
153
Actions
Partages
0
Téléchargements
93
Commentaires
1
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Ontologies et Web 2.0 : une Expérimentation en Entreprise

  1. 1. Ontologies et Web 2.0 : Une expérimentation en entreprise Alexandre Passant : EDF R&D / LaLIC – Paris-Sorbonne Philippe Laublet : LaLIC – Paris-Sorbonne 1 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ IC2007
  2. 2. Web 2.0 … • Remettre l’utilisateur comme producteur au centre des outils • Faciliter la publication et les échanges d’information • Blogs, wikis … • Systèmes de partage d’information et de documents • Popularisation de RSS comme format d’échange • « Tagging » pour la catégorisation de l’information • Taggage collaboratif largement répandu comme activité sociale • Folksonomies (Vander Wal 2004) • Etude des phénomènes de convergence … 2 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  3. 3. « Logiciels sociaux » : quelques exemples … • Plateforme de blogs (Blogger) • Partage de photos (Flickr) • Partage de vidéos (YouTube) • Bookmarking collaboratif (Delicious) • Encyclopédie ouverte (Wikipédia) • Réseaux sociaux (LinkedIn) • Agrégateur RSS (FeedBurner) • Homepage personnelle (Netvibes) •… 3 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  4. 4. Le Web 2.0 en Entreprise • Objectifs du projet • Faciliter • La consultation d’information externe (flux RSS) • Le partage d’informations internes (blogs personnels) • La mise en place de connaissances pérennes (wikis thématiques) • Remettre en cause l’asymétrie de l’information • Limiter l’adhérence au mail et à la diffusion restreinte d’informations • Migration des systèmes classiques vers des intranets «2.0» • Contraintes organisationnelles • Quel intérêt à partager ses connaissances ? • Peur de l’ouverture des wikis 4 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  5. 5. Le projet Athena (EDF R&D) • Une plateforme Web 2.0 pour l’intelligence collective 5 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  6. 6. Web 2.0 et Web Sémantique au sein d’Athena • Bénéficier des qualités des deux approches • Facilité d’utilisation et forte acceptabilité des outils et des concepts sociaux (Web 2.0) • Formalisation, consensus, Inférences, requêtes (WS) • Eviter les inconvénients des deux approches • Résultats de recherche dépendants des tags (Web 2.0) • Obliger tous les utilisateurs à accéder à l’ontologie et à modéliser la connaissance de façon formelle (WS) 6 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  7. 7. Problèmes d’hétérogénéité • Dans les textes (appellations, …) • Des tags • Des outils • Blogs • Wikis • Flux RSS 7 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  8. 8. Problèmes d’hétérogénéité dans les textes • Problématiques des documents « Web 2.0 »: • Une majorité d’outils non structurés (blogs, wikis …) et en texte libre • Abbréviations, acronymes • Synonymes … • Variations morphologiques, typographiques • Recherche d’information « plein texte » • Nécessité d’élargir manuellement la recherche d’information aux différentes normalisations d’une même notion … et donc de les connaître à priori ! 8 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  9. 9. Problèmes d’hétérogénéité des tags • Utilisation partagée de mots-clés libres ou tags • Flickr, del.icio.us • Association libre (en nombre et en type) de mots-clés aux documents pour les catégoriser et regrouper • Composante sociale : émergence de folksonomies • Différents problèmes • Les mêmes … • Un mot-clé pour plusieurs notions (peu fréquent dans notre cas) • « Apple » … ? • Une notion pour plusieurs mots-clés • « Semantic Web », « SemWeb » … • Dépend fortement de la pratique et de l’expérience de tagging de chacun 9 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  10. 10. Une seule notion … une multitude de tags 10 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  11. 11. Combinaison des 2 hétérogénéités • Billets de blogs taggés: • Hétérogénéité au niveau des textes et des tags • Nécessité d’une indexation unique pour retrouver l’information 11 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  12. 12. Utilisation d’ontologies pour gérer l’hétérogénéité • Solution ? • Etablir un lien entre documents et classes / instances d’une ontologie du domaine afin de palier aux problèmes de recherche d’information • Moyens • Une notion, plusieurs formalisations • Un concept de l’ontologie est associé à un certain nombre de marques qui peuvent être des labels (rdfs:label) ou des tags (tag:hasTag) • Marque (C) = {Label(C)} U {Tag(C)} • Marque (EDF) = {EDF, Electricité de France, …} U {company_EDF, elec-edf, …} • Distinction nécessaire entre label - admis par tous - et tag – vision personnelle. 12 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  13. 13. Représentation • Lien entre concept (classe ou instance) et un ensemble de tags et labels associés 13 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  14. 14. Du document à l’ontologie • Propriété sioc:topic pour établir le lien entre données sources (billet de blog, page wiki …) et ontologie • Interface de validation pour éviter et résoudre l’ambiguïté • Création contrôlée de nouvelles instances 14 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  15. 15. Mise en place de la solution • Modélisation de l’ontologie • Analyse des tags pour définir les instances nécessaires • Extension d’ontologies existantes (FOAF, DOAP, geonames …) • Adaptation et création d’ontologies du domaine • Mélange d’approche Top-down et Bottom-up • Intégration des billets • SIOC (Breslin et al. 05) • Interface d’association entre tags et ontologie • Stockage et interrogation des données • Entrepôt RDF pour centraliser les données produites • Plug-ins de navigation et de recherche greffés sur l’interface SPARQL (Parsia 06) 15 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  16. 16. Vers une recherche sémantique d’information (1/2) •Deux grandes étapes • 1) Proposition des concepts de l’ontologie incluant dans leur label ou tag le terme de recherche • Permet d’affiner et désambiguïser la recherche • « EDF » => « EDF », « EDF R&D », « EDF Energy » ? • 2) Recherche des documents en fonction du concept déterminé et non plus du mot-clé (et des propriétés des concepts) • Identifie l’ensemble des documents quelque soit le tag ou label d’origine 16 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  17. 17. Vers une recherche sémantique d’information (2/2) • 1) Validation du terme recherché • 2) Récupération des billets concernés • Gestion de l’hétérogénéité des mots-clés d’origine 17 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  18. 18. Extension des possibilités de recherche • Utilisation de l’ontologie, des instances, et des relations pour aller plus loin dans la recherche d’information • Instances de la même classes, propriétés communes … 18 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  19. 19. Conclusion • L’ontologie permet de résoudre une partie des problèmes d’hétérogénéité posés par les applications Web 2.0 • Approche utilisant des technologies standard et ouvertes (RDF, SPARQL, FOAF …) • Travaux à développer : • Indexation semi-automatique et sémantique des flux RSS • Extension des possibilités de suggestion d’information • Amélioration de nouveaux outils (wikis …) pour le peuplement d’ontologie • Médiateur pour les différents outils du Web 2.0 • Pour l’accès à l’information … Alexandre PASSANT, Jean-David STA, Philippe LAUBLET, Folksonomies, Ontologies and corporate blogging, in Blogtalk reloaded – Social Software, Research and Cases, T.N.Burg, J.Schmidt (eds), Herstellung : Books on Demand GmbH 2007. 19 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
  20. 20. Web 2.0 et WS : d’autres questions • Dériver une sémantique émergente des interactions collaboratives du Web 2.0 ? • Entre autres du marquage collaboratif (folksonomie) • Modéliser cette sémantique émergente dans des ontologies ? • Gérer les évolutions des documents et des … tags ? • Faire bénéficier les applications collaboratives des ontologies et des technologies du WS 20 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007

×