Moteurs de recherche et web sémantique

6 004 vues

Publié le

Le Web sémantique est-il un n-ième standard de représentation des données ou une nouvelle façon d’aborder la recherche d’information ?

L'utilisation du terme « Sémantique » a souvent été porteur de confusions donnant à penser que le Web sémantique visait la compréhension du langage naturel par les machines. Même si les objectifs réels du Web sémantique semblent en réalité éloignées des techniques du traitement automatique de la langue, les technologies du Web sémantique n'en restent pas moins intéressantes pour les solutions d'accès et de recherche d'information. En effet, celles-ci sont déployée dans des contextes de plus en plus complexes mêlant données structurées et données non structurées et, dans ce cadre, les technologies du Web sémantique permettent de résoudre de nombreux problèmes de par le cadre d'interopérabilité et l'écosystème de standards et d'outils qu'elles offrent.

Impliqués depuis plusieurs années dans le domaine, nous montrerons comment les technologies du Web sémantique aide les équipes Antidot à mieux gérer, traiter et valoriser les données de leurs clients. Dans cette présentation, nous parcourrons une palette assez large de manipulations des objets sémantiques pratiquées couramment dans nos réalisations et basées sur les technologies du Web sémantique.

Nous illustrerons notre exposé par des réalisations concrètes et nous montrerons en quoi l’utilisation du Web sémantique nous a épargné des heures de développements spécifiques et nous a permis d’adresser des problématiques de plus en plus complexes.

Nous aborderons notamment l’extension sémantique, la navigation par facette, la mise en relation de silos d’informations hétérogènes, l’alignement des données sur des référentiels, l’utilisation du Web des données et d’autres techniques originales que nous avons développées pour la nouvelle version d’AFS.

Publié dans : Technologie, Formation
0 commentaire
11 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
6 004
Sur SlideShare
0
Issues des intégrations
0
Intégrations
631
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
11
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Moteurs de recherche et web sémantique

  1. 1. Web sémantiqueetmoteurs de recherche<br />http://www.antidot.net<br />Jérôme Mainka<br />SemWeb.pro<br />17 janvier 2011<br />
  2. 2. Antidot<br />Cœur de métier <br /><ul><li>Solution de recherche et d’accès à l’information</li></ul>Compétences<br /><ul><li>Editeur, hébergeur, conseil et intégrateur</li></ul>Fiche d’identité <br /><ul><li> Création en 1999
  3. 3. Implantation : Paris, Lyon, Aix en Provence
  4. 4. Forte croissance 13eme croissance française au classement</li></ul>Solutions<br /><ul><li>AFS : moteur de recherche
  5. 5. CKS : services collaboratifs</li></li></ul><li>Quelques références<br />Média<br />Entreprises<br />eCommerce<br />Institutions<br />Santé<br />
  6. 6. Moteur de recherche<br />Recherche plein-texte vs recherche structurée<br />
  7. 7. Recherche plein texte<br />Plus que faire correspondre des octets<br />
  8. 8. Synonymie<br />car@en<br />Voiture<br />Bagnole<br />char@fr_CA<br />
  9. 9.
  10. 10. Hyponymie / Méronymie<br />
  11. 11.
  12. 12. Méronymie/Holonymie<br />
  13. 13.
  14. 14. Vocabulaire SKOS<br />Des concepts : classe skos:Concept<br />Des relations sémantiques :<br />skos:broader, narrower<br />skos:exactMatch, closeMatch<br />Des libellés<br />skos:prefLabel, altLabel, hiddenLabel<br />
  15. 15. Sémantique<br />Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. <br />skos:broaderTransitive<br />skos:narrower<br />skos:narrower<br />skos:broader<br />skos:broader<br />skos:prefLabel<br />skos:altLabel<br />skos:prefLabel<br />skos:altLabel<br />skos:prefLabel<br />skos:altLabel<br />Lorem ipsum <br />
  16. 16. Inférence<br />Il ne s’agit évidemment pas d’apprendre par cœur les propriétés sémantiques du vocabulaire : rdfs, owl est suffisant pour l’essentiel.<br />Exemple :<br />skos:broader rdfs:subPropertyOf skos:broaderTransitive .<br />skos:broaderTransitive a owl:TransitiveProperty .<br />skos:narrower owl:inverseOf skos:broader .<br />
  17. 17. Clés du succès<br />Les libellés peuvent être soumis à des normalisations :<br />"voyages" = "voyage"<br />"Mainka" = "MNK"<br />"Mainka" = "aiinkamank »<br />Indexation / Requête = offline / online<br />Structure de stockage<br />m taille du référentiel<br />n taille du texte à indexer :<br />Indexation en O(n log m)<br />
  18. 18. Recherche structurée<br />
  19. 19. Description des facettes<br /><PériodeHistorique> a skos:OrderedCollection ;<br /> skos:memberList ( <ÉpoqueContemporaine><br /> <ÉpoqueModerne><br /> <MoyenÂge> ) .<br /><Discipline> a skos:Collection ;<br /> skos:member <AnthropologieBiologique> ,<br /> <Démographie> ,<br /> <Droit> .<br /><Facets> a skos:OrderedCollection ;<br /> skos:memberList ( <PériodeHistorique><br /> <Discipline> ) . <br />
  20. 20. Ontologies du domaineOntologies de navigation<br />Ontologies du domaine pas forcément adaptées à une interface de navigation<br />Nécessité de transformer les ontologies du domaine pour les faire correspondre aux besoins de la navigation.<br />Prise en compte de besoins utilisateurs / besoins métiers.<br />2 approches :<br />Formules N3 : <br />{ ?doc <published> 2001 . } => { ?doc afs:subject <p2001> . } .<br />SPARQL :<br />CONSTRUCT { ?doc afs:subject <p2001> . } WHERE { ?doc <published> 2001 . }<br />
  21. 21. Annotations<br />À partir de règles<br />À partir du contenu plein texte (extraction d’entités, classification automatique)<br />Inférence <br />{ ?doc afs:subject [ skos:broaderTransitive ?c2 . ] . }=> { ?doc afs:subject ?c2 . } . <br />Une facette est une annotation particulière<br />
  22. 22. Affichage<br />Tri<br />OrderedCollection<br />Tri alphabétique<br />Tri par comptage<br />Gestion des données de grandes tailles<br />Paging des valeurs de facettes<br />Support des opérateurs AND, OR, NOT.<br />
  23. 23. Un modèle de document unifié ?<br />Pour mettre en place un service de recherche :<br />Structures molles<br />Concepts simples: Annotations, Facettes, Titre, URL, Plein texte, etc.<br />Format pivot RDF<br />Mapping des documents via une chaîne de traitements élémentaires : AFS-PaF (Pipes & Filters)<br />
  24. 24. <ul><li> Créer des chaînes de traitement par assemblage de modules</li></ul>Sources de données<br />Module connecteur<br />Modules de transformation et enrichissement<br />
  25. 25. <ul><li>Les données et enrichissements sont exportés en RDF en bout de chaine
  26. 26. Les triplets générés sont exploités</li></ul>pour retour vers les sources sous forme normalisée<br />pour traiter des requêtes complexes<br />pour une exposition dans le Web de données<br />Génération<br />Chargement de l’entrepôt<br />Entrepôt RDF<br />Fichiers de triplets<br />Corpus<br />
  27. 27. <ul><li>AFS et SPARQL sont des Web Service techniques
  28. 28. Ils sont enrobés dans une couche métier</li></ul>un Web Service applicatif qui permet la négociation de contenu<br />Description<br /> XML<br />Description<br /> RDF<br />Document<br />
  29. 29. <ul><li>Le document</li></ul>est composite<br />est dynamique<br />évolue dans le temps<br />est un objet à gérer<br />à accéder de façonunifiée <br />
  30. 30. Des données partout<br />RéférentielDisciplinesHAL-SHS<br />RéférentielAuteursHAL-SHS<br />RéférentielOrganisationHAL-SHS<br />RéférentielCatégoriesCalenda<br />RéférentielThésaurus WSIAF<br />RéférentielPactols<br />RéférentielGeonames<br />RéférentielRameau<br />RéférentielLexvo<br />ISIDORE<br />
  31. 31. Conclusion<br />Le Web sémantique : ça sert (ça marche, c’est « simple »)<br />Rester modeste :<br />Objectifs<br />Stratégie<br />Mise en œuvre<br />Plein de sujets d’évolution<br />Extraction de concepts<br />Alignement automatique d’ontologies<br />

×