Pour un véritable accès unifié à l’information<br />i-expo        18 mai 2011<br />
Société ANTIDOT<br />Editeur de logiciels<br /> depuis 1999 | Paris, Lyon, Aix-en-Provence<br />Solution de recherche et d...
Parmi nos clients<br />Média<br />Entreprises<br />E-commerce<br />Institutions<br />Santé<br />
Plan<br />Le problème<br />#&!<br />Les limites de la « recherche fédérée » de documents<br />
Plan<br />Le problème<br />La réponse<br />#&!<br />?<br />Penser l’accès à l’information dans un espace unifié<br />
Plan<br />Le problème<br />La réponse<br />La solution<br />#&!<br />?<br />Capter, Penser, Valoriser, Exposer l’informati...
Plan<br />Un exemple<br />Le problème<br />La réponse<br />La solution<br />#&!<br />?<br />Le projet Isidore<br />(TGE Ad...
Le problème<br />Les limites de la recherche fédérée<br />
Les difficultés de la recherche fédérée<br />Des silos de  données cloisonnés<br />Des données hétérogènes<br />Des référe...
Le moteur de recherche : un outil miracle ?<br />
Les limites de la recherche fédérée<br />Recette de cuisine de la recherche fédérée<br />Indexez<br />Servez<br />Collecte...
Au mieux, une juxtaposition de docs<br />L’utilisateur n’est pas acteur de sa recherche. <br />
La REPONSE  ANTIDOT<br />Penser l’accès à l’information dans un espace unifié et enrichi<br />
Modéliser, lier et annoter les informations<br />Créer une cohérence et de l’information<br />par la mise en relation des ...
Modéliser, lier et annoter les informations<br />Utiliser la nature des données sources<br />a pour sujet<br />fait référe...
S’appuyer sur les technologies du Web Sémantique<br />Un cadre d’interopérabilité pour mettre à disposition,<br />consulte...
Un espace unifié d’information<br />Agilité ne rime pas avec stabilité<br />Modifier les silos existants n’est pas possibl...
Créer de la valeur pour les utilisateurs<br />
LA SOLUTION  ANTIDOT<br />Capter, penser, valoriser, exposer l’information<br />
Capter, Valoriser, Enrichir et Exposer l’information<br />
Antidot Information Factory<br />AIF : un outil industriel et évolutif<br />Une chaîne de captation et de traitement<br />...
AIF : une chaîne de traitement<br />Créer des chaînes de traitement de données par assemblage de modules<br />Sources de d...
AIF : des briques à assembler<br />Déjà plus de 50 modules prêts à l’emploi en standard<br />Connecteurs<br />Traitements ...
AIF : un cadre de développement<br />Un cadre de développement pour construire des modules<br />50+ filtres prêts à l’empl...
AIF : un modèle d’unité documentaire<br />Le document<br />est  composite <br />est  dynamique<br />évolue dans le temps<b...
AIF : exposition des données<br />AIF rend accessibles les contenus enrichis via un Content Repository<br />API Web<br />L...
AIF : traite des « flux multi-documents »<br />AIF travaille en flux indépendamment du stockage des données<br />Enrichiss...
Trouver rapidement l’information<br />
AFS : recherche sémantique<br />Recherche plein texte avec fonctions linguistiques :<br />extension automatique<br />sugge...
AFS : suggestion intelligente<br />Autocomplétion intelligente pendant la saisie de la requête<br />
AFS : recherche avancée<br />Recherche multicritères avancée<br />Recherche géographique<br />
AFS : recherche à facettes<br />Recherche à facettes<br />
AFS : regroupement de résultats<br />Clusterisation : regroupement des résultats selon une taxonomie, des propriétés, …<br />
AFS : intégration<br />Toutes les API accessibles en REST<br />Formats de sortie SI ou Web : XML, JSON<br />Compatible Ope...
Annoter et Partager l’information pour mieux Collaborer<br />
ACS : la recherche collaborative<br />Capitaliser<br />Enregistrer<br />Requêtes<br />Réponses<br />Organiser<br />Dossier...
Un exemple  PROBANT<br />Le projet Isidore<br />
Le très grand équipement Adonis (CNRS)<br />Le Très grand équipement du CNRS pour les Sciences Humaines et Sociales<br />A...
Principe du projet<br />Un projet classique en apparence<br />Collecter<br />Traiter<br />Diffuser<br />
Les particularités du projet<br />Collecter des données hétérogènes<br />primaires, secondaires<br />annuaires, bases de d...
Les particularités du projet<br /><ul><li>Traiter</li></ul>Normaliser les données(qualité, forme, alignement)<br />Enrichi...
Les particularités du projet<br />Diffuser dans le Web de données<br />Se préparer auLinked/Open Data<br />Permettre l’éme...
Sources de données<br />Des sources multiples et des traitements ad-hoc<br /><ul><li>Sites Web</li></ul>collecte par sitem...
Sources de données<br />Connecteurs<br />Modules Pipes&Filters spécifiques aux sources<br />Modules Pipes&Filters communs<...
Chaîne de collecte et de traitement<br />Une chaîne dédiée à la normalisation : 12 filtres<br />Récupération de chaque res...
Chaine d’enrichissement<br />Une chaîne dédiée à l’enrichissement : 14 filtres<br />Classification sur la taxonomie HAL<br...
Le moteur utilise les documents déjà classés pour apprendre<br />Puis utilise la base d’indicateurs statistiques pour clas...
Normalisation sur les référentiels<br />fr<br />Français<br />FR<br />francais<br />français<br />Français<br />Anglais<br...
Annotation (tagging)<br />Mots clefs<br />Chaîne de caractères<br />Est exprimé par<br />Est décrit par<br />Le moteur eff...
Les quatre principes du Web de données ou Linked Data <br />http://dbpedia.org/resource/French_National_Centre_for_Scienti...
Utiliser des URIs<br />Chaque ressource reçoit dans Isidore un identifiant unique et stabledélivré par le CCSD selon le sy...
Des URIS HTTP<br />Pour chaque URI, Isidore est capable de renvoyer le format  le mieux adapté à l’émetteur de la requête ...
Des URIS HTTP<br />Pour chaque URI, Isidore est capable de renvoyer le format  le mieux adapté à l’émetteur de la requête ...
Des URIS HTTP<br />Pour chaque URI, Isidore est capable de renvoyer le format  le mieux adapté à l’émetteur de la requête ...
Exprimer l’URI des objets liés<br />RéférentielDisciplinesHAL-SHS<br />RéférentielAuteursHAL-SHS<br />RéférentielOrganisat...
Rendre accessible les enrichissements<br />pour mettre en place une boucle de rétro-action<br />
Architecture fonctionnelle globale<br />Sources de données<br />Collecte, traitement, indexation<br />Diffusion<br />Appli...
Merci de votre attention !<br />Des questions ?<br />
Prochain SlideShare
Chargement dans…5
×

Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information

1 864 vues

Publié le

Toute organisation subit les limites de son système d’information : entrepôts de données cloisonnés, données hétérogènes, documents non structurés, thésaurus incomplets, taxonomies incohérentes…

Les utilisateurs en souffrent et attendent un véritable « accès unifié à l’information » : trouver l’information par les concepts plutôt que la chercher par les mots, naviguer aisément dans l’information, mieux l’exploiter en collaborant. L’entreprise doit évoluer vers un « espace informationnel enrichi », servant différents usages selon le profil ou la mission de chaque collaborateur.

La vision innovante d'Antidot permet d’aller bien au-delà de ce que permettent les approchent traditionnelles comme la « recherche fédérée » ou encore les « search based applications » car Antidot Information Factory et Antidot Finder Suite permettent de modéliser l’information, de capter, normaliser, décrire et agréger des données puis d’en inférer des informations nouvelles, facilement accessibles.

Intégrant nativement les technologies du web sémantique, Antidot apporte les solutions les plus en pointe dans le domaine et démontre à travers une réalisation emblématique - le projet ISIDORE du CNRS TGE Adonis - comment capter, remodeler et rendre accessible une information à forte valeur ajoutée.

0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 864
Sur SlideShare
0
Issues des intégrations
0
Intégrations
8
Actions
Partages
0
Téléchargements
27
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Capter = Harvesting (le H de AOI-PMH)
  • Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information

    1. 1. Pour un véritable accès unifié à l’information<br />i-expo 18 mai 2011<br />
    2. 2. Société ANTIDOT<br />Editeur de logiciels<br /> depuis 1999 | Paris, Lyon, Aix-en-Provence<br />Solution de recherche et d’accès à l’information<br />e-Commerce | Portails | Média | Entreprises<br />Produits - SaaS ou licence<br />AIF : chaine de captation et de valorisation des données<br />AFS : moteur de recherche sémantique à facettes<br />ACS : services collaboratifs<br />
    3. 3. Parmi nos clients<br />Média<br />Entreprises<br />E-commerce<br />Institutions<br />Santé<br />
    4. 4. Plan<br />Le problème<br />#&!<br />Les limites de la « recherche fédérée » de documents<br />
    5. 5. Plan<br />Le problème<br />La réponse<br />#&!<br />?<br />Penser l’accès à l’information dans un espace unifié<br />
    6. 6. Plan<br />Le problème<br />La réponse<br />La solution<br />#&!<br />?<br />Capter, Penser, Valoriser, Exposer l’information<br />
    7. 7. Plan<br />Un exemple<br />Le problème<br />La réponse<br />La solution<br />#&!<br />?<br />Le projet Isidore<br />(TGE Adonis<br />CNRS)<br />
    8. 8. Le problème<br />Les limites de la recherche fédérée<br />
    9. 9. Les difficultés de la recherche fédérée<br />Des silos de données cloisonnés<br />Des données hétérogènes<br />Des référentiels épars et incomplets<br />Une terminologie subjective<br />
    10. 10. Le moteur de recherche : un outil miracle ?<br />
    11. 11. Les limites de la recherche fédérée<br />Recette de cuisine de la recherche fédérée<br />Indexez<br />Servez<br />Collectez<br />
    12. 12. Au mieux, une juxtaposition de docs<br />L’utilisateur n’est pas acteur de sa recherche. <br />
    13. 13. La REPONSE ANTIDOT<br />Penser l’accès à l’information dans un espace unifié et enrichi<br />
    14. 14. Modéliser, lier et annoter les informations<br />Créer une cohérence et de l’information<br />par la mise en relation des différents silos <br />
    15. 15. Modéliser, lier et annoter les informations<br />Utiliser la nature des données sources<br />a pour sujet<br />fait référence à<br />a pour sujet<br />cite<br />inclut<br />CR de réunion<br />Fiche produit<br />page Web<br />Courriel<br />émetteur<br />auteur<br />auteur<br />destinataire<br />fait référence à<br />participant<br />une personne<br />
    16. 16. S’appuyer sur les technologies du Web Sémantique<br />Un cadre d’interopérabilité pour mettre à disposition,<br />consulter, lier et partager des données<br />Un mécanisme d’identification<br />Un protocole<br />Un « langage »<br />Un principe<br />HTTP<br />L’hypertexte<br />URL / URI<br />RDF<br />
    17. 17. Un espace unifié d’information<br />Agilité ne rime pas avec stabilité<br />Modifier les silos existants n’est pas possible<br />Dupliquer les données est une folie<br />Et pourtant<br />Il faut rendre les données malléables et dynamiques<br />Les données enrichies doivent être accessibles<br />
    18. 18. Créer de la valeur pour les utilisateurs<br />
    19. 19. LA SOLUTION ANTIDOT<br />Capter, penser, valoriser, exposer l’information<br />
    20. 20. Capter, Valoriser, Enrichir et Exposer l’information<br />
    21. 21. Antidot Information Factory<br />AIF : un outil industriel et évolutif<br />Une chaîne de captation et de traitement<br />Un cadre de développement<br />Un modèle d’Unité Documentaire<br />
    22. 22. AIF : une chaîne de traitement<br />Créer des chaînes de traitement de données par assemblage de modules<br />Sources de données<br />Module connecteur<br />Modules de transformation et enrichissement<br />
    23. 23. AIF : des briques à assembler<br />Déjà plus de 50 modules prêts à l’emploi en standard<br />Connecteurs<br />Traitements XML<br />Text-mining<br />Traitements RDF<br />
    24. 24. AIF : un cadre de développement<br />Un cadre de développement pour construire des modules<br />50+ filtres prêts à l’emploi <br />Un environnement d’exécution<br />
    25. 25. AIF : un modèle d’unité documentaire<br />Le document<br />est composite <br />est dynamique<br />évolue dans le temps<br />est un objet géré<br /> de façon unifiée <br />
    26. 26. AIF : exposition des données<br />AIF rend accessibles les contenus enrichis via un Content Repository<br />API Web<br />Linked Data<br />
    27. 27. AIF : traite des « flux multi-documents »<br />AIF travaille en flux indépendamment du stockage des données<br />Enrichissement<br />SGBDR<br />Sémantisation<br />Captation<br />Entrepôt RDF (Linked Data)<br />Normalisation<br />Classification<br />Annotation<br />Content Repository<br />Moteur de recherche AFS<br />Indexation<br />
    28. 28. Trouver rapidement l’information<br />
    29. 29. AFS : recherche sémantique<br />Recherche plein texte avec fonctions linguistiques :<br />extension automatique<br />suggestion orthographique<br />suggestion de concepts<br />expressions contextuelles<br />
    30. 30. AFS : suggestion intelligente<br />Autocomplétion intelligente pendant la saisie de la requête<br />
    31. 31. AFS : recherche avancée<br />Recherche multicritères avancée<br />Recherche géographique<br />
    32. 32. AFS : recherche à facettes<br />Recherche à facettes<br />
    33. 33. AFS : regroupement de résultats<br />Clusterisation : regroupement des résultats selon une taxonomie, des propriétés, …<br />
    34. 34. AFS : intégration<br />Toutes les API accessibles en REST<br />Formats de sortie SI ou Web : XML, JSON<br />Compatible OpenSearch<br />Adapté aux architectures SOA et aux projets SBA<br />
    35. 35. Annoter et Partager l’information pour mieux Collaborer<br />
    36. 36. ACS : la recherche collaborative<br />Capitaliser<br />Enregistrer<br />Requêtes<br />Réponses<br />Organiser<br />Dossiers<br />Tags<br />
    37. 37. Un exemple PROBANT<br />Le projet Isidore<br />
    38. 38. Le très grand équipement Adonis (CNRS)<br />Le Très grand équipement du CNRS pour les Sciences Humaines et Sociales<br />Adonis : accès unifié aux données et documents numériques des sciences humaines et sociales<br />Isidore : point d’accès unifié à des données enrichies<br />
    39. 39. Principe du projet<br />Un projet classique en apparence<br />Collecter<br />Traiter<br />Diffuser<br />
    40. 40. Les particularités du projet<br />Collecter des données hétérogènes<br />primaires, secondaires<br />annuaires, bases de données, référentiels<br />Exploiter les métadonnéeset le texte intégral<br />Points durs :diversité, volumétrie<br />
    41. 41. Les particularités du projet<br /><ul><li>Traiter</li></ul>Normaliser les données(qualité, forme, alignement)<br />Enrichir(classification, URI pérenne, vignettes, extraction…)<br />
    42. 42. Les particularités du projet<br />Diffuser dans le Web de données<br />Se préparer auLinked/Open Data<br />Permettre l’émergence de nouveaux outils exploitant les données<br />Rendre accessibleà l’écosystème les données enrichies<br />
    43. 43. Sources de données<br />Des sources multiples et des traitements ad-hoc<br /><ul><li>Sites Web</li></ul>collecte par sitemap<br />extraction des données RDFa<br /><ul><li>Flux RSS</li></ul>capitalisation « illimitée »<br /><ul><li>Entrepôts de publications : articles, revues, thèses, …</li></ul>captation structurée : OAI-PMH, OAI-ORE<br />extraction des métadonnées : DC<br /><ul><li>Diverses sources structurées</li></ul>annuaires de personnes, ressources, sources<br />conférences, séminaires, …<br />Sites Web (sitemap)<br />Flux RSS<br />Entrepôts OAI<br />Calenda<br />Vue générale de la chaîne « PaF » Isidore<br />
    44. 44. Sources de données<br />Connecteurs<br />Modules Pipes&Filters spécifiques aux sources<br />Modules Pipes&Filters communs<br />Sites Web (sitemap)<br />Flux RSS<br />…<br />Liens pérennes<br />Entrepôts OAI<br />…<br />Calenda<br />…<br />…<br />Vue générale de la chaîne « PaF » Isidore<br />Annotation<br />…<br />Référentiels SKOS<br />Fichiers XML de configuration des connecteurs AFS et des modules de normalisation<br />
    45. 45. Chaîne de collecte et de traitement<br />Une chaîne dédiée à la normalisation : 12 filtres<br />Récupération de chaque ressource listée dans le Sitemap<br />Extraction du RDFa<br />Sérialisation du RDFa<br />Passage dans un format pivot<br />Normalisation de la date<br />Normalisation de l’auteur<br />RécupérationHandle et imagette<br />Ajout des informations sources/document<br />Sérialisation du XML pivot<br />
    46. 46. Chaine d’enrichissement<br />Une chaîne dédiée à l’enrichissement : 14 filtres<br />Classification sur la taxonomie HAL<br />Classification sur la taxonomie Sujets Calenda<br />Classification sur la taxonomie Temps Calenda<br />Classification sur la taxonomie Géo Calenda<br />Alignement des types de document<br />Alignement des dates sur Thésaurus W (SIAF)<br />Alignement des langues sur Lexvo<br />Enrichissement des auteurs sur HAL<br />Extraction des sujets sur Rameau, Pactols, Geonames<br />Fusion des annotations<br />
    47. 47. Le moteur utilise les documents déjà classés pour apprendre<br />Puis utilise la base d’indicateurs statistiques pour classifier les 900 000 documents du corpus<br />La classification automatique<br />
    48. 48. Normalisation sur les référentiels<br />fr<br />Français<br />FR<br />francais<br />français<br />Français<br />Anglais<br />en<br />anglais<br />eng<br />english<br />EN<br />
    49. 49. Annotation (tagging)<br />Mots clefs<br />Chaîne de caractères<br />Est exprimé par<br />Est décrit par<br />Le moteur effectue unecomparaison morphologique <br />Pour lier le mot-clé au concept<br />Étiquette<br />Est exprimé par<br />Une ressource documentaire<br />Chaîne de caractères<br />Est décrit par<br />Est décrit par<br />Organise<br />Concept<br />Un thésaurus<br />
    50. 50. Les quatre principes du Web de données ou Linked Data <br />http://dbpedia.org/resource/French_National_Centre_for_Scientific_Research<br />Utiliser des URIs<br />Utiliser des URIsaccessibles via HTTP<br />Donner l’accès aux données utiles en utilisant les standards SPARQL et RDF<br />Exprimer l’URI des objets liés<br />Source : http://www.w3.org/2009/Talks/0204-ted-tbl/#%281%29<br />
    51. 51. Utiliser des URIs<br />Chaque ressource reçoit dans Isidore un identifiant unique et stabledélivré par le CCSD selon le système Handle<br />http://www.rechercheisidore.fr/resource/ 10670.1/qydusc<br />Résolveur<br />Identifiant Handle<br />
    52. 52. Des URIS HTTP<br />Pour chaque URI, Isidore est capable de renvoyer le format le mieux adapté à l’émetteur de la requête : la négociation de contenu<br />http://www.rechercheisidore.fr/resource/10670.1/qydusc<br />http://halshs.archives-ouvertes.fr/halshs-00004902/en/<br />
    53. 53. Des URIS HTTP<br />Pour chaque URI, Isidore est capable de renvoyer le format le mieux adapté à l’émetteur de la requête : la négociation de contenu<br />http://www.rechercheisidore.fr/resource/10670.1/qydusc<br />http://www.rechercheisidore.fr/data/10670.1/qydusc.n3<br />
    54. 54. Des URIS HTTP<br />Pour chaque URI, Isidore est capable de renvoyer le format le mieux adapté à l’émetteur de la requête : la négociation de contenu<br />http://www.rechercheisidore.fr/resource/10670.1/qydusc<br />http://www.rechercheisidore.fr/data/10670.1/qydusc.n3<br />http://halshs.archives-ouvertes.fr/halshs-00004902/en/<br />
    55. 55. Exprimer l’URI des objets liés<br />RéférentielDisciplinesHAL-SHS<br />RéférentielAuteursHAL-SHS<br />RéférentielOrganisationHAL-SHS<br />RéférentielCatégoriesCalenda<br />RéférentielThésaurus WSIAF<br />RéférentielPactols<br />RéférentielGeonames<br />RéférentielRameau<br />RéférentielLexvo<br />ISIDORE<br />
    56. 56. Rendre accessible les enrichissements<br />pour mettre en place une boucle de rétro-action<br />
    57. 57. Architecture fonctionnelle globale<br />Sources de données<br />Collecte, traitement, indexation<br />Diffusion<br />Applications<br />Service de recherche AFS<br />Web : sites, flux<br />indexation<br />UI de démo<br />Capter<br />Annoter, filtrer<br />Normaliser, dédoublonner<br />Entrepôts OAI<br />génération<br />du RDF<br />rechercheisidore<br />Applications de gestion de la plateforme Isidore<br />Entrepôts RDF<br />SparQL endpoint<br />Configuration des sources (appli dédiée)<br />Gestion des référentiels<br />(ITM)<br />Back Office moteur<br />(BO-AFS)<br />Applications,<br />Web Services<br />
    58. 58. Merci de votre attention !<br />Des questions ?<br />

    ×