SlideShare une entreprise Scribd logo
1  sur  40
Référentiels et moteurs de recherche www.antidot.net
ANTIDOT
Société ANTIDOT Cœur de métier  Solution de recherche et d’accès à l’information Compétences Editeur, hébergeur, conseil et intégrateur Fiche d’identité   Création en 1999  Implantation : Paris, Lyon, Aix en Provence Forte croissance 13ème croissance française  au classement Solutions AFS : moteur de recherche CKS : services collaboratifs
Solutions par métier AFS@ENTERPRISE - La solution IntranetAugmente l’efficacité de la recherche et de la diffusion d’information en interne fusionnant moteur de recherche fédéré, veille et outil de partage d’information. AFS@STORE - la solution e-CommerceAugmente significativement le taux de conversion et de rachat en proposant des outils de recherche, de navigation, d’analyse et de référencement avancé. AFS@WEB - la solution portail Augmente le nb de visiteurs et de pages vues ainsi que la notoriété du site. AFS@PUBLISHING - la solution mediaValorise et commercialise davantage les archives en proposant une recherche fédérée et intelligente sur des contenus multimédia.
Parmi nos références Média Entreprises eCommerce Institutions Santé
Les Référentiels Définition Exemples
Définition Référentiel  [referãsjεl]. n. m.  ,[object Object]
Ensemble auquel doivent appartenir les éléments, les solutions d'un problème posé (Larousse).
Ensemble général dont on étudie les sous-ensembles.,[object Object]
Données dont les applications de l'ensemble du système d'information ont besoin pour fonctionner ; les « données de référence » (Wikipedia).,[object Object]
Généralistes :
dictionnaires : Littré (78 423 entrées), Larousse (135 000 entrées), Wiktionnaire …
encyclopédiques : Rameau (Répertoired'autorité-matière de la BNF, 100 000 noms communs)
Spécialisés :
Eurovoc : multilingue,par l’UE
Geonames : 8 millions de noms géographiques
Termsciences : vocabulaire scientifique (190 000 concepts  650 000 termes, par l’INIST),[object Object]
Types de référentiels : enfouis dans le système d’information Référentiels malgré eux Les SI des entreprises regorgent de référentiels  ,[object Object],Noms, groupes, fonctions, rôles … ,[object Object],Noms, métiers, secteurs …  ,[object Object],AFS, CKS   ACC, RTE Prana  QM Catégories, produits, références …
Types de référentiels : enfouis dans le système d’information Référentiels malgré eux Tout ce qui structure et oriente l’usage au quotidien : taxonomies, plans de classement ,[object Object]
Arborescences des serveurs de fichiers
Structures des GED, des sites,[object Object]
Utilisation par les moteurs Extension sémantique Auto complétion Catégorisation Annotation automatique Recherche à facettes
Utilisation par les moteurs Les moteurs de recherche adorent les référentiels Indexation Annotation Enrichissement… Captation des sources Récupération, générationdes référentiels
Utilisation par les moteurs Extension sémantique = élargir la recherche ,[object Object]
aligner le vocabulaire métier avec l’usage,[object Object],[object Object],[object Object]
Utilisation par les moteurs Catégorisation ventiler les réponsessur des axes nouveauxpour répondre à desusages précis.
Utilisation par les moteurs Annoter automatiquement les documents repérer dans chaque document les concepts des référentiels :identifier les personnes citées, les produits, les clients … ,[object Object],Antidot Finder Suite   ACC   RTE   SEMA CKS Produit moteur de recherche, facettes, lemmatisation, catégorisation, annotation, indexation, text-mining Vocabulaire Fabrice Lacroix Stéphane Loesel Jérôme Mainka Annuaire
Utilisation par les moteurs Génération de nuages de mots Chaque document est résumé automatiquement
Utilisation par les moteurs Recherche à facettes fournir des filtres à l’utilisateur pour comprendre l’information et affiner dynamiquement sa recherche
Cas Client : Annotations sémantiques
Le corpus d’évaluation :      1000 livres scannés      (277 739 pages) Les référentiels : ,[object Object]
RAMEAU:  100 000 termes
LCSH: 250 000 termes
… Cas BNF - Les sources brutes
Le processus brut de l’annotation : pour chaque terme du livre présent dans un référentiel, créer une annotation sémantique « la page X référence le concept Y ». Cas BNF - Principe
Le résultat obtenu est très décevant. Pourquoi ? Trop de pages dans les livres et trop de termes dans les référentiels. Exemple : Les Fables de la Fontaine ,[object Object]
10 000+ annotations générées
2500 après optimisationChaque livre contient      tous les concepts Cas BNF - Premier résultat
Les annotations générées et les facettes deviennent inutiles. Tous les livres se ressemblent. Taxonomie Rameau Cas BNF - Inconvénient
Antidot résout le problème avec une innovation :      un moteur de filtrage sémantique post-annotation 0 à 5 des concepts les plus significatifs pour les facettes 10 000 annotations 20 à 40 annotations automatiques Cas BNF - La solution Antidot semantic filtering engine

Contenu connexe

Tendances

Orthophonistes3 2011-1-strategie
Orthophonistes3 2011-1-strategieOrthophonistes3 2011-1-strategie
Orthophonistes3 2011-1-strategie
David BENOIST
 
Recherche documentaire en médecine
Recherche documentaire en médecineRecherche documentaire en médecine
Recherche documentaire en médecine
eveillard
 
Documentation Electronique
Documentation  ElectroniqueDocumentation  Electronique
Documentation Electronique
rapettis
 
PubMed en 10 000 signes
PubMed en 10 000 signesPubMed en 10 000 signes
PubMed en 10 000 signes
eveillard
 
Orthophonistes3 2011-4-bbd
Orthophonistes3 2011-4-bbdOrthophonistes3 2011-4-bbd
Orthophonistes3 2011-4-bbd
David BENOIST
 

Tendances (17)

Grand livre de PubMed
Grand livre de PubMedGrand livre de PubMed
Grand livre de PubMed
 
Orthophonistes3 2011-1-strategie
Orthophonistes3 2011-1-strategieOrthophonistes3 2011-1-strategie
Orthophonistes3 2011-1-strategie
 
Liste de références de la thèse2
Liste de références de la thèse2Liste de références de la thèse2
Liste de références de la thèse2
 
Recherche documentaire en médecine
Recherche documentaire en médecineRecherche documentaire en médecine
Recherche documentaire en médecine
 
Documentation Electronique
Documentation  ElectroniqueDocumentation  Electronique
Documentation Electronique
 
Brevet2016
Brevet2016Brevet2016
Brevet2016
 
PubMed en 10 000 signes
PubMed en 10 000 signesPubMed en 10 000 signes
PubMed en 10 000 signes
 
Brest slidedoc
Brest slidedocBrest slidedoc
Brest slidedoc
 
Orthophonistes3 2011-4-bbd
Orthophonistes3 2011-4-bbdOrthophonistes3 2011-4-bbd
Orthophonistes3 2011-4-bbd
 
Recherche d'information et veille chimie 2017
Recherche d'information et veille chimie 2017Recherche d'information et veille chimie 2017
Recherche d'information et veille chimie 2017
 
Se former sur pub med
Se former sur pub medSe former sur pub med
Se former sur pub med
 
Slidedoc documents gratuits def
Slidedoc  documents  gratuits defSlidedoc  documents  gratuits def
Slidedoc documents gratuits def
 
Iut chimie ppp-2017
Iut chimie ppp-2017Iut chimie ppp-2017
Iut chimie ppp-2017
 
Polytech geii sept2016
Polytech geii sept2016Polytech geii sept2016
Polytech geii sept2016
 
Recherche documentaire Master 1 LEA
Recherche documentaire Master 1 LEARecherche documentaire Master 1 LEA
Recherche documentaire Master 1 LEA
 
Master genie procedes-sept2016
Master genie procedes-sept2016Master genie procedes-sept2016
Master genie procedes-sept2016
 
Pub med
Pub medPub med
Pub med
 

En vedette

En vedette (7)

Comment choisir un moteur de recherche ?
Comment choisir un moteur de recherche  ?Comment choisir un moteur de recherche  ?
Comment choisir un moteur de recherche ?
 
Comparatif moteur de recherche
Comparatif moteur de rechercheComparatif moteur de recherche
Comparatif moteur de recherche
 
Referencement moteur de-recherche
Referencement moteur de-rechercheReferencement moteur de-recherche
Referencement moteur de-recherche
 
ElasticSearch : Architecture et Développement
ElasticSearch : Architecture et DéveloppementElasticSearch : Architecture et Développement
ElasticSearch : Architecture et Développement
 
Elasticsearch - Devoxx France 2012
Elasticsearch - Devoxx France 2012Elasticsearch - Devoxx France 2012
Elasticsearch - Devoxx France 2012
 
Moteur de recherche retour expérience
Moteur de recherche   retour expérienceMoteur de recherche   retour expérience
Moteur de recherche retour expérience
 
Verbes en -er au présent
Verbes en -er au présentVerbes en -er au présent
Verbes en -er au présent
 

Similaire à Référentiel et Moteur de Recherche

Recherche d'information sages femmes
Recherche d'information sages femmesRecherche d'information sages femmes
Recherche d'information sages femmes
Laetitia Raimbault
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Antidot
 
Correction des exercices du premier jour
Correction des exercices du premier jourCorrection des exercices du premier jour
Correction des exercices du premier jour
eveillard
 
Pubmed Internes Médecine Générale
Pubmed Internes Médecine GénéralePubmed Internes Médecine Générale
Pubmed Internes Médecine Générale
Laetitia Raimbault
 

Similaire à Référentiel et Moteur de Recherche (20)

Pdj pharma partie lingway
Pdj pharma partie lingwayPdj pharma partie lingway
Pdj pharma partie lingway
 
Navigation et Recherche pour les sites E-Commerce
Navigation et Recherche pour les sites E-CommerceNavigation et Recherche pour les sites E-Commerce
Navigation et Recherche pour les sites E-Commerce
 
Recherche d'information sages femmes
Recherche d'information sages femmesRecherche d'information sages femmes
Recherche d'information sages femmes
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
 
Sources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’InformationSources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’Information
 
Correction des exercices du premier jour
Correction des exercices du premier jourCorrection des exercices du premier jour
Correction des exercices du premier jour
 
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Du bon usage de Google : la recherche d’informations sur le web
Du bon usage de Google : la recherche d’informations sur le webDu bon usage de Google : la recherche d’informations sur le web
Du bon usage de Google : la recherche d’informations sur le web
 
Archives ouvertes en médecine : Trouver des articles en texte intégral en lib...
Archives ouvertes en médecine : Trouver des articles en texte intégral en lib...Archives ouvertes en médecine : Trouver des articles en texte intégral en lib...
Archives ouvertes en médecine : Trouver des articles en texte intégral en lib...
 
Web of Science - Fiche technique
Web of Science - Fiche techniqueWeb of Science - Fiche technique
Web of Science - Fiche technique
 
Concepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSConcepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSS
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Sp6 Yann Nicolas
Sp6 Yann NicolasSp6 Yann Nicolas
Sp6 Yann Nicolas
 
Cours eleves sages femmes
Cours eleves sages femmesCours eleves sages femmes
Cours eleves sages femmes
 
ED VAS 2016 Pour une recherche bibliographique efficace
ED VAS 2016 Pour une recherche bibliographique efficaceED VAS 2016 Pour une recherche bibliographique efficace
ED VAS 2016 Pour une recherche bibliographique efficace
 
Cdi tpe lycee
Cdi tpe lyceeCdi tpe lycee
Cdi tpe lycee
 
Pub med niveau 1
Pub med niveau 1Pub med niveau 1
Pub med niveau 1
 
Pubmed Internes Médecine Générale
Pubmed Internes Médecine GénéralePubmed Internes Médecine Générale
Pubmed Internes Médecine Générale
 

Plus de Antidot

Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
Antidot
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
Antidot
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
Antidot
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Antidot
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Antidot
 

Plus de Antidot (20)

Comment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaireComment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaire
 
Antidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenus
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texte
 
Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
 
Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FR
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
 
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?
 
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertes
 

Référentiel et Moteur de Recherche

  • 1. Référentiels et moteurs de recherche www.antidot.net
  • 3. Société ANTIDOT Cœur de métier Solution de recherche et d’accès à l’information Compétences Editeur, hébergeur, conseil et intégrateur Fiche d’identité Création en 1999 Implantation : Paris, Lyon, Aix en Provence Forte croissance 13ème croissance française au classement Solutions AFS : moteur de recherche CKS : services collaboratifs
  • 4. Solutions par métier AFS@ENTERPRISE - La solution IntranetAugmente l’efficacité de la recherche et de la diffusion d’information en interne fusionnant moteur de recherche fédéré, veille et outil de partage d’information. AFS@STORE - la solution e-CommerceAugmente significativement le taux de conversion et de rachat en proposant des outils de recherche, de navigation, d’analyse et de référencement avancé. AFS@WEB - la solution portail Augmente le nb de visiteurs et de pages vues ainsi que la notoriété du site. AFS@PUBLISHING - la solution mediaValorise et commercialise davantage les archives en proposant une recherche fédérée et intelligente sur des contenus multimédia.
  • 5. Parmi nos références Média Entreprises eCommerce Institutions Santé
  • 7.
  • 8. Ensemble auquel doivent appartenir les éléments, les solutions d'un problème posé (Larousse).
  • 9.
  • 10.
  • 12. dictionnaires : Littré (78 423 entrées), Larousse (135 000 entrées), Wiktionnaire …
  • 13. encyclopédiques : Rameau (Répertoired'autorité-matière de la BNF, 100 000 noms communs)
  • 16. Geonames : 8 millions de noms géographiques
  • 17.
  • 18.
  • 19.
  • 21.
  • 22. Utilisation par les moteurs Extension sémantique Auto complétion Catégorisation Annotation automatique Recherche à facettes
  • 23. Utilisation par les moteurs Les moteurs de recherche adorent les référentiels Indexation Annotation Enrichissement… Captation des sources Récupération, générationdes référentiels
  • 24.
  • 25.
  • 26. Utilisation par les moteurs Catégorisation ventiler les réponsessur des axes nouveauxpour répondre à desusages précis.
  • 27.
  • 28. Utilisation par les moteurs Génération de nuages de mots Chaque document est résumé automatiquement
  • 29. Utilisation par les moteurs Recherche à facettes fournir des filtres à l’utilisateur pour comprendre l’information et affiner dynamiquement sa recherche
  • 30. Cas Client : Annotations sémantiques
  • 31.
  • 32. RAMEAU: 100 000 termes
  • 33. LCSH: 250 000 termes
  • 34. … Cas BNF - Les sources brutes
  • 35. Le processus brut de l’annotation : pour chaque terme du livre présent dans un référentiel, créer une annotation sémantique « la page X référence le concept Y ». Cas BNF - Principe
  • 36.
  • 37. 10 000+ annotations générées
  • 38. 2500 après optimisationChaque livre contient tous les concepts Cas BNF - Premier résultat
  • 39. Les annotations générées et les facettes deviennent inutiles. Tous les livres se ressemblent. Taxonomie Rameau Cas BNF - Inconvénient
  • 40. Antidot résout le problème avec une innovation : un moteur de filtrage sémantique post-annotation 0 à 5 des concepts les plus significatifs pour les facettes 10 000 annotations 20 à 40 annotations automatiques Cas BNF - La solution Antidot semantic filtering engine
  • 41. Les facettes deviennent utilisables et permettent maintenant de discriminer les livres Taxonomie Rameau Cas BNF - Résultat obtenu
  • 42. Chaque livre est automatiquement annoté Cas BNF - Résultat obtenu
  • 43. Référentiels et Web Sémantique
  • 44.
  • 45. Du référentiel à l’ontologie Et tous ces objets sont liés par des règles Relations internes : appartient à, est composé de, est relié à… Types Anatomie Parties Pathologies … … … est sujet à … … … … est traitable par Types est indiqué pour Traitements Médicaments Posologies Galénique est composé de … Relations internes : est contre indiqué avec, neutralise, amplifie, …
  • 46. Du référentiel à l’ontologie Le référentiel est la base de l’ontologie Ontologie = des choses (des objets) + des mots pour en parler + des règles qui animent / contraignent les choses L’ontologie décrit donc un domaine particulier.Les règles ne sont plus « codées » mais exprimées et donc modifiables dynamiquement. Les ontologies permettent aux applications de publier, d’échanger des informations.Il faut donc utiliser au maximum des ontologies normalisées.
  • 47. Ontologie et moteur de recherche L’articulation des référentiels entre eux permet de mailler l’information et de décupler les possibilités d’interrogation sans toucher aux entrepôts sources tous les documents sur les traitements incompatibles avec le médicament X Recherche unifiée « one search to query them all » le moteur de recherche : une approche « pragmantique »pragmatique + sémantique
  • 49.
  • 53.
  • 54. Exploitez les référentiels métier existants
  • 55. Enrichissez avec votre vocabulaire maison
  • 56. Tirez partie des composants de votre SI
  • 57.