Créer un moteur de recherche avec des logiciels libresRobert Viseur
Lorsque l’on parle de moteur de recherche, les noms de Google, Bing ou Yahoo! viennent immédiatement à l’esprit. La taille de ces moteurs (plusieurs milliards de pages indexées), l’importance des infrastructures (grands centres de données) et la pertinence des résultats de recherche peuvent donner l’impression que les développements spécifiques sont devenus impossibles ou sans intérêt.
La création de moteurs de recherche spécialisés reste cependant possible, et utile pour certains usages particuliers (ex.: moteurs de recherche d’entreprise, mise en place de systèmes de veille, etc.). Pour ce faire, le développeur peut s’appuyer sur les interfaces de programmation (API) généralement mises à disposition par les moteurs de recherche commerciaux mais aussi sur les très nombreux composants et logiciels libres existants. Ces derniers couvrent la collecte des données textuelles, leur analyse, leur indexation et leur présentation.
La présentation détaille les différentes étapes de création d’un moteur de recherche. Les outils libres disponibles, ainsi que leurs limites et cadres d’utilisation privilégiés, sont ensuite présentés.
Cette présentation a été réalisée dans le cadre du cours Projet d’intervention en milieu documentaire du programme d’études Techniques de la documentation au Cégep Lionel-Groulx. Réalisée par Marie Ève Cossette, Paméla Lebrun et Geneviève Noiseux.
Comment créer un thésaurus de A à Z et inventorier plus de 300 documents en 2...Paméla Lebrun
Cette présentation a été réalisée dans le cadre du cours Projet d’intervention en milieu documentaire du programme d’études Techniques de la documentation au Cégep Lionel-Groulx. Réalisése par Marie Ève Cossette, Paméla Lebrun et Geneviève Noiseux.
Présentation par Pierre-Yves Buard lors de l'école d'été Biblissima « Autour de la bibliothèque du Mont Saint-Michel — éditer et cataloguer aujourd’hui » (Avranches, 29 août – 2 septembre 2016).
Créer un moteur de recherche avec des logiciels libresRobert Viseur
Lorsque l’on parle de moteur de recherche, les noms de Google, Bing ou Yahoo! viennent immédiatement à l’esprit. La taille de ces moteurs (plusieurs milliards de pages indexées), l’importance des infrastructures (grands centres de données) et la pertinence des résultats de recherche peuvent donner l’impression que les développements spécifiques sont devenus impossibles ou sans intérêt.
La création de moteurs de recherche spécialisés reste cependant possible, et utile pour certains usages particuliers (ex.: moteurs de recherche d’entreprise, mise en place de systèmes de veille, etc.). Pour ce faire, le développeur peut s’appuyer sur les interfaces de programmation (API) généralement mises à disposition par les moteurs de recherche commerciaux mais aussi sur les très nombreux composants et logiciels libres existants. Ces derniers couvrent la collecte des données textuelles, leur analyse, leur indexation et leur présentation.
La présentation détaille les différentes étapes de création d’un moteur de recherche. Les outils libres disponibles, ainsi que leurs limites et cadres d’utilisation privilégiés, sont ensuite présentés.
Cette présentation a été réalisée dans le cadre du cours Projet d’intervention en milieu documentaire du programme d’études Techniques de la documentation au Cégep Lionel-Groulx. Réalisée par Marie Ève Cossette, Paméla Lebrun et Geneviève Noiseux.
Comment créer un thésaurus de A à Z et inventorier plus de 300 documents en 2...Paméla Lebrun
Cette présentation a été réalisée dans le cadre du cours Projet d’intervention en milieu documentaire du programme d’études Techniques de la documentation au Cégep Lionel-Groulx. Réalisése par Marie Ève Cossette, Paméla Lebrun et Geneviève Noiseux.
Présentation par Pierre-Yves Buard lors de l'école d'été Biblissima « Autour de la bibliothèque du Mont Saint-Michel — éditer et cataloguer aujourd’hui » (Avranches, 29 août – 2 septembre 2016).
Présentation par Pierre-Yves Buard lors de l'école d'été Biblissima « Autour de la bibliothèque du Mont Saint-Michel — éditer et cataloguer aujourd’hui » (Avranches, 29 août – 2 septembre 2016).
Pierre-Yves Buard, Biblissima pour l'édition scientifique. Journée Biblissima et IIIF "Innover pour redécouvrir le patrimoine écrit" (15 mars 2018, Campus Condorcet)
Comment l'intelligence artificielle améliore la recherche documentaireAntidot
Présentation faite par Pierre Col au Meetup Lyon Data Science du 9 juin 2016 : l'intelligence artificielle et le machine learning, appliqués au texte mining (classification automatique, extraction d'entités nommées) permettent d'enrichir des corpus documentaires avec des métadonnées qui vont faciliter la recherche d'information et la navigation dans les documents, qui peuvent être liés selon l'approche du linked data.
Cours sur les normes et standards (principales notions à connaître) auprès d'étudiants en Master Multimédia de Bordeaux. Principaux enjeux des normes et standards abordés : accessibilité, indexation (avec métadonnées et dublin core), interopérabilité, web sémantique et open data.
Les éléments d'indexation dans la DTD-EADDanis Habib
Une présentation élaborée par un groupe de travail sur la DTD-EAD que j'avais récupéré pour une formation sur l'indexation : quels sont les éléments d'indexation utilisés dans la DTD-EAD?
Présentation de Stéphane Pouyllau (TGE Adonis, CNRS) lors du colloque infoclio.ch 2011 à Berne le 30 septembre 2011.
Ecouter la conférence:
http://soundcloud.com/infoclio-ch/isidore
ISIDORE : plateforme d’accès unifié aux données de la recherche en sciences humaines et sociales
ISIDORE est un plate-forme informatique d'accès unifié, de valorisation et d'enrichissement des données numériques de la recherche en sciences humaines et sociales. Créé et animée par le très grand équipement ADONIS du Centre national de la recherche scientifique (Paris, France), ISIDORE est accessible à tous depuis décembre 2010 sur le site web http://rechercheisidore.fr. Ce nouvel outil s'appuie sur des principales méthodes d'interopérabilité des données en vigueur depuis plus de 10 ans tout en ouvrant sur les méthodes du web de données, aussi nommé web 3.0, actuellement en plein développement (RDF, etc.).
ISIDORE collecte les métadonnées et les données, les enrichies en les reliant aux termes issus de référentiels scientifiques (thesaurus, vocabulaires, etc.), les places dans le web de données et les rend accessibles au travers d'un triple accès (moteur de recherche sur le web, api et "sparql endpoint" pour pour construire des applications d'aide à la recherche). ISIDORE est le plus gros projet d'open data scientifique opérationnel en France.
L'intervention proposée permettra de découvrir la rapidement la plate-forme et ces spécificités, d'en comprendre le fonctionnement et d'en présenter les premiers retours.
Support de cours sur le logiciel de gestion et de mise en forme de références bibliographiques et de documents EndNote, et de son outil en ligne de partage, EndNote Online.
Présentation par Pierre-Yves Buard lors de l'école d'été Biblissima « Autour de la bibliothèque du Mont Saint-Michel — éditer et cataloguer aujourd’hui » (Avranches, 29 août – 2 septembre 2016).
Pierre-Yves Buard, Biblissima pour l'édition scientifique. Journée Biblissima et IIIF "Innover pour redécouvrir le patrimoine écrit" (15 mars 2018, Campus Condorcet)
Comment l'intelligence artificielle améliore la recherche documentaireAntidot
Présentation faite par Pierre Col au Meetup Lyon Data Science du 9 juin 2016 : l'intelligence artificielle et le machine learning, appliqués au texte mining (classification automatique, extraction d'entités nommées) permettent d'enrichir des corpus documentaires avec des métadonnées qui vont faciliter la recherche d'information et la navigation dans les documents, qui peuvent être liés selon l'approche du linked data.
Cours sur les normes et standards (principales notions à connaître) auprès d'étudiants en Master Multimédia de Bordeaux. Principaux enjeux des normes et standards abordés : accessibilité, indexation (avec métadonnées et dublin core), interopérabilité, web sémantique et open data.
Les éléments d'indexation dans la DTD-EADDanis Habib
Une présentation élaborée par un groupe de travail sur la DTD-EAD que j'avais récupéré pour une formation sur l'indexation : quels sont les éléments d'indexation utilisés dans la DTD-EAD?
Présentation de Stéphane Pouyllau (TGE Adonis, CNRS) lors du colloque infoclio.ch 2011 à Berne le 30 septembre 2011.
Ecouter la conférence:
http://soundcloud.com/infoclio-ch/isidore
ISIDORE : plateforme d’accès unifié aux données de la recherche en sciences humaines et sociales
ISIDORE est un plate-forme informatique d'accès unifié, de valorisation et d'enrichissement des données numériques de la recherche en sciences humaines et sociales. Créé et animée par le très grand équipement ADONIS du Centre national de la recherche scientifique (Paris, France), ISIDORE est accessible à tous depuis décembre 2010 sur le site web http://rechercheisidore.fr. Ce nouvel outil s'appuie sur des principales méthodes d'interopérabilité des données en vigueur depuis plus de 10 ans tout en ouvrant sur les méthodes du web de données, aussi nommé web 3.0, actuellement en plein développement (RDF, etc.).
ISIDORE collecte les métadonnées et les données, les enrichies en les reliant aux termes issus de référentiels scientifiques (thesaurus, vocabulaires, etc.), les places dans le web de données et les rend accessibles au travers d'un triple accès (moteur de recherche sur le web, api et "sparql endpoint" pour pour construire des applications d'aide à la recherche). ISIDORE est le plus gros projet d'open data scientifique opérationnel en France.
L'intervention proposée permettra de découvrir la rapidement la plate-forme et ces spécificités, d'en comprendre le fonctionnement et d'en présenter les premiers retours.
Support de cours sur le logiciel de gestion et de mise en forme de références bibliographiques et de documents EndNote, et de son outil en ligne de partage, EndNote Online.
Points forts :
• Traitements spécifiques par type de média
• Gestion optimisée des formats générés par Armadillo
• Fonctions de gestion sur mesure selon les besoins métiers
La société Armadillo a pour métier historique l’édition de DAM. Ses solutions sont aujourd’hui diffusées en grand nombre sous forme de progiciels et sous forme d’applications sur mesure.
Comme toutes les solutions Armadillo, l’application DAM est souple, évolutive et modulaire, pour bâtir un outil correspondant à vos besoins métier.
C’est un outil professionnel idéal pour l’archivage, l’indexation, l’échange et la publication de tous contenus: photos, vidéos, sons, docs bureautiques (office, open office, PDF), Indesign, Illustrator, 3D…
La structure d’index très évoluée d’Armadillo permet dans une même base de donnée physique de gérer des fonds hétérogènes de manière autonome (champs spécifiques) et homogène (champs communs) de façon simple et transverse.
Fonctions principales :
Traitements spécifiques par type de document (pdf, suite office, images, vidéos, sons, indd…)
Structures documentaires spécifiques par type et/ou groupe de documents
Gestion des connaissances via des ontologies (thésaurus, plan de classement…)
Rebonds sémantiques (objet attribut d’un autre objet)
Nombreuses fonctions d’aide à l’indexation (propagation, héritages, abréviations…)
Cette présentation définit rapidement le Plan de gestion de données dans le cadre du Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis.
La solution GDI (Global Data Inquirer) est une solution de data science développée par Assystem.
Elle permet d’extraire une description exhaustive des installations (ontologies) et d’alimenter :
- des bases de données propriétaires
- des modèles de simulations ou MBSE (ingénierie système basée sur les modèles)
- un moteur de recherche sémantique
Les informations pertinentes accumulées sur toute la durée vie d’une installation, sont ainsi rapidement accessibles malgré la masse de documents.
Les bonnes pratiques en bibliographie, les outils et méthodes bibliométriques (notamment Zotero) pour l'aide à la recherche et l'écriture des thèses et mémoires en droit. Un rapide focus final est fait sur les outils d'aide à la détection de plagiat.
Intervention réalisée en octobre 2014 pour le compte de l'école doctorale de droit public de Paris I.
Points forts :
• Traitements spécifiques par type de média
• Gestion optimisée des formats générés par Armadillo
• Fonctions de gestion sur mesure selon les besoins métiers
La société Armadillo a pour métier historique l’édition de DAM. Ses solutions sont aujourd’hui diffusées en grand nombre sous forme de progiciels et sous forme d’applications sur mesure.
Comme toutes les solutions Armadillo, l’application DAM est souple, évolutive et modulaire, pour bâtir un outil correspondant à vos besoins métier.
C’est un outil professionnel idéal pour l’archivage, l’indexation, l’échange et la publication de tous contenus: photos, vidéos, sons, docs bureautiques (office, open office, PDF), Indesign, Illustrator, 3D…
La structure d’index très évoluée d’Armadillo permet dans une même base de donnée physique de gérer des fonds hétérogènes de manière autonome (champs spécifiques) et homogène (champs communs) de façon simple et transverse.
Fonctions principales :
Traitements spécifiques par type de document (pdf, suite office, images, vidéos, sons, indd…)
Structures documentaires spécifiques par type et/ou groupe de documents
Gestion des connaissances via des ontologies (thésaurus, plan de classement…)
Rebonds sémantiques (objet attribut d’un autre objet)
Nombreuses fonctions d’aide à l’indexation (propagation, héritages, abréviations…)
Jabes 2021 - Poster "Initiation aux études historiques"ABES
MANUEL NUMÉRIQUE EN ACCÈS LIBRE
POUR L’ENSEIGNEMENT SUPÉRIEUR EN HISTOIRE
• Favorise l’apprentissage des modes
de réflexion propres à l’historien
• Familiarise l’étudiant à la maîtrise
des sources et outils de l’historien
• Ouvre l’étudiant aux disciplines qui
environnent et nourrissent la science
historique
• Donne à l’étudiant les repères
historiographiques
Poster présenté par COUPERIN
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"ABES
This document discusses the status of requests in Cidemis, the French ISSN database. It provides statistics on the percentage of requests (corrections, creations, numeration) that were completed in 2015-2020 for ISSN France and other centers. Completion rates were higher for ISSN France than other centers. It also discusses how to track numeration requests that were accepted in the Sudoc database to then close the corresponding requests in Cidemis.
This document provides an overview of the Cidemis application and circuit for requesting ISSN numbers. It begins with a brief introduction to Cidemis and the upstream Sudoc networks. It then discusses the digitization of the request circuit and how technology illuminates the complexity of communication. The rest of the document provides reminders and best practices for users of the application, including the importance of clear communication and documentation. It also references additional resources for learning about and using Cidemis.
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"ABES
Session coordonnée par Marianne Giloux (Abes).
Cette session aborde les points suivants :
- Un renouvellement conceptuel international
- Un renouvellement technologique nécessaire
- La transition bibliographique de l’Abes : l’expérimentation SudocFRBR, le FNE, le projet Sudoc21 et lme projet "Vers la LRMisation des données"
Jabes 2021 - 26 ans après la création de l'AbesABES
Présentation de David Aymonin, directeur de l'Abes
Intervention qui brosse un tableau synthétique de ce que fait l’Abes aujourd’hui : à quoi sert-elle ? dans quel contexte ? pour qui travaille-t-elle ? de quelle manière et avec qui ?
Présentation des Actus de l'Abes 2021, partie 1.
Cette partie est consacré aux actions de l'Abes au service de l'IST, de la Science Ouverte et des grands projets nationaux.
Poster présenté par l'Abes (hors concours).
Depuis 2019, l’Abes teste un nouvel algorithme développé par OCLC pour créer automatiquement des pré-notices d’œuvres, à partir de regroupements de notices bibliographiques. Ce premier pas dans la FRBRisation (aujourd'hui on parle de LRMisation) des données du catalogue Sudoc s’est accompagné d’un contrôle très strict des performances et des résultats de ce "robot". L’expérimentation aujourd’hui terminée, il est temps d’en dresser le bilan, pour vérifier dans quelle mesure, à l’avenir, les algorithmes et l’intelligence artificielle seront d’un précieux recours pour modéliser des millions de données.
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...ABES
Poster présenté par le SCD de l'Université de Toulouse 2 Jean Jaurès.
Le Service Commun de la Documentation de l’Université Toulouse - Jean Jaurès a mis en place un service d'accompagnement à la gestion des données qui s'articule autour :
- d'une offre de formation à destination des doctorants
- d'un accompagnement des chercheurs
La mise en œuvre de cet appui en collaboration avec l'ensemble des acteurs impliqués au niveau de l'établissement a permis un reconnaissance du SCD comme un acteur primordial sur ces questions. Ainsi, dans le cadre de la formalisation des acteurs de la Science Ouverte au sein de l’établissement, la vice-présidence recherche a chargé le SCD d'assurer les fonctions d'administrateur.rice des données, des algorithmes et des codes sources de la recherche et de co-piloter le comité opérationnel des données de la recherche.
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...ABES
Poster présenté par l'association KohaLa.
Ce poster présente le plugin Koha qui permet d’insérer des identifiants pérennes trouvés par Bibliostratus dans des notices bibliographiques (ark ou PPN) et autorités (ark, isni, Idref).
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...ABES
Poster présenté par le SCD de l'Université Toulouse 2 Jean Jaurès.
L’objet de ce poster est de présenter la démarche qui a conduit à un projet d’expositions participatives autour de la collection cartographique patrimoniale de l’Université Toulouse Jean Jaurès, conservée au Centre de Ressources Olympe de Gouges. Après avoir découvert en 2007 cette collection sans usages, alors que j'étais responsable de la bibliothèque de Géographie, j'ai décidé de mener à partir de 2010 des recherches en Sciences de l’Information et de la Communication sur le document carte. Après l'obtention de mon doctorat en 2015, j'ai poursuivi des travaux scientifiques sur une méthode favorisant l’appropriation des valeurs informatives de ce document singulier dans l'idée de développer des médiations. Depuis deux ans, j'expérimente ainsi des ateliers avec des usagers placés en situation d’enquêter sur des cartes, en vue de réaliser des posters documentaires. Les objectifs de l'application professionnelle de mes réflexions sont multiples : créer du lien entre des documents patrimoniaux sans usages et des potentiels récepteurs, les inviter à découvrir et à utiliser des documents dans une démarche de réactivation, les inciter à avoir des lectures plurielles d'un même document, et enfin proposer un autre modèle d’expositions afin de vivifier des collections en dormance documentaire.
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...ABES
Poster présenté par l'INISTCNRS et le CCSD.
Lancé au printemps 2021 et soutenu par le MESRI, corHAL proposera ses services à la fin de l’année. Porté par l’Inist et le CCSD, ce projet permet de collecter des métadonnées de publications scientifiques françaises issues de plusieurs réservoirs. Ces données sont homogénéisées et enrichies à l’aide d’alignements. Un repérage de doublons assure la création de notices unifiées combinant les informations des différentes sources. Grâce à un système d’alertes (mode push ou pull), le service propose au chercheur ses publications absentes de HAL. Ce dernier choisit d’importer automatiquement aucun, un, plusieurs ou tous les textes intégraux de ses publications dans l’archive ouverte nationale.
CorHAL, un outil au service du chercheur et de la science ouverte.
Cycle de Formation Théâtrale 2024 / 2025Billy DEYLORD
Pour la Saison 2024 / 2025, l'association « Le Bateau Ivre » propose un Cycle de formation théâtrale pour particuliers amateurs et professionnels des arts de la scène enfants, adolescents et adultes à l'Espace Saint-Jean de Melun (77). 108 heures de formation, d’octobre 2024 à juin 2025, à travers trois cours hebdomadaires (« Pierrot ou la science de la Scène », « Montage de spectacles », « Le Mime et son Répertoire ») et un stage annuel « Tournez dans un film de cinéma muet ».
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseOscar Smith
Besoin des conseils pour les Jeunes ? Le document suivant est plein des conseils de la Vie ! C’est vraiment un document conseil de la jeunesse que tout jeune devrait consulter.
Voir version video:
➡https://youtu.be/7ED4uTW0x1I
Sur la chaine:👇
👉https://youtube.com/@kbgestiondeprojets
Aimeriez-vous donc…
-réussir quand on est jeune ?
-avoir de meilleurs conseils pour réussir jeune ?
- qu’on vous offre des conseils de la vie ?
Ce document est une ressource qui met en évidence deux obstacles qui empêchent les jeunes de mener une vie épanouie : l'inaction et le pessimisme.
1) Découvrez comment l'inaction, c'est-à-dire le fait de ne pas agir ou d'agir alors qu'on le devrait ou qu'on est censé le faire, est un obstacle à une vie épanouie ;
> Comment l'inaction affecte-t-elle l'avenir du jeune ? Que devraient plutôt faire les jeunes pour se racheter et récupérer ce qui leur appartient ? A découvrir dans le document ;
2) Le pessimisme, c'est douter de tout ! Les jeunes doutent que la génération plus âgée ne soit jamais orientée vers la bonne volonté. Les jeunes se sentent toujours mal à l'aise face à la ruse et la volonté politique de la génération plus âgée ! Cet état de doute extrême empêche les jeunes de découvrir les opportunités offertes par les politiques et les dispositifs en faveur de la jeunesse. Voulez-vous en savoir plus sur ces opportunités que la plupart des jeunes ne découvrent pas à cause de leur pessimisme ? Consultez cette ressource gratuite et profitez-en !
En rapport avec les " conseils pour les jeunes, " cette ressource peut aussi aider les internautes cherchant :
➡les conseils pratiques pour les jeunes
➡conseils pour réussir
➡jeune investisseur conseil
➡comment investir son argent quand on est jeune
➡conseils d'écriture jeunes auteurs
➡conseils pour les jeunes auteurs
➡comment aller vers les jeunes
➡conseil des jeunes citoyens
➡les conseils municipaux des jeunes
➡conseils municipaux des jeunes
➡conseil des jeunes en mairie
➡qui sont les jeunes
➡projet pour les jeunes
➡conseil des jeunes paris
➡infos pour les jeunes
➡conseils pour les jeunes
➡Quels sont les bienfaits de la jeunesse ?
➡Quels sont les 3 qualités de la jeunesse ?
➡Comment gérer les problèmes des adolescents ?
➡les conseils de jeunes
➡guide de conseils de jeunes
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...mrelmejri
J'ai réalisé ce projet pour obtenir mon diplôme en licence en sciences de gestion, spécialité management, à l'ISCAE Manouba. Au cours de mon stage chez Attijari Bank, j'ai été particulièrement intéressé par l'impact des critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les décisions d'investissement dans le secteur bancaire. Cette étude explore comment ces critères influencent les stratégies et les choix d'investissement des banques.
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...M2i Formation
Améliorez l'intégration de vos nouveaux collaborateurs grâce à notre formation flash sur l'onboarding. Découvrez des stratégies éprouvées et des outils pratiques pour transformer l'intégration en une expérience fluide et efficace, et faire de chaque nouvelle recrue un atout pour vos équipes.
Les points abordés lors de la formation :
- Les fondamentaux d'un onboarding réussi
- Les outils et stratégies pour un onboarding efficace
- L'engagement et la culture d'entreprise
- L'onboarding continu et l'amélioration continue
Formation offerte animée à distance avec notre expert Eric Collin
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24BenotGeorges3
Les informations et évènements agricoles en province du Luxembourg et en Wallonie susceptibles de vous intéresser et diffusés par le SPW Agriculture, Direction de la Recherche et du Développement, Service extérieur de Libramont.
Le fichier :
Les newsletters : https://agriculture.wallonie.be/home/recherche-developpement/acteurs-du-developpement-et-de-la-vulgarisation/les-services-exterieurs-de-la-direction-de-la-recherche-et-du-developpement/newsletters-des-services-exterieurs-de-la-vulgarisation/newsletters-du-se-de-libramont.html
Bonne lecture et bienvenue aux activités proposées.
#Agriculture #Wallonie #Newsletter #Recherche #Développement #Vulgarisation #Evènement #Information #Formation #Innovation #Législation #PAC #SPW #ServicepublicdeWallonie
8. Constat :
➢ Modèles de documents DTD et schémas
multiples
➢ Respect aléatoire des standards de la part des
éditeurs
➢ Formes et éléments de contenu très variés,
contenu inexact ou absent
➢ Spécificité d’un corpus en XML (arborescence
avec respect aléatoire de la DTD, noms des
éléments différents, espaces de noms non
déclarés ...)
8
La standardisation des données a pour objectif d’assurer une
interopérabilité optimale des données en vue de leur réutilisation.
Standardisation :
➢ Formats standards :
● MODS, TEI …
➢ Données (valeurs)
10. Pour rendre mon document compatible avec
différents standards
11. Metadonnées :
● titles
● abstracts
● identifiers
● authors / affiliations
● keywords
● bibliographic references
● etc.
11
MODS (Metadata Object Description Schema) :
En tant que format d’échanges et de partage, il permet une articulation
entre des données bibliographiques construites selon des modèles
différents (books + journals)
Format pivot
12. Metadonnées dans <teiHeader> :
● titles
● abstracts
● identifiers
● authors / affiliations
● keywords
● bibliographic references
● etc.
+ balisage du texte dans <text><body>
12
TEI (Text Encoding Initiative) :
Effort international pour unifier les pratiques d’encodage de texte dans
le domaine académique.
- Plein texte dans XML
- généré à partir du PDF
13. Pour permettre à mon document d’être
“recherchable” & “analysable” par des outils TDM
25. Une API pour permettre à mon document d’être
consulté
26. 26
Un Web Service permettant d'accéder à mon document
grâce à des fonctionnalités de :
• Recherche avancée
• Tri
• Pagination
• Facettes
• Téléchargement
28. 28
Après intégration, recherche et accès au plein-texte :
• Widgets
• Portails universitaires / ENT
• Outils de découverte
• Google Scholar
• Démonstrateur
• Extension Firefox
& Google Chrome
• ...
29. Permettre à mon document d’être trouvé via
plusieurs moteurs compatibles OpenURL
30. ● L'API ISTEX dispose de son propre résolveur dédié
aux ressources ISTEX
● Respect de la Norme OpenURL z39_88_2004
(versions 0.1 et 1.0)
● Résolution à partir
○ d'identifiants forts (DOI, PMID…)
○ de métadonnées, si suffisamment exhaustives
● Exemples
○ https://api.istex.fr/document/openurl?rft_id=
info:doi/10.1007/978-3-642-13792-1_17
○ https://api.istex.fr/document/openurl?
&rft.issn=0302-9743
&rft.au=Alma M. Gómez-Rodríguez&rft.date=2010
30
31. ● Possibilité d'intégrer le résolveur dans les outils
compatibles avec la norme
○ Exemple : Zotero
31
1
2
3
32. Permettre à mon document d’être trouvé
via les outils de découverte
34. Permettre à mon document d’être trouvé
via le moteur spécialisé Google Scholar
35. ● Déclaration des "bouquets ISTEX" via KBart Bacon
● Utilisation de la fonction "Library Links"
35
2
1
3
4
36. 36
● Ajout d'un lien [PDF ISTEX] si ressource détectée
● Ce lien de type OpenURL
○ Utilise le résolveur ISTEX
○ Amène au plein-texte sur la plateforme ISTEX
38. • Détection automatique des documents ISTEX
à partir des identifiants documentaires (DOI, PMID, PII…)
• Vérification de la présence dans l'API ISTEX
via requête OpenURL
• Affichage d'un bouton reliant au plein-texte
38
39. • Installation simplifiée (https://addons.istex.fr)
• Activation automatique de la bibliothèque ISTEX GScholar
39
OU