Mettre en pratique les recommandations sur les archives ouvertes de nouvelle génération de COAR pour l’archive ouverte institutionnelle, Horizon Pleins textes de l’IRD
un récent rapport de COAR (Confederation of Open Access
Repositories) sur les archives ouvertes de nouvelle génération explique que celles-ci n’ont pas développé pleinement leur potentiel et ne sont pas assez connectées. Ce travail
analyse comment les principales recommandations du rapport COAR pourraient être appliquées à l’archive ouverte institutionnelle Horizon Plein textes de l’IRD.
Une introduction aux données de la recherche. Journée d'Etude Agropolis Montp...
Similaire à Mettre en pratique les recommandations sur les archives ouvertes de nouvelle génération de COAR pour l’archive ouverte institutionnelle, Horizon Pleins textes de l’IRD
Similaire à Mettre en pratique les recommandations sur les archives ouvertes de nouvelle génération de COAR pour l’archive ouverte institutionnelle, Horizon Pleins textes de l’IRD (20)
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle génération de COAR pour l’archive ouverte institutionnelle, Horizon Pleins textes de l’IRD
1. Mettre en pratique les recommandations sur les
archives ouvertes de nouvelle génération de
COAR pour l’archive ouverte institutionnelle,
Horizon Pleins textes de l’IRD
Pascal Aventurier service Information Scientifique et
Technique / MCST
Institut de Recherche pour le Développement)
@IST_IRD email : pascal.aventurier@ird.fr
https://www.netvibes.com/doc_ird_de_montpellier#aides_a_la_publication
http://horizon.documentation.ird.fr
2. Objectifs
Les archives ouvertes institutionnelles ont atteint
leur objectif initial
Pérénisation
Visibilité
Mesure de l’activité
Accès libre aux publications
Services aux chercheurs
Exposition des métadonnées pour moissonnage
Liens avec les systems éditoriaux
3. 18/12/2018 3
AVENTURIER PASCAL. Mettre en pratique les recommandations
sur les archives ouvertes de nouvelle génération de COAR pour
l’archive ouverte institutionnelle Horizon Pleins textes de l'iRD.
In : IBNLKHAYAT N. (ED.), BACHR A.A. (ED.), BENCHAKROUN A.
(ED.), ROUDIÈS O. (ED.). Le libre accès à la science :
fondements,enjeux et dynamiques. Rabat : Centre National de
Documentation, 2018, p. 16-28. ISBN 9789920365680 ICOA :
Colloque International sur le LibreAccès = ICOA : International
Colloquium of OpenAccess, 3., 2018/11/28-30, Rabat
http://hal.ird.fr/hal-01941353v1
fdi:010074626
4. Objectifs
les archives ouvertes ne sont pas vraiment
inter-opérables
De nouvelles technologies et architectures
permettraient de nouvelles utilisations et
services
Identification de nouvelles fonctionnalités et
architectures pour les archives ouvertes
Dans le contexte de la communication
scientifique
Mais
5. Contexte
Augmentation du gold open access
Diffusion de nouveaux types de documents
(données, vidéos…)
Preprints, Open Peer-review et Annotation
Identifiants pérennes
Interaction des archives ouvertes avec les
systèmes internes
6. Importance des archives ouvertes : participer à un
modèle pérenne pour l’accès à la conservation
scientifique
18/12/2018 6
APC Article ProcessingCharge peut aller jusqu’à 4000 euros/article pour une
moyenne de 1500 euros
Source: Redalyc https://twitter.com/Redalyc/status/1044987650384568320
7. IRD Institut de Recherche pour le
Développement
dd/mm/yyy Menu insertion / En-tête et pied de page : pour modifier globalement + date 7
Multidisciplinaire : pandémie, changement climatique , crise humaine et politiques,
equitable scientific partnership with developing countries
Partenariats scientifiques équitables avec les pays en développement
65 unites Mixte de Recherche , 2100 agents IRD et 820 chercheurs
60 % des publications avec un co-auteur des pays du Sud
8. Horizon : Archive institutionnelle de l’IRD
• bref historique : un décret : 1955
ART. 6. - Le Centre de documentation est chargé d'assurer le
dépouillement, la conservation et la diffusion de la
documentation scientifique et technique se rapportant aux
activités de l'O.R.S.T.O.M.
un fonds physique : 1960 , une base informatisée : 1986,
un fonds numérique : 1995
• Un exemple unique dans le champ des EPST par son
ampleur
+97000 documents, +79000 PDF dont près de 65000
librement téléchargeables
• Tout chercheur recruté à l’IRD est censé déposer ses travaux
Goury et Brunet 201
Brunet 2018
10. Horizon : visibilité avec OAI-PMH et Sitemap
10
IRD LAB
https://hal.archives-ouvertes.fr/
https://www.rechercheisidore.fr/
https://www.openaire.eu/
http://biblioteca.clacso.edu.ar/
http://openminted.eu/
EU
internal
OAI-PMH : protocol for metadata exchange
HAL le portail national
pour les archives ouvertes
Biblioteca virtual du Clasco
11. Perspectives et évolutions
module HAL, dans Horizon pour envoyer directement des
métadonnées dans HAL
Intégration de l’identifiant numérique pour chercheurs, Orcid
https://orcid.org/ ) , afin de permettre une alimentation
automatique des comptes chercheurs
L’ajoutd’information pour lier la publication au jeu de données
dans Dataverse IRD et réciproquement ;
L’implémentation de l’APIISTEX (https://www.istex.fr/ ) qui
permet de relier les 20 millions d’articles scientifiques
La mise à disposition des données bibliographiques en données
liées ouvertes (linked open data) et alignées avec des
vocabulaires de référence
11
Techniques
07/06/20
18
12. COAR
https://www.coar-repositories.org/activities/
1- Promouvoir le Développement d’un réseau durable d’archives
ouvertes comme élément clé pour les infrastructures internationales de
recherche, support de l’excellence en éducation et enseignement
2- Fournir un support pour la capacité de construction (capacity building)
3- Définir et promouvoir l’interopérabilté, l’adoption de standards et
autre systèmes liés
4- Stimuler le Développement et l’adoption de services à valeur ajoutées
pour les archives ouvertes et leurs réseaux
13. Une archive ouverte de nouvelles génération
» Gère et donne accès à un ensemble diversifié
de ressources (preprints, données, vidéo…)
»Est centré sur les ressources
»Est un entrepôt en réseau, interconnecté
»Propose des contenus machine-friendly
»Est active car elle informe les autres systèmes
et permet des interactions actives locales
15. Fonctionnalités et recommendations techniques
https://www.coar-
repositories.org/files/NGR-
Final-Formatted-Report-
cc.pdf
1. Rendre visibles les identifiants
2. Déclarer les licences au niveau des
ressources
3. Découvrir par la navigation
4. Interagir avec les ressources (annotations,
commentaires et examen)
5. Transférer des ressources
6. Découvrir des lots
7. Recueillir et rendre visibles des activités
8. Identifier les utilisateurs
9. Authentifier les utilisateurs
10.Rendre visibles les statistiques d’utilisation
normalisées
11. Assurer la conservation des ressources Les
fonctionnalités et les technologies
présentées Coar 2017
18. Signposting –
http://signposting.org/
»Signposting est une approche pour rendre
le web académique plus facilement lisible par
les machines en exposant des relations
comme les liens typés. Dans le HTTP Link
headers
»Signposting est implémenté dans
in DSpace-CRIS and OJS. DSpace 7
projéte également de l’implémenter
19. Signposting – exemple d’en tête de signposting
Dans une “landing page”, = la page html décrivant la ressource pour
les consultations humaines,
l’en-tête HTTP (http lin header) contient des informations typant la
relationTyped link auteur et le reliant avec son identifiant Orcid .
Cette information est directement interprétable par les machines.
HTTP/1.1 303 See Other
Server: Apache-Coyote/1.1
Vary: Accept
Location:
http://www.dlib.org/dlib/november15/vandesompel/11vandesompel.
html
Link: <http://orcid.org/0000-0002-0715-6126> ; rel="author",
<http://orcid.org/0000-0003-3749-8116> ; rel="author"
Expires:Tue, 31 May 2016 17:18:50 GMT
Content-Type: text/html;charset=utf-8
Content-Length: 217
Date:Tue, 31 May 2016 16:38:15 GMT
Connection: keep-alive
19
20. Signposting Pattern
»Author
›Lien vers l’information auteur (avec identifiant)
»Bibliographic Metadata
›Le lien pointe vers les métadonnées, en utilisant la relation
describedby et spécifie le format de métadonnées
»Identifier
›Lien vers la « landing page » qui contient et liens vers l’article les
ressources complémentaires etc
› ou propose tous les liens avec accès direct à l’article et aux
ressources liées
»Publication Boundary
›Lien vers la collection par exemple
»ResourceType
›Signale que le lien de l’identifiant est un de type article par
exemple 20
22. Un lien vers la licence a été
proposé pour afficher cette
information
Source Shearer 2018
23. Active Repository Pattern
• Les archives ouvertes en tant que
composant proactif dans un système
conduit par les évenements
• Publiant des évenements qui ajoutent
un nouvel item à un ou plusieurs hubs de
notification ‘events’
• Des systems tiers “souscrivent” à ces
notifications
• Très peu de développement logiciel
http://www.paulwalk.net/2015/10/19/the-active-repository-pattern/
24. Exemple Core
»Activity Streams :
https://www.w3.org/TR/activitystreams-core/
»une recommandation duW3C depuis le 23 mai 2017.
»Cette spécification décrit un modèle pour représenter
les activités potentielles et terminées en utilisant le
format JSON.
»Elle est destinée à être utilisée avec des vocabulaires
qui détaillent la structure des activités et définissent des
types spécifiques d'activités d’un nouvel objet pertinent
ou d’une modification de métadonnées existantes.
» Il permettra aussi de proposer du contenu à des
utilisateurs.
24
25. Les archives ouvertes et les hubs (concentrateur) avec active
repository
Hub comments/annotationsHub “peer review “
Hub changement des Metadonnées
Les archives ouvertes
Source Shearer et Wilcox 2018
27. Ressources Sync
27
Financé par la Sloan Fondation
Pour remplacer OAI-PMH création
2012-2013
OAI-PMH est centré sur les archives ouvertes
Ressources Sync est centré sur les ressources
Plus rapide, fiable et évolutif
Resourcesync est une spécification s’appuyant sur les sitemaps
Ressources Sync permet de transférer le texte intégral et les métadonnées Conduit la
synchronisation des ressources
Permet les modifications en temps réel real-time notification
Fonctionnement
Chargement initial (Dump)
Mise à jour des changements
Les archives ouvertes créent un Dump des changements
Les autres archives mettent à jour leurs contenus avec ces changements
28. Resourcesync :
»http://www.openarchives.org/rs/toc
»Resourcesync est une spécification s’appuyant sur les
sitemaps qui peuvent être utilisés par les administrateurs
pour fournir des informations permettant aux systèmes
tiers de rester synchronisés avec les ressources de
l’entrepôt-source à mesure qu’elles évoluent (création,
mise à jour, etc..). ResourceSync a été créé par la SLOAN
Foundation et le JISC.
»https://sloan.org/
»ps://www.jisc.ac.uk/
28
32. Développements autour de ResourceSync
»Implémentation
› Python
›Connecteurs au système de fichiers, à l’index Solr
›Exposition de Resource Lists, Change Lists
›Convertisseur de OAI-PMH fait par les développeurs
de UCLA
›Planification de Resource Dump, Change Dump
Pour suivre les développements
https://github.com/resourcesync/py-resourcesync
36. Horizon Plein textes - ce qui pourrait être implémenté
1. Rendre visibles les identifiants
2. Déclarer les licences au niveau
des ressources
3. Découvrir par la navigation
4. Interagir avec les ressources
(annotations, commentaires et
examen)
5. Transférer des ressources
6. Découvrir des lots
7. Recueillir et rendre visibles des
activités
8. Identifier les utilisateurs
9. Authentifier les utilisateurs
10.Rendre visibles les statistiques
d’utilisation normalisées
36
1. Signposting
2. Signposting + Creatives
commons
3. Signposting
4.Activity Streams, Web
Annotation Protocol
5. ResourceSync, Sword
6.ResourceSync, Signposting,
Sitemaps
7. Activity Streams,
resourcesync+…
8.Orcid+
9.OpenID connect+
10.Counter, Sushi +
37. Implémentation des technologies dans les plateformes
• OpenAIRE – Europe
• National Institute of Informatics (NII) - Japan
• US Next Generation Repositories Implementers Group
• CARL Open RepositoriesWorking Group - Canada
Implémentation de la technologie dans les logiciels
• ResourceSync
• Dspace https://github.com/DSpace/DSpaceResourceSync
• Une réflexion sur Islandora https://islandora.ca/content/islandora-and-coar-next-generation-repositories-
report
• Signposting
• Signposting sera implémenté dans Dspace 7 et est déjà implémenté dansOJS (Open Journal System), un
logiciel libre pour la gestion complète de journaux scientifiques, dans des entrepôts de données et dans le
schéma Datacite pour décrire les jeux de données scientifiques. https://signposting.org/adopters/
38. Conclusions
»D’une archive ouverte à un réseau d’archives ouvertes
interconnectées
›Échanges de ressources et d ’activités (annotation)
»Des technologies très intéressantes qui pourraient être
plus largement implémentées …à suivre
»L’archive ouverte s’inscrit dans le processus de
publication
»Les outils libres (Dspace , Eprint) doivent proposer ces
outils dans leurs distribution, et les agrégateurs les
utiliser
»Peut être un peu tôt pour Horizon plein textes… ne pas
oublier aussi les ressources nationales (ISTEX, HAL…)
»Changer d’outil pour Horizon Plein textes ??
38
39. Merci de votre attention !
Et merci à toute l’équipe IST de l’IRD
Questions ?
Pascal.Aventurier@ird.fr
39
@IST_IRD
http://horizon.documentation.ird.fr ; https://numerisud.ird.fr/
Nos supports : http://www.slideshare.net/IST_IRD
40. Références
Bollini, Andra (2018). . “(170) #COAR2018 Next Generation Repositories by Andrea Bollini -YouTube.” n.d.Accessed November 23, 2018.
https://www.youtube.com/watch?v=pY5q0JWgzn4&index=5&list=PLHgaWM4ONlSi2B0M3uk7Ir5yUS_sTXtgk.
Brunet, Emilie (2018). “Horizon, ArchiveOuverte Institutionnelle de l’IRD.” Education presented at the Forum desAOI, Paris.
https://www.slideshare.net/IST_IRD/horizon-archive-ouverte-institutionnelle-de-lird-emilie-brunet-forum-des-aoi-13062018.
COAR.( 2017). “Fonctionnalités et RecommandationsTechniques Du Groupe deTravailCOAR Sur Les ArchivesOuvertes de Prochaine
Génération (Trad).” https://www.coar-repositories.org/files/NGR-Final-Formatted-Report_french-version.pdf.
Klein, Martin (2018). “ATechnical Framework for Resource Synchronization.” n.d.Accessed November 23, 2018.
http://www.dlib.org/dlib/january13/klein/01klein.html.
Klein, Martin (2018). COAR e.V. ResourceSync: A Modular Framework forWeb-Based Resource Synchronization by Martin Klein. Accessed
September 25, 2018. https://www.youtube.com/watch?v=tfD-C_LiQXw&feature=youtu.be.
Knoth, Peter. 2018. “CORE’s Use of ResourceSync | Zenodo.” https://zenodo.org/record/1433820#._dBfzhKipo.“
“ResourceSync Framework Specification.”Accessed November 22, 2018.h
ttp://www.openarchives.org/rs/1.1/resourcesync#ResMDLinking.
MIT. MASSACHUSETTS INSTITUTE OF TECHNOLOGY (2016). Institute-wideTask Force on the Future of Libraries. Preliminary Report.
[En ligne]. https://future-of-libraries.mit.edu/sites/default/files/FutureLibraries-PrelimReport-Final.pdf (Page consultée le 30 août 2018).
Nixon, William (2018). “NextGeneration Repositories / Que Faire Pour Une Meilleure Nteropérabilité.JournéeVisibilité Des Archives
Ouvertes.”Villeurbanne (France, November 20. https://visiarchives.sciencesconf.org/data/pages/coar_ngr_couperin_final_2018.pdf.
Rodrigues, Eloy; Shearer, Kathleen; COAR Next Generation RepositoriesWG (2017). Behaviours andTechnical Recommendations of the
COAR Next Generation RepositoriesWorking Group », [En ligne]. Disponible à : https://www.coar-repositories.org/files/NGR-Final-
Formatted-Report-cc.pdf (Page consultée le 30 août 2018).
Shearer, Kathleen. 2018. “#COAR2018 Open Is Not Enough! By Kathleen Shearer,COAR Executive Director.”YouTube.Accessed October
13, 2018. https://www.youtube.com/channel/UCdyST1LzXVP0Rh40-Ek4B_A.
Shearer, Kahtleen, and DavidWilcox. 2018. “Next Generation Repositories: Scaling up Repositories to aGlobal KnowledgeCommons.”
June 26. https://doi.org/10.5281/zenodo.1298417.
Van de Sompel, H., and Nelson, M.L. (2015)Achieving Meaningful Interoperability forWeb-Based Scholarship.
http://www.slideshare.net/hvdsomp/interoperability-for-webbased-scholarship
Van deSompel, Hebert. (2014). ResourceSync: A Quick Overview.Accessed November 27, 2018.
https://www.youtube.com/watch?time_continue=2&v=ASQ4jMYytsA.
40ICOA 2018 Rabat