ISIDORE :
L'accès unifié aux données numériques
des sciences humaines et sociales
rechercheisidore.fr
Jean-Luc Minel, TGE Adonis/Univ. Paris Ouest la Défense
Stéphane Pouyllau, TGE Adonis/CNRS
Journée de l'ABES, Montpellier, 17 mai 2011.
Très grand équipement Adonis
 Adonis est le seul très grand équipement pour
les SHS
 Infrastructure de recherche au sens de la
feuille de route européenne ESFRI
 Accès aux données (ISIDORE) ; Centres de
ressources ; Grille de services
Revues.org Persée HALSHS theses.fr
BDD
MSH, UMR...
Portail Web Portail Web Portail WebPortail Web Portail WebPortail Web Portail WebPortail Web
La situation actuelle de l'accès aux
données numériques des SHS
ISIDORE
Entrepôt de
données
moissonnées
Référentiels :
BNF, Archives de
France,
Réseau Frantiq
HALSHS...
Données enrichies
Revues.org Persée HALSHS theses.fr
BDD
MSH, UMR...
Portail Web Portail Web Portail WebPortail Web Portail WebPortail Web Portail WebPortail Web
rechercheisidore.fr
Données
Collecte
(crawl)
Traitements Accès
(API et facettes)
Gestion, Monitoring, Statistiques
Utilisateurs
Référentiels
Normalisés (RDF/SKOS)
SPARQL endpoint
pour les producteurs
de données
Le fonctionnement général
rechercheisidore.fr
Extension de recherche sur les
catalogues de bibliothèques (SRU/SRW
- Z3950)
Données
Données
Données
OAI-PMH
RDFa
RSS
Enrichissement des des
métadonnées et données
(format pivot RDF)
Référentiels Référentiels
 Phase 1 (novembre 2009 – novembre 2010)
 Accès unifiés aux données actuelles des opérateurs
« historiques »
 Développement de la plateforme de recherche
 Phase 2 (novembre 2010 – novembre 2011)
 Construction et normalisation de référentiels
 Enrichissement du site rechercheisidore.fr (prod.)
 Phase 3 (novembre 2011 – novembre 2012)
 Développement de portails dédiés, extension (portails)
 Développement d'outil et services (web de données)
Les phases de réalisation : un planning respecté
Les fondations
 Implication des opérateurs SHS produisant des
données (non-éditées, sources éditées, publications)
 Utilisation de standards internationaux
 Formats ouverts (indépendance vis à vis de
fournisseurs)
 Mise en valeur des données, métadonnées,
référentiels structurés produits par les équipes.
 Développement et mode de fonctionnement itératif
La réalisation : une petite équipe...
Une équipe de réalisation interdisciplinaire dirigée par le TGE
Adonis
 Une direction de projet : Jean-Luc Minel et Stéphane Pouyllau, TGE
ADONIS
 Un chef de projet / architecte : Laurent Capelli, CCSD
 Réalisation, développement et interfaces : Jean-baptiste Génicot,
Philippe Correia, Loic Comparet (TGE ADONIS et CCSD)
 Support d'infrastructure : Centre de Calcul de l'IN2P3 / CNRS
(Villeurbanne)
Un marché public de réalisation (octobre 2009 – mars 2010) et un
consortium :
 Antidot, Mondeca, Sword
- Contribution à la visibilité
internationale de la
production scientifique des
SHS
- Accès unifié à des données
numériques réparties
- Contribution à la réflexion
sur la métamorphose de
l’environnement numérique
de travail pour le chercheur
en SHS
- Valorisation et construction
de référentiels scientifiques
- Valorisation et exploitation
des métadonnées des SHS
- Disséminer les bonnes
pratiques des humanités
numériques (gestion de
projets, utilisation de formats
pivots, standards, etc.)
Les bénéfices attendus pour les SHS
Les bénéfices technologiques pour les SHS
 ISIDORE est un outil du web 3.0 (web de données)
 ISIDORE est un point d'accès que l'on peut décliner
 Portails thématiques
 Vers d'autres disciplines
 ISIDORE est construit de façon modulaire sur les principes
du W3C (consortium gérant le web)
 Construire et participer à la construction du web de
données, avec des données scientifiques
ISIDORE : un cas unique ?
ISIDORE est un site
web... avec « une »
860 sources de
données moissonnées
+ de 1.000.000
ressources indexés
Étendre la
recherche sur des
catalogues de
bibliothèques
Vue générale d'une ressource dans
rechercheisidore.fr
Web de données et ISIDORE :
Construire des outils de recherche
ISIDORE
Pactols
Rameau
Geonames
(lieux)
Thésaurus
W (archives
de France)
Lexvo
(langues)
Référentiels
HALSHS
(personnes
disciplines)
OpenEdition
Calenda.org
(catégories)
Isidore dans le nuage du web sémantique
Accès à l'entrepôt RDF d'ISIDORE avec
le langage sparql (W3C) = accès aux
données enrichies (métadonnées
producteurs + enrichissements) dans un
format normalisé et ouvert
Accès au sparql end point d'ISIDORE
 Charte d'utilisation fixant les conditions d'utilisation
 Travail en commun entre le TGE Adonis et les
utilisateurs
 Objectifs :
 Travail sur la qualité des métadonnées
 Garder la maîtrise des métadonnées et des
données (respect des URI des producteurs de
données, filtres RDF)
 Sensibiliser les partenaires du TGE Adonis aux
aspects stratégiques de l'open data scientifique
ISIDORE : vue coté service pour les producteurs
 ISIDORE distribue pour les ressources moissonnées un
identifiant pérenne (handle) :
 Si la ressource en possède déjà un (doi, …) ISIDORE
donne le choix au producteur
 De ré-exposer son id. pérenne
 D'utiliser le handle ISIDORE
 Si la ressource n'a pas d'id. Pérenne :
 Le handle ISIDORE peut être réutilisé par le
producteur
=> Service d'identification pérenne
ISIDORE : Les + pour les chercheurs
 Enrichissement des données :
 Explorer une question
 Balayer rapidement une discipline
 Suivre des thèmes (veille)
 Construire des outils d'aide à la recherche :
 ISIDORE est aussi utilisable via une API
 Intégration possible dans les outils de gestion de site
web : flux RSS, Modules CMS (à venir)
En savoir plus...
 Contact général : isidore@tge-adonis.fr
 Ajout de sources : isidore-sources@tge-adonis.fr
 Comprendre isidore :
http://rechercheisidore.fr/apropos et
http://www.tge-adonis.fr/service/isidore
Merci de votre attention...
 www.rechercheisidore.fr

Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDORE : l'accès unifié aux données numériques des sciences humaines et sociales"

  • 1.
    ISIDORE : L'accès unifiéaux données numériques des sciences humaines et sociales rechercheisidore.fr Jean-Luc Minel, TGE Adonis/Univ. Paris Ouest la Défense Stéphane Pouyllau, TGE Adonis/CNRS Journée de l'ABES, Montpellier, 17 mai 2011.
  • 2.
    Très grand équipementAdonis  Adonis est le seul très grand équipement pour les SHS  Infrastructure de recherche au sens de la feuille de route européenne ESFRI  Accès aux données (ISIDORE) ; Centres de ressources ; Grille de services
  • 7.
    Revues.org Persée HALSHStheses.fr BDD MSH, UMR... Portail Web Portail Web Portail WebPortail Web Portail WebPortail Web Portail WebPortail Web La situation actuelle de l'accès aux données numériques des SHS
  • 8.
    ISIDORE Entrepôt de données moissonnées Référentiels : BNF,Archives de France, Réseau Frantiq HALSHS... Données enrichies Revues.org Persée HALSHS theses.fr BDD MSH, UMR... Portail Web Portail Web Portail WebPortail Web Portail WebPortail Web Portail WebPortail Web rechercheisidore.fr
  • 9.
    Données Collecte (crawl) Traitements Accès (API etfacettes) Gestion, Monitoring, Statistiques Utilisateurs Référentiels Normalisés (RDF/SKOS) SPARQL endpoint pour les producteurs de données Le fonctionnement général rechercheisidore.fr Extension de recherche sur les catalogues de bibliothèques (SRU/SRW - Z3950) Données Données Données OAI-PMH RDFa RSS Enrichissement des des métadonnées et données (format pivot RDF) Référentiels Référentiels
  • 10.
     Phase 1(novembre 2009 – novembre 2010)  Accès unifiés aux données actuelles des opérateurs « historiques »  Développement de la plateforme de recherche  Phase 2 (novembre 2010 – novembre 2011)  Construction et normalisation de référentiels  Enrichissement du site rechercheisidore.fr (prod.)  Phase 3 (novembre 2011 – novembre 2012)  Développement de portails dédiés, extension (portails)  Développement d'outil et services (web de données) Les phases de réalisation : un planning respecté
  • 11.
    Les fondations  Implicationdes opérateurs SHS produisant des données (non-éditées, sources éditées, publications)  Utilisation de standards internationaux  Formats ouverts (indépendance vis à vis de fournisseurs)  Mise en valeur des données, métadonnées, référentiels structurés produits par les équipes.  Développement et mode de fonctionnement itératif
  • 12.
    La réalisation :une petite équipe... Une équipe de réalisation interdisciplinaire dirigée par le TGE Adonis  Une direction de projet : Jean-Luc Minel et Stéphane Pouyllau, TGE ADONIS  Un chef de projet / architecte : Laurent Capelli, CCSD  Réalisation, développement et interfaces : Jean-baptiste Génicot, Philippe Correia, Loic Comparet (TGE ADONIS et CCSD)  Support d'infrastructure : Centre de Calcul de l'IN2P3 / CNRS (Villeurbanne) Un marché public de réalisation (octobre 2009 – mars 2010) et un consortium :  Antidot, Mondeca, Sword
  • 13.
    - Contribution àla visibilité internationale de la production scientifique des SHS - Accès unifié à des données numériques réparties - Contribution à la réflexion sur la métamorphose de l’environnement numérique de travail pour le chercheur en SHS - Valorisation et construction de référentiels scientifiques - Valorisation et exploitation des métadonnées des SHS - Disséminer les bonnes pratiques des humanités numériques (gestion de projets, utilisation de formats pivots, standards, etc.) Les bénéfices attendus pour les SHS
  • 14.
    Les bénéfices technologiquespour les SHS  ISIDORE est un outil du web 3.0 (web de données)  ISIDORE est un point d'accès que l'on peut décliner  Portails thématiques  Vers d'autres disciplines  ISIDORE est construit de façon modulaire sur les principes du W3C (consortium gérant le web)  Construire et participer à la construction du web de données, avec des données scientifiques
  • 15.
    ISIDORE : uncas unique ?
  • 16.
    ISIDORE est unsite web... avec « une » 860 sources de données moissonnées + de 1.000.000 ressources indexés
  • 22.
    Étendre la recherche surdes catalogues de bibliothèques
  • 23.
    Vue générale d'uneressource dans rechercheisidore.fr
  • 27.
    Web de donnéeset ISIDORE : Construire des outils de recherche
  • 28.
  • 29.
    Isidore dans lenuage du web sémantique
  • 30.
    Accès à l'entrepôtRDF d'ISIDORE avec le langage sparql (W3C) = accès aux données enrichies (métadonnées producteurs + enrichissements) dans un format normalisé et ouvert
  • 32.
    Accès au sparqlend point d'ISIDORE  Charte d'utilisation fixant les conditions d'utilisation  Travail en commun entre le TGE Adonis et les utilisateurs  Objectifs :  Travail sur la qualité des métadonnées  Garder la maîtrise des métadonnées et des données (respect des URI des producteurs de données, filtres RDF)  Sensibiliser les partenaires du TGE Adonis aux aspects stratégiques de l'open data scientifique
  • 33.
    ISIDORE : vuecoté service pour les producteurs  ISIDORE distribue pour les ressources moissonnées un identifiant pérenne (handle) :  Si la ressource en possède déjà un (doi, …) ISIDORE donne le choix au producteur  De ré-exposer son id. pérenne  D'utiliser le handle ISIDORE  Si la ressource n'a pas d'id. Pérenne :  Le handle ISIDORE peut être réutilisé par le producteur => Service d'identification pérenne
  • 34.
    ISIDORE : Les+ pour les chercheurs  Enrichissement des données :  Explorer une question  Balayer rapidement une discipline  Suivre des thèmes (veille)  Construire des outils d'aide à la recherche :  ISIDORE est aussi utilisable via une API  Intégration possible dans les outils de gestion de site web : flux RSS, Modules CMS (à venir)
  • 35.
    En savoir plus... Contact général : isidore@tge-adonis.fr  Ajout de sources : isidore-sources@tge-adonis.fr  Comprendre isidore : http://rechercheisidore.fr/apropos et http://www.tge-adonis.fr/service/isidore
  • 36.
    Merci de votreattention...  www.rechercheisidore.fr