AAF - Archives et Internet : les nouveaux enjeux                                               INTEROPERABILITÉ ET        ...
CC BY-NC-ND J Mark Dodds, FlickrMais qu’est-ce que c’est que    ces gros mots…?!?
L’interopérabilité, pour vous… ?                               CC BY-ND Helga Weber, Flickr
INTEROPERABILITE = Permettre  léchange de données entre     systèmes dinformation                                      CC ...
La recette de l’interopérabilité       de Grand-Maman                               CC BY-NC-SA Joana Hard, Flickr
Des ingrédients de qualitéDes données hétérogènes…       mais propres                              CC BY-NC-SA Joana Hard,...
Des protocoles de pro  Du matériel d’échange       normalisés                          CC BY-NC Captain Blaubeere, Flickr
De bonnes proportions Un langage commun                        CC BY-NC-SA paloetic, Flickr
ECHANGER, POURQUOI ?CC BY Robert Couse-Baker, Flickr
Améliorer la visibilité et la disséminationdes collections                CC BY-ND Jeremy Salmon, Flickr
Organiser l’accès àl’information pour    les usagers                      CC BY-NC-ND Alain Bachellier, Flickr
Dupliquer ?CC BY-SA e3000, Flickr
Le contexte administratif et    technique : le référentiel   général d’interopérabilité             (RGI)Publié par la DGM...
Les niveaux   d’interopérabilité du RGIEx. modélisation, ontologies, mais aussi SEDAEx. formats d’images, de documents mul...
Pour parler la même langue :         normaliser !                                 ThesaurusEAD                            ...
Où es-tu ?Des identifiants   pour les  ressources numériques  Uniques  Pérennes                            CC BY-NC-ND x...
ARK : un formatd’identificationpérenne                   CC BY-NC-ND Friday Flets, Flickr
http://archives.somme.fr/ark:/58483/a011260969022JKSv1y/1/1                             ARK aux AD de la Somme
Le système ARK : structure                          et organisationhttp://gallica.bnf.fr/ark:/12148/bpt6k5809503p/f2.image...
OAI-PMHUn protocole d’échange incontournable dans le       domaine culturel                      CC BY-NC dr coop, Flickr
CC BY-NC-ND Marylise Doctrinal, Flickr       OAI-PMH =Open Archives Initiative - Protocol for Metadata      Harvesting
Principes de fonctionnement du      protocole OAI-PMH                                 © Ministère de la Culture, 2005
Le fournisseur   Le fournisseur  de données       de services   (entrepôt)     (moissonneur)                              ...
The place to be ?L’OAI-PMH en 2012, c’est :                                  CC BY-NC-ND vallygirl_tka, Flickr1740 entrepô...
Les concepts documentaires                      de l’OAI-PMH RESSOURCEObjet physique ou          ITEM   numérique         ...
Exemple denotice OAI
Qu’y a-t-il dans unenregistrement OAI-PMH ? •Un en-tête : header- identifier (obligatoire, non répétable)- datestamp (obli...
Qu’y a-t-il dans unenregistrement OAI-PMH ? •Des métadonnées : metadata- métadonnées encodées en XML avec leurélément raci...
CC BY-NC-ND Wondermonkey2k, Flickr   Parlez-vous   OAI-PMH ?OAI-PMH a le vocabulaire d’un     bébé de 18 mois !
La syntaxe de moissonnage                    : les 6 verbesIdentify : identifier l’entrepôtListMetadataFormats : lister le...
CC BY-NC-SA Musebrarian, Flickr
OAI-PMH             at o uts                   L esIl sappuie sur les standards du Web, lemoissonnage est simple à mettre ...
OAI-PMH             i mi tes                   Le slProblèmes de granularité et dehiérarchisationPas d’interrogation fineP...
AV OUS DE JOUER…!     (n° 1-5)
Dublin Core  À protocole d’échange  générique… format de métadonnées générique !                           CC BY-NC-ND s.r...
15 éléments de  description, facultatifs et  répétables                  CC BY-NC-SA David Sherret, Flickr
CC BY-NC-SA David Sky, source Améliorer la recherche de ressourcessur le web, en définissant un ensemble      de métadonné...
Les 15 éléments        du Dublin Core simple   Contenu      Propriété    Instanciation              intellectuelleTitle   ...
Mais comment je fais du DublinCore avec mes données à moi ?                                 CC BY-SA tangi_bertin, Flickr
La problématique des conversions                               CC BY-ND tomaB, Flickr
Une notice dans Cartolis          http://www.cartolis.org/detail_notice.php?num=AA00000001&x=11&y=13
La même en Dublin Core…http://www.cartolis.org/oai/oai2.php?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:cartolis.o...
Et avec l’EAD ?        COMPLEXITÉ          HIERARCHIE           GRANULARITÉ                         CC BY-NC-ND Rickydavid...
Un fonds d’archives en EAD : les   papiers Pierre et Marie Curie
Du fichier XML-EAD trèsstructuré et hiérarchisé…
… à l’enregistrement       en Dublin Core
… et c’est pas fini…  A partir d’informationscontenues dans <archdesc>
Tableau de conversion EAD > Dublin Core
Dublin Core           at o uts                 L esGénéricité : permet de décrire des ressources numériques ou physiques, ...
Dublin Core                         i mi tes                   Le slSimplification des métadonnéesLibertés d’interprétatio...
CC BY-ND cursething, Flickr OAI-PMH est simpleDublin Core est simple          Ce n’est pas une          raison pour faire ...
AV OUS DE JOUER…!      (n°6)
CC BY-NC pcgn7, Flickr… et donc, finalement,à quoi ça sert…?           … à participer à des            portails collectifs !
Europeana, mère de tous les portails…
La nébuleuse des projets liés à Europeana
Des portails par              type d’institutionLe Portail archivistique européen
Des portails nationauxLe « guichet unique » français :      le moteur Collections
Une dynamique est lancée... Les portails culturels locaux se multiplient                              GeoCulture enBanque ...
Mais aussi...Isidore, plateforme de  recherche pour les sciences humaines et    sociales (SHS)                         Gal...
AV OUS DE JOUER…!      (n°7)
Pour aller plus loin…InteropérabilitéInteropérabilité : faire des choix, échanger, gérer le temps (S. Pouyllau, 2010)Voir ...
Merci de votre attention                                        pauline.moirez@bnf.frCC BY-NC Go Esewhere, flickr
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
Prochain SlideShare
Chargement dans…5
×

Interopérabilité et échanges de données pour les archives

1 646 vues

Publié le

L'échange de données pour les institutions culturelles : le protocole OAI-PMH, le format Dublin Core, les portails de ressources culturelles et patrimoniales

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 646
Sur SlideShare
0
Issues des intégrations
0
Intégrations
4
Actions
Partages
0
Téléchargements
56
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Participer à des portails communs, à des projets collaboratifs, se faire connaître en participant à des projets plus vastes Permettre et susciter les réutilisations Améliorer son référencement par les moteurs de recherche en multipliant les liens entrants Augmenter la fréquentation de nos sites et la consultation de nos ressources numériques
  • Échanger avec d’autres domaines (culturels, patrimoniaux, scientifiques) Proposer un accès unique pour les usagers S’intégrer dans un écosystème d’usages de recherche centralisé
  • Seulement les métadonnées, et seulement dans un format appauvri : pas de duplication des contenus. Éviter les doublons, éviter de perdre la main sur les contenus numérisés
  • Objectifs : Améliorer la qualité des services aux administrés Réduire les délais de mise en ligne des services Maîtriser les coûts (développement et maintenance) Favoriser l&apos;interopérabilité en respectant l’autonomie Contribuer à l’ouverture des systèmes d’information Adopter un langage et une sémantique communs Converger vers un cadre d’interopérabilité européen Guider les administrations dans leurs choix Garantir la neutralité de l’administration Favoriser la standardisation et l’innovation
  • Unique : L&apos;identifiant a la même signification partout. L’identifiant désigne une seule et unique ressource. Pérenne : L’identifiant ne doit pas dépendre de l’emplacement physique de la ressource (URL) ‏ . La pérennité est garantie par l’institution qui attribue les identifiants (« autorité nommante »).
  • Archival Resource Key Mis en place par la California Digital Library Qui l’utilise en France ? (institutions figurant sur le registre de la CDL) Institutions versées dans la préservation des données numériques : CINES, CNES Bibliothèques : BnF, BM Toulouse, BIU Cujas, Archives : ANOM, AD Somme, Doubs, Belfort, Allier, Côte-d&apos;Or, AM Pontivy, Collectivités territoriales : Ville de Besançon, CG Martinique
  • ARK (Archival Resource Key) est un système d&apos;identifiants mis en place par la California Digital Library (CDL), et qui a vocation à identifier des objets de manière pérenne. Il peut s&apos;agir d&apos;objets de tous types, physiques (table, livre), numériques (livre numérisé…) ou même immatériels (concepts, …). Les qualifieurs sont des suffixes permettant de préciser sa demande sur un document et sont de deux types : - Les qualifieurs de granularité, commençant par un &amp;quot;/&amp;quot;, permettent de demander l&apos;accès à une partie de l&apos;objet (ex. : page d&apos;un document). Ils suivent immédiatement le nom ARK ; - Les qualifieurs de service, commençant par un &amp;quot;.&amp;quot;, permettent de demander l&apos;accès à une variante particulière d&apos;un document et/ou à un service particulier sur celui-ci (type de dissémination particulier d&apos;un document, version n°1 du document…). 
  • Protocole Règles régissant les échanges d’information dans les télécommunications. On distingue les protocoles de correction d’erreurs, de compression, de transfert, de transmission et de communication, [etc.] Spécification d&apos;un dialogue entre plusieurs ordinateurs qui s&apos;échangent des données Les protocoles donnent les moyens techniques permettant à plusieurs applications de dialoguer entre elles Ex. Protocole de transfert (HTTP) Protocole de transmission et de communication : TCP/IP
  • Conçu lors de la convention de Santa Fé, 1999. Version actuelle date de 2002. Rendre interrogeables des bases de données hétérogènes Collecter massivement les métadonnées et les stocker
  • Les fournisseurs de données, qui déposent leurs métadonnées sur un serveur Web appelé « entrepôt ». Les fournisseurs de service (moissonneurs) qui collectent ces données pour les intégrer à leur index et permettent à l&apos;utilisateur final de faire des recherches.
  • Il est possible de créer des ensembles par thèmes , ou bien par types de documents (livres, photographies, documents d&apos;archives, périodiques etc.), ou encore par fonds ou collections .
  • = 6 verbes ! Le protocole OAI-PMH définit 6 types de requêtes HTTP auxquelles est associé un flux XML de réponses.
  • Dublin Core OBLIGATOIRE dans les entrepôts OAI
  • Créé en 1995 à Dublin, Ohio par OCLC et NCSA (National Center for Supercomputing Applications) Norme ISO 15836:2003, révisée en 2009 Maintenue par la Dublin Core Metadata Initiative Schéma de métadonnées généraliste, définit un noyau minimal de métadonnées Un format utile pour franchir les frontières entre spécialités, … mais qui n’est pas sans problème Faiblesse descriptive Besoin de normalisation et de bonnes pratiques Granularité et hiérarchie Dublin Core simple, mais aussi Dublin Core qualifié : 18 éléments + des qualificatifs, définition de profils pour des communautés particulières
  • suffisamment simples pour que des non-spécialistes puissent les créer à n’importe quel point du cycle de vie de la ressource mais suffisamment structurées pour qu’elles puissent rendre les moteurs de recherche plus performants
  • Quel format pour quelle interopérabilité ?
  • Conversion d’un format fortement hiérarchisé à un format à plat comment ne pas perdre les informations de contexte ? la gestion de l’héritage en EAD ?
  • Hiérarchie des éléments
  • Granularité : le niveau de pertinence pour réaliser l’extraction est donc le niveau de &lt;c/&gt; où est signalée la ressource numérique (élément &lt;c&gt; à l’intérieur duquel se trouve la balise &lt;dao&gt; avec l’attribut href pointant vers une URL contenant un identifiant ARK)
  • Comment constituer le contenu des éléments DC Ne pas chercher forcément à faire entrer l’ensemble des données sources de force dans le format d’arrivée !
  • Le respect des normes est le gage de l’interopérabilité La qualité des métadonnées est essentielle Sinon : des pratiques hétérogènes d’un fournisseur de données à l’autre qui nuisent à l’interopérabilité et rendent plus difficile l’élaboration de services
  • Ex de recherche : napoleon Atouts : Recherche fédérée Fonctionnalités de recherche Exposition des données
  • (un outil de conversion en « EAD européen »)
  • Interopérabilité et échanges de données pour les archives

    1. 1. AAF - Archives et Internet : les nouveaux enjeux INTEROPERABILITÉ ET ÉCHANGES DE DONNÉESCC BY-NC-SA Vicky&Chuck Rogers, Flickr Pauline Moirez – BnF – 26 juin 2012
    2. 2. CC BY-NC-ND J Mark Dodds, FlickrMais qu’est-ce que c’est que ces gros mots…?!?
    3. 3. L’interopérabilité, pour vous… ? CC BY-ND Helga Weber, Flickr
    4. 4. INTEROPERABILITE = Permettre léchange de données entre systèmes dinformation CC BY-NC-ND Josh Fassbind, FlickrPouvoir se parler Se comprendre (transport des (sens des données données) échangées)
    5. 5. La recette de l’interopérabilité de Grand-Maman CC BY-NC-SA Joana Hard, Flickr
    6. 6. Des ingrédients de qualitéDes données hétérogènes… mais propres CC BY-NC-SA Joana Hard, Flickr
    7. 7. Des protocoles de pro Du matériel d’échange normalisés CC BY-NC Captain Blaubeere, Flickr
    8. 8. De bonnes proportions Un langage commun CC BY-NC-SA paloetic, Flickr
    9. 9. ECHANGER, POURQUOI ?CC BY Robert Couse-Baker, Flickr
    10. 10. Améliorer la visibilité et la disséminationdes collections CC BY-ND Jeremy Salmon, Flickr
    11. 11. Organiser l’accès àl’information pour les usagers CC BY-NC-ND Alain Bachellier, Flickr
    12. 12. Dupliquer ?CC BY-SA e3000, Flickr
    13. 13. Le contexte administratif et technique : le référentiel général d’interopérabilité (RGI)Publié par la DGME en 2009 « détermine notamment lesrépertoires de données, les normes etles standards qui doivent être utilisés par les autorités administratives »
    14. 14. Les niveaux d’interopérabilité du RGIEx. modélisation, ontologies, mais aussi SEDAEx. formats d’images, de documents multimédia, formats bureautiques, langage XMLEx. protocoles et langages Web et messagerie, téléphonie, annuaires LDAP
    15. 15. Pour parler la même langue : normaliser ! ThesaurusEAD W Normes et standards Référentiels archivistiques Rameau EAC Dublin Langues Core ISO 639 Formats de Schémas métadonnées d’encodage Pays METS ISO 3166
    16. 16. Où es-tu ?Des identifiants pour les ressources numériques Uniques Pérennes CC BY-NC-ND xcode, Flickr Citables
    17. 17. ARK : un formatd’identificationpérenne CC BY-NC-ND Friday Flets, Flickr
    18. 18. http://archives.somme.fr/ark:/58483/a011260969022JKSv1y/1/1 ARK aux AD de la Somme
    19. 19. Le système ARK : structure et organisationhttp://gallica.bnf.fr/ark:/12148/bpt6k5809503p/f2.image typeprotocole d’identifiant nom ARK autorité qualifieurs numéro (facultatif) d’adressage d’autorité (NMAH) nommante (NAAN) Et dans la vraie vie…
    20. 20. OAI-PMHUn protocole d’échange incontournable dans le domaine culturel CC BY-NC dr coop, Flickr
    21. 21. CC BY-NC-ND Marylise Doctrinal, Flickr OAI-PMH =Open Archives Initiative - Protocol for Metadata Harvesting
    22. 22. Principes de fonctionnement du protocole OAI-PMH © Ministère de la Culture, 2005
    23. 23. Le fournisseur Le fournisseur de données de services (entrepôt) (moissonneur) CC BY-NC-ND Gerry Balding, FlickrLes acteurs de l’OAI-PMH
    24. 24. The place to be ?L’OAI-PMH en 2012, c’est : CC BY-NC-ND vallygirl_tka, Flickr1740 entrepôts enregistrésPlus de 25 millionsd’enregistrements moissonnables
    25. 25. Les concepts documentaires de l’OAI-PMH RESSOURCEObjet physique ou ITEM numérique Notice informatique (URL + métadonnées)ENREGISTREMENT Unité documentaire LOT / SETdans un entrepôt OAI Ensemble d’enregistrements
    26. 26. Exemple denotice OAI
    27. 27. Qu’y a-t-il dans unenregistrement OAI-PMH ? •Un en-tête : header- identifier (obligatoire, non répétable)- datestamp (obligatoire, non répétable)- setSpec (facultatif, répétable)- attribut de statut pour les itemssupprimés
    28. 28. Qu’y a-t-il dans unenregistrement OAI-PMH ? •Des métadonnées : metadata- métadonnées encodées en XML avec leurélément racine et leur espace de nom- les entrepôts doivent fournir leursmétadonnées en Dublin Core simple ; ilspeuvent proposer en plus d’autres formats
    29. 29. CC BY-NC-ND Wondermonkey2k, Flickr Parlez-vous OAI-PMH ?OAI-PMH a le vocabulaire d’un bébé de 18 mois !
    30. 30. La syntaxe de moissonnage : les 6 verbesIdentify : identifier l’entrepôtListMetadataFormats : lister les formatsutilisés (Dubin Core, EAD, etc.)ListSets : lister les ensembles d’enregistrementsListRecords : lister les ressources décritesListIdentifiers : lister les références desressourcesGetRecord : récupérer une ressource particulière
    31. 31. CC BY-NC-SA Musebrarian, Flickr
    32. 32. OAI-PMH at o uts L esIl sappuie sur les standards du Web, lemoissonnage est simple à mettre enœuvre.Les contenus ne sont pas dupliqués.Les métadonnées collectées sont misesà jour simplement etautomatiquement (moissonnagedifférentiel/incrémental).Il s’adapte à des besoinstransdisciplinaires sans interdire desbesoins plus spécialisés.
    33. 33. OAI-PMH i mi tes Le slProblèmes de granularité et dehiérarchisationPas d’interrogation finePas de liens simples avec les ressourcesextérieuresLimité à la communauté des chercheurset bibliothécaires
    34. 34. AV OUS DE JOUER…! (n° 1-5)
    35. 35. Dublin Core À protocole d’échange générique… format de métadonnées générique ! CC BY-NC-ND s.red, Flickr
    36. 36. 15 éléments de description, facultatifs et répétables CC BY-NC-SA David Sherret, Flickr
    37. 37. CC BY-NC-SA David Sky, source Améliorer la recherche de ressourcessur le web, en définissant un ensemble de métadonnées communes
    38. 38. Les 15 éléments du Dublin Core simple Contenu Propriété Instanciation intellectuelleTitle Creator DateSubject Contributor TypeDescription Publisher FormatSource Rights IdentifierLanguageRelation Tous fa cultatifs s pétable Tous réCoverage
    39. 39. Mais comment je fais du DublinCore avec mes données à moi ? CC BY-SA tangi_bertin, Flickr
    40. 40. La problématique des conversions CC BY-ND tomaB, Flickr
    41. 41. Une notice dans Cartolis http://www.cartolis.org/detail_notice.php?num=AA00000001&x=11&y=13
    42. 42. La même en Dublin Core…http://www.cartolis.org/oai/oai2.php?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:cartolis.org:AA00000001
    43. 43. Et avec l’EAD ? COMPLEXITÉ HIERARCHIE GRANULARITÉ CC BY-NC-ND Rickydavid, Flickr
    44. 44. Un fonds d’archives en EAD : les papiers Pierre et Marie Curie
    45. 45. Du fichier XML-EAD trèsstructuré et hiérarchisé…
    46. 46. … à l’enregistrement en Dublin Core
    47. 47. … et c’est pas fini… A partir d’informationscontenues dans <archdesc>
    48. 48. Tableau de conversion EAD > Dublin Core
    49. 49. Dublin Core at o uts L esGénéricité : permet de décrire des ressources numériques ou physiques, utilisable par de nombreuses communautésSimplicitéGrande souplesseUtilisation internationale
    50. 50. Dublin Core i mi tes Le slSimplification des métadonnéesLibertés d’interprétation qui limitentl’interopérabilité sémantiqueValeurs des éléments non normalisées Faiblesse des informations techniques
    51. 51. CC BY-ND cursething, Flickr OAI-PMH est simpleDublin Core est simple Ce n’est pas une raison pour faire n’importe quoi !
    52. 52. AV OUS DE JOUER…! (n°6)
    53. 53. CC BY-NC pcgn7, Flickr… et donc, finalement,à quoi ça sert…? … à participer à des portails collectifs !
    54. 54. Europeana, mère de tous les portails…
    55. 55. La nébuleuse des projets liés à Europeana
    56. 56. Des portails par type d’institutionLe Portail archivistique européen
    57. 57. Des portails nationauxLe « guichet unique » français : le moteur Collections
    58. 58. Une dynamique est lancée... Les portails culturels locaux se multiplient GeoCulture enBanque numérique des savoirs aquitains (BnsA) Limousin Manioc, bibliothèque numérique des Caraïbes
    59. 59. Mais aussi...Isidore, plateforme de recherche pour les sciences humaines et sociales (SHS) Gallica et ses 41 bibliothèques partenaires
    60. 60. AV OUS DE JOUER…! (n°7)
    61. 61. Pour aller plus loin…InteropérabilitéInteropérabilité : faire des choix, échanger, gérer le temps (S. Pouyllau, 2010)Voir EAD et interopérabilité :comment permettre le moissonnage demétadonnées normalisées par des portails (L. Grand, F. Rolland, 2010)Identifiants pérennesIdentifiants pérennes (E. Bermès, 2009)Des identifiants pérennes pour les ressources numériques - L’expérience de la BnF (E. Bermès, 2006)ARK, qu’est-ce que c’est ? (2012).OAI-PMHSite officiel de l’Open archive initiativeLe protocole OAI et ses usages en bibliothèque (MCC, 2005)Guide dinteropérabilité OAI-PMH pour un référencement des documentsnumériques dans Gallica (2010)Le Guide des Bonnes Pratiques Numériques - Entrepôt OAI-PMH (TGE Adonis,2010)Dublin CoreSite officiel de la Dublin Core Metadata initiative
    62. 62. Merci de votre attention pauline.moirez@bnf.frCC BY-NC Go Esewhere, flickr

    ×