Outil de recherche fédérée

des offices du Service de la culture


    Forum valaisan des chercheurs – 20.01.2012
1.

L’accès aux collections patrimoniales
1. L’accès aux collections patrimoniales




                                      3
1. L’accès aux collections patrimoniales




                                      4
1. L’accès aux collections patrimoniales




                                      5
2.

        Le projet pilote

de moteur de recherche fédérée
Premiers pas…
    Point de départ
•    réalisation de la plate-forme de pérennisation et d’archivage des collections
     numériques et numérisées du Service de la culture
      •   premiers versements d’archives électroniques effectués en mai 2011

      •   volume des données au 31 décembre 2011 = 5.5 TB
            • 147 226 photographies
            • 1934 archives sonores
            • 429 films




                                                                               7
Premiers pas…
    Objectifs
•    mettre en œuvre le processus d’accès aux collections numériques et
     numérisées du Service de la culture (Archives de l’Etat du Valais,
     Médiathèque Valais et Musées cantonaux)

•    organiser et réaliser un projet pilote de recherche fédérée et de consultation
     pour les collections numériques et numérisées du Service de la culture

    Constitution d’un groupe de travail composé de
•    représentants des Archives de l’Etat du Valais, de la Médiathèque Valais et
     des Musées cantonaux

•    représentants du Service cantonal de l’informatique

•    consultant = Antidot SAS
                                                                               8
    Mandat du 28 mars 2011
Les difficultés d’un tel projet…
    Choix du corpus
•    Archives de l’Etat du Valais
      •   88 793 unités documentaires (scopeQuery)
      •   provenance = anciens fonds de l’Etat du Valais, fonds de communes municipales et
          bourgeoisiales et fonds privés

•    Médiathèque Valais
      •   13 438 unités documentaires
      •   provenance = collections audiovisuelles du site de Martigny (10 298 unités
          documentaires) et collections numérisées du site de Sion (3 140 unités
          documentaires)

•    Musées cantonaux
      •   24 915 unités documentaires
      •   provenance = Musée d’histoire

                                                                                       9
Les difficultés d’un tel projet…
    Description des unités documentaires
•    chaque métier a ses propres normes de description

•    nécessité de définir, le cas échéant, les correspondances entre les différents
     éléments des schémas de métadonnées utilisés

    Livraison des unités documentaires
•    Archives de l’Etat du Valais = EAD

•    Médiathèque Valais = Dublin Core

•    Musées cantonaux = extraction XML brute

     => transformation en un format XML pivot
                                                                             10
Les difficultés d’un tel projet…
    Indexation
•    objectif = obtenir une indexation suffisamment fine pour éviter les silences et
     les bruits

•    définir des index généraux « utiles » pour toutes les institutions et des index
     spécifiques à chaque institution

•    tenir compte des différents niveaux et qualités de l’indexation
      •   Archives de l’Etat du Valais = aucune indexation des unités de description

      •   Médiathèque Valais = utilisation de différents index (vocabulaire RERO,
          bibliographie valaisanne, CDU)

      •   Musées cantonaux = index spécifiques à chaque Musée

                                                                                       11
Les difficultés d’un tel projet…
    Indexation
•    index généraux
      •   provenance

      •   lieux

      •   périodes

      •   personnes


•    index « matières »
      •   tests avec différents index (GEMET Thesaurus, Thésaurus SIAF, bibvs)



                                                                                 12
Le moteur de recherche fédérée…




projet pilote a démontré la possibilité de mettre en œuvre un moteur de
            recherche fédérée au sein du Service de la culture    13
Les suites du projet
    Consolidation des résultats de la phase pilote
•    travail important à entreprendre en matière d’indexation (indexation
     « matières »)

    Réalisation de l’interopérabilité du moteur de recherche fédérée, de
    manière à pouvoir l’inscrire dans le réseau mondial d’échange des
    données
•    réalisation d’un entrepôt OAI-PMH (cf. Europeana)

•    exposition des données (web des données)




                                                                            14
Les suites du projet
    Interface de consultation du moteur de recherche fédérée
•    interface de recherche des informations dans la corpus

•    contenu éditorial

•    prise en compte de l’interactivité (web 2.0)

•    prise en compte des différents supports




                                                               15
Coordonnées

Alain Dubois
Archiviste paléographe
Rue des Vergers 7
1950 Sion

027 606 46 17
alain.dubois@admin.vs.ch




                                16

Alain Dubois

  • 1.
    Outil de recherchefédérée des offices du Service de la culture Forum valaisan des chercheurs – 20.01.2012
  • 2.
  • 3.
    1. L’accès auxcollections patrimoniales 3
  • 4.
    1. L’accès auxcollections patrimoniales 4
  • 5.
    1. L’accès auxcollections patrimoniales 5
  • 6.
    2. Le projet pilote de moteur de recherche fédérée
  • 7.
    Premiers pas… Point de départ • réalisation de la plate-forme de pérennisation et d’archivage des collections numériques et numérisées du Service de la culture • premiers versements d’archives électroniques effectués en mai 2011 • volume des données au 31 décembre 2011 = 5.5 TB • 147 226 photographies • 1934 archives sonores • 429 films 7
  • 8.
    Premiers pas… Objectifs • mettre en œuvre le processus d’accès aux collections numériques et numérisées du Service de la culture (Archives de l’Etat du Valais, Médiathèque Valais et Musées cantonaux) • organiser et réaliser un projet pilote de recherche fédérée et de consultation pour les collections numériques et numérisées du Service de la culture Constitution d’un groupe de travail composé de • représentants des Archives de l’Etat du Valais, de la Médiathèque Valais et des Musées cantonaux • représentants du Service cantonal de l’informatique • consultant = Antidot SAS 8 Mandat du 28 mars 2011
  • 9.
    Les difficultés d’untel projet… Choix du corpus • Archives de l’Etat du Valais • 88 793 unités documentaires (scopeQuery) • provenance = anciens fonds de l’Etat du Valais, fonds de communes municipales et bourgeoisiales et fonds privés • Médiathèque Valais • 13 438 unités documentaires • provenance = collections audiovisuelles du site de Martigny (10 298 unités documentaires) et collections numérisées du site de Sion (3 140 unités documentaires) • Musées cantonaux • 24 915 unités documentaires • provenance = Musée d’histoire 9
  • 10.
    Les difficultés d’untel projet… Description des unités documentaires • chaque métier a ses propres normes de description • nécessité de définir, le cas échéant, les correspondances entre les différents éléments des schémas de métadonnées utilisés Livraison des unités documentaires • Archives de l’Etat du Valais = EAD • Médiathèque Valais = Dublin Core • Musées cantonaux = extraction XML brute => transformation en un format XML pivot 10
  • 11.
    Les difficultés d’untel projet… Indexation • objectif = obtenir une indexation suffisamment fine pour éviter les silences et les bruits • définir des index généraux « utiles » pour toutes les institutions et des index spécifiques à chaque institution • tenir compte des différents niveaux et qualités de l’indexation • Archives de l’Etat du Valais = aucune indexation des unités de description • Médiathèque Valais = utilisation de différents index (vocabulaire RERO, bibliographie valaisanne, CDU) • Musées cantonaux = index spécifiques à chaque Musée 11
  • 12.
    Les difficultés d’untel projet… Indexation • index généraux • provenance • lieux • périodes • personnes • index « matières » • tests avec différents index (GEMET Thesaurus, Thésaurus SIAF, bibvs) 12
  • 13.
    Le moteur derecherche fédérée… projet pilote a démontré la possibilité de mettre en œuvre un moteur de recherche fédérée au sein du Service de la culture 13
  • 14.
    Les suites duprojet Consolidation des résultats de la phase pilote • travail important à entreprendre en matière d’indexation (indexation « matières ») Réalisation de l’interopérabilité du moteur de recherche fédérée, de manière à pouvoir l’inscrire dans le réseau mondial d’échange des données • réalisation d’un entrepôt OAI-PMH (cf. Europeana) • exposition des données (web des données) 14
  • 15.
    Les suites duprojet Interface de consultation du moteur de recherche fédérée • interface de recherche des informations dans la corpus • contenu éditorial • prise en compte de l’interactivité (web 2.0) • prise en compte des différents supports 15
  • 16.
    Coordonnées Alain Dubois Archiviste paléographe Ruedes Vergers 7 1950 Sion 027 606 46 17 alain.dubois@admin.vs.ch 16