Presentation PIN 2011

Les métadonnées de pérennisation et l’accès aux objetsFormation PIN18-21 octobre 2011Pérennisation et communication de l'information numériquePascal RomainIngénieur documentaireConseil général de la Gironde

Sommaire• Introduction sur les métadonnées définition, aspect théorique, processus de production• Le modèle d’information de l’OAIS: place des métadonnées dans le modèle • Quelles métadonnées pour la pérennisation ?• Encoder et lier les métadonnées• L’accès à l’information grâce aux métadonnées

Introduction sur les métadonnées : définitionUne métadonnée est une donnée servant à définir ou décrire une autre donnée.Porteuse d'information sur le contexte, le sens et la description de la ressource informationnelle portée par la donnée brute.μετά:préfixe grec indiquant l'auto-référence

Introduction sur les métadonnées : théorieLes métadonnées servent à définir et conserver l’intégrité, l’interprétation et l’interopérabilité des données.Elles transforment la donnée brute en donnée intelligibletitrecontexte temporel+=indexation lieuproducteurindexation sujetcontexte spatial

Introduction sur les métadonnées : théorieDans le contexte numérique, des dispositifs de médiation sont nécessaires à l’appréhension de la donnée.Plusieurs communautés d’utilisateurs impliquent différents types de métadonnéesUne métadonnée doit avoir une finalité et une utilité immédiateDes dispositifs d’encodage, de lecture et de transmission conditionnent notre accès aux donnéesAttention : l’abus de métadonnées est dangereux pour la santéDes dispositifs de stockage, de sécurisationet de surveillance sont nécessaires à la conservation des données

Introduction sur les métadonnées: typologieOn distingue généralement 4 grands types de métadonnées :métadonnées techniques: décrivent les outils utilisés pour créer la donnée ainsi que le processus de création lui-même. essentielles à l'intelligibilité de la donnée dans un contexte d'intermédiation numérique ainsi qu'à la qualité de la donnée dans une perspective de conservation sur le long terme.elles doivent suivre le cycle de vie de la donnée et permettre de garantir son intégritémétadonnées administrativesutilisées pour définir les contrôles d'accès à la donnéedécrivent les évènements et les agents qui interviennent sur la donnée ainsi que les conditions d'utilisationpermettent de gérer la donnée et les liens qui peuvent exister entre ses éventuelles différentes représentationsmétadonnées descriptivesutilisées pour préciser le contenu informatif de la donnéestructurent les informations dont la donnée est porteuse en la reliant à des concepts ou à d'autres donnéespermettent d'expliciter, de décrire, de contextualiser ou de hiérarchiser l'informationmétadonnées de structureenveloppes qui permettent de relier plusieurs types de métadonnéepermettent de disposer d'un cadre de description commun favorisant l'interopérabilité de l'information

Introduction sur les métadonnées: productionLa production de métadonnées peut s'envisager à différentes étapes du cycle de vie du document porteur d'information :saisie à la créationsaisies au cours d'une étape de traitement de l'informationextraction à posteriori : transformation, diffusion, récupération

Introduction sur les métadonnées: productionlors de la création de la donnée des champs permettent d'expliciter des informations de contexte, de provenance ou d'accès dans l'en-tête ou dans un fichier séparépar exemple champs IPTC dans les images ou métadonnées dans les en-têtes des documents bureautiquessaisie à la création:saisie à posteriori:extraction automatisée:-> la saisie à la création est l'opération la moins coûteuse et celle qui assure la meilleure qualité.à partir de la consultation des données, une description structurée de l'information est possiblepar exemple une notice documentaire, une fiche technique, des conditions d’accès->compétences scientifiques coûteuses ; voire impossibilité de compléter l'information il est possible de caractériser des éléments d'information automatiquementpar exemple par la mise en relation du contenu informationnel avec des référentiels de données ou des processus d’OCR-> l'extraction automatique est coûteuse pour parvenir à une qualité documentaire satisfaisante

Sommaire• Introduction sur les métadonnées définition, aspect théorique, processus de production• Le modèle d’information de l’OAIS: place des métadonnées dans le modèle • Quelles métadonnées pour la pérennisation ?• encoder et lier les métadonnées• L’accès à l’information grâce aux métadonnées

Modèle conceptuel organisé autour de 6 entités gérant les échanges d’informations au sein du système d’informationSystème d’information ouvert d’archivageOAIS

Le modèle d’information de l’OAIS: les paquets d’informationDans le contexte de la pérennisation, les informations peuvent prendre 3 formes successives ou simultanées:

le paquet d’information à soumettre : SIP (Submission Information Package)

le paquet d’information à archiver: AIP (Archival Information Package). Il peut exister sous 2 formes au sein de l’archive OAIS

Le paquet d’information à diffuser : DIP (Diffusion Information Package)

Les entités administration et planification sont chargés de gérer ces états en fonction des besoinsLe modèle d’information de l’OAIS: les paquets d’informationPaquetInformationObjet

Le modèle d’information de l’OAIS: les paquets d’information: l’informationl’Objet Information est composé d’un objet données(physique ou numérique) et de l’information dereprésentation qui permet d’interpréter les donnéessous la forme d’une information compréhensible.

Le modèle d’information de l’OAIS: les paquets d’information: la représentationInformation de structure

types de données courants en informatique, comme des caractères, des nombres, des pixels, des tableaux

informations complémentaires associées aux éléments de structure, telles que la langue dans laquelle l’objet est exprimé, les opérations réalisables sur chaque type de données et leurs corrélations, etc.

Identifiants d’autres standards comme la référence à la norme ASCIIbasé sur le principe de la récursivité

Le modèle d’information de l’OAIS: les paquets d’information: la pérennisationInformation de provenanceDécrit l’origine du contenu d’information, qui en a la charge, et quel est l’historique de ses modifications

Information de contexteDécrit comment le contenu d’information s’articule avec d’autres informations à l’extérieur du paquet

Information d’identificationFournit un ou plusieurs identifiants ou systèmes d’identification

Information d’intégritéProtège le contenu d’information contre les altérations non documentéesLe modèle d’information de l’OAIS: les relationsUne information est toujours produite dans un contexte. Elle résulte de l’action d’un ou plusieurs agents. Son cycle de vie est une suite d’événements qui opèrent sur des objets entre lesquels il existent souvent des relations

Le modèle d’information de l’OAIS: le contexte du versementLe versement d’un document ou d’une archive dans une perspective de pérennisation implique la description de plusieurs éléments de contexte (l’environnement technique, la description du producteur, la description du contenu, les droits d’accès).Il mets en relation un agent versant et un agent recevant autour d’un versement comprenant des objets en relation

Le modèle d’information de l’OAIS: le contexte de la gestion (ou archivage)La gestion et le stockage impliquent la description d’évènements (l’analyse, l’enrichissement, le stockage, la migration) dont la responsabilité incombe à l’entité OAIS.Ces processus sont complexes et nécessitent la description des objets à conserver et à diffuser

Le modèle d’information de l’OAIS: le contexte d’administrationL’administration dans le temps de l’archive nécessite le suivi et la modification des événements qui affectent l’information.Une veille technologique est nécessaire pour garantir l’accès des agents habilités au cours du cycle de vie des objets informationnels

Le modèle d’information de l’OAIS: le contexte de l’accèsL’accès aux informations nécessite l’enrichissement et la mise en relation des objets avec d’autres sources d’explicitation Les communautés d’agents expriment des besoins qui doivent être pris en compte sans compromettre l’intégrité de l’entité OAIS

Le modèle d’information de l’OAIS: la structuration des méta-donnéesL’entité OAIS utilise les métadonnées pour normaliser et structurer les échanges d’informations avec les acteurs externes et internes

L’objectif est de conserver la richesse de l’information et sa traçabilitéSommaire• Introduction sur les métadonnées définition, aspect théorique, processus de production• Le modèle d’information de l’OAIS: place des métadonnées dans le modèle • Quelles métadonnées pour la pérennisation ?• encoder et lier les métadonnées• L’accès à l’information grâce aux métadonnées

Quelle métadonnées pour la pérennisation ?Les informations techniquesLa production et la conservation de métadonnées techniques répondent à une triple finalitéqui correspond aux étapesinhérentes au cycle de vie documentaire qualité intelligibilitéintégritéproduction conservation diffusion

Quelle métadonnées pour la pérennisation ?Les informations administrativesLa gestion et le stockagede métadonnées techniques répondent à une logique de structuration des entités qui interagissent entre dans les différents contextesinhérentes au cycle de vie documentaire agents événements objetscréation conservation diffusion

Quelle métadonnées pour la pérennisation ?Les informations descriptivesLa description et la structuration des métadonnées descriptives répondent à une logique de recherche et d’accès en fonction de la communauté d’utilisateurset des impératifs de citabilité et d’interopérabilitéacteurs contexte objetsidentité référentiel granularité

Quelle métadonnées pour la pérennisation ?Les informations de structureLes métadonnées de structure sont des enveloppes qui relientet permettent de disposer d'un cadre de description communfavorisant l'interopérabilité de l'information et la structuration de l'informationobjets événements agentsidentité représentation pérennité

Quelle métadonnées pour la pérennisation ?METS: la structuration de la description des ressourcesLe schéma METS vise à fournir un méta-modèle pour l'encapsulation d'autres formats de métadonnées. Ce schéma XML composé de 7 sections est extrêmement flexible. Il permet notamment de représenter l'information sous forme de carte de structure et s'implémenter le modèle conceptuel OAIS. Il constitue un format pivot entre la logique de diffusion et celle de conservation de l'information.

Quelle métadonnées pour la pérennisation ?METS: la structuration de la description des ressourcesL’utilisation de METS passe par la mise en forme d’un profil d’utilisationCelui-ci permet de définir les règles de description et de permettre une automatisation des processus de validation et de contrôle.Il permet de multiplier les formats de description et les modes de consultation des objets à conserver ou à diffuser.Il utilise un système de pointeur basé sur l’identification de toutes les unités de description

Quelle métadonnées pour la pérennisation ?3 normes pour la structuration des objets d’informationPREMIS (PreservationMetadata: ImplementationStrategies) : le modèle de données de PREMIS est composé de 5 entités reliées entre elles par des identifiants: Entité intellectuelle, Objet, Evénement, Agent, et Droits. Ce schéma répond notamment au besoin de pérennisation de l'information numérique et de conservation du cycle de vie des données (import dans un entrepôt de donnée, migration, gestion d'intégrité, liens entre différentes représentations d'un même document). [http://www.loc.gov/standards/premis]LIDO (Lightweight Information DescribingObjects) : cette norme vise à décrire les objets patrimoniaux en référence au modèle conceptuel international CIDOC-CRM((ISO 21127). Il permet de décrire l'objet en terme de contenu mais également de cycle de vie et est fortement orienté vers l'interopérabilité et la mise en réseau. [http://www.lido-schema.org]FRBR (FunctionnalRequirements for Bibliographic Records) et FRAD (FunctionalRequirements for Authority Data) sont des normes qui organisent les différentes composantes de la description bibliographique. Ils organisent les différentes composantes de la description bibliographique.et fournissent un modèle conceptuel permettant l'amélioration des notices de catalogue (un produit), l'action de cataloguer (un processus) et la conception des catalogues (une technologie)

Quelle métadonnées pour la pérennisation ?PREMIS : les métadonnées du cycle de vieles schémas OBJET, EVENT et AGENT les plus usités sont reliés par un mécanisme d'identifiant.

des listes d'autorités peuvent être utilisées en vue d'optimiser les opérations de gestion, de contrôle ou de transformation (eventType, agentType, format, objectCategory, storageMedium, copyrightStatus, and RightsBasis).

PREMIS est couramment utilisé en lien avec METS:

premis:objectdanstechMDdansdigiProvMD

premis:agentdansdigiProvMDourightsMD

Des choixd’implémentationss’imposent en lien avec l’utilisation de METS (redondance de données, mécanismed’identification, répartition des informations)Quelle métadonnées pour la pérennisation ?PREMIS : les métadonnées du cycle de vie

Quelle métadonnées pour la pérennisation ?LIDO: un cadre conceptuel et techniquebasé sur le modèle conceptuel CIDOC-CRM (ISO 21127:2006) : conseil international des musées-modèle conceptuel de référenceconstitue une « ontologie » de l'information relative au patrimoine culturella présentation en est basée sur l'approche « orientée objet »la création, la collection ou l'utilisation d'un objet sont définies comme des événements qui ont des entités associées comme des dates, des lieux ou des acteurs.

Quelle métadonnées pour la pérennisation ?FRBR: le modèle conceptuel de référenceUn modèle ternaire :

une entité est un être, ou une « chose doté d'une existence distincte »

un attribut est une qualité, quelque chose qui décrit cette entité

Presentation PIN 2011

Contenu connexe

En vedette

Similaire à Presentation PIN 2011

Presentation PIN 2011