4. Préparer l’Atelier Fabriqué avec http://wordle
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
5. Autres ?
Notez des noms de normes, recommandations ou
modèles que vous connaissez ou sur lesquels
vous souhaiteriez des informations
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
6. 2.
2. NORMALISATION
Contexte
Enjeux
Acteurs en présence
7. 2.1
Contexte
• L’information
– fait partie intégrante de toute activité humaine
[F.Moreau] - La méta-information permet de localiser un bien
informationnel et de décider de l’intérêt de le consommer
« La méta-information est ainsi indéniablement au cœur du
processus de création de valeur à l’heure du numérique ».
• Les TIC
– sont des technologies qui agissent sur l’information
– elles sont structurantes et modèlent les dispositifs
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
8. 2.2
Enjeux
• Standardisation - normalisation
– Des formats des données numériques
Des méta-informations
– Des systèmes d’encodage ?
• Plusieurs strates complémentaires
Codage de base Unicode
Technique Technologies du Web
Structure Identifiants, schémas de ressources, méta-
informations
Encodage des contenus Nomenclatures, terminologies
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
9. 2.3
Acteurs en présence (1)
• Histoires, fonctionnements et périmètres variables
• Coordination : une nécessité
• ISO TC46 avec ISO TC37
• L’ISO et l’IEEE (concepteur entre autres du LOM) en 2008
• ISO TC46 (Information et Documentation) et l’IETF en 2008
• Organes-clés pour l’infodoc
• ISO TC46 - piloté actuellement par la France (C.Dhérent / Bnf)
– Un rôle essentiel, des moyens faibles au regard du travail réalisé et
à réaliser
– Activité des groupes - les professionnels terrain sont absents !
• NISO - National Information Standards Organization
• Library of Congress : http://www.loc.gov/standards/
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
10. 2.3
Acteurs en présence (2)
• ISO et organes locaux
• Comités centrés sur l’information et les TIC : JTC1 (TIC,
ISO/CEI), TC37 (Terminologie), TC46 (Infodoc)
• Internet et le Web
• IETF - « groupe informel et auto-organisé » qui développe les
spécifications des standards de l'Internet : les RFC
• ICANN - organes normalisateurs du Web
– IANA = bureau central d'enregistrement des activités IETF
• Autres organismes par métiers ou domaines
• OASIS - consortium mondial, autour d’XML - DocBook, UDDI,…
• IEEE - à l’origine du LOM ; ADL - standards du e-learning
• IPTC, IFLA (bibliothèque), SMTPE (cinéma et télévision), …
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
12. 3.1
Un modèle conceptuel métier : FRBR
Functional Requirements for Bibliographic Records, IFLA, initié en 1997
Entités du Groupe 2 - FRANAR « identifiants »
Entités du Groupe 3 - FRSAR « sujets »
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
13. 3.2
Succession d’outils : FRBR et ….
« Or, pour gérer des données, ces gens-là (les geeks)
travaillent de la manière suivante : ils font de la
modélisation, puis des spécifications, et enfin ils
implémentent. Nous, pauvres bibliothécaires et
catalogueurs, le nez dans le guidon trop souvent, nous
avons commencé par créer un format d'implémentation
(MARC), s'appuyant quand même sur une norme (l'ISBD).
Mais mieux vaut tard que jamais, nous avons fini par faire la
modélisation et les spécifications de nos données
bibliographiques : ce sont les FRBR. » Figoblog, 10/03/05
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
14. 3.2
Succession d’outils : … RDA, MODS et ONIX
• Schémas et outils techniques en cours de révision !
– Outils métiers
• RDA / description bibliographique
• FRAD / autorités
– Outils informatiques
• MODS / remplacement de MARC en XML
• Compatible avec le format de livre ONIX
(ONline Information eXchange)
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
15. 3.3
Notation particulière : CRM (1)
Conceptual Reference Model (Museum!), ISO 2127:2006
• Au cœur du modèle
– Des évènements et des phénomènes temporels
– La modélisation de l’activité versus la description d’objets
Actions ( Activity )
La Seconde Guerre mondiale, la bataille de Stalingrad,
le tremblement de terre de Lisbonne, la naissance de
Cléopâtre, la fête donnée pour mon anniversaire le 28
juin 1995, la conférence de Yalta, une tuile est tombée
de mon toit, la conférence Inria de 2008, …
Début d’existence : naissance, création, formation, etc.
Fin d’existence : destruction, dissolution, mort, etc.
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
16. 3.3
Notation particulière : CRM (2)
• Des métadonnées libérées
• Des applications à construire sont requis pour et un
QuickTime™ visionner cette image.
décompresseur
« un élément physique fabriqué par l’homme »
(E24 - Physical man-made thing)
« A par héritage des propriétés de tout objet physique »
« une localisation ou une position » (P53 - has former location)
« Dans un lieu précis » (E53 - Place)
« un Lieu » (E53 - Place )
« est identifié par » (P87 - identified by)
« une appellation » (E4 - Appellation)
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
17. 3.4
Profil d’application : TEF
• Thèses électroniques françaises, recommandation
Afnor 2006
• Composition de la recommandation
– Un modèle pour le genre « thèse » s’appuyant sur les FRBR
• travail universitaire validé par des pairs, une œuvre de l’esprit, un
document administratif pour la délivrance d’un diplôme national
– Un format informatique de structuration et d’encodage XML
selon le vocabulaire Schematron. (binding)
– Un format informatique d’organisation des données selon le
vocabulaire METS
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
18. 3.5
Conteneur et transporteur : METS
• Metadata Encoding and Transmission Standard
– Maintenu par la LC
– Enveloppe pour transporter des ressources
– Une carte de la structure (Structural Map) de l’objet METS
– La liste des fichiers (File Section)
– Cinq autres sections, facultatives et répétables en fonction des
ressources intégrées : l’en-tête, les métadonnées descriptives et
administratives, les liens structurels entre les différents éléments de
la carte, ainsi que des exécutables.
• Autre conteneur : MXF (Material eXchange Format)
– Etabli par la SMPTE (Soc. Motion Picture & TV Engineers).
– Enveloppe unique : contenus (essences), métadonnées,
informations administratives sur la ressource globale
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
19. 3.6
Livres numériques
• Digital Accessible Information System, Z39.86:2005
DAISY Adopté par Braillenet en 2002 ;
• Structuration XML des livres audionumérique, DTBook
Métadonnées spécifiques : navigation dans la structure du
livre + synchronisation sonore
• Norme SMIL/XHTML du W3C
• acteurs variés (Adobe, Hachette, OCLC, universités…)
ePub de l’IDPF • 3 spécifications: structure (OPS), format (OPF), conteneur
format harmonisé ? (OCF)
• Vocabulaire établi à partir du DTBook (Daisy) et XHTML
• Depuis 1992, par OASIS - intégré aux outils bureautiques
• Noyau standardisé extensible; modèle et schéma XML
DocBook • Un vocabulaire intégrant la structure des documents et les
métadonnées (dont 3 éléments du DC)
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
20. 3.7
Schémas de concepts (1)
• Derrière des schémas, des modèles différents
– TMF (ISO 16642:2003) - Terminological Markup Framework
– SKOS/RDF du W3C, Juin 2008 - thésaurus et classification pour
la recherche
– NP25964 - projet de refonte des normes du thésaurus, pour
l’indexation (et la recherche)
• Composants
– Concepts et relations entre concepts ; termes reliés avec des
concepts et entre eux
– Entités - attributs - relation
3 modèles - 3 finalités différentes
Atelier - étudier la représentation UML d’un schéma
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
21. 3.8
Composants transversaux
• Représentation de haut niveau
– Modélisation qui convient dans de nombreux contextes (A)
– Développement de schémas normalisés, réutilisables (B)
• Utilisables dans d’autres schémas ou profils
• Exemples
– Jeu de métadonnées générique : Dublin Core
– Eléments de données ou groupe d’éléments de données
• Identifiants normalisés
• Langues, Pays,…
• Microformats : hCard (vCard), hCalendar,…
• Certaines balises imposées dans (X)Html : rel: «license »
• Schémas de concepts
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
22. 3.9
Familles de schémas : cohérence métier
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
23. 4.
4. EN CONCLUSION
Sur le plan technique
Sur le plan des métiers
Sur le plan de la normalisation
24. 4.1
Sur le plan technique
• Des formalismes variés
– Ne facilitant pas la prise en main de schémas ou modèles
• Qu’est-ce-qu’un schéma de représentation ?
– Une entité globale (le profil d’application LOM Fr)
– Ou un ensemble de composants (langue, DRM,…)
• Correspondance entre schémas
– Alignement conceptuel plutôt qu’alignement technique
– Utiliser Dublin Core comme un cadre général et non comme
une spécification technique
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
25. 4.1
Sur le plan des métiers
• Continuum de la conception à l’exploitation des
ressources
– Métadonnées à la source : « recyclage infini » des métadonnées
produites, et non (re)création
– Ne pas rester à la lisière du document
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
26. Annexe 1 - Outil : langage graphique UML
entités
relation
Draft Schema np25964 attributs
INRIA IST - Session Métadonnées et normalisation par 2008 -Dal
30 Sept Sylvie
Notes de l'éditeur
Voir aussi - Chapitre 7 - Méta-information et économie numérique François Moreau (Cnam, Laboratoire d’économétrie)
Voir aussi - Chapitre 7 - Méta-information et économie numérique François Moreau (Cnam, Laboratoire d’économétrie)
Monde du Web http://www.isoc-gfsi.org/ietf/tao.html#intro Nouvelles de l'ISO : accords ISO/IEEE et ISO/TC46/IETF ISO et l'IEEE (Institute of Electrical and Electronics Engineers, à l'origine de nombreux standards d'ingénierie de l'information, dont le LOM) ont signé un accord en avril 2008 pour renforcer leur coopération en matière de normalisation internationale. http://www.iso.org/iso/fr/pressrelease.htm?refid=Ref1125 Par ailleurs, pour les mêmes raisons, le comité technique Information et documentation de l'ISO (ISO/TC46) a signé un accord de liaison avec l'IETF (Internet Engineering Task Force). ICANN - Internet Corporation for Assigned Names and Numbers
Monde du Web http://www.isoc-gfsi.org/ietf/tao.html#intro TC 46 - billet sur le blog Descripteurs en 2008 : http://dossierdoc.typepad.com/descripteurs/2008/06/la-galre-du-tra.html ICANN - Internet Corporation for Assigned Names and Numbers
RDA / description bibliographique, FRAD / autorités : A2 - Outils de modélisation métier MODS / remplacement de MARC B2 - Outil informatique Format éditorial ONIX (ONline Information Exchange). Proposé en 1999 par le groupe EDItEUR pour favoriser le commerce électronique du livre et des séries à l’attention des éditeurs, libraires et autres intermédiaires. Il complète le modèle de la référence bibliographique par des données administratives comme la licence de publication ou par des données d’accès comme des listes contrôlées adaptées aux catalogues d’éditeurs. Format ONIX: www.editeur.org/onix.html, www.bisg.org/onix/onix_faq.html
RDA / description bibliographique, FRAD / autorités : A2 - Outils de modélisation métier MODS / remplacement de MARC B2 - Outil informatique Format éditorial ONIX (ONline Information Exchange). Proposé en 1999 par le groupe EDItEUR pour favoriser le commerce électronique du livre et des séries à l’attention des éditeurs, libraires et autres intermédiaires. Il complète le modèle de la référence bibliographique par des données administratives comme la licence de publication ou par des données d’accès comme des listes contrôlées adaptées aux catalogues d’éditeurs. Format ONIX: www.editeur.org/onix.html, www.bisg.org/onix/onix_faq.html
METS est une spécification développée au départ sur la base du modèle de l’OAIS (ISO 14721:2003)
http://blog.feedbooks.com/fr/?p=82 pour des informations techniques sur .epub