Métadonnées <ul><li>François-Xavier Boffy </li></ul><ul><li>SID – SCD Lyon 1 </li></ul>
M. Jourdain et les métadonnées DATA META Les métadonnées sont « des données sur des données » ( data about data , cf. Mart...
M. Jourdain et les métadonnées Villeurbanne 69100 Sous-préfecture 138 000 hab. On fait des métadonnées depuis très longtem...
Exemples de métadonnées <ul><li>Votre numéro de sécurité sociale – les machines peuvent gérer votre dossier </li></ul><ul>...
Approche classique <ul><li>Les métadonnées sont des données sur les données, donc on peut classer les métadonnées selon le...
Exemple en Dublin Core qualifié et LOM <ul><li>title  signale le nom d'usage du contenu </li></ul><ul><li>rights  signale ...
Changer de format... <ul><li>title  en DC = champ  240  en MARC </li></ul><ul><li>embargoDate  en PRISM =? en DC (n'existe...
Transférer des données... <ul><li>Titre = La pie voleuse / La Pie voleuse / The Thieving Magpie / ... </li></ul><ul><li>Da...
Des questions restent ouvertes, sur la théorie et la pratique : <ul><li>Quel équilibre entre la richesse des métadonnées e...
Si on élargissait le traitement ? <ul><li>Non seulement </li></ul><ul><ul><li>DC </li></ul></ul><ul><ul><li>DC Terms </li>...
Mon approche <ul><li>La méta-information est un processus de transmission qu'on peut modéliser de différentes façons </li>...
Rappel FRBR <ul><li>On distingue </li></ul><ul><ul><li>l'oeuvre (exemple : l'histoire des Misérables de Victor Hugo) </li>...
Et les standards de métadonnées ? <ul><li>Pourquoi pas... </li></ul><ul><ul><li>Règles de conception de métadonnées </li><...
Standard de conception Standard d'organisation Standard d'expression  grammaticale  Standard d'expression du vocabulaire 4...
Langages à balise Formats bibliographiques XML HTML TEI DC MARC LCSH RFC3361 MeSH DC-HAL LOM La place qu'on peut attribuer...
DC Abstract  model  Langages à balise XML DC Terms DC DC-HAL Europeana RFC3361 LCSH Le DC abstract model contrôle l'emploi...
Langages à balise XML METS  MODS DC Terms MADS LCSH MIX Le METS peut structurer toutes les organisations et les expression...
Formats bibliographiques MARC UNIMARC MARC21 MARCXML Langages à balise XML Le MARCXML est l'adaptation de MARC21 à la conc...
Microformats hCard Hcal  W3CDTF Les Microformats, standards sans organisation (en caricaturant un peu)
Enveloppe de métadonnées XMP  PDF Métadonnées embarquées EXIF L'enrichissement des métadonnées des PDF ou image peut se fa...
Fils de métadonnées RSS  PAM Transmission par lots Z3950 La transmission des métadonnées en séquence peut elle-même être s...
RDF XML RDF / XML Mais au fait, où se placerait RDF dans cette modélisation ? SPARQL
Pourquoi cette typologie ? <ul><li>Mieux montrer les implications des choix de standard de métadonnées </li></ul><ul><li>M...
Merci <ul><li>C'est tout... pour le moment ! </li></ul>Continuer vers Ali Sabieh ©2010 Visocrea
Prochain SlideShare
Chargement dans…5
×

Metadonnees -- une typologie

2 006 vues

Publié le

Présentation générale de ce que sont les métadonnées, de quelques questions qu'elles soulèvent, suivie d'une proposition de typologie des standards de métadonnées.
Manquent les animations
Version 1.1

Publié dans : Technologie
0 commentaire
3 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
2 006
Sur SlideShare
0
Issues des intégrations
0
Intégrations
7
Actions
Partages
0
Téléchargements
47
Commentaires
0
J’aime
3
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Metadonnees -- une typologie

  1. 1. Métadonnées <ul><li>François-Xavier Boffy </li></ul><ul><li>SID – SCD Lyon 1 </li></ul>
  2. 2. M. Jourdain et les métadonnées DATA META Les métadonnées sont « des données sur des données » ( data about data , cf. Martin). On pourrait dire aussi, « des données sur du donné » (y compris sur les objets sensibles). Quand on utilise des données portant sur un objet, on utilise des méta-données.
  3. 3. M. Jourdain et les métadonnées Villeurbanne 69100 Sous-préfecture 138 000 hab. On fait des métadonnées depuis très longtemps sans s'en rendre forcément compte...
  4. 4. Exemples de métadonnées <ul><li>Votre numéro de sécurité sociale – les machines peuvent gérer votre dossier </li></ul><ul><li>Vos prénoms – on peut vous identifier plus précisément qu'avec un seul (alternative : date voire lieu de naissance) </li></ul><ul><li>Votre taille – on peut savoir quel vêtement (= une autre donnée) pourrait « s'agencer » avec vous; mais elle varie ! </li></ul><ul><li>La cuisson de la viande au restaurant – question de vocabulaire (bleu, à point...) ! </li></ul>
  5. 5. Approche classique <ul><li>Les métadonnées sont des données sur les données, donc on peut classer les métadonnées selon le type des données </li></ul><ul><li>Distinction entre </li></ul><ul><ul><li>Métadonnées descriptives (du contenu) </li></ul></ul><ul><ul><li>Métadonnées administratives (droits) </li></ul></ul><ul><ul><li>Métadonnées de structure (relations) </li></ul></ul><ul><ul><li>Métadonnées sur les métadonnées </li></ul></ul>
  6. 6. Exemple en Dublin Core qualifié et LOM <ul><li>title signale le nom d'usage du contenu </li></ul><ul><li>rights signale des droits sur le document </li></ul><ul><li>hasPart signale une sous-partie du doc </li></ul><ul><li>metametadata/contribute (ou 3.2, en LOM) signale l'origine des métadonnées </li></ul>
  7. 7. Changer de format... <ul><li>title en DC = champ 240 en MARC </li></ul><ul><li>embargoDate en PRISM =? en DC (n'existe pas) </li></ul><ul><li>creator en DC ≈ %A en Endnote </li></ul><ul><li>contributor en Zotero ≠ contributor en DC </li></ul><ul><li>La conversion d'un format de métadonnées en un autre est déjà délicat à cause de la « grammaire » utilisée par chacun. </li></ul>
  8. 8. Transférer des données... <ul><li>Titre = La pie voleuse / La Pie voleuse / The Thieving Magpie / ... </li></ul><ul><li>Date = “02/12/1977” / “2 décembre 77” / “12/02/1977” </li></ul><ul><li>La conversion des métadonnées est rendue difficile aussi à cause des vocabulaires plus ou moins bien contrôlés employés par les utilisateurs / créateurs de métadonnées. </li></ul>
  9. 9. Des questions restent ouvertes, sur la théorie et la pratique : <ul><li>Quel équilibre entre la richesse des métadonnées et leur interprétabilité ? </li></ul><ul><li>Quelles relations entre les différents formats ? </li></ul><ul><li>Qui choisit les noms des champs, qui choisit ce qu'on peut y mettre (usagers, éditeurs, instituts de normalisation) ? </li></ul><ul><li>Une norme de stockage ou de transmission, un codage de caractères (ex : Unicode) sont-il aussi des standards de métadonnées ? </li></ul>
  10. 10. Si on élargissait le traitement ? <ul><li>Non seulement </li></ul><ul><ul><li>DC </li></ul></ul><ul><ul><li>DC Terms </li></ul></ul><ul><ul><li>MODS </li></ul></ul><ul><ul><li>MARC </li></ul></ul><ul><ul><li>EAD </li></ul></ul><ul><ul><li>RDF / XML </li></ul></ul><ul><ul><li>METS </li></ul></ul><ul><ul><li>RIS... </li></ul></ul><ul><li>Mais aussi </li></ul><ul><ul><li>RAMEAU </li></ul></ul><ul><ul><li>Z3950 </li></ul></ul><ul><ul><li>DOCX </li></ul></ul><ul><ul><li>Endnote (.enl) </li></ul></ul><ul><ul><li>XML </li></ul></ul><ul><ul><li>Microformat </li></ul></ul><ul><ul><li>RFC3361 </li></ul></ul><ul><ul><li>RDF... </li></ul></ul>
  11. 11. Mon approche <ul><li>La méta-information est un processus de transmission qu'on peut modéliser de différentes façons </li></ul><ul><li>La dialectique entre les fonctionnements du web et les essais de normalisation / standardisation rompt les limites entre données et métadonnées </li></ul><ul><li>Dans le cas des données, les FRBR ont proposé une modélisation intéressante </li></ul>Attention ! Les diapositives qui suivent sont des propositions de modélisation qui n'engagent que leur auteur.
  12. 12. Rappel FRBR <ul><li>On distingue </li></ul><ul><ul><li>l'oeuvre (exemple : l'histoire des Misérables de Victor Hugo) </li></ul></ul><ul><ul><li>l'expression de l'oeuvre (exemple : le film Les Misérables inspiré de l'oeuvre d'Hugo) </li></ul></ul><ul><ul><li>la manifestation de l'oeuvre (exemple : le film Les Misérables sur DVD édité en 2004) </li></ul></ul><ul><ul><li>l'item (exemple : 1 exemplaire du DVD) </li></ul></ul>
  13. 13. Et les standards de métadonnées ? <ul><li>Pourquoi pas... </li></ul><ul><ul><li>Règles de conception de métadonnées </li></ul></ul><ul><ul><li>Règles d'organisation de métadonnées </li></ul></ul><ul><ul><li>Règles d'expression de métadonnées </li></ul></ul><ul><ul><ul><li>Règles grammaticales </li></ul></ul></ul><ul><ul><ul><li>Règles du vocabulaire </li></ul></ul></ul>
  14. 14. Standard de conception Standard d'organisation Standard d'expression grammaticale Standard d'expression du vocabulaire 4 niveaux de régulation des métadonnées
  15. 15. Langages à balise Formats bibliographiques XML HTML TEI DC MARC LCSH RFC3361 MeSH DC-HAL LOM La place qu'on peut attribuer à certains standards de méta-information
  16. 16. DC Abstract model Langages à balise XML DC Terms DC DC-HAL Europeana RFC3361 LCSH Le DC abstract model contrôle l'emploi des grammaires et des vocabulaires, mais reste sur la conception duXML RDF
  17. 17. Langages à balise XML METS MODS DC Terms MADS LCSH MIX Le METS peut structurer toutes les organisations et les expressions de métadonnées sur la base du XML PREMIS TextMD
  18. 18. Formats bibliographiques MARC UNIMARC MARC21 MARCXML Langages à balise XML Le MARCXML est l'adaptation de MARC21 à la conception des langages à balises de type XML
  19. 19. Microformats hCard Hcal W3CDTF Les Microformats, standards sans organisation (en caricaturant un peu)
  20. 20. Enveloppe de métadonnées XMP PDF Métadonnées embarquées EXIF L'enrichissement des métadonnées des PDF ou image peut se faire avec une enveloppe de métadonnées en XMP
  21. 21. Fils de métadonnées RSS PAM Transmission par lots Z3950 La transmission des métadonnées en séquence peut elle-même être standardisée de manières diverses. RSS 1.0 RDF SRU / SRW CQL
  22. 22. RDF XML RDF / XML Mais au fait, où se placerait RDF dans cette modélisation ? SPARQL
  23. 23. Pourquoi cette typologie ? <ul><li>Mieux montrer les implications des choix de standard de métadonnées </li></ul><ul><li>Mieux évaluer les possibilités de conversion entre les standards à partir des ensembles qu'ils encadrent ou qui leur sont liés </li></ul><ul><li>Mieux distinguer ce qui relève d'un choix conceptuel, d'organisation ou de vocabulaire </li></ul><ul><li>Garder la possibilité d'inventer de nouveaux modes de méta-information, avec des organisations identiques ou diférentes </li></ul>
  24. 24. Merci <ul><li>C'est tout... pour le moment ! </li></ul>Continuer vers Ali Sabieh ©2010 Visocrea

×