Ce diaporama a bien été signalé.
Le téléchargement de votre SlideShare est en cours. ×

Inha in visu-metadonnees-12 septembre 2012

Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Chargement dans…3
×

Consultez-les par la suite

1 sur 65 Publicité
Publicité

Plus De Contenu Connexe

Publicité

Similaire à Inha in visu-metadonnees-12 septembre 2012 (20)

Plus par Peccatte (20)

Publicité

Plus récents (20)

Inha in visu-metadonnees-12 septembre 2012

  1. 1. INHA - InVisu Paris – mercredi 12 septembre 2012 Autour des métadonnées des images numériques standards, technologies, pratiques Patrick Peccatte Chercheur associé au Laboratoire d'histoire visuelle contemporaine (Lhivic/EHESS) peccatte@softexperience.com Twitter: @ppeccatte Facebook: patrick.peccatte Google+: Patrick Peccatte Flickr: patrickpeccatte et photosnormandie http://culturevisuelle.org/dejavu Tumblr: dubruitausignal.tumblr.com
  2. 2. Une histoire ancienne Il était une fois... et bien connue L'album de photos wenzday01/Flickr Creative Commons
  3. 3. on ajoutait des légendes aux photos... lizjones112/Flickr Creative Commons
  4. 4. mais attention au déclassement... Yume Photo/Flickr Creative Commons
  5. 5. la solution ? la légende au verso Guanatos Gwyn/Flickr Creative Commons
  6. 6. Documenter Le système Autographic la photo de Kodak permettait "au plus près", au photographe d’ajouter des informations écrites une préoccupation sur le film au moment constante de l’exposition Mario Groleau/Flickr Creative Commons
  7. 7. Photo légendée selon le procédé Autographic (Nico Redlich, 1931). Trois-Rivières, Canada Mario Groleau/Flickr Creative Commons
  8. 8. Avec le numérique... Légendes Métadonnées  Une métadonnée est littéralement une donnée sur une donnée ✔ Dans le domaine des métadonnées [metadata], on parle de données sur une ressource  Plus précisément, c'est un ensemble structuré de données décrivant une ressource quelconque  Une métadonnée peut être utilisée à des fins diverses… ✔ la description et la recherche de ressources ✔ la gestion de collections de ressources ✔ la préservation des ressources
  9. 9. Métadonnées "métiers" [1/2]  Les ressources décrites par des métadonnées ne sont pas nécessairement sous forme digitale ✔ un catalogue de bibliothèque ou de musée contient aussi des métadonnées qui référencent des objets physiques  De nombreuses communautés s'intéressent aux métadonnées ✔ bibliothécaires, documentalistes, archivistes, iconographes, conservateurs de musées, … ✔ …gèrent de nombreux types de ressources
  10. 10. Métadonnées "métiers" [2/2]  ressources: monographies, publications en série, articles, photos, archives, pièces de musée, séquences audio ou vidéo, etc. ✔ on ne décrit pas toutes ces variétés de ressources de la même façon  apparition de standards de métadonnées "métiers"… images  IPTC/IIM (Information Interchange Model)  Exif (Exchangeable Image File Format)  MARC (Machine-readable cataloging) bibliothèques  ISBD (International Standard Bibliographic Description)  catalogage (Marc)  indexation (ISBD)  Dewey Decimal Classification system  classification (Dewey)  EAD (Encoded Archival Description) archives  CIMI consortium (Computer Interchange of Museum Information) musées  RKMS (Recordkeeping Metadata Schema)  MPEG-7 (Multimedia Content Description Interface) audio  ID3 (tags des fichiers audio MP3) standard "de fait "  LOM (IEEE - Learning Object Metadata) éducation  SCORM (Sharable Content Object Reference Model)
  11. 11. Où sont les métadonnées ?  Considérons la ressource suivante : http://www.liberation.fr/medias,62  Cette ressource contient plusieurs métadonnées ✔ site liberation.fr ✔ page Web de la rubrique medias  Les noms informatiques sont des métadonnées ✔ Plus généralement : nom ≈ description nom, chemin d'accès, extension, taille, attributs,≈date de chemin d'accès plan de classement création, date de modification, propriétaire, droits d'accès, etc. sont des métadonnées  Mais cela ne suffit pas, d'autres informations sont nécessaires : description longue, mots-clés, copyright, etc.
  12. 12. Où sont les métadonnées ? Dans une base de données ou un fichier indépendant associé aux données (sidecar file). Les métadonnées sont externes aux ressources. Fichier El Greco.jpg Fichier El Greco.doc Titre principal: El Greco, Begräbnis des Conde de Orgaz Description: El Greco, Domenikos Theotokopoulos, dit ; 1541-1614. .- 'L'Enterrement du comte d'Orgaz', v. 1586. (Saint Augustin et saint Etienne enterrent Don Gonzalo Ruyz de Toledo, Conde de Orgáz, mort en 1327). Huile sur toile, H. 4,60 ; L. 3,60. Tolède, église Santo Tomé. Année de l'évènement: 1586. Année de l'oeuvre: 1586. Mots-clés: 16E SIECLE; AME; ANGE; ART; ART ESPAGNOL; CHRIST; ENTERREMENT; ESPAGNE; GRECO, LE; HUILE SUR TOILE; INHUMATION; MANIERISME; MORT; ORGAZ, DON GONZALO RUYZ; PEINTURE; PERSONNE; ROYAUME DES CIEUX; SAINT AUGUSTIN D'HIPPONE; SAINT ETIENNE; SAINT JEAN- BAPTISTE; TABLEAU; TOLEDE; VIERGE MARIE; DEESIS, vertical
  13. 13. Où sont les métadonnées ?  Dans les données elles-mêmes. Les métadonnées sont internes, "embarquées" dans les ressources numériques.  Les informations EXIF (et GPS) et IPTC/IIM des images numériques sont des métadonnées internes  Les métadonnées XMP peuvent être internes ou externes
  14. 14. Où sont les métadonnées ? contexte de publication (sans métadonnées) Fichier image numérique exploitation Exif IPTC/IIM XMP XMP copie externe GPS Autres informations... Vignette intégrée
  15. 15. Contexte de publication ... pas besoin de métadonnées – le cas de Google Images Çà marche...
  16. 16. Contexte de publication ... pas besoin de métadonnées [really ?] Les informations du contexte de publication ne suffisent pas
  17. 17. Contexte de publication ... pas besoin de métadonnées [really ?] C'est mieux. Mais même avec le Sort by subject les informations générées à partir du contexte de publication ne suffisent pas!
  18. 18. Contexte de publication ... pas besoin de métadonnées [really ?] Catégories ignorées
  19. 19. Avantage et inconvénient des métadonnées internes  Avantage L'échange est facilité; la ressource numérique transporte avec elle ses propres métadonnées lorsqu'elle est téléchargée, copiée, renommée, compactée, etc. ✔ Facilite l'interopérabilité, c'est-à-dire la capacité d’échanger des données entre systèmes différents  Inconvénient Il est nécessaire de copier les métadonnées dans une base de données pour exploiter une grande collection de ressources numériques.
  20. 20. Lire les métadonnées internes des images ● Pas besoin d'outils onéreux ou compliqués ● Sur le Web, il n'est même pas nécessaire de télécharger l'image, utiliser Jeffrey's Exif Viewer http://regex.info/exif.cgi Exemple sur une image de Wikimedia Commons http://commons.wikimedia.org/wiki/File:Statue_Berthold-Brecht-Platz_(Mitte)_Berthold_Brecht.jpg
  21. 21. Image analysée Vignette intégrée Métadonnées textuelles Coordonnées GPS http://regex.info/exif.cgi appliqué sur l'image
  22. 22. Une métadonnée n'est pas obligatoirement textuelle Vignette Métadonnées textuelles intégrée Image analysée Une vignette intégrée peut (parfois) fournir beaucoup d'informations. C'est une métadonnée...
  23. 23. Éditeurs de métadonnées IPTC/IIM et XMP http://www.iptc.org/cms/site/photometadatasupportlist.html etc.
  24. 24. XnView (Win/Mac, gratuit)
  25. 25. Ce que les métadonnées ne sont pas.... ● Contrôle des usages et droits, DRM [Digital Rights Management] ● Tatouage invisible [watermarking] ● Stéganographie: dissimuler un message dans un autre message (en particulier une image numérique) ● Digital forensics: analyse technique des retouches, examen de l'authenticité ["diplomatique numérique"]
  26. 26. Métadonnées Exif (et GPS)
  27. 27. Métadonnées et images – EXIF  EXIF est une abréviation de EXchangeable Image File. Ce format définit les informations d'ordre technique contenues dans les fichiers des images. Ce sont donc des métadonnées de type interne.  Le format EXIF a été développé en octobre 1995 par le JEIDA (Japan Electronic Industry Development Association). La version 2.0 date de novembre 1997, la révision 2.1 de juin 1998 et la révision 2.2 d'avril 2002.  Ce n'est pas un standard, mais il est supporté par tous les fabricants d'APN (avec des variantes propriétaires)  Les informations EXIF concernent les paramètres de prise de vue et les réglages de l'appareil au moment de la capture numérique : ✔ fabricant et modèle de l'appareil ✔ hauteur et largeur de l'image ✔ date et heure de la prise de vue ✔ orientation ✔ résolution, temps d'exposition, ouverture ✔ présence d'un flash ✔ coordonnées GPS sur certains appareils hauts de gamme récents ✔ etc. [30 éléments environ]
  28. 28. Géolocalisation des images ? Très simple... Opérations documentaires équivalentes ? localisation  adresse postale Le Mont-Saint-Michel, 50116, Manche, France  latitude / longitude 48° 38' 10'' N, 1° 30' 41'' W geotags
  29. 29. Géolocalisation des images ? Pas si simple... Crédit El Guanche sur Flickr Licence Creative Commons Le Mont-Saint-Michel et le rocher de Tombelaine vus d'avion  Pour exprimer en geotags cette localisation: ✔ Distinguer entre localisation du sujet et localisation de la prise de vue ✔ Utiliser d'autres geotags également indispensables: altitude et direction
  30. 30. Géolocalisation des images ? Pas si simple... Crédit mafleen sur Flickr Licence Creative Commons La tour de Tokyo (35° 41' N, 139° 46' E) et le mont Fuji (35° 21' 29" N, 138° 43' 52" E) Sujet : descriptions multiples Avant-plan et arrière-plan sont distants de 100 km environ
  31. 31. Métadonnées IPTC/IIM
  32. 32. Métadonnées et images – IPTC/IIM  L'IPTC (International Press and Telecommunications Council) est une organisation internationale qui développe des standards d'échange de données pour la presse  L'IPTC et la NAA (Newspaper Association of America) ont créé en 1991 le modèle global de données appelé Information Interchange Model [IIM]  Sous-ensemble de l'IIM utilisé par Adobe dès 1994 pour définir dans Photoshop les informations associées à une image  C'est ce sous-ensemble composé de 33 champs qui est communément appelé métadonnées IPTC
  33. 33. Métadonnées et images – IPTC/IIM  Métadonnées IPTC = ensemble de champs textuels (Titre, Légende, Mots-clés, Copyright, etc.) stockés dans le fichier image  Chaque champ est identifié par un numéro et un nom normalisé (en anglais)  Très utilisé dans la presse et l'édition
  34. 34. Métadonnées et images – IPTC/IIM  Privilégier un ensemble restreint de champs gérés par la plupart des programmes d'édition IPTC. Par exemple: ✔ n° 25, Keywords (Mots-clés) champ répétable ✔ 55, Date Created (Date de création) ✔ 80, By-line (Auteur) ✔ 90, City (Ville) ✔ 101, Country/Primary Location Name (Pays) ✔ 105, Headline (Titre) ✔ 120, Caption/Abstract (Description/Légende) le plus long champ du standard (2000 caractères maximum)  Respecter le standard en ce qui concerne la répétabilité et la longueur maximale des champs
  35. 35. Métadonnées et images – IPTC/IIM et Exif Modifiable IPTC/IIM : métadonnées ayant trait à la par définition sémantique de l'image et nécessitant l'intervention d'un opérateur humain pour être renseignées EXIF : métadonnées techniques relatives à la prise de vue et fournies automatiquement par un appareil numérique Éviter de modifier
  36. 36. Pratique des métadonnées IPTC/IIM L'exemple des photos d'agence Deux grandes catégories  Photos d'actualités Editorial, News ✔ titre, description/légende, (parfois mots-clés)  Photos d'illustration Creative, Illustration, Documentaire, Stock en général atemporelles ✔ mots-clés, (parfois légendes)  Les historiques sont traitées comme l'éditorial
  37. 37. Photo d'actualité ou photo historique Champs IPTC légende (Caption/Abstract n° 120) mots-clés (Keywords n° 25)
  38. 38. Photo d'illustration
  39. 39. Attention à l'indexation!
  40. 40. Attention à l'indexation! surindexation
  41. 41. Attention à l'indexation! Indexation à l'aide de vocabulaires contrôlés générant des termes associés inappropriés
  42. 42. Métadonnées XMP
  43. 43. Dublin Core Metadata Initiative  Le Dublin Core est un ensemble de 15 éléments de métadonnées ayant trait : ✔ au Contenu Title, Description, Subject, Source, Coverage, Type, Relation Creator et non pas Author ✔ à la Propriété intellectuelle Creator, Contributor, Publisher, Rights ✔ à la Version Date, Format, Identifier, Language DC définit un vocabulaire de métadonnées commun à plusieurs communautés
  44. 44. Dublin Core Metadata Initiative  Le Dublin Core ne prétend pas répondre aux besoins et à la complexité de tous les métiers  Le Dublin Core est un ensemble simple et très utilisé de métadonnées, mais il n'est pas suffisant  Dans la plupart des besoins professionnels, il doit être complété par d'autres schémas de métadonnées  Le Dublin Core est une norme ISO (n° 15836)  Pour en savoir plus: www.dublincore.org
  45. 45. XMP – Extensible Metadata Platform  Créé par Adobe en septembre 2001  Pas réservé aux images. Le format PDF par exemple supporte XMP  Utilise une version simplifiée de RDF (Resource Description Framework) ● Développé par le W3C, base du Web sémantique ● Permet d'encoder, échanger et réutiliser des métadonnées structurées ● Peut s'exprimer en XML (sérialisation)  Utilise le schéma Dublin Core comme fondation (préfixe de l'espace de noms XML: dc:)  XMP est un standard ISO depuis mars 2012 ● ISO 16684-1:2012, Graphic technology – Extensible metadata platform (XMP) specification – Part 1: Data model, serialization and core properties
  46. 46. XMP – Extensible Metadata Platform Les espaces de noms XMP sont des conteneurs Source: Fotoware
  47. 47. XMP – Extensible Metadata Platform Les champs appartiennent à un espace de noms Source: Fotoware
  48. 48. XMP – Extensible Metadata Platform Les espaces de noms permettent d'éviter les collisions Source: Fotoware
  49. 49. Panneaux standards sur Photoshop [ancienne version (CS) ; semblable sur les versions plus récentes]
  50. 50. Organisation des métadonnées par espaces de noms: Dublin Core (préfixe dc) Photoshop (héritage IPTC/IIM) etc. Le panneau Avancé
  51. 51. Bien connaître vos outils dans les workflows complexes Ne pas utiliser des outils non XMP après avoir travaillé avec des outils XMP IPTC n°120: Chatons IPTC n°120: Deux chatons IPTC n°120: Deux chatons XMP dc:description: Chatons XMP dc:description: Chatons XMP dc:description: Chatons Indexation avec un outil XMP Modification à l'aide d'un outil Retour à un outil XMP uniquement IPTC/IIM (non XMP)
  52. 52. Perspectives ouvertes par XMP En quoi XMP est-il plus performant que l'IIM ? IPTC/IIM XMP Binaire (non facilement lisible) Lisible (XML) Statique Extensible et évolutif Extensibilité non documentée Extensibilité documentée (champs non standards) (Namespaces) Pas de types de données Types de données et types structurés Problèmes d'accents Pas de problèmes d'accents (codage Unicode) Inadapté aux légendes Adapté aux légendes multilingues multilingues
  53. 53. La transition du standard IPTC/IIM vers XMP IPTC Photo Metadata  IPTC Photo Metadata est une initiative de l'IPTC qui regroupe deux schémas XMP : IPTC Core et IPTC Extension  But définir des éléments de métadonnées dans le but de proposer une correspondance non ambiguë et une transition en douceur depuis les métadonnées IPTC/IIM (dit legacy) vers une technologie XMP
  54. 54. La transition du standard IPTC/IIM vers XMP IPTC Photo Metadata  IPTC Core reprend sous forme XMP la plupart des métadonnées de l'IIM (mais pas toutes). Son préfixe d'espace de noms est iptc4xmp ✔ IIM Contact n'est pas repris tel quel  IPTC Core comporte aussi des métadonnées supplémentaires par rapport à l'IIM : ✔ Structure Contact : nom, adresse, téléphone, etc. ✔ Localisation (seuls Pays, Code Pays, Ville existent en IIM) ✔ NewsCodes : sujet, scène, genre
  55. 55. La transition du standard IPTC/IIM vers XMP IPTC Photo Metadata IPTC Extension 1.1  Distingue entre la Localisation de la prise de vue et la Localisation du sujet photographié  Gestion des droits : Copyright Owner, Copyright Owner Name, etc.  Informations concernant le modèle photographié : Model Age, Minor Model Age Disclosure, etc.  Informations concernant la propriété des "contenus" photographiés  Informations concernant l'œuvre ou l'objet figurant sur l'image : Artwork or Object in the Image
  56. 56. Extensibilité XMP  Exemple avec Photoshop  Ajouter des panneaux (Custom panels) pour afficher et/ou modifier les métadonnées Astronomy Visualization Metadata Standard  Observer le panneau Avancé
  57. 57. Panneaux standards sur Photoshop [version CS ; semblable sur les versions plus récentes]
  58. 58. Le panneau Avancé
  59. 59. Le panneau Avancé. Détail des informations dans l'espace de nom avm
  60. 60. Extensibilité. Ajout de panneaux personnalisés [Custom panels]. Liste des panneaux.
  61. 61. Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Creator.
  62. 62. Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Content.
  63. 63. Pratique des métadonnées internes des images numériques  Ne pas modifier les métadonnées Exif, à l'exception des coordonnées GPS et parfois de la date de prise de vue (si l'appareil était mal réglé)  Utiliser toujours des standards éprouvés: Dublin Core, IPTC/IIM et équivalent en XMP  Ne pas être top "ambitieux", se contenter d'un jeu de métadonnées cruciales et que l'on maîtrise  Se conformer aux pratiques documentaires habituelles et éviter la surindexation  Si vous utilisez IPTC/IIM, maintenir la cohérence avec les équivalents XMP  N'utiliser l'extensibilité XMP que s'il existe un schéma documenté et soutenu par une organisation reconnue
  64. 64. Pour en savoir plus Métadonnées: une initiation peccatte.karefil.com/software/Metadata.htm Le site de l'IPTC www.iptc.org Adobe Extensible Metadata Platform (XMP) www.adobe.com/products/xmp/main.html Controlled Vocabulary www.controlledvocabulary.com
  65. 65. La légende ne deviendra-t-elle pas l’élément essentiel du cliché ? Walter Benjamin Petite histoire de la photographie (1931)

×