SlideShare une entreprise Scribd logo
1  sur  65
Télécharger pour lire hors ligne
INHA - InVisu
                    Paris – mercredi 12 septembre 2012

         Autour des métadonnées des
             images numériques
               standards, technologies, pratiques
                                                                              Patrick Peccatte
                                    Chercheur associé au Laboratoire d'histoire visuelle contemporaine
                                                                                        (Lhivic/EHESS)

                                                                          peccatte@softexperience.com
                                                                                    Twitter: @ppeccatte
                                                                             Facebook: patrick.peccatte
                                                                              Google+: Patrick Peccatte
                                                            Flickr: patrickpeccatte et photosnormandie
http://culturevisuelle.org/dejavu                                   Tumblr: dubruitausignal.tumblr.com
Une histoire
ancienne            Il était une fois...
et bien connue     L'album de photos




wenzday01/Flickr
Creative Commons
on ajoutait des légendes
                           aux photos...




lizjones112/Flickr
Creative Commons
mais attention
                    au déclassement...




Yume Photo/Flickr
Creative Commons
la solution ?
                       la légende au verso




Guanatos Gwyn/Flickr
Creative Commons
Documenter              Le système Autographic
la photo                   de Kodak permettait
"au plus près",         au photographe d’ajouter
                         des informations écrites
une préoccupation         sur le film au moment
constante                     de l’exposition




 Mario Groleau/Flickr
 Creative Commons
Photo légendée selon le procédé
                       Autographic (Nico Redlich, 1931).
                            Trois-Rivières, Canada




Mario Groleau/Flickr
Creative Commons
Avec le numérique...
              Légendes                     Métadonnées

    Une métadonnée est littéralement une donnée sur
    une donnée
    ✔
        Dans le domaine des métadonnées [metadata], on parle de
        données sur une ressource

    Plus précisément, c'est un ensemble structuré de
    données décrivant une ressource quelconque

    Une métadonnée peut être utilisée à des fins
    diverses…
    ✔
        la description et la recherche de ressources
    ✔
        la gestion de collections de ressources
    ✔
        la préservation des ressources
Métadonnées "métiers" [1/2]


    Les ressources décrites par des métadonnées
    ne sont pas nécessairement sous forme digitale
    ✔
        un catalogue de bibliothèque ou de musée contient
        aussi des métadonnées qui référencent des objets
        physiques

    De nombreuses communautés s'intéressent aux
    métadonnées
    ✔
        bibliothécaires, documentalistes, archivistes,
        iconographes, conservateurs de musées, …
    ✔
        …gèrent de nombreux types de ressources
Métadonnées "métiers" [2/2]
   
       ressources: monographies, publications en série, articles, photos,
       archives, pièces de musée, séquences audio ou vidéo, etc.
       ✔
           on ne décrit pas toutes ces variétés de ressources de la même façon
   
       apparition de standards de métadonnées "métiers"…
images
              IPTC/IIM (Information Interchange Model)
              Exif (Exchangeable Image File Format)
              MARC (Machine-readable cataloging)                          bibliothèques
              ISBD (International Standard Bibliographic Description)      catalogage (Marc)
                                                                            indexation (ISBD)
              Dewey Decimal Classification system
                                                                            classification (Dewey)
              EAD (Encoded Archival Description)      archives
              CIMI consortium (Computer Interchange of Museum Information) musées
              RKMS (Recordkeeping Metadata Schema)
              MPEG-7 (Multimedia Content Description Interface)       audio
              ID3 (tags des fichiers audio MP3) standard "de fait "
              LOM (IEEE - Learning Object Metadata)                   éducation
              SCORM (Sharable Content Object Reference Model)
Où sont les métadonnées ?

    Considérons la ressource suivante :
    http://www.liberation.fr/medias,62

    Cette ressource contient plusieurs métadonnées
    ✔
        site liberation.fr
    ✔
        page Web de la rubrique medias

    Les noms informatiques sont des métadonnées
    ✔
        Plus généralement :                            nom ≈ description
        nom, chemin d'accès, extension, taille, attributs,≈date de
                                               chemin d'accès plan de classement
        création, date de modification, propriétaire, droits d'accès, etc.
        sont des métadonnées

    Mais cela ne suffit pas, d'autres informations sont
    nécessaires :
    description longue, mots-clés, copyright, etc.
Où sont les métadonnées ?
Dans une base de données ou un fichier indépendant
         associé aux données (sidecar file).
  Les métadonnées sont externes aux ressources.
 Fichier El Greco.jpg       Fichier El Greco.doc
                          Titre principal: El Greco, Begräbnis des Conde de
                          Orgaz
                          Description: El Greco, Domenikos Theotokopoulos,
                          dit ; 1541-1614. .- 'L'Enterrement du comte d'Orgaz',
                          v. 1586. (Saint Augustin et saint Etienne enterrent Don
                          Gonzalo Ruyz de Toledo, Conde de Orgáz, mort en
                          1327). Huile sur toile, H. 4,60 ; L. 3,60. Tolède, église
                          Santo Tomé. Année de l'évènement: 1586. Année de
                          l'oeuvre: 1586.
                          Mots-clés: 16E SIECLE; AME; ANGE; ART; ART
                          ESPAGNOL; CHRIST; ENTERREMENT;
                          ESPAGNE; GRECO, LE; HUILE SUR TOILE;
                          INHUMATION; MANIERISME; MORT; ORGAZ,
                          DON GONZALO RUYZ; PEINTURE; PERSONNE;
                          ROYAUME DES CIEUX; SAINT AUGUSTIN
                          D'HIPPONE; SAINT ETIENNE; SAINT JEAN-
                          BAPTISTE; TABLEAU; TOLEDE; VIERGE
                          MARIE; DEESIS, vertical
Où sont les métadonnées ?


    Dans les données elles-mêmes.
    Les métadonnées sont internes, "embarquées"
    dans les ressources numériques.

    Les informations EXIF (et GPS) et IPTC/IIM des
    images numériques sont des métadonnées
    internes

    Les métadonnées XMP peuvent être
    internes ou externes
Où sont les métadonnées ?


                                                 contexte de
                                                 publication
                                                (sans métadonnées)


                    Fichier image numérique


 exploitation
                      Exif   IPTC/IIM    XMP       XMP
copie externe
                     GPS


                       Autres informations...
                              Vignette
                              intégrée
Contexte de publication ... pas besoin de
métadonnées – le cas de Google Images
                                  Çà marche...
Contexte de publication ... pas besoin de
        métadonnées [really ?]
                         Les informations du contexte
                         de publication ne suffisent pas
Contexte de publication ... pas besoin de
        métadonnées [really ?]
                                   C'est mieux.
                       Mais même avec le Sort by subject
                           les informations générées
                       à partir du contexte de publication
                                 ne suffisent pas!
Contexte de publication ... pas besoin de
        métadonnées [really ?]
                              Catégories ignorées
Avantage et inconvénient
           des métadonnées internes

    Avantage
    L'échange est facilité; la ressource numérique
    transporte avec elle ses propres métadonnées
    lorsqu'elle est téléchargée, copiée, renommée,
    compactée, etc.
    ✔
        Facilite l'interopérabilité, c'est-à-dire la capacité
        d’échanger des données entre systèmes différents

    Inconvénient
    Il est nécessaire de copier les métadonnées
    dans une base de données pour exploiter une
    grande collection de ressources numériques.
Lire les métadonnées internes des images


   ●
       Pas besoin d'outils onéreux ou compliqués
   ●
      Sur le Web, il n'est même pas nécessaire de télécharger
   l'image, utiliser Jeffrey's Exif Viewer
   http://regex.info/exif.cgi


Exemple sur une image de Wikimedia Commons
http://commons.wikimedia.org/wiki/File:Statue_Berthold-Brecht-Platz_(Mitte)_Berthold_Brecht.jpg
Image analysée




                         Vignette
                         intégrée
Métadonnées textuelles




                                     Coordonnées GPS




                              http://regex.info/exif.cgi appliqué sur l'image
Une métadonnée n'est pas obligatoirement
              textuelle
                             Vignette
  Métadonnées textuelles
                             intégrée
                                               Image analysée




        Une vignette intégrée peut (parfois)
         fournir beaucoup d'informations.
             C'est une métadonnée...
Éditeurs de métadonnées
               IPTC/IIM et XMP
http://www.iptc.org/cms/site/photometadatasupportlist.html




                      etc.
XnView (Win/Mac, gratuit)
Ce que les métadonnées
              ne sont pas....
●
    Contrôle des usages et droits,
    DRM [Digital Rights Management]
●
    Tatouage invisible [watermarking]
●
    Stéganographie: dissimuler un message dans un
    autre message (en particulier une image
    numérique)
●
    Digital forensics: analyse technique des
    retouches, examen de l'authenticité
    ["diplomatique numérique"]
Métadonnées
Exif (et GPS)
Métadonnées et images – EXIF

    EXIF est une abréviation de EXchangeable Image File. Ce format définit les
    informations d'ordre technique contenues dans les fichiers des images.
    Ce sont donc des métadonnées de type interne.

    Le format EXIF a été développé en octobre 1995 par le JEIDA
    (Japan Electronic Industry Development Association).
    La version 2.0 date de novembre 1997, la révision 2.1 de juin 1998 et la révision 2.2
    d'avril 2002.

    Ce n'est pas un standard, mais il est supporté par tous les fabricants d'APN
    (avec des variantes propriétaires)

    Les informations EXIF concernent les paramètres de prise de vue et les
    réglages de l'appareil au moment de la capture numérique :
     ✔   fabricant et modèle de l'appareil
     ✔   hauteur et largeur de l'image
     ✔   date et heure de la prise de vue
     ✔   orientation
     ✔   résolution, temps d'exposition, ouverture
     ✔   présence d'un flash
     ✔   coordonnées GPS sur certains appareils hauts de gamme récents
     ✔   etc. [30 éléments environ]
Géolocalisation des images ? Très simple...

                                                Opérations
                                              documentaires
                                              équivalentes ?




                                                  localisation


    adresse postale
    Le Mont-Saint-Michel, 50116, Manche, France

    latitude / longitude
    48° 38' 10'' N, 1° 30' 41'' W                   geotags
Géolocalisation des images ? Pas si simple...




                                                Crédit El Guanche sur Flickr
                                                Licence Creative Commons


Le Mont-Saint-Michel et le rocher de Tombelaine vus d'avion

   Pour exprimer en geotags cette localisation:
  ✔
      Distinguer entre localisation du sujet et localisation de la prise de vue
  ✔
      Utiliser d'autres geotags également indispensables: altitude et direction
Géolocalisation des images ? Pas si simple...




                                             Crédit mafleen sur Flickr
                                             Licence Creative Commons


            La tour de Tokyo (35° 41' N, 139° 46' E)
         et le mont Fuji (35° 21' 29" N, 138° 43' 52" E)
   Sujet : descriptions multiples
   Avant-plan et arrière-plan sont distants de 100 km environ
Métadonnées
  IPTC/IIM
Métadonnées et images – IPTC/IIM


    L'IPTC (International Press and Telecommunications
    Council) est une organisation internationale qui développe
    des standards d'échange de données pour la presse

    L'IPTC et la NAA (Newspaper Association of America) ont
    créé en 1991 le modèle global de données appelé
    Information Interchange Model [IIM]

    Sous-ensemble de l'IIM utilisé par Adobe dès 1994 pour
    définir dans Photoshop les informations associées à une
    image

    C'est ce sous-ensemble composé de 33 champs qui est
    communément appelé métadonnées IPTC
Métadonnées et images – IPTC/IIM



    Métadonnées IPTC = ensemble de champs
    textuels (Titre, Légende, Mots-clés, Copyright,
    etc.) stockés dans le fichier image

    Chaque champ est identifié par un numéro et
    un nom normalisé (en anglais)

    Très utilisé dans la presse et l'édition
Métadonnées et images – IPTC/IIM

    Privilégier un ensemble restreint de champs gérés par la
    plupart des programmes d'édition IPTC. Par exemple:
      ✔
          n° 25, Keywords (Mots-clés) champ répétable
      ✔
          55, Date Created (Date de création)
      ✔
          80, By-line (Auteur)
      ✔
          90, City (Ville)
      ✔
          101, Country/Primary Location Name (Pays)
      ✔
          105, Headline (Titre)
      ✔
          120, Caption/Abstract (Description/Légende)
            le plus long champ du standard (2000 caractères maximum)

    Respecter le standard en ce qui concerne la répétabilité et
    la longueur maximale des champs
Métadonnées et images – IPTC/IIM et Exif

                                               Modifiable
IPTC/IIM : métadonnées ayant trait à la        par définition
  sémantique de l'image et nécessitant
  l'intervention d'un opérateur humain pour être
  renseignées
EXIF : métadonnées techniques relatives à la prise
  de vue et fournies automatiquement par un
  appareil numérique                     Éviter de modifier
Pratique des métadonnées IPTC/IIM
  L'exemple des photos d'agence

Deux grandes catégories

  Photos d'actualités
  Editorial, News
    ✔
        titre, description/légende, (parfois mots-clés)

    Photos d'illustration
    Creative, Illustration, Documentaire, Stock
    en général atemporelles
    ✔
        mots-clés, (parfois légendes)

    Les historiques sont traitées comme l'éditorial
Photo d'actualité ou photo historique




                      Champs IPTC
                      légende (Caption/Abstract n° 120)
                      mots-clés (Keywords n° 25)
Photo d'illustration
Attention à l'indexation!
Attention à l'indexation!




                    surindexation
Attention à l'indexation!




                   Indexation à l'aide de
                   vocabulaires contrôlés
                générant des termes associés
                       inappropriés
Métadonnées
    XMP
Dublin Core Metadata Initiative


    Le Dublin Core est un ensemble de 15
    éléments de métadonnées ayant trait :
    ✔
        au Contenu
        Title, Description, Subject, Source,
        Coverage, Type, Relation
                                      Creator et non pas Author
    ✔
        à la Propriété intellectuelle
        Creator, Contributor, Publisher, Rights
    ✔
        à la Version
        Date, Format, Identifier, Language

                 DC définit un vocabulaire de métadonnées
                    commun à plusieurs communautés
Dublin Core Metadata Initiative


    Le Dublin Core ne prétend pas répondre aux
    besoins et à la complexité de tous les métiers

    Le Dublin Core est un ensemble simple et très
    utilisé de métadonnées, mais il n'est pas
    suffisant

    Dans la plupart des besoins professionnels, il
    doit être complété par d'autres schémas de
    métadonnées

    Le Dublin Core est une norme ISO (n° 15836)

    Pour en savoir plus: www.dublincore.org
XMP – Extensible Metadata Platform


    Créé par Adobe en septembre 2001

    Pas réservé aux images.
    Le format PDF par exemple supporte XMP

    Utilise une version simplifiée de RDF
    (Resource Description Framework)
    ●
        Développé par le W3C, base du Web sémantique
    ●
        Permet d'encoder, échanger et réutiliser des métadonnées structurées
    ●
        Peut s'exprimer en XML (sérialisation)


    Utilise le schéma Dublin Core comme fondation
    (préfixe de l'espace de noms XML: dc:)

    XMP est un standard ISO depuis mars 2012
    ●
        ISO 16684-1:2012, Graphic technology – Extensible metadata platform
        (XMP) specification – Part 1: Data model, serialization and core
        properties
XMP – Extensible Metadata Platform
Les espaces de noms XMP sont des conteneurs




                                        Source: Fotoware
XMP – Extensible Metadata Platform
Les champs appartiennent à un espace de noms




                                        Source: Fotoware
XMP – Extensible Metadata Platform
Les espaces de noms permettent d'éviter les collisions




                                             Source: Fotoware
Panneaux standards sur Photoshop [ancienne version (CS) ; semblable sur les versions plus récentes]
Organisation des métadonnées
                        par espaces de noms:
                      Dublin Core (préfixe dc)
                    Photoshop (héritage IPTC/IIM)
                                 etc.




Le panneau Avancé
Bien connaître vos outils dans les workflows
                    complexes
                Ne pas utiliser des outils non XMP
              après avoir travaillé avec des outils XMP




IPTC n°120: Chatons              IPTC n°120: Deux chatons          IPTC n°120: Deux chatons
XMP dc:description: Chatons      XMP dc:description: Chatons       XMP dc:description: Chatons


Indexation avec un outil XMP    Modification à l'aide d'un outil      Retour à un outil XMP
                               uniquement IPTC/IIM (non XMP)
Perspectives ouvertes par XMP
      En quoi XMP est-il plus performant que l'IIM ?


          IPTC/IIM                            XMP
Binaire (non facilement lisible)   Lisible (XML)
Statique                           Extensible et évolutif
Extensibilité non documentée       Extensibilité documentée
(champs non standards)             (Namespaces)

Pas de types de données            Types de données et types
                                   structurés
Problèmes d'accents                Pas de problèmes d'accents
                                   (codage Unicode)
Inadapté aux légendes              Adapté aux légendes
multilingues                       multilingues
La transition du standard IPTC/IIM vers XMP
                IPTC Photo Metadata

 
     IPTC Photo Metadata est une initiative de
     l'IPTC qui regroupe deux schémas XMP :
     IPTC Core et IPTC Extension
 
     But définir des éléments de métadonnées dans
     le but de proposer une correspondance non
     ambiguë et une transition en douceur depuis
     les métadonnées IPTC/IIM (dit legacy) vers
     une technologie XMP
La transition du standard IPTC/IIM vers XMP
                     IPTC Photo Metadata

 
     IPTC Core reprend sous forme XMP la plupart
     des métadonnées de l'IIM (mais pas toutes). Son
     préfixe d'espace de noms est iptc4xmp
      ✔
          IIM Contact n'est pas repris tel quel
 
     IPTC Core comporte aussi des métadonnées
     supplémentaires par rapport à l'IIM :
      ✔
          Structure Contact : nom, adresse, téléphone, etc.
      ✔
          Localisation (seuls Pays, Code Pays, Ville existent en IIM)
      ✔
          NewsCodes : sujet, scène, genre
La transition du standard IPTC/IIM vers XMP
                      IPTC Photo Metadata

IPTC Extension 1.1
 
     Distingue entre la Localisation de la prise de vue et la
     Localisation du sujet photographié
 
     Gestion des droits :
     Copyright Owner, Copyright Owner Name, etc.
 
     Informations concernant le modèle photographié :
     Model Age, Minor Model Age Disclosure, etc.
 
     Informations concernant la propriété des "contenus"
     photographiés
 
     Informations concernant l'œuvre ou l'objet figurant sur l'image :
     Artwork or Object in the Image
Extensibilité XMP



    Exemple avec Photoshop

    Ajouter des panneaux (Custom panels) pour afficher
    et/ou modifier les métadonnées Astronomy Visualization
    Metadata Standard

    Observer le panneau Avancé
Panneaux standards sur Photoshop [version CS ; semblable sur les versions plus récentes]
Le panneau Avancé
Le panneau Avancé. Détail des informations dans l'espace de nom avm
Extensibilité. Ajout de panneaux personnalisés [Custom panels]. Liste des panneaux.
Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Creator.
Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Content.
Pratique des métadonnées internes des
               images numériques

    Ne pas modifier les métadonnées Exif, à l'exception des
    coordonnées GPS et parfois de la date de prise de vue (si
    l'appareil était mal réglé)

    Utiliser toujours des standards éprouvés:
    Dublin Core, IPTC/IIM et équivalent en XMP

    Ne pas être top "ambitieux", se contenter d'un jeu de
    métadonnées cruciales et que l'on maîtrise

    Se conformer aux pratiques documentaires habituelles et éviter
    la surindexation

    Si vous utilisez IPTC/IIM, maintenir la cohérence avec les
    équivalents XMP

    N'utiliser l'extensibilité XMP que s'il existe un schéma
    documenté et soutenu par une organisation reconnue
Pour en savoir plus


Métadonnées: une initiation
peccatte.karefil.com/software/Metadata.htm
Le site de l'IPTC
www.iptc.org
Adobe Extensible Metadata Platform (XMP)
www.adobe.com/products/xmp/main.html
Controlled Vocabulary
www.controlledvocabulary.com
La légende ne deviendra-t-elle pas l’élément
essentiel du cliché ?



                                               Walter Benjamin
                       Petite histoire de la photographie (1931)

Contenu connexe

Tendances (6)

La bibliothèque numérique
La bibliothèque numériqueLa bibliothèque numérique
La bibliothèque numérique
 
La recherche documentaire
La recherche documentaireLa recherche documentaire
La recherche documentaire
 
2009 2010 Fip3 A Unix
2009 2010 Fip3 A Unix2009 2010 Fip3 A Unix
2009 2010 Fip3 A Unix
 
Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014
 
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèquesLe web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
 
Place du document numérique dans les ENT
Place du document numérique dans les ENTPlace du document numérique dans les ENT
Place du document numérique dans les ENT
 

En vedette (8)

Les TIC et l'art : l'Accessibilité numérique
Les TIC et l'art : l'Accessibilité numériqueLes TIC et l'art : l'Accessibilité numérique
Les TIC et l'art : l'Accessibilité numérique
 
Autour de Wikipédia et des projets frères
Autour de Wikipédia et des projets frèresAutour de Wikipédia et des projets frères
Autour de Wikipédia et des projets frères
 
Tic identite numerique12-12-2011
Tic identite numerique12-12-2011Tic identite numerique12-12-2011
Tic identite numerique12-12-2011
 
Les TIC et l'art : les corpus scientifiques face au web ouvert
Les TIC et l'art : les corpus scientifiques face au web ouvertLes TIC et l'art : les corpus scientifiques face au web ouvert
Les TIC et l'art : les corpus scientifiques face au web ouvert
 
Licences libres et licences creative commons version web
Licences libres et licences creative commons version webLicences libres et licences creative commons version web
Licences libres et licences creative commons version web
 
Quelle utilisation des TIC dans une thèse en histoire de l'art ?
Quelle utilisation des TIC dans une thèse en histoire de l'art ?Quelle utilisation des TIC dans une thèse en histoire de l'art ?
Quelle utilisation des TIC dans une thèse en histoire de l'art ?
 
Zotero, journée de formation 19 janvier 2017
Zotero, journée de formation 19 janvier 2017Zotero, journée de formation 19 janvier 2017
Zotero, journée de formation 19 janvier 2017
 
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
 

Similaire à Inha in visu-metadonnees-12 septembre 2012

Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Peccatte
 
Formation "Culture numérique" - introduction
Formation "Culture numérique" - introduction Formation "Culture numérique" - introduction
Formation "Culture numérique" - introduction
ABES
 
Fondamentaux du journalisme web - session 1 - 2013
Fondamentaux du journalisme web - session 1 - 2013Fondamentaux du journalisme web - session 1 - 2013
Fondamentaux du journalisme web - session 1 - 2013
Gwendal Perrin
 

Similaire à Inha in visu-metadonnees-12 septembre 2012 (20)

Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 a...
 
Partage et création numérique : exemple du projet tarnais : du patrimoine loc...
Partage et création numérique : exemple du projet tarnais : du patrimoine loc...Partage et création numérique : exemple du projet tarnais : du patrimoine loc...
Partage et création numérique : exemple du projet tarnais : du patrimoine loc...
 
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
 
Adbs formation numerique_ce_ratp
Adbs formation numerique_ce_ratpAdbs formation numerique_ce_ratp
Adbs formation numerique_ce_ratp
 
Produit mondialise amazon_kindle
Produit mondialise amazon_kindleProduit mondialise amazon_kindle
Produit mondialise amazon_kindle
 
Big Data et Technologies du Langage
Big Data et Technologies du LangageBig Data et Technologies du Langage
Big Data et Technologies du Langage
 
L'ontologie NiceTag : Modéliser les tags à l'aide des graphes nommés RDF (pré...
L'ontologie NiceTag : Modéliser les tags à l'aide des graphes nommés RDF (pré...L'ontologie NiceTag : Modéliser les tags à l'aide des graphes nommés RDF (pré...
L'ontologie NiceTag : Modéliser les tags à l'aide des graphes nommés RDF (pré...
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Formation "Culture numérique" - introduction
Formation "Culture numérique" - introduction Formation "Culture numérique" - introduction
Formation "Culture numérique" - introduction
 
Informatique documentaire - Cours Licence pro bib 2013 (journée 2)
Informatique documentaire - Cours Licence pro bib 2013 (journée 2)Informatique documentaire - Cours Licence pro bib 2013 (journée 2)
Informatique documentaire - Cours Licence pro bib 2013 (journée 2)
 
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesInteropérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
 
Fondamentaux du journalisme web - session 1 - 2013
Fondamentaux du journalisme web - session 1 - 2013Fondamentaux du journalisme web - session 1 - 2013
Fondamentaux du journalisme web - session 1 - 2013
 
Quelles métadonnées pour les images scientifiques ?
Quelles métadonnées pour les images scientifiques ?Quelles métadonnées pour les images scientifiques ?
Quelles métadonnées pour les images scientifiques ?
 
Avant la veille : tentative de grammaire du web
Avant la veille : tentative de grammaire du webAvant la veille : tentative de grammaire du web
Avant la veille : tentative de grammaire du web
 
Web 2.0 et bibliothèques
Web 2.0 et bibliothèquesWeb 2.0 et bibliothèques
Web 2.0 et bibliothèques
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ? Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumerique
 
Numérier et partager ses collections
Numérier et partager ses collectionsNumérier et partager ses collections
Numérier et partager ses collections
 

Plus de Peccatte

Fadben presentation 23 mars 2012
Fadben presentation   23 mars 2012Fadben presentation   23 mars 2012
Fadben presentation 23 mars 2012
Peccatte
 
The commons séminaire muséologie - 14 février 2012
The commons   séminaire muséologie - 14 février 2012The commons   séminaire muséologie - 14 février 2012
The commons séminaire muséologie - 14 février 2012
Peccatte
 
Colloque si la photo est bonne 20 octobre 2011
Colloque si la photo est bonne   20 octobre 2011Colloque si la photo est bonne   20 octobre 2011
Colloque si la photo est bonne 20 octobre 2011
Peccatte
 
Les concepts fondamentaux de DITA
Les concepts fondamentaux de DITALes concepts fondamentaux de DITA
Les concepts fondamentaux de DITA
Peccatte
 

Plus de Peccatte (20)

Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...
Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...
Les figurations sensuelles et érotisées de Jeanne d’Arc au temps de sa canoni...
 
Les origines du cinéma de nazisploitation
Les origines du cinéma de nazisploitationLes origines du cinéma de nazisploitation
Les origines du cinéma de nazisploitation
 
Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...
Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...
Séminaire Camera Memoria - Les premières publications des photos de Robert Ca...
 
La bande dessinée et la tapisserie de Bayeux - Angoulême, 3 mai 2017
La bande dessinée et la tapisserie de Bayeux  - Angoulême, 3 mai 2017La bande dessinée et la tapisserie de Bayeux  - Angoulême, 3 mai 2017
La bande dessinée et la tapisserie de Bayeux - Angoulême, 3 mai 2017
 
Girls' Romances #97, December 1963, Arleigh Publishing [DC]
Girls' Romances #97, December 1963, Arleigh Publishing [DC]Girls' Romances #97, December 1963, Arleigh Publishing [DC]
Girls' Romances #97, December 1963, Arleigh Publishing [DC]
 
Strange Suspense Stories #72, October 1964, Charlton Comics
Strange Suspense Stories #72, October 1964,  Charlton ComicsStrange Suspense Stories #72, October 1964,  Charlton Comics
Strange Suspense Stories #72, October 1964, Charlton Comics
 
Secret Hearts #83, November 1962, Arleigh Publishing [DC]
Secret Hearts #83, November 1962, Arleigh Publishing [DC]Secret Hearts #83, November 1962, Arleigh Publishing [DC]
Secret Hearts #83, November 1962, Arleigh Publishing [DC]
 
All-American Men of War #089, February 1962, DC
All-American Men of War #089, February 1962, DCAll-American Men of War #089, February 1962, DC
All-American Men of War #089, February 1962, DC
 
Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960
Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960
Donald Duck, Lost and Found, Little Golden Book, New York, Golden Press, 1960
 
PhotosNormandie, Forum des Archivistes - 20 mars 2013
PhotosNormandie, Forum des Archivistes - 20 mars 2013PhotosNormandie, Forum des Archivistes - 20 mars 2013
PhotosNormandie, Forum des Archivistes - 20 mars 2013
 
Séminaire images de guerres ULB (présentation)
Séminaire images de guerres ULB (présentation)Séminaire images de guerres ULB (présentation)
Séminaire images de guerres ULB (présentation)
 
Fadben presentation 23 mars 2012
Fadben presentation   23 mars 2012Fadben presentation   23 mars 2012
Fadben presentation 23 mars 2012
 
The commons séminaire muséologie - 14 février 2012
The commons   séminaire muséologie - 14 février 2012The commons   séminaire muséologie - 14 février 2012
The commons séminaire muséologie - 14 février 2012
 
La Tapisserie de Bayeux
La Tapisserie de BayeuxLa Tapisserie de Bayeux
La Tapisserie de Bayeux
 
Colloque si la photo est bonne 20 octobre 2011
Colloque si la photo est bonne   20 octobre 2011Colloque si la photo est bonne   20 octobre 2011
Colloque si la photo est bonne 20 octobre 2011
 
IHA - 28 juin 2011 - PhotosNormandie
IHA - 28 juin 2011 - PhotosNormandieIHA - 28 juin 2011 - PhotosNormandie
IHA - 28 juin 2011 - PhotosNormandie
 
Machine Tags Flickr Peccatte
Machine Tags Flickr PeccatteMachine Tags Flickr Peccatte
Machine Tags Flickr Peccatte
 
Luxembourg Photos Normandie Peccatte
Luxembourg Photos Normandie PeccatteLuxembourg Photos Normandie Peccatte
Luxembourg Photos Normandie Peccatte
 
Web 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophiqueWeb 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophique
 
Les concepts fondamentaux de DITA
Les concepts fondamentaux de DITALes concepts fondamentaux de DITA
Les concepts fondamentaux de DITA
 

Dernier

Dernier (12)

PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdfPowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
 
Quitter la nuit. pptx
Quitter          la        nuit.    pptxQuitter          la        nuit.    pptx
Quitter la nuit. pptx
 
Traitement des eaux usées par lagunage a macrophytes.pptx
Traitement des eaux usées par lagunage a macrophytes.pptxTraitement des eaux usées par lagunage a macrophytes.pptx
Traitement des eaux usées par lagunage a macrophytes.pptx
 
Système National de Santé au- Maroc-(2017)."pdf"
Système National de Santé au- Maroc-(2017)."pdf"Système National de Santé au- Maroc-(2017)."pdf"
Système National de Santé au- Maroc-(2017)."pdf"
 
Formation IAT pour sonelgaz chlef algérie.ppt
Formation IAT pour sonelgaz chlef algérie.pptFormation IAT pour sonelgaz chlef algérie.ppt
Formation IAT pour sonelgaz chlef algérie.ppt
 
Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctions
 
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
 
rapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdfrapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdf
 
Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"
 
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
 
Quitter la nuit. pptx
Quitter        la             nuit.   pptxQuitter        la             nuit.   pptx
Quitter la nuit. pptx
 

Inha in visu-metadonnees-12 septembre 2012

  • 1. INHA - InVisu Paris – mercredi 12 septembre 2012 Autour des métadonnées des images numériques standards, technologies, pratiques Patrick Peccatte Chercheur associé au Laboratoire d'histoire visuelle contemporaine (Lhivic/EHESS) peccatte@softexperience.com Twitter: @ppeccatte Facebook: patrick.peccatte Google+: Patrick Peccatte Flickr: patrickpeccatte et photosnormandie http://culturevisuelle.org/dejavu Tumblr: dubruitausignal.tumblr.com
  • 2. Une histoire ancienne Il était une fois... et bien connue L'album de photos wenzday01/Flickr Creative Commons
  • 3. on ajoutait des légendes aux photos... lizjones112/Flickr Creative Commons
  • 4. mais attention au déclassement... Yume Photo/Flickr Creative Commons
  • 5. la solution ? la légende au verso Guanatos Gwyn/Flickr Creative Commons
  • 6. Documenter Le système Autographic la photo de Kodak permettait "au plus près", au photographe d’ajouter des informations écrites une préoccupation sur le film au moment constante de l’exposition Mario Groleau/Flickr Creative Commons
  • 7. Photo légendée selon le procédé Autographic (Nico Redlich, 1931). Trois-Rivières, Canada Mario Groleau/Flickr Creative Commons
  • 8. Avec le numérique... Légendes Métadonnées  Une métadonnée est littéralement une donnée sur une donnée ✔ Dans le domaine des métadonnées [metadata], on parle de données sur une ressource  Plus précisément, c'est un ensemble structuré de données décrivant une ressource quelconque  Une métadonnée peut être utilisée à des fins diverses… ✔ la description et la recherche de ressources ✔ la gestion de collections de ressources ✔ la préservation des ressources
  • 9. Métadonnées "métiers" [1/2]  Les ressources décrites par des métadonnées ne sont pas nécessairement sous forme digitale ✔ un catalogue de bibliothèque ou de musée contient aussi des métadonnées qui référencent des objets physiques  De nombreuses communautés s'intéressent aux métadonnées ✔ bibliothécaires, documentalistes, archivistes, iconographes, conservateurs de musées, … ✔ …gèrent de nombreux types de ressources
  • 10. Métadonnées "métiers" [2/2]  ressources: monographies, publications en série, articles, photos, archives, pièces de musée, séquences audio ou vidéo, etc. ✔ on ne décrit pas toutes ces variétés de ressources de la même façon  apparition de standards de métadonnées "métiers"… images  IPTC/IIM (Information Interchange Model)  Exif (Exchangeable Image File Format)  MARC (Machine-readable cataloging) bibliothèques  ISBD (International Standard Bibliographic Description)  catalogage (Marc)  indexation (ISBD)  Dewey Decimal Classification system  classification (Dewey)  EAD (Encoded Archival Description) archives  CIMI consortium (Computer Interchange of Museum Information) musées  RKMS (Recordkeeping Metadata Schema)  MPEG-7 (Multimedia Content Description Interface) audio  ID3 (tags des fichiers audio MP3) standard "de fait "  LOM (IEEE - Learning Object Metadata) éducation  SCORM (Sharable Content Object Reference Model)
  • 11. Où sont les métadonnées ?  Considérons la ressource suivante : http://www.liberation.fr/medias,62  Cette ressource contient plusieurs métadonnées ✔ site liberation.fr ✔ page Web de la rubrique medias  Les noms informatiques sont des métadonnées ✔ Plus généralement : nom ≈ description nom, chemin d'accès, extension, taille, attributs,≈date de chemin d'accès plan de classement création, date de modification, propriétaire, droits d'accès, etc. sont des métadonnées  Mais cela ne suffit pas, d'autres informations sont nécessaires : description longue, mots-clés, copyright, etc.
  • 12. Où sont les métadonnées ? Dans une base de données ou un fichier indépendant associé aux données (sidecar file). Les métadonnées sont externes aux ressources. Fichier El Greco.jpg Fichier El Greco.doc Titre principal: El Greco, Begräbnis des Conde de Orgaz Description: El Greco, Domenikos Theotokopoulos, dit ; 1541-1614. .- 'L'Enterrement du comte d'Orgaz', v. 1586. (Saint Augustin et saint Etienne enterrent Don Gonzalo Ruyz de Toledo, Conde de Orgáz, mort en 1327). Huile sur toile, H. 4,60 ; L. 3,60. Tolède, église Santo Tomé. Année de l'évènement: 1586. Année de l'oeuvre: 1586. Mots-clés: 16E SIECLE; AME; ANGE; ART; ART ESPAGNOL; CHRIST; ENTERREMENT; ESPAGNE; GRECO, LE; HUILE SUR TOILE; INHUMATION; MANIERISME; MORT; ORGAZ, DON GONZALO RUYZ; PEINTURE; PERSONNE; ROYAUME DES CIEUX; SAINT AUGUSTIN D'HIPPONE; SAINT ETIENNE; SAINT JEAN- BAPTISTE; TABLEAU; TOLEDE; VIERGE MARIE; DEESIS, vertical
  • 13. Où sont les métadonnées ?  Dans les données elles-mêmes. Les métadonnées sont internes, "embarquées" dans les ressources numériques.  Les informations EXIF (et GPS) et IPTC/IIM des images numériques sont des métadonnées internes  Les métadonnées XMP peuvent être internes ou externes
  • 14. Où sont les métadonnées ? contexte de publication (sans métadonnées) Fichier image numérique exploitation Exif IPTC/IIM XMP XMP copie externe GPS Autres informations... Vignette intégrée
  • 15. Contexte de publication ... pas besoin de métadonnées – le cas de Google Images Çà marche...
  • 16. Contexte de publication ... pas besoin de métadonnées [really ?] Les informations du contexte de publication ne suffisent pas
  • 17. Contexte de publication ... pas besoin de métadonnées [really ?] C'est mieux. Mais même avec le Sort by subject les informations générées à partir du contexte de publication ne suffisent pas!
  • 18. Contexte de publication ... pas besoin de métadonnées [really ?] Catégories ignorées
  • 19. Avantage et inconvénient des métadonnées internes  Avantage L'échange est facilité; la ressource numérique transporte avec elle ses propres métadonnées lorsqu'elle est téléchargée, copiée, renommée, compactée, etc. ✔ Facilite l'interopérabilité, c'est-à-dire la capacité d’échanger des données entre systèmes différents  Inconvénient Il est nécessaire de copier les métadonnées dans une base de données pour exploiter une grande collection de ressources numériques.
  • 20. Lire les métadonnées internes des images ● Pas besoin d'outils onéreux ou compliqués ● Sur le Web, il n'est même pas nécessaire de télécharger l'image, utiliser Jeffrey's Exif Viewer http://regex.info/exif.cgi Exemple sur une image de Wikimedia Commons http://commons.wikimedia.org/wiki/File:Statue_Berthold-Brecht-Platz_(Mitte)_Berthold_Brecht.jpg
  • 21. Image analysée Vignette intégrée Métadonnées textuelles Coordonnées GPS http://regex.info/exif.cgi appliqué sur l'image
  • 22. Une métadonnée n'est pas obligatoirement textuelle Vignette Métadonnées textuelles intégrée Image analysée Une vignette intégrée peut (parfois) fournir beaucoup d'informations. C'est une métadonnée...
  • 23. Éditeurs de métadonnées IPTC/IIM et XMP http://www.iptc.org/cms/site/photometadatasupportlist.html etc.
  • 25. Ce que les métadonnées ne sont pas.... ● Contrôle des usages et droits, DRM [Digital Rights Management] ● Tatouage invisible [watermarking] ● Stéganographie: dissimuler un message dans un autre message (en particulier une image numérique) ● Digital forensics: analyse technique des retouches, examen de l'authenticité ["diplomatique numérique"]
  • 27. Métadonnées et images – EXIF  EXIF est une abréviation de EXchangeable Image File. Ce format définit les informations d'ordre technique contenues dans les fichiers des images. Ce sont donc des métadonnées de type interne.  Le format EXIF a été développé en octobre 1995 par le JEIDA (Japan Electronic Industry Development Association). La version 2.0 date de novembre 1997, la révision 2.1 de juin 1998 et la révision 2.2 d'avril 2002.  Ce n'est pas un standard, mais il est supporté par tous les fabricants d'APN (avec des variantes propriétaires)  Les informations EXIF concernent les paramètres de prise de vue et les réglages de l'appareil au moment de la capture numérique : ✔ fabricant et modèle de l'appareil ✔ hauteur et largeur de l'image ✔ date et heure de la prise de vue ✔ orientation ✔ résolution, temps d'exposition, ouverture ✔ présence d'un flash ✔ coordonnées GPS sur certains appareils hauts de gamme récents ✔ etc. [30 éléments environ]
  • 28. Géolocalisation des images ? Très simple... Opérations documentaires équivalentes ? localisation  adresse postale Le Mont-Saint-Michel, 50116, Manche, France  latitude / longitude 48° 38' 10'' N, 1° 30' 41'' W geotags
  • 29. Géolocalisation des images ? Pas si simple... Crédit El Guanche sur Flickr Licence Creative Commons Le Mont-Saint-Michel et le rocher de Tombelaine vus d'avion  Pour exprimer en geotags cette localisation: ✔ Distinguer entre localisation du sujet et localisation de la prise de vue ✔ Utiliser d'autres geotags également indispensables: altitude et direction
  • 30. Géolocalisation des images ? Pas si simple... Crédit mafleen sur Flickr Licence Creative Commons La tour de Tokyo (35° 41' N, 139° 46' E) et le mont Fuji (35° 21' 29" N, 138° 43' 52" E) Sujet : descriptions multiples Avant-plan et arrière-plan sont distants de 100 km environ
  • 32. Métadonnées et images – IPTC/IIM  L'IPTC (International Press and Telecommunications Council) est une organisation internationale qui développe des standards d'échange de données pour la presse  L'IPTC et la NAA (Newspaper Association of America) ont créé en 1991 le modèle global de données appelé Information Interchange Model [IIM]  Sous-ensemble de l'IIM utilisé par Adobe dès 1994 pour définir dans Photoshop les informations associées à une image  C'est ce sous-ensemble composé de 33 champs qui est communément appelé métadonnées IPTC
  • 33. Métadonnées et images – IPTC/IIM  Métadonnées IPTC = ensemble de champs textuels (Titre, Légende, Mots-clés, Copyright, etc.) stockés dans le fichier image  Chaque champ est identifié par un numéro et un nom normalisé (en anglais)  Très utilisé dans la presse et l'édition
  • 34. Métadonnées et images – IPTC/IIM  Privilégier un ensemble restreint de champs gérés par la plupart des programmes d'édition IPTC. Par exemple: ✔ n° 25, Keywords (Mots-clés) champ répétable ✔ 55, Date Created (Date de création) ✔ 80, By-line (Auteur) ✔ 90, City (Ville) ✔ 101, Country/Primary Location Name (Pays) ✔ 105, Headline (Titre) ✔ 120, Caption/Abstract (Description/Légende) le plus long champ du standard (2000 caractères maximum)  Respecter le standard en ce qui concerne la répétabilité et la longueur maximale des champs
  • 35. Métadonnées et images – IPTC/IIM et Exif Modifiable IPTC/IIM : métadonnées ayant trait à la par définition sémantique de l'image et nécessitant l'intervention d'un opérateur humain pour être renseignées EXIF : métadonnées techniques relatives à la prise de vue et fournies automatiquement par un appareil numérique Éviter de modifier
  • 36. Pratique des métadonnées IPTC/IIM L'exemple des photos d'agence Deux grandes catégories  Photos d'actualités Editorial, News ✔ titre, description/légende, (parfois mots-clés)  Photos d'illustration Creative, Illustration, Documentaire, Stock en général atemporelles ✔ mots-clés, (parfois légendes)  Les historiques sont traitées comme l'éditorial
  • 37. Photo d'actualité ou photo historique Champs IPTC légende (Caption/Abstract n° 120) mots-clés (Keywords n° 25)
  • 40. Attention à l'indexation! surindexation
  • 41. Attention à l'indexation! Indexation à l'aide de vocabulaires contrôlés générant des termes associés inappropriés
  • 43. Dublin Core Metadata Initiative  Le Dublin Core est un ensemble de 15 éléments de métadonnées ayant trait : ✔ au Contenu Title, Description, Subject, Source, Coverage, Type, Relation Creator et non pas Author ✔ à la Propriété intellectuelle Creator, Contributor, Publisher, Rights ✔ à la Version Date, Format, Identifier, Language DC définit un vocabulaire de métadonnées commun à plusieurs communautés
  • 44. Dublin Core Metadata Initiative  Le Dublin Core ne prétend pas répondre aux besoins et à la complexité de tous les métiers  Le Dublin Core est un ensemble simple et très utilisé de métadonnées, mais il n'est pas suffisant  Dans la plupart des besoins professionnels, il doit être complété par d'autres schémas de métadonnées  Le Dublin Core est une norme ISO (n° 15836)  Pour en savoir plus: www.dublincore.org
  • 45. XMP – Extensible Metadata Platform  Créé par Adobe en septembre 2001  Pas réservé aux images. Le format PDF par exemple supporte XMP  Utilise une version simplifiée de RDF (Resource Description Framework) ● Développé par le W3C, base du Web sémantique ● Permet d'encoder, échanger et réutiliser des métadonnées structurées ● Peut s'exprimer en XML (sérialisation)  Utilise le schéma Dublin Core comme fondation (préfixe de l'espace de noms XML: dc:)  XMP est un standard ISO depuis mars 2012 ● ISO 16684-1:2012, Graphic technology – Extensible metadata platform (XMP) specification – Part 1: Data model, serialization and core properties
  • 46. XMP – Extensible Metadata Platform Les espaces de noms XMP sont des conteneurs Source: Fotoware
  • 47. XMP – Extensible Metadata Platform Les champs appartiennent à un espace de noms Source: Fotoware
  • 48. XMP – Extensible Metadata Platform Les espaces de noms permettent d'éviter les collisions Source: Fotoware
  • 49. Panneaux standards sur Photoshop [ancienne version (CS) ; semblable sur les versions plus récentes]
  • 50. Organisation des métadonnées par espaces de noms: Dublin Core (préfixe dc) Photoshop (héritage IPTC/IIM) etc. Le panneau Avancé
  • 51. Bien connaître vos outils dans les workflows complexes Ne pas utiliser des outils non XMP après avoir travaillé avec des outils XMP IPTC n°120: Chatons IPTC n°120: Deux chatons IPTC n°120: Deux chatons XMP dc:description: Chatons XMP dc:description: Chatons XMP dc:description: Chatons Indexation avec un outil XMP Modification à l'aide d'un outil Retour à un outil XMP uniquement IPTC/IIM (non XMP)
  • 52. Perspectives ouvertes par XMP En quoi XMP est-il plus performant que l'IIM ? IPTC/IIM XMP Binaire (non facilement lisible) Lisible (XML) Statique Extensible et évolutif Extensibilité non documentée Extensibilité documentée (champs non standards) (Namespaces) Pas de types de données Types de données et types structurés Problèmes d'accents Pas de problèmes d'accents (codage Unicode) Inadapté aux légendes Adapté aux légendes multilingues multilingues
  • 53. La transition du standard IPTC/IIM vers XMP IPTC Photo Metadata  IPTC Photo Metadata est une initiative de l'IPTC qui regroupe deux schémas XMP : IPTC Core et IPTC Extension  But définir des éléments de métadonnées dans le but de proposer une correspondance non ambiguë et une transition en douceur depuis les métadonnées IPTC/IIM (dit legacy) vers une technologie XMP
  • 54. La transition du standard IPTC/IIM vers XMP IPTC Photo Metadata  IPTC Core reprend sous forme XMP la plupart des métadonnées de l'IIM (mais pas toutes). Son préfixe d'espace de noms est iptc4xmp ✔ IIM Contact n'est pas repris tel quel  IPTC Core comporte aussi des métadonnées supplémentaires par rapport à l'IIM : ✔ Structure Contact : nom, adresse, téléphone, etc. ✔ Localisation (seuls Pays, Code Pays, Ville existent en IIM) ✔ NewsCodes : sujet, scène, genre
  • 55. La transition du standard IPTC/IIM vers XMP IPTC Photo Metadata IPTC Extension 1.1  Distingue entre la Localisation de la prise de vue et la Localisation du sujet photographié  Gestion des droits : Copyright Owner, Copyright Owner Name, etc.  Informations concernant le modèle photographié : Model Age, Minor Model Age Disclosure, etc.  Informations concernant la propriété des "contenus" photographiés  Informations concernant l'œuvre ou l'objet figurant sur l'image : Artwork or Object in the Image
  • 56. Extensibilité XMP  Exemple avec Photoshop  Ajouter des panneaux (Custom panels) pour afficher et/ou modifier les métadonnées Astronomy Visualization Metadata Standard  Observer le panneau Avancé
  • 57. Panneaux standards sur Photoshop [version CS ; semblable sur les versions plus récentes]
  • 59. Le panneau Avancé. Détail des informations dans l'espace de nom avm
  • 60. Extensibilité. Ajout de panneaux personnalisés [Custom panels]. Liste des panneaux.
  • 61. Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Creator.
  • 62. Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Content.
  • 63. Pratique des métadonnées internes des images numériques  Ne pas modifier les métadonnées Exif, à l'exception des coordonnées GPS et parfois de la date de prise de vue (si l'appareil était mal réglé)  Utiliser toujours des standards éprouvés: Dublin Core, IPTC/IIM et équivalent en XMP  Ne pas être top "ambitieux", se contenter d'un jeu de métadonnées cruciales et que l'on maîtrise  Se conformer aux pratiques documentaires habituelles et éviter la surindexation  Si vous utilisez IPTC/IIM, maintenir la cohérence avec les équivalents XMP  N'utiliser l'extensibilité XMP que s'il existe un schéma documenté et soutenu par une organisation reconnue
  • 64. Pour en savoir plus Métadonnées: une initiation peccatte.karefil.com/software/Metadata.htm Le site de l'IPTC www.iptc.org Adobe Extensible Metadata Platform (XMP) www.adobe.com/products/xmp/main.html Controlled Vocabulary www.controlledvocabulary.com
  • 65. La légende ne deviendra-t-elle pas l’élément essentiel du cliché ? Walter Benjamin Petite histoire de la photographie (1931)