Journée d’étude et atelier expérimental
         Ouverture et réutilisation des données
                « Open Data culturel »
      École supérieure d’art d’Aix-en-Provence – 19 & 20 avril 2012




                 Objets informationnels
                   et objets culturels
                                                                     Patrick Peccatte
                                                                     Chercheur associé au
                                              Laboratoire d'histoire visuelle contemporaine
                                                                             (Lhivic/EHESS)

                                                                 peccatte@softexperience.com
                                                                           Twitter: @ppeccatte
                                                                    Facebook: patrick.peccatte
                                                                     Google+: Patrick Peccatte
                                                   Flickr: patrickpeccatte et photosnormandie
http://culturevisuelle.org/dejavu                          Tumblr: dubruitausignal.tumblr.com
Ouverture et réutilisation des données
    (programme et résumés des présentations)
Données, etc.
            (selon les résumés des présentations)


    Base de données (di Filippi)

    Contenus, contenus numériques (Bermès, Domange)

    Document (Peccatte, Simon)

 Données, data, données ouvertes, open data
(Aillagon, Artin, Bermès, di Filippi, Labelle & Holken,
Nepote, Simon Vernet)

    Information (Artin, Domange, Peccatte)

 Rédactionnels, monographies, œuvres d'art,
photographies, témoignages (Bekkers)

 Ressources, ressources numériques
(Aillagon, Bermès, Simon)
Actions sur les données ?
                (selon les résumés des présentations)

    Accès (Domange)

    Appropriation (Aillagon)

    Consommation (Aillagon)

    Diffusion (Aillagon, Bermès, di Filippi)

    Exploitation (Simon)

    Exposition (Simon)

    Indexation (Peccatte)

    Mashup (Artin)

    Mise à disposition (Domange)

    Navigation (Bermès)

    Ouverture (Intro, Simon, Vernet)

    Partage (Bekkers)

    Réutilisation (Intro, di Filippi, Simon)

    Restitution (Artin, Bekkers)

    Usage (Aillagon, Vernet)

    Valorisation (Aillagon)
Opérations informatiques majeures

    Stockage

    Recherche, accès

    (et quelques autres...)


                     Types de données

    Textes

    Nombres et visualisations de nombres

    Sons

    Images fixes

    Images animées

    Structures (tables, triplets, etc.)
Deux notions importantes à ajouter



    Programmation
         ✔
             implicite car les données dont nous parlons
             sont numériques

    Métadonnées (≈ description des données)
         ✔
             implicite car les métadonnées sont des
             données
Le projet "Digital Public Library of America"




 Les données sont documentarisées à travers les métadonnées ?
Recherche de texte
    Une phrase énigmatique




« Tap da sac'h 'ta, breur kozh »
             ???
Recherche de texte
      « Tap da sac'h 'ta, breur kozh »




Prends donc ton sac, vieux frère
Poème de Youenn Gwernig (en breton)
Recherche d'une partie d'image




D'où vient ce lolcat ?
Recherche d'une partie d'image


D'où vient ce lolcat ?
Jérôme Bosch, Le Jardin des délices, 1504
Reconnaissance de musique




Des logiciels grand public comme Shazam ou SoundHound
          permettent de reconnaître des mélodies
Culture et mémorisation

La culture ne peut plus être considérée comme une
accumulation passive de connaissances diverses
La reconnaissance des œuvres peut être efficacement
simulée par des algorithmes
Thèse faible
        ✔
            Ces applications Internet ne constituent qu'une
            extension de notre mémoire
Thèse forte
        ✔
            Notre rapport au savoir et à la culture est profondément
            modifié par les nouvelles possibilités informationnelles
"Penser en objets" - Background


Philosophie
      ✔
          Ontologie (plutôt analytique...)
      ✔
          Philosophie de l'information (Luciano Floridi)
Informatique
      ✔
          Représentation des connaissances [ontologies]
      ✔
          Programmation par objets
Une ontologie rudimentaire

Entités naturelles (Soleil, Lune)
Êtres physiques (hommes, animaux)
Êtres sociaux
Événements (naturels, historiographiques, etc.)
Artefacts (fabriqués par l'homme)
       ✔
           Objets techniques
       ✔
           Objets culturels, matériels ou immatériels
                ✗
                 Objets artistiques (peinture, musique, etc.)
       ✔
           Objets informationnels
L'information – un concept très complexe
théories de l'information (plusieurs)
information sémantique
information physique
information biologique
information économique
SIC: Sciences de l'information et de la communication
etc.


Informatique :
traitement des données, traitement de l'information
Théories de l'information



Théorie de Shannon (1948)
Théorie algorithmique de l'information
     ✔
         Solomonov, Kolmogorov (années 1960)
     ✔
         Chaitin
     ✔
         etc.
Théorie algorithmique de l'information
                      (grosso modo...)


Évaluation de la complexité d'une suite de signes S
≈ quantité d'information
Une suite de signes est toujours le résultat de l'exécution
d'au moins un programme
        ✔
            À la recherche du temps perdu
        ✔
            print "Longtemps, je me suis couché de bonne
            heure, etc."
La quantité d'information d'une suite S est la longueur du
plus court programme qui engendre S
Conception sémantique de l'information



Donnée = défaut d'uniformité représentable à
l'aide de symboles


Information = Données + Interprétation
Objet computationnel et Objet informationnel

Objet computationnel (informatique)
    ✔
        collection de données numériques (informatiques)
        brutes formant un tout
Objet informationnel
    ✔
        collection structurée d'informations
        (pas obligatoirement numériques) formant un tout
    ✔
        un objet informationnel numérique est un objet
        informatique
        (mais l'inverse n'est pas toujours vrai)
Un objet computationnel est une instance de classe




     Old cars all in a neat row, by deflam, Creative Commons
        http://www.flickr.com/photos/freeparking/502609973/
Méréologie
 Petite typologie des objets informationnels

objet informationnel = collection structurée d'informations formant un tout
auquel on accède à travers une ou plusieurs de ses parties

objet informationnel [o. i.]
     ► o.i. immatériel
             ► o.i. numérique
                     ► o.i. numérique du Web
                             ► o.i. numérique du Web recherchable
                                     ► o.i. numérique du Web recherchable
                                     par une ou plusieurs de ses parties

      Aspect méréologique des objets informationnels numériques
    (la méréologie est l'étude des relations entre la partie et le tout)
La hiérarchisation des objets
         informationnels sur le Web
                      ressource
                      ressource
                      ressource
                      ressource
                      ressource
                      ressource
                      ressource




Liste de ressources dont on ne consulte que le haut.
         vue sur Google ≈ rasoir d'Occam
Représentation des textes - codage Unicode




Important et "invisible": Unicode Collation Algorithm (UCA) algorithme
  définissant un ordre normalisé pour le tri, la reconnaissance et la
                           recherche de texte
Représentation des sons et des images –
        empreintes (fingerprints)


Une empreinte acoustique d'un son (ou une empreinte
visuelle d'une image) est une représentation simplifiée
d'un signal audio (ou vidéo)
Conception unifiée mettant en œuvre des méthodes
d'accès aux objets à partir de fragments
Méthodes d'accès

Algorithmes
  ✔
      sur des classements, des hiérarchisations et valorisations
  ✔
      sur des représentations textuelles directes (codages) ou
      indirectes (contextes de publication, métadonnées)
               
                   mais en fait, nommer ou décrire, c'est déjà classer
  ✔
      sur des représentations d'objets ou de fragments d'objets
      (empreintes)


Accès aux objets
  ≈ détermination des parties communes
Puissance (et limite) du calcul
          "Calculabilité externe"


Les objets informationnels numériques sont
construits pour être ordonnés, recherchés et
retrouvés, comparés et reliés entre eux
Les recherches d'informations quelconques peuvent
alors s'effectuer "mécaniquement"
Puissance (et limite) du calcul
       "Calculabilité interne"




Exemple Computable Document Format de Wolfram
Le document devient objet informationnel

Document                      Objet informationnel

Indexation,                   Méthodes d'accès
métadonnées

Statique                      Calculé, dynamique

Localisé                      Non localisé


 Ce n'est pas seulement la mémoire humaine qui est
                impactée par le Web.
     C'est notre conception même de la culture.
Objection 1 : Ce n'est que du calcul

Réponses
La théorie algorithmique de l'information lie les
concepts d'information et de programme
Les propositions pour lesquelles il existe une
démonstration [un algorithme] constituent une classe
bien particulière
Il est remarquable que l'on puisse répondre à une
question en mettant en œuvre un algorithme sur un
corpus de données
Objection 2: Les humains ne fonctionnent pas ainsi

Grief semblable formulé à l'encontre du programme de l'Intelligence
Artificielle dans les années 60




    Big Mouth by angel_shark, (Flickr, Creative Commons) / Cyana by Ifremer, (Wikimedia Commons)

 « Se demander si un ordinateur peut penser n'a pas plus d'intérêt
 que de se demander si un sous-marin peut nager. » Edsger Dijkstra
Émergence ?
Apparition de nouvelles informations qui s'agglomèrent
aux objets informationnels sur le Web, provoquée par:
    ✔
        l'interconnexion de ressources diverses
    ✔
      l'ouverture aux ressources dans des langues
    inconnues auparavant inaccessibles
    ✔
        l'insertion dans des flux informationnels
    ✔
     la sérendipité (capacité de découvrir quelque chose
    sans l'avoir cherché)
L'émergence en ontologie: apparition de nouvelles
propriétés des objets au delà d'une certaine complexité
Émergence et cultures


Émergence d'applications et d'usages nouveaux lors de
l'ouverture des données
Cultures: organisations selon des propriétés
émergentes de la masse informationnelle rendue
intelligible par des méthodes d'accès diverses
Une multiplicité de cultures émergent et remplacent
une culture classique normative
Vers une "pluralité et une relativité" des ontologies
culturelles (?)

Objets informationnels et objets culturels - Open Data, Aix-en-Provence, 19 avril 2012

  • 1.
    Journée d’étude etatelier expérimental Ouverture et réutilisation des données « Open Data culturel » École supérieure d’art d’Aix-en-Provence – 19 & 20 avril 2012 Objets informationnels et objets culturels Patrick Peccatte Chercheur associé au Laboratoire d'histoire visuelle contemporaine (Lhivic/EHESS) peccatte@softexperience.com Twitter: @ppeccatte Facebook: patrick.peccatte Google+: Patrick Peccatte Flickr: patrickpeccatte et photosnormandie http://culturevisuelle.org/dejavu Tumblr: dubruitausignal.tumblr.com
  • 2.
    Ouverture et réutilisationdes données (programme et résumés des présentations)
  • 3.
    Données, etc. (selon les résumés des présentations)  Base de données (di Filippi)  Contenus, contenus numériques (Bermès, Domange)  Document (Peccatte, Simon)  Données, data, données ouvertes, open data (Aillagon, Artin, Bermès, di Filippi, Labelle & Holken, Nepote, Simon Vernet)  Information (Artin, Domange, Peccatte)  Rédactionnels, monographies, œuvres d'art, photographies, témoignages (Bekkers)  Ressources, ressources numériques (Aillagon, Bermès, Simon)
  • 4.
    Actions sur lesdonnées ? (selon les résumés des présentations)  Accès (Domange)  Appropriation (Aillagon)  Consommation (Aillagon)  Diffusion (Aillagon, Bermès, di Filippi)  Exploitation (Simon)  Exposition (Simon)  Indexation (Peccatte)  Mashup (Artin)  Mise à disposition (Domange)  Navigation (Bermès)  Ouverture (Intro, Simon, Vernet)  Partage (Bekkers)  Réutilisation (Intro, di Filippi, Simon)  Restitution (Artin, Bekkers)  Usage (Aillagon, Vernet)  Valorisation (Aillagon)
  • 5.
    Opérations informatiques majeures  Stockage  Recherche, accès  (et quelques autres...) Types de données  Textes  Nombres et visualisations de nombres  Sons  Images fixes  Images animées  Structures (tables, triplets, etc.)
  • 6.
    Deux notions importantesà ajouter  Programmation ✔ implicite car les données dont nous parlons sont numériques  Métadonnées (≈ description des données) ✔ implicite car les métadonnées sont des données
  • 7.
    Le projet "DigitalPublic Library of America" Les données sont documentarisées à travers les métadonnées ?
  • 8.
    Recherche de texte Une phrase énigmatique « Tap da sac'h 'ta, breur kozh » ???
  • 9.
    Recherche de texte « Tap da sac'h 'ta, breur kozh » Prends donc ton sac, vieux frère Poème de Youenn Gwernig (en breton)
  • 10.
    Recherche d'une partied'image D'où vient ce lolcat ?
  • 11.
    Recherche d'une partied'image D'où vient ce lolcat ?
  • 12.
    Jérôme Bosch, LeJardin des délices, 1504
  • 13.
    Reconnaissance de musique Deslogiciels grand public comme Shazam ou SoundHound permettent de reconnaître des mélodies
  • 14.
    Culture et mémorisation Laculture ne peut plus être considérée comme une accumulation passive de connaissances diverses La reconnaissance des œuvres peut être efficacement simulée par des algorithmes Thèse faible ✔ Ces applications Internet ne constituent qu'une extension de notre mémoire Thèse forte ✔ Notre rapport au savoir et à la culture est profondément modifié par les nouvelles possibilités informationnelles
  • 15.
    "Penser en objets"- Background Philosophie ✔ Ontologie (plutôt analytique...) ✔ Philosophie de l'information (Luciano Floridi) Informatique ✔ Représentation des connaissances [ontologies] ✔ Programmation par objets
  • 16.
    Une ontologie rudimentaire Entitésnaturelles (Soleil, Lune) Êtres physiques (hommes, animaux) Êtres sociaux Événements (naturels, historiographiques, etc.) Artefacts (fabriqués par l'homme) ✔ Objets techniques ✔ Objets culturels, matériels ou immatériels ✗ Objets artistiques (peinture, musique, etc.) ✔ Objets informationnels
  • 17.
    L'information – unconcept très complexe théories de l'information (plusieurs) information sémantique information physique information biologique information économique SIC: Sciences de l'information et de la communication etc. Informatique : traitement des données, traitement de l'information
  • 18.
    Théories de l'information Théoriede Shannon (1948) Théorie algorithmique de l'information ✔ Solomonov, Kolmogorov (années 1960) ✔ Chaitin ✔ etc.
  • 19.
    Théorie algorithmique del'information (grosso modo...) Évaluation de la complexité d'une suite de signes S ≈ quantité d'information Une suite de signes est toujours le résultat de l'exécution d'au moins un programme ✔ À la recherche du temps perdu ✔ print "Longtemps, je me suis couché de bonne heure, etc." La quantité d'information d'une suite S est la longueur du plus court programme qui engendre S
  • 20.
    Conception sémantique del'information Donnée = défaut d'uniformité représentable à l'aide de symboles Information = Données + Interprétation
  • 21.
    Objet computationnel etObjet informationnel Objet computationnel (informatique) ✔ collection de données numériques (informatiques) brutes formant un tout Objet informationnel ✔ collection structurée d'informations (pas obligatoirement numériques) formant un tout ✔ un objet informationnel numérique est un objet informatique (mais l'inverse n'est pas toujours vrai)
  • 22.
    Un objet computationnelest une instance de classe Old cars all in a neat row, by deflam, Creative Commons http://www.flickr.com/photos/freeparking/502609973/
  • 23.
    Méréologie Petite typologiedes objets informationnels objet informationnel = collection structurée d'informations formant un tout auquel on accède à travers une ou plusieurs de ses parties objet informationnel [o. i.] ► o.i. immatériel ► o.i. numérique ► o.i. numérique du Web ► o.i. numérique du Web recherchable ► o.i. numérique du Web recherchable par une ou plusieurs de ses parties Aspect méréologique des objets informationnels numériques (la méréologie est l'étude des relations entre la partie et le tout)
  • 24.
    La hiérarchisation desobjets informationnels sur le Web ressource ressource ressource ressource ressource ressource ressource Liste de ressources dont on ne consulte que le haut. vue sur Google ≈ rasoir d'Occam
  • 25.
    Représentation des textes- codage Unicode Important et "invisible": Unicode Collation Algorithm (UCA) algorithme définissant un ordre normalisé pour le tri, la reconnaissance et la recherche de texte
  • 26.
    Représentation des sonset des images – empreintes (fingerprints) Une empreinte acoustique d'un son (ou une empreinte visuelle d'une image) est une représentation simplifiée d'un signal audio (ou vidéo) Conception unifiée mettant en œuvre des méthodes d'accès aux objets à partir de fragments
  • 27.
    Méthodes d'accès Algorithmes ✔ sur des classements, des hiérarchisations et valorisations ✔ sur des représentations textuelles directes (codages) ou indirectes (contextes de publication, métadonnées)  mais en fait, nommer ou décrire, c'est déjà classer ✔ sur des représentations d'objets ou de fragments d'objets (empreintes) Accès aux objets ≈ détermination des parties communes
  • 28.
    Puissance (et limite)du calcul "Calculabilité externe" Les objets informationnels numériques sont construits pour être ordonnés, recherchés et retrouvés, comparés et reliés entre eux Les recherches d'informations quelconques peuvent alors s'effectuer "mécaniquement"
  • 29.
    Puissance (et limite)du calcul "Calculabilité interne" Exemple Computable Document Format de Wolfram
  • 30.
    Le document devientobjet informationnel Document Objet informationnel Indexation, Méthodes d'accès métadonnées Statique Calculé, dynamique Localisé Non localisé Ce n'est pas seulement la mémoire humaine qui est impactée par le Web. C'est notre conception même de la culture.
  • 31.
    Objection 1 :Ce n'est que du calcul Réponses La théorie algorithmique de l'information lie les concepts d'information et de programme Les propositions pour lesquelles il existe une démonstration [un algorithme] constituent une classe bien particulière Il est remarquable que l'on puisse répondre à une question en mettant en œuvre un algorithme sur un corpus de données
  • 32.
    Objection 2: Leshumains ne fonctionnent pas ainsi Grief semblable formulé à l'encontre du programme de l'Intelligence Artificielle dans les années 60 Big Mouth by angel_shark, (Flickr, Creative Commons) / Cyana by Ifremer, (Wikimedia Commons) « Se demander si un ordinateur peut penser n'a pas plus d'intérêt que de se demander si un sous-marin peut nager. » Edsger Dijkstra
  • 33.
    Émergence ? Apparition denouvelles informations qui s'agglomèrent aux objets informationnels sur le Web, provoquée par: ✔ l'interconnexion de ressources diverses ✔ l'ouverture aux ressources dans des langues inconnues auparavant inaccessibles ✔ l'insertion dans des flux informationnels ✔ la sérendipité (capacité de découvrir quelque chose sans l'avoir cherché) L'émergence en ontologie: apparition de nouvelles propriétés des objets au delà d'une certaine complexité
  • 34.
    Émergence et cultures Émergenced'applications et d'usages nouveaux lors de l'ouverture des données Cultures: organisations selon des propriétés émergentes de la masse informationnelle rendue intelligible par des méthodes d'accès diverses Une multiplicité de cultures émergent et remplacent une culture classique normative Vers une "pluralité et une relativité" des ontologies culturelles (?)