SlideShare une entreprise Scribd logo
1  sur  121
Télécharger pour lire hors ligne
Le document numérique

Produire et décrire le document numérique : les identifiants
Le document numérique


»   Nature et structure du document numérique
      La notion de document : d’une définition formelle à une approche par écosystème
      Les types de fichiers : Les formats textes, les formats images, les formats multimédia
      La granularité du document, structuration et déstructuration
»   Produire et décrire le document numérique
      Le cas de la numérisation
      Le cas des de ePub
      Les identifiants
»   Les métadonnées
      Les métadonnées pour la recherche
         • Le cas des catalogues
         • Le cas des moteurs
         • Approche sémantique
      Les métadonnées comme point d’accès
         • Accès centralisés (catalogue et/ou moteur)
         • Accès distribués fermés et ouverts (OAI, RSS et OPDS)
         • L’interopérabilité sémantique
         • Les nouvelles métadonnées (folksonomies)
         • Multiplier les accès et multiplier les documents
»   Les enjeux des accès et de la médiation:
      Maitrise de la chaîne et des formats
      Longue traine et économie de l’attention
      Appréhender la collection numérique : le cas des bibliothèques
      La médiation autour des documents numériques


2                                                                                        Luc Bellier 2013
Le document numérique




»   Les métadonnées : Les métadonnées pour la recherche :
      Catalogues,
      Moteurs
      Approche sémantique




3                                                           Luc Bellier 2013
Les métadonnées
    »   Les métadonnées pour la recherche : les catalogues




4                                                                                            Luc Bellier 2013
                                                             http://www.flickr.com/photos/ajpresto714/761178431/
Les métadonnées
    »   Les métadonnées pour la recherche : les catalogues




»       Fonctionnement binaire et linéaire :
          critère recherché présent : oui / non
          listes d’entrées d’index
»       Recherches uniques, avec liste de résultat unique
»       Recherche dans les « métadonnées »
»       « Web invisible » / web visible




5                                                            Luc Bellier 2013
Les métadonnées
    »   Les métadonnées pour la recherche : les moteurs




6                                                         Luc Bellier 2013
Les métadonnées
    »   Les métadonnées pour la recherche : les moteurs




7                                                         Luc Bellier 2013
Les métadonnées
    »   Les métadonnées pour la recherche : les moteurs




8                                                         Luc Bellier 2013
Les métadonnées
    »   Les métadonnées pour la recherche : les moteurs




Recherche
                                                                      Réponse
Critère 1     Critère 2    Critère 3    Critère 4         Critère …




9                                                                     Luc Bellier 2013
Les métadonnées
 »   Les métadonnées pour la recherche : les moteurs




»    Si le nombre de résultats ne correspond pas au nombre de documents (pages
     web), à quoi correspond-il ?
»    Réponse: au nombre des entrées d’index




10                                                                     Luc Bellier 2013
Les métadonnées
 »   Les métadonnées pour la recherche : les moteurs




11                                                     Luc Bellier 2013
Les métadonnées
 »   Les métadonnées pour la recherche : les moteurs



»    Les documents du web et ce
     que peut voir un moteur de
     recherche :


»    Mise en forme
»    Texte et autres caractères
     internes


»    Le document devient sa
     propre description




12                                                     Luc Bellier 2013
Titre                     Adresse

                             Zone de texte : titre gras



     Liens générés automatiquement
       Liste à puces avec liens



                                                     Image



                     Formulaire de saisie




13                                                           Luc Bellier 2013
»    Que peut voir un moteur de recherche dans une bibliothèque numérique ?




14                                                                      Luc Bellier 2013
Les métadonnées
 »   Les métadonnées pour la recherche : les moteurs

»    Recherche en texte intégral
»    Recherche statistique ou associative
       fréquence du mot à l’intérieur du document
       rareté du mot dans la collection
       longueur du mot trouvé par rapport à la longueur du champ
»    Recherche linguistique
       exploitation du vocabulaire et de la grammaire
       lemmatisation de l’index
       catégorisation des mots-outils
       extraction d’entités nommées
»    Recherche sémantique : exploitation d’un modèle de connaissance ou référentiel
       extraction terminologique (couplée à l'analyse sémantique)
       détection du contexte global du document
       classification automatique des mots du texte
       expansion de requête
       navigation dans un thésaurus de haut niveau
       calcul des relations entre thèmes (lexicométrie)
       filtrage des thèmes en fonction de leur pertinence
15                                                                        Luc Bellier 2013
Les métadonnées
»    Les métadonnées pour la recherche : approche sémantique



»    Le principe des moteurs sémantiques
»    Intégration de chaque mot significatif dans une chaîne d’équivalents sémantiques
       Par exemple, une recherche sur le mot « élection » retrouvera les documents
         contenant les mots « voix », « urne » et « vote », même si le mot « élection »
         ne se trouve pas explicitement dans le texte.
»    Cartographie et extraction de connaissances
       Proposition d’une liste de critères pertinents qui ont émergé des documents, ce
        qui évite d’avoir à affiner la recherche par une « chaîne de caractères »
       Recherche par similarité avec un texte existant (qui sera analysé et dont tous
        les mots significatifs seront utilisés comme critères de recherche).
»    Désambiguisation des requêtes / Multilinguisme
       Par exemple : avocat (juriste) / avocat (plante)
       Par exemple : pain (fr : aliment) / pain (en : douleur)



16                                                                           Luc Bellier 2013
Les métadonnées
»    Les métadonnées pour la recherche




17                                       Luc Bellier 2013
Les métadonnées
»    Les métadonnées pour la recherche




18                                       Luc Bellier 2013
Les métadonnées
 »   Les métadonnées pour la recherche




19                                       Luc Bellier 2013
Les métadonnées
 »   Les métadonnées pour la recherche




20                                       Luc Bellier 2013
Les métadonnées
 »   Les métadonnées pour la recherche : approche sémantique



       Modèle de l’arbre

                                                                      Catalogue




         Notice : Les Misérables                                      Notice : Victor Hugo           Notice : portrait de V. Hugo

                                                     Lien explicite


                                   Titre                                                                              titre
                                                                                    dates

                                   Auteur : Victor                                                                    auteur
                                   Hugo                                             bio
                                                                                             Lien implicite


                                                                                                                      Sujet :
                                   Corpus : littérature                             …                                 Victor
                                   française                                                                          Hugo

                                   Ressource (doc.                                                                    Ressource
                                   numérisé)                                                                          (doc.
                                                                                                                      numérisé)



21                                                                                                                                  Luc Bellier 2013
Les métadonnées
»     Les métadonnées pour la recherche : approche sémantique


     BUT : Lier et interroger des données dispersées
     sur le Web avec les technologies du Web
     sémantique
»     Utiliser des identifiants
      accessibles via les protocoles du
      web (http)
»     Donner l’accès aux données
      utiles en utilisant les standards
      SPARQL et RDF

             Principes du LOD
            par Tim Berners-Lee




22                                                              Luc Bellier 2013
Les métadonnées
»    Les métadonnées pour la recherche : approche sémantique




                      http://wimmics.inria.fr/projects/dbpedia/doc/index.php/Documentation#Processus_d.27extraction_des_donn.C3.A9es_de_Wikip.C3.A9dia


23                                                                                                                                                       Luc Bellier 2013
Le document numérique


»    Nature et structure du document numérique
       La notion de document : d’une définition formelle à une approche par écosystème
       Les types de fichiers : Les formats textes, les formats images, les formats multimédia
       La granularité du document, structuration et déstructuration
»    Produire et décrire le document numérique
       Le cas de la numérisation
       Le cas des de ePub
       Les identifiants
»    Les métadonnées
       Les métadonnées pour la recherche
          • Le cas des catalogues
          • Le cas des moteurs
          • Approche sémantique
       Les métadonnées comme point d’accès
          • Accès centralisés (catalogue et/ou moteur)
          • Accès distribués fermés et ouverts (OAI, RSS et OPDS)
          • L’interopérabilité sémantique
          • Les nouvelles métadonnées (folksonomies)
          • Multiplier les accès et multiplier les documents
»    Les enjeux des accès et de la médiation:
       Maitrise de la chaîne et des formats
       Longue traine et économie de l’attention
       Appréhender la collection numérique : le cas des bibliothèques
       La médiation autour des documents numériques


24                                                                                        Luc Bellier 2013
Les métadonnées




»    Les métadonnées comme point d’accès :
       Accès centralisés
       Accès distribués




25                                           Luc Bellier 2013
Les métadonnées comme point d’accès
»    L’accès centralisé : exemple de la presse sur Gallica



La presse dans Gallica :


» à raison d’un n° par jour

» pendant 50 ans ou plus

» une liste de plusieurs dizaines
     de milliers de n° disponibles !!!




26                                                           Luc Bellier 2013
Les métadonnées comme point d’accès
»    L’accès centralisé : exemple de la presse sur Gallica




27                                                           Luc Bellier 2013
Les métadonnées comme point d’accès
»    L’accès centralisé : exemple de la presse sur Gallica




28                                                           Luc Bellier 2013
Les métadonnées comme point d’accès
»    L’accès centralisé : Open content Alliance




29                                                Luc Bellier 2013
Les métadonnées comme point d’accès
     L’accès centralisé : Hati Trust




30                                     Luc Bellier 2013
Les métadonnées comme point d’accès
 L’accès centralisé : google Books Search




31                                          Luc Bellier 2013
Les métadonnées comme point d’accès
     L’accès distribué : les systèmes fermés




»      EBSCO
»      PROQUEST
»      JSTOR
»      CAIRN
»      Etc.




32                                             Luc Bellier 2013
Les métadonnées comme point d’accès
L’accès distribué : OAI Europeana




33                                    Luc Bellier 2013
Les métadonnées comme point d’accès
L’accès distribué : l’OAI de Gallica




34                                     Luc Bellier 2013
Les métadonnées comme point d’accès
L’accès distribué : l’OAI de Gallica




35                                     Luc Bellier 2013
Les métadonnées comme point d’accès
     »    Les accès distribués
         Protocole d’échanges de données


                                       http
                                                                Programme
                     Entrepôt          xml                      moissonneur
          Base A
                        A


                                       http
                    Entrepôt
         Base B        B
                                                xml               Index
                                                                                Requête
                                http
                                                                                utilisateur
                                          xml
                                                                www serveur
                   Entrepôt
         Base C       C                                                         Résultats




                                                      OAI-PMH


36                                                                            Luc Bellier 2013
Les métadonnées comme point d’accès
L’accès distribué : l’OAI



    Interopérabilité des données (OAI-PMH, Entrepôts OAI)
       Initiative OAI : Open Archive Initiative (1999)
          Objectif : améliorer le signalement des e-prints, des publications
             scientifiques et l’interopérabilité des bases d’archives ouvertes
          Moyen : création d’un protocole technique de diffusion et de collecte
             de métadonnées
       OAI-PMH : Protocol for Metadata Harvesting
       Intérêt dans le domaine culturel et patrimonial
    Collections partagées dans des architectures réparties
    Interrogation centralisée   Fournisseurs de données




                                  Fournisseurs de services

37                                                                          Luc Bellier 2013
Les métadonnées comme point d’accès
L’accès distribué : l’OAI
                                 serveur              serveur
                                 OAI                  OAI
                                                                         serveur
                                                                                                      serveur
                                                                         OAI
                                                     Library of                                       OAI
                 serveur          Syndicat
                 OAI                                 Congress          Universités de
                                  national de         363 notices                              Bibliothèques
     serveur                      l’édition                            Strasbourg
                                                                                               virtuelles
     OAI                              5546 notices                         435 notices
                       CNUM                                                                    humanistes
                    91 notices                                                                186 notices

      BIUM
        3970 notices

                                                     Base de données
                                                                                 site SICD
                                                                                 Strasbourg          site LOC
                                  Editeurs
                 site CNUM

                                                Consultation de ces
     site BIUM                                  documents sur les autres sites
                                                                                                  site BVH
                                                         serveur
                                                         OAI
38                                                                                              Luc Bellier 2013
Les métadonnées comme point d’accès
     »    Les accès distribués




»        Initiative OAI : Open Archive Initiative (1999)
           Objectif : améliorer le signalement des e-prints, des publications scientifiques et
              l’interopérabilité des bases d’archives ouvertes
           Moyen : création d’un protocole technique de diffusion et de collecte de
              métadonnées

»        OAI-PMH : Protocol for Metadata Harvesting
           (Protocole de l’OAI pour le « moissonnage » des métadonnées)
           Convention de Santa Fe, 1999
           Version 2, juin 2002

»        Intérêt dans le domaine culturel et patrimonial



39                                                                                 Luc Bellier 2013
Les métadonnées comme point d’accès
     »    Les accès distribués

          Le protocole OAI-PMH



Un protocole simple et ouvert qui


»        favorise l’interopérabilité et le signalement complémentaire des ressources
         culturelles
           sans duplication ni déchargement des documents numériques primaires

»        accroît la visibilité sur le web de l’offre documentaire
           en abattant certaines barrières du web invisible
           en rendant possible le signalement de ressources non accessibles aux moteurs
            de recherche




40                                                                            Luc Bellier 2013
Les métadonnées comme point d’accès
     »    Les accès distribués

 Le protocole OAI-PMH
Un protocole simple et ouvert qui


»        permet une gestion simple et automatisable des mises à jour par le fournisseur de
         service
           mécanisme asynchrone
           prévoit l’actualisation des liens, en répercutant les dernières modifications des
            réservoirs sources, sans copier à nouveau l’intégralité des données (la charge
            n’en étant que plus légère pour les serveurs)


»        s’appuie sur un format de description générique (Dublin Core simple) pour les
         besoins transdisciplinaires
           Dublin Core simple : format obligatoire
           sans interdire des formats adaptés à des besoins plus spécialisés

»        échange les métadonnées, pas les objets


41                                                                               Luc Bellier 2013
Les métadonnées comme point d’accès
     »   Les accès distribués

 Le protocole OPDS




42                                    Luc Bellier 2013
Les métadonnées comme point d’accès
     »    Les accès distribués

 Le protocole OPDS


« Créer un écosystème basé sur des standards ouverts, permettant à n'importe qui de
   constituer une collection, de naviguer dans celle-ci et d'acquérir des ressources
   associées, depuis n'importe quelle source, et dans n'importe quel environnement »
                                          Hadrien Gardeur FeedBooks http://opds-spec.org/


»        Format adapté aux catalogues de libraires en ligne
»        Permet de gérer une collection publique et/ou privée, de gérer l’accès à la
         ressource en ligne quelque soit l’utilisateur du catalogue.
»        Permet d’assurer une médiation vers la ressource aisée pour l’utilisateur, dans le
         respect des conditions voulues par le créateur.




43                                                                               Luc Bellier 2013
Les métadonnées comme point d’accès
 L’accès distribué: les fils rss




44                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 L’accès distribué: les fils rss




45                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 L’accès distribué: les fils rss




46                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 L’accès distribué: les fils rss




47                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 L’accès distribué: les fils rss




48                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 L’accès distribué: les fils rss




                                   Notice : Les Misérables



                                                             Titre


                                                             Auteur : Victor
                                                             Hugo



                                                             Corpus : littérature
                                                             française

                                                             Ressource (doc.
                                                             numérisé)




49                                                                                  Luc Bellier 2013
Les métadonnées comme point d’accès
Les accès : théâtre des tensions de l’édition scientifique



 »    Modèle marchand fermé (EBSCO, CAIRN, PROQUEST) contre un modèle ouvert
      non marchand (wikipedia, Internet Archive, Archives ouvertes)
        En témoigne les récents débats sur les activités de l’INIST, les accords de la
         BnF avec Proquest
 »    Modèle distribué (EBSCO, OAI-PMH) contre modèle centralisé (Google Books,
      Hathi Trust)
 »    Stratégie collective organisant l’offre et la demande (Couperin, Carel, Open
      Archive) contre politique centralisée organisant la stabilité des acteurs de l’offre
      (financements CNRS ou CNL)
 »    Concentration de l’offre et de la demande :
        Concentration dans l’édition scientifique depuis 20 ans, l’édition litt. Générale
         depuis 10 autour des enjeux numériques (plateformes Hachette, Editis,
         Gallimard-Flammarion-Le Seuil)
        Concentration de la demande : licence nationale négociée par Agence ou
         Consortiums (CAREL, Couperin)
        Concentration de la chaine de la valeur (verrou logiciel, intégration verticale des
         acteurs nationaux Fnac-Kobo, internationaux – Apple, Amazon)
 50                                                                              Luc Bellier 2013
Le document numérique


»    Nature et structure du document numérique
       La notion de document : d’une définition formelle à une approche par écosystème
       Les types de fichiers : Les formats textes, les formats images, les formats multimédia
       La granularité du document, structuration et déstructuration
»    Produire et décrire le document numérique
       Le cas de la numérisation
       Le cas des de ePub
       Les identifiants
»    Les métadonnées
       Les métadonnées pour la recherche
          • Le cas des catalogues
          • Le cas des moteurs
          • Approche sémantique
       Les métadonnées comme point d’accès
          • Accès centralisés (catalogue et/ou moteur)
          • Accès distribués fermés et ouverts (OAI, RSS et OPDS)
          • L’interopérabilité sémantique
          • Les nouvelles métadonnées (folksonomies)
          • Multiplier les accès et multiplier les documents
»    Les enjeux des accès et de la médiation:
       Maitrise de la chaîne et des formats
       Longue traine et économie de l’attention
       Appréhender la collection numérique : le cas des bibliothèques
       La médiation autour des documents numériques


51                                                                                        Luc Bellier 2013
Les métadonnées comme point d’accès




»    Interopérabilité sémantique




52                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique




53                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique




54                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique




55                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique
     Bibliosurf – carte des romans policiers




56                                             Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique




57                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique




»    « Web sémantique » ou « web de données », plutôt que web de documents


»    RDF (Resource Description Framework)
       Cadre de description d’une ressource
         • Modélisation générale : vide de forme, vide de contenu
         • Triplets : ressource (sujet), prédicat (relation), valeur (description)
»    SKOS (Simple Knowledge Organisation System)
       Système simple d’organisation des connaissances
       SKOS permet d’organiser les rapports entre concepts
»    SPARQL (Sparql Protocol and Query Language)
       Protocole Sparql et langage d’interrogation
       SPARQL est le pour interroger des données stockées en RDF


58                                                                               Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique




59                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique




60                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Interopérabilité sémantique


     Une convergence inachevée : Les bibliothèques, les mondes marchand et les
     acteurs de référence

     Pour aller plus loin :

     la nouvelle classification de la CLIL :
     http://www.clil.org/information/detailDoc.html?docId=34

     Un rapprochement entre les bibliothèques et l’édition :
     http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_a
     fnor_2012.html




61                                                                           Luc Bellier 2013
Les métadonnées comme point d’accès




»    Les nouvelles indexations




62                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Les nouvelles indexations : Folksonomies


     »   Définition
           un processus de classification collaborative
           par des mots-clés librement choisis
           le résultat de cette classification

     »   Inconvénients
           vocabulaire non normalisé :
              • problèmes de polysémie, synonymie
              • lemmatisation,orthographe
           vocabulaire non structuré, sans hiérarchie ni relation sémantique
           vocabulaire hétérogène
              • mêlant le très spécifique (éventuellement à haut niveau d’expertise) et le
                 très superficiel
              • pouvant être trop simple, trop peu d’expertise
              • utilisant implicitement des univers de références
           vocabulaire personnel (à lire, lu, à acheter, à la bibliothèque sur LibraryThing,
             moi sur Flickr)
           confusion entre pertinence et popularité



63                                                                               Luc Bellier 2013
Les métadonnées comme point d’accès
 Les nouvelles indexations : Folksonomies

»    Avantages :
       indexation simple, gratuite et rapide
       indexation cumulative
       couverture documentaire totale
          • sans exclusion des œuvres de fiction
          • sans exclusion de types de documents
          • incluant la description du contenu, et non seulement la classification sujet
            (roman policier / peste)
       largement auto-régulée
       conforme aux usages du web
          • dans les fonctions de recherche
          • par les aspects égotiques et ludiques
               - simultanéité de la consultation et de l’indexation
               - absence de contrainte
               - intervention personnelle : approche subjective, permettant l’indexation
                 orientée utilisateur / tâche
               - défiance par rapport aux experts et à leur langage compliqué




64                                                                           Luc Bellier 2013
Les métadonnées comme point d’accès
 Les nouvelles indexations : Folksonomies




65                                          Luc Bellier 2013
Les métadonnées comme point d’accès
 Les nouvelles indexations : Folksonomies




66                                          Luc Bellier 2013
Les métadonnées comme point d’accès
 Les nouvelles indexations : Folksonomies




67                                          Luc Bellier 2013
Les métadonnées comme point d’accès
 Les nouvelles indexations : Folksonomies




68                                          Luc Bellier 2013
Les métadonnées comme point d’accès
 Les nouvelles indexations : Folksonomies




»    Une question en suspens
       Quelle perception par les utilisateurs ?
         • Différence entre un catalogue de bibliothèque et les autres sites web
         • Calcul de la « pertinence » non remis en question
            - Supériorité des algorithmes de classement dans la relation avec les
               utilisateurs




69                                                                        Luc Bellier 2013
Les métadonnées comme point d’accès
 Multiplier les points d’accès




70                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Multiplier les points d’accès




71                                    Luc Bellier 2013
Les métadonnées comme point d’accès
 Multiplier les points d’accès
En allégeant les développements




72                                    Luc Bellier 2013
Les métadonnées comme point d’accès




»    Le document numérique est sur la toile
       Le lecteur n’a plus besoin d’aller à
        la bibliothèque pour lire son livre…
       Et pas non plus sur le site de la
        bibliothèque numérique, ou chez un
        libraire




73                                             Luc Bellier 2013
Le document numérique


»    Nature et structure du document numérique
       La notion de document : d’une définition formelle à une approche par écosystème
       Les types de fichiers : Les formats textes, les formats images, les formats multimédia
       La granularité du document, structuration et déstructuration
»    Produire et décrire le document numérique
       Le cas de la numérisation
       Le cas des de ePub
       Les identifiants
»    Les métadonnées
       Les métadonnées pour la recherche
          • Le cas des catalogues
          • Le cas des moteurs
          • Approche sémantique
       Les métadonnées comme point d’accès
          • Accès centralisés (catalogue et/ou moteur)
          • Accès distribués fermés et ouverts (OAI, RSS et OPDS)
          • L’interopérabilité sémantique
          • Les nouvelles métadonnées (folksonomies)
          • Multiplier les accès et multiplier les documents
»    Les enjeux des accès et de la médiation:
       Maitrise de la chaîne et des formats
       Longue traine et économie de l’attention
       Appréhender la collection numérique : le cas des bibliothèques
       La médiation autour des documents numériques


74                                                                                        Luc Bellier 2013
Les enjeux des accès et de la médiation




»    Librairies en ligne, enjeux des dispositifs et des formats, longue traine et économie
     de l’attention




75                                                                            Luc Bellier 2013
Les enjeux des accès et de la médiation




76                                        Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Maitrise de la chaine et des formats




77                                          Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Maitrise de la chaine et des formats




 Exemple : ePub Fnac non lisible sur une autre tablette que la Kobo


78                                                                    Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Maitrise de la chaine et des formats




 http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_afnor_2012.html

79                                                                                            Luc Bellier 2013
Les enjeux des accès et de la médiation
»     Maitrise de la chaine et des formats

      Rédaction                       Edition                          Fabrication
                                                                                         Vente numérique


                                                BAT
                                                                      Import xml pivot
      Manuscrit                                                       Transformation
                                                                         xml selon
                                                                                               Mise à
                                                                        plateforme
                                                  Préparation du                           disposition des
                        Relecture
                                                    pivot XML                              intermédiaires
                       Corrections                                    Exports des xml
                                                                         modifiés
                                                  Liens avec les                           Modifications
      Illustration                                  documents                                  des
                                                     externes                              métadonnées
                                                                   Versions imprimées         selon
                       Numérisation                Ajouts des                              plateformes
                       Chargement                 métadonnées
                                                                                          Chargement sur
     Iconographie                                     Archivage                           les plateformes
                                                                      Import xml pivot      et validation

                                                                      Transformation
                                                                         xml selon
                                                                         maquete

                                                                      Exports des xml
                                                 BAT
                                                                         modifiés


                                                                   Versions numériques



81                                                                                       Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Maitrise de la chaine et des formats


»    Le Format Apple Ibooks
       En avance technologique sur le marché
       Lecture sur Tablette et Smartphone
       Intègre des éléments multimédia
       Fonctionnalités du reader avancées


»    Le format Amazon KindleVersion Mobi 7 est un Epub version 1
       Destiné à une liseuse à Encre électronique
       Version KF8 s’approche de l’Epub 3
       Destiné à une tablette


»    Le format ADELisible sur le reader de Adobe
»    SDK (DevKit) repris par de nombreux readers : tablettes et liseuses



82                                                                         Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Maitrise de la chaine et des formats




»    Maitrise de la chaine s’oppose au développement du marché :
       Le lecteur veut un livre qui se lit n’importe où et s’achète n’importe où
       Le marché propose des livres selon le terminal de lecture
       Le lecteur veut lire et relire sur tous ses terminaux
       Le marché n’autorise qu’un terminal ou seuls les terminaux autorisés par le
        revendeur
       Je veux lire mes livres même si je change de terminal
       Le marché ne m’autorise pas à changer de terminal sans renoncer à mes livres




83                                                                       Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Maitrise de la chaine et des formats


»    La maitrise des conditions de lecture et donc de mise en valeur du texte passe par
     :
       La maitrise des formats et de leurs possibilités (sous-traitant des éditeurs)
       La maitrise des dispositifs et appareils (fabricants) ainsi que les modalités d’exploitation des fichiers
        (éditeurs de logiciel)
       Au moment de l’édition du document et à tout moment après (obsolescence des formats,
        incompatibilité ascendante)
       La maitrise des conditions de mise en vente ou d’accès sur la plate-forme (mise en avant, conditions
        tarifaires, accompagnement etc.)

»    Cette maitrise n’est jamais totalement partagée : la médiation et la maitrise
     technique de la totalité de la chaine sont donc imparfaites, avec un fort avantage
     aux grandes plateforme Apple et Amazon.
       Par le financement de la création de contenus adaptés à leur format et sur les segments définis par
        eux.
       Par la validation préalable des contenus proposés avant la mise en vente :
         • Un manuel scolaire gratuit et sous licence CC retiré par Apple :
             http://www.ralentirtravaux.com/le_blog/?p=1843
         • Changement des conditions juridiques aboutissant au retrait d’ouvrages y compris quand ils ont
             été vendus : http://www.ebouquin.fr/2009/07/20/amazon-fait-disparaitre-des-livres-de-orwell-sur-le-
             kindle/



84                                                                                                  Luc Bellier 2013
Le document numérique


»    Nature et structure du document numérique
       La notion de document : d’une définition formelle à une approche par écosystème
       Les types de fichiers : Les formats textes, les formats images, les formats multimédia
       La granularité du document, structuration et déstructuration
»    Produire et décrire le document numérique
       Le cas de la numérisation
       Le cas des de ePub
       Les identifiants
»    Les métadonnées
       Les métadonnées pour la recherche
          • Le cas des catalogues
          • Le cas des moteurs
          • Approche sémantique
       Les métadonnées comme point d’accès
          • Accès centralisés (catalogue et/ou moteur)
          • Accès distribués fermés et ouverts (OAI, RSS et OPDS)
          • L’interopérabilité sémantique
          • Les nouvelles métadonnées (folksonomies)
          • Multiplier les accès et multiplier les documents
»    Les enjeux des accès et de la médiation:
       Maitrise de la chaîne et des formats
       Longue traine et économie de l’attention
       Appréhender la collection numérique : le cas des bibliothèques
       La médiation autour des documents numériques


85                                                                                        Luc Bellier 2013
Les enjeux des accès et de la médiation




»    Maitrise de la chaine et des formats




86                                          Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Longue traine et économie de l’attention


»    De nouvelles conditions définissent de nouvelles règles et de nouvelles façons de
     travailler : la longue traine
        notion apparue en 2004, sous la plume de Chris Anderson pour décrire le
         modèle économique de sociétés comme Amazon.
        La masse critique permise par un marché ouvert et par l’absence de magasin
         physique grâce au web permet d’élargir le catalogue des produits à vendre
     http://fr.wikipedia.org/wiki/Longue_tra%C3%AEne
     http://www.bibliobsession.net/2011/04/27/quels-criteres-pour-utiliser-la-longue-traine-2/




»    L’économie de l’attention : dans le cadre d’une concurrence entre les médias, la
     bataille se livre sur « le temps de cerveau disponible ». La concurrence n’est donc
     pas uniquement au sein du monde marchand, mais entre l’ensemble des espaces
     qui proposent des ressources

       http://fr.wikipedia.org/wiki/%C3%89conomie_de_l%27attention
       http://fr.slideshare.net/phcouve/lconomie-de-lattention-presentation




87                                                                                               Luc Bellier 2013
Temps continu Les enjeux des accès et de la médiation
                                                   Web media révolutionne
                                                   le modèle économique
        Tv radios                  Tv radios
          TNT                       Satellite            Zone de
                                                      hypothétique de
                                                        partage entre
                                                      paiement par les
                                                      annonceurs et les
                                                         particuliers

                                                                     Seuil indicatif
                               Presse                                de rentabilité

                  cinéma
                           revues


                           édition
Temps
discontinu
         rareté                                                      abondance


88                                                                 Luc Bellier 2013
Le document numérique


»    Nature et structure du document numérique
       La notion de document : d’une définition formelle à une approche par écosystème
       Les types de fichiers : Les formats textes, les formats images, les formats multimédia
       La granularité du document, structuration et déstructuration
»    Produire et décrire le document numérique
       Le cas de la numérisation
       Le cas des de ePub
       Les identifiants
»    Les métadonnées
       Les métadonnées pour la recherche
          • Le cas des catalogues
          • Le cas des moteurs
          • Approche sémantique
       Les métadonnées comme point d’accès
          • Accès centralisés (catalogue et/ou moteur)
          • Accès distribués fermés et ouverts (OAI, RSS et OPDS)
          • L’interopérabilité sémantique
          • Les nouvelles métadonnées (folksonomies)
          • Multiplier les accès et multiplier les documents
»    Les enjeux des accès et de la médiation:
       Maitrise de la chaîne et des formats
       Longue traine et économie de l’attention
       Appréhender la collection numérique : le cas des bibliothèques
       La médiation autour des documents numériques


89                                                                                        Luc Bellier 2013
Les enjeux des accès et de la médiation




»    Appréhender la collection numérique : le cas des bibliothèques




90                                                                    Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Appréhender la collection numérique




  Identifier
 Sélectionner      Collecter
                   Produire         Stocker
                                   Préserver   Transformer
                                                  Gérer      Communiquer
                                                               Diffuser




                                                                Bibliothèque
                                                                 numérique
                                                                  en ligne
      Données /
     Métadonnées




91                                                              Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Appréhender la collection numérique




         Catalogue     Catalogue
                      public (OAI)
                                     Serveurs
                                     d’archives   BdD de
                                                  gestion
                                                            Serveurs de
                                                            consultation




      Données /
     Métadonnées




92                                                                    Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Appréhender la collection numérique


 La collection numérique




 Les collections                      ?
             Reliés
                                           Numérique natif
                                 Films




93                                                      Luc Bellier 2013
Les enjeux des accès et de la médiation
»       Appréhender la collection numérique

               Centre de ressources                               Centre de ressources partenaires
     (Bibliothèques centre de documentation)
                                               Accès

       Catalogue
                             Catalogues                Entrepôt
                            ouverts (OAI)               (OAI)

                                                                  Serveurs
                                                                  d’archives         BdD de
                                                                                     gestion         Serveurs de
                                                                                                     consultation




           Données /                                                          Numérique natif
          Métadonnées




94                                                                                                   Luc Bellier 2013
Les enjeux des accès et de la médiation
»       Appréhender la collection numérique

               Centre de ressources               Accès par
                                                 abonnement        Prestataire, Éditeur, agrégateur
     (Bibliothèques centre de documentation)


             Catalogue            Catalogues
                                 ouverts (OAI)                Serveurs
                                                              d’archives
                                                                                  BdD de
                                                                                  gestion
                                                                                                      Serveurs de
                                                                                                      consultation




                                                                                Numérique natif
           Données /
          Métadonnées




95                                                                                                    Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Appréhender la collection numérique

         Catalogue     Catalogue
                      public (OAI)
                                     Serveurs
                                     d’archives     BdD de
                                                    gestion            Serveurs de       Droits
                                                                       consultation     d’accès




                                                                                         Droits
      Données /                                                                         d’accès
     Métadonnées

                                                                        Salle de
                        http:/www                   Outils de           lecture
                       Catalogue       Magasin      gestion
                                                   (conservation,
         Catalogue      public                    acquisition, prêt)



96                                                                                 Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Appréhender la collection numérique




                                           LOC




97                                               Luc Bellier 2013
Les enjeux des accès et de la médiation
»    Appréhender la collection numérique




»    La dispersion documentaire des collections numériques est aussi une dispersion
     ou un partage des tâches, des compétences et des responsabilités.
»    Elle soulève la question de l’investissement des professionnels de l’information
     dans les questions informatiques et/ou des professionnels de l’informatiques dans
     le domaine documentaire.
»    Ce rapprochement ne peut s’opérer sans une formation des professionnels de
     l’information aux technologies de plus en plus pointue de l’informatique
     documentaire, dont le champs dépasse celui du catalogue :
        Archivage et conservation
        Accès
        Formats de structuration des documents numériques.




98                                                                         Luc Bellier 2013
Division technique de la lecture
                                 su


                                                               Outil de stockage

       lu/vu/su                                    lu
                                                         +
                             Outil de stockage                 Outil de diffusion
                             Outil de diffusion                Outil d’accès
                        =>          +             =>
                               lu/vu
                                                         +   lu/vu
     Dispositif de                                                    Outil d’accès
     lecture,                                                         Outil de stockage
     Outil de                                                         Dispositif de lecture
     stockage
     Outil de                                            +
     diffusion, Outil                                                      vu/su
     d’accès             Dispositif de lecture,
                                                        http://www.        Outil d’accès
                         Outil d’accès
                                                                           Outil de stockage
                                                                           Outil de diffusion

99                                                                                  Luc Bellier 2013
Le document numérique


»     Nature et structure du document numérique
        La notion de document : d’une définition formelle à une approche par écosystème
        Les types de fichiers : Les formats textes, les formats images, les formats multimédia
        La granularité du document, structuration et déstructuration
»     Produire et décrire le document numérique
        Le cas de la numérisation
        Le cas des de ePub
        Les identifiants
»     Les métadonnées
        Les métadonnées pour la recherche
           • Le cas des catalogues
           • Le cas des moteurs
           • Approche sémantique
        Les métadonnées comme point d’accès
           • Accès centralisés (catalogue et/ou moteur)
           • Accès distribués fermés et ouverts (OAI, RSS et OPDS)
           • L’interopérabilité sémantique
           • Les nouvelles métadonnées (folksonomies)
           • Multiplier les accès et multiplier les documents
»     Les enjeux des accès et de la médiation:
        Maitrise de la chaîne et des formats
        Longue traine et économie de l’attention
        Appréhender la collection numérique : le cas des bibliothèques
        La médiation autour des documents numériques


100                                                                                        Luc Bellier 2013
Les enjeux des accès et de la médiation




»     La médiation autour des documents numériques




101                                                  Luc Bellier 2013
Intégration dans un environnement personnel




»     Un nouveau cadre de signalement
        Rejoindre l’utilisateur dans son lieu de travail / de consultation
         (la bibliothèque hors les murs et le prêt entre bibliothèques)
        Offrir de nouveaux services de veille
         (étagère des nouvelles acquisitions, lettre d’information, expositions
         temporaires)
        Faciliter la consultation des documents




102                                                                               Luc Bellier 2013
Intégration dans un environnement personnel


»     S’adresser à l’utilisateur et l’Informer des nouveautés, lui permettre de faire ce qu’il n’appelle
      pas la « veille documentaire »

        lettres d’information
        Fils RSS : actualité de la bibliothèque uniquement (Cervantes virtual)

        Fils RSS sur les contenus
            •   paramétrage générique (BU Laval, BU Illinois, Jubil, SCD Lyon 3, WNCLN, Project
                Gutenberg)
            •   paramétrage par l’utilisateur
                   - lors de la recherche (Saphir, enssib, National Libr. of Ireland)
                   - après authentification (WNCLN)
            •   paramétrage par type de document : si ressources audio numérisées, prévoir
                l’abonnement au podcast (Collège de France, Kankakee Public Library Podcast)
            •   dans bibliothèque numérique ou sur le portail de l’institution




103                                                                                        Luc Bellier 2013
Intégration dans un environnement personnel




104                                           Luc Bellier 2013
Intégration dans un environnement personnel




105
Intégration dans un environnement personnel




106                                           Luc Bellier 2013
107   Luc Bellier 2013
108   Luc Bellier 2013
De nouveaux outils de signalement


»les protocoles d’échanges de métadonnées

»Multiplier les documents numériques

»La médiation numérique
Les médiations numériques




                            Auteur : David Liziard


110
La communauté d’une bibliothèque

      »   Ajouter une interface de publication flexible ?
            Intégrer la bibliothèque numérique à la bibliothèque ou à l’institution ?
            comment ? Qui l’alimente et à quel rythme ? En quel nom ?

      »   Blog
            La solution du blog est-elle la meilleure ? Un blog séparé avec seulement un fil RSS
              inclus dans le portail de la bibliothèque numérique ?
            Le blog permet d’autres relations avec l’usager qui sortent du cadre de la veille :
                •   Proximité de ton
                •   Publier des critiques d’ouvrages (prescription)
                •   Faire participer la communauté (commentaires)
                •   Rendre la bibliothèque plus transparente & expliquer le fonctionnement, le jargon,
                    le backoffice de la bibliothèque numérique, les évolutions des fonctionnalités, les
                    dysfonctionnements, les perspectives
            Rendre compte des animations
            Le blog permet éventuellement de favoriser un travail de médiation léger et collaboratif




111                                                                                      Luc Bellier 2013
La communauté d’une bibliothèque




112                                Luc Bellier 2013
Les contenus libres ou librement accessibles
et les nouvelles formes de la médiation




113                                            Luc Bellier 2013
114   Luc Bellier 2013
115   Luc Bellier 2013
De nouveaux outils de signalement


»les protocoles d’échanges de métadonnées

»Multiplier les documents numériques

»La médiation numérique
              … la recommandation par les lecteurs…
Un nouveau signalement : la recommandation




»     Explicite / Implicite
»     Par service dédié extérieur à la bibliothèque numérique / à l’intérieur de la
      bibliothèque




117                                                                             Luc Bellier 2013
Un nouveau signalement : la recommandation




118                                          Luc Bellier 2013
Un nouveau signalement : la recommandation




119
Un nouveau signalement : la recommandation




120                                          Luc Bellier 2013
Un nouveau signalement : la recommandation


»     « Crowdsourcing »
        services nombreux (citeULike, connotea, delicious, yoolink…)
        choix à effectuer ? Partenariats
          privilégiés ?




    121                                                                 Luc Bellier 2013
Un nouveau signalement : la recommandation




122                                          Luc Bellier 2013

Contenu connexe

Tendances

Recherche documentaire : premiers pas
Recherche documentaire : premiers pasRecherche documentaire : premiers pas
Recherche documentaire : premiers pasBUPMCformM
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeJulien Sicot
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeJulien Sicot
 
Portails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logicielsPortails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logicielsMarc Maisonneuve
 
Présentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives OuvertesPrésentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives OuvertesJulien Sicot
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Bibliotheque Université de Provence
 
Les Portails De BibliothèQue
Les Portails De BibliothèQueLes Portails De BibliothèQue
Les Portails De BibliothèQuecyberdoc
 
Cours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapoCours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapoVirginie Delaine
 
La recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de donnéesLa recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de donnéesLatour Marie
 

Tendances (17)

Recherche documentaire : premiers pas
Recherche documentaire : premiers pasRecherche documentaire : premiers pas
Recherche documentaire : premiers pas
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliotheque
 
Outils de veille informationnelle - Hiver 2017
Outils de veille informationnelle - Hiver 2017Outils de veille informationnelle - Hiver 2017
Outils de veille informationnelle - Hiver 2017
 
Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016
Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016
Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliotheque
 
Portails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logicielsPortails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logiciels
 
Présentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives OuvertesPrésentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives Ouvertes
 
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
 
Méthodologie de la recherche documentaire M1 Anglais
Méthodologie de la recherche documentaire M1 AnglaisMéthodologie de la recherche documentaire M1 Anglais
Méthodologie de la recherche documentaire M1 Anglais
 
Les Portails De BibliothèQue
Les Portails De BibliothèQueLes Portails De BibliothèQue
Les Portails De BibliothèQue
 
2016 formation documentaire_des2213
2016 formation documentaire_des22132016 formation documentaire_des2213
2016 formation documentaire_des2213
 
Cours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapoCours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapo
 
ÉTS - Recherche avancée de documentation scientifique
ÉTS - Recherche avancée de documentation scientifiqueÉTS - Recherche avancée de documentation scientifique
ÉTS - Recherche avancée de documentation scientifique
 
2016 formation documentaire_des8003
2016 formation documentaire_des80032016 formation documentaire_des8003
2016 formation documentaire_des8003
 
La recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de donnéesLa recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de données
 
Méthodologie de la recherche documentaire M1 Langues romanes
Méthodologie de la recherche documentaire M1 Langues romanesMéthodologie de la recherche documentaire M1 Langues romanes
Méthodologie de la recherche documentaire M1 Langues romanes
 

Similaire à Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017Alain Marois
 
M1 BMC 2012-2013 Méthodologie de la recherche bibliographique
M1 BMC 2012-2013 Méthodologie de la recherche bibliographiqueM1 BMC 2012-2013 Méthodologie de la recherche bibliographique
M1 BMC 2012-2013 Méthodologie de la recherche bibliographiqueBUPMCformM
 
Doctorat sciences - Recherche bibliographique : méthode, sources et outils
Doctorat sciences - Recherche bibliographique : méthode, sources et outilsDoctorat sciences - Recherche bibliographique : méthode, sources et outils
Doctorat sciences - Recherche bibliographique : méthode, sources et outilsFrédérique Flamerie
 
Support acceder info
Support acceder infoSupport acceder info
Support acceder infoClaude Boé
 
Cours recherche documentaire Master Matières Premières Naturelles en Cosmétique
Cours recherche documentaire Master Matières Premières Naturelles en CosmétiqueCours recherche documentaire Master Matières Premières Naturelles en Cosmétique
Cours recherche documentaire Master Matières Premières Naturelles en CosmétiqueMagalie Le Gall
 
Formation à la recherche documentaire Master MPNC
Formation à la recherche documentaire Master MPNCFormation à la recherche documentaire Master MPNC
Formation à la recherche documentaire Master MPNCMagalie Le Gall
 
Devenir chercheur: réussir son projet de veille scientifique/ Lrhoul Hanae
Devenir chercheur: réussir son projet de veille scientifique/ Lrhoul HanaeDevenir chercheur: réussir son projet de veille scientifique/ Lrhoul Hanae
Devenir chercheur: réussir son projet de veille scientifique/ Lrhoul HanaeLrhoul Hanae
 

Similaire à Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013 (20)

Méthodologie documentaire Master 2 Psychanalyse novembre 2016
Méthodologie documentaire Master 2 Psychanalyse novembre 2016Méthodologie documentaire Master 2 Psychanalyse novembre 2016
Méthodologie documentaire Master 2 Psychanalyse novembre 2016
 
Master 1 sociologie 2015
Master 1 sociologie 2015Master 1 sociologie 2015
Master 1 sociologie 2015
 
Master 1 géographie 2015
Master 1 géographie 2015Master 1 géographie 2015
Master 1 géographie 2015
 
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
 
M1 BMC 2012-2013 Méthodologie de la recherche bibliographique
M1 BMC 2012-2013 Méthodologie de la recherche bibliographiqueM1 BMC 2012-2013 Méthodologie de la recherche bibliographique
M1 BMC 2012-2013 Méthodologie de la recherche bibliographique
 
Master2 psy octobre 2015
Master2 psy octobre 2015Master2 psy octobre 2015
Master2 psy octobre 2015
 
Doctorat sciences - Recherche bibliographique : méthode, sources et outils
Doctorat sciences - Recherche bibliographique : méthode, sources et outilsDoctorat sciences - Recherche bibliographique : méthode, sources et outils
Doctorat sciences - Recherche bibliographique : méthode, sources et outils
 
2013_formationL1_BULettresUBO
2013_formationL1_BULettresUBO2013_formationL1_BULettresUBO
2013_formationL1_BULettresUBO
 
Master2 psychanalyse janvier 2016
Master2 psychanalyse janvier 2016Master2 psychanalyse janvier 2016
Master2 psychanalyse janvier 2016
 
Licence 3 italien
Licence 3 italien Licence 3 italien
Licence 3 italien
 
Polytech geii sept2016
Polytech geii sept2016Polytech geii sept2016
Polytech geii sept2016
 
Support acceder info
Support acceder infoSupport acceder info
Support acceder info
 
Hypotheses Ifpo
Hypotheses IfpoHypotheses Ifpo
Hypotheses Ifpo
 
Cours recherche documentaire Master Matières Premières Naturelles en Cosmétique
Cours recherche documentaire Master Matières Premières Naturelles en CosmétiqueCours recherche documentaire Master Matières Premières Naturelles en Cosmétique
Cours recherche documentaire Master Matières Premières Naturelles en Cosmétique
 
Master aifa 2016 [jjc ag]_mr
Master aifa 2016 [jjc ag]_mrMaster aifa 2016 [jjc ag]_mr
Master aifa 2016 [jjc ag]_mr
 
Formation à la recherche documentaire Master MPNC
Formation à la recherche documentaire Master MPNCFormation à la recherche documentaire Master MPNC
Formation à la recherche documentaire Master MPNC
 
Master 1 aire culturelle romane 2015
Master 1 aire culturelle romane 2015Master 1 aire culturelle romane 2015
Master 1 aire culturelle romane 2015
 
Master 1 Lettres modernes 2016
Master 1 Lettres modernes 2016Master 1 Lettres modernes 2016
Master 1 Lettres modernes 2016
 
Iut chimie ppp-2017
Iut chimie ppp-2017Iut chimie ppp-2017
Iut chimie ppp-2017
 
Devenir chercheur: réussir son projet de veille scientifique/ Lrhoul Hanae
Devenir chercheur: réussir son projet de veille scientifique/ Lrhoul HanaeDevenir chercheur: réussir son projet de veille scientifique/ Lrhoul Hanae
Devenir chercheur: réussir son projet de veille scientifique/ Lrhoul Hanae
 

Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013

  • 1. Le document numérique Produire et décrire le document numérique : les identifiants
  • 2. Le document numérique » Nature et structure du document numérique  La notion de document : d’une définition formelle à une approche par écosystème  Les types de fichiers : Les formats textes, les formats images, les formats multimédia  La granularité du document, structuration et déstructuration » Produire et décrire le document numérique  Le cas de la numérisation  Le cas des de ePub  Les identifiants » Les métadonnées  Les métadonnées pour la recherche • Le cas des catalogues • Le cas des moteurs • Approche sémantique  Les métadonnées comme point d’accès • Accès centralisés (catalogue et/ou moteur) • Accès distribués fermés et ouverts (OAI, RSS et OPDS) • L’interopérabilité sémantique • Les nouvelles métadonnées (folksonomies) • Multiplier les accès et multiplier les documents » Les enjeux des accès et de la médiation:  Maitrise de la chaîne et des formats  Longue traine et économie de l’attention  Appréhender la collection numérique : le cas des bibliothèques  La médiation autour des documents numériques 2 Luc Bellier 2013
  • 3. Le document numérique » Les métadonnées : Les métadonnées pour la recherche :  Catalogues,  Moteurs  Approche sémantique 3 Luc Bellier 2013
  • 4. Les métadonnées » Les métadonnées pour la recherche : les catalogues 4 Luc Bellier 2013 http://www.flickr.com/photos/ajpresto714/761178431/
  • 5. Les métadonnées » Les métadonnées pour la recherche : les catalogues » Fonctionnement binaire et linéaire :  critère recherché présent : oui / non  listes d’entrées d’index » Recherches uniques, avec liste de résultat unique » Recherche dans les « métadonnées » » « Web invisible » / web visible 5 Luc Bellier 2013
  • 6. Les métadonnées » Les métadonnées pour la recherche : les moteurs 6 Luc Bellier 2013
  • 7. Les métadonnées » Les métadonnées pour la recherche : les moteurs 7 Luc Bellier 2013
  • 8. Les métadonnées » Les métadonnées pour la recherche : les moteurs 8 Luc Bellier 2013
  • 9. Les métadonnées » Les métadonnées pour la recherche : les moteurs Recherche Réponse Critère 1 Critère 2 Critère 3 Critère 4 Critère … 9 Luc Bellier 2013
  • 10. Les métadonnées » Les métadonnées pour la recherche : les moteurs » Si le nombre de résultats ne correspond pas au nombre de documents (pages web), à quoi correspond-il ? » Réponse: au nombre des entrées d’index 10 Luc Bellier 2013
  • 11. Les métadonnées » Les métadonnées pour la recherche : les moteurs 11 Luc Bellier 2013
  • 12. Les métadonnées » Les métadonnées pour la recherche : les moteurs » Les documents du web et ce que peut voir un moteur de recherche : » Mise en forme » Texte et autres caractères internes » Le document devient sa propre description 12 Luc Bellier 2013
  • 13. Titre Adresse Zone de texte : titre gras Liens générés automatiquement Liste à puces avec liens Image Formulaire de saisie 13 Luc Bellier 2013
  • 14. » Que peut voir un moteur de recherche dans une bibliothèque numérique ? 14 Luc Bellier 2013
  • 15. Les métadonnées » Les métadonnées pour la recherche : les moteurs » Recherche en texte intégral » Recherche statistique ou associative  fréquence du mot à l’intérieur du document  rareté du mot dans la collection  longueur du mot trouvé par rapport à la longueur du champ » Recherche linguistique  exploitation du vocabulaire et de la grammaire  lemmatisation de l’index  catégorisation des mots-outils  extraction d’entités nommées » Recherche sémantique : exploitation d’un modèle de connaissance ou référentiel  extraction terminologique (couplée à l'analyse sémantique)  détection du contexte global du document  classification automatique des mots du texte  expansion de requête  navigation dans un thésaurus de haut niveau  calcul des relations entre thèmes (lexicométrie)  filtrage des thèmes en fonction de leur pertinence 15 Luc Bellier 2013
  • 16. Les métadonnées » Les métadonnées pour la recherche : approche sémantique » Le principe des moteurs sémantiques » Intégration de chaque mot significatif dans une chaîne d’équivalents sémantiques  Par exemple, une recherche sur le mot « élection » retrouvera les documents contenant les mots « voix », « urne » et « vote », même si le mot « élection » ne se trouve pas explicitement dans le texte. » Cartographie et extraction de connaissances  Proposition d’une liste de critères pertinents qui ont émergé des documents, ce qui évite d’avoir à affiner la recherche par une « chaîne de caractères »  Recherche par similarité avec un texte existant (qui sera analysé et dont tous les mots significatifs seront utilisés comme critères de recherche). » Désambiguisation des requêtes / Multilinguisme  Par exemple : avocat (juriste) / avocat (plante)  Par exemple : pain (fr : aliment) / pain (en : douleur) 16 Luc Bellier 2013
  • 17. Les métadonnées » Les métadonnées pour la recherche 17 Luc Bellier 2013
  • 18. Les métadonnées » Les métadonnées pour la recherche 18 Luc Bellier 2013
  • 19. Les métadonnées » Les métadonnées pour la recherche 19 Luc Bellier 2013
  • 20. Les métadonnées » Les métadonnées pour la recherche 20 Luc Bellier 2013
  • 21. Les métadonnées » Les métadonnées pour la recherche : approche sémantique Modèle de l’arbre Catalogue Notice : Les Misérables Notice : Victor Hugo Notice : portrait de V. Hugo Lien explicite Titre titre dates Auteur : Victor auteur Hugo bio Lien implicite Sujet : Corpus : littérature … Victor française Hugo Ressource (doc. Ressource numérisé) (doc. numérisé) 21 Luc Bellier 2013
  • 22. Les métadonnées » Les métadonnées pour la recherche : approche sémantique BUT : Lier et interroger des données dispersées sur le Web avec les technologies du Web sémantique » Utiliser des identifiants accessibles via les protocoles du web (http) » Donner l’accès aux données utiles en utilisant les standards SPARQL et RDF Principes du LOD par Tim Berners-Lee 22 Luc Bellier 2013
  • 23. Les métadonnées » Les métadonnées pour la recherche : approche sémantique http://wimmics.inria.fr/projects/dbpedia/doc/index.php/Documentation#Processus_d.27extraction_des_donn.C3.A9es_de_Wikip.C3.A9dia 23 Luc Bellier 2013
  • 24. Le document numérique » Nature et structure du document numérique  La notion de document : d’une définition formelle à une approche par écosystème  Les types de fichiers : Les formats textes, les formats images, les formats multimédia  La granularité du document, structuration et déstructuration » Produire et décrire le document numérique  Le cas de la numérisation  Le cas des de ePub  Les identifiants » Les métadonnées  Les métadonnées pour la recherche • Le cas des catalogues • Le cas des moteurs • Approche sémantique  Les métadonnées comme point d’accès • Accès centralisés (catalogue et/ou moteur) • Accès distribués fermés et ouverts (OAI, RSS et OPDS) • L’interopérabilité sémantique • Les nouvelles métadonnées (folksonomies) • Multiplier les accès et multiplier les documents » Les enjeux des accès et de la médiation:  Maitrise de la chaîne et des formats  Longue traine et économie de l’attention  Appréhender la collection numérique : le cas des bibliothèques  La médiation autour des documents numériques 24 Luc Bellier 2013
  • 25. Les métadonnées » Les métadonnées comme point d’accès :  Accès centralisés  Accès distribués 25 Luc Bellier 2013
  • 26. Les métadonnées comme point d’accès » L’accès centralisé : exemple de la presse sur Gallica La presse dans Gallica : » à raison d’un n° par jour » pendant 50 ans ou plus » une liste de plusieurs dizaines de milliers de n° disponibles !!! 26 Luc Bellier 2013
  • 27. Les métadonnées comme point d’accès » L’accès centralisé : exemple de la presse sur Gallica 27 Luc Bellier 2013
  • 28. Les métadonnées comme point d’accès » L’accès centralisé : exemple de la presse sur Gallica 28 Luc Bellier 2013
  • 29. Les métadonnées comme point d’accès » L’accès centralisé : Open content Alliance 29 Luc Bellier 2013
  • 30. Les métadonnées comme point d’accès L’accès centralisé : Hati Trust 30 Luc Bellier 2013
  • 31. Les métadonnées comme point d’accès L’accès centralisé : google Books Search 31 Luc Bellier 2013
  • 32. Les métadonnées comme point d’accès L’accès distribué : les systèmes fermés » EBSCO » PROQUEST » JSTOR » CAIRN » Etc. 32 Luc Bellier 2013
  • 33. Les métadonnées comme point d’accès L’accès distribué : OAI Europeana 33 Luc Bellier 2013
  • 34. Les métadonnées comme point d’accès L’accès distribué : l’OAI de Gallica 34 Luc Bellier 2013
  • 35. Les métadonnées comme point d’accès L’accès distribué : l’OAI de Gallica 35 Luc Bellier 2013
  • 36. Les métadonnées comme point d’accès » Les accès distribués Protocole d’échanges de données http Programme Entrepôt xml moissonneur Base A A http Entrepôt Base B B xml Index Requête http utilisateur xml www serveur Entrepôt Base C C Résultats OAI-PMH 36 Luc Bellier 2013
  • 37. Les métadonnées comme point d’accès L’accès distribué : l’OAI  Interopérabilité des données (OAI-PMH, Entrepôts OAI)  Initiative OAI : Open Archive Initiative (1999) Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées  OAI-PMH : Protocol for Metadata Harvesting  Intérêt dans le domaine culturel et patrimonial  Collections partagées dans des architectures réparties  Interrogation centralisée Fournisseurs de données Fournisseurs de services 37 Luc Bellier 2013
  • 38. Les métadonnées comme point d’accès L’accès distribué : l’OAI serveur serveur OAI OAI serveur serveur OAI Library of OAI serveur Syndicat OAI Congress Universités de national de 363 notices Bibliothèques serveur l’édition Strasbourg virtuelles OAI 5546 notices 435 notices CNUM humanistes 91 notices 186 notices BIUM 3970 notices Base de données site SICD Strasbourg site LOC Editeurs site CNUM Consultation de ces site BIUM documents sur les autres sites site BVH serveur OAI 38 Luc Bellier 2013
  • 39. Les métadonnées comme point d’accès » Les accès distribués » Initiative OAI : Open Archive Initiative (1999)  Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes  Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées » OAI-PMH : Protocol for Metadata Harvesting  (Protocole de l’OAI pour le « moissonnage » des métadonnées)  Convention de Santa Fe, 1999  Version 2, juin 2002 » Intérêt dans le domaine culturel et patrimonial 39 Luc Bellier 2013
  • 40. Les métadonnées comme point d’accès » Les accès distribués Le protocole OAI-PMH Un protocole simple et ouvert qui » favorise l’interopérabilité et le signalement complémentaire des ressources culturelles  sans duplication ni déchargement des documents numériques primaires » accroît la visibilité sur le web de l’offre documentaire  en abattant certaines barrières du web invisible  en rendant possible le signalement de ressources non accessibles aux moteurs de recherche 40 Luc Bellier 2013
  • 41. Les métadonnées comme point d’accès » Les accès distribués Le protocole OAI-PMH Un protocole simple et ouvert qui » permet une gestion simple et automatisable des mises à jour par le fournisseur de service  mécanisme asynchrone  prévoit l’actualisation des liens, en répercutant les dernières modifications des réservoirs sources, sans copier à nouveau l’intégralité des données (la charge n’en étant que plus légère pour les serveurs) » s’appuie sur un format de description générique (Dublin Core simple) pour les besoins transdisciplinaires  Dublin Core simple : format obligatoire  sans interdire des formats adaptés à des besoins plus spécialisés » échange les métadonnées, pas les objets 41 Luc Bellier 2013
  • 42. Les métadonnées comme point d’accès » Les accès distribués Le protocole OPDS 42 Luc Bellier 2013
  • 43. Les métadonnées comme point d’accès » Les accès distribués Le protocole OPDS « Créer un écosystème basé sur des standards ouverts, permettant à n'importe qui de constituer une collection, de naviguer dans celle-ci et d'acquérir des ressources associées, depuis n'importe quelle source, et dans n'importe quel environnement » Hadrien Gardeur FeedBooks http://opds-spec.org/ » Format adapté aux catalogues de libraires en ligne » Permet de gérer une collection publique et/ou privée, de gérer l’accès à la ressource en ligne quelque soit l’utilisateur du catalogue. » Permet d’assurer une médiation vers la ressource aisée pour l’utilisateur, dans le respect des conditions voulues par le créateur. 43 Luc Bellier 2013
  • 44. Les métadonnées comme point d’accès L’accès distribué: les fils rss 44 Luc Bellier 2013
  • 45. Les métadonnées comme point d’accès L’accès distribué: les fils rss 45 Luc Bellier 2013
  • 46. Les métadonnées comme point d’accès L’accès distribué: les fils rss 46 Luc Bellier 2013
  • 47. Les métadonnées comme point d’accès L’accès distribué: les fils rss 47 Luc Bellier 2013
  • 48. Les métadonnées comme point d’accès L’accès distribué: les fils rss 48 Luc Bellier 2013
  • 49. Les métadonnées comme point d’accès L’accès distribué: les fils rss Notice : Les Misérables Titre Auteur : Victor Hugo Corpus : littérature française Ressource (doc. numérisé) 49 Luc Bellier 2013
  • 50. Les métadonnées comme point d’accès Les accès : théâtre des tensions de l’édition scientifique » Modèle marchand fermé (EBSCO, CAIRN, PROQUEST) contre un modèle ouvert non marchand (wikipedia, Internet Archive, Archives ouvertes)  En témoigne les récents débats sur les activités de l’INIST, les accords de la BnF avec Proquest » Modèle distribué (EBSCO, OAI-PMH) contre modèle centralisé (Google Books, Hathi Trust) » Stratégie collective organisant l’offre et la demande (Couperin, Carel, Open Archive) contre politique centralisée organisant la stabilité des acteurs de l’offre (financements CNRS ou CNL) » Concentration de l’offre et de la demande :  Concentration dans l’édition scientifique depuis 20 ans, l’édition litt. Générale depuis 10 autour des enjeux numériques (plateformes Hachette, Editis, Gallimard-Flammarion-Le Seuil)  Concentration de la demande : licence nationale négociée par Agence ou Consortiums (CAREL, Couperin)  Concentration de la chaine de la valeur (verrou logiciel, intégration verticale des acteurs nationaux Fnac-Kobo, internationaux – Apple, Amazon) 50 Luc Bellier 2013
  • 51. Le document numérique » Nature et structure du document numérique  La notion de document : d’une définition formelle à une approche par écosystème  Les types de fichiers : Les formats textes, les formats images, les formats multimédia  La granularité du document, structuration et déstructuration » Produire et décrire le document numérique  Le cas de la numérisation  Le cas des de ePub  Les identifiants » Les métadonnées  Les métadonnées pour la recherche • Le cas des catalogues • Le cas des moteurs • Approche sémantique  Les métadonnées comme point d’accès • Accès centralisés (catalogue et/ou moteur) • Accès distribués fermés et ouverts (OAI, RSS et OPDS) • L’interopérabilité sémantique • Les nouvelles métadonnées (folksonomies) • Multiplier les accès et multiplier les documents » Les enjeux des accès et de la médiation:  Maitrise de la chaîne et des formats  Longue traine et économie de l’attention  Appréhender la collection numérique : le cas des bibliothèques  La médiation autour des documents numériques 51 Luc Bellier 2013
  • 52. Les métadonnées comme point d’accès » Interopérabilité sémantique 52 Luc Bellier 2013
  • 53. Les métadonnées comme point d’accès Interopérabilité sémantique 53 Luc Bellier 2013
  • 54. Les métadonnées comme point d’accès Interopérabilité sémantique 54 Luc Bellier 2013
  • 55. Les métadonnées comme point d’accès Interopérabilité sémantique 55 Luc Bellier 2013
  • 56. Les métadonnées comme point d’accès Interopérabilité sémantique Bibliosurf – carte des romans policiers 56 Luc Bellier 2013
  • 57. Les métadonnées comme point d’accès Interopérabilité sémantique 57 Luc Bellier 2013
  • 58. Les métadonnées comme point d’accès Interopérabilité sémantique » « Web sémantique » ou « web de données », plutôt que web de documents » RDF (Resource Description Framework)  Cadre de description d’une ressource • Modélisation générale : vide de forme, vide de contenu • Triplets : ressource (sujet), prédicat (relation), valeur (description) » SKOS (Simple Knowledge Organisation System)  Système simple d’organisation des connaissances  SKOS permet d’organiser les rapports entre concepts » SPARQL (Sparql Protocol and Query Language)  Protocole Sparql et langage d’interrogation  SPARQL est le pour interroger des données stockées en RDF 58 Luc Bellier 2013
  • 59. Les métadonnées comme point d’accès Interopérabilité sémantique 59 Luc Bellier 2013
  • 60. Les métadonnées comme point d’accès Interopérabilité sémantique 60 Luc Bellier 2013
  • 61. Les métadonnées comme point d’accès Interopérabilité sémantique Une convergence inachevée : Les bibliothèques, les mondes marchand et les acteurs de référence Pour aller plus loin : la nouvelle classification de la CLIL : http://www.clil.org/information/detailDoc.html?docId=34 Un rapprochement entre les bibliothèques et l’édition : http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_a fnor_2012.html 61 Luc Bellier 2013
  • 62. Les métadonnées comme point d’accès » Les nouvelles indexations 62 Luc Bellier 2013
  • 63. Les métadonnées comme point d’accès Les nouvelles indexations : Folksonomies » Définition  un processus de classification collaborative  par des mots-clés librement choisis  le résultat de cette classification » Inconvénients  vocabulaire non normalisé : • problèmes de polysémie, synonymie • lemmatisation,orthographe  vocabulaire non structuré, sans hiérarchie ni relation sémantique  vocabulaire hétérogène • mêlant le très spécifique (éventuellement à haut niveau d’expertise) et le très superficiel • pouvant être trop simple, trop peu d’expertise • utilisant implicitement des univers de références  vocabulaire personnel (à lire, lu, à acheter, à la bibliothèque sur LibraryThing, moi sur Flickr)  confusion entre pertinence et popularité 63 Luc Bellier 2013
  • 64. Les métadonnées comme point d’accès Les nouvelles indexations : Folksonomies » Avantages :  indexation simple, gratuite et rapide  indexation cumulative  couverture documentaire totale • sans exclusion des œuvres de fiction • sans exclusion de types de documents • incluant la description du contenu, et non seulement la classification sujet (roman policier / peste)  largement auto-régulée  conforme aux usages du web • dans les fonctions de recherche • par les aspects égotiques et ludiques - simultanéité de la consultation et de l’indexation - absence de contrainte - intervention personnelle : approche subjective, permettant l’indexation orientée utilisateur / tâche - défiance par rapport aux experts et à leur langage compliqué 64 Luc Bellier 2013
  • 65. Les métadonnées comme point d’accès Les nouvelles indexations : Folksonomies 65 Luc Bellier 2013
  • 66. Les métadonnées comme point d’accès Les nouvelles indexations : Folksonomies 66 Luc Bellier 2013
  • 67. Les métadonnées comme point d’accès Les nouvelles indexations : Folksonomies 67 Luc Bellier 2013
  • 68. Les métadonnées comme point d’accès Les nouvelles indexations : Folksonomies 68 Luc Bellier 2013
  • 69. Les métadonnées comme point d’accès Les nouvelles indexations : Folksonomies » Une question en suspens  Quelle perception par les utilisateurs ? • Différence entre un catalogue de bibliothèque et les autres sites web • Calcul de la « pertinence » non remis en question - Supériorité des algorithmes de classement dans la relation avec les utilisateurs 69 Luc Bellier 2013
  • 70. Les métadonnées comme point d’accès Multiplier les points d’accès 70 Luc Bellier 2013
  • 71. Les métadonnées comme point d’accès Multiplier les points d’accès 71 Luc Bellier 2013
  • 72. Les métadonnées comme point d’accès Multiplier les points d’accès En allégeant les développements 72 Luc Bellier 2013
  • 73. Les métadonnées comme point d’accès » Le document numérique est sur la toile  Le lecteur n’a plus besoin d’aller à la bibliothèque pour lire son livre…  Et pas non plus sur le site de la bibliothèque numérique, ou chez un libraire 73 Luc Bellier 2013
  • 74. Le document numérique » Nature et structure du document numérique  La notion de document : d’une définition formelle à une approche par écosystème  Les types de fichiers : Les formats textes, les formats images, les formats multimédia  La granularité du document, structuration et déstructuration » Produire et décrire le document numérique  Le cas de la numérisation  Le cas des de ePub  Les identifiants » Les métadonnées  Les métadonnées pour la recherche • Le cas des catalogues • Le cas des moteurs • Approche sémantique  Les métadonnées comme point d’accès • Accès centralisés (catalogue et/ou moteur) • Accès distribués fermés et ouverts (OAI, RSS et OPDS) • L’interopérabilité sémantique • Les nouvelles métadonnées (folksonomies) • Multiplier les accès et multiplier les documents » Les enjeux des accès et de la médiation:  Maitrise de la chaîne et des formats  Longue traine et économie de l’attention  Appréhender la collection numérique : le cas des bibliothèques  La médiation autour des documents numériques 74 Luc Bellier 2013
  • 75. Les enjeux des accès et de la médiation » Librairies en ligne, enjeux des dispositifs et des formats, longue traine et économie de l’attention 75 Luc Bellier 2013
  • 76. Les enjeux des accès et de la médiation 76 Luc Bellier 2013
  • 77. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats 77 Luc Bellier 2013
  • 78. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats Exemple : ePub Fnac non lisible sur une autre tablette que la Kobo 78 Luc Bellier 2013
  • 79. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_afnor_2012.html 79 Luc Bellier 2013
  • 80. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats Rédaction Edition Fabrication Vente numérique BAT Import xml pivot Manuscrit Transformation xml selon Mise à plateforme Préparation du disposition des Relecture pivot XML intermédiaires Corrections Exports des xml modifiés Liens avec les Modifications Illustration documents des externes métadonnées Versions imprimées selon Numérisation Ajouts des plateformes Chargement métadonnées Chargement sur Iconographie Archivage les plateformes Import xml pivot et validation Transformation xml selon maquete Exports des xml BAT modifiés Versions numériques 81 Luc Bellier 2013
  • 81. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats » Le Format Apple Ibooks  En avance technologique sur le marché  Lecture sur Tablette et Smartphone  Intègre des éléments multimédia  Fonctionnalités du reader avancées » Le format Amazon KindleVersion Mobi 7 est un Epub version 1  Destiné à une liseuse à Encre électronique  Version KF8 s’approche de l’Epub 3  Destiné à une tablette » Le format ADELisible sur le reader de Adobe » SDK (DevKit) repris par de nombreux readers : tablettes et liseuses 82 Luc Bellier 2013
  • 82. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats » Maitrise de la chaine s’oppose au développement du marché :  Le lecteur veut un livre qui se lit n’importe où et s’achète n’importe où  Le marché propose des livres selon le terminal de lecture  Le lecteur veut lire et relire sur tous ses terminaux  Le marché n’autorise qu’un terminal ou seuls les terminaux autorisés par le revendeur  Je veux lire mes livres même si je change de terminal  Le marché ne m’autorise pas à changer de terminal sans renoncer à mes livres 83 Luc Bellier 2013
  • 83. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats » La maitrise des conditions de lecture et donc de mise en valeur du texte passe par :  La maitrise des formats et de leurs possibilités (sous-traitant des éditeurs)  La maitrise des dispositifs et appareils (fabricants) ainsi que les modalités d’exploitation des fichiers (éditeurs de logiciel)  Au moment de l’édition du document et à tout moment après (obsolescence des formats, incompatibilité ascendante)  La maitrise des conditions de mise en vente ou d’accès sur la plate-forme (mise en avant, conditions tarifaires, accompagnement etc.) » Cette maitrise n’est jamais totalement partagée : la médiation et la maitrise technique de la totalité de la chaine sont donc imparfaites, avec un fort avantage aux grandes plateforme Apple et Amazon.  Par le financement de la création de contenus adaptés à leur format et sur les segments définis par eux.  Par la validation préalable des contenus proposés avant la mise en vente : • Un manuel scolaire gratuit et sous licence CC retiré par Apple : http://www.ralentirtravaux.com/le_blog/?p=1843 • Changement des conditions juridiques aboutissant au retrait d’ouvrages y compris quand ils ont été vendus : http://www.ebouquin.fr/2009/07/20/amazon-fait-disparaitre-des-livres-de-orwell-sur-le- kindle/ 84 Luc Bellier 2013
  • 84. Le document numérique » Nature et structure du document numérique  La notion de document : d’une définition formelle à une approche par écosystème  Les types de fichiers : Les formats textes, les formats images, les formats multimédia  La granularité du document, structuration et déstructuration » Produire et décrire le document numérique  Le cas de la numérisation  Le cas des de ePub  Les identifiants » Les métadonnées  Les métadonnées pour la recherche • Le cas des catalogues • Le cas des moteurs • Approche sémantique  Les métadonnées comme point d’accès • Accès centralisés (catalogue et/ou moteur) • Accès distribués fermés et ouverts (OAI, RSS et OPDS) • L’interopérabilité sémantique • Les nouvelles métadonnées (folksonomies) • Multiplier les accès et multiplier les documents » Les enjeux des accès et de la médiation:  Maitrise de la chaîne et des formats  Longue traine et économie de l’attention  Appréhender la collection numérique : le cas des bibliothèques  La médiation autour des documents numériques 85 Luc Bellier 2013
  • 85. Les enjeux des accès et de la médiation » Maitrise de la chaine et des formats 86 Luc Bellier 2013
  • 86. Les enjeux des accès et de la médiation » Longue traine et économie de l’attention » De nouvelles conditions définissent de nouvelles règles et de nouvelles façons de travailler : la longue traine  notion apparue en 2004, sous la plume de Chris Anderson pour décrire le modèle économique de sociétés comme Amazon.  La masse critique permise par un marché ouvert et par l’absence de magasin physique grâce au web permet d’élargir le catalogue des produits à vendre http://fr.wikipedia.org/wiki/Longue_tra%C3%AEne http://www.bibliobsession.net/2011/04/27/quels-criteres-pour-utiliser-la-longue-traine-2/ » L’économie de l’attention : dans le cadre d’une concurrence entre les médias, la bataille se livre sur « le temps de cerveau disponible ». La concurrence n’est donc pas uniquement au sein du monde marchand, mais entre l’ensemble des espaces qui proposent des ressources  http://fr.wikipedia.org/wiki/%C3%89conomie_de_l%27attention  http://fr.slideshare.net/phcouve/lconomie-de-lattention-presentation 87 Luc Bellier 2013
  • 87. Temps continu Les enjeux des accès et de la médiation Web media révolutionne le modèle économique Tv radios Tv radios TNT Satellite Zone de hypothétique de partage entre paiement par les annonceurs et les particuliers Seuil indicatif Presse de rentabilité cinéma revues édition Temps discontinu rareté abondance 88 Luc Bellier 2013
  • 88. Le document numérique » Nature et structure du document numérique  La notion de document : d’une définition formelle à une approche par écosystème  Les types de fichiers : Les formats textes, les formats images, les formats multimédia  La granularité du document, structuration et déstructuration » Produire et décrire le document numérique  Le cas de la numérisation  Le cas des de ePub  Les identifiants » Les métadonnées  Les métadonnées pour la recherche • Le cas des catalogues • Le cas des moteurs • Approche sémantique  Les métadonnées comme point d’accès • Accès centralisés (catalogue et/ou moteur) • Accès distribués fermés et ouverts (OAI, RSS et OPDS) • L’interopérabilité sémantique • Les nouvelles métadonnées (folksonomies) • Multiplier les accès et multiplier les documents » Les enjeux des accès et de la médiation:  Maitrise de la chaîne et des formats  Longue traine et économie de l’attention  Appréhender la collection numérique : le cas des bibliothèques  La médiation autour des documents numériques 89 Luc Bellier 2013
  • 89. Les enjeux des accès et de la médiation » Appréhender la collection numérique : le cas des bibliothèques 90 Luc Bellier 2013
  • 90. Les enjeux des accès et de la médiation » Appréhender la collection numérique Identifier Sélectionner Collecter Produire Stocker Préserver Transformer Gérer Communiquer Diffuser Bibliothèque numérique en ligne Données / Métadonnées 91 Luc Bellier 2013
  • 91. Les enjeux des accès et de la médiation » Appréhender la collection numérique Catalogue Catalogue public (OAI) Serveurs d’archives BdD de gestion Serveurs de consultation Données / Métadonnées 92 Luc Bellier 2013
  • 92. Les enjeux des accès et de la médiation » Appréhender la collection numérique La collection numérique Les collections ? Reliés Numérique natif Films 93 Luc Bellier 2013
  • 93. Les enjeux des accès et de la médiation » Appréhender la collection numérique Centre de ressources Centre de ressources partenaires (Bibliothèques centre de documentation) Accès Catalogue Catalogues Entrepôt ouverts (OAI) (OAI) Serveurs d’archives BdD de gestion Serveurs de consultation Données / Numérique natif Métadonnées 94 Luc Bellier 2013
  • 94. Les enjeux des accès et de la médiation » Appréhender la collection numérique Centre de ressources Accès par abonnement Prestataire, Éditeur, agrégateur (Bibliothèques centre de documentation) Catalogue Catalogues ouverts (OAI) Serveurs d’archives BdD de gestion Serveurs de consultation Numérique natif Données / Métadonnées 95 Luc Bellier 2013
  • 95. Les enjeux des accès et de la médiation » Appréhender la collection numérique Catalogue Catalogue public (OAI) Serveurs d’archives BdD de gestion Serveurs de Droits consultation d’accès Droits Données / d’accès Métadonnées Salle de http:/www Outils de lecture Catalogue Magasin gestion (conservation, Catalogue public acquisition, prêt) 96 Luc Bellier 2013
  • 96. Les enjeux des accès et de la médiation » Appréhender la collection numérique LOC 97 Luc Bellier 2013
  • 97. Les enjeux des accès et de la médiation » Appréhender la collection numérique » La dispersion documentaire des collections numériques est aussi une dispersion ou un partage des tâches, des compétences et des responsabilités. » Elle soulève la question de l’investissement des professionnels de l’information dans les questions informatiques et/ou des professionnels de l’informatiques dans le domaine documentaire. » Ce rapprochement ne peut s’opérer sans une formation des professionnels de l’information aux technologies de plus en plus pointue de l’informatique documentaire, dont le champs dépasse celui du catalogue :  Archivage et conservation  Accès  Formats de structuration des documents numériques. 98 Luc Bellier 2013
  • 98. Division technique de la lecture su Outil de stockage lu/vu/su lu + Outil de stockage Outil de diffusion Outil de diffusion Outil d’accès => + => lu/vu + lu/vu Dispositif de Outil d’accès lecture, Outil de stockage Outil de Dispositif de lecture stockage Outil de + diffusion, Outil vu/su d’accès Dispositif de lecture, http://www. Outil d’accès Outil d’accès Outil de stockage Outil de diffusion 99 Luc Bellier 2013
  • 99. Le document numérique » Nature et structure du document numérique  La notion de document : d’une définition formelle à une approche par écosystème  Les types de fichiers : Les formats textes, les formats images, les formats multimédia  La granularité du document, structuration et déstructuration » Produire et décrire le document numérique  Le cas de la numérisation  Le cas des de ePub  Les identifiants » Les métadonnées  Les métadonnées pour la recherche • Le cas des catalogues • Le cas des moteurs • Approche sémantique  Les métadonnées comme point d’accès • Accès centralisés (catalogue et/ou moteur) • Accès distribués fermés et ouverts (OAI, RSS et OPDS) • L’interopérabilité sémantique • Les nouvelles métadonnées (folksonomies) • Multiplier les accès et multiplier les documents » Les enjeux des accès et de la médiation:  Maitrise de la chaîne et des formats  Longue traine et économie de l’attention  Appréhender la collection numérique : le cas des bibliothèques  La médiation autour des documents numériques 100 Luc Bellier 2013
  • 100. Les enjeux des accès et de la médiation » La médiation autour des documents numériques 101 Luc Bellier 2013
  • 101. Intégration dans un environnement personnel » Un nouveau cadre de signalement  Rejoindre l’utilisateur dans son lieu de travail / de consultation (la bibliothèque hors les murs et le prêt entre bibliothèques)  Offrir de nouveaux services de veille (étagère des nouvelles acquisitions, lettre d’information, expositions temporaires)  Faciliter la consultation des documents 102 Luc Bellier 2013
  • 102. Intégration dans un environnement personnel » S’adresser à l’utilisateur et l’Informer des nouveautés, lui permettre de faire ce qu’il n’appelle pas la « veille documentaire »  lettres d’information  Fils RSS : actualité de la bibliothèque uniquement (Cervantes virtual)  Fils RSS sur les contenus • paramétrage générique (BU Laval, BU Illinois, Jubil, SCD Lyon 3, WNCLN, Project Gutenberg) • paramétrage par l’utilisateur - lors de la recherche (Saphir, enssib, National Libr. of Ireland) - après authentification (WNCLN) • paramétrage par type de document : si ressources audio numérisées, prévoir l’abonnement au podcast (Collège de France, Kankakee Public Library Podcast) • dans bibliothèque numérique ou sur le portail de l’institution 103 Luc Bellier 2013
  • 103. Intégration dans un environnement personnel 104 Luc Bellier 2013
  • 104. Intégration dans un environnement personnel 105
  • 105. Intégration dans un environnement personnel 106 Luc Bellier 2013
  • 106. 107 Luc Bellier 2013
  • 107. 108 Luc Bellier 2013
  • 108. De nouveaux outils de signalement »les protocoles d’échanges de métadonnées »Multiplier les documents numériques »La médiation numérique
  • 109. Les médiations numériques Auteur : David Liziard 110
  • 110. La communauté d’une bibliothèque » Ajouter une interface de publication flexible ?  Intégrer la bibliothèque numérique à la bibliothèque ou à l’institution ?  comment ? Qui l’alimente et à quel rythme ? En quel nom ? » Blog  La solution du blog est-elle la meilleure ? Un blog séparé avec seulement un fil RSS inclus dans le portail de la bibliothèque numérique ?  Le blog permet d’autres relations avec l’usager qui sortent du cadre de la veille : • Proximité de ton • Publier des critiques d’ouvrages (prescription) • Faire participer la communauté (commentaires) • Rendre la bibliothèque plus transparente & expliquer le fonctionnement, le jargon, le backoffice de la bibliothèque numérique, les évolutions des fonctionnalités, les dysfonctionnements, les perspectives  Rendre compte des animations  Le blog permet éventuellement de favoriser un travail de médiation léger et collaboratif 111 Luc Bellier 2013
  • 111. La communauté d’une bibliothèque 112 Luc Bellier 2013
  • 112. Les contenus libres ou librement accessibles et les nouvelles formes de la médiation 113 Luc Bellier 2013
  • 113. 114 Luc Bellier 2013
  • 114. 115 Luc Bellier 2013
  • 115. De nouveaux outils de signalement »les protocoles d’échanges de métadonnées »Multiplier les documents numériques »La médiation numérique … la recommandation par les lecteurs…
  • 116. Un nouveau signalement : la recommandation » Explicite / Implicite » Par service dédié extérieur à la bibliothèque numérique / à l’intérieur de la bibliothèque 117 Luc Bellier 2013
  • 117. Un nouveau signalement : la recommandation 118 Luc Bellier 2013
  • 118. Un nouveau signalement : la recommandation 119
  • 119. Un nouveau signalement : la recommandation 120 Luc Bellier 2013
  • 120. Un nouveau signalement : la recommandation » « Crowdsourcing »  services nombreux (citeULike, connotea, delicious, yoolink…)  choix à effectuer ? Partenariats privilégiés ? 121 Luc Bellier 2013
  • 121. Un nouveau signalement : la recommandation 122 Luc Bellier 2013