2. Le document numérique
» Nature et structure du document numérique
La notion de document : d’une définition formelle à une approche par écosystème
Les types de fichiers : Les formats textes, les formats images, les formats multimédia
La granularité du document, structuration et déstructuration
» Produire et décrire le document numérique
Le cas de la numérisation
Le cas des de ePub
Les identifiants
» Les métadonnées
Les métadonnées pour la recherche
• Le cas des catalogues
• Le cas des moteurs
• Approche sémantique
Les métadonnées comme point d’accès
• Accès centralisés (catalogue et/ou moteur)
• Accès distribués fermés et ouverts (OAI, RSS et OPDS)
• L’interopérabilité sémantique
• Les nouvelles métadonnées (folksonomies)
• Multiplier les accès et multiplier les documents
» Les enjeux des accès et de la médiation:
Maitrise de la chaîne et des formats
Longue traine et économie de l’attention
Appréhender la collection numérique : le cas des bibliothèques
La médiation autour des documents numériques
2 Luc Bellier 2013
3. Le document numérique
» Les métadonnées : Les métadonnées pour la recherche :
Catalogues,
Moteurs
Approche sémantique
3 Luc Bellier 2013
4. Les métadonnées
» Les métadonnées pour la recherche : les catalogues
4 Luc Bellier 2013
http://www.flickr.com/photos/ajpresto714/761178431/
5. Les métadonnées
» Les métadonnées pour la recherche : les catalogues
» Fonctionnement binaire et linéaire :
critère recherché présent : oui / non
listes d’entrées d’index
» Recherches uniques, avec liste de résultat unique
» Recherche dans les « métadonnées »
» « Web invisible » / web visible
5 Luc Bellier 2013
6. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
6 Luc Bellier 2013
7. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
7 Luc Bellier 2013
8. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
8 Luc Bellier 2013
9. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
Recherche
Réponse
Critère 1 Critère 2 Critère 3 Critère 4 Critère …
9 Luc Bellier 2013
10. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
» Si le nombre de résultats ne correspond pas au nombre de documents (pages
web), à quoi correspond-il ?
» Réponse: au nombre des entrées d’index
10 Luc Bellier 2013
11. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
11 Luc Bellier 2013
12. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
» Les documents du web et ce
que peut voir un moteur de
recherche :
» Mise en forme
» Texte et autres caractères
internes
» Le document devient sa
propre description
12 Luc Bellier 2013
13. Titre Adresse
Zone de texte : titre gras
Liens générés automatiquement
Liste à puces avec liens
Image
Formulaire de saisie
13 Luc Bellier 2013
14. » Que peut voir un moteur de recherche dans une bibliothèque numérique ?
14 Luc Bellier 2013
15. Les métadonnées
» Les métadonnées pour la recherche : les moteurs
» Recherche en texte intégral
» Recherche statistique ou associative
fréquence du mot à l’intérieur du document
rareté du mot dans la collection
longueur du mot trouvé par rapport à la longueur du champ
» Recherche linguistique
exploitation du vocabulaire et de la grammaire
lemmatisation de l’index
catégorisation des mots-outils
extraction d’entités nommées
» Recherche sémantique : exploitation d’un modèle de connaissance ou référentiel
extraction terminologique (couplée à l'analyse sémantique)
détection du contexte global du document
classification automatique des mots du texte
expansion de requête
navigation dans un thésaurus de haut niveau
calcul des relations entre thèmes (lexicométrie)
filtrage des thèmes en fonction de leur pertinence
15 Luc Bellier 2013
16. Les métadonnées
» Les métadonnées pour la recherche : approche sémantique
» Le principe des moteurs sémantiques
» Intégration de chaque mot significatif dans une chaîne d’équivalents sémantiques
Par exemple, une recherche sur le mot « élection » retrouvera les documents
contenant les mots « voix », « urne » et « vote », même si le mot « élection »
ne se trouve pas explicitement dans le texte.
» Cartographie et extraction de connaissances
Proposition d’une liste de critères pertinents qui ont émergé des documents, ce
qui évite d’avoir à affiner la recherche par une « chaîne de caractères »
Recherche par similarité avec un texte existant (qui sera analysé et dont tous
les mots significatifs seront utilisés comme critères de recherche).
» Désambiguisation des requêtes / Multilinguisme
Par exemple : avocat (juriste) / avocat (plante)
Par exemple : pain (fr : aliment) / pain (en : douleur)
16 Luc Bellier 2013
17. Les métadonnées
» Les métadonnées pour la recherche
17 Luc Bellier 2013
18. Les métadonnées
» Les métadonnées pour la recherche
18 Luc Bellier 2013
19. Les métadonnées
» Les métadonnées pour la recherche
19 Luc Bellier 2013
20. Les métadonnées
» Les métadonnées pour la recherche
20 Luc Bellier 2013
21. Les métadonnées
» Les métadonnées pour la recherche : approche sémantique
Modèle de l’arbre
Catalogue
Notice : Les Misérables Notice : Victor Hugo Notice : portrait de V. Hugo
Lien explicite
Titre titre
dates
Auteur : Victor auteur
Hugo bio
Lien implicite
Sujet :
Corpus : littérature … Victor
française Hugo
Ressource (doc. Ressource
numérisé) (doc.
numérisé)
21 Luc Bellier 2013
22. Les métadonnées
» Les métadonnées pour la recherche : approche sémantique
BUT : Lier et interroger des données dispersées
sur le Web avec les technologies du Web
sémantique
» Utiliser des identifiants
accessibles via les protocoles du
web (http)
» Donner l’accès aux données
utiles en utilisant les standards
SPARQL et RDF
Principes du LOD
par Tim Berners-Lee
22 Luc Bellier 2013
23. Les métadonnées
» Les métadonnées pour la recherche : approche sémantique
http://wimmics.inria.fr/projects/dbpedia/doc/index.php/Documentation#Processus_d.27extraction_des_donn.C3.A9es_de_Wikip.C3.A9dia
23 Luc Bellier 2013
24. Le document numérique
» Nature et structure du document numérique
La notion de document : d’une définition formelle à une approche par écosystème
Les types de fichiers : Les formats textes, les formats images, les formats multimédia
La granularité du document, structuration et déstructuration
» Produire et décrire le document numérique
Le cas de la numérisation
Le cas des de ePub
Les identifiants
» Les métadonnées
Les métadonnées pour la recherche
• Le cas des catalogues
• Le cas des moteurs
• Approche sémantique
Les métadonnées comme point d’accès
• Accès centralisés (catalogue et/ou moteur)
• Accès distribués fermés et ouverts (OAI, RSS et OPDS)
• L’interopérabilité sémantique
• Les nouvelles métadonnées (folksonomies)
• Multiplier les accès et multiplier les documents
» Les enjeux des accès et de la médiation:
Maitrise de la chaîne et des formats
Longue traine et économie de l’attention
Appréhender la collection numérique : le cas des bibliothèques
La médiation autour des documents numériques
24 Luc Bellier 2013
25. Les métadonnées
» Les métadonnées comme point d’accès :
Accès centralisés
Accès distribués
25 Luc Bellier 2013
26. Les métadonnées comme point d’accès
» L’accès centralisé : exemple de la presse sur Gallica
La presse dans Gallica :
» à raison d’un n° par jour
» pendant 50 ans ou plus
» une liste de plusieurs dizaines
de milliers de n° disponibles !!!
26 Luc Bellier 2013
27. Les métadonnées comme point d’accès
» L’accès centralisé : exemple de la presse sur Gallica
27 Luc Bellier 2013
28. Les métadonnées comme point d’accès
» L’accès centralisé : exemple de la presse sur Gallica
28 Luc Bellier 2013
29. Les métadonnées comme point d’accès
» L’accès centralisé : Open content Alliance
29 Luc Bellier 2013
30. Les métadonnées comme point d’accès
L’accès centralisé : Hati Trust
30 Luc Bellier 2013
31. Les métadonnées comme point d’accès
L’accès centralisé : google Books Search
31 Luc Bellier 2013
32. Les métadonnées comme point d’accès
L’accès distribué : les systèmes fermés
» EBSCO
» PROQUEST
» JSTOR
» CAIRN
» Etc.
32 Luc Bellier 2013
33. Les métadonnées comme point d’accès
L’accès distribué : OAI Europeana
33 Luc Bellier 2013
34. Les métadonnées comme point d’accès
L’accès distribué : l’OAI de Gallica
34 Luc Bellier 2013
35. Les métadonnées comme point d’accès
L’accès distribué : l’OAI de Gallica
35 Luc Bellier 2013
36. Les métadonnées comme point d’accès
» Les accès distribués
Protocole d’échanges de données
http
Programme
Entrepôt xml moissonneur
Base A
A
http
Entrepôt
Base B B
xml Index
Requête
http
utilisateur
xml
www serveur
Entrepôt
Base C C Résultats
OAI-PMH
36 Luc Bellier 2013
37. Les métadonnées comme point d’accès
L’accès distribué : l’OAI
Interopérabilité des données (OAI-PMH, Entrepôts OAI)
Initiative OAI : Open Archive Initiative (1999)
Objectif : améliorer le signalement des e-prints, des publications
scientifiques et l’interopérabilité des bases d’archives ouvertes
Moyen : création d’un protocole technique de diffusion et de collecte
de métadonnées
OAI-PMH : Protocol for Metadata Harvesting
Intérêt dans le domaine culturel et patrimonial
Collections partagées dans des architectures réparties
Interrogation centralisée Fournisseurs de données
Fournisseurs de services
37 Luc Bellier 2013
38. Les métadonnées comme point d’accès
L’accès distribué : l’OAI
serveur serveur
OAI OAI
serveur
serveur
OAI
Library of OAI
serveur Syndicat
OAI Congress Universités de
national de 363 notices Bibliothèques
serveur l’édition Strasbourg
virtuelles
OAI 5546 notices 435 notices
CNUM humanistes
91 notices 186 notices
BIUM
3970 notices
Base de données
site SICD
Strasbourg site LOC
Editeurs
site CNUM
Consultation de ces
site BIUM documents sur les autres sites
site BVH
serveur
OAI
38 Luc Bellier 2013
39. Les métadonnées comme point d’accès
» Les accès distribués
» Initiative OAI : Open Archive Initiative (1999)
Objectif : améliorer le signalement des e-prints, des publications scientifiques et
l’interopérabilité des bases d’archives ouvertes
Moyen : création d’un protocole technique de diffusion et de collecte de
métadonnées
» OAI-PMH : Protocol for Metadata Harvesting
(Protocole de l’OAI pour le « moissonnage » des métadonnées)
Convention de Santa Fe, 1999
Version 2, juin 2002
» Intérêt dans le domaine culturel et patrimonial
39 Luc Bellier 2013
40. Les métadonnées comme point d’accès
» Les accès distribués
Le protocole OAI-PMH
Un protocole simple et ouvert qui
» favorise l’interopérabilité et le signalement complémentaire des ressources
culturelles
sans duplication ni déchargement des documents numériques primaires
» accroît la visibilité sur le web de l’offre documentaire
en abattant certaines barrières du web invisible
en rendant possible le signalement de ressources non accessibles aux moteurs
de recherche
40 Luc Bellier 2013
41. Les métadonnées comme point d’accès
» Les accès distribués
Le protocole OAI-PMH
Un protocole simple et ouvert qui
» permet une gestion simple et automatisable des mises à jour par le fournisseur de
service
mécanisme asynchrone
prévoit l’actualisation des liens, en répercutant les dernières modifications des
réservoirs sources, sans copier à nouveau l’intégralité des données (la charge
n’en étant que plus légère pour les serveurs)
» s’appuie sur un format de description générique (Dublin Core simple) pour les
besoins transdisciplinaires
Dublin Core simple : format obligatoire
sans interdire des formats adaptés à des besoins plus spécialisés
» échange les métadonnées, pas les objets
41 Luc Bellier 2013
42. Les métadonnées comme point d’accès
» Les accès distribués
Le protocole OPDS
42 Luc Bellier 2013
43. Les métadonnées comme point d’accès
» Les accès distribués
Le protocole OPDS
« Créer un écosystème basé sur des standards ouverts, permettant à n'importe qui de
constituer une collection, de naviguer dans celle-ci et d'acquérir des ressources
associées, depuis n'importe quelle source, et dans n'importe quel environnement »
Hadrien Gardeur FeedBooks http://opds-spec.org/
» Format adapté aux catalogues de libraires en ligne
» Permet de gérer une collection publique et/ou privée, de gérer l’accès à la
ressource en ligne quelque soit l’utilisateur du catalogue.
» Permet d’assurer une médiation vers la ressource aisée pour l’utilisateur, dans le
respect des conditions voulues par le créateur.
43 Luc Bellier 2013
44. Les métadonnées comme point d’accès
L’accès distribué: les fils rss
44 Luc Bellier 2013
45. Les métadonnées comme point d’accès
L’accès distribué: les fils rss
45 Luc Bellier 2013
46. Les métadonnées comme point d’accès
L’accès distribué: les fils rss
46 Luc Bellier 2013
47. Les métadonnées comme point d’accès
L’accès distribué: les fils rss
47 Luc Bellier 2013
48. Les métadonnées comme point d’accès
L’accès distribué: les fils rss
48 Luc Bellier 2013
49. Les métadonnées comme point d’accès
L’accès distribué: les fils rss
Notice : Les Misérables
Titre
Auteur : Victor
Hugo
Corpus : littérature
française
Ressource (doc.
numérisé)
49 Luc Bellier 2013
50. Les métadonnées comme point d’accès
Les accès : théâtre des tensions de l’édition scientifique
» Modèle marchand fermé (EBSCO, CAIRN, PROQUEST) contre un modèle ouvert
non marchand (wikipedia, Internet Archive, Archives ouvertes)
En témoigne les récents débats sur les activités de l’INIST, les accords de la
BnF avec Proquest
» Modèle distribué (EBSCO, OAI-PMH) contre modèle centralisé (Google Books,
Hathi Trust)
» Stratégie collective organisant l’offre et la demande (Couperin, Carel, Open
Archive) contre politique centralisée organisant la stabilité des acteurs de l’offre
(financements CNRS ou CNL)
» Concentration de l’offre et de la demande :
Concentration dans l’édition scientifique depuis 20 ans, l’édition litt. Générale
depuis 10 autour des enjeux numériques (plateformes Hachette, Editis,
Gallimard-Flammarion-Le Seuil)
Concentration de la demande : licence nationale négociée par Agence ou
Consortiums (CAREL, Couperin)
Concentration de la chaine de la valeur (verrou logiciel, intégration verticale des
acteurs nationaux Fnac-Kobo, internationaux – Apple, Amazon)
50 Luc Bellier 2013
51. Le document numérique
» Nature et structure du document numérique
La notion de document : d’une définition formelle à une approche par écosystème
Les types de fichiers : Les formats textes, les formats images, les formats multimédia
La granularité du document, structuration et déstructuration
» Produire et décrire le document numérique
Le cas de la numérisation
Le cas des de ePub
Les identifiants
» Les métadonnées
Les métadonnées pour la recherche
• Le cas des catalogues
• Le cas des moteurs
• Approche sémantique
Les métadonnées comme point d’accès
• Accès centralisés (catalogue et/ou moteur)
• Accès distribués fermés et ouverts (OAI, RSS et OPDS)
• L’interopérabilité sémantique
• Les nouvelles métadonnées (folksonomies)
• Multiplier les accès et multiplier les documents
» Les enjeux des accès et de la médiation:
Maitrise de la chaîne et des formats
Longue traine et économie de l’attention
Appréhender la collection numérique : le cas des bibliothèques
La médiation autour des documents numériques
51 Luc Bellier 2013
52. Les métadonnées comme point d’accès
» Interopérabilité sémantique
52 Luc Bellier 2013
58. Les métadonnées comme point d’accès
Interopérabilité sémantique
» « Web sémantique » ou « web de données », plutôt que web de documents
» RDF (Resource Description Framework)
Cadre de description d’une ressource
• Modélisation générale : vide de forme, vide de contenu
• Triplets : ressource (sujet), prédicat (relation), valeur (description)
» SKOS (Simple Knowledge Organisation System)
Système simple d’organisation des connaissances
SKOS permet d’organiser les rapports entre concepts
» SPARQL (Sparql Protocol and Query Language)
Protocole Sparql et langage d’interrogation
SPARQL est le pour interroger des données stockées en RDF
58 Luc Bellier 2013
61. Les métadonnées comme point d’accès
Interopérabilité sémantique
Une convergence inachevée : Les bibliothèques, les mondes marchand et les
acteurs de référence
Pour aller plus loin :
la nouvelle classification de la CLIL :
http://www.clil.org/information/detailDoc.html?docId=34
Un rapprochement entre les bibliothèques et l’édition :
http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_a
fnor_2012.html
61 Luc Bellier 2013
63. Les métadonnées comme point d’accès
Les nouvelles indexations : Folksonomies
» Définition
un processus de classification collaborative
par des mots-clés librement choisis
le résultat de cette classification
» Inconvénients
vocabulaire non normalisé :
• problèmes de polysémie, synonymie
• lemmatisation,orthographe
vocabulaire non structuré, sans hiérarchie ni relation sémantique
vocabulaire hétérogène
• mêlant le très spécifique (éventuellement à haut niveau d’expertise) et le
très superficiel
• pouvant être trop simple, trop peu d’expertise
• utilisant implicitement des univers de références
vocabulaire personnel (à lire, lu, à acheter, à la bibliothèque sur LibraryThing,
moi sur Flickr)
confusion entre pertinence et popularité
63 Luc Bellier 2013
64. Les métadonnées comme point d’accès
Les nouvelles indexations : Folksonomies
» Avantages :
indexation simple, gratuite et rapide
indexation cumulative
couverture documentaire totale
• sans exclusion des œuvres de fiction
• sans exclusion de types de documents
• incluant la description du contenu, et non seulement la classification sujet
(roman policier / peste)
largement auto-régulée
conforme aux usages du web
• dans les fonctions de recherche
• par les aspects égotiques et ludiques
- simultanéité de la consultation et de l’indexation
- absence de contrainte
- intervention personnelle : approche subjective, permettant l’indexation
orientée utilisateur / tâche
- défiance par rapport aux experts et à leur langage compliqué
64 Luc Bellier 2013
65. Les métadonnées comme point d’accès
Les nouvelles indexations : Folksonomies
65 Luc Bellier 2013
66. Les métadonnées comme point d’accès
Les nouvelles indexations : Folksonomies
66 Luc Bellier 2013
67. Les métadonnées comme point d’accès
Les nouvelles indexations : Folksonomies
67 Luc Bellier 2013
68. Les métadonnées comme point d’accès
Les nouvelles indexations : Folksonomies
68 Luc Bellier 2013
69. Les métadonnées comme point d’accès
Les nouvelles indexations : Folksonomies
» Une question en suspens
Quelle perception par les utilisateurs ?
• Différence entre un catalogue de bibliothèque et les autres sites web
• Calcul de la « pertinence » non remis en question
- Supériorité des algorithmes de classement dans la relation avec les
utilisateurs
69 Luc Bellier 2013
70. Les métadonnées comme point d’accès
Multiplier les points d’accès
70 Luc Bellier 2013
71. Les métadonnées comme point d’accès
Multiplier les points d’accès
71 Luc Bellier 2013
72. Les métadonnées comme point d’accès
Multiplier les points d’accès
En allégeant les développements
72 Luc Bellier 2013
73. Les métadonnées comme point d’accès
» Le document numérique est sur la toile
Le lecteur n’a plus besoin d’aller à
la bibliothèque pour lire son livre…
Et pas non plus sur le site de la
bibliothèque numérique, ou chez un
libraire
73 Luc Bellier 2013
74. Le document numérique
» Nature et structure du document numérique
La notion de document : d’une définition formelle à une approche par écosystème
Les types de fichiers : Les formats textes, les formats images, les formats multimédia
La granularité du document, structuration et déstructuration
» Produire et décrire le document numérique
Le cas de la numérisation
Le cas des de ePub
Les identifiants
» Les métadonnées
Les métadonnées pour la recherche
• Le cas des catalogues
• Le cas des moteurs
• Approche sémantique
Les métadonnées comme point d’accès
• Accès centralisés (catalogue et/ou moteur)
• Accès distribués fermés et ouverts (OAI, RSS et OPDS)
• L’interopérabilité sémantique
• Les nouvelles métadonnées (folksonomies)
• Multiplier les accès et multiplier les documents
» Les enjeux des accès et de la médiation:
Maitrise de la chaîne et des formats
Longue traine et économie de l’attention
Appréhender la collection numérique : le cas des bibliothèques
La médiation autour des documents numériques
74 Luc Bellier 2013
75. Les enjeux des accès et de la médiation
» Librairies en ligne, enjeux des dispositifs et des formats, longue traine et économie
de l’attention
75 Luc Bellier 2013
76. Les enjeux des accès et de la médiation
76 Luc Bellier 2013
77. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
77 Luc Bellier 2013
78. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
Exemple : ePub Fnac non lisible sur une autre tablette que la Kobo
78 Luc Bellier 2013
79. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
http://www.bnf.fr/fr/professionnels/autres_journees_professionnelles/a.journee_afnor_2012.html
79 Luc Bellier 2013
80. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
Rédaction Edition Fabrication
Vente numérique
BAT
Import xml pivot
Manuscrit Transformation
xml selon
Mise à
plateforme
Préparation du disposition des
Relecture
pivot XML intermédiaires
Corrections Exports des xml
modifiés
Liens avec les Modifications
Illustration documents des
externes métadonnées
Versions imprimées selon
Numérisation Ajouts des plateformes
Chargement métadonnées
Chargement sur
Iconographie Archivage les plateformes
Import xml pivot et validation
Transformation
xml selon
maquete
Exports des xml
BAT
modifiés
Versions numériques
81 Luc Bellier 2013
81. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
» Le Format Apple Ibooks
En avance technologique sur le marché
Lecture sur Tablette et Smartphone
Intègre des éléments multimédia
Fonctionnalités du reader avancées
» Le format Amazon KindleVersion Mobi 7 est un Epub version 1
Destiné à une liseuse à Encre électronique
Version KF8 s’approche de l’Epub 3
Destiné à une tablette
» Le format ADELisible sur le reader de Adobe
» SDK (DevKit) repris par de nombreux readers : tablettes et liseuses
82 Luc Bellier 2013
82. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
» Maitrise de la chaine s’oppose au développement du marché :
Le lecteur veut un livre qui se lit n’importe où et s’achète n’importe où
Le marché propose des livres selon le terminal de lecture
Le lecteur veut lire et relire sur tous ses terminaux
Le marché n’autorise qu’un terminal ou seuls les terminaux autorisés par le
revendeur
Je veux lire mes livres même si je change de terminal
Le marché ne m’autorise pas à changer de terminal sans renoncer à mes livres
83 Luc Bellier 2013
83. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
» La maitrise des conditions de lecture et donc de mise en valeur du texte passe par
:
La maitrise des formats et de leurs possibilités (sous-traitant des éditeurs)
La maitrise des dispositifs et appareils (fabricants) ainsi que les modalités d’exploitation des fichiers
(éditeurs de logiciel)
Au moment de l’édition du document et à tout moment après (obsolescence des formats,
incompatibilité ascendante)
La maitrise des conditions de mise en vente ou d’accès sur la plate-forme (mise en avant, conditions
tarifaires, accompagnement etc.)
» Cette maitrise n’est jamais totalement partagée : la médiation et la maitrise
technique de la totalité de la chaine sont donc imparfaites, avec un fort avantage
aux grandes plateforme Apple et Amazon.
Par le financement de la création de contenus adaptés à leur format et sur les segments définis par
eux.
Par la validation préalable des contenus proposés avant la mise en vente :
• Un manuel scolaire gratuit et sous licence CC retiré par Apple :
http://www.ralentirtravaux.com/le_blog/?p=1843
• Changement des conditions juridiques aboutissant au retrait d’ouvrages y compris quand ils ont
été vendus : http://www.ebouquin.fr/2009/07/20/amazon-fait-disparaitre-des-livres-de-orwell-sur-le-
kindle/
84 Luc Bellier 2013
84. Le document numérique
» Nature et structure du document numérique
La notion de document : d’une définition formelle à une approche par écosystème
Les types de fichiers : Les formats textes, les formats images, les formats multimédia
La granularité du document, structuration et déstructuration
» Produire et décrire le document numérique
Le cas de la numérisation
Le cas des de ePub
Les identifiants
» Les métadonnées
Les métadonnées pour la recherche
• Le cas des catalogues
• Le cas des moteurs
• Approche sémantique
Les métadonnées comme point d’accès
• Accès centralisés (catalogue et/ou moteur)
• Accès distribués fermés et ouverts (OAI, RSS et OPDS)
• L’interopérabilité sémantique
• Les nouvelles métadonnées (folksonomies)
• Multiplier les accès et multiplier les documents
» Les enjeux des accès et de la médiation:
Maitrise de la chaîne et des formats
Longue traine et économie de l’attention
Appréhender la collection numérique : le cas des bibliothèques
La médiation autour des documents numériques
85 Luc Bellier 2013
85. Les enjeux des accès et de la médiation
» Maitrise de la chaine et des formats
86 Luc Bellier 2013
86. Les enjeux des accès et de la médiation
» Longue traine et économie de l’attention
» De nouvelles conditions définissent de nouvelles règles et de nouvelles façons de
travailler : la longue traine
notion apparue en 2004, sous la plume de Chris Anderson pour décrire le
modèle économique de sociétés comme Amazon.
La masse critique permise par un marché ouvert et par l’absence de magasin
physique grâce au web permet d’élargir le catalogue des produits à vendre
http://fr.wikipedia.org/wiki/Longue_tra%C3%AEne
http://www.bibliobsession.net/2011/04/27/quels-criteres-pour-utiliser-la-longue-traine-2/
» L’économie de l’attention : dans le cadre d’une concurrence entre les médias, la
bataille se livre sur « le temps de cerveau disponible ». La concurrence n’est donc
pas uniquement au sein du monde marchand, mais entre l’ensemble des espaces
qui proposent des ressources
http://fr.wikipedia.org/wiki/%C3%89conomie_de_l%27attention
http://fr.slideshare.net/phcouve/lconomie-de-lattention-presentation
87 Luc Bellier 2013
87. Temps continu Les enjeux des accès et de la médiation
Web media révolutionne
le modèle économique
Tv radios Tv radios
TNT Satellite Zone de
hypothétique de
partage entre
paiement par les
annonceurs et les
particuliers
Seuil indicatif
Presse de rentabilité
cinéma
revues
édition
Temps
discontinu
rareté abondance
88 Luc Bellier 2013
88. Le document numérique
» Nature et structure du document numérique
La notion de document : d’une définition formelle à une approche par écosystème
Les types de fichiers : Les formats textes, les formats images, les formats multimédia
La granularité du document, structuration et déstructuration
» Produire et décrire le document numérique
Le cas de la numérisation
Le cas des de ePub
Les identifiants
» Les métadonnées
Les métadonnées pour la recherche
• Le cas des catalogues
• Le cas des moteurs
• Approche sémantique
Les métadonnées comme point d’accès
• Accès centralisés (catalogue et/ou moteur)
• Accès distribués fermés et ouverts (OAI, RSS et OPDS)
• L’interopérabilité sémantique
• Les nouvelles métadonnées (folksonomies)
• Multiplier les accès et multiplier les documents
» Les enjeux des accès et de la médiation:
Maitrise de la chaîne et des formats
Longue traine et économie de l’attention
Appréhender la collection numérique : le cas des bibliothèques
La médiation autour des documents numériques
89 Luc Bellier 2013
89. Les enjeux des accès et de la médiation
» Appréhender la collection numérique : le cas des bibliothèques
90 Luc Bellier 2013
90. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
Identifier
Sélectionner Collecter
Produire Stocker
Préserver Transformer
Gérer Communiquer
Diffuser
Bibliothèque
numérique
en ligne
Données /
Métadonnées
91 Luc Bellier 2013
91. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
Catalogue Catalogue
public (OAI)
Serveurs
d’archives BdD de
gestion
Serveurs de
consultation
Données /
Métadonnées
92 Luc Bellier 2013
92. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
La collection numérique
Les collections ?
Reliés
Numérique natif
Films
93 Luc Bellier 2013
93. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
Centre de ressources Centre de ressources partenaires
(Bibliothèques centre de documentation)
Accès
Catalogue
Catalogues Entrepôt
ouverts (OAI) (OAI)
Serveurs
d’archives BdD de
gestion Serveurs de
consultation
Données / Numérique natif
Métadonnées
94 Luc Bellier 2013
94. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
Centre de ressources Accès par
abonnement Prestataire, Éditeur, agrégateur
(Bibliothèques centre de documentation)
Catalogue Catalogues
ouverts (OAI) Serveurs
d’archives
BdD de
gestion
Serveurs de
consultation
Numérique natif
Données /
Métadonnées
95 Luc Bellier 2013
95. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
Catalogue Catalogue
public (OAI)
Serveurs
d’archives BdD de
gestion Serveurs de Droits
consultation d’accès
Droits
Données / d’accès
Métadonnées
Salle de
http:/www Outils de lecture
Catalogue Magasin gestion
(conservation,
Catalogue public acquisition, prêt)
96 Luc Bellier 2013
96. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
LOC
97 Luc Bellier 2013
97. Les enjeux des accès et de la médiation
» Appréhender la collection numérique
» La dispersion documentaire des collections numériques est aussi une dispersion
ou un partage des tâches, des compétences et des responsabilités.
» Elle soulève la question de l’investissement des professionnels de l’information
dans les questions informatiques et/ou des professionnels de l’informatiques dans
le domaine documentaire.
» Ce rapprochement ne peut s’opérer sans une formation des professionnels de
l’information aux technologies de plus en plus pointue de l’informatique
documentaire, dont le champs dépasse celui du catalogue :
Archivage et conservation
Accès
Formats de structuration des documents numériques.
98 Luc Bellier 2013
98. Division technique de la lecture
su
Outil de stockage
lu/vu/su lu
+
Outil de stockage Outil de diffusion
Outil de diffusion Outil d’accès
=> + =>
lu/vu
+ lu/vu
Dispositif de Outil d’accès
lecture, Outil de stockage
Outil de Dispositif de lecture
stockage
Outil de +
diffusion, Outil vu/su
d’accès Dispositif de lecture,
http://www. Outil d’accès
Outil d’accès
Outil de stockage
Outil de diffusion
99 Luc Bellier 2013
99. Le document numérique
» Nature et structure du document numérique
La notion de document : d’une définition formelle à une approche par écosystème
Les types de fichiers : Les formats textes, les formats images, les formats multimédia
La granularité du document, structuration et déstructuration
» Produire et décrire le document numérique
Le cas de la numérisation
Le cas des de ePub
Les identifiants
» Les métadonnées
Les métadonnées pour la recherche
• Le cas des catalogues
• Le cas des moteurs
• Approche sémantique
Les métadonnées comme point d’accès
• Accès centralisés (catalogue et/ou moteur)
• Accès distribués fermés et ouverts (OAI, RSS et OPDS)
• L’interopérabilité sémantique
• Les nouvelles métadonnées (folksonomies)
• Multiplier les accès et multiplier les documents
» Les enjeux des accès et de la médiation:
Maitrise de la chaîne et des formats
Longue traine et économie de l’attention
Appréhender la collection numérique : le cas des bibliothèques
La médiation autour des documents numériques
100 Luc Bellier 2013
100. Les enjeux des accès et de la médiation
» La médiation autour des documents numériques
101 Luc Bellier 2013
101. Intégration dans un environnement personnel
» Un nouveau cadre de signalement
Rejoindre l’utilisateur dans son lieu de travail / de consultation
(la bibliothèque hors les murs et le prêt entre bibliothèques)
Offrir de nouveaux services de veille
(étagère des nouvelles acquisitions, lettre d’information, expositions
temporaires)
Faciliter la consultation des documents
102 Luc Bellier 2013
102. Intégration dans un environnement personnel
» S’adresser à l’utilisateur et l’Informer des nouveautés, lui permettre de faire ce qu’il n’appelle
pas la « veille documentaire »
lettres d’information
Fils RSS : actualité de la bibliothèque uniquement (Cervantes virtual)
Fils RSS sur les contenus
• paramétrage générique (BU Laval, BU Illinois, Jubil, SCD Lyon 3, WNCLN, Project
Gutenberg)
• paramétrage par l’utilisateur
- lors de la recherche (Saphir, enssib, National Libr. of Ireland)
- après authentification (WNCLN)
• paramétrage par type de document : si ressources audio numérisées, prévoir
l’abonnement au podcast (Collège de France, Kankakee Public Library Podcast)
• dans bibliothèque numérique ou sur le portail de l’institution
103 Luc Bellier 2013
110. La communauté d’une bibliothèque
» Ajouter une interface de publication flexible ?
Intégrer la bibliothèque numérique à la bibliothèque ou à l’institution ?
comment ? Qui l’alimente et à quel rythme ? En quel nom ?
» Blog
La solution du blog est-elle la meilleure ? Un blog séparé avec seulement un fil RSS
inclus dans le portail de la bibliothèque numérique ?
Le blog permet d’autres relations avec l’usager qui sortent du cadre de la veille :
• Proximité de ton
• Publier des critiques d’ouvrages (prescription)
• Faire participer la communauté (commentaires)
• Rendre la bibliothèque plus transparente & expliquer le fonctionnement, le jargon,
le backoffice de la bibliothèque numérique, les évolutions des fonctionnalités, les
dysfonctionnements, les perspectives
Rendre compte des animations
Le blog permet éventuellement de favoriser un travail de médiation léger et collaboratif
111 Luc Bellier 2013
115. De nouveaux outils de signalement
»les protocoles d’échanges de métadonnées
»Multiplier les documents numériques
»La médiation numérique
… la recommandation par les lecteurs…
116. Un nouveau signalement : la recommandation
» Explicite / Implicite
» Par service dédié extérieur à la bibliothèque numérique / à l’intérieur de la
bibliothèque
117 Luc Bellier 2013