Bibliothèques et crowdsourcing

437 vues

Publié le

Stage Master 2 Politique des bibliotèques et de la documentation (ENSSIB), 11 janvier 2017

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
437
Sur SlideShare
0
Issues des intégrations
0
Intégrations
110
Actions
Partages
0
Téléchargements
5
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Bibliothèques et crowdsourcing

  1. 1. Bibliothèques et crowdsourcing Stage ENSSIB – PBD 11 janvier 2017 Pauline Moirez, BnF Jean-Philippe Moreux, BnF CCBY-NC-ND_NDenis,Flickr
  2. 2. CCBY-NC-SAEmilyTaliaferroPrince,Flick Inventer de nouvelles relations avec nos publics
  3. 3. S’inscrire dans un écosystème où l’interaction est la norme CCBY-NCDCSmith,Flickr RESEAUX SOCIAUX WEB MOBILE WEB SOCIAL GEOLOCALISATION GAMIFICATION
  4. 4. Galleries Libraries Archives Muséums Echanger avec les autres institutions patrimoniales et culturelles Diapo inspirée d’Antoine Courtin
  5. 5. Comprendre et se conformer aux codes d'usages du web
  6. 6. CCBY-NC-ND,Flickr Pour enrichir nos collections et les services rendus à nos usagers
  7. 7. C’est une mission pour Super Librarian !
  8. 8. Au programme 1. Contexte et enjeux du crowdsourcing pour les bibliothèques 2. Typologie de projets 3. Retour d’expérience sur la plateforme de correction d’OCR CORRECT 4. Contenus et données : qualité, nature, cadre juridique 5. Recruter et motiver les publics Et des ateliers pratiques
  9. 9. CCBY-NCdrcoop,Flickr Contexte et enjeux du crowdsourcing pour les bibliothèques
  10. 10. Arrêtons de parler de web 2.0… CCBY-NC-NDJoshFassbind,Flickr
  11. 11. Médias sociaux ou web social ?
  12. 12. Les projets Wikimedia CCBY-SAWikimediaFoundation Le web collaboratif
  13. 13. CCBY-NC-SAmonmimoun,Flickr Une terminologie fluctuante… qui reflète différentes réalités Crowdsourcing Web collaboratif Web participatif Métadonnées sociales Production participative Community sourcing
  14. 14. Les archives participatives Kate Theimer Un organisme, un site ou une collection auxquels des personnes qui ne sont pas des professionnels des archives apportent leur connaissance ou ajoutent des contenus, généralement dans un contexte numérique en ligne. Il en résulte une meilleure compréhension des documents d’archives.
  15. 15. Le musée participatif Nina Simon « Je définis une institution culturelle participative comme un endroit où les visiteurs peuvent créer, partager et échanger entre eux autour des objets culturels. »
  16. 16. CCBY-NCryancr,Flickr Les enjeux culturels de la participation
  17. 17. CCBY-NDJeremySalmon,Flickr L’économie de la recommandation
  18. 18. Notation et critiques BM de Saint-Herblain
  19. 19. Les « playlists » de l’INA Organisation de l’information par les usagers
  20. 20. What’s your MET ? au Metropolitain Museum Marketing viral
  21. 21. CCBY-NDiT@c,Flickr Sciences citoyennes
  22. 22. Ancient Lives (Université d’Oxford)
  23. 23. Muséum d’histoire naturelle VigieNature BirdLab Les Herbonautes
  24. 24. Citizen Archivist (AN Etats-Unis)
  25. 25. CCBY-NC-NDLibelulle,Flickr
  26. 26. Métadonnées sociales CCBYyoppy,Flickr
  27. 27. CCBY-NC-NDRickydavid,Flickr Catalogues enrichis Granularité de description plus fine Plein texte Construction de nouveaux services
  28. 28. L’indexation de la bibliothèque Indexation en langage naturel (folksonomies) Le tagging des usagers La Library of Congress sur Flickr : plus de 20000 photographies, 67000 tags ajoutés
  29. 29. Operation War Diaries (Archives nationales du Royaume-Uni) Indexation collaborative
  30. 30. Identification de photographies BM de Lyon
  31. 31. Identification de vidéos Mémoire – Les images d’archives (CICLIC)
  32. 32. Catalogage collectif de manuscrits Manuscrits islamiques de l’Université du Michigan
  33. 33. Rétroconversion de fichiers papiers Convert-a-Card (Libcrowds, British Library)
  34. 34. Géolocalisation des contenus Map Warper de la NYPL : géoréférencement de cartes anciennes
  35. 35. CCBY-NC-SAmikeVC,Flickr Plein texte
  36. 36. « Many hands make light work » Trove (Bibliothèque nationale d’Australie) Correction collaborative d’OCR
  37. 37. Transcription collaborative AnnoTate (Tate Gallery)
  38. 38. Edition collaborative Transcribe Bentham (Université de Londres)
  39. 39. Edition annotée Candide 2.0 (New York Public Library)
  40. 40. SHS participatives Transcrire (Huma-Num)
  41. 41. Co-création de contenus et de savoirs CCBY-NCDonMcCullough,Flickr
  42. 42. CCBY-SAJennyYE,WikimediaCommons « Editathons » (journées contributives) British Library
  43. 43. Un wiki pour une institution La « Rosalipédie » de la bibliothèque numérique de Toulouse
  44. 44. Inventaires participatifs Le Laboratoire des internautes des AD Vendée
  45. 45. La « Grande collecte » 1914-1918 Collecte de documents privés
  46. 46. Moving Here – 200 years of migrations in England (AN Royaume-Uni) Collecte d’archives orales
  47. 47. Une exposition sur place créée par les internautes au Brooklyn museum Co-création d’exposition
  48. 48. Hackathon BnF 2016 Hackathons Projet Gallicarte Projet GallicaLOL
  49. 49. CCBY-NC-NDjonathan_W,Flickr Crowdfunding
  50. 50. CCBYAmandaB,Flickr Le crowdsourcing à la BnF : retour d’expérience sur le projet Correct
  51. 51. Disposer d’un mode texte de bonne qualité - Recherche plein texte - Accessibilité (synthèse vocale) - Text mining  OCR automatique insatisfaisant  Nécessité d’une relecture humaine Source:Gallica
  52. 52. OCR Diapo empruntée à I. Josse
  53. 53. Etude sur les usages collaboratifs (Plein Sens, 2008)  « échanger sur Gallica, on n’y pense pas » Depuis 2010 : médiation numérique, communauté des Gallicanautes Etude Usage et satisfaction de Gallica (GMV, 2011) Source:Gallica
  54. 54. Les Gallicanautes brûlent de corriger Gallica ! Source : Twitter. Diapo empruntée à M. Leroy-Terquem
  55. 55. Les bibliothécaires sont de plus en plus favorables au crowdsourcing - Complémentarité des métadonnées professionnelles et sociales - Multiplication des sources de données (dérivation de notices, éditeurs, etc.) Source:Gallica
  56. 56. Ouverture de 1365 documents sur la bibliothèque numérique Wikisource - S’appuyer sur une plateforme préexistante (éditeur de texte) et des contributeurs wikisourciens - Expérimenter un premier projet collaboratif Source:Gallica
  57. 57. Fin 2016 : 111 documents corrigés par une double vérification ; 153 documents validés par un seul correcteur - Faiblesse de la communication et de la médiation institutionnelle - Difficulté de s’insérer dans la communauté des Wikisourciens - Difficulté de réintégrer les documents produits Source:Gallica
  58. 58. Conception de la plateforme collaborative Correct de correction et d’enrichissement de documents numérisés 9 partenaires : - Coordination : Orange Labs - Entreprises : Jamespot, Urbilog, I2S - Labos de recherche : ISEP, INSA Lyon, Université Claude Bernard, Paris 8 - Institution culturelle : BnF
  59. 59. Moteur autocontrôle Editeur de correction Réseau social Diapo empruntée à I. Josse
  60. 60. 2012-2013 2013-2014 2014-2015 RECHERCHE / PROTOTYPE 66 EXPERIMENTATION Expérimentation 3 Observation continue des activités de la plateforme Réalisation d’une étude d’usage Expérimentation 1 En avril 2013 , expérimentation du 1er prototype de l’éditeur de correction Expérimentation 2 Le 19 juin à La BnF, expérimentation en réseau, réalisée simultanément à distance et à la BnF Editeur de correction Module réseau social Ouverture de Correct Diapo empruntée à I. Josse
  61. 61. Diapo empruntée à I. Josse
  62. 62. Le cadre juridique - Les métadonnées descriptives : open data (licence Etalab) - Les documents numérisé et l’OCR : licence spécifique de Gallica (toutes réutilisations privées ou publiques sauf commerciales) - Les données produites : entrent dans la licence Gallica (pas de mention des contributeurs)
  63. 63. Recrutement et motivation des usagers - La communauté des Gallicanautes : communication sur les réseaux sociaux et sur Gallica - Choix des corpus : - Documents les plus consultés de Gallica (ésotérisme, récits de voyages) - Usages constatés sur le web : romans d’anticipation, gastronomie - Sujets « tous publics » : littérature populaire, contes d’ici et d’ailleurs - Lien à l’actualité : Première guerre mondiale
  64. 64. Un pari : un projet de crowdsourcing appuyé sur un réseau social - Miser sur l’entraide des usagers pour organiser le travail de participation et assurer la qualité de la production - Parier sur l’échange social comme levier de motivation - Objectif : susciter l’appropriation de la plateforme par les usagers, passer de la participation à la collaboration - L’exemple du groupe Lecteurs.com
  65. 65. Résultats de l’étude d’usages de la plateforme Correct (nov. 2014-jan.2015) - Analyse des statistiques - Questionnaire en ligne - Focus groups - Recueil de carnets d’activité
  66. 66. Quelques chiffres 369 inscrits en deux mois - pics liés aux actions de communication - 47% ont « décroché » en 48 heures
  67. 67. 3 701 pages corrigées sur un total de 16 805 pages (62 ouvrages proposés), soit environ 22% du nombre total des pages. 37 contributeurs (soit 8% des inscrits) ont assuré 63% des corrections totales dont 10 ont réalisés à eux-seuls 50% du total des corrections. Quelques « super-contributeurs »
  68. 68. Profils des contributeurs - Bibliothécaires - Enseignants et chercheurs - Amateurs de culture, bibliophiles - Technophiles
  69. 69. « C’est comme les mots croisés mais c’est utile » - Mais des outils d’échanges et de collaboration peu utilisés : 75% des contributeurs n’ont jamais échangé avec d’autres. - même si la correction est une activité solitaire, la présence des autres contributeurs sur la plateforme accroît la motivation. « Je ne suis pas rentré en contact pour l’instant avec les autres utilisateurs de Correct mais cela m’intéresserait de le faire avec les personnes qui corrigent un document qui m’intéresse. » Des interfaces agréables
  70. 70. Motivation des usagers - découvrir des documents (intérêt scientifique, curiosité), - participer à l’amélioration de Gallica - contribuer de manière citoyenne à un projet de la BnF - envie de voir l’aboutissement des corrections sur un document (satisfaction ou plaisir du travail fini)
  71. 71. Attention aux enjeux techniques ! • Prévoir la réintégration des données enrichies/corrigées • Penser aux : – formats techniques – SI de l'institution – cycles de vie des objets numériques – coûts/gains – mesure de la qualité
  72. 72. CCBY-NC-SAJoanaHard,Flickr Contenus et données
  73. 73. CCBY-SAe3000,Flickr Comment assurer la qualité des données produites ?
  74. 74. DigitalKoot, correction collaborative d’OCR (Bibliothèque nationale de Finlande) Des microtâches très encadrées
  75. 75. S’assurer de la compétence des usagers Examen de paléographie pour l’indexation collaborative aux AD Ain
  76. 76. Evaluation sociale et validation par des experts Transcribe Bentham (University College London)
  77. 77. Automatisation des vérifications Old Weather (Archives nationales du Royaume-Uni)
  78. 78. Miser sur l’encadrement et l’entraide des contributeurs Plateforme Correct : activité de correction appuyée sur un réseau social
  79. 79. Utilisation de référentiels JocondeLab (Ministère de la Culture)
  80. 80. CCBYRobertCouse-Baker,Flickr Quels lieux pour les projets de crowdsourcing ?
  81. 81. History Pin (Archives nationales d’Australie) Sur une plateforme extérieure
  82. 82. Sur une plateforme dédiée Le Wiki de la Grande Guerre (département des Yvelines)
  83. 83. Au cœur du catalogue Trove (Bibliothèque nationale d’Australie)
  84. 84. CCBY-NDripplestonegarden,Flickr Quels réintégration des données produites ?
  85. 85. Contribuer sans réintégrer les données Ateliers Wikipedia / Centre Pompidou
  86. 86. Afficher dans un catalogue des données produites ailleurs La Babelthèque dans le catalogue de la BM de Toulouse
  87. 87. Questions juridiques CCBY-SAMichaelCoghlan,Flickr
  88. 88. Open data (métadonnées) et open content (documents numérisés) BnF : data.bnf.fr, toutes les données des catalogues Images numérisées de la BNUS Mairie de Toulouse (Archives, Musée des Augustins) Œuvres du Rijksmuseum
  89. 89. Open data et culture
  90. 90. Les licenses Creative Commons
  91. 91. Proposer un cadre clair et explicite Trove (Terms of use)
  92. 92. Rendre aux usagers ce qui appartient aux usagers ? Mémoire des hommes (Ministère de la Défense)
  93. 93. Créditer les contributeurs Annotations trouvées dans les registres d’état-civil (AD Mayenne)
  94. 94. Reconnaître les contributeurs comme co-auteurs Foldit : des contributeurs crédités comme auteurs des articles scientifiques
  95. 95. CCBYMarcCornelis,Flickr Recruter et motiver les publics
  96. 96. Atteindre la masse critique ? CCBY-NC-NDLuluWitch,Flickr
  97. 97. La loi de participation : « 90-9-1 » Et à l’heure du web social ? Source:BBC
  98. 98. Choisir ses publics - Public local / national / international - Tous publics ou publics ciblés : - Généalogistes ou érudits locaux (ex. indexation collaborative des documents nominatifs) - Enfants, scolaires (ex. atelier Wikipedia) - Professionnels du patrimoine - Non-voyants (ex. plateforme Correct) - Chercheurs, Digital humanities (ex. Transcrire)
  99. 99. Identifier les leviers de motivation des publics choisis - Participation citoyenne - Intérêt scientifique - Curiosité technophile - Sentiment de communauté (ex. Transcribe Bentham) - Interfaces agréables - Intense animation et médiation (on aime être sollicité) - Mais aussi…
  100. 100. Gamification Metadatagames (Dartmouth College)
  101. 101. Choix des corpus Do it yourself history (Université de l’Iowa)
  102. 102. Système de récompenses ArcHIVE, transcription collaborative des inventaires des AN d’Australie
  103. 103. Bibliographie sommaire E. Bouyé, « Le web collaboratif dans les services d’archives publics : un pari sur l’intelligence et la motivation des publics », La Gazette des Archives, n°227 (2012-3). B. W. Brumfield, « Control for Crowdsourced Transcription », Collaborative Manuscript Transcription, 2012. Construire des pratiques participatives dans les bibliothèques, dir. Raphaëlle Bats, Presses de l’ENSSIB, 2015 A. Chardonnens, Collections iconographiques numérisées et crowdsourcing : Possibilités et limites de la co-création de métadonnées par le grand public au travers de trois études de cas, mémoire pour le diplôme de Master en Gestion culturelle, université libre de Bruxelles, 2015. D. Day, Enjeux, état des lieux et dynamiques de participation en bibliothèques, mémoire pour le diplôme de conservateur des bibliothèques, ENSSIB, 2014, A. Neroulidis, Le crowdsourcing appliqué aux archives numériques : concepts, pratiques et enjeux, mémoire pour le diplôme de master en sciences de l’information et des bibliothèques, ENSSIB, 2015. P. Moirez, « Archives participatives », dans Bibliothèques 2.0 à l’heure des médias sociaux, dir. M. Amar et V. Mesguich, 2012, p. 187-197. P. Moirez, « Bibliothèques, crowdsourcing, métadonnées sociales », BBF (sept. 2013). P. Moirez, J.-P. Moreux, I. Josse, Etat de l’art en matière de crowdsourcing dans Les bibliothèques numériques, 2013. K. Smith-Yoshimura, C. Shein, Social Metadata for Libraries, Archives, and Museums, OCLC, 2011-2012. K. Theimer, « The participatory archives », Archives Next, 2011.
  104. 104. Merci de votre attention CCBY-NCGoEsewhere,flickr pauline.moirez@bnf.fr @archives_masala jean-philippe.moreux@bnf.fr

×