Oe Abes Mai2008

9 547 vues

Publié le

Folksonomies et indexation sociale : le monde comme catalogue. Intervention aux journées ABES. 21 Mai 2008

Publié dans : Technologie
0 commentaire
7 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
9 547
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2 397
Actions
Partages
0
Téléchargements
105
Commentaires
0
J’aime
7
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Oe Abes Mai2008

    1. 1. Indexation sociale et folksonomies : le monde comme catalogue. .Olivier ERTZSCHEID. Maître de conférences en sciences de l’information Université de Nantes / IUT La Roche sur Yon http://www.affordance.info Journées ABES. Montpellier. 20 et 21 Mai 2008
    2. 2. Le Pitch <ul><li>A l'heure du web 2.0, les technologies d'indexation sociale prennent de plus en plus de place dans le repérage, le classement, la hiérarchisation et l'accès à l'information et aux documents. </li></ul><ul><li>Les pratiques professionnelles se dissolvent dans les usages amateurs . </li></ul><ul><li>Quelles sont les frontières et les enjeux de cette nouvelle bibliothéconomie de masse pour la société de la connaissance ? </li></ul>
    3. 3. Demandez le programme Chapitre 1 er : Définitions & Exemples Chapitre 2 nd : Folksonomistes : qui sont-ils ? Chapitre 3 ième : Pourquoi ça marche ? Chapitre 4 ème : Quelles pratiques ? Chapitre 5 ème : Quel avenir ? Chapitre 6 ème : Le monde comme pan-catalogue.
    4. 4. L’indexation sociale ou « Folksonomie » Définitions & Exemples
    5. 5. « Ce n’est pas sale ! »
    6. 6. Définition <ul><li>«  Folksonomies désignent </li></ul><ul><ul><li>un processus de classification collaborative </li></ul></ul><ul><ul><li>par des mots-clés librement choisis </li></ul></ul><ul><ul><li>Ou le résultat de cette classification.  » (Wikipédia) </li></ul></ul>
    7. 7. ≠ thesaurus <ul><li>« vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine » </li></ul>
    8. 8. ≠ ontologie <ul><li>« ensemble structuré de concepts. (…) </li></ul><ul><li>organisés dans un graphe (…) </li></ul><ul><li>relations sémantiques et de composition ou d'héritage. » </li></ul>
    9. 9. Folksonomie ≠ thesaurus ≠ ontologie <ul><li>«  Folksonomies désignent </li></ul><ul><ul><li>un processus de classification collaborative </li></ul></ul><ul><ul><li>par des mots-clés librement choisis </li></ul></ul><ul><ul><li>Ou le résultat de cette classification.  » </li></ul></ul><ul><li>Vocabulaire non-normalisé, </li></ul><ul><li>non-structuré, </li></ul><ul><li>non-spécifique à un domaine, </li></ul><ul><li>sans relations sémantiques ou hiérarchiques. </li></ul>
    10. 10. Le petit folksonomiste illustré Source : Agnès de Saxcé BBF 2007 - Paris, t. 52, n° 4. Compte-rendu du colloque évaluation et validation de l’information.
    11. 11. 5 étapes d’indexation Web <META> Communauté de pratique Web Sémantique FOLKSONOMIES Communauté D’usage DUBLIN-CORE OAI-PMH Communauté Métier / Ressources ONTOLOGIES Communauté compétences (Outils + métier) ? ? Standardisation Linguistique de corpus GOOGLE PageRank « Indexeurs sans le savoir »
    12. 12.
    13. 13.
    14. 14. Dél.icie.uses folksonomies
    15. 15. FolsonomiSTES Martiens ? Visionnaires ? Gourous ? Une secte ? Indexeurs du troisième type ? ? Pour ou contre ?
    16. 16. Qui indexe ? <ul><li>Usagers, </li></ul><ul><li>Consommateurs, </li></ul><ul><li>Producteurs, </li></ul><ul><li>Auteurs, </li></ul><ul><li>Novices, </li></ul><ul><li>Experts. </li></ul>Textes Docs de travail Articles scientifiques Billets de blogs Photos Vidéos A moi Aux autres A la volée En surface En profondeur (deep tagging) En connaissance de cause Au hasard Pour moi (tags privés) Pour les autres (tags publics) Organiser, Partager, Chercher, Retrouver Associer, « Participer » Quoi ? Pourquoi ? Comment ?
    17. 17. Digital Natives / Digital immigrants La loi de (rupert) Murdoch <ul><li>Sites pratiquant/proposant l’indexation sociale/communautaire sont </li></ul><ul><ul><li>Majoritairement créés par de jeunes entrepreneurs (start-up) </li></ul></ul><ul><ul><li>Majoritairement utilisés par un public « jeune » </li></ul></ul><ul><ul><li>Majoritairement rachetés par des « digital immigrants » </li></ul></ul>
    18. 18. ? Avantages = Inconvénients ? <ul><li>Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite </li></ul><ul><li>Intérêt d’un filtrage collaboratif </li></ul><ul><li>gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs) … </li></ul><ul><li>Couverture documentaire totale (documents, livres, photos, couriels, cartes géographiques …) </li></ul><ul><li>Conforme aux usages (onebox, oneword) </li></ul><ul><li>Trop simple, trop peu d’expertise, trop d’hétérogénéité </li></ul><ul><li>Confusion entretenue entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement) </li></ul><ul><li>polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.) </li></ul><ul><li>= Méta-bruit </li></ul>
    19. 19. ? Avantages = Inconvénients ? <ul><li>« Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. » </li></ul><ul><li>Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation. </li></ul><ul><li>Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises. </li></ul><ul><li>Mais sur les objets ? </li></ul><ul><ul><li>Qui va se lancer dans une entreprise de classification aristotélicienne des photos de vacances de 100 000 personnes sur FlickR ? </li></ul></ul><ul><ul><li>Doit-on décider qu’elles sont inclassables ?? </li></ul></ul>
    20. 20. Pourquoi ça marche ?? « Si l'on tague &quot;A la recherche du temps perdu&quot;, dans son édition de 1947 en 15 volumes (disponible en téléchargement ici), on trouve 442 occurrences du prénom &quot;Odette&quot; sur les quelques 5000 pages de l'ouvrage. Et pourtant Proust ne l'a pas appelé &quot;A la recherche d'Odette ». (à noter qu'on ne trouve que 24 &quot;madeleine&quot;). Comme quoi les tags c'est de la merde. Et les taguers des branleurs. » Commentaire d’un billet publié sur Embruns.net (blog de Laurent Gloaguen)
    21. 21. Une image vaut 1000 mots (clés ?) Graphic by Elliancet in Search Engine Land.
    22. 22. Les raisons du succès <ul><li>Temporalité réunifiée entre interface et indexation </li></ul><ul><li>La fonction symbolique plutôt que la vocation analytique. </li></ul><ul><li>Sagesse des foules </li></ul><ul><li>Auto-régulation </li></ul><ul><li>Faible coût cognitif </li></ul><ul><li>(enfin une) Indexation orientée-tâche </li></ul>1 2 3 4 5 6
    23. 23. Les raisons du succès (1/5) : Une temporalité (ré?)unifiée entre interface et indexation <ul><li>Temps consultation ≈ temps de l’accès ≈ temps de l’indexation </li></ul><ul><li>Micro-temporalités successives, parfois simultanées, jamais contraintes, sans préalables. </li></ul><ul><li>Langages documentaires & formels (Thésaurus & ontologies) pour l’accès à l’information : </li></ul><ul><ul><li>Interfaces asynchrones. </li></ul></ul><ul><ul><li>Nbre textes > nbre d’indexeur = temporalité interfaçage longue </li></ul></ul><ul><ul><li>Acculturation difficile </li></ul></ul><ul><li>Folksonomies </li></ul><ul><ul><li>Interface synchrone. Le temps de l’indexation est le même que celui de l’accès et du repérage. </li></ul></ul><ul><ul><li>Nbre documents < = nbre d’indexeurs = temporalité interfaçage courte (simultanée) </li></ul></ul><ul><ul><li>Acculturation a priori. </li></ul></ul>
    24. 24. Les raisons du succès (2/5) : La fonction symbolique plutôt que la vocation analytique. <ul><li>Vocation analytique des langages documentaires & formels : </li></ul><ul><ul><li>classer physiquement et/ou conceptuellement selon la nature de l’objet </li></ul></ul><ul><ul><li>Univers de référence « construit » par l’indexeur, l’expert et l’état des connaissances au moment de l’indexation </li></ul></ul><ul><ul><li>Approche « objective », logique ou logiciste </li></ul></ul><ul><li>Fonction symbolique Folksonomies : </li></ul><ul><ul><li>Repérer sémantiquement pour accéder et/ou représenter l’objet. </li></ul></ul><ul><ul><li>Univers de référence induit par l’objet lui-même et le rapport objet/indexeur (affordance) </li></ul></ul><ul><ul><li>Approche « subjective », empirique, « essai et erreur » </li></ul></ul>
    25. 25. Les raisons du succès (3/5) : la sagesse des foules <ul><li>«  (…) N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable . Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)...  » Adam Bosworth, VP ingénierie chez Google. </li></ul><ul><li>Postule l’existence pour tout élément donné (texte, image, document) d’une série de mots et termes composant le plus petit lexique commun (concensus) permettant de décrire l'objet ou le document. </li></ul>
    26. 26. Les raisons du succès (4/5) : un faible coût cognitif <ul><li>Marquage élimine la phase de décision (choix de la bonne catégorie) </li></ul><ul><li>Dissipe la phase de paralysie d’analyse (choix du mot-clé) </li></ul><ul><li>Permet l’ancrage en contexte socio-cognitif immédiat. </li></ul><ul><ul><li>Google image labeller : http://images.google.com/imagelabeler/ </li></ul></ul><ul><li>Hiérarchie centrée document VS anarchie centrée utilisateur MAIS … </li></ul><ul><li>Confirmation de l’axiomatique du memex : </li></ul><ul><ul><li>« human mind doesn’t work that way » </li></ul></ul><ul><ul><li>« association » </li></ul></ul>
    27. 27. Les raisons du succès (5/5) : Auto-régulation ? <ul><li>Golder Scott A. & Huberman Bernardo A., « The Structure of Collaborative Tagging Systems », Information Dynamics Lab, HP Labs , 2005. </li></ul><ul><li>Méthodologie </li></ul><ul><ul><li>Site Del.icio.us sur une période donnée (5 jours) </li></ul></ul><ul><ul><li>Corpus : </li></ul></ul><ul><ul><ul><li>Les plus populaires (212 URL présents dans 19422 signets) </li></ul></ul></ul><ul><ul><ul><li>Échantillon aléatoire de 229 usagers ayant partagé durant période test + tous leurs signets y compris hors-période (68 668 signets) </li></ul></ul></ul>
    28. 28. Les lois folksonomiques <ul><li>Loi de caractérisation </li></ul><ul><ul><li>7 types de tags : Thématiques (orientés sujet) / Nature de l’objet (article, blog, livre) / Propriétaire (auteur du signet) / adjectifs de caractérisation (drôle, stupide, horreur) / auto-référence (messignets, monnom …) / orientés tâche (à lire, recherche d‘emploi) </li></ul></ul><ul><li>Loi de partage </li></ul><ul><ul><li>Plus on possède (= partage), plus on taggue (avec fortes variations selon individus) </li></ul></ul><ul><li>Loi de Feedback positif </li></ul><ul><ul><li>Motifs stables dans la proportion et le choix des tags. </li></ul></ul><ul><ul><li>Plus une ressource est partagée, plus le nombre de tags la décrivant se stabilise ainsi que leur nature. </li></ul></ul>
    29. 29. Folksonomies & Pratiques
    30. 30. Librarything : la communauté comme indexeur <ul><li>Site communautaire à vocation bibliothéconomique : www.librarything.com </li></ul><ul><ul><li>Février 2006: 1.5 millions de références => Juin 2006: 3.2 millions => Nov 2006: 6.2 millions => Juin 2007 : 14 millions => Mai 2008 : 26 Millions </li></ul></ul>
    31. 31. Le meilleur des deux mondes ? <ul><li>Indexation « standard » : </li></ul><ul><ul><li>notice au format MARC, </li></ul></ul><ul><ul><li>indexation DEWEY, </li></ul></ul><ul><ul><li>LC « subjects headings », </li></ul></ul><ul><li>Indexation sociale : </li></ul><ul><ul><li>tags associés, </li></ul></ul><ul><ul><li>fiches de lecture et revues de la communauté, </li></ul></ul><ul><ul><li>système de recommandation </li></ul></ul>Modèle collaboratif, auto-régul, ouvert en lecture et en écriture, « Amazon-ifié », « OPAC-ifié »
    32. 32. Les musées … aussi ! <ul><li>Metropolitan Museum of Art indique que : </li></ul><ul><ul><li>&quot; sur 30 oeuvres d'art indexées par les usagers, plus de 80% des tags ne figuraient pas dans le vocabulaire documentaire utilisé par le musée. &quot; </li></ul></ul><ul><li>Outil collaboratif de tagging à destination des musées </li></ul><ul><ul><li>http://www.steve.museum/ </li></ul></ul>« Nécessité fait loi. »
    33. 33. Les musées … aussi ! <ul><li>Musée McCord de Montréal. </li></ul><ul><li>Usagers créent et ajoutent : </li></ul><ul><ul><li>des tags pour annoter les fonds existants, </li></ul></ul><ul><ul><li>des commentaires, </li></ul></ul><ul><ul><li>des images personnelles, </li></ul></ul><ul><ul><li>Peuvent visionner l'ensemble des &quot;circuits publics&quot;. </li></ul></ul>« Nécessité fait loi. »
    34. 34. Les bases de données scientifiques … aussi !! hubmed.org
    35. 35. Le catalogue … aussi !! http://orlabs.oclc.org/Identities
    36. 36. Le moteurs … aussi !!! <ul><li>Plusieurs « écoles » </li></ul><ul><ul><li>Moteurs dédiés (technorati.com) </li></ul></ul><ul><ul><li>Fonctionnalité intégrée (MyYahoo) </li></ul></ul><ul><ul><li>Illusion folksonomique (cloud.clusty.com) </li></ul></ul>
    37. 37. Les communautés scientifiques : aussi !!! <ul><li>Postgenomic.com, CiteUlike (Repérage de signets IST) … </li></ul><ul><li>Folksonomies présentes partout : accès, repérage, commentaire. </li></ul>
    38. 38. Et les bibliothèques ? Aussi ! <ul><li>Bibliothèque & Catalogue http://tags.library.upenn.edu/ </li></ul><ul><li>Intégration dans SIGB (open source ou propriétaires) : Étagères virtuelles de PMB </li></ul>Rapport Calhoun pour la LoC (Mars 2006) Déclencheur pour le monde des bibliothèques www.loc.gov/catdir/calhoun-report-final.pdf
    39. 39. Et les bibliothèques ? Aussi !! <ul><li>Library of Congress sur FlickR : </li></ul><ul><ul><li>http://flickr.com/photos/library_of_congress/ </li></ul></ul><ul><li>Boston Public Library sur FlickR : </li></ul><ul><ul><li>http://flickr.com/photos/boston_public_library/ </li></ul></ul><ul><li>Pourquoi ? </li></ul><ul><ul><li>« Pour partager ces collections photographiques avec ceux qui ne visitent pas notre site </li></ul></ul><ul><ul><li>Pour mieux comprendre en quoi l'indexation sociale pour nous apporter des idées d'amélioration de nos services et de nos fonds </li></ul></ul><ul><ul><li>Pour accroître notre expérience et notre implication dans des communautés web partageant des centres d'intérêts communs avec les collections de bibliothèques. » </li></ul></ul><ul><ul><ul><li>Source : http://www.loc.gov/rr/print/flickr_pilot_faq.html </li></ul></ul></ul><ul><li>RÉSULTAT ?? </li></ul>
    40. 40. Résultat … <ul><li>392,000 views on the photostream </li></ul><ul><li>650,000 views of photos </li></ul><ul><li>Adding in set and collection page views, there were about 1.1 million total views on our account </li></ul><ul><li>All 3,100+ photos have been viewed </li></ul><ul><li>420 of the photos have comments </li></ul><ul><li>1,200 of the photos have been favorited </li></ul>En une nuit !! http://www.loc.gov/blog/?p=237
    41. 41. http://flickr.com/photos/library_of_congress/alltags/
    42. 42.
    43. 43. C’est déjà demain Où comment « concilier l’inconciliable » ?
    44. 44. Intérêt « fusionnel » <ul><li>Exporter … </li></ul><ul><li>Vers un site collaboratif communautaire (del.icio.us) </li></ul><ul><li>Des (méta)données documentaires (HubMed) </li></ul><ul><li>Fertilisation croisée </li></ul><ul><li>Ouverture des catalogues </li></ul>http://hublog.hubmed.org/
    45. 45. L’hybridation comme modèle ? <ul><li>Amazon : Amapedia </li></ul><ul><li>« Collaborative structured tagging » </li></ul><ul><li>Tags factuels </li></ul><ul><ul><li>TagFactuel : valeur1, Valeur2, Valeur3 ... </li></ul></ul><ul><li>Tags catégoriels </li></ul><ul><ul><li>Relation « is a » </li></ul></ul><ul><ul><li>Relation « like … » </li></ul></ul><ul><ul><li>Relation « partage des attributs essentiels » </li></ul></ul>
    46. 46. Vers des modèles hybrides <ul><li>FlickR (& bientôt) Del.icio.us : « Machine Tags » </li></ul><ul><li>Nom : attribut = valeur. </li></ul><ul><li>flickr:user=straup </li></ul><ul><li>flora:tree=coniferous </li></ul><ul><li>medium:paint=oil </li></ul><ul><li>geo:cartier=&quot;plateau mont royal&quot; </li></ul><ul><li>geo:neighbourhood=geo:cartier </li></ul>
    47. 47. Quel avenir ? Penser une bibliothéconomie « à l’échelle » des transformations en cours, et « en mouvement ». Une bibliothéconomie de masse .
    48. 48. Quels mouvements ? Tectonique documentaire : Cinq continents réunifiés
    49. 49. Dérive des continents documentaires : le monde comme Pan-catalogue 1995 2005 2015 ? Web public Web privé Web personnel (Desktop) Web intime (Mail) indexé non-indexé Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) ? Pourquoi ?
    50. 50. Quelle échelle ? Celle des nouvelles cultures , des nouvelles pratiques , des nouveaux besoins des natifs digitaux
    51. 51. Bouillon de cultures <ul><li>Culture du fragment : Homogénéisation des savoirs </li></ul><ul><li>Culture de l’accès : Économie de l’attention </li></ul><ul><li>Culture du service, de la proximité, du «  service de proximité  » </li></ul><ul><ul><li>Librairie, bibliothèque, pizzéria « près de chez vous » : « caRtalogue » </li></ul></ul><ul><li>Culture de « l’économie » </li></ul><ul><ul><li>d’expertise ( sagesse des foules ) </li></ul></ul><ul><ul><li>de temps ( immédiateté ) </li></ul></ul><ul><ul><li>d’argent (culture du gratuit ) </li></ul></ul><ul><li>Culture de l’ouverture : Open Access, Open Archives, Open Office, Open Data … </li></ul><ul><li>Culture de la synchronicité </li></ul><ul><ul><li>Accès, repérage, recherche, certification, indexation, navigation, partage </li></ul></ul>Réflexion sur « l’offre » documentaire Doit intégrer cette économie de la demande
    52. 52. Quelles transformations ? Celle des pratiques
    53. 53. Confusion des pratiques ? chercher communiquer Tagger / indexer organiser s’orienter partager google talk earth print orkut API’s Web/documenet public Web/document` privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs)
    54. 54. Mathématiques bibliothéconomiques <ul><li>Années 90 : industrialisation de l’indexation (moteurs de recherche) </li></ul><ul><li>Années 2000 : marchandisation de l’indexation (liens sponsorisés) </li></ul><ul><li>Aujourd’hui : « indexabilité » de l’actuelle masse documentaire : </li></ul><ul><ul><li>Totale : nos mails, nos documents de travail, nos « recherches », nos amis, nos préférences sexuelles, politiques, religieuses … </li></ul></ul><ul><ul><li>En temps réel : à la volée </li></ul></ul><ul><ul><li>Transparente : visible par tous (surtout par les moteurs) et de partout (interopérabilité) </li></ul></ul><ul><li>Bibliothéconomie de masse = industrialisation + marchandisation + indexabilité </li></ul><ul><li>Horizon de l’indexation : </li></ul><ul><ul><li>Question n’est plus celle de l’autorité (qui a autorité pour indexer) </li></ul></ul><ul><ul><li>ni même de l’expertise (qui a compétence pour indexer) </li></ul></ul><ul><ul><li>mais celle de l’usage (qui a besoin d’indexer) </li></ul></ul><ul><li>IL EST URGENT DE SE SAISIR DE CES OUTILS ! </li></ul>
    55. 55. Il y a urgence. ? Sinon ? Modèle marchand de la bib. Autarcithécaires Bibliothèques ?
    56. 56. Conclusion … <ul><li>« It is neither Pandora’s box not panacea. Social tagging highlights the interstices of authorship, intertextuality, and context in indexing, and asks us to fill in the gaps. It is a catalyst for improvement and innovation in indexing.  » </li></ul><ul><ul><li>Joseph T. Tennis. Social tagging and the next stpe for indexing. 17th SIG/CR Classification Research Workshop, Novembre 4, 2006. </li></ul></ul><ul><li>La communauté comme indexeur a son rôle à jouer. </li></ul><ul><li>Pour aller vers un juste milieu entre folksonomie débridée et rigidité taxonomique </li></ul>
    57. 57. … MeRci … ? QuEsTioNs ? ? QuEsTioNs ?

    ×