Séminaire sur les pratiques d'indexation .
Aspect historique des index et de l’indexation (en France), Prise en compte de la fonction de recherche, Prise en compte (partielle) du contexte des CDIs pour évaluer l’impact de ces évolutions fonctionnelles et techniques
8. Contexte actuel principe de convergence Ressources numériques Technologies de l’information Acteurs dans la Société de l’information Modes d’accès à l’information Sylvie Dalbin, 22 Septembre 2009
9.
10.
11.
12.
13.
14. Pratiques d’indexation 1. Indexation de la langue 2. Indexation structurelle (Web sémantique) 3. Indexation sociale Sylvie Dalbin, 22 Septembre 2009
26. Indexation structurelle (5) Schémas de métadonnées orientés ressources Des référentiels terminologiques communs
27. Ex. - Indexation structurell e (4) identifiant relation instance de la classe Oeuvre instance de la classe Personne attribut entités Les machines vont pouvoir exploiter automatiquement toutes ces données => le web sémantique des données Ontologie du domaine de la musique (très partielle)
28. Architecture des SID Autre exemple : Métalangage OTAREN (Outil Thématique d’Aide à la Recherche pour l’Education Nationale), François Feyler
32. Synthèse : méthodes et outils Document de travail, Dalbin, version 2009 Période Ressource Processus Outils Public Usage 1 Antiquité Un manuscrit ou corpus d’un auteur annotation du contenu d’un texte notes marginales au texte, de toute nature; table de concordance accès rapide à un passage pour compréhension => mémorisation 2 Moyen Age Manuscrit papyrus - parchemin - codex note externe - lien au texte; regroupement des notes Table - Index symbole de repérage idem + extension aux encyclopédies 3 Renaissance Imprimé un manuscrit des collections indexation fine contenu du document (et de collections) Index de fin de livre recherche sujet avec accès direct au passage du texte ; langues vernaculaires 4 Fin XIXe siècle Périodiques, Livres industrialisation indexation thématique de collections, contrôlée Index de collection Vocabulaire contrôlé vedettes - thésaurus repérage sujet avec accès indirect au texte 5 Après 2ème Guerre Mondiale Variétés de “documents” Support numérique indexation fine du contenu de collections + Hypertexte automates exploitant des ressources linguistiques repérage info avec accès direct au texte 6 Fin XXè - Début XXI Web annotation .sociale, ..sémantique ontologie, taxonomie compréhension pour accès à un grain d’info + lecture num. Société
37. Références Histoire Chronologie des supports, des dispositifs et des outils de repérage de l'information , Sylvie FAYET-SCRIBE, décembre 1997, http://biblio-fr.info.unicaen.fr/bnum/jelec/Solaris/d04/4fayet_1tab.html Concevoir l’index d’un livre. Théorie et pratique, Jacques Maniez, Dominique Maniez, ADBS Editions (à paraître en 2009/2010) Nouvelles pratiques d'indexation, nouveaux enjeux documentaires ?, Muriel Amar, 2008 (manuscrit) Technologies de l’information Les nouvelles technologies : révolution culturelle et cognitive (Durée :1h04) - Conférence de Michel Serres (philosophe, de l’Académie française), http://www.inria.fr/40ans/forum/video.fr.php Giant Global Graph, Tim Ber ners-Lee, nov. 2007 - http://dig.csail.mit.e du/breadcrumbs/node/215 Inde xation de la langue Introduction au TALN, An ne Vilnat, 2008 (cours ) - http://www.limsi.fr/Individu/anne/coursM2 R/intro.pdf Recherche d’information et traitement de la langue : fondem ents linguistiques et applications. Lallich-B oidi n, G. et Maret , D., Presses de l’ENSSIB, 2005. (ISB N: 2-910227-60-X). (analyse - Documentaliste - Sciences de l’information 2006, vol. 43, n° 2, p166- http://ww w.cairn.info/revue-documentaliste-sciences-de-l-info rmation-2006-2-page-158.htm ) Indexation structure (Web sémantique) Sur la légitimité des contenus générés par les utilisateurs, Patrick Peccatte, 30 jui n 2009 http://blog.tuquoque.com/post/2009/06/30/Sur-la-legitimite-des-contenus-generes-p ar-les-utilisateurs Exemples en ligne Index automatique / Agence de l’Eau Seine Normandie : http://www.eau-seine-normandie.fr /index .php?id =533 Les utilisateurs indexent / http://dossierdoc.typepad.com/descripteurs/2008/ 0 1/tagger-pour-la.html Outiller les utilisateurs / Musée McCord - http://dossierdoc.typepad.com/desc ripteurs/2007/12/publics-librs-a.html Compétences Métiers et compétence en InfoDoc, S.Dalbin, (weblogue) - http://referentieleninfodoc.wordpress.com /
Notes de l'éditeur
4. Les nouvelles technologies : révolution culturelle et cognitive (Durée :1h04)Conférence de Michel Serres (philosophe, de l’Académie française), http://www.in ria.fr/40ans/ forum/video.fr.php
Distinction entre les professionnels pour la capitalisation/l’archivage et ceux pour la diffusion
André Tricot - chercheur à l’UTM (Univ de Toulouse Mirail) http://pagesperso-orange.fr/andre.tricot/index.html
Introduction au TALN, Anne Vilnat, 2008 (cours) http://www.limsi.fr/Individu/anne/coursM2R/intro.pdf
Sujet - Groupe nominal et groupe verbal - Nom propre - Verbe + Groupe nominal; Déterminant et nom Analyseur
Microformats “génériques” : iCalendat (évènement), XFN (réseaux de connaissances), hAtom (fil d’actualités), hResume (CV), Rel-tag (tags)... Familles de schémas de métadonnées de Domaines de la Formation (lom-fr,...) Des ontologies génériques et spécialisées
Microformats “génériques” : iCalendat (évènement), XFN (réseaux de connaissances), hAtom (fil d’actualités), hResume (CV), Rel-tag (tags)... Familles de schémas de métadonnées de Domaines de la Formation (lom-fr,...) Des ontologies génériques et spécialisées
Tim Berners-Lee, 2001
Un exemple de réexploitation du travail de référencement, grâce à un balisage plus formel et à l’usage des technologies ouvertes du web.
L’application Facette du MIT, récupère toutes les données sous Delicious et propose une interface de recherche par facettes
titre : auteur/compositeur
Métalangage de recherche - 8000 notions - 80000 entrées; Alignements entre plusieurs vocabulaires : Motbis, Rameau, Th. Unesco, Gemet ..... Vocabulaires contrôlés, par François Feyler, [avril 2009]; http://www.savoirscdi.cndp.fr/?id=1066
http://dossierdoc.typepad.com/descripteurs/2008/01/tagger-pour-la.html S'ENTHOUSIASMER De très nombreux messages pour donner son sentiment sur les photos SE SOUVENIR Les natifs s'expriment ; un afficionado/a de la photographie évoque son v ieux P entax ] APPRENDRE Ici que lqu'un s'étonne de voir de la couleur p our un e photo de 1913. Quelqu'un d'au tre lui signale avec amusement, qu'il s'agit de l a date de naissance du photographe, la date de la photo étant 1943.... Voilà une leçon à l a "maîtrise à l'informatio n" qui profite à tous ! 2 jours après , quelqu'un reconnaît qu'il s'était posé la question... SE DOCUMENTER D'au tres posent des questions sur le photographe STOCKER/CONSERVER Plusieurs personnes ont conservé cette photo dans leurs favoris ENRICHIR et ANNOTER Quelqu'un d'autre rajoute un lien sur une biographie du photogra phe (qui se trouve sur un aut re site US. Quelques mo ts-clés ont é té ajoutés, décrivant le paysage lui -même (blue sky, silo ).
http://dossierdoc.typepad.com/descripteurs/2007/12/publics-librs-a.html S'ENTHOUSIASMER De très nombreux messages pour donner son sentiment sur les photos SE SOUVENIR Les natifs s'expriment ; un afficionado/a de la photographie évoque son vi eux Pe ntax ] APPRENDRE Ici quel qu'un s'étonne de voir de la couleur pou r une photo de 1 913. Quelqu'un d'autr e lui signale avec amusement, qu'il s'agit de la date de naissance du photographe, la date de la photo étant 1943.... Voilà une leçon à la "maîtrise à l'information" q ui profite à tous ! 2 jours après , quelqu'un reconnaît qu'il s'était posé la question... SE DOCUMENTER D'autre s posent des questions sur le photographe STOCKER/CONSERVER Plusieurs personnes ont conservé cette photo d ans leurs favoris ENRICHIR et ANNOTER Quelqu'un d'autre rajoute un lien sur une biographie du photograp he (qui se trouve sur un autr e site US. Quelques mots- clés ont été ajoutés, décrivant le paysage lui- même (blue sky, silo) .
Le problème vedettes matière / thésaurus est devenu secondaire. Par contre, le principe d’une indexation au thème principal versus une annotation précise des contenus reste posé.
* SID = système d’information documentaire
Identité professionnelle : - unité de traitement : bibliothéconomie [3], [4] ; documentalistes [2], [3], [4] - méthodes et outils en cohérence avec cette unité de traitement: -> indexation au sujet principal et vedettes / tous les sujets (contenus) des documents (thésaurus spécialisé)