Introduction à l'informatique documentaire - 2011

3 373 vues

Publié le

Publié dans : Formation
0 commentaire
2 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
3 373
Sur SlideShare
0
Issues des intégrations
0
Intégrations
59
Actions
Partages
0
Téléchargements
56
Commentaires
0
J’aime
2
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Introduction à l'informatique documentaire - 2011

  1. 1. informatique documentaire « une courte introduction » Sylvain Machefert – 17·02·2011
  2. 2. Généralités Les outils Formats de fichierDescription Échange Actualités
  3. 3. GénéralitésDomaine public // Nasa // Wikimedia Commons
  4. 4. Le document numérique « Dans son acception courante un document estgénéralement défini comme le support physiquedune information. Plus précisément on peut ledéfinir comme un ensemble de donnéesinformatives présentes sur un support, sous uneforme permanente et lisible par l’homme ou parune machine (permanent par opposition àvolatil). » http://fr.wikipedia.org/wiki/Document
  5. 5. Le document numériqueLe document numérique peut être compris dans un sensplus large, comme étant un ensemble de donnéesinformatives sous forme de chiffres (= numérique)lisible par un dispositif informatique restituantles informations.
  6. 6. ENJEUX● Interopérabilité● Accessibilité● Pérennité CC-BY-NC-SA // Maurizio DArrigo // Flickr
  7. 7. Éléments de vocabulaire● bit → le fameux 0 ou 1● octet → 8 bits → 256 combinaisons● kilooctets → 1024 octets● mégaoctet → 1024 kilooctets● gigaoctet → 1024 mégaoctets● téraoctet → 1024 gigaoctets CC-BY-NC-SA // Stephanie Booth // Flickr
  8. 8. Codage des caractères Étendue Codage Création bits Valeurs CaractèresASCII 1961 7 128 95ISO-8859-1 / Latin-1 1987 8 256 191 (accents)UTF-8 1993 8-32 > 2 milliards > 100 000 CC-BY-SA // Paqribas // Wikimedia Commons
  9. 9. Des outils 9CC-BY-SA // Wolfgang Sauber // Wikimedia Commons
  10. 10. SIGB / OPAC 10Domaine public // David Rees // Wikimedia Commons
  11. 11. place aux briques ? 11Domaine public // Ministère de la défense des États-Unis
  12. 12. Recherche fédérée CC-BY-NC-SA // Eddie Codel // Flickr
  13. 13. GEDDomaine public // DustyDingo // Wikimedia Commons
  14. 14. + tout un écosystème wikiAtoZ ERMS blog portail CMS Reverse proxy résolveur Gestion OpenURL postes publics excel !
  15. 15. le logiciel libreCC-BY-NC-SA // Francesco Lodolo // Flickr
  16. 16. Formats de fichiers 16CC-BY // Marc Mateus // Flickr
  17. 17. HTML – 1989● structuration des pages web● se limite à la présentation (peu de sémantique)● support variable selon les outils
  18. 18. CSS – 1995● feuille de style pour le web● séparation entre structure et présentation main.css
  19. 19. XML – 1998● Recommandation du W3C● Intimement lié au web● Structure arborescente● Format générique décliné en schémas ● TEI : Text Encoding Initiative ● EAD : Encoded Archival Description ● TEF : Thèses Électroniques Françaises ● METS : Metadata Encoding and Transmission Standard
  20. 20. Epub – 2007● Format ouvert pour les ebooks● Archive composée de HTML, css, images CC-BY // Dan Taylor // Flickr
  21. 21. DigitalRightsManagement 21 CC-BY // Martin Krzywinski // Flickr
  22. 22. Description 22 CC-BY-SA // Julian Fong // Flickr
  23. 23. Les métadonnéesdescriptives techniques juridiques● importance du choix de format● ne pas sisoler de ses partenaires● qui peut le plus peut le moins … CC-BY // MG Shelton // Flickr
  24. 24. IdentifiantSuite de caractères alphanumériquespermettant didentifier une ressourcephysique ou une ressource logique,selon une granularité particulière.
  25. 25. Identifier lunité physique● Enregistrements musicaux (ISRC)● Œuvre audiovisuelle (ISAN)● Texte (ISTC)● partie dun périodique (SICI)
  26. 26. Identifier lunité physique● Livre  → ISBN → 978-2-7654-0954-0● Périodique → ISSN → 0335-1793● Musique → ISMN → M-060-11561-5
  27. 27. Identifier en ligneLes URI (Uniform Resource Identifier) sont lélémentcentral de lidentication en ligne.Leur but est de :● Nommer● Adresse● Décrire (jusquà un certain point)
  28. 28. URN – Uniform Resource Name● Indépendant de lemplacement● Nécessite un répertoire de correspondanceex : « urn:isbn:0-395-36341-1 » ; « doi:10.1000/182 »
  29. 29. URL – Uniform Resource Locator● Localisation des pages web en HTTP● Très lié à lhébergeur http://fr.wikipedia.org/wiki/URLprotocole sous-domaine nom de domaine 2nd niveau nom de domaine 1er niveau nom de la ressource
  30. 30. URL – Enjeux de la lisibilité● Permet un accès direct à la ressource● Facilite la citation (cf. permalien)● Indexation dans les moteurs de recherche● Moissonnage OAI
  31. 31. ARK – Archival Resource Key● Créé et maintenu par la California Digital Library● Utilisé par la BnF● Plusieurs niveaux de granularité : ● page dans un document ● image dans un lot de documents http://catalogue.bnf.fr/ ark:/12148/bpt6k103226k/f263.pagination http://gallica.bnf.fr/ adresse du résolveur (optionnel) espace de nom institution Identifiant unique niveau plus fin
  32. 32. DOI – Digital Object Identifier● Géré par Crossref pour le domaine de la recherche● Plus de 48 millions denregistrements http://dx.doi.org/ doi:10.1045/may2006-apps http://hdl.handle.net/ résolveur espace de nom code handle du DOI organisme gestionnaire identifiant de lobjet
  33. 33. Description ≠ Stockage Dublin Core MARC Onix iso2709 XMLFormat binaire
  34. 34. Description – Les format MARC – 1965● Par et pour les bibliothécaires● Deux niveaux darborescence● Variations nationales (Marc 21, unimarc …)● Principal format utilisé en bibliothèque
  35. 35. Description – Dublin Core – 1995● 15 éléments de base ● contenu : titre, type, sujet ... ● Propriété intellectuelle : créateur, éditeur ... ● Instanciation : date, identifiant, format● Version étendue : DC qualifié● Utilisé par OAI
  36. 36. Description – RDF – 1999● Ressources du Web, pour le web sémantique● Définition par triplets : Sujet – Prédicat – Objet <Écrivain> <Auteur_de> <Livre> <Écrivain> <Date_de_Naissance> <Année>● Relations définies dans des vocabulaires ● FOAF : personnes et leurs relations ● SKOS : thesaurus Linked data exemples DBpedia
  37. 37. StockageXML iso2709 binaire
  38. 38. Échange 38CC-BY // JC i Nuria // Flickr
  39. 39. Échanger ses données pour ...● Être présent sur le web● Ne pas réinventer la roue● Sintégrer dans un Système dInformation● Faciliter la vie de lusager● Rendre le système évolutif
  40. 40. RSS – Really Simple SyndicationSabonner aux mises à jour dun site et centraliser les alertes sur cesmises à jour © Matthew Forsythe
  41. 41. Les Web Services → Usages divers● Technologie Web déchange de données entre applications● Facilite ● lintégration avec dautres outils ● les possibilités de « mash-up »● AJAX : « Asynchronous JavaScript and XML »
  42. 42. OAI-PMH → Échange de métadonnées● Format XML● Données Dublin Core● Protocole très simple● Nécessite des urls pérennes ex. 1 ; ex. 2
  43. 43. Z39.50 → Interrogation● Format historique (1970)● Possibilités très larges● Utilisé pour la recherche fédérée et la dérivation de notices CC-BY-SA – Alexander Drachmann – Flickr
  44. 44. SRU / SRW → Interrogation● Protocole Web● Langage dinterrogation dédié● Assez simple (3 opérations) exemple CC-BY-SA – Alexander Drachmann – Flickr
  45. 45. OpenURL → Aiguillage du lecteur …● Lier les métadonnées à la ressource quelles décrivent en fonction des accès dont dispose lutilisateur● « résolveur de lien » pour fournir ce lien et/ou dautres services CC-BY-SA – Tennen Gas – Wikimedia Commons
  46. 46. Sans OpenURL Notice repérée Rechercheau catalogue Site de Texte l’éditeur intégral
  47. 47. Avec OpenURL Notice repérée Résolveur Recherche de liensau catalogue Site de Texte l’éditeur intégral
  48. 48. OpenURL – Exemple1 2
  49. 49. « Actualités » 49 CC-BY // Alex Barth // Flickr
  50. 50. le nuageCC-BY // Kevin dooley // Flickr
  51. 51. Web de donnéesCC-BY-SA // Richard Cyganiak and Anja Jentzsch // loc-cloud.net
  52. 52. FRBR / RDADomaine public // Mhrmaw // Wikimedia Commons
  53. 53. Aller plus loin (décembre 2005) (septembre 2007)Et surtout les blogs : « Bibliothèques [reloaded] » ; « Face-Écran » ;« Vingt-sept point sept » ...
  54. 54. 1ère page : CC-BY-NC-SA – Don Solo – Flickr CC-BY-NC // Tinker*Tailor // Flickr

×