M2 gidn bn biblio_ml

546 vues

Publié le

0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
546
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
6
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

M2 gidn bn biblio_ml

  1. 1. République Tunisienne Université de la manoubaMinistère de l’enseignement supérieur Institut supérieur de la Documentation BiblioML Elaboré par Tarek Hamdi [M2 GIDN : Bibliothèques Numériques] 2012/2013
  2. 2. Table des matièresI. Introduction .......................................................................................................................................... 2II. UNIMARC ............................................................................................................................................. 2III. XML ..................................................................................................................................................... 3IV. BiblioML.............................................................................................................................................. 4V. Avantages de BiblioML ..................................................................................................................... 7VI. Utilisations et projets en BiblioML ..................................................................................................... 7VII. Conclusion ......................................................................................................................................... 8VIII. Exemple d’enregistrement BiblioML................................................................................................ 9IX. Webographie ................................................................................................................................... 15
  3. 3. I. Introduction BiblioML est une représentation en XML (DTD puis schéma) des noticesbibliographiques basée sur le format d’échange UNIMARC qui respect la norme ISO 2709.La norme ISO 2709 est une norme internationale qui définit la structure des notices contenantdes données bibliographiques.Pour entamer le sujet de BiblioML, il parait indispensable d’éclaircir la notion d’UNIMARCet de présenter la technologie XML et les intersections possibles entre eux. II. UNIMARC UNIMARC est un standard déchange de données bibliographiques et est aussi définitcomme un format informatique international des données bibliographiques permettant leséchanges entre logiciels documentaires ou bases de données bibliographiques. Principalementdéfini par lIFLA (International Federation of Library and Institutions), l’UNIMARC estconforme à la norme ISO 2709. Le format UNIMARC est complété, en France, par larecommandation 995 qui complète l’UNIMARC en prenant en compte le codage desinformations concernant les exemplaires (nombre et numéros dexemplaires, par exemple). UNIMARC est un format "champs" (champ-valeur répétable), adaptable à denombreux objets (bibliographie, autorités, classification, archivistique ...). Une notice UNIMARC est constituée de différents blocs numérotés qui correspondentà des types dinformations. Chacun de ces blocs est constitué de champs et de sous-champs.Les champs sont numérotés, les sous-champs sont introduits par le symbole $ suivi dunelettre.Voici un exemple de fichier UNIMARC correspondant à un exemplaire de code barre5777008954 de : Les Champignons / Jean C. Keller. - Paris : le Livre de poche, 1983 - 127 p. : ill. ; 17 cm. - (Le Livre de poche; 7847). Les rubriques d’UNIMARC Significations*****cam**22002411**450* [Données codées]010 ** $a 2-253-03268-9 $b Br. $d 24 F [ISBN, reliure, prix]100 ** $a 19840104d1983****m**y0frey0103****ba [Données codées]101 ** $a fre [Code de langue]102 ** $a FR [Code de pays]
  4. 4. Les rubriques d’UNIMARC Significations105 ** $a aay**zz**00|z| [Données codées]106 ** $a r [Données codées]200 1* $a Les Champignons $f Jean C. Keller [Titre, auteur]210 *0 $a Paris $c le Livre de poche $d 1983 [Edition]215 ** $a 127 p. $c ill. $d 17 cm [Collation]225 2* $a Le Livre de poche $v 7847 [Collection]606 ** $3 $a Champignons [Vedette matiére]676 ** $a 589.2 [Indice Dewey]700 1* $a Keller $b Jean [Vedette auteur]995 ** $f 5777008954 $k 589.2 KELRQ : les * désignent des espaces = des blancs ou à des positions non renseignées Les jeux de caractères ISO sont utilisés pour les échanges de données en formatUNIMARC. Le label de notice, le répertoire, les indicateurs, les codes de sous-zones et lesautres codes spécifiés dans ce manuel doivent être enregistrés en utilisant les caractères decommande et les caractères graphiques du jeu de caractères ISO 646 (IRV), ou alphabetinternational de référence, qui est considéré par défaut comme le jeu de caractères de lanotice. Les techniques d’extension spécifiées dans le jeu de caractères ISO/IEC 2022 sontutilisées quand plusieurs jeux de caractères sont nécessaires dans une même notice. III. XML XML (Extensible markup language) est un langage de balisage générique dont le butest de permettre la fonctionnalité et l’interopérabilité du Web en permettant à plusieurssystèmes d’information hétérogènes de communiquer et d’échanger. Autrement dit il reposesur des principes : c’est un langage de balisage extensible ; sa maintenance est assurée par leW3C; les balises ne sont pas prédéfinies mais libres et précisent le sens ou la structure et nonpas la présentation graphique; le contenu, la structure et la présentation sont nettementdissociés ; la structure des informations est arborescente.Les raisons qui rendent intéressantes son utilisation sont que : c’est un format libre et ouvert;il est indépendant de toute plateforme informatique ; il est promis à une certaine pérennité (ilest répandu dans plusieurs domaines et bénéficie d’une solide structure de maintenance) ; ilfacilite l’interopérabilité.En bibliothèque son utilisation permet : d’afficher des notices bibliographiques sur le Web(BiblioML, MarcXML, MODS…) ; d’y échanger ces notices (OAI, Dublin Core…) ; d’yéditer des ressources (TEI, EAD…) ; d’y diffuser de l’information (RDF, RSS, Atom…).Pour mieux cerner les possibilités permises par XML, faisons une petite comparaison avec leformat Marc. Marc se matérialise sous la forme d’un format de saisie constitué de zonesprédéfinies et immuables, certaines de ces zones permettent de communiquer avec d’autressystèmes utilisant le même format ce qui permet à plusieurs bibliothèques d’échanger desnotices bibliographiques par l’import ou l’export de celles-ci. Mais ces échanges neconcernent pas les usagers de quelques bibliothèques qui sont dans l’impossibilité d’accéder
  5. 5. aux notices via le Web (pour cela ils doivent préalablement passer par le site de laBibliothèque pour accéder à son OPAC). Alors qu’avec XML, ces notices bibliographiquesdeviennent visibles à partir du Web parce qu’étant repérables par les différents outils derecherche qui le sillonnent. En d’autres termes les OPAC sont mis en surface et accessibles,en principe, à tout internaute. Un autre avantage parmi d’autres est, par exemple, lechangement de formats de notices de MARC à XML qui se fait sans perte de données,permettant ainsi une retro-conversion « fidèle » de ces dernières… Ce souci de pallierl’incapacité du Marc à permettre les échanges sur le WEB, sera à l’origine de la création duMarcXML par la Bibliothèque du Congrès en juin 2002. IV. BiblioML BiblioML, ou Bibliographic Markup Language, est une DTD XML (XML Schémadepuis la version 0.6 ) créée en 1999 sous l’égide de la Mission de la recherche et de latechnologie du Ministère de la Culture français qui souhaitait mettre en place un outilcommun de gestion des références bibliographiques de ses applications XML (dossiersdinventaire, dossiers dartistes, rapports de fouilles, etc.). Cette DTD a été développé parMartin Sévigny de la société AJLSM pour représenter toutes les informations que lon trouvedans une notice UNIMARC (bibliographique et autorités) en format XML. Tableau de synthèse des correspondancesUNIMARC : Bloc et champ BiblioML : Elément-père, élément-filsBloc des informations descriptives 2XX, <Description>champ 200 <Title and Responsibility>Bloc des informations descriptives 2XX, <Description>champ 205 <EditionGroup>Bloc des informations descriptives 2XX, <Description>champ 210 <PublicationGroup>Bloc des informations descriptives 2XX, <Description>champ 215 <PhysicalDescription>Bloc des informations descriptives 2XX,champ 225Bloc des notes 3XX <Notes> <Description>Bloc des notes 3XXBloc 0XX, champ 012 <IdentificationNumbers> <FingerprintID> <CodedValues>, maisBloc des informations codées 1XX aussi <Meta> et <Description> <RelatedTitles>Bloc des titres associés 5XX <Subjects>Bloc de lindexation-matière 6XX <Description>Bloc de la responsabilité intellectuelle 7XX <IntellectualResponsibility>Bloc 8XX des données <Meta>Internationales
  6. 6. BiblioML permet la conversion au format XML de notices bibliographiques oudautorité saisies en format UNIMARC. Dailleurs, le Manuel UNIMARC a servi de documentde référence lors de la création de la DTD et les champs et sous-champs de BiblioMLcorrespondent à ceux dUNIMARC. BiblioML comporte 224 éléments (BiblioRecord étantcelui de plus haut niveau), 2 entités (BooleanAttribute et DataContent) mais aucune notation. Lelement BiblioRecord est composé de:  Meta : métadonnées liées à lenregistrement (date et lieu de création, etc...). Ces informations ont pour origine différents champs Unimarc, principalement les champs 0xx.  Description : description de loeuvre : titre, auteurs, dates, éditeur, droits... (champs 2xx et 5xx dUnimarc)  Notes : notes concernant loeuvre, destinées au public (champs 3xx)  CodedValues : informations codées relatives à la description de loeuvre (principalement, les champs 1xx dUnimarc)  Subjects : sujets traités par loeuvre, et mots-clés correspondant (champs 6xx)  Relationships : liens vers dautres oeuvres (champs 4xx)  IntellectualResponsability : indications de responsabilité intellectuelle telles quelles figurent dans lISBD (champs 7xx)  LocalData : données locales propres à létablissement créateur de la notice (champs 9xx)  Tables : table des matières et Index  Text : texte de présentation de louvrage <BiblioRecord Language="fre" id="B590092101_00073.173_001"> <Meta>...</Meta> <Description>...</Description> <CodedValues>...</CodedValues> <Notes>...</Notes> <Subjects>...</Subjects> <LocalData>...</LocalData> <TableOfContents>...</TableOfContents> <Index>...</Index> </BiblioRecord> Lexpressivité dXML peut être menée plus loin. On peut ainsi tirer parti delimbrication des éléments pour regrouper des informations et les nommer plus explicitement.Si le champ 200 est le titre, et quil y a un sous-champ pour les sous-titres ($e), il nest pasdésagréable de pouvoir lindiquer expressément, exemple en "pseudo-code"
  7. 7. La souplesse du format BiblioML permet dajouter bien dautres informations, commedes index, des tables des matières, des illustrations, et surtout, ce qui est très particulier àXML, du texte riche. La DTD BiblioML prévoit ainsi des noms permettant quune noticedevienne un document avec plus de contenu.BiblioML et La Compatibilités : Dans une conversion UNIMARC vers BiblioML, laplupart des champs documentés trouve une place en XML. Pour des usages spécifiques à uneorganisation, les outils livrés peuvent être édités (XSL) pour rendre raison à des besoins quinauraient pas été prévus. Par contre, une fois passés en BiblioML, surtout si les contenus ontété enrichis, un retour en MARC pourrait perdre une partie de linformation.Outils BiblioML. Autour de BiblioML, on trouvera des outils libres habituels : conversiondepuis lUNIMARC, transformation de restitution. On mentionne particulièrement BiB-X, uneapplication libre qui administre, cherche et produit des notices. On notera la possibilité depouvoir définir ses propres formulaires de saisie (selon le type de documents), dans unstandard XML (XForm). BiblioML apporte des extensions au format UNIMARC, dont voici les plussignificatives :- Il est possible dencoder le texte du document en question, inclus dans lélément <Text>.- Il est également envisageable dintégrer des tables et des index, au moyen de la balise<Tables>, puis <TableOfContent> ou <Index>. Il sagit dune nette progression par rapport àla possibilité de référencer une table des matières au moyen du champ 359 puisquil ny aplus de limitation de niveaux darborescence.- En ce qui concerne les liens entre notices, indiqués par les éléments <Relationships> puis<LinkedItem>, plusieurs solutions sont possibles. Comme le propose MARC, un simple lienentre les notices peut être créé. Lélément <LinkedItem> est alors vide et lattribut RecordIDindique le numéro de la notice concernée. On peut également envisager dinclure la secondenotice dans la première, en utilisant lélément <BiblioRecord>.Dans tous les cas, lattribut « Relation » permet dindiquer le type de relation entre les deuxouvrages décrits. BiblioML apporte ainsi davantage de souplesse et de lisibilité quelutilisation éventuelle des champs 4XX proposés par UNIMARC.- Linformation concernant les exemplaires locaux peut être donnée directement, alors quunenotice dexemplaire devait être liée à la notice bibliographique dans UNIMARC. Pour cela ilsuffit dutiliser lélément <Copies> et ses éléments-fils. Cette expérience de traitement avecBiblioML montre que si toute information de type bibliographique aurait pu être saisie enMARC, BiblioML apporte davantage de clarté. Les extensions proposées par BiblioML nesont donc pas si significatives pour la description bibliographique du livre en tant que telle. Levéritable enrichissement, cest de rendre possible lintégration de tout ou partie du documentprimaire.
  8. 8. D’autre part, BiblioML permet une description bibliographique fine et complète, maisles possibilités de renseigner les métadonnées de gestion techniques et administratives sontbien moins riches que celles que proposent le Dublin Core ou l’en-tête de la TEI. En effet,lencodage dans BiblioML de ces métadonnées se limite à lélément <Meta>, et ellescorrespondent ni plus ni moins à celles qui figurent dans une notice MARC. Cela doit êtreperçu comme une limitation, car dans un contexte de numérisation et dédition sur leWeb, le contexte du document ainsi que les conditions daccès doivent être précisées. V. Avantages de BiblioML Brièvement, l’utilisation du format BiblioML nous engendre plusieurs avantages dont lesplus importants sont les suivants :  Format moderne : basée sur XML, adaptée à Internet  Format ouvert : mises dans le domaine public, les spécifications de BiblioML sont disponibles sur le site officiel du ministère de la culture.  Modèle de caractères Unicode : toutes les écritures, basées sur ce système de codage universel, sont représentables sans ambiguïté.  Hiérarchie complète : tous les documents sont décrits exactement, quelle que soit la complexité de leur structure  Taille illimitée : la taille des documents ou des zones nest pas limitée.  Toutes les extensions sont possibles : texte intégral, table des matières, index, illustrations graphiques ou sonores...  Facilités de compréhension : les balises BiblioML permettent de décrire lisiblement la structure et la sémantique de chaque élément VI. Utilisations et projets en BiblioMLUtilisant ou Sappuyant sur BiblioML, plusieurs projets ont vu le jour. Voici quelquesapplications utilisant BiblioML :  La bibliographie nationale française (en ligne depuis juillet 2001). Les notices bibliographiques sont dabord cataloguées en Intermarc puis extraites en UNIMARC, et ensuite converties en XML selon la DTD BiblioML. Un serveur de transformation produit enfin des pages HTML pour publication sur le Web.
  9. 9.  La bibliographie nationale française : le Dépôt légal utilise BiblioML pour générer les pages HTML statiques des différents numéros de la Bibliographie (http://bibliographienationale.bnf.fr).  Base de documents SANGIS (Réseau du sud-est asiatique pour un systéme dinformations géologiques SANGIS) du CIFEG (centre international pour la formation et les échanges en géosciences) : base de données BiblioML pour la diffusion dun catalogue collectif de références bibliographiques dans le domaine des sciences de la terre.  Bilans scientifiques régionaux : projet de base bibliographique BiblioML dans le domaine archéologique  Bibliographie Dossiers dartistes : projet du Ministère de la culture et de la communication, ayant pour but de mettre en place une infrastructure permettant de gérer et diffuser des dossiers dartistes complets et riches, incluant des références bibliographiques.  Article Repository System : un projet du College of Business of Public Administration (BPA) de luniversité de lArizona utilise une base de données darticles et des références en BiblioML  Open Citation System : un autre projet du BPA de luniversité de lArizona utilise BiblioML "as an architecture-neutral middle layer to store large bibliographic citation databases for scientific sharing". Des convertisseurs seront développés de BiblioML vers divers formats comme BibTeX et EndNote. VII. Conclusion La bibliographie est un domaine très "balisé" dans linformatique documentaire.Comparativement à dautres milieux, les bibliothèques ont rapidement implanté des formats etdes systèmes informatiques de catalogage. Les normes "MARC" ont permis de répondre à desbesoins que dautres formats ne représentaient pas aussi bien. XML permet de représentercorrectement des informations codées en MARC, ainsi que dautres.BiblioML devient un format source susceptible dêtre inclus ou transformé à destinationdautres documents XML.Cependant, pour dautres contextes, la totalité des informations du format darchivage ne sontpas toujours indispensables (exemples : date denregistrement, référence à une noticedautorité spécifique à un système). Il est alors plus important que la source soit conforme àlespace de noms de destination. Ceci permettra une courte revue dautres standards XML dela bibliographie, permettant de mieux définir la spécificité dun format complet de catalogage.Lorsquun système bibliographique est utilisé par des auteurs (en XML), on comprend dès lorsle gros intérêt dajouter cette sorte dexports. Un chercheur pourra par exemple composer sabibliographie sur le catalogue dune bibliothèque, et obtenir son panier dans le format qui luiest directement utile.
  10. 10. En fin, on peut distinguer les trois points suivants :  La technologie MARC a donné les moyens de formuler très précisément les besoins bibliographiques. Cependant, le format impose des raideurs qui ne sont plus nécessaires et qui cantonnent son utilisation à des applications spécifiques et généralement commerciales. XML permet un décalque sans perte des informations et aussi de profiter des outils propres à cette technologie.  Une DTD ou Schéma comme BiblioML permet de garder la richesse des catalogues, en pouvant y ajouter facilement dautres informations, comme la table des matières, un résumé, un index, une illustration. Fonder un système bibliographique sur ce type de format peut par exemple agrémenter les catalogues pour donner un accès plus agréable au public.  Enfin, ladoption dun format XML expressif apporte une souplesse à linformation, qui lui permet plus facilement dêtre servie à des machines (DC, OAI) ou dêtre utilisée par des auteurs. VIII. Exemple d’enregistrement BiblioML<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE BiblioRecord PUBLIC "-//MCC-FR//DTD BiblioML V03//EN" "biblioml_030.dtd"> <BiblioRecord Language="fre" id="B20"> <Meta> …………………………. </Meta> <Description> …………………………. </Description> <CodedValues> …………………………. </CodedValues> <Notes> …………………………. </Notes> <Subjects> …………………………. </Subjects> </BiblioRecord>
  11. 11. On considère la notice bibliographique écrit sous format BiblioML Métadonnées
  12. 12. Description
  13. 13. Valeurs codées Notes Subjects
  14. 14. LocalDataTable Of Contents
  15. 15. Index
  16. 16. IX. Webographie RESSOURCES EN LIGNEBottin, Michel. BiblioML : Une application XML pour les données bibliographiques etdautorités, compatible avec (UNI)MARC. [en ligne]. Disponible sur : <http://www.paris-lavillette.archi.fr/docu/biblioml/fr/index.html>. (consulté le 20/12/2012).Bibliothèque nationale de France. Manuel UNIMARC : format bibliographique. [enligne]. Disponible sur :<http://www.bnf.fr/fr/professionnels/anx_formats/a.unimarc_manuel_format_bibliographique.html#SHDC__Attribute_BlocArticle3BnF>. (consulté le 20/12/2012).PMB sevices. PMB : Guide de ladministrateur. [en ligne]. Disponible sur :<http://www.sigb.net/doc/fr_FR/html-admin/>. (consulté le 24/12/2012).Club BCDI. Unimarc ISO 2709. [en ligne]. Disponible sur : < http://club-bcdi.crdp-poitiers.cndp.fr/docbcdi3ecole/unimarc.html#def>. (consulté le 24/12/2012).Lécole nationale supérieure darchitecture de Paris La Villette. (Noticebibliographique). [en ligne]. Disponible sur : < http://www.paris-lavillette.archi.fr/docu/biblioml/fr/B590092101_00073.173_001.xml>. (consulté le20/12/2012).Groupe de Recherche en Apprentissage Automatique Lille 3. BIBLIOML. [en ligne].Disponible sur : < http://www.grappa.univ-lille3.fr/~tommasi/InfoDoc/Formats2006/biblioML//bib-elt.html>. (consulté le20/12/2012).Blogokat, saga des DTD. Les DTD : 5. BiblioML. [en ligne]. Disponible sur : <http://blogokat.canalblog.com/archives/2005/01/16/240301.html>. (consulté le20/12/2012).SENBIBDOC. Archives du mot-clef BiblioML : N° 10 – XML et bibliothèques. [enligne]. Disponible sur : http://antoninbenoitdiouf.com/tag/biblioml/>. (consulté le20/12/2012).coverpages. BiblioML - XML for UNIMARC Bibliographic Records. [en ligne].Disponible sur : < http://xml.coverpages.org/biblioML.html>. (consulté le 20/12/2012).Glorieux, Frédéric. Bibliographie et XML. [en ligne]. Disponible sur :<http://projets.ajlsm.com/sdapa/sdapa/infos/standards/bibliographie.html>. (consulté le20/12/2012).
  17. 17. MOREL-PAIR, Catherine. Métadonnées et XML Des standards efficients del’environnement numérique. Villeurbanne : ENSSIB, 2007, 32 p.Olivier, Mabille. Enrichir le catalogage des documents audiovisuels : étude de faisabilitéau département de lAudiovisuel. Villeurbanne : ENSSIB, 2006, 82 p.Bernaudin, Anne-Claire. Mise en ligne d’un guide bibliographique en sciencesreligieuses : difficultés, enjeux, perspectives. ENSSIB, 2005, 68 p.

×