PLATEFORME NUMÉRISATION ET DE 
TRAITEMENT ARCHIVISTIQUE ET 
DOCUMENTAIRE 
http://msh-dijon.u-bourgogne.fr/
Décrire les ressources 
archivistiques et 
documentaires
Types de documents concernés 
• Fonds d’archives 
• Documents imprimés 
• Monographies 
• Publications en série 
Les premiers fonds traités à la MSH ont été des fonds d’archives 
• Forum Social Européen 
• Enquête archives de la recherche en SHS 
Description des fonds d’archives 
Réalisation d’instruments de recherche encodés en XML EAD (2002) 
Outils successifs : X-Metal , Arkhéïa aide au classement, oXygen depuis 2012
Fonds de documents imprimés décrits par la plateforme 
• Revues : 
• Cahiers d’histoire (1966-2001) 
• Société française (1981-1999) 
• Brochures / ouvrages 
• Brochures de la Bibliothèque Marxiste de Paris 
• Brochures du fonds des archives privées Patrick Kessel 
• Grande Edition Marx et Engels 
Description des documents imprimés 
Réalisation de catalogues encodés en XML EAD (2002) 
Outils utilisés : Arkhéïa aide au classement, module bibliothèque, oXygen depuis 
2012. 
Les catalogues EAD produits avec Arkhéïa sont conformes au format ISBD
Décrire des documents imprimés en XML-EAD 
• Une question de compétences 
Plusieurs années de pratique de l ’EAD à la MSH 
• Un choix contextuel 
Pleade, solution utilisée à la MSH pour la mise en oeuvre de son portail PANDOR 
est un outil de publication et de consultation d'instruments de recherche 
encodés en XML-EAD 
• Répondre aux évolutions de la pratique du web par le public 
Les catalogues de bibliothèques sont de moins en moins consultés. Opter pour le 
format XML, c’est être visible par les moteurs de recherche et donc par le public 
qui ne connait pas le portail de la MSH 
• Souplesse de la description en EAD 
Possibilité de créer et de distinguer des champs spécifiques aux besoins d’un 
projet, d’un corpus. 
Ex : notices de la GEME
Notice « enrichie » de la GEME 
Renvoi vers une autre 
traduction d’une même oeuvre. 
Rebond entre notices par lien hypertexte.
Distinguer la forme du contenu 
Objectifs 
• Proposer des affichages différents en fonction de la nature des documents 
décrits 
• Faciliter la mise en correspondance avec d’autres formats de métadonnées 
(ex : Dublin Core simple) et/ou l’exploitation par d’autres systèmes
Exemple d’encodage en EAD 
<c id="brb3612" level="item"> 
<did altrender="isbd-m-fr"> 
<unitid label="Cotes extrêmes">brb3612</unitid> 
<unittitle label="Intitulé de l'unité documentaire"> 
Un aspirant dictateur : André Tardieu / Félicien Challaye. 
<edition>2ème édition.</edition> 
<imprint> 
<geogname>Paris</geogname> 
<publisher>Librairie du travail</publisher> 
<date normal="1932" type="publication">1932</date> 
</imprint> 
<bibseries>Faits et documents ; 10</bibseries> 
</unittitle> 
<unitdate label="Date de l'unité documentaire" normal="1932">1932</unitdate> 
<physdesc label="Description physique"> 
<genreform >Ouvrages</genreform><lb/> 
<extent label="Collation" type="collation">32 p.</extent><lb/> 
</physdesc> 
</did><prefercite href="http://pandor.u-bourgogne. 
fr/ead.html?id=FRMSH021_00009&amp;amp;c=FRMSH021_00009_brb3612"/> 
<controlaccess> 
<persname role="auteur">Challaye, Félicien</persname> 
<title >Un aspirant dictateur : André Tardieu</title> 
</controlaccess> 
<dao href="BMP/brb3612/" role="series" title="Consulter la brochure"/></c>
Affichage par défaut de Pleade 
pour les documents imprimés 
Affichage de type ISBD : sans distinction des zones de description, peu adapté 
au public.
Affichage de type catalogue de 
bibliothèque prévu pour PANDOR 
Même contenu en EAD que la vue précédente, l’affichage varie en fonction de 
paramètres gérés par une feuille de style au niveau de l’application Pleade.
Notice sur Pandor
La même notice sur Europeana 
Après une mise en correspondance des champs EAD et Dublin Core simple, les 
métadonnées produites à la MSH sont affichées dans Eureopeana
Indexation 
Index existants 
• Titres 
• Auteurs 
• Éditeurs 
• Collection 
En outre, la navigation par le plan de classement permet une consultation 
thématique des fonds 
Indexation à venir 
• Indexation matière d’une partie du fonds des brochures de la BMP pendant 
un stage de 2 mois (avril – mai 2014)
Numériser les ressources 
documentaires et 
archivistiques
Constitution d’un parc de scanners depuis 2006 
• 2 scanners de production CANON DR 9050 C. Formats de sortie TIFF, JPEG, 
PDF, résolution max 600 dpi. 
• 2 scanners de livres i2s COPIBOOK RGB 300 dpi et i2s COPIBOOK ONYX 600 
dpi format de sortie
Constitution d’un parc de scanners depuis 2006 
• 1 scanner de livres précieux ou plans I2s DIGIBOOK A0, résolution max 800 DPI 
jusqu’au format A1 
• 1 scanner de microfilms automatique 16/35 mm WICKS 1 Wilson RS 325, 
résolution max 600 DPI.
Numérisation 
Le service de numérisation (SNBD) de la MSH de Dijon s’appuie sur les 
recommandations du Service Interministériel des Archives de France (SIAF), du 
Centre Informatique National de l’Enseignement Supérieur (CINES) et du TGIR 
Huma-Num en termes de numérisation, choix des formats numériques en 
fonction des différentes typologies et résolutions… (« Guide méthodologique 
pour le choix de formats numériques pérennes » et « le guide des bonnes 
pratiques numériques »). Une numérisation dite de conservation est effectuée à 
la MSH. 
Le format de numérisation pour les archives de type textuel ou iconographique 
est le format Tagged Image File Format (TIFF) sans compression. La résolution 
minimum est de 300 DPI, cependant s’il est prévu une phase de reconnaissance 
optique de caractères, la résolution sera de 400 DPI. Dans la plupart des cas la 
numérisation s’effectue en couleur.
La numérisation des corpus 
Grace au soutien de la fondation Gabriel Péri et du Conseil Régional de 
Bourgogne les corpus suivants ont pu être constitués 
• Le fonds de brochures de la BMP : 2933 brochures numérisées, traitées, 
recadrées soit 128 785 pages 
• Le fonds de brochures Patrick Kessel : 475 brochures numérisées, traitées, 
recadrées soit 16 000 pages 
• Numérisation d’ouvrages dans le cadre de la Grande édition Marx-Engels, 41 
ouvrages ont été numérisés soit 8800 pages
La numérisation des corpus 
Les revues dites communistes 
• Cahiers de l'Institut Maurice Thorez - Cahiers d'histoire, revue d'histoire 
critique (1966-2001) : 116 numéros numérisés soit 22 080 pages 
• Société française, Cahiers de l'institut de recherches marxistes - Société 
française - Société française, Raisons d'agir, passion de comprendre (1981- 
1999) : 60 numéros numérisés soit 4520 pages 
• La revue Economie et politique : 401 numéros, hors séries, ou conférences ont 
été numérisés soit 40 700 pages 
• La revue l’Ecole & la Nation : 338 numéros, hors séries ou suppléments 
numérisés soit 18 522 pages
La numérisation des corpus 
Corpus archives du communisme 
une partie des fonds suivants : 488, 489, 490, 491, 492, 493, 494, 495, 507, 717, 
533, 534, 535, 537, 538, 539 
Il s’agissait de numériser 220 microfilms soit 176 000 pages environ (cf. ANR 
PAPIK@2F pour de plus amples informations.
Diffuser les ressources 
documentaires et 
archivistiques
Le résultat de l’ensemble du travail réalisé par la plateforme de la MSH de Dijon 
(instruments de recherche, catalogues électroniques et documents numérisés) 
est mis en ligne sur internet et librement accessible via le Portail Archives 
Numériques et Données de la Recherche (PANDOR). 
http://pandor.u-bourgogne.fr 
Cet outil de diffusion permet la mise à disposition des corpus numériques 
constitués lors de programmes de recherche portés par la MSH et/ou les 
laboratoires SHS qui lui sont associés.
Fonctionnement technique du portail PANDOR 
L’application utilisée par la MSH de Dijon est issue du monde du libre. C’est une 
application Web, s’appuyant sur un serveur Apache et l’architecture J2EE (JAVA). 
Elle permet la publication et la diffusion de documents au format XML, et 
supporte les documents aux formats XML-EAD, XML-EAC, XML-TEI, et XML METS 
/ ALTO. Elle dispose aussi d’un moissonneur et d’un entrepôt OAI-PMH. En effet, 
elle supporte le protocole d’échange de données OAI-PMH, ce qui garantit 
l’interopérabilité avec d’autres bibliothèques numériques. 
Ainsi, le portail de publication de la MSH de Dijon est moissonné depuis mai 2013 
par la Bibliothèque Numérique EUROPEANA, dans le cadre du programme 
européen Heritage of People’s Europe (HOPE).
Navigation dans PANDOR 
Navigation dans un cadre de classement (classement par thématiques de 
recherche soutenues à la MSH de Dijon) – Navigation dans l’ensemble des corpus.
La recherche sur PANDOR 
Recherche simple 
Recherche avancée (dans tous les corpus) 
Recherche spécifique (recherche dans un corpus particulier) 
Recherche en plein texte dans les documents numérisés (très prochainement) – 
module XML ALTO 
Après obtention d’un identifiant et d’un mot de passe, possibilité de sauvegarder 
l’historique des requêtes et mise à disposition d’un porte-documents

Ppt msh def.

  • 1.
    PLATEFORME NUMÉRISATION ETDE TRAITEMENT ARCHIVISTIQUE ET DOCUMENTAIRE http://msh-dijon.u-bourgogne.fr/
  • 2.
    Décrire les ressources archivistiques et documentaires
  • 3.
    Types de documentsconcernés • Fonds d’archives • Documents imprimés • Monographies • Publications en série Les premiers fonds traités à la MSH ont été des fonds d’archives • Forum Social Européen • Enquête archives de la recherche en SHS Description des fonds d’archives Réalisation d’instruments de recherche encodés en XML EAD (2002) Outils successifs : X-Metal , Arkhéïa aide au classement, oXygen depuis 2012
  • 4.
    Fonds de documentsimprimés décrits par la plateforme • Revues : • Cahiers d’histoire (1966-2001) • Société française (1981-1999) • Brochures / ouvrages • Brochures de la Bibliothèque Marxiste de Paris • Brochures du fonds des archives privées Patrick Kessel • Grande Edition Marx et Engels Description des documents imprimés Réalisation de catalogues encodés en XML EAD (2002) Outils utilisés : Arkhéïa aide au classement, module bibliothèque, oXygen depuis 2012. Les catalogues EAD produits avec Arkhéïa sont conformes au format ISBD
  • 5.
    Décrire des documentsimprimés en XML-EAD • Une question de compétences Plusieurs années de pratique de l ’EAD à la MSH • Un choix contextuel Pleade, solution utilisée à la MSH pour la mise en oeuvre de son portail PANDOR est un outil de publication et de consultation d'instruments de recherche encodés en XML-EAD • Répondre aux évolutions de la pratique du web par le public Les catalogues de bibliothèques sont de moins en moins consultés. Opter pour le format XML, c’est être visible par les moteurs de recherche et donc par le public qui ne connait pas le portail de la MSH • Souplesse de la description en EAD Possibilité de créer et de distinguer des champs spécifiques aux besoins d’un projet, d’un corpus. Ex : notices de la GEME
  • 6.
    Notice « enrichie» de la GEME Renvoi vers une autre traduction d’une même oeuvre. Rebond entre notices par lien hypertexte.
  • 7.
    Distinguer la formedu contenu Objectifs • Proposer des affichages différents en fonction de la nature des documents décrits • Faciliter la mise en correspondance avec d’autres formats de métadonnées (ex : Dublin Core simple) et/ou l’exploitation par d’autres systèmes
  • 8.
    Exemple d’encodage enEAD <c id="brb3612" level="item"> <did altrender="isbd-m-fr"> <unitid label="Cotes extrêmes">brb3612</unitid> <unittitle label="Intitulé de l'unité documentaire"> Un aspirant dictateur : André Tardieu / Félicien Challaye. <edition>2ème édition.</edition> <imprint> <geogname>Paris</geogname> <publisher>Librairie du travail</publisher> <date normal="1932" type="publication">1932</date> </imprint> <bibseries>Faits et documents ; 10</bibseries> </unittitle> <unitdate label="Date de l'unité documentaire" normal="1932">1932</unitdate> <physdesc label="Description physique"> <genreform >Ouvrages</genreform><lb/> <extent label="Collation" type="collation">32 p.</extent><lb/> </physdesc> </did><prefercite href="http://pandor.u-bourgogne. fr/ead.html?id=FRMSH021_00009&amp;amp;c=FRMSH021_00009_brb3612"/> <controlaccess> <persname role="auteur">Challaye, Félicien</persname> <title >Un aspirant dictateur : André Tardieu</title> </controlaccess> <dao href="BMP/brb3612/" role="series" title="Consulter la brochure"/></c>
  • 9.
    Affichage par défautde Pleade pour les documents imprimés Affichage de type ISBD : sans distinction des zones de description, peu adapté au public.
  • 10.
    Affichage de typecatalogue de bibliothèque prévu pour PANDOR Même contenu en EAD que la vue précédente, l’affichage varie en fonction de paramètres gérés par une feuille de style au niveau de l’application Pleade.
  • 11.
  • 12.
    La même noticesur Europeana Après une mise en correspondance des champs EAD et Dublin Core simple, les métadonnées produites à la MSH sont affichées dans Eureopeana
  • 13.
    Indexation Index existants • Titres • Auteurs • Éditeurs • Collection En outre, la navigation par le plan de classement permet une consultation thématique des fonds Indexation à venir • Indexation matière d’une partie du fonds des brochures de la BMP pendant un stage de 2 mois (avril – mai 2014)
  • 14.
    Numériser les ressources documentaires et archivistiques
  • 15.
    Constitution d’un parcde scanners depuis 2006 • 2 scanners de production CANON DR 9050 C. Formats de sortie TIFF, JPEG, PDF, résolution max 600 dpi. • 2 scanners de livres i2s COPIBOOK RGB 300 dpi et i2s COPIBOOK ONYX 600 dpi format de sortie
  • 16.
    Constitution d’un parcde scanners depuis 2006 • 1 scanner de livres précieux ou plans I2s DIGIBOOK A0, résolution max 800 DPI jusqu’au format A1 • 1 scanner de microfilms automatique 16/35 mm WICKS 1 Wilson RS 325, résolution max 600 DPI.
  • 17.
    Numérisation Le servicede numérisation (SNBD) de la MSH de Dijon s’appuie sur les recommandations du Service Interministériel des Archives de France (SIAF), du Centre Informatique National de l’Enseignement Supérieur (CINES) et du TGIR Huma-Num en termes de numérisation, choix des formats numériques en fonction des différentes typologies et résolutions… (« Guide méthodologique pour le choix de formats numériques pérennes » et « le guide des bonnes pratiques numériques »). Une numérisation dite de conservation est effectuée à la MSH. Le format de numérisation pour les archives de type textuel ou iconographique est le format Tagged Image File Format (TIFF) sans compression. La résolution minimum est de 300 DPI, cependant s’il est prévu une phase de reconnaissance optique de caractères, la résolution sera de 400 DPI. Dans la plupart des cas la numérisation s’effectue en couleur.
  • 18.
    La numérisation descorpus Grace au soutien de la fondation Gabriel Péri et du Conseil Régional de Bourgogne les corpus suivants ont pu être constitués • Le fonds de brochures de la BMP : 2933 brochures numérisées, traitées, recadrées soit 128 785 pages • Le fonds de brochures Patrick Kessel : 475 brochures numérisées, traitées, recadrées soit 16 000 pages • Numérisation d’ouvrages dans le cadre de la Grande édition Marx-Engels, 41 ouvrages ont été numérisés soit 8800 pages
  • 19.
    La numérisation descorpus Les revues dites communistes • Cahiers de l'Institut Maurice Thorez - Cahiers d'histoire, revue d'histoire critique (1966-2001) : 116 numéros numérisés soit 22 080 pages • Société française, Cahiers de l'institut de recherches marxistes - Société française - Société française, Raisons d'agir, passion de comprendre (1981- 1999) : 60 numéros numérisés soit 4520 pages • La revue Economie et politique : 401 numéros, hors séries, ou conférences ont été numérisés soit 40 700 pages • La revue l’Ecole & la Nation : 338 numéros, hors séries ou suppléments numérisés soit 18 522 pages
  • 20.
    La numérisation descorpus Corpus archives du communisme une partie des fonds suivants : 488, 489, 490, 491, 492, 493, 494, 495, 507, 717, 533, 534, 535, 537, 538, 539 Il s’agissait de numériser 220 microfilms soit 176 000 pages environ (cf. ANR PAPIK@2F pour de plus amples informations.
  • 21.
    Diffuser les ressources documentaires et archivistiques
  • 22.
    Le résultat del’ensemble du travail réalisé par la plateforme de la MSH de Dijon (instruments de recherche, catalogues électroniques et documents numérisés) est mis en ligne sur internet et librement accessible via le Portail Archives Numériques et Données de la Recherche (PANDOR). http://pandor.u-bourgogne.fr Cet outil de diffusion permet la mise à disposition des corpus numériques constitués lors de programmes de recherche portés par la MSH et/ou les laboratoires SHS qui lui sont associés.
  • 23.
    Fonctionnement technique duportail PANDOR L’application utilisée par la MSH de Dijon est issue du monde du libre. C’est une application Web, s’appuyant sur un serveur Apache et l’architecture J2EE (JAVA). Elle permet la publication et la diffusion de documents au format XML, et supporte les documents aux formats XML-EAD, XML-EAC, XML-TEI, et XML METS / ALTO. Elle dispose aussi d’un moissonneur et d’un entrepôt OAI-PMH. En effet, elle supporte le protocole d’échange de données OAI-PMH, ce qui garantit l’interopérabilité avec d’autres bibliothèques numériques. Ainsi, le portail de publication de la MSH de Dijon est moissonné depuis mai 2013 par la Bibliothèque Numérique EUROPEANA, dans le cadre du programme européen Heritage of People’s Europe (HOPE).
  • 24.
    Navigation dans PANDOR Navigation dans un cadre de classement (classement par thématiques de recherche soutenues à la MSH de Dijon) – Navigation dans l’ensemble des corpus.
  • 26.
    La recherche surPANDOR Recherche simple Recherche avancée (dans tous les corpus) Recherche spécifique (recherche dans un corpus particulier) Recherche en plein texte dans les documents numérisés (très prochainement) – module XML ALTO Après obtention d’un identifiant et d’un mot de passe, possibilité de sauvegarder l’historique des requêtes et mise à disposition d’un porte-documents