Ce diaporama a bien été signalé.
Le téléchargement de votre SlideShare est en cours. ×

JCR 2021 - Présentation "Et la boucle est bouclee"

Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Chargement dans…3
×

Consultez-les par la suite

1 sur 7 Publicité

Plus De Contenu Connexe

Plus par ABES (20)

Plus récents (20)

Publicité

JCR 2021 - Présentation "Et la boucle est bouclee"

  1. 1. Et la boucle est bouclée : les notices ISSN dans le Sudoc Réunion annuelle des responsables de centres du réseau du Sudoc-PS Jeudi 14 Octobre 2021 - Montpellier
  2. 2. Base “signal” x x Conversion et enrichissement des notices
  3. 3. PICA + “AFF P” = “AFF UNM”
  4. 4. Base de Production Base “signal” Chargement des notices en base de production
  5. 5. Fusions 86% Nouvelles notices (imprimé) 6% Nouvelles notices (électronique) 6% Candidats-doublons 2% Répartition (statistiques imports 2020)
  6. 6. RAPPEL : Comment fonctionnent les fusions ? La zone de la notice résidente est intégralement remplacée (« écrasée ») Zones concernées (quelques exemples) : 011, 100, 530, … ; 430, 440, … (zones sous autorité ISSN) La zone est ajoutée à la notice résidente si elle est différente (si elle est identique, on laisse la zone existante) Zones concernées (quelques exemples) : 033, 321, … La zone est ajoutée à la notice résidente si elle est absente Zones concernées (quelques exemples) : 207, 676, … • Mettre à jour les zones sous autorité ISSN • Conserver au maximum les zones susceptibles d’avoir été modifiées / enrichies par les catalogueurs
  7. 7. Traitements post-chargement

Notes de l'éditeur

  • Et le Sudoc, alors ?

    L’Abes importe les notices du registre dans le Sudoc, et il nous a paru intéressant de détailler avec vous la chaîne de traitement

    => Volonté de montrer comment ça se passe « en coulisses », pour mieux comprendre ce qu’il se passe dans le Sudoc quand le réseau crée des notices, fait des demandes Cidemis numérotation/corrections




  • Description du circuit d’import des notices en provenance d’ISSN dans le Sudoc : nous a paru utile de l’expliquer, pour mieux comprendre modalités d’import, zone modifiées/écrasées, quels enrichissements ?

    CIEPS/ISSN - Centre international d’enregistrement des publications en série (CIEPS) (Centre international de l’ISSN)

    CIEPS : envoi bimensuel des notices : nouvelles notices, notices mises à jour (centres étrangers + international + ISSN France pour l’instant)
    Export des notices à destination de l’Abes (en UNIMARC ISO), via mise à disposition des fichiers sur le cloud => envoi mail : x fichiers à dispo (2 ou 3 généralement, pour un volume d’environ 10 – 15 000 notices, parfois +)

    Réception puis conversion des notices en PICA+ (= format propriétaire de la base de données qui se cache derrière le Sudoc)
    + enrichissements (= données ajoutées par le programme de conversion) :
    Date de la conversion en 801
    Ajout n° source (035) issn12345678 ; road12345678 si 321 ROAD présente dans la notice importée
    210 ou 214, selon les conditions définies (si 202 dans l’une des zones 210 => 214)

    Chargement des notices converties dans une base « signal » = une base de transit, dotée d’un minimum d’index de même définition que ceux de la base dans laquelle on veut importer les notices (= base de production) ; on l’appelle aussi base intermédiaire

    Corrections dans la base intermédiaire : si la correction porte sur des données sous autorité ISSN => suppression et ré-import de la notice
    Sinon, correction directement dans la base intermédiaire
  • Visualisation d’une notice en PICA+
  • Maintenant que les notices se trouvent dans cette base « intermédiaire », il va falloir les charger dans la base de production.
    Pb : certaines notices se trouvent déjà dans la base, soit créées par les catalogueurs du réseau, avec demande de numérotation, soit elles ont été mises à jour par le CIEPS, et doivent être rechargées en corrigeant les infos mises à jour.
    D’autres notices doivent être créées, car ne sont pas encore dans le catalogue.

    On va donc définir des paramètres qui permettent de comparer les nouvelles notices avec celles du Sudoc (notices « résidentes ») : le programme va comparer afin de savoir s’il doit faire nouvelle notice, fusion ou candidat doublon.

    Vérifier si la notice est déjà dans le Sudoc, grâce aux n° source : 035 et 011 + type de support
    Si oui > fusion (si toutes les conditions sont réunies)

    Reliquat : soumis à l’autre type de comparaison : index CLM & taux de ressemblance

    CLM = CLuster Matchkey

    Clé titre auteur (9, 4, 2, 2, 1, 4)

    Les valeurs de cet index sont calculées en prenant les :

    9 premiers caractères du premier mot du titre
    4 premiers caractères du deuxième mot du titre
    2 premiers caractères du troisième mot du titre
    2 premiers caractères du quatrième mot du titre
    1 (premier) caractère du cinquième mot du titre
    4 premiers caractères du premier mot du nom de l'auteur

    Zones :
    200 $a $c $e $h $i
    700, 701, 702 $a
    710, 711, 712 $a

    A la fin de cette étape, le programme produit des fichiers résultats, qui serviront aux traitements post-chargement
  • Comment se répartissent les différents cas de figure ? Fusion ? Nouvelle notice ? Candidat-doublon ?
    Toujours à peu près les mêmes proportions : ex. sur l’année 2020

    358303 notices reçues
    357984 notices converties

    21088 nouvelles imp
    21998 nouvelles élec
    46086 nouvelles en tout

    7507 candidats doublons

    307164 fusions

    196 notices supprimées de la base intermédiaire pour conflit de support
  • Fonctionnement des fusions
    On met à jour les zones sous autorité ISSN
    On conserve au maximum les zones susceptibles d’avoir été modifiées / enrichies par les catalogueurs pour ne pas écraser le travail du réseau

    1 table .asc = fichier de commandes, qui liste toutes les zones de la notice, suivi d’instructions pour chaque zone

    3 grands cas de figure :
    On remplace totalement la zone de la notice résidente par celle de la notice entrante = on « écrase » la zone existante
    Ex. 100, 530 (= zones sous autorité ISSN)
    + quasiment toutes les zones de liens 4XX

    &036J REPLACE(KEEP) ADD(KEEP) DELETE !430
    &036K REPLACE(KEEP) ADD(KEEP) DELETE !440

    Pour la liste de toutes les zones sous autorité ISSN, se référer au GM : http://documentation.abes.fr/sudoc/manuels/controle_bibliographique/circuit_signalement_rc/index.html#CorrectionZoneAutoriteISSN

    On ajoute la zone si elle est différente
    Ex. 321 : si identique dans la notice résidente et dans entrante, on ne fait rien ; sinon, on ajoute la 321 différente ($a)
    033
    &009Q IDENTICAL($a)?KEEP:ADD ADD(KEEP) KEEP !033

    On ajoute la zone si elle est absente
    Ex. 207

  • Grâce aux fichiers résultats produits au moment de l’intégration des notices dans la base de production, on va pouvoir appliquer d’autres traitements aux notices, après leur chargement
    Opérations manuelles !

    Traitement des conflits de support A/O = inversion des ISSN entre l’imprimé et son équivalent électronique
    Si erreur < Registre, on garde la notice résidente Sudoc et on supprime la notice erronée de la base intermédiaire (elle ne sera pas chargée) ; la notice résidente ne sera pas modifiée
    Si erreur < Sudoc, on corrige la notice résidente (Ab > Ob ou Ob > Ab + zones à mettre à jour), et la notice entrante fusionne avec la résidente


    2. Traitement des demandes Cidemis à partir des fichiers résultats « merge » ( = pour les notices qui ont fusionné avec les notices résidentes du Sudoc) : repérer les notices qui contiennent une demande Cidemis
    Pour les demandes de numérotation => on supprime la zone 830 qui contient la demande, puisque de fait la notice a été numérotée puisqu’elle a été livrée
    Pour les demandes de corrections : on vérifie si la correction a été prise en compte
    Si oui, suppression zone de la demande
    Si non, on rétablit la donnée corrigée par le catalogueur (pour mémoire, les demandes de correction porte sur des zones sous autorité ISSN, donc correction proposée est effacée au moment du chargement = donnée écrasée par celle de la notice entrante), et on laisse la zone contenant la demande de correction puisqu’elle n’a pas été prise en compte
    Pour les demandes de corrections antérieures à la mise en place du circuit Cidemis, l’Abes précise en 830 qu’il faut ré-initialiser la demande dans Cidemis si elle est toujours d’actualité

    Comme souligné précédemment par Yves, la suppression de la zone 830 contenant la demande dans le Sudoc n’entraîne pas la validation automatique dans Cidemis (alors que la validation dans Cidemis entraîne la suppression automatique de la 830 Sudoc)

    Il n’y a aucun moyen automatique de « pister » les demandes de correction refusées/acceptées dans les notices du Sudoc et les demandes correspondantes non validées dans Cidemis.

    Il est en revanche possible de « pister » les demandes de numérotation acceptées dans les notices du Sudoc et de clore automatiquement les demandes correspondantes dans Cidemis : la base est a priori à jour au 1er juin 2021.
    il faut aller valider dans Cidemis (moi je fais parfois ça). Et ensuite on croise les doigts pour que le Centre mette à jour dans Cidemis

    3. Traitement des candidats-doublons
    Contrairement aux autres imports (mono, notamment), c’est l’Abes qui traite les candidats doublons, dès le chargement terminé.

    RAPPEL : les fusions se font automatiquement chaque soir / le programme de fusion tourne tous les soirs à 19h

    4. Programme de liage (zone 4XX) = remplacer $tTitre et $xISSN par $0PPN

×