3. Contexte
J’aime lire des livres – mais pas les relire !
Ceux que j’achète trainent sur mes étagères
Je préfère donc emprunter en bibliothèque
J’ai autour de chez moi plusieurs bibliothèques
Municipales, universitaires, associatives
Comment en profiter au mieux ?
5. Difficultés pour l’usager
OPAC laissant parfois à désirer
Ergonomie moyenne, lenteur
Peu de (méta)données : commentaires, extraits, etc.
Services annexes : être averti des nouveautés, etc.
Pas de catalogue commun en général
Recherche croisée quelque fois possible
Obligation de « consommer l’information » telle
qu’on nous la présente
Qu’est-ce mon projet propose ?
6. L’accès à des données « structurées »
Données enfouies dans les SIGB
Le plus utile d’abord : disponibilité des ouvrages
Potentiellement beaucoup plus d’informations, pour
différents publics
Service de recherche fédérée
Nantes
Critère de recherche
ex: ISBN = 2-266-11156-6 Saint
Herblain
Résultat Orvault
ex: disponible à Nantes
bibli.othequ.es
7. Exploiter les données
Interface graphique pour l’utilisateur
Serais-je capable de faire un meilleur OPAC ?
S’intégrer dans les usages actuels du Web
Mashup : se greffer sur les sites Web existants
Vente en ligne (Amazon, Alapage, Chapitre…)
Choix pragmatique, qui n’est pas sans soulever des questions
Critiques littéraires
Potentiellement tout site Web avec référence à un livre
Mais comment identifier cette référence ? ISBN, OpenURL
10. Comment ça fonctionne ? côté client
Technologie « user script » (JavaScript)
Disponible
sur Firefox (Greasemonkey), IE, Safari,
Google Chrome, Opera
Script bibli.othequ.es exécuté sur les pages d’une
liste prédéfinie de sites Web
Extractionde l’ISBN (mais OpenURL envisageable)
Nécessite de connaître la structure du code HTML
Interroge le service de recherche fédérée
Incruste le widget selon résultat de la recherche
11. Comment ça fonctionne ? côté serveur
Base de données recensant les bibliothèques
Modélisation « au mieux » et schéma XML
Serveurs
backend (Z39.50, SRU) et frontend (OPAC)
Adresse, protocole, type SIGB, format MARC Département
Bibliothèques
Hiérarchie en ensembles Ville
Informations géographiques
BU BM
Données d’exemplaires
à « déchiffrer » Univ 1 Univ 2
12. Comment ça fonctionne ? côté serveur
Interrogation des serveurs
Z39.50 – quand c’est possible…
Sinon web scraping de l’OPAC (!)
Logiciel en Perl supportant env. 15 types d’OPAC
Pour 1 ISBN donné : interrogation & redirection
Difficile à fiabiliser, solution de derniers recours
Chaine de traitement Z39.50/SRU et MARC/XML
Baséesur des logiciels libres
Notamment grâce aux produits d’IndexData
13. Schéma de fonctionnement
Web
Normalisation MARC
Optimisation réseau
Z39.50 #1
ISBN
Infos de
+
dispo.
ID bib.
yazproxy Z39.50 #2
http://
bibli.othequ.es OPAC #1
/search
SimpleServer
OPAC #2
Liste
des
bibliothèques Cache MARC
14. Perspectives
Industrialiser la solution
Utiliser
des standards (ISO, donc payants…)
Annuaire de bibliothèques et de leurs services
ISO 2146:2009 (modèle) et ISO 8459:2009 (vocabulaire)
Répertoires du CCFr + SUDOC comme point de départ
D’autres l’ont déjà fait : projet australien ORCA
Interrogation d’un catalogue pour disponibilité
ISO 20775:2009 (schéma XML), compatible avec SRU/SRW
Utilisé par WorldCat pour leur API
Quelle implication des bibliothèques ?
Annuaire, données d’exemplaires, etc.
15. Bilan
Ca marche – à peu près
Dépendant de la fiabilité des serveurs interrogés
Reste un prototype, un outil de démonstration
Une idée de projet à reprendre par une institution
Les données suscitent les innovations
Qualités à viser : diversité, exhaustivité et fiabilité
Produire avant d’avoir (tous) les usages
Après WorldCat
FranceCat ?