Innover par et
pour la donnée
@ Bibcamp'2015
nicolas.chauvat@logilab.fr
Fondateur et PDG de Logilab depuis l'an 2000
2
Vous n'êtes pas du métier ?
ma culture =
recherche en informatique
+ logiciel libre
+ Web
+ agilité
3
Comment êtes-vous arrivé là ?
•  CubicWeb débuté en 2001
•  Linked Open Data pour des musées en 2006
•  Rencontré BnF à un...
Vous vendez quoi ?
•  conseil et formation
(urbanisation des données, web sémantique, agilité, etc.)
•  publication web sé...
data.bnf
le Web
7
8
Alignements
•  Outil Nazca (calcul de similarités)
•  notice bibliographique <-> notice d'autorité titre
•  regroupe ou cr...
10
Feuille de route data.bnf
•  100% du catalogue
•  mise à jour toutes les 2 semaines
•  réintégration des alignements dans ...
Enjeux data.bnf selon la BnF
•  Visibilité et référencement
•  Interopérabilité
•  Fiabilité grâce à la traçabilité des UR...
13
14
15
16
17
18
19
Linked Data et bibliothèques
•  http://data.bnf.fr et bibliothèques
•  http://data.europeana.eu
•  http://datos.bne.es, ht...
Provenance des jeux de données
•  généré par ?
•  utilisé par ?
•  date de début / fin ?
•  dérivé de ?
•  licence ?
21
Maturité des données ouvertes
1.  Données disponibles sur le Web sous une licence ouverte
2.  + format structuré (CSV, XML...
interopérabilité
le Web
Qu'est-ce que le web ?
Réseau mondial de données construit sur la base d'un ensemble de
standards d'interopérabilité (prot...
Le Web passe à l'échelle
Liens permettent collaboration à grande échelle
Création d'identifiants est décentralisée
(Domain...
Attention à ne pas confondre
•  web sémantique :
données utilisables par un programme PAS trait. auto. des langues
•  RDF ...
Recentrage sur les données
•  rassembler / collecter
•  aligner / normaliser
•  enrichir / annoter / classer
•  définir un...
Urbanisation des données
libre privé
externe interne
générique spécifique
statique dynamique
29
30
Avenir probable
•  biens communs
•  spécialisation territoire / langue / thème / domaine
•  interopérabilité / décentralis...
Les applications
passent,
les données
restent.
“
Prochain SlideShare
Chargement dans…5
×

Innover par et pour la donnée - Logilab ADBU Bibcamp 2015

2 354 vues

Publié le

Innover par et pour la donnée, illustrée par l'exemple de data.bnf.fr et les principes du web sémantique.

Présentation de Logilab au #bibcamp15 organisé en juin 2015 par l'ADBU, association des directeurs de bibliothèques universitaires.

Publié dans : Formation
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
2 354
Sur SlideShare
0
Issues des intégrations
0
Intégrations
867
Actions
Partages
0
Téléchargements
7
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Innover par et pour la donnée - Logilab ADBU Bibcamp 2015

  1. 1. Innover par et pour la donnée
  2. 2. @ Bibcamp'2015 nicolas.chauvat@logilab.fr Fondateur et PDG de Logilab depuis l'an 2000 2
  3. 3. Vous n'êtes pas du métier ? ma culture = recherche en informatique + logiciel libre + Web + agilité 3
  4. 4. Comment êtes-vous arrivé là ? •  CubicWeb débuté en 2001 •  Linked Open Data pour des musées en 2006 •  Rencontré BnF à une conference en 2007 •  Gagné marché en 2010 puis 2012 •  Depuis de nombreux projets intéressants 4
  5. 5. Vous vendez quoi ? •  conseil et formation (urbanisation des données, web sémantique, agilité, etc.) •  publication web sémantique (culture = opencat + fevis + biblissima + musées) •  traitement des données (nettoyage, enrichissement, alignement, etc.) 5
  6. 6. data.bnf le Web
  7. 7. 7
  8. 8. 8
  9. 9. Alignements •  Outil Nazca (calcul de similarités) •  notice bibliographique <-> notice d'autorité titre •  regroupe ou crée notices biblio et autorité •  liens avec bases externes •  Réutilisation de données •  règles métiers ou identifiant ARK •  VIAF et autres alignements existants 9
  10. 10. 10
  11. 11. Feuille de route data.bnf •  100% du catalogue •  mise à jour toutes les 2 semaines •  réintégration des alignements dans le catalogue •  ajout de modèles plus simples (?) •  data.bnf.fr/atelier pour avant-premières 11
  12. 12. Enjeux data.bnf selon la BnF •  Visibilité et référencement •  Interopérabilité •  Fiabilité grâce à la traçabilité des URLs •  Réutilisation souple par des tiers 12
  13. 13. 13
  14. 14. 14
  15. 15. 15
  16. 16. 16
  17. 17. 17
  18. 18. 18
  19. 19. 19
  20. 20. Linked Data et bibliothèques •  http://data.bnf.fr et bibliothèques •  http://data.europeana.eu •  http://datos.bne.es, http://dnb.de, http://libris.kb.se •  Sudoc IdRef •  VIAF (Virtual International Authority File) •  etc 20
  21. 21. Provenance des jeux de données •  généré par ? •  utilisé par ? •  date de début / fin ? •  dérivé de ? •  licence ? 21
  22. 22. Maturité des données ouvertes 1.  Données disponibles sur le Web sous une licence ouverte 2.  + format structuré (CSV, XML, Excel, mais pas PDF ou image) 3.  + format non-propriétaire (CSV plutôt que Excel) 4.  + respect des standards RDF (identification par des URLs, vocabulaire défini: pas CSV, etc.) 5.  + liens vers d'autres données pour fournir du contexte (ontologies) et enrichir (autres jeux de données) 22
  23. 23. interopérabilité
  24. 24. le Web
  25. 25. Qu'est-ce que le web ? Réseau mondial de données construit sur la base d'un ensemble de standards d'interopérabilité (protocoles, formats, vocabulaires, modèles, interrogation), qui s'appuie sur les URLs pour identifier de manière unique les données élémentaires et les lier entre elles. “ 25
  26. 26. Le Web passe à l'échelle Liens permettent collaboration à grande échelle Création d'identifiants est décentralisée (Domain Name System est délégué) Incohérence globale ("monde ouvert") permet parallélisation 26
  27. 27. Attention à ne pas confondre •  web sémantique : données utilisables par un programme PAS trait. auto. des langues •  RDF et vocabulaires : standardiser les échanges de données PAS les outils et le stockage •  Un et un seul Web : un protocole (HTTP) et plusieurs standards pour l'échange de données (HTML, RDF, OWL, JSON, DC, FOAF, SKOS, etc.) 27
  28. 28. Recentrage sur les données •  rassembler / collecter •  aligner / normaliser •  enrichir / annoter / classer •  définir un pivot métier avec des données de référence •  lier les données entre elles 28
  29. 29. Urbanisation des données libre privé externe interne générique spécifique statique dynamique 29
  30. 30. 30
  31. 31. Avenir probable •  biens communs •  spécialisation territoire / langue / thème / domaine •  interopérabilité / décentralisation •  multiplicité des réutilisations 31
  32. 32. Les applications passent, les données restent. “

×