• J'aime
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Prochain SlideShare
Chargement dans... 5
×

theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

  • 2,192 vues
Transféré le

Intervention 45' Mediadix 12 octobre 2012

Intervention 45' Mediadix 12 octobre 2012

Plus dans : Éducation
  • Full Name Full Name Comment goes here.
    Êtes-vous sûr de vouloir
    Votre message apparaîtra ici
Aucun téléchargement

Vues

Total des vues
2,192
Sur Slideshare
0
À partir des ajouts
0
Nombre d'ajouts
2

Actions

Partages
Téléchargements
13
Commentaires
2
J'aime
5

Ajouts 0

No embeds

Signaler un contenu

Signalé comme inapproprié Signaler comme inapproprié
Signaler comme inapproprié

Indiquez la raison pour laquelle vous avez signalé cette présentation comme n'étant pas appropriée.

Annuler
    No notes for slide

Transcript

  • 1. theses.frun exemple douverture de linformation scientifique sur le web de données mediadix :: 12 octobre 2012
  • 2. Les identifiants, marchepied vers le web de données• 2011LYO20079 N° national de thèse• http://www.theses.fr/2011LYO20079• http://www.theses.fr/2011LYO20079/document• http://www.theses.fr/2011LYO20079.rdf• 030807069 Autorité Sudoc (IdRef)• http://www.theses.fr/030807069• http://www.theses.fr/030807069.rdf
  • 3. Les données ABES sur le web dedonnées, avec IdRef pour pivot
  • 4. Le nuage du web de données liées
  • 5. Le nuage du web de données liées
  • 6. Comment faire pour récupérer le RDF de theses.fr• Moissonnage – OAI-PMH – Sitemaps + RDF• Dump – Extraction de tout le RDF – Asynchrone (photo au temps t) – Celui qui a récupéré le dump a toute liberté • Ex : monter un serveur SPARQL et une appli dessus 
  • 7. Adopte un directeur de thèseRequête fine avec SPARQL :Je veux un directeur, qui a déjà dirigé une thèse sur la colonisation dans les 5 ans, qui n’encadre pas plus de 4 étudiants, qui est relié à tel vieux prof…Et encore plus de possibilités, via les liens RDF vers IdRef, Sudoc, Wikipedia…
  • 8. MAIS CE N’EST PAS SI SIMPLE…
  • 9. Les technologies sémantiques, c’est pas magiqueFOURNIR D’AUTRES MOYENSD’EXPLOITER LES DONNÉES
  • 10. Fournir d’autres moyens d’exploiter les données• OAI-PMH (pour thèses élec. Soutenues)• Notices Sudoc (!)• Web services de recherche :http://www.theses.fr/?q=colonialisme+allemagnehttp://www.theses.fr/?q=colonialisme+allemagne&format=atomhttp://www.theses.fr/?q=colonialisme+allemagne&format=solr
  • 11. t heses.f r en R F D
  • 12. Les technologies sémantiques, c’est pas magiqueL’INTEROPÉRABILITÉ,UN DILEMME
  • 13. Lever le dilemme de l’interopérabilité ?marcrel:aut dcterms:creatorMARCREL = MARC 21 Relators Dublin Core(codes de fonction)« plus fin mais un truc de bib » « tout le monde comprend mais un peu vague »marcrel:aut rdfs:subPropertyOf dcterms:creator Ce mécanisme logique lève le dilemme. Sur le papier…
  • 14. Les technologies sémantiques, c’est pas magiqueAVANT D’OUVRIR LES DONNÉES,IL FAUT LES PRODUIRE
  • 15. Derrière les données, des workflows, des réseaux, des gens• STEP – Réseau des thèses en préparation – Ex-FCT (Nanterre) – 80 établissements• STAR – Réseau des thèses numériques – 80 établissements• Circulation des données – Saisie en ligne – Imports (partiels ou complets)• Interconnexion avec IdRef – Utiliser et enrichir le référentiel d’autorités, avec outils IdRef – Automatiser le liage aux autorités ? Mais il faut encore qu’elles existent
  • 16. Les technologies sémantiques, c’est pas magiquePOUR SE LIER A D’AUTRES DONNÉES, ILFAUT QU’ELLES SOIENT OUVERTES !
  • 17. Aujourd’hui Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF owl:sameAs Auteur Auteur ISNI Wikipedia
  • 18. Demain Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF Auteur Auteur ISNI Wikipedia
  • 19. + articles, éditions scientifiques, num Après-demain peut-être ? Fonds érisation, etc. Calames Livre Worldcat Livre Sudoc cite Auteur IdRef Données Thèse brutes theses.fr a pour owl:sameAs+brevets, proj dérivéets ANR, etc. Auteur HAL CCSD Auteur VIAF Article HAL CCSD Auteur BnF owl:sameAs + CrossRef, revues, indicateurs d’usage, etc. Auteur Auteur ISNI Wikipedia
  • 20. Les services publics de données qui manquent aux thèses à l’IST• Structures de recherche• Écoles doctorales• Entreprises (SIREN de l’INSEE)• Brevets (?)• Classification des disciplines• Projets de recherche• …
  • 21. Leibniz, Lettre à Arnauld (30 avril 1687) 29