• Partagez
  • E-mail
  • Intégrer
  • J'aime
  • Télécharger
  • Contenu privé
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
 

theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

on

  • 2,456 vues

Intervention 45' Mediadix 12 octobre 2012

Intervention 45' Mediadix 12 octobre 2012

Statistiques

Vues

Total des vues
2,456
Vues sur SlideShare
1,483
Vues externes
973

Actions

J'aime
5
Téléchargements
13
Commentaires
2

3 Ajouts 973

http://www.scoop.it 959
https://twitter.com 13
http://localhost 1

Accessibilité

Catégories

Détails de l'import

Uploaded via as Microsoft PowerPoint

Droits d'utilisation

CC Attribution-ShareAlike LicenseCC Attribution-ShareAlike License

Report content

Signalé comme inapproprié Signaler comme inapproprié
Signaler comme inapproprié

Indiquez la raison pour laquelle vous avez signalé cette présentation comme n'étant pas appropriée.

Annuler

12 sur 2 précédent suivant

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Votre message apparaîtra ici
    Processing...
Poster un commentaire
Modifier votre commentaire

    theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données Presentation Transcript

    • theses.frun exemple douverture de linformation scientifique sur le web de données mediadix :: 12 octobre 2012
    • Les identifiants, marchepied vers le web de données• 2011LYO20079 N° national de thèse• http://www.theses.fr/2011LYO20079• http://www.theses.fr/2011LYO20079/document• http://www.theses.fr/2011LYO20079.rdf• 030807069 Autorité Sudoc (IdRef)• http://www.theses.fr/030807069• http://www.theses.fr/030807069.rdf
    • Les données ABES sur le web dedonnées, avec IdRef pour pivot
    • Le nuage du web de données liées
    • Le nuage du web de données liées
    • Comment faire pour récupérer le RDF de theses.fr• Moissonnage – OAI-PMH – Sitemaps + RDF• Dump – Extraction de tout le RDF – Asynchrone (photo au temps t) – Celui qui a récupéré le dump a toute liberté • Ex : monter un serveur SPARQL et une appli dessus 
    • Adopte un directeur de thèseRequête fine avec SPARQL :Je veux un directeur, qui a déjà dirigé une thèse sur la colonisation dans les 5 ans, qui n’encadre pas plus de 4 étudiants, qui est relié à tel vieux prof…Et encore plus de possibilités, via les liens RDF vers IdRef, Sudoc, Wikipedia…
    • MAIS CE N’EST PAS SI SIMPLE…
    • Les technologies sémantiques, c’est pas magiqueFOURNIR D’AUTRES MOYENSD’EXPLOITER LES DONNÉES
    • Fournir d’autres moyens d’exploiter les données• OAI-PMH (pour thèses élec. Soutenues)• Notices Sudoc (!)• Web services de recherche :http://www.theses.fr/?q=colonialisme+allemagnehttp://www.theses.fr/?q=colonialisme+allemagne&format=atomhttp://www.theses.fr/?q=colonialisme+allemagne&format=solr
    • t heses.f r en R F D
    • Les technologies sémantiques, c’est pas magiqueL’INTEROPÉRABILITÉ,UN DILEMME
    • Lever le dilemme de l’interopérabilité ?marcrel:aut dcterms:creatorMARCREL = MARC 21 Relators Dublin Core(codes de fonction)« plus fin mais un truc de bib » « tout le monde comprend mais un peu vague »marcrel:aut rdfs:subPropertyOf dcterms:creator Ce mécanisme logique lève le dilemme. Sur le papier…
    • Les technologies sémantiques, c’est pas magiqueAVANT D’OUVRIR LES DONNÉES,IL FAUT LES PRODUIRE
    • Derrière les données, des workflows, des réseaux, des gens• STEP – Réseau des thèses en préparation – Ex-FCT (Nanterre) – 80 établissements• STAR – Réseau des thèses numériques – 80 établissements• Circulation des données – Saisie en ligne – Imports (partiels ou complets)• Interconnexion avec IdRef – Utiliser et enrichir le référentiel d’autorités, avec outils IdRef – Automatiser le liage aux autorités ? Mais il faut encore qu’elles existent
    • Les technologies sémantiques, c’est pas magiquePOUR SE LIER A D’AUTRES DONNÉES, ILFAUT QU’ELLES SOIENT OUVERTES !
    • Aujourd’hui Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF owl:sameAs Auteur Auteur ISNI Wikipedia
    • Demain Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF Auteur Auteur ISNI Wikipedia
    • + articles, éditions scientifiques, num Après-demain peut-être ? Fonds érisation, etc. Calames Livre Worldcat Livre Sudoc cite Auteur IdRef Données Thèse brutes theses.fr a pour owl:sameAs+brevets, proj dérivéets ANR, etc. Auteur HAL CCSD Auteur VIAF Article HAL CCSD Auteur BnF owl:sameAs + CrossRef, revues, indicateurs d’usage, etc. Auteur Auteur ISNI Wikipedia
    • Les services publics de données qui manquent aux thèses à l’IST• Structures de recherche• Écoles doctorales• Entreprises (SIREN de l’INSEE)• Brevets (?)• Classification des disciplines• Projets de recherche• …
    • Leibniz, Lettre à Arnauld (30 avril 1687) 29