0
theses.frun exemple douverture de linformation scientifique    sur le web de données                      mediadix :: 12 o...
Les identifiants,    marchepied vers le web de données•   2011LYO20079       N° national de thèse•   http://www.theses.fr/...
Les données ABES sur le web dedonnées, avec IdRef pour pivot
Le nuage du web de données liées
Le nuage du web de données liées
Comment faire pour récupérer le RDF           de theses.fr• Moissonnage  – OAI-PMH  – Sitemaps + RDF• Dump  – Extraction d...
Adopte un directeur de thèseRequête fine avec SPARQL :Je veux un directeur, qui a  déjà dirigé une thèse sur  la colonisat...
MAIS CE N’EST PAS SI SIMPLE…
Les technologies sémantiques, c’est pas magiqueFOURNIR D’AUTRES MOYENSD’EXPLOITER LES DONNÉES
Fournir d’autres moyens d’exploiter les                données• OAI-PMH (pour thèses élec. Soutenues)• Notices Sudoc (!)• ...
t heses.f r en R F                D
Les technologies sémantiques, c’est pas magiqueL’INTEROPÉRABILITÉ,UN DILEMME
Lever le dilemme de l’interopérabilité                  ?marcrel:aut                            dcterms:creatorMARCREL = M...
Les technologies sémantiques, c’est pas magiqueAVANT D’OUVRIR LES DONNÉES,IL FAUT LES PRODUIRE
Derrière les données, des workflows, des réseaux, des gens• STEP   – Réseau des thèses en préparation   – Ex-FCT (Nanterre...
Les technologies sémantiques, c’est pas magiquePOUR SE LIER A D’AUTRES DONNÉES, ILFAUT QU’ELLES SOIENT OUVERTES !
Aujourd’hui                     Fonds                               Calames               Livre              Sudoc        ...
Demain                     Fonds                          Calames          Livre         Sudoc                            ...
+ articles, éditions                                                                            scientifiques, num  Après-...
Les services publics de données qui        manquent aux thèses à l’IST•   Structures de recherche•   Écoles doctorales•   ...
Leibniz, Lettre à Arnauld (30 avril 1687)                                            29
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Prochain SlideShare
Chargement dans... 5
×

theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

2,343

Published on

Intervention 45' Mediadix 12 octobre 2012

Published in: Éducation
2 commentaires
6 mentions J'aime
Statistiques
Remarques
Aucun téléchargement
Vues
Total des vues
2,343
Sur Slideshare
0
À partir des ajouts
0
Nombre d'ajouts
2
Actions
Partages
0
Téléchargements
14
Commentaires
2
J'aime
6
Ajouts 0
No embeds

No notes for slide

Transcript of "theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données"

  1. 1. theses.frun exemple douverture de linformation scientifique sur le web de données mediadix :: 12 octobre 2012
  2. 2. Les identifiants, marchepied vers le web de données• 2011LYO20079 N° national de thèse• http://www.theses.fr/2011LYO20079• http://www.theses.fr/2011LYO20079/document• http://www.theses.fr/2011LYO20079.rdf• 030807069 Autorité Sudoc (IdRef)• http://www.theses.fr/030807069• http://www.theses.fr/030807069.rdf
  3. 3. Les données ABES sur le web dedonnées, avec IdRef pour pivot
  4. 4. Le nuage du web de données liées
  5. 5. Le nuage du web de données liées
  6. 6. Comment faire pour récupérer le RDF de theses.fr• Moissonnage – OAI-PMH – Sitemaps + RDF• Dump – Extraction de tout le RDF – Asynchrone (photo au temps t) – Celui qui a récupéré le dump a toute liberté • Ex : monter un serveur SPARQL et une appli dessus 
  7. 7. Adopte un directeur de thèseRequête fine avec SPARQL :Je veux un directeur, qui a déjà dirigé une thèse sur la colonisation dans les 5 ans, qui n’encadre pas plus de 4 étudiants, qui est relié à tel vieux prof…Et encore plus de possibilités, via les liens RDF vers IdRef, Sudoc, Wikipedia…
  8. 8. MAIS CE N’EST PAS SI SIMPLE…
  9. 9. Les technologies sémantiques, c’est pas magiqueFOURNIR D’AUTRES MOYENSD’EXPLOITER LES DONNÉES
  10. 10. Fournir d’autres moyens d’exploiter les données• OAI-PMH (pour thèses élec. Soutenues)• Notices Sudoc (!)• Web services de recherche :http://www.theses.fr/?q=colonialisme+allemagnehttp://www.theses.fr/?q=colonialisme+allemagne&format=atomhttp://www.theses.fr/?q=colonialisme+allemagne&format=solr
  11. 11. t heses.f r en R F D
  12. 12. Les technologies sémantiques, c’est pas magiqueL’INTEROPÉRABILITÉ,UN DILEMME
  13. 13. Lever le dilemme de l’interopérabilité ?marcrel:aut dcterms:creatorMARCREL = MARC 21 Relators Dublin Core(codes de fonction)« plus fin mais un truc de bib » « tout le monde comprend mais un peu vague »marcrel:aut rdfs:subPropertyOf dcterms:creator Ce mécanisme logique lève le dilemme. Sur le papier…
  14. 14. Les technologies sémantiques, c’est pas magiqueAVANT D’OUVRIR LES DONNÉES,IL FAUT LES PRODUIRE
  15. 15. Derrière les données, des workflows, des réseaux, des gens• STEP – Réseau des thèses en préparation – Ex-FCT (Nanterre) – 80 établissements• STAR – Réseau des thèses numériques – 80 établissements• Circulation des données – Saisie en ligne – Imports (partiels ou complets)• Interconnexion avec IdRef – Utiliser et enrichir le référentiel d’autorités, avec outils IdRef – Automatiser le liage aux autorités ? Mais il faut encore qu’elles existent
  16. 16. Les technologies sémantiques, c’est pas magiquePOUR SE LIER A D’AUTRES DONNÉES, ILFAUT QU’ELLES SOIENT OUVERTES !
  17. 17. Aujourd’hui Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF owl:sameAs Auteur Auteur ISNI Wikipedia
  18. 18. Demain Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF Auteur Auteur ISNI Wikipedia
  19. 19. + articles, éditions scientifiques, num Après-demain peut-être ? Fonds érisation, etc. Calames Livre Worldcat Livre Sudoc cite Auteur IdRef Données Thèse brutes theses.fr a pour owl:sameAs+brevets, proj dérivéets ANR, etc. Auteur HAL CCSD Auteur VIAF Article HAL CCSD Auteur BnF owl:sameAs + CrossRef, revues, indicateurs d’usage, etc. Auteur Auteur ISNI Wikipedia
  20. 20. Les services publics de données qui manquent aux thèses à l’IST• Structures de recherche• Écoles doctorales• Entreprises (SIREN de l’INSEE)• Brevets (?)• Classification des disciplines• Projets de recherche• …
  21. 21. Leibniz, Lettre à Arnauld (30 avril 1687) 29
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×