Métadonnées de thèse

Métadonnées de thèsenicolas@abes.fr1stage enssib | Valorisation des thèses | 2 décembre 2010

Plan Introduction – de quoi parle-t-on ?

Des métadonnées dans tous les états

Les métadonnées dans les thèses2

IntroductionDe quoi parle-t-on ?3

IntroductionDe quoi parle-t-on ?Métadonnées = ?Thèse = ?4

Métadonnées = ?Information structurée et réutilisable sur (…)ExemplesUne page de titre papier est structurée, mais n’est pas réutilisableUne notice MARC = un ensemble de métadonnées5

Cette thèse a pour directeur Untel6

Cette thèse a pour directeur UntelQui appartient à tel laboratoire7

Cette thèse a pour directeur UntelQui appartient à tel laboratoireQui a un partenariat avec telle entreprise8

Cette thèse a pour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’9

Cette thèse a pour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’

Qui est dirigé par tel chercheur’10

Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue11

Qui est dirigé par tel chercheur’Qui appartient au comité de telle revueQui a publié tel chercheur’’12

Qui est dirigé par tel chercheur’Qui appartient au comité de telle revueQui a publié tel chercheur’’Etc.Où s’arrêter ?13

MétadonnéesOù s’arrêter ?La notice n’est pas la frontièreLa base de données n’est pas la frontièreLe Web est la frontièreWeb de données (RDF) cf. + loinModèle du grapheDes réseaux qui peuvent s’étendre et s’interconnecter à l’infiniDes trajectoires directes ou non entre deux pointsA travers les frontières ordinaires (langues, administratives, normes…)14

Les métadonnées de thèse,c’est…toute information structurée … … qui concerne de près ou de loin la thèsepeu importe la structurepeu importe le formatpeut importe le type d’entité dont on parle :DocumentPersonneOrganismeConcept16

Thèse = ?En apparence, c’est un objet précisEn fait, différentes entités derrière le mot « Thèse »Et chacune a ses propres métadonnées17

Thèse comme Texte (« rédaction »)Thèse comme Edition (« quatre fois plus de pages »)19

Thèse comme Œuvre Thèse comme Texte (« version »)Thèse comme Edition/Format (« manuscrit »)20

Thèse comme Période, Processus administratif (« moitié »)21

Thèse comme Diplôme (« inscription »)22

Les métadonnées de thèse dans tous les étatsCirculation et recyclage23

Différentes phasesDifférents formatsCirculation & recyclagePas de multiple saisie24

Il n’existe pas un format canonique pour les métadonnées de thèseIl n’existe pas un état de complétude (géométrie variable, selon contexte)Il n’existe pas qu’un circuit linéaire (workflow à la carte)Mais il existe des conditions favorables à la circulation et au recyclage des métadonnées 26

Conditions favorablesInformation la plus découpée possible nom et prénom séparésInformation la plus homogène possiblePeu importe la structure des dates, mais ne pas varierInformation la plus précise possiblePas de majuscules non ACCENTUEES !Utiliser des listes fermées (diplômes, disciplines..)Garder le maximum de précision et de richesse au fil des conversionsAvoir des outils qui permettent de maîtriser les flux entrants et sortantsDisposer de compétences XSLT27

TEFUne forme parmi d’autres pour les métadonnées de thèse28

TEFFormat XMLPour les thèses numériques nativesRecommandation AFNOR (2006) ?<chut>Obligation ABES</chut>TEF, fait sur mesure pour STARPour répondre aux missions de STARFormat d’import de STAR29

Missions de STAR > Aspects de TEFSignalement SudocTEF : méta biblio, autorités…Archivage pérenneTEF : gestion d’éditions différentes, avec métadonnées de fichiers associéesRespect du droit de la PI et des restrictions de diffusionTEF : gestion fine des droitsRespect de la validation JuryTEF : différentes versions possibles30

TEF et les FRBRFRBR : modélisation de l’information bibliographique par l’iFLA (1998)Clarification conceptuelleA chaque niveau ses métadonnéesŒuvreExpression (= Version selon TEF)Manifestation (= Edition selon TEF)Exemplaire (Pas dans TEF)32

Générer du TEF pour importer dans STARPartir de n’importe quelles données structuréesConvertir en TEF, complet ou nonSTAR : pas tout ou rien36

http://www.theses.fr/2009TOUR3802URL pérenne de la description HTML de la thèse comme œuvrePoint de départ vers documents, métadonnées, ressources liées…38

http://www.theses.fr/2009TOUR3802/documentURL pérenne de document (s)Renvoie vers une des éditions sur un des serveurs de diffusionSelon un ordre définiAction : Getit !39

http://www.theses.fr/2009TOUR3802/idIdentifiant de la thèse comme œuvreAujourd’hui pur identifiant pour le RDFDemain, identifiant et URLMême si l’œuvre n’est pas un document accessible surle Web. Seules ses éditions (manifestations) y sont.40

Avec le portail des thèses (2011) :http://www.theses.fr/2009TOUR3802.rdfhttp://www.theses.fr/2009TOUR3802.xmlhttp://www.theses.fr/2009TOUR3802/dc.xmlhttp://www.theses.fr/2009TOUR3802/marc.xml…41

Identifier les entités liées aux thèses IdRefwww.idref.fr42

Besoin de référentielsIdentifier les personnes, organismes, concepts…Autorités Sudoc >> IdRefD’autres entités > d’autres référentielsLaboratoires ?Entreprises ?Contrat CIFRE ?Projets ANR ?43

IdRefNouvelle application ABES (octobre 2010)Objectifs :Interroger, modifier, créer les autorités SudocÀ partir du site Web www.idref.frA partir d’une autre application « branchée » sur IdRefSTAR (oct. 2010), Calames (aujourd’hui !), ORI-OAI (2011) et d’autres applications de l’ens. sup. & rech. fr.44

Politique des URLhttp://www.idref.fr/026690276URL des métadonnées de la personne (HTML ou RDF)http://www.idref.fr/026690276/idURL de la personneRedirige (303) vers les métadonnéeshttp://www.idref.fr/026690276.rdfURL des métadonnées RDF de la personnehttp://www.idref.fr/026690276.htmlURL des métadonnées HTML de la personnehttp://www.idref.fr/026690276.xmlURL des métadonnées UNIMARC/XML de la personne46

PrièreFaîtes le maximum de liens vers des référentiels et leurs identifiants !Membres du juryEntreprisesEntreprisesProjets ANRLe Web vous le rendra… 47

Vers un Web de métadonnéesRDF48

RDFStandard W3CExiste depuis 1998, mais décolle aujourd’huiResource Description FrameworkCadre général pour décrire n’importe quoiToutpeut être « resource » à décrireRDF, modèle universel pour intégrer toute information au Web de données49

http://www.theses.fr/2009TOUR3802/iddcterms:creatorhttp://www.idref.fr/142976903/idCette thèse …… a pour auteur …… untel.50

http://www.theses.fr/2009TOUR3802/idhttp://purl.org/dc/terms/creatorhttp://www.idref.fr/142976903/idLa relation creator est également identifiée par une URL51

Métadonnées de thèse

Contenu connexe

Tendances

En vedette

Similaire à Métadonnées de thèse

Plus de Y. Nicolas

Dernier

Métadonnées de thèse