Métadonnées de thèsenicolas@abes.fr1stage enssib    |   Valorisation des thèses   |   2 décembre 2010
Plan 	Introduction – de quoi parle-t-on ?
 	Des métadonnées dans tous les états
 	TEF
 	Identifiants
IdRef
 	RDF
 	Les métadonnées dans les thèses2
IntroductionDe quoi parle-t-on ?3
IntroductionDe quoi parle-t-on ?Métadonnées = ?Thèse = ?4
Métadonnées = ?Information structurée et réutilisable sur (…)ExemplesUne page de titre papier est structurée, mais n’est pas réutilisableUne notice MARC  = un ensemble de métadonnées5
Cette thèse a pour directeur Untel6
Cette thèse a pour directeur UntelQui appartient à tel laboratoire7
Cette thèse a pour directeur UntelQui appartient à tel laboratoireQui a un partenariat avec telle entreprise8
Cette thèse a pour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’9
Cette thèse a pour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
Qui est dirigé par tel chercheur’10
Cette thèse a pour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue11
Cette thèse a pour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
Qui est dirigé par tel chercheur’Qui appartient au comité de telle revueQui a publié tel chercheur’’12
Cette thèse a pour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
Qui est dirigé par tel chercheur’Qui appartient au comité de telle revueQui a publié tel chercheur’’Etc.Où s’arrêter ?13
MétadonnéesOù s’arrêter ?La notice n’est pas la frontièreLa base de données n’est pas la frontièreLe Web est la frontièreWeb de données (RDF)			cf. + loinModèle du grapheDes réseaux qui peuvent s’étendre et s’interconnecter à l’infiniDes trajectoires directes ou non entre deux pointsA travers les frontières ordinaires (langues, administratives, normes…)14
15
Les métadonnées de thèse,c’est…toute information structurée … … qui concerne de près ou de loin la thèsepeu importe la structurepeu importe le formatpeut importe le type d’entité dont on parle :DocumentPersonneOrganismeConcept16
Thèse = ?En apparence, c’est un objet précisEn fait, différentes entités derrière le mot « Thèse »Et chacune a ses propres métadonnées17
http://thesedemerde.fr18
Thèse comme Texte (« rédaction »)Thèse comme Edition (« quatre fois plus de pages »)19
Thèse comme Œuvre Thèse comme Texte (« version »)Thèse comme Edition/Format (« manuscrit »)20
Thèse comme Période, Processus administratif (« moitié »)21
Thèse comme Diplôme (« inscription »)22
Les métadonnées de thèse dans tous les étatsCirculation et recyclage23
Différentes phasesDifférents formatsCirculation & recyclagePas de multiple saisie24
25
Il n’existe pas un format canonique pour les métadonnées de thèseIl n’existe pas un état de complétude (géométrie variable, selon contexte)Il n’existe pas qu’un circuit linéaire (workflow à la carte)Mais il existe des conditions favorables à la circulation et au recyclage des métadonnées 26
Conditions favorablesInformation la plus découpée possible nom et prénom séparésInformation la plus homogène possiblePeu importe la structure des dates, mais ne pas varierInformation la plus précise possiblePas de majuscules non ACCENTUEES !Utiliser des listes fermées (diplômes, disciplines..)Garder le maximum de précision et de richesse au fil des conversionsAvoir des outils qui permettent de maîtriser les flux entrants et sortantsDisposer de compétences XSLT27
TEFUne forme parmi d’autres pour les métadonnées de thèse28
TEFFormat XMLPour les thèses numériques nativesRecommandation AFNOR (2006) ?<chut>Obligation ABES</chut>TEF, fait sur mesure pour STARPour répondre aux missions de STARFormat d’import de STAR29
Missions de STAR > Aspects de TEFSignalement SudocTEF : méta biblio, autorités…Archivage pérenneTEF : gestion d’éditions différentes, avec métadonnées de fichiers associéesRespect du droit de la PI et des restrictions de diffusionTEF : gestion fine des droitsRespect de la validation JuryTEF : différentes versions possibles30
31
TEF et les FRBRFRBR : modélisation de l’information bibliographique par l’iFLA (1998)Clarification conceptuelleA chaque niveau ses métadonnéesŒuvreExpression			(= Version selon TEF)Manifestation		(= Edition selon TEF)Exemplaire			(Pas dans TEF)32
Le cas simple33
Un cas plus complexe34
Un autre cas plus complexe35
Générer du TEF pour importer dans STARPartir de n’importe quelles données structuréesConvertir en TEF, complet ou nonSTAR : pas tout ou rien36
Identifiants37
http://www.theses.fr/2009TOUR3802URL pérenne de la description HTML de la thèse comme œuvrePoint de départ vers documents, métadonnées, ressources liées…38
http://www.theses.fr/2009TOUR3802/documentURL pérenne de document (s)Renvoie vers une des éditions sur un des serveurs de diffusionSelon un ordre définiAction : Getit !39
http://www.theses.fr/2009TOUR3802/idIdentifiant de la thèse comme œuvreAujourd’hui pur identifiant pour le RDFDemain, identifiant et URLMême si l’œuvre n’est pas un document accessible surle Web. Seules ses éditions (manifestations) y sont.40
Avec le portail des thèses (2011) :http://www.theses.fr/2009TOUR3802.rdfhttp://www.theses.fr/2009TOUR3802.xmlhttp://www.theses.fr/2009TOUR3802/dc.xmlhttp://www.theses.fr/2009TOUR3802/marc.xml…41
Identifier les entités liées aux thèses IdRefwww.idref.fr42
Besoin de référentielsIdentifier les personnes, organismes, concepts…Autorités Sudoc >> IdRefD’autres entités > d’autres référentielsLaboratoires ?Entreprises ?Contrat CIFRE ?Projets ANR ?43
IdRefNouvelle application ABES (octobre 2010)Objectifs :Interroger, modifier, créer les autorités SudocÀ partir du site Web www.idref.frA partir d’une autre application « branchée » sur IdRefSTAR (oct. 2010), Calames (aujourd’hui !), ORI-OAI (2011) et d’autres applications de l’ens. sup. & rech. fr.44
45
Politique des URLhttp://www.idref.fr/026690276URL des métadonnées de la personne (HTML ou RDF)http://www.idref.fr/026690276/idURL de la personneRedirige (303) vers les métadonnéeshttp://www.idref.fr/026690276.rdfURL des métadonnées RDF de la personnehttp://www.idref.fr/026690276.htmlURL des métadonnées HTML de la personnehttp://www.idref.fr/026690276.xmlURL des métadonnées UNIMARC/XML de la personne46
PrièreFaîtes le maximum de liens vers des référentiels et leurs identifiants !Membres du juryEntreprisesEntreprisesProjets ANRLe Web vous le rendra…	47
Vers un Web de métadonnéesRDF48
RDFStandard W3CExiste depuis 1998, mais décolle aujourd’huiResource Description FrameworkCadre général pour décrire n’importe quoiToutpeut être « resource » à décrireRDF, modèle universel pour intégrer toute information au Web de données49
http://www.theses.fr/2009TOUR3802/iddcterms:creatorhttp://www.idref.fr/142976903/idCette thèse …… a pour auteur …… untel.50
http://www.theses.fr/2009TOUR3802/idhttp://purl.org/dc/terms/creatorhttp://www.idref.fr/142976903/idLa relation creator est également identifiée par une URL51

Métadonnées de thèse

  • 1.
    Métadonnées de thèsenicolas@abes.fr1stageenssib | Valorisation des thèses | 2 décembre 2010
  • 2.
    Plan Introduction –de quoi parle-t-on ?
  • 3.
    Des métadonnéesdans tous les états
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
    Les métadonnéesdans les thèses2
  • 9.
  • 10.
    IntroductionDe quoi parle-t-on?Métadonnées = ?Thèse = ?4
  • 11.
    Métadonnées = ?Informationstructurée et réutilisable sur (…)ExemplesUne page de titre papier est structurée, mais n’est pas réutilisableUne notice MARC = un ensemble de métadonnées5
  • 12.
    Cette thèse apour directeur Untel6
  • 13.
    Cette thèse apour directeur UntelQui appartient à tel laboratoire7
  • 14.
    Cette thèse apour directeur UntelQui appartient à tel laboratoireQui a un partenariat avec telle entreprise8
  • 15.
    Cette thèse apour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’9
  • 16.
    Cette thèse apour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
  • 17.
    Qui est dirigépar tel chercheur’10
  • 18.
    Cette thèse apour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
  • 19.
    Qui est dirigépar tel chercheur’Qui appartient au comité de telle revue11
  • 20.
    Cette thèse apour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
  • 21.
    Qui est dirigépar tel chercheur’Qui appartient au comité de telle revueQui a publié tel chercheur’’12
  • 22.
    Cette thèse apour directeur UntelQui appartient à tel laboratoire Qui a un partenariat avec telle entrepriseQui a un partenariat avec tel laboratoire’
  • 23.
    Qui est dirigépar tel chercheur’Qui appartient au comité de telle revueQui a publié tel chercheur’’Etc.Où s’arrêter ?13
  • 24.
    MétadonnéesOù s’arrêter ?Lanotice n’est pas la frontièreLa base de données n’est pas la frontièreLe Web est la frontièreWeb de données (RDF) cf. + loinModèle du grapheDes réseaux qui peuvent s’étendre et s’interconnecter à l’infiniDes trajectoires directes ou non entre deux pointsA travers les frontières ordinaires (langues, administratives, normes…)14
  • 25.
  • 26.
    Les métadonnées dethèse,c’est…toute information structurée … … qui concerne de près ou de loin la thèsepeu importe la structurepeu importe le formatpeut importe le type d’entité dont on parle :DocumentPersonneOrganismeConcept16
  • 27.
    Thèse = ?Enapparence, c’est un objet précisEn fait, différentes entités derrière le mot « Thèse »Et chacune a ses propres métadonnées17
  • 28.
  • 29.
    Thèse comme Texte(« rédaction »)Thèse comme Edition (« quatre fois plus de pages »)19
  • 30.
    Thèse comme ŒuvreThèse comme Texte (« version »)Thèse comme Edition/Format (« manuscrit »)20
  • 31.
    Thèse comme Période,Processus administratif (« moitié »)21
  • 32.
    Thèse comme Diplôme(« inscription »)22
  • 33.
    Les métadonnées dethèse dans tous les étatsCirculation et recyclage23
  • 34.
    Différentes phasesDifférents formatsCirculation& recyclagePas de multiple saisie24
  • 35.
  • 36.
    Il n’existe pasun format canonique pour les métadonnées de thèseIl n’existe pas un état de complétude (géométrie variable, selon contexte)Il n’existe pas qu’un circuit linéaire (workflow à la carte)Mais il existe des conditions favorables à la circulation et au recyclage des métadonnées 26
  • 37.
    Conditions favorablesInformation laplus découpée possible nom et prénom séparésInformation la plus homogène possiblePeu importe la structure des dates, mais ne pas varierInformation la plus précise possiblePas de majuscules non ACCENTUEES !Utiliser des listes fermées (diplômes, disciplines..)Garder le maximum de précision et de richesse au fil des conversionsAvoir des outils qui permettent de maîtriser les flux entrants et sortantsDisposer de compétences XSLT27
  • 38.
    TEFUne forme parmid’autres pour les métadonnées de thèse28
  • 39.
    TEFFormat XMLPour lesthèses numériques nativesRecommandation AFNOR (2006) ?<chut>Obligation ABES</chut>TEF, fait sur mesure pour STARPour répondre aux missions de STARFormat d’import de STAR29
  • 40.
    Missions de STAR> Aspects de TEFSignalement SudocTEF : méta biblio, autorités…Archivage pérenneTEF : gestion d’éditions différentes, avec métadonnées de fichiers associéesRespect du droit de la PI et des restrictions de diffusionTEF : gestion fine des droitsRespect de la validation JuryTEF : différentes versions possibles30
  • 41.
  • 42.
    TEF et lesFRBRFRBR : modélisation de l’information bibliographique par l’iFLA (1998)Clarification conceptuelleA chaque niveau ses métadonnéesŒuvreExpression (= Version selon TEF)Manifestation (= Edition selon TEF)Exemplaire (Pas dans TEF)32
  • 43.
  • 44.
    Un cas pluscomplexe34
  • 45.
    Un autre casplus complexe35
  • 46.
    Générer du TEFpour importer dans STARPartir de n’importe quelles données structuréesConvertir en TEF, complet ou nonSTAR : pas tout ou rien36
  • 47.
  • 48.
    http://www.theses.fr/2009TOUR3802URL pérenne dela description HTML de la thèse comme œuvrePoint de départ vers documents, métadonnées, ressources liées…38
  • 49.
    http://www.theses.fr/2009TOUR3802/documentURL pérenne dedocument (s)Renvoie vers une des éditions sur un des serveurs de diffusionSelon un ordre définiAction : Getit !39
  • 50.
    http://www.theses.fr/2009TOUR3802/idIdentifiant de lathèse comme œuvreAujourd’hui pur identifiant pour le RDFDemain, identifiant et URLMême si l’œuvre n’est pas un document accessible surle Web. Seules ses éditions (manifestations) y sont.40
  • 51.
    Avec le portaildes thèses (2011) :http://www.theses.fr/2009TOUR3802.rdfhttp://www.theses.fr/2009TOUR3802.xmlhttp://www.theses.fr/2009TOUR3802/dc.xmlhttp://www.theses.fr/2009TOUR3802/marc.xml…41
  • 52.
    Identifier les entitésliées aux thèses IdRefwww.idref.fr42
  • 53.
    Besoin de référentielsIdentifierles personnes, organismes, concepts…Autorités Sudoc >> IdRefD’autres entités > d’autres référentielsLaboratoires ?Entreprises ?Contrat CIFRE ?Projets ANR ?43
  • 54.
    IdRefNouvelle application ABES(octobre 2010)Objectifs :Interroger, modifier, créer les autorités SudocÀ partir du site Web www.idref.frA partir d’une autre application « branchée » sur IdRefSTAR (oct. 2010), Calames (aujourd’hui !), ORI-OAI (2011) et d’autres applications de l’ens. sup. & rech. fr.44
  • 55.
  • 56.
    Politique des URLhttp://www.idref.fr/026690276URLdes métadonnées de la personne (HTML ou RDF)http://www.idref.fr/026690276/idURL de la personneRedirige (303) vers les métadonnéeshttp://www.idref.fr/026690276.rdfURL des métadonnées RDF de la personnehttp://www.idref.fr/026690276.htmlURL des métadonnées HTML de la personnehttp://www.idref.fr/026690276.xmlURL des métadonnées UNIMARC/XML de la personne46
  • 57.
    PrièreFaîtes le maximumde liens vers des référentiels et leurs identifiants !Membres du juryEntreprisesEntreprisesProjets ANRLe Web vous le rendra… 47
  • 58.
    Vers un Webde métadonnéesRDF48
  • 59.
    RDFStandard W3CExiste depuis1998, mais décolle aujourd’huiResource Description FrameworkCadre général pour décrire n’importe quoiToutpeut être « resource » à décrireRDF, modèle universel pour intégrer toute information au Web de données49
  • 60.
  • 61.