French version of the CERIF tutorial / Version francisée du tutoriel CERIF
CERIF is an EC-recommended format for Research Information storage and exchange / CERIF est un format recommandé par la Commission Européenne pour le stockage et l'échange des informations sur la recherche
1. www.eurocris.org
Introduction à CERIF
Valérie BRASSE - 02/06/2015
Basé sur le “CERIF Tutorial”
par Brigitte Jörg (CERIF TG Leader 2004-2012)
et Jan Dvořák (CERIF TG Leader depuis 2013)
2. www.eurocris.org
Informations sur la Recherche
• Common European Research Information Format = format européen
commun pour les informations sur la Recherche
• Quelles sont les informations sur la Recherche qu’il faut connaître,
mesurer, échanger, enregistrer, résumer ou dont il faut suivre
l’évolution tout au long du cycle de vie de cette Recherche?
• Comment les représenter, les stocker ou les échanger?
• Nous allons identifier quelques exemples parmi les processus
cartographiés, et voir comment ils sont représentés via CERIF:
02/06/2015 Introduction à CERIF 2
3. www.eurocris.org Processus
Unités de recherche, Equipes, Structures…
Résultats de la recherche, Publications, Brevets,…
Projet scientifique
Doctorants, Chercheurs, RH…
Source: Carto_Ca2Co_Recherche_EuroCRIS_v1.0.xslx
02/06/2015 Introduction à CERIF 3
4. www.eurocris.org
Quelles sont les caractéristiques d’un projet
(scientifique / de recherche)?
Un nom ou titre
Un acronyme
Un code (identifiant), par ex un numéro de Grant
Une description plus ou moins longue (abstract)
Des mots-clés
Une page Internet ou une fiche (URI)
Une date de début (prévue)
Une date de fin ou durée (prévue)
[Une source de financement]
[Un coordinateur de projet]
[Un domaine scientifique]
[Des publications scientifiques]
[Une infrastructure] […]
02/06/2015 Introduction à CERIF 4
5. www.eurocris.org
Source: http://www.agence-nationale-
recherche.fr/?Projet=ANR-14-CE06-0016
Un nom ou titre
Un acronyme
Un code (identifiant), par ex un numéro de Grant
Une description plus ou moins longue (abstract)
Une page Internet
ou une fiche (URI)
Une date de début (prévue)
Une date de fin ou durée (prévue)
[Une source de financement]
[Un coordinateur de projet]
[Un domaine scientifique]
02/06/2015 Introduction à CERIF 5
6. www.eurocris.org
Source: http://cordis.europa.eu/project/rcn/106635_en.html
Un nom ou titre
Un acronyme
Un code (identifiant), par ex un numéro de Grant
Une description plus ou moins longue (abstract)
Une page Internet ou une fiche (URI)
Une date de début (prévue)
Une date de fin ou durée (prévue)
[Une source de financement]
[Un coordinateur de projet]
[Un domaine scientifique]
[Des publications scientifiques]
02/06/2015 Introduction à CERIF 6
7. www.eurocris.org
Source: http://gtr.rcuk.ac.uk/project/A49CA721-
687A-4D55-8FDF-9B60375B6EA8
Un nom ou titre
Un code (identifiant), par ex un numéro de Grant
Une description plus ou moins longue (abstract)
Des mots-clés
Une page Internet ou une fiche (URI)
Une date de début (prévue)
Une date de fin ou durée (prévue)
[Une source de financement]
[Un coordinateur de projet]
[Un domaine scientifique]
02/06/2015 Introduction à CERIF 7
11. www.eurocris.org
Représentation en Base de Données
Format, Unicité, Non-nul, Clé Etrangère (FK), Clé Primaire composée (ensemble des PFK et PK)
02/06/2015 Introduction à CERIF 11
12. www.eurocris.org
Exemple en BD cfProjId (PK) cfAcro cfURI cfStartDate cfEndDate
project-ist-world IST World http://... 2005-04-01 2007-11-30
cfProjID (FK) cfLangCode cfTrans cfTitle
project-ist-world EN O Knowledge Base for RTD Competencies in IST
project-ist-world DE H Wissensbasis für RTD Kompetenzen im Bereich IST
cfProj
cfProjTitle, PK = cfProjID + cfLangCode + cfTrans
cfProjID (FK) cfLangCode cfTrans cfKeyw
project-ist-world EN O IST, Research Information, NMS, Portal
cfProjID (FK) cfLangCode cfTrans cfAbstr
project-ist-world EN O The objective of the project is to set…
cfProjKeyw, PK = cfProjID + cfLangCode + cfTrans
cfProjAbstr, PK = cfProjID + cfLangCode + cfTrans
Source: http://www.eurocris.org/Uploads/Web%20pages/CERIF-1.3/Specifications/CERIF1.3_FDM.pdf
02/06/2015 Introduction à CERIF 12
15. www.eurocris.org
Représentation et exemple
en Linked Data
Source: http://cerif-linked-
data.googlecode.com/files/Proposal%20of%20Recommendations%
20-%20Report.docx
02/06/2015 Introduction à CERIF 15
17. www.eurocris.org
SYNTHESE INTERMEDIAIRE
• CERIF est:
• Un modèle conceptuel
• Un format de stockage en base de donnée relationnelle
• Un ensemble de formats d’échanges de données (XML, Linked Data)
• CERIF supporte le multilangage, avec la valeur originale d’un attribut
textuel, et pour tout autre langage, une valeur traduite
automatiquement et/ou humainement
• Pour le moment, on a vu l’Entité CERIF “PROJET” (cfProj)
02/06/2015 Introduction à CERIF 17
18. www.eurocris.org
Quelles sont les caractéristiques d’un
individu (chercheur, doctorant…)?
Nom(s), prénom(s)
Un code (identifiant), par ex un numéro de SS
Des mots-clés d’expertise
Une page Internet de profil professionnel (URI)
Une date de naissance
Sexe féminin / masculin
Un/des sujet(s) de recherche de prédilection
[Une organisation/unité dans laquelle il travaille]
[Des adresses emails professionnelles et personnelles]
[Des publications qu’il a (co-)écrites]
[Des expertises et compétences]
[…]
02/06/2015 Introduction à CERIF 18
22. www.eurocris.org
Vue conceptuelle 2
Les attributs multilingues sont représentés par une entité liée chacun.
Le nom d’une personne est représenté par une entité propre,
chaque valeur étant liée à la personne pour un rôle particulier.
02/06/2015 Introduction à CERIF 22
23. www.eurocris.org
Nomenclature CERIF: en anglais, abrégé, précédé de cf
Exemple: Sujets de recherche de personne = Person Research Interests = cfPersResInt
02/06/2015 Introduction à CERIF 23
24. www.eurocris.org
Représentation en Base de Données
Format, Unicité, Non-nul, Clé Etrangère (FK), Clé Primaire composée (ensemble des PFK et PK)
02/06/2015 Introduction à CERIF 24
25. www.eurocris.org
Exemple en BD cfPersId (PK) cfBirthdate cfGender cfURI
person-brigitte-joerg 1954-03-25 f http://...
cfPersNameID (PK) cfFamilyNames cfFirstNames cfOtherNames
bj-name Joerg Brigitte
cfPers
cfPersName
cfPersID (FK) cfLang
Code
cfTrans cfResInt
person-brigitte-joerg EN O Brigitte is interested in Research Information and
Research Information Systems.
cfPersID (FK) cfLang
Code
cfTrans cfKeyw
person-brigitte-joerg EN O Information Systems, Research Information,
Ontologies
cfPersResInt, PK = cfPersID + cfLangCode + cfTrans
cfPersKeyw, PK = cfPersID + cfLangCode + cfTrans
Source: http://www.eurocris.org/Uploads/Web%20pages/CERIF-1.3/Specifications/CERIF1.3_FDM.pdf
cfPersKeyw
cfPersName
cfPersName
02/06/2015 Introduction à CERIF 25
26. www.eurocris.org
Quelles sont les caractéristiques d’une unité
organisationnelle (labo, institut,…)?
Un nom d’unité
Un acronyme
Un code (identifiant)
Des activités de recherche
Des mots-clés
Une page Internet (URI)
Un budget annuel (dans une unité monétaire donnée)
[Un chef de service]
[Des projets de recherche menés]
[Une direction mère]
[…]Un effectif
02/06/2015 Introduction à CERIF 26
27. www.eurocris.org
Vue conceptuelle
L’entité UNITE ORGA. possède des propriétés (attributs) et est
liée à d’autres entités.
Les attributs multilingues sont représentés par une entité liée
chacun.
02/06/2015 Introduction à CERIF 27
28. www.eurocris.org
Nomenclature CERIF: en anglais, abrégé, précédé de cf
Exemple: Activités de recherche d’une unité organisationnelle = Organisational Unit Research Activities = cfOrgUnitResAct
02/06/2015 Introduction à CERIF 28
29. www.eurocris.org
Représentation en Base de Données
Format, Unicité, Non-nul, Clé Etrangère (FK), Clé Primaire composée (ensemble des PFK et PK)
02/06/2015 Introduction à CERIF 29
30. www.eurocris.org
cfOrgUnitID (FK) cfLangCode cfTrans cfKeyw
orgunit-eurocris EN O Association, European
cfOrgUnitKeyw, PK = cfOrgUnitID + cfLangCode + cfTrans
Exemple en BD cfOrgUnitId (PK) cfCurr
Code
cfAcro cfURI cfHead
count
cfTurn
orgunit-eurocris EUR euroCRIS http://...
cfOrgUnit
cfOrgUnitID (FK) cfLang
Code
cfTrans cfName
orgunit-eurocris EN O European Current Research Information Systems
cfOrgUnitID (FK) cfLang
Code
cfTrans cfResAct
orgunit-eurocris EN O euroCRIS is a professional…
cfOrgUnitName, PK = cfOrgUnitID + cfLangCode + cfTrans
cfOrgUnitResAct, PK = cfOrgUnitID + cfLangCode + cfTrans
Source: http://www.eurocris.org/Uploads/Web%20pages/CERIF-1.3/Specifications/CERIF1.3_FDM.pdf
02/06/2015 Introduction à CERIF 30
31. www.eurocris.org
SYNTHESE INTERMEDIAIRE
• Les entités de base de CERIF sont:
Projet, Personne et Unité Organisationnelle
• Ces entités ont des attributs, certains étant
“sortis” car multiples (Nom de personne)
ou multilingues (Noms, Mots-clés,
Description…)
Person OrganisationUnit
Project
PersonPerson OrganisationUnitOrganisationUnit
ProjectProject
02/06/2015 Introduction à CERIF 31
32. www.eurocris.org
Quelles sont les caractéristiques des
résultats (publication, brevet, “produit”)?
02/06/2015 Introduction à CERIF 32
35. www.eurocris.org
SYNTHESE INTERMEDIAIRE
Pour le moment, nous
avons vu
cfExpertise
AndSkills
cfEquipmentcfFunding
cfFacility
cfService
cfCitation
cfEvent
cfLanguage cfCurrency
cfCountry
cfCurriculum
Vitae
cfPrize
cfQualification
cfGeographic
BoundingBox
cfPostalAddress
cfElectronicAddress
cfPerson
cfProject
cfOrganisation
Unit
cfResultPatent
cfResult
Publication
cfResultProduct
cfIndicator cfMeasurement
cfFederated
Identifier
cfPerson
cfProject
cfOrganisation
Unit
cfResultPatent
cfResult
Publication
cfResultProduct
cfLanguage
ainsi que la notion
de multilingue
les 6 entités “coeur”
du modèle CERIF 1.6,
02/06/2015 Introduction à CERIF 35
36. www.eurocris.org
Quelles sont les relations entre une personne, un
projet, une unité organisationnelle?
Person OrganisationUnit
Project
PersonPerson OrganisationUnitOrganisationUnit
ProjectProject
02/06/2015 Introduction à CERIF 36
37. www.eurocris.org
Base object 1
(FK)
Base object 2
(FK)
cfStartDate
cfEndDate
role : cfClassification (FK)
Time range
of validity
cfFraction
Fraction
(optional)
Représentation d’une relation dans CERIF
Dans CERIF, une relation entre deux entités est aussi une entité: une “entité de lien” (Link Entity).
Cette entité de lien contient:
• Une référence à chacune des deux entités “mères”
• Un “rôle” (partie sémantique du modèle, à suivre)
• Une période de validité: date de début et date de fin de la relation avec ce rôle
• (en option) une fraction (voir exemple)
• (selon les entités de lien) des attributs propres
02/06/2015 Introduction à CERIF 37
38. www.eurocris.org
cfOrgUnit
“Labo Phys Fond”
cfPers
“Jean Dupont”
-∞ .. +∞
“Chef de service”
: cfClassification
Le chef de service Jean Dupont du Laboratoire Physique fondamentale est remplacé au 01/01/2015 par Julie Marchand.
Initialement:
cfOrgUnit
“Labo Phys Fond”
cfPers
“Jean Dupont”
-∞ .. 2014-12-31
Ensuite:
cfPers
“Julie Marchand”
2015-01-01 .. +∞
“Chef de service”
: cfClassification
“Chef de service”
: cfClassification
Période de validité Rôle
Exemple pour la période de validité
02/06/2015 Introduction à CERIF 38
39. www.eurocris.org
Exemple pour la fraction
cfProj
“Particule de Dieu”
cfFund
“EC - H3000”
cfFund
“CERN - ProgrammeX”
“Financement”
: cfClassification
“Financement”
: cfClassification
Période de validité RôleFraction
2020-01-01
2999-12-31
0,25
2020-01-01
2999-12-31
0,75
Le projet “Particule de Dieu” est financé depuis le 01/01/2020 jusqu’au 31/12/2999 à 25% par le programme
“EC – H3000” et à 75% par le programme “CERN – ProgrammeX”.
Note 1: les dates de début et de fin du projet peuvent être différentes (début au 01/01/2015 par exemple).
Note 2: dans cette entité de lien “cfProj_Fund”, les attributs propres sont: cfAmount (montant du
financement) et cfCurrCode (unité monétaire).
02/06/2015 Introduction à CERIF 39
43. www.eurocris.org
L’aspect sémantique
• Si on veut classifier une entité, on la relie à un “terme”.
• Si on veut définir un rôle dans une relation entre 2 entités, on le
précise via un “terme”.
• Les termes “autorisés” sont rassemblés dans des “schémas” ou
vocabulaire.
• Des termes de plusieurs vocabulaires peuvent être synonymes; un
vocabulaire peut être un sous-ensemble d’un autre,…
02/06/2015 Introduction à CERIF 43
45. www.eurocris.org
Terme: cfClass• Voca d’appartenance
• ID
• Dates début/fin
• URI
• Terme
• Description
• Définition
• Exemple
avec pour les textes:
• Langue
• Traduction
• Source02/06/2015 Introduction à CERIF 45
48. www.eurocris.org
L‘aspect sémantique de CERIF...
...permet de capturer tout schéma ou structure:
• Listes plates
• Thesauri
• Systèmes de classification (ex. SKOS, ...)
• Taxonomies
• Ontologies
... est ouvert et extensible dans tous les sens
• Nouveaux Schémas
• Nouveaux Concepts / Termes
• Nouvelles Relations
... permet de gérer
• la sémantique des rôles et types
• les domaines (Subject Headings)
• l‘historisation (datation)
... permet de faire des correspondances entre schémas
SYNTHESE INTERMEDIAIRE
02/06/2015 Introduction à CERIF 48
50. www.eurocris.org
Identifiant fédéré: cfFedId
Beaucoup d’identifiants existent:
• ResultPublication
• ISBN
• ISSN
• DOI
• WoS Accession Number
• Scopus EID
• PubMed Central ID
• Person
• Social Security Number
• Staff Id in HR system
• Author identifier
• ORCID
• IdRef
• Project/Grant
• Funder’s reference number
• Organisation’s reference number
• Organisation
• VAT Identification Number
• Internal Code
• FundId
• Classification
• External Code
Une entité dédiée, cfFedId, se charge de stocker l’ensemble des
identifiants d’un enregistrement, en gardant:
• de quelle entité il s’agit (cfClassId, cfClassSchemeId)
• la clé primaire qui identifie l’enregistrement concerné (cfInstId)
• l’identifiant concerné
• en option, le service qui a émis cet identifiant
02/06/2015 Introduction à CERIF 50
51. www.eurocris.org
Mesures et indicateurs
02/06/2015 Introduction à CERIF 51
• economic and commercial
• economic
• impact on business
• improving performance of existing businesses
• increased turnover by 1.2M€ in 2012
• time savings of 14.56%
• reduced costs by 42%
• new products/processes
• creating numbers of new products/services
• commercialising / other success measures
Extract from the MICE List of Indicators
Indicateurs
Mesures
52. www.eurocris.org Ex d’utilisation de CERIF au nv conceptuel: MERIL
Modélisation initiale
Mappé sur CERIF 1.2
02/06/2015 Introduction à CERIF 52
54. www.eurocris.org
Organisation
(cfOrgUnit)
Contact Person (cfPerson)
Research Services
(cfService)
Equipments
(cfEquipment)
Status, Type
(cfClass),
Description,
Keywords,…
(cfFacility)
Scientific domain,
RI Category
(cfClassification)
Location
(cfPostAddress,…)
The MERIL project was supported by the European Commission under Framework Programme 7 - Contract # 262159.
http://portal.meril.eu/02/06/2015 Introduction à CERIF 54
55. www.eurocris.org
SYNTHESE GENERALE SUR CERIF
• Un modèle conceptuel
• Un format de stockage
• Des formats d’échange
• Couvre les principaux concepts de la Recherche
• Ainsi que des Indicateurs et Mesures
• Multilingue
• Couche sémantique extensible
• Identifiant fédéré
• Traçabilité temporelle
02/06/2015 Introduction à CERIF 55