SlideShare une entreprise Scribd logo
CAP SUR LES DONNEES
Annabelle Filatre (AgroParisTech)
Hanka Hensens (IRD)
Isabelle Nault (INRAE)
Collège DoctoralUniversité de Montpellier -CISTAgropolis
Introductionaux
Donnéesdelarecherche
Collège Doctoral Université de Montpellier - CIST Agropolis
Collège Doctoral Université de Montpellier - CIST Agropolis
Définitions (1)
• Pour vous ?
• Par l’exemple…
• Vous avez 5 mn !
Crédits : 1-Junah Rosales, Pixabay 2- JocelynJalette, Wikimedia
Commons 3- FreeSVG
1
2
3
Collège Doctoral Université de Montpellier - CIST Agropolis
Typologie / Méthode d’obtention
Données
d'observations,
d'enquête
Données de
simulation
Données
expérimentales
Données
rassemblées /
dérivées
(traitées,
corrigées,…)
Résultats d’expériences,
Echantillons,
Photos de microscope,
Spectroscopie,…
…
Modèles
Algorithmes
Scripts
…
Mesures, Relevés de terrain,
Réponses à questionnaires et enquêtes,
Transcriptions d’interviews
Photographies, films, fichiers audio,
…
Fichiers de données
Documents texte,
Feuilles de calculs,
Bases de données
Statistiques, …
[IST Agropolis, 2016]
1.1. Définitions et typologie
Création /
Collecte
Traitement
et analyse
Conservation
Accès et
réutilisation
• Données traitées
• Données analysées
• Données enrichies
• Données déposées
• Données publiées
• Données archivées
• Données réutilisées
• Données partagées
• Données brutes
• Données sources
• Données recueillies
Collège Doctoral Université de Montpellier - CIST Agropolis
Typologie / Cycle de vie des données
Collège Doctoral Université de Montpellier - CIST Agropolis
Ne sont PAS des données de la recherche
Selon l'OCDE :
Les documents non achevés :
• les carnets de laboratoire
• les analyses préliminaires, les projets de documents scientifiques et
les programmes de travaux futurs
• les examens par les pairs
• les communications personnelles avec des collègues, …
Les objets matériels :
• les souches bactériennes
• les animaux de laboratoire,…
Les productions scientifiques
• les publications scientifiques, communications à congrès,
• les supports de formation, …
Les données administratives non intégrées dans un corpus de
recherche... Image de Pixabay
Collège Doctoral Université de Montpellier - CIST Agropolis
Définitions (2)
• Pour l’OCDE (2006) :
« Enregistrements factuels (chiffres, textes, images et sons), qui sont
utilisés comme sources principales pour la recherche scientifique et
sont généralement reconnus par la communauté scientifique comme
nécessaires pour valider les résultats de la recherche. »
(repris par le Plan National pour Science Ouverte - 2018)
• Pour la Royal Society of London :
« Informations qualitatives ou quantitatives […] qui sont factuelles.
Ces données peuvent être brutes ou primaires (directement issue
d’une mesure), ou dérivée de données primaires, mais ne sont pas
encore le produit d’analyse ou d’interprétation autres que le calculs. »
Collège Doctoral Université de Montpellier - CIST Agropolis
Définitions (3)
• Pour la Commission Européenne (H2020) :
"1. Les données sous-jacente (les données nécessaires pour valider les
résultats présentés dans les publications scientifiques), incluant les
métadonnées associées (c’est-à-dire les métadonnées décrivant les
données de recherche déposées)
2.Toute autre donnée (par exemple les données conservées qui ne sont
pas directement attribuables à une publication, ou les données
brutes), y compris les métadonnées associées.
(…) L'accent est mis sur les données de recherche disponibles sous
forme numérique. »
Collège Doctoral Université de Montpellier - CIST Agropolis
Définition du Jeu de Données (DataSet)
• « Agrégation, sous une forme lisible, de
données brutes ou dérivées présentant une
certaine unité, rassemblées pour former un
ensemble cohérent. » (Gaillard, 2014).
• Unité de dépôt :
sa granularité ne doit être ni trop petite, ni
trop grande, pour faciliter la citation
• Complété par des métadonnées nécessaires à
leur réutilisation et à leur validation :
méthodes d’obtention, logiciels nécessaires,
auteurs, couverture temporelle et spatiale,
etc…
Collège Doctoral Université de Montpellier - CIST Agropolis
Les enjeux de la (bonne) gestion des données scientifiques
Enjeux scientifiques
• Diminution de la perte de données
• Continuité de la recherche
• Recherche multidisciplinaire /
systèmes complexes
• Big Data et Data Science
Enjeux économiques
• Bonne gestion budgétaire
• Innovation, valorisation
• Conditions de financement des
bailleurs
• Evolution de la publication
scientifique
Enjeux sociétaux
• Transparence et reproductibilité
• Participation citoyenne
• Accroissement de l'impact science
/ société
• Interopérabilité des données
Collège Doctoral Université de Montpellier - CIST Agropolis
Enjeux : Perte des données scientifiques VINES Timothy H., et al. The Availability of
Research Data Declines Rapidly with Article
Age, Current Biology, 2014.
20 ans après publication,
80 % des données sont perdues
Causes
 Destruction des supports, virus
 Obsolescence matérielle ou logicielle
 Lieu de stockage indéfini
 Erreurs humaines, départs de personnel
Conséquences
 Perte de temps, d’argent, de fonds publics
 Pas de vérification des résultats
 Pas de comparaison dans le temps ou l’espace
 Pas de réutilisations par d’autres publics
ou pour d’autres fins
Collège Doctoral Université de Montpellier - CIST Agropolis
Enjeux : Crise de la reproductibilité scientifique
En 2016, 1500 chercheurs répondent à Nature :
“More than 70% of researchers
have tried and failed to reproduce
another scientist's experiments,
and more than half have failed to
reproduce their own experiments”
Nature may 2016 : https://www.nature.com/news/1-500-scientists-
lift-the-lid-on-reproducibility-1.19970
Dégât collatéral du « Publish or Perish »…
Collège Doctoral Université de Montpellier - CIST Agropolis
Enjeux :Vers une Science Ouverte
 Vise la transparence et le
partage de l’ensemble du
processus de recherche,
 de la formulation de l’hypothèse
à la diffusion des résultats, en
passant par les méthodes,
données, protocoles, ainsi que
l’évaluation, la publication, etc.
 Pour susciter analyses, critiques
et discussions (publiques) dans
le but de le valider et
l’améliorer Notion de Science ouverte et thèmes/enjeux
connexes, Wikipedia
Collège Doctoral Université de Montpellier - CIST Agropolis
Contexte international : Libre Accès et Science Ouverte
Loi Cada (1978)
Directive PSI
(2003)
Directive
Inspire
(2007)
Charte du
G8 (2013)
Loi Valter
(2015)
Initiative de
Budapest (2002)
Initiative de
Berlin(2003)
Directive
Inspire
(2003)
Déclaration
de l'OCDE
(2006)
Plan S
(2018)
Horizon 2020
(2013-2016)
Loi pour une
République
Numérique
(2016)
Plan National
pour la Science
Ouverte (2018)
ANR : politique
Science Ouverte
(2019)
Open Data
Open Access
Open Science
Collège Doctoral Université de Montpellier - CIST Agropolis
Contexte National : Plan National pour la Science Ouverte
Juillet 2018
• Axe 1 Généraliser l’accès ouvert aux
publications
• Axe 2 : Structurer et ouvrir les données de la
recherche
• Obligation de diffusion ouverte des données
• Créer la fonction Administrateur des données dans
chaque établissement
• Données ouvertes associées aux articles
scientifiques
• Axe 3 : s’inscrire dans une dynamique durable,
européenne et internationale
«La France s'engage pour que les résultats de la
recherche scientifique soient ouverts à tous, chercheurs,
entreprises et citoyens, sans entrave, sans délai, sans
payement.» (https://www.ouvrirlascience.fr)
Collège Doctoral Université de Montpellier - CIST Agropolis
Contexte national : Politique Science Ouverte de l’ANR
https://anr.fr/fr/lanr-et-la-recherche/engagements-et-valeurs/la-science-ouverte/
Collège Doctoral Université de Montpellier - CIST Agropolis
Droit des données : le cadre juridique français
• D’une manière générale, les données sont réputées « de libre
parcours » : elles ne sont pas protégées par le droit d’auteur
• Les données issues de la recherche sont considérées comme des
documents administratifs, si elles ont été produites dans le cadre d'une
mission de service public ou majoritairement grâce à des fonds publics :
• Elles sont donc communicables à la demande (sauf exceptions
légales), si elles sont "achevées".
• Elles sont soumises à un principe d’ouverture par défaut.
• Elles doivent être diffusées gratuitement et librement réutilisables
Cf. Loi pour une République Numérique (2016)
Collège Doctoral Université de Montpellier - CIST Agropolis
Droit des données : Exceptions 1- Publication sous condition
1. Les données personnelles (RGPD), en particulier les données sensibles (CNIL),
dont les données de santé
2. Les données protégées par le droit d’auteur (œuvres originales)
3. Les données qui impliquent un partenaire étranger ou privé (Droit sui generis des
bases de données)
4. Les données concernant les ressources génétiques et « connaissances
traditionnelles » associées : Protocole de Nagoya
5. Les informations pouvant avoir un impact sur la conservation de la biodiversité Code
de l’Environnement
6. Les données présentant des risques pour la protection du potentiel scientifique et
technique de la Nation
Collège Doctoral Université de Montpellier - CIST Agropolis
Droit des données : Exceptions 2-Publication
•Données relatives à la sécurité publique, sureté
de l’Etat et sécurité des l’établissements :
biens, personnes, informatique, …
•Secret professionnel : secret des procédés,
secret médical, secret de l’instruction, secret
bancaire, …
•Secret défense
Collège Doctoral Université de Montpellier - CIST Agropolis
Droit des données : Des licences pour préciser les droits de diffusion
En France, selon Décret n° 2017-638 du 27/04/2017 relatif
aux licences de réutilisation à titre gratuit des informations
publiques et aux modalités de leur homologation,
2 choix possibles seulement :
• l’ODbL (Open Database License version 1.0),
pour contrôler les redistributions et les travaux
dérivés, ou pour une diffusion internationale
• la Licence Ouverte Etalab,
si le suivi du devenir des données n’est pas recherché
et si les données sont essentiellement distribuées en
France
Collège Doctoral Université de Montpellier - CIST Agropolis
Droit des données : Licences Creative Commons
Alternative internationale possible
Pour choisir : https://creativecommons.org/choose/?lang=fr
Pour comprendre :
https://creativecommons.org/licenses/?lang=fr-FR
5 icônes = 5 droits combinables 7 licences
ZERO Domaine public
BY
Attribution
= Paternité
SA
Share Alike
= Partage dans les mêmes conditions
NC Non Commercial
ND
No Derivatives
= Pas de Modification
Conception
projet
Conception
méthode(s)
Démarrage
projet
Analyse
données
Fin du projet
PUBLICATION
Description Dépôt
Stockage
DécouvertePartage
Nouvelles
recherches /
publications
/ citations
PGD
ENTREPOT
Acquisition
données
Conclusion: des pratiques à changer…
Collège Doctoral Université de Montpellier - CIST Agropolis
• Licence d’utilisation
appropriée
• Formats ouverts
• Vocabulaire partagé
• Standards de
métadonnées
communs
• Accès pérenne aux
données
• Accord des
producteurs
• Identifiant
pérenne
• Métadonnées
Facile à
trouver
Accessible
RéutilisableInter-
opérable
Aussi ouvert que possible,
aussi fermé que nécessaire
… dans le respect des principes FAIR
Collège Doctoral Université de Montpellier - CIST Agropolis

Contenu connexe

Tendances

Presentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonusPresentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonus
Desconnets Jean-Christophe
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
Lesticetlart Invisu
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
Bertrand Tavitian
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Agropolis International
 
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
Agropolis International
 
Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...
Lesticetlart Invisu
 
M allanic piv2017_c
M allanic piv2017_cM allanic piv2017_c
M allanic piv2017_c
Bertrand Tavitian
 
Stage pgd 2021-04-07
Stage pgd 2021-04-07Stage pgd 2021-04-07
Stage pgd 2021-04-07
Eliane Caillou
 
Données ouvertes de la recherche : nouvelles pratiques de publication et de p...
Données ouvertes de la recherche : nouvelles pratiques de publication et de p...Données ouvertes de la recherche : nouvelles pratiques de publication et de p...
Données ouvertes de la recherche : nouvelles pratiques de publication et de p...
pascal aventurier
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Pierre Naegelen
 
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Lesticetlart Invisu
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Agropolis International
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...
Thierry Chanier
 
Mc jacquemot piv2017_c
Mc jacquemot piv2017_cMc jacquemot piv2017_c
Mc jacquemot piv2017_c
Bertrand Tavitian
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Cairn.info
 
Module8a tdm-cnedellec
Module8a tdm-cnedellecModule8a tdm-cnedellec
Module8a tdm-cnedellec
Claire Nedellec
 
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...
Pierre-Carl Langlais
 
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Le_GFII
 
IST, comment préparer l'avenir ?
IST, comment préparer l'avenir ?IST, comment préparer l'avenir ?
IST, comment préparer l'avenir ?
ABES
 
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Lesticetlart Invisu
 

Tendances (20)

Presentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonusPresentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonus
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
 
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
 
Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...
 
M allanic piv2017_c
M allanic piv2017_cM allanic piv2017_c
M allanic piv2017_c
 
Stage pgd 2021-04-07
Stage pgd 2021-04-07Stage pgd 2021-04-07
Stage pgd 2021-04-07
 
Données ouvertes de la recherche : nouvelles pratiques de publication et de p...
Données ouvertes de la recherche : nouvelles pratiques de publication et de p...Données ouvertes de la recherche : nouvelles pratiques de publication et de p...
Données ouvertes de la recherche : nouvelles pratiques de publication et de p...
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...
 
Mc jacquemot piv2017_c
Mc jacquemot piv2017_cMc jacquemot piv2017_c
Mc jacquemot piv2017_c
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
 
Module8a tdm-cnedellec
Module8a tdm-cnedellecModule8a tdm-cnedellec
Module8a tdm-cnedellec
 
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...
 
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
 
IST, comment préparer l'avenir ?
IST, comment préparer l'avenir ?IST, comment préparer l'avenir ?
IST, comment préparer l'avenir ?
 
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
 

Similaire à Introduction aux données de la recherche

Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...
Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...
Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...
AKASIAS
 
Présentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfistPrésentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfist
URFIST de Paris
 
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Rayna Stamboliyska
 
SIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophonesSIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophones
INRAE (MISTEA) and University of Montpellier (LIRMM)
 
Science ouverte en Afro-Francophonie subsaharienne
Science ouverte en Afro-Francophonie subsaharienneScience ouverte en Afro-Francophonie subsaharienne
Science ouverte en Afro-Francophonie subsaharienne
Antonin Benoît DIOUF
 
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
Academy of Science of South Africa (ASSAf)
 
Du dépôt au partage de données
Du dépôt au partage de donnéesDu dépôt au partage de données
Du dépôt au partage de donnéesAntoine Blanchard
 
UE ISSM 7.309 GCF2019
UE ISSM 7.309 GCF2019UE ISSM 7.309 GCF2019
Programme colloque Open Data & données personnelles Perspectives scientifiques
Programme colloque Open Data & données personnelles Perspectives scientifiquesProgramme colloque Open Data & données personnelles Perspectives scientifiques
Programme colloque Open Data & données personnelles Perspectives scientifiques
liberTIC
 
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
Le_GFII
 
Ethique des-publications-cnrs-novembre-2011-vf
Ethique des-publications-cnrs-novembre-2011-vfEthique des-publications-cnrs-novembre-2011-vf
Ethique des-publications-cnrs-novembre-2011-vf
Patricia Volland-Nail
 
UE ISSM 7309 GCF2023.pptx
UE ISSM 7309 GCF2023.pptxUE ISSM 7309 GCF2023.pptx
UE ISSM 7309 GCF2023.pptx
OKCC/C3O and CREM/université Lorraine
 
JE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPauJE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPau
Françoise Gouzi
 
JIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - IntroductionJIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - Introduction
Groupe Traces
 
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
URFIST de Paris
 
Apports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiquesApports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiques
Philippe GORRY
 
Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)
URFIST de Paris
 
Les enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la rechercheLes enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la recherche
Conseil constitutionnel, Constitutional Council, France
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
AssociationAF
 

Similaire à Introduction aux données de la recherche (20)

Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...
Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...
Pourquoi l'Intelligence Stratégique pour la recherche et l'innovation ? - par...
 
Présentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfistPrésentation-R-Barre-Jne 30ans-des-urfist
Présentation-R-Barre-Jne 30ans-des-urfist
 
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
 
SIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophonesSIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophones
 
Science ouverte en Afro-Francophonie subsaharienne
Science ouverte en Afro-Francophonie subsaharienneScience ouverte en Afro-Francophonie subsaharienne
Science ouverte en Afro-Francophonie subsaharienne
 
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
 
Du dépôt au partage de données
Du dépôt au partage de donnéesDu dépôt au partage de données
Du dépôt au partage de données
 
UE ISSM 7.309 GCF2019
UE ISSM 7.309 GCF2019UE ISSM 7.309 GCF2019
UE ISSM 7.309 GCF2019
 
Programme colloque Open Data & données personnelles Perspectives scientifiques
Programme colloque Open Data & données personnelles Perspectives scientifiquesProgramme colloque Open Data & données personnelles Perspectives scientifiques
Programme colloque Open Data & données personnelles Perspectives scientifiques
 
ISTséance1
ISTséance1ISTséance1
ISTséance1
 
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
 
Ethique des-publications-cnrs-novembre-2011-vf
Ethique des-publications-cnrs-novembre-2011-vfEthique des-publications-cnrs-novembre-2011-vf
Ethique des-publications-cnrs-novembre-2011-vf
 
UE ISSM 7309 GCF2023.pptx
UE ISSM 7309 GCF2023.pptxUE ISSM 7309 GCF2023.pptx
UE ISSM 7309 GCF2023.pptx
 
JE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPauJE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPau
 
JIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - IntroductionJIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - Introduction
 
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
 
Apports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiquesApports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiques
 
Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)Les métriques de la science (ou La bibliométrie pour les nuls)
Les métriques de la science (ou La bibliométrie pour les nuls)
 
Les enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la rechercheLes enjeux de la valorisation numérique de la recherche
Les enjeux de la valorisation numérique de la recherche
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
 

Plus de IST IRD - Service IST de l'Institut de Recherche pour le Développement

Migration end note-zotero
Migration end note-zoteroMigration end note-zotero
Zotero5 perfectionnement
Zotero5 perfectionnementZotero5 perfectionnement
Zotero5 initiation
Zotero5 initiationZotero5 initiation
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Entreposer donnees decker-atelier-data_suds_20191118
Entreposer donnees decker-atelier-data_suds_20191118Entreposer donnees decker-atelier-data_suds_20191118
Entreposer donnees decker-atelier-data_suds_20191118
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Signature des Publications Scientifiques_David Pontille_JeudIST IRD 20190516
Signature des Publications Scientifiques_David Pontille_JeudIST IRD  20190516Signature des Publications Scientifiques_David Pontille_JeudIST IRD  20190516
Signature des Publications Scientifiques_David Pontille_JeudIST IRD 20190516
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
GBIF Jeudist IRD_20190418
GBIF Jeudist IRD_20190418GBIF Jeudist IRD_20190418
Poster Dataverse IRD JNSO 2018
Poster Dataverse IRD JNSO 2018Poster Dataverse IRD JNSO 2018
End Note X8 - Hensens Hanka - 2017
End Note X8 - Hensens Hanka - 2017 End Note X8 - Hensens Hanka - 2017
Opendata repository-Gabarone,20181108
Opendata repository-Gabarone,20181108Opendata repository-Gabarone,20181108
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Equation de recherche
Equation de rechercheEquation de recherche
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Rechercher l'information scientifique. Hanka Hensens. 15/05/2018
Rechercher l'information scientifique. Hanka Hensens. 15/05/2018Rechercher l'information scientifique. Hanka Hensens. 15/05/2018
Rechercher l'information scientifique. Hanka Hensens. 15/05/2018
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018
Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018
Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Mieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRD
Mieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRDMieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRD
Mieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRD
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 
Identifiants chercheurs. 12 avril 2018. JeudIST IRD
Identifiants chercheurs. 12 avril 2018. JeudIST IRD Identifiants chercheurs. 12 avril 2018. JeudIST IRD
Identifiants chercheurs. 12 avril 2018. JeudIST IRD
IST IRD - Service IST de l'Institut de Recherche pour le Développement
 

Plus de IST IRD - Service IST de l'Institut de Recherche pour le Développement (20)

Migration end note-zotero
Migration end note-zoteroMigration end note-zotero
Migration end note-zotero
 
Zotero5 perfectionnement
Zotero5 perfectionnementZotero5 perfectionnement
Zotero5 perfectionnement
 
Zotero5 initiation
Zotero5 initiationZotero5 initiation
Zotero5 initiation
 
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
APA et Protocole de nagoya et leur impact sur la recherche et sa valorisation...
 
Entreposer donnees decker-atelier-data_suds_20191118
Entreposer donnees decker-atelier-data_suds_20191118Entreposer donnees decker-atelier-data_suds_20191118
Entreposer donnees decker-atelier-data_suds_20191118
 
Signature des Publications Scientifiques_David Pontille_JeudIST IRD 20190516
Signature des Publications Scientifiques_David Pontille_JeudIST IRD  20190516Signature des Publications Scientifiques_David Pontille_JeudIST IRD  20190516
Signature des Publications Scientifiques_David Pontille_JeudIST IRD 20190516
 
GBIF Jeudist IRD_20190418
GBIF Jeudist IRD_20190418GBIF Jeudist IRD_20190418
GBIF Jeudist IRD_20190418
 
Poster Dataverse IRD JNSO 2018
Poster Dataverse IRD JNSO 2018Poster Dataverse IRD JNSO 2018
Poster Dataverse IRD JNSO 2018
 
End Note X8 - Hensens Hanka - 2017
End Note X8 - Hensens Hanka - 2017 End Note X8 - Hensens Hanka - 2017
End Note X8 - Hensens Hanka - 2017
 
Opendata repository-Gabarone,20181108
Opendata repository-Gabarone,20181108Opendata repository-Gabarone,20181108
Opendata repository-Gabarone,20181108
 
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
Valorisation et Bibliometrie, Isabelle Henry, JeudIST IRD du 8/11/2018
 
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
Publier avec intégrité, Hervé Maisonneuve, JeudIST IRD du 11/10/2018
 
Equation de recherche
Equation de rechercheEquation de recherche
Equation de recherche
 
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
Realiser un plan de gestion de donnees avec dmp opidor. jeudist IRD du 20/09/...
 
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
Rechercher des publications scientifiques en libre acces. Hanka Hensens. 15/0...
 
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
Parcours de recherche documentaire. Hanka Hensens. 15/05/2018
 
Rechercher l'information scientifique. Hanka Hensens. 15/05/2018
Rechercher l'information scientifique. Hanka Hensens. 15/05/2018Rechercher l'information scientifique. Hanka Hensens. 15/05/2018
Rechercher l'information scientifique. Hanka Hensens. 15/05/2018
 
Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018
Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018
Reseaux sociaux académiques. Emilie Brunet. Insa Toulouse. 14/06/2018
 
Mieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRD
Mieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRDMieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRD
Mieux publier la science. Eric Lichtfouse. 15 février 2018. JeudIST IRD
 
Identifiants chercheurs. 12 avril 2018. JeudIST IRD
Identifiants chercheurs. 12 avril 2018. JeudIST IRD Identifiants chercheurs. 12 avril 2018. JeudIST IRD
Identifiants chercheurs. 12 avril 2018. JeudIST IRD
 

Introduction aux données de la recherche

  • 1. CAP SUR LES DONNEES Annabelle Filatre (AgroParisTech) Hanka Hensens (IRD) Isabelle Nault (INRAE) Collège DoctoralUniversité de Montpellier -CISTAgropolis
  • 3. Collège Doctoral Université de Montpellier - CIST Agropolis Définitions (1) • Pour vous ? • Par l’exemple… • Vous avez 5 mn ! Crédits : 1-Junah Rosales, Pixabay 2- JocelynJalette, Wikimedia Commons 3- FreeSVG 1 2 3
  • 4. Collège Doctoral Université de Montpellier - CIST Agropolis Typologie / Méthode d’obtention Données d'observations, d'enquête Données de simulation Données expérimentales Données rassemblées / dérivées (traitées, corrigées,…) Résultats d’expériences, Echantillons, Photos de microscope, Spectroscopie,… … Modèles Algorithmes Scripts … Mesures, Relevés de terrain, Réponses à questionnaires et enquêtes, Transcriptions d’interviews Photographies, films, fichiers audio, … Fichiers de données Documents texte, Feuilles de calculs, Bases de données Statistiques, …
  • 5. [IST Agropolis, 2016] 1.1. Définitions et typologie Création / Collecte Traitement et analyse Conservation Accès et réutilisation • Données traitées • Données analysées • Données enrichies • Données déposées • Données publiées • Données archivées • Données réutilisées • Données partagées • Données brutes • Données sources • Données recueillies Collège Doctoral Université de Montpellier - CIST Agropolis Typologie / Cycle de vie des données
  • 6. Collège Doctoral Université de Montpellier - CIST Agropolis Ne sont PAS des données de la recherche Selon l'OCDE : Les documents non achevés : • les carnets de laboratoire • les analyses préliminaires, les projets de documents scientifiques et les programmes de travaux futurs • les examens par les pairs • les communications personnelles avec des collègues, … Les objets matériels : • les souches bactériennes • les animaux de laboratoire,… Les productions scientifiques • les publications scientifiques, communications à congrès, • les supports de formation, … Les données administratives non intégrées dans un corpus de recherche... Image de Pixabay
  • 7. Collège Doctoral Université de Montpellier - CIST Agropolis Définitions (2) • Pour l’OCDE (2006) : « Enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. » (repris par le Plan National pour Science Ouverte - 2018) • Pour la Royal Society of London : « Informations qualitatives ou quantitatives […] qui sont factuelles. Ces données peuvent être brutes ou primaires (directement issue d’une mesure), ou dérivée de données primaires, mais ne sont pas encore le produit d’analyse ou d’interprétation autres que le calculs. »
  • 8. Collège Doctoral Université de Montpellier - CIST Agropolis Définitions (3) • Pour la Commission Européenne (H2020) : "1. Les données sous-jacente (les données nécessaires pour valider les résultats présentés dans les publications scientifiques), incluant les métadonnées associées (c’est-à-dire les métadonnées décrivant les données de recherche déposées) 2.Toute autre donnée (par exemple les données conservées qui ne sont pas directement attribuables à une publication, ou les données brutes), y compris les métadonnées associées. (…) L'accent est mis sur les données de recherche disponibles sous forme numérique. »
  • 9. Collège Doctoral Université de Montpellier - CIST Agropolis Définition du Jeu de Données (DataSet) • « Agrégation, sous une forme lisible, de données brutes ou dérivées présentant une certaine unité, rassemblées pour former un ensemble cohérent. » (Gaillard, 2014). • Unité de dépôt : sa granularité ne doit être ni trop petite, ni trop grande, pour faciliter la citation • Complété par des métadonnées nécessaires à leur réutilisation et à leur validation : méthodes d’obtention, logiciels nécessaires, auteurs, couverture temporelle et spatiale, etc…
  • 10. Collège Doctoral Université de Montpellier - CIST Agropolis Les enjeux de la (bonne) gestion des données scientifiques Enjeux scientifiques • Diminution de la perte de données • Continuité de la recherche • Recherche multidisciplinaire / systèmes complexes • Big Data et Data Science Enjeux économiques • Bonne gestion budgétaire • Innovation, valorisation • Conditions de financement des bailleurs • Evolution de la publication scientifique Enjeux sociétaux • Transparence et reproductibilité • Participation citoyenne • Accroissement de l'impact science / société • Interopérabilité des données
  • 11. Collège Doctoral Université de Montpellier - CIST Agropolis Enjeux : Perte des données scientifiques VINES Timothy H., et al. The Availability of Research Data Declines Rapidly with Article Age, Current Biology, 2014. 20 ans après publication, 80 % des données sont perdues Causes  Destruction des supports, virus  Obsolescence matérielle ou logicielle  Lieu de stockage indéfini  Erreurs humaines, départs de personnel Conséquences  Perte de temps, d’argent, de fonds publics  Pas de vérification des résultats  Pas de comparaison dans le temps ou l’espace  Pas de réutilisations par d’autres publics ou pour d’autres fins
  • 12. Collège Doctoral Université de Montpellier - CIST Agropolis Enjeux : Crise de la reproductibilité scientifique En 2016, 1500 chercheurs répondent à Nature : “More than 70% of researchers have tried and failed to reproduce another scientist's experiments, and more than half have failed to reproduce their own experiments” Nature may 2016 : https://www.nature.com/news/1-500-scientists- lift-the-lid-on-reproducibility-1.19970 Dégât collatéral du « Publish or Perish »…
  • 13. Collège Doctoral Université de Montpellier - CIST Agropolis Enjeux :Vers une Science Ouverte  Vise la transparence et le partage de l’ensemble du processus de recherche,  de la formulation de l’hypothèse à la diffusion des résultats, en passant par les méthodes, données, protocoles, ainsi que l’évaluation, la publication, etc.  Pour susciter analyses, critiques et discussions (publiques) dans le but de le valider et l’améliorer Notion de Science ouverte et thèmes/enjeux connexes, Wikipedia
  • 14. Collège Doctoral Université de Montpellier - CIST Agropolis Contexte international : Libre Accès et Science Ouverte Loi Cada (1978) Directive PSI (2003) Directive Inspire (2007) Charte du G8 (2013) Loi Valter (2015) Initiative de Budapest (2002) Initiative de Berlin(2003) Directive Inspire (2003) Déclaration de l'OCDE (2006) Plan S (2018) Horizon 2020 (2013-2016) Loi pour une République Numérique (2016) Plan National pour la Science Ouverte (2018) ANR : politique Science Ouverte (2019) Open Data Open Access Open Science
  • 15. Collège Doctoral Université de Montpellier - CIST Agropolis Contexte National : Plan National pour la Science Ouverte Juillet 2018 • Axe 1 Généraliser l’accès ouvert aux publications • Axe 2 : Structurer et ouvrir les données de la recherche • Obligation de diffusion ouverte des données • Créer la fonction Administrateur des données dans chaque établissement • Données ouvertes associées aux articles scientifiques • Axe 3 : s’inscrire dans une dynamique durable, européenne et internationale «La France s'engage pour que les résultats de la recherche scientifique soient ouverts à tous, chercheurs, entreprises et citoyens, sans entrave, sans délai, sans payement.» (https://www.ouvrirlascience.fr)
  • 16. Collège Doctoral Université de Montpellier - CIST Agropolis Contexte national : Politique Science Ouverte de l’ANR https://anr.fr/fr/lanr-et-la-recherche/engagements-et-valeurs/la-science-ouverte/
  • 17. Collège Doctoral Université de Montpellier - CIST Agropolis Droit des données : le cadre juridique français • D’une manière générale, les données sont réputées « de libre parcours » : elles ne sont pas protégées par le droit d’auteur • Les données issues de la recherche sont considérées comme des documents administratifs, si elles ont été produites dans le cadre d'une mission de service public ou majoritairement grâce à des fonds publics : • Elles sont donc communicables à la demande (sauf exceptions légales), si elles sont "achevées". • Elles sont soumises à un principe d’ouverture par défaut. • Elles doivent être diffusées gratuitement et librement réutilisables Cf. Loi pour une République Numérique (2016)
  • 18. Collège Doctoral Université de Montpellier - CIST Agropolis Droit des données : Exceptions 1- Publication sous condition 1. Les données personnelles (RGPD), en particulier les données sensibles (CNIL), dont les données de santé 2. Les données protégées par le droit d’auteur (œuvres originales) 3. Les données qui impliquent un partenaire étranger ou privé (Droit sui generis des bases de données) 4. Les données concernant les ressources génétiques et « connaissances traditionnelles » associées : Protocole de Nagoya 5. Les informations pouvant avoir un impact sur la conservation de la biodiversité Code de l’Environnement 6. Les données présentant des risques pour la protection du potentiel scientifique et technique de la Nation
  • 19. Collège Doctoral Université de Montpellier - CIST Agropolis Droit des données : Exceptions 2-Publication •Données relatives à la sécurité publique, sureté de l’Etat et sécurité des l’établissements : biens, personnes, informatique, … •Secret professionnel : secret des procédés, secret médical, secret de l’instruction, secret bancaire, … •Secret défense
  • 20. Collège Doctoral Université de Montpellier - CIST Agropolis Droit des données : Des licences pour préciser les droits de diffusion En France, selon Décret n° 2017-638 du 27/04/2017 relatif aux licences de réutilisation à titre gratuit des informations publiques et aux modalités de leur homologation, 2 choix possibles seulement : • l’ODbL (Open Database License version 1.0), pour contrôler les redistributions et les travaux dérivés, ou pour une diffusion internationale • la Licence Ouverte Etalab, si le suivi du devenir des données n’est pas recherché et si les données sont essentiellement distribuées en France
  • 21. Collège Doctoral Université de Montpellier - CIST Agropolis Droit des données : Licences Creative Commons Alternative internationale possible Pour choisir : https://creativecommons.org/choose/?lang=fr Pour comprendre : https://creativecommons.org/licenses/?lang=fr-FR 5 icônes = 5 droits combinables 7 licences ZERO Domaine public BY Attribution = Paternité SA Share Alike = Partage dans les mêmes conditions NC Non Commercial ND No Derivatives = Pas de Modification
  • 22. Conception projet Conception méthode(s) Démarrage projet Analyse données Fin du projet PUBLICATION Description Dépôt Stockage DécouvertePartage Nouvelles recherches / publications / citations PGD ENTREPOT Acquisition données Conclusion: des pratiques à changer… Collège Doctoral Université de Montpellier - CIST Agropolis
  • 23. • Licence d’utilisation appropriée • Formats ouverts • Vocabulaire partagé • Standards de métadonnées communs • Accès pérenne aux données • Accord des producteurs • Identifiant pérenne • Métadonnées Facile à trouver Accessible RéutilisableInter- opérable Aussi ouvert que possible, aussi fermé que nécessaire … dans le respect des principes FAIR Collège Doctoral Université de Montpellier - CIST Agropolis

Notes de l'éditeur

  1. Video de fin (aspects juridiques ?) à choisir sur https://www.youtube.com/channel/UCiQKWx7D5wPJr4TG2zN7BJA/videos
  2. 1: Oui, VOUS ! 2 : N’ayez pas peur ! 3 : On va travailler en brainstorming… 4: et à partir d’exemples : Qu’est-ce qui fait partie des données de la recherche pour vous ? Répondez en donnant : votre prénom et vos suggestions. Celui qui donne le plus d’exemple a gagné. Celui qui commence est avantagé ! Annabelle comptabilise le nombre de réponse par prénom et j’écris les exemples sur le tableau en les regroupant : données d’observation/d’enquête, données de simulation, données expérimentales, données brutes/dérivées
  3. Priorisation sur les données liées aux publications par l’Europe et le Gouvernement français : reproductibilité et vérification (scandales périodiques, particulièrement en santé
  4. Les enjeux scientifiques : Eviter la perte de données en cours et surtout à la fin du projet : Assurer la sécurité des données de la recherche et leur archivage à long terme Assurer la continuité de la recherche, en permettant la réutilisation des données antérieures, Répondre à des défis scientifiques complexes (environnement global, changement social,…) qui supposent transdisciplinarité, collaboration des équipes, ouverture et mutualisation des informations Big data : masse de données numériques produites et rendues accessibles, enjeu majeur actuel du point de vue économique, industriel et scientifique La Data science se développe pour générer automatiquement de nouvelles connaissances en exploitant ces grandes masses de données (scientifiques entre autres) Les enjeux économiques : Eviter de refaire ce qui a déjà été fait (et financé), permettre à d’autres d’exploiter ses données dans un souci d'économie, de retour sur investissement et d'innovation Satisfaire aux conditions de financement des bailleurs et justifier de l'utilisation des fonds publics Faire évoluer le système de l'édition scientifique en permettant aux chercheurs de se réapproprier l’évaluation et la diffusion de leur production Les enjeux sociétaux Accroître la transparence du processus scientifique en permettant le contrôle des données et la reproductibilité des expériences, et augmenter la confiance en la science et la méthode scientifique, Favoriser la participation des citoyens et de la société civile : libre accès pour tous aux connaissances Accroître la visibilité, l’utilisation et l’impact de la recherche au sein et hors de la communauté scientifique Permettre le dialogue entre applications, thématiques, outils,… via l'interopérabilité des données
  5. La crise de la reproductibilité de la science (scandales, rétractation d'articles, ex. Chloroquine Covid) justifie la bonne gestion des données de la recherche : Cette étude révèle que 70 % des chercheurs ne peuvent pas reproduire les expériences d'autres chercheurs et plus de la moitié d'entre eux ne peuvent pas reproduire leurs propres expériences !
  6. Contexte international qui promeut l'avènement de la Science Ouverte en accélérant clairement le rythme. Les dates clés : Contexte européen : Horizon 2020 : obligation d'un PGD pour tous les projets depuis 2016 Contexte français : la loi pour une République numérique a conduit à la mise en place d'un principe d'ouverture des données « par défaut », qui modifie fortement les règles de diffusion et de réutilisation des informations publiques. Ces textes sont applicables aux données scientifiques produites par les établissements d'enseignement et de recherche publics. Le Plan national pour la science ouverte, rend obligatoire l'accès ouvert pour les publications et pour les données issues de recherches financées sur fonds (majoritairement) publics Dans le cadre de sa politique science ouverte, l’Agence nationale de la recherche (ANR) participe à l’alignement européen et international en faveur de la structuration et de l’ouverture des données de la recherche
  7. Ainsi, de plus en plus d'organismes mettent en place des actions concernant les données : CIRAD / IRD / INRA / Universités,… Le plan national stipule également la généralisation de la mise en place de plans de gestion des données dans les appels à projets de recherche
  8. La politique science ouverte initiée par l’ANR dès 2013 s’inscrit pleinement dans le cadre du Plan national pour la science ouverte selon les trois objectifs suivants : Favoriser le libre accès aux publications (Open Access) : dépôt du texte intégral des publications scientifiques issues du projet de recherche dans les conditions prévues par la LRN Elaborerd’un Plan de Gestion des Données (PGD) pour les projets financés à partir de 2019 Coordonner les actions aux niveaux européens et international ( PGD / Standards / Licences …)
  9. Avant 2016, la réutilisation des données publiques était régie en France par la loi CADA (1978) relative aux relations entre l’administration et les usagers. Elle instaurait bien un droit à la «libre réutilisation» des informations produites par les administrations Les lois Valter et Lemaire ont profondément modifié le cadre de la réutilisation des données publiques, en instaurant un principe d’ouverture «par défaut» et de mise en ligne a priori
  10. Faites attention, si vos données rentrent dans un des cas suivants, vous ne pourrez pas les diffuser sans autorisation, ou floutage, agrégation,… qui demandent temps et/ou compétence/logiciel,…: 1-Données sensibles : origines ethniques; opinions politiques, philosophiques ou religieuse; appartenance syndicale, sexualité, Cas particulier des données de santé : nécessité du consentement préalable (formulaire pour donner accès, à qui, pour quelle utilisation,…)+ anomymisation obligatoire (difficile noms, coordonnées mais aussi tout ce qui peut permettre de retrouver la personne) 2-Données protégées par le droit d’auteur : textes, figures, photographies … 3-Le producteur d'une base de données bénéficie d'une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d'un investissement financier, matériel ou humain « substantiel » (chaque nouvel investissement prolongeant la durée de la protection). 4-Protocole de Nagoya : données obtenues après « consentement préalable en connaissance de cause » des communautés locales autochtones, pour que les « connaissances, innovations et pratiques qu’elles ont développées » soient reconnues et que leurs conditions d’utilisation soient « convenues d’un commun accord » 5-Localisation d’une espèce menacée par exemple… 6-produites dans des laboratoires classés «  zones à régime restrictif » (ZRR) en particulier
  11. ODBL (~CC-BY-SA) La licence Open Database a été créée au départ pour les bases de données. Elle permet à chacun d’exploiter publiquement, commercialement ou non, des bases de données à condition de maintenir la licence sur la base de données, sur les modifications éventuelles qui y sont apportées, et sur les créations dérivées qui mentionneront expressément l’origine des données. Etalab (~CC-BY) licence libre française créée par la mission Etalab afin d'encadrer l'ouverture des données de l’État français
  12. Les licences CC ne sont pas dans le décret, mais, elles sont communément utilisées pour les données et proposées par les entrepôts. A droite, les 7 licences classées de haut en bas de la plus libre à la moins ouverte Pour aller plus loin sur les licences, une récapitulatif très complet est disponible sur le site data.gouv.fr / rubrique Licences
  13. Vous voyez s'afficher en bas de la diapo le déroulé d'un projet de recherche avec 1-Anciennes pratiques de gestion des données 2-Ajout des nouvelles préconisations 3-conséquences bénéfiques
  14. Une des grades trouvailles européennes !