La Science Ouverte est à l’ordre du jour, en France et en Europe.
Après les publications, les données de la recherche sont sous le feu des projecteurs.
Ce gisement de connaissances, trop peu connu et exploité, est même souvent voué à l’oubli et à la destruction, faute de signalisation et de sauvegarde pérenne.
L’IRD, plus encore que les autres organismes de recherche, se doit de proposer une politique, des méthodologies et des outils de préservation et de partage des données recueillies dans, par et pour les pays du Sud par l’ensemble de ses équipes de recherche.
Lors de cette conférence, Pascal Aventurier, responsable du Service Information Scientifique et Technique (IST), et Jean-Christophe Desconnets, Directeur de la Mission Infrastructure et Données Numériques (MIDN), présenteront le projet d’entrepôt de données de l’IRD qui ouvrira mi 2019.
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...Lesticetlart Invisu
Intervention de Rémi Gaillard, responsable du pôle « Politique documentaire et valorisation des collections » de la bibliothèque de l'Université Pierre-et-Marie-Curie, aux Lundis numériques de l'INHA (14 septembre 2015).
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Le_GFII
Intervention de Patricia Geretto, ingénierie de l'information - TAL à la DVIST INRA. Forum du GFII les 8 & 9 dec 2015.
OpenMinTeD, projet Horizon 2020, a pour objectif de créer une infrastructure facilitant l'usage des ressources et des outils de text-mining pour les communautés scientifiques. Cette plateforme ouverte et pérenne permettra aux chercheurs de découvrir, créer, partager et ré-utiliser la connaissance extraite d’un vaste éventail de sources de la littérature scientifique. Des cas d'usage sont identifiés et développés par des experts de différents domaines. L'Institut National de la Recherche Agronomique (INRA) participe pour sa part aux cas d'usage en agronomie.
La Science Ouverte est à l’ordre du jour, en France et en Europe.
Après les publications, les données de la recherche sont sous le feu des projecteurs.
Ce gisement de connaissances, trop peu connu et exploité, est même souvent voué à l’oubli et à la destruction, faute de signalisation et de sauvegarde pérenne.
L’IRD, plus encore que les autres organismes de recherche, se doit de proposer une politique, des méthodologies et des outils de préservation et de partage des données recueillies dans, par et pour les pays du Sud par l’ensemble de ses équipes de recherche.
Lors de cette conférence, Pascal Aventurier, responsable du Service Information Scientifique et Technique (IST), et Jean-Christophe Desconnets, Directeur de la Mission Infrastructure et Données Numériques (MIDN), présenteront le projet d’entrepôt de données de l’IRD qui ouvrira mi 2019.
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...Lesticetlart Invisu
Intervention de Rémi Gaillard, responsable du pôle « Politique documentaire et valorisation des collections » de la bibliothèque de l'Université Pierre-et-Marie-Curie, aux Lundis numériques de l'INHA (14 septembre 2015).
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Le_GFII
Intervention de Patricia Geretto, ingénierie de l'information - TAL à la DVIST INRA. Forum du GFII les 8 & 9 dec 2015.
OpenMinTeD, projet Horizon 2020, a pour objectif de créer une infrastructure facilitant l'usage des ressources et des outils de text-mining pour les communautés scientifiques. Cette plateforme ouverte et pérenne permettra aux chercheurs de découvrir, créer, partager et ré-utiliser la connaissance extraite d’un vaste éventail de sources de la littérature scientifique. Des cas d'usage sont identifiés et développés par des experts de différents domaines. L'Institut National de la Recherche Agronomique (INRA) participe pour sa part aux cas d'usage en agronomie.
Pour les universités et instituts du Sud, les bouleversements de l'IST ouvrent des perspectives nouvelles : la littérature scientifique devient plus accessible et la production scientifique de l’organisme peut être diffusée plus facilement, grâce aux mouvements du Libre Accès et de la Science Ouverte, et aux développement de technologies de l’information basées sur des logiciels libres.
Marc Goovaerts met en application ce nouveau paradigme dans différents projets de coopération Nord-Sud-Sud, en portant une attention particulière à l’interopérabilité, aux métadonnées et aux identifiants uniques.
Marc Goovaerts, bibliothécaire à l’Université de Hasselt (Belgique), coordonne depuis 20 ans divers projets de coopération financés par le programme IODE de l’UNESCO (https://www.iode.org/) et VLIR-UOS (https://www.vliruos.be/en) avec des bibliothèques et instituts du Sud. Deux récents projets de coopération avec 5 universités cubaines serviront d’exemple.
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheAgropolis International
Une fiche pratique dédiée aux données de la recherche dans le cadre de l'Open Access (créée en septembre 2015 et révisée en octobre 2016) :
• enjeux,
• typologie,
• cycle de vie de la donnée,
• les étapes de gestion des données de la recherche
• le plan de gestion (PGD ou Data Management Plan - DMP)
• exemples de modèles de plans de gestion de données
• la valorisation des données de la recherche
• la (ré)utilisation des données et le droit d'auteurs (licences).
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révisée en octobre 2016
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
Analyser les statistiques de consultation de la documentation en vue d'évaluer les besoins des chercheurs
Etre un acteur de l'indexation des données : "médiateur de la valorisation des données" (Catherine Morel-Pair)
Constituer une cellule d'appui pour la gestion des données de la recherche : l'élaboration d'un Digital Management Plan (DMP) ou Plan de Gestion des Données (PGD)
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...Agropolis International
La politique de libre accès de l'UE
Le projet pilote de libre accès aux données de la recherche (Open Research Data)
Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révision octobre 2016
Présentation au Pôle Science de l’IRD , le 13 septembre 2018 du projet d'entrepôt de données ouvertes de l'IRD, du contexte de l'Open Science en France et en Europe et des avantages à disposer d'un entrepôt de données pour l'IRD et ses partenaires.
Cette introduction au Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis définit rapidement ce qui fait partie des données de la recherche publique et le cadre juridique qui leur est appliqué.
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Alberto González-Talaván
Cette présentation établis les principes fondamentales pour la publication des données provenant des échantillons. Elle était présenté pour la première fois dans la formation GB22 pour des points nodaux du GBIF.
Diapos produites et présentés par L. Smirnova (Royal Museum for Central Africa - Belgium).
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
Ces dernières années ont vu se multiplier des plateformes d’échanges et de gestion d’information géolocalisées, prenant des formes diverses, qu’il s’agisse de catalogues de données géoréferencées ou de plateformes web SIG, souvent enrichies d’applications métiers. Beaucoup d’inventivité, d’innovation et donc d’énergie ont été mises au service de développements.
Ce séminaire se propose à partir de différentes expériences de revenir sur les usages de ces plateformes, en mettant en perspective l’ensemble du dispositif (les caractéristiques de la solution et les besoins initialement affichés, les usagers ciblés), et les utilisations effectives a posteriori, mais aussi en revenant sur les éventuelles conséquences de ces plateformes sur les pratiques professionnelles, sur les évolutions envisagées et à envisager tant pour les usages de type « consultation » que pour les usages de type « contribution ».
Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scient...ABES
Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scientifique et technique", Francis André, directeur adjoint de la direction de l'IST du CNRS (DIST), dans le cadre des Journées Abes 2011
High-level Meeting & Workshop on Environmental and Scientific Open Data for Sustainable Development Goals in Developing Countries. Madagascar, 4-6 December 2017
Entreposer des données : pourquoi, domment. Introduction généraleà la présentation de DataSuds, l'entrepôt de données de l'IRD, par Luc Decker, administrateur des données à l'IRD
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
L'émergence du phénomène du web 2.0, des nouveaux outils d'accès à l'information qu'il propose, des nouveaux types de contenus qu'il met en ligne, et des nouveaux protocoles de filtrage et de validation qu'il abolit ou transcende, interroge les pratiques actuelles de formation à l'IST. Parmi d'autres, le phénomène des blogs d'experts gagne le domaine de l'enseignement en général et de l'université en particulier. Des institutions, des composantes, des formations, des services, des communautés scientifiques, mais aussi des enseignants-chercheurs ouvrent de nouveaux espaces de paroles, mettant en œuvre de nouvelles dynamique de collaboration. Ces nouveaux collaboratoires, sous l'angle des rapports entre science et société, permettent d'articuler différemment un grand nombre de pratiques scientifiques en terme de diffusion, de collecte, de recherche, de publication et d'enseignement. Le domaine de la culture informationnelle et de la maîtrise de l'information en particulier, et celui des sciences de l'information et de la communication en général est à la fois un terrain et un révélateur particulièrement pertinent pour analyser les problématiques sous-jacentes de ces nouveaux collaboratoires, au rang desquelles la construction d'une culture du préprint, la mise à disposition d'indicateurs adaptés, la facilitation du déploiement rapide d'expertises dispersées et la reconfiguration des champs.
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
Foire aux questions - FAQ sur les donnnées de la recherche
Fiche créée en septembre 2015 et révisée en octobre 2016
Qu'est-ce que l'ouverture des données (Open Data) ?
Quelles données préserver ?
Où déposer mes données ?
Comment définir les conditions de réutilisation de mes données ?
Et si mes données sont déjà déposées dans les réseaux sociaux (ResearchGate, Academia...) ?
Qu'est-ce qu'un jeu de données ?
Où rechercher des jeux de données ?
Qu'est-ce qu'un DOI ?
Comment citer un jeu de données ?
Qu'est-ce qu'un PGD ?
A quelles questions répond un PGD ?
De quels outils je dispose pour rédiger un PGD ?
Avec qui interagir pour élaborer un PGD ?
L'éthique du partage et moi ?
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Fiche créée en septembre 2015 et révisée en octobre 2016
Pour les universités et instituts du Sud, les bouleversements de l'IST ouvrent des perspectives nouvelles : la littérature scientifique devient plus accessible et la production scientifique de l’organisme peut être diffusée plus facilement, grâce aux mouvements du Libre Accès et de la Science Ouverte, et aux développement de technologies de l’information basées sur des logiciels libres.
Marc Goovaerts met en application ce nouveau paradigme dans différents projets de coopération Nord-Sud-Sud, en portant une attention particulière à l’interopérabilité, aux métadonnées et aux identifiants uniques.
Marc Goovaerts, bibliothécaire à l’Université de Hasselt (Belgique), coordonne depuis 20 ans divers projets de coopération financés par le programme IODE de l’UNESCO (https://www.iode.org/) et VLIR-UOS (https://www.vliruos.be/en) avec des bibliothèques et instituts du Sud. Deux récents projets de coopération avec 5 universités cubaines serviront d’exemple.
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheAgropolis International
Une fiche pratique dédiée aux données de la recherche dans le cadre de l'Open Access (créée en septembre 2015 et révisée en octobre 2016) :
• enjeux,
• typologie,
• cycle de vie de la donnée,
• les étapes de gestion des données de la recherche
• le plan de gestion (PGD ou Data Management Plan - DMP)
• exemples de modèles de plans de gestion de données
• la valorisation des données de la recherche
• la (ré)utilisation des données et le droit d'auteurs (licences).
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révisée en octobre 2016
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
Analyser les statistiques de consultation de la documentation en vue d'évaluer les besoins des chercheurs
Etre un acteur de l'indexation des données : "médiateur de la valorisation des données" (Catherine Morel-Pair)
Constituer une cellule d'appui pour la gestion des données de la recherche : l'élaboration d'un Digital Management Plan (DMP) ou Plan de Gestion des Données (PGD)
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...Agropolis International
La politique de libre accès de l'UE
Le projet pilote de libre accès aux données de la recherche (Open Research Data)
Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révision octobre 2016
Présentation au Pôle Science de l’IRD , le 13 septembre 2018 du projet d'entrepôt de données ouvertes de l'IRD, du contexte de l'Open Science en France et en Europe et des avantages à disposer d'un entrepôt de données pour l'IRD et ses partenaires.
Cette introduction au Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis définit rapidement ce qui fait partie des données de la recherche publique et le cadre juridique qui leur est appliqué.
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Alberto González-Talaván
Cette présentation établis les principes fondamentales pour la publication des données provenant des échantillons. Elle était présenté pour la première fois dans la formation GB22 pour des points nodaux du GBIF.
Diapos produites et présentés par L. Smirnova (Royal Museum for Central Africa - Belgium).
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
Ces dernières années ont vu se multiplier des plateformes d’échanges et de gestion d’information géolocalisées, prenant des formes diverses, qu’il s’agisse de catalogues de données géoréferencées ou de plateformes web SIG, souvent enrichies d’applications métiers. Beaucoup d’inventivité, d’innovation et donc d’énergie ont été mises au service de développements.
Ce séminaire se propose à partir de différentes expériences de revenir sur les usages de ces plateformes, en mettant en perspective l’ensemble du dispositif (les caractéristiques de la solution et les besoins initialement affichés, les usagers ciblés), et les utilisations effectives a posteriori, mais aussi en revenant sur les éventuelles conséquences de ces plateformes sur les pratiques professionnelles, sur les évolutions envisagées et à envisager tant pour les usages de type « consultation » que pour les usages de type « contribution ».
Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scient...ABES
Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scientifique et technique", Francis André, directeur adjoint de la direction de l'IST du CNRS (DIST), dans le cadre des Journées Abes 2011
High-level Meeting & Workshop on Environmental and Scientific Open Data for Sustainable Development Goals in Developing Countries. Madagascar, 4-6 December 2017
Entreposer des données : pourquoi, domment. Introduction généraleà la présentation de DataSuds, l'entrepôt de données de l'IRD, par Luc Decker, administrateur des données à l'IRD
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
L'émergence du phénomène du web 2.0, des nouveaux outils d'accès à l'information qu'il propose, des nouveaux types de contenus qu'il met en ligne, et des nouveaux protocoles de filtrage et de validation qu'il abolit ou transcende, interroge les pratiques actuelles de formation à l'IST. Parmi d'autres, le phénomène des blogs d'experts gagne le domaine de l'enseignement en général et de l'université en particulier. Des institutions, des composantes, des formations, des services, des communautés scientifiques, mais aussi des enseignants-chercheurs ouvrent de nouveaux espaces de paroles, mettant en œuvre de nouvelles dynamique de collaboration. Ces nouveaux collaboratoires, sous l'angle des rapports entre science et société, permettent d'articuler différemment un grand nombre de pratiques scientifiques en terme de diffusion, de collecte, de recherche, de publication et d'enseignement. Le domaine de la culture informationnelle et de la maîtrise de l'information en particulier, et celui des sciences de l'information et de la communication en général est à la fois un terrain et un révélateur particulièrement pertinent pour analyser les problématiques sous-jacentes de ces nouveaux collaboratoires, au rang desquelles la construction d'une culture du préprint, la mise à disposition d'indicateurs adaptés, la facilitation du déploiement rapide d'expertises dispersées et la reconfiguration des champs.
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
Foire aux questions - FAQ sur les donnnées de la recherche
Fiche créée en septembre 2015 et révisée en octobre 2016
Qu'est-ce que l'ouverture des données (Open Data) ?
Quelles données préserver ?
Où déposer mes données ?
Comment définir les conditions de réutilisation de mes données ?
Et si mes données sont déjà déposées dans les réseaux sociaux (ResearchGate, Academia...) ?
Qu'est-ce qu'un jeu de données ?
Où rechercher des jeux de données ?
Qu'est-ce qu'un DOI ?
Comment citer un jeu de données ?
Qu'est-ce qu'un PGD ?
A quelles questions répond un PGD ?
De quels outils je dispose pour rédiger un PGD ?
Avec qui interagir pour élaborer un PGD ?
L'éthique du partage et moi ?
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Fiche créée en septembre 2015 et révisée en octobre 2016
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Cairn.info
La réflexion sur les enjeux épistémologiques, culturels, politiques et économiques de l’exposition, la valorisation et la réutilisation des données de la recherche mobilise actuellement une variété d’acteurs du milieu de la recherche : institutions, chercheurs, éditeurs scientifiques, documentalistes / bibliothécaires, etc. A partir d’une série d’entretiens semi-directifs menés auprès de chercheurs en sciences humaines et sociales (SHS), nous avons essayer de comprendre la façon spécifique dont cette question plurielle se pose dans ces disciplines : Qu’est-ce qu’une donnée de la recherche en SHS ? Quelles données partager et dans quel but ? Quelles conditions et quels freins à l’accès et au partage dans ces domaines ? Comment les chercheurs souhaitent-ils valoriser ces données ? Cette étude exploratoire a donné lieu à un présentation du groupe "Big data / Smart data" du GFII.
Cahier des charges pour la création d'un data warehouse medicalVincent H. Hupertan
The creation of a data warehouse for biomedical research is the major step to obtain reliable data for the clinical research, publications, retrospective or prospective evaluation of the activity. Without replacing the existing information system, they must allow optimize clinical research.
Série de webinaires sur le gouvernement ouvert du Canada
L'équipe du #GouvOuvert est de retour avec un nouveau webinaire le 28 novembre! Nous allons discuter au sujet des #coulisses des #donnéesouvertes au avec la professeure
@TraceyLauriault
de
@Carleton_U
et
@JaimieBoyd
. Inscrivez-vous maintenant: http://ow.ly/UQvu50xabIb
"Une politique à l'écoute des chercheurs : entre mandat de dépôt sur mesure et accompagnement sur mesure" (retour d'expérience de l'Université Toulouse - Jean Jaurès), journée d'étude « Services aux chercheurs : quelle politique pour les archives ouvertes institutionnelles ? »
URFIST Bordeaux, SCD Pau, 21 avril 2015
Similaire à Du dépôt au partage de données (20)
Découvrir un blog de science sur la base d’une recommandation. Le lire parce qu’on apprécie son style. Engager la conversation avec son auteur. Se familiariser avec un regard scientifique sur le monde. Incarner à son tour des savoirs et des attitudes. Voici où peut mener une longue fréquentation des blogs de science, que l’on tentera ensemble de comprendre et d’analyser.
1. Du dépôt au partage de
données
Antoine Blanchard, consultant en information
scientifique chez Deuxième labo
antoine@deuxieme-labo.fr
Journée Thématique du GdR 2647 STIC-Santé CNRS/Inserm
“Avantages et limites d’un dépôt national de données biologiques”
16 mars 2011
Campus des Cordeliers, Paris
3. Pour faire avancer la
science
• trop de résultats ne sont pas publiés
• ou ils sont sous-utilisés (“hypopublication”)
“the current scientific literature
(…) contains huge amounts of
undiscovered science”
http://figshare.com Peter Murray-Rust (2007), “Data-Driven Science
- A Scientist's View”, http://www.sis.pitt.edu/
~repwkshop/papers/murray.html
4. Une responsabilité
déontologique
• Committee on Responsibilities of
Authorship in the Biological Sciences,
National Research Council. Sharing
Publication-Related Data and Materials:
Responsibilities of Authorship in the Life
Sciences (National Academy of Sciences,
2003)
8. Toronto International Data Release Workshop Authors (2009),
“Prepublication data sharing”, Nature 461, 168-170
9. Quand déposer des
données ?
• … : lors de la publication d’un article
• 1992 (États-Unis) : dans les 6 mois
• 1996 (Human Genome Project) : dans les
24 h
• ≠ embargo de 18 mois pour les données
des brevets !
11. Le “vol” de données
• “To date, many papers have been published by third parties
reporting research findings enabled by data sets released
before publication. The experiences shared in Toronto
suggest that these have rarely affected subsequent
publications authored by the data producers.”
• embargo : cf. Principes des Bermudes (Human Genome
Project), 1996
• “the Toronto meeting participants recognized that this is an
ongoing concern that is best addressed by fostering a
scientific culture that encourages transparent and explicit
cooperation on the part of data producers, data analysts,
reviewers and journal editors”
Toronto International Data Release Workshop Authors (2009),
“Prepublication data sharing”, Nature 461: 168-170
12. Les licences fermées
• En 1998, Celera annonce que les résultats
de son initiative de séquençage seront “en
accès libre”… mais est-ce suffisant ?
• “any restrictions on use should be strongly
resisted and we endorse explicit
encouragement of open sharing, for
example under the newly available CC0
public domain waiver of Creative
Commons” Paul N. Schofield et al. (2009), “Post-publication
sharing of data and tools”, Nature 461: 171-173
13. Les bases de données
laissées en friche
• 1330 bases de données en biologie
moléculaire (Nucleic Acids Research
online Database Collection)
• il est plus facile d’obtenir un
financement pour créer une nouvelle
base de données que pour la maintenir
en fonctionnement
• quand la taille des bases de données
génomiques double (tous les 18 mois), Merali Z. & J. Giles (2005), “Databases in peril”,
Nature, 435: 1010-1
les coûts de maintenance augmentent
de 10%
OECD Megascience Forum Working Group on
Biological Informatics (1999), Final Report, http://
www.gbif.org
14. La difficulté à trouver
l’information
• Un problème connu, cf. Altschul,sequences
(1994), “Issues in searching molecular
S.F. et al.
databases”, Nature Genetics 6(2): 119-129
• mais accentué dans les bases de
données brevets où les inventions
sont décrites génériquement
Exemple : “A nucleic acid sequence at least
90% identical to the nucleotide sequence
of any of the polynucleotides of (a)–(n)…”
20. Ne pas se reposer sur
les “supplementary data”
• une pratique courante…
• …alors que ces données ne sont pas
standardisées, pas cherchables, et pas
pérennes (17% des SD n’étaient plus en
ligne 1 an après — surtout celles stockées
ailleurs que sur le site de la revue).
N. Anderson et al. (2006), “On the persistence of
supplementary resources in biomedical
publications”, BMC Bioinformatics 7: 260