Cette présentation décrit le scénario changeant de la publication des données sur la biodiversité, tel qu'il est en 2015. Elle était présenté pour la première fois dans la formation GB22 pour des points nodaux du GBIF.
Diapos produites et présentés par L. Russell (Vertnet), traduites en Français par M. Raymond (Secrétariat GBIF).
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheAgropolis International
Une fiche pratique dédiée aux données de la recherche dans le cadre de l'Open Access (créée en septembre 2015 et révisée en octobre 2016) :
• enjeux,
• typologie,
• cycle de vie de la donnée,
• les étapes de gestion des données de la recherche
• le plan de gestion (PGD ou Data Management Plan - DMP)
• exemples de modèles de plans de gestion de données
• la valorisation des données de la recherche
• la (ré)utilisation des données et le droit d'auteurs (licences).
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révisée en octobre 2016
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...Agropolis International
La politique de libre accès de l'UE
Le projet pilote de libre accès aux données de la recherche (Open Research Data)
Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révision octobre 2016
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
Foire aux questions - FAQ sur les donnnées de la recherche
Fiche créée en septembre 2015 et révisée en octobre 2016
Qu'est-ce que l'ouverture des données (Open Data) ?
Quelles données préserver ?
Où déposer mes données ?
Comment définir les conditions de réutilisation de mes données ?
Et si mes données sont déjà déposées dans les réseaux sociaux (ResearchGate, Academia...) ?
Qu'est-ce qu'un jeu de données ?
Où rechercher des jeux de données ?
Qu'est-ce qu'un DOI ?
Comment citer un jeu de données ?
Qu'est-ce qu'un PGD ?
A quelles questions répond un PGD ?
De quels outils je dispose pour rédiger un PGD ?
Avec qui interagir pour élaborer un PGD ?
L'éthique du partage et moi ?
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Fiche créée en septembre 2015 et révisée en octobre 2016
Cette introduction au Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis définit rapidement ce qui fait partie des données de la recherche publique et le cadre juridique qui leur est appliqué.
Un PGD, qu'est-ce que c'est ? Pour quoi faire ? Comment ?
Un PGD sert surtout à se poser les bonnes questions et à adopter des méthodes rigoureuses de gestion pour documenter, stocker, responsabiliser, archiver, informer, et finalement partager les données scientifiques.
Le PGD est de plus en plus souvent recommandé ou même exigé par les financeurs, les éditeurs, les organismes scientifiques.
L’exposé présente les grands principes et principales étapes d’un PGD et les aides à la rédaction.
Cette intervention d'Hanka Hensens a eu lieu le 20 septembre 2018, dans le cadre des JeudIST de l'IRD Occitanie.
Hanka Hensens, responsable du Centre de Documentation IRD Occitanie, a animé depuis 2017 plusieurs ateliers sur les Plans de Gestion de Données en direction des scientifiques d’Agropolis. Elle forme étudiants et chercheurs depuis près de 20 ans à la recherche et à la gestion de l’information scientifique.
Un plan de gestion de données (PGD ou DMP pour Data Management Plan) est un document qui spécifie quelles données sont collectées ou générées, et comment elles seront gérées, partagées et préservées pendant et après un projet. Le support de ce webinaire donne les clés pour pouvoir amorcer la rédaction d’un PGD en toute sérénité en présentant les enjeux et objectifs d’un PGD, son contenu et un outil d’aide à la rédaction : DMP OPIDOR.
Claire SOWINSKI est responsable du service formation-DoRANum de l’Inist-CNRS (Institut de l’Information Scientifique et Technique).
La Science Ouverte est à l’ordre du jour, en France et en Europe.
Après les publications, les données de la recherche sont sous le feu des projecteurs.
Ce gisement de connaissances, trop peu connu et exploité, est même souvent voué à l’oubli et à la destruction, faute de signalisation et de sauvegarde pérenne.
L’IRD, plus encore que les autres organismes de recherche, se doit de proposer une politique, des méthodologies et des outils de préservation et de partage des données recueillies dans, par et pour les pays du Sud par l’ensemble de ses équipes de recherche.
Lors de cette conférence, Pascal Aventurier, responsable du Service Information Scientifique et Technique (IST), et Jean-Christophe Desconnets, Directeur de la Mission Infrastructure et Données Numériques (MIDN), présenteront le projet d’entrepôt de données de l’IRD qui ouvrira mi 2019.
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheAgropolis International
Une fiche pratique dédiée aux données de la recherche dans le cadre de l'Open Access (créée en septembre 2015 et révisée en octobre 2016) :
• enjeux,
• typologie,
• cycle de vie de la donnée,
• les étapes de gestion des données de la recherche
• le plan de gestion (PGD ou Data Management Plan - DMP)
• exemples de modèles de plans de gestion de données
• la valorisation des données de la recherche
• la (ré)utilisation des données et le droit d'auteurs (licences).
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révisée en octobre 2016
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...Agropolis International
La politique de libre accès de l'UE
Le projet pilote de libre accès aux données de la recherche (Open Research Data)
Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Date : 09/2015, révision octobre 2016
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
Foire aux questions - FAQ sur les donnnées de la recherche
Fiche créée en septembre 2015 et révisée en octobre 2016
Qu'est-ce que l'ouverture des données (Open Data) ?
Quelles données préserver ?
Où déposer mes données ?
Comment définir les conditions de réutilisation de mes données ?
Et si mes données sont déjà déposées dans les réseaux sociaux (ResearchGate, Academia...) ?
Qu'est-ce qu'un jeu de données ?
Où rechercher des jeux de données ?
Qu'est-ce qu'un DOI ?
Comment citer un jeu de données ?
Qu'est-ce qu'un PGD ?
A quelles questions répond un PGD ?
De quels outils je dispose pour rédiger un PGD ?
Avec qui interagir pour élaborer un PGD ?
L'éthique du partage et moi ?
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Fiche créée en septembre 2015 et révisée en octobre 2016
Cette introduction au Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis définit rapidement ce qui fait partie des données de la recherche publique et le cadre juridique qui leur est appliqué.
Un PGD, qu'est-ce que c'est ? Pour quoi faire ? Comment ?
Un PGD sert surtout à se poser les bonnes questions et à adopter des méthodes rigoureuses de gestion pour documenter, stocker, responsabiliser, archiver, informer, et finalement partager les données scientifiques.
Le PGD est de plus en plus souvent recommandé ou même exigé par les financeurs, les éditeurs, les organismes scientifiques.
L’exposé présente les grands principes et principales étapes d’un PGD et les aides à la rédaction.
Cette intervention d'Hanka Hensens a eu lieu le 20 septembre 2018, dans le cadre des JeudIST de l'IRD Occitanie.
Hanka Hensens, responsable du Centre de Documentation IRD Occitanie, a animé depuis 2017 plusieurs ateliers sur les Plans de Gestion de Données en direction des scientifiques d’Agropolis. Elle forme étudiants et chercheurs depuis près de 20 ans à la recherche et à la gestion de l’information scientifique.
Un plan de gestion de données (PGD ou DMP pour Data Management Plan) est un document qui spécifie quelles données sont collectées ou générées, et comment elles seront gérées, partagées et préservées pendant et après un projet. Le support de ce webinaire donne les clés pour pouvoir amorcer la rédaction d’un PGD en toute sérénité en présentant les enjeux et objectifs d’un PGD, son contenu et un outil d’aide à la rédaction : DMP OPIDOR.
Claire SOWINSKI est responsable du service formation-DoRANum de l’Inist-CNRS (Institut de l’Information Scientifique et Technique).
La Science Ouverte est à l’ordre du jour, en France et en Europe.
Après les publications, les données de la recherche sont sous le feu des projecteurs.
Ce gisement de connaissances, trop peu connu et exploité, est même souvent voué à l’oubli et à la destruction, faute de signalisation et de sauvegarde pérenne.
L’IRD, plus encore que les autres organismes de recherche, se doit de proposer une politique, des méthodologies et des outils de préservation et de partage des données recueillies dans, par et pour les pays du Sud par l’ensemble de ses équipes de recherche.
Lors de cette conférence, Pascal Aventurier, responsable du Service Information Scientifique et Technique (IST), et Jean-Christophe Desconnets, Directeur de la Mission Infrastructure et Données Numériques (MIDN), présenteront le projet d’entrepôt de données de l’IRD qui ouvrira mi 2019.
Présentaion des outils et services documentaires offerts par le Service IST de la Délégation Régionale Occitanie de l'IRD (Montpellier), en présentiel et à distance : sites web, adresses mails, publications et ressources sur abonnement, assistance, recommandations et formations,...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...Lesticetlart Invisu
Intervention de Rémi Gaillard, responsable du pôle « Politique documentaire et valorisation des collections » de la bibliothèque de l'Université Pierre-et-Marie-Curie, aux Lundis numériques de l'INHA (14 septembre 2015).
Ce webinaire présentera COVID-END aux participants et abordera les manières dont les ressources de COVID-END peuvent vous soutenir dans votre réponse à la COVID-19. Contenant des astuces, des outils et un guide de sources de données probantes utiles tant aux chercheurs qu’aux décideurs, COVID-END peut offrir quelque chose à chacun.
Présentation au Pôle Science de l’IRD , le 13 septembre 2018 du projet d'entrepôt de données ouvertes de l'IRD, du contexte de l'Open Science en France et en Europe et des avantages à disposer d'un entrepôt de données pour l'IRD et ses partenaires.
Cette présentation définit rapidement le Plan de gestion de données dans le cadre du Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis.
ResearcherID, ORCID, IdHAL : enjeux et perspectives des identifiants chercheurspascal aventurier
Researcher ID, ORCID, IdHAL : enjeux et perspectives des identifiants chercheurs. Cours URFIST PARIS
Comment citer ce document :
Aventurier, P. (2016). Researcher ID, ORCID, IdHAL : enjeux et perspectives des identifiants chercheurs. Presented at cours Urfist, Paris (2016-03-18).
https://hal.archives-ouvertes.fr/cel-01314562
L'utilisation du réseau scientifique social ResearchGate pour le dépôt de publications scientifiques par les chercheurs d'un organisme de recherche français comme le Cirad.
Support de cours du Séminaire "Maîtriser l'Information scientifique et Technique en Recherche" de Janvier 2016 (2 jours) à l'intention des doctorants en Sciences expérimentales (biologie, physique, chimie, sciences de l'ingénieur, mathématiques, etc ...) de l'Université François Rabelais de Tours.
La publication savante : pourquoi publier, le libre accès, les revues prédatrices, les indicateurs bibliométriques, où publier, les profiles de chercheur.
Accompagnement actif des chercheurs à la gestion et au partage des données de...Lesticetlart Invisu
Accompagnement actif des chercheurs à la gestion et au partage des données de la recherche
Thierry Beguiristain, OTELo
M-Christine Jacquemot-Perbal, Inist-CNRS
Optimiser recherche d'information scientifique dans le domaine biomedical - P...Patricia Volland-Nail
Formation dispensée à l'URFIST de Rennes en Décembre 2011. Intitulé de la formation : "Optimiser sa recherche d'information dans le domaine biomédical"
Articles que j\'ai écrit pour L\'Express de Madagascarsperrier7
Rédaction d\'un éditorial intitulé "Un Vazaha à Tana" : les déboires d\'un petit français perdu en terre malgache.
Enquêtes de société : "L\'adoption à Madagascar devient un marché lucratif", "Les intérêts français à Madagascar", "Madagascar intéresse la Chine"...
Reportages : "Un Chinois dans la vigne", "A Sainte-Marie sur les traces des pirates imaginaires", "Sainte-Marie, un paradis délaissé", "Andringitra, trop beau pour attirer les investisseurs étrangers"
Portrait de Laurence Ink, écrivain
Présentaion des outils et services documentaires offerts par le Service IST de la Délégation Régionale Occitanie de l'IRD (Montpellier), en présentiel et à distance : sites web, adresses mails, publications et ressources sur abonnement, assistance, recommandations et formations,...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...Lesticetlart Invisu
Intervention de Rémi Gaillard, responsable du pôle « Politique documentaire et valorisation des collections » de la bibliothèque de l'Université Pierre-et-Marie-Curie, aux Lundis numériques de l'INHA (14 septembre 2015).
Ce webinaire présentera COVID-END aux participants et abordera les manières dont les ressources de COVID-END peuvent vous soutenir dans votre réponse à la COVID-19. Contenant des astuces, des outils et un guide de sources de données probantes utiles tant aux chercheurs qu’aux décideurs, COVID-END peut offrir quelque chose à chacun.
Présentation au Pôle Science de l’IRD , le 13 septembre 2018 du projet d'entrepôt de données ouvertes de l'IRD, du contexte de l'Open Science en France et en Europe et des avantages à disposer d'un entrepôt de données pour l'IRD et ses partenaires.
Cette présentation définit rapidement le Plan de gestion de données dans le cadre du Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis.
ResearcherID, ORCID, IdHAL : enjeux et perspectives des identifiants chercheurspascal aventurier
Researcher ID, ORCID, IdHAL : enjeux et perspectives des identifiants chercheurs. Cours URFIST PARIS
Comment citer ce document :
Aventurier, P. (2016). Researcher ID, ORCID, IdHAL : enjeux et perspectives des identifiants chercheurs. Presented at cours Urfist, Paris (2016-03-18).
https://hal.archives-ouvertes.fr/cel-01314562
L'utilisation du réseau scientifique social ResearchGate pour le dépôt de publications scientifiques par les chercheurs d'un organisme de recherche français comme le Cirad.
Support de cours du Séminaire "Maîtriser l'Information scientifique et Technique en Recherche" de Janvier 2016 (2 jours) à l'intention des doctorants en Sciences expérimentales (biologie, physique, chimie, sciences de l'ingénieur, mathématiques, etc ...) de l'Université François Rabelais de Tours.
La publication savante : pourquoi publier, le libre accès, les revues prédatrices, les indicateurs bibliométriques, où publier, les profiles de chercheur.
Accompagnement actif des chercheurs à la gestion et au partage des données de...Lesticetlart Invisu
Accompagnement actif des chercheurs à la gestion et au partage des données de la recherche
Thierry Beguiristain, OTELo
M-Christine Jacquemot-Perbal, Inist-CNRS
Optimiser recherche d'information scientifique dans le domaine biomedical - P...Patricia Volland-Nail
Formation dispensée à l'URFIST de Rennes en Décembre 2011. Intitulé de la formation : "Optimiser sa recherche d'information dans le domaine biomédical"
Articles que j\'ai écrit pour L\'Express de Madagascarsperrier7
Rédaction d\'un éditorial intitulé "Un Vazaha à Tana" : les déboires d\'un petit français perdu en terre malgache.
Enquêtes de société : "L\'adoption à Madagascar devient un marché lucratif", "Les intérêts français à Madagascar", "Madagascar intéresse la Chine"...
Reportages : "Un Chinois dans la vigne", "A Sainte-Marie sur les traces des pirates imaginaires", "Sainte-Marie, un paradis délaissé", "Andringitra, trop beau pour attirer les investisseurs étrangers"
Portrait de Laurence Ink, écrivain
planning des examens DELF DELF PRO DALF
au CEFI BRON
http://www.cefi-formation.fr/?rub=formations&pagination=Dipl%F4mes%20Langues%20(DELF,%20DELF%20PRO%20DALF,%20DILF)
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2022)Alain Marois
Support de formation pour la séance Veille du cycle de formations aux doctorants SHS du site Université de Lyon. Juin 2022. 3h (des supports de TD complètent)
BID CE Workshop 1 - session 11 - Basic concepts about biodiversity data qualityAlberto González-Talaván
Presentation and discussion about topics such licenses, metadata, mandatory fields, how an IPT instance can host datasets for different publishing institutions, etc.
-----
Présentation et discussion autour de sujets tels que les licences, métadonnées, champs obligatoires, l’hébergement de jeux de données de différentes institutions sur la même installation IPT, etc
Gestion des données scientifiques en imagerie in vivo – Journée scientifique organisée par PIV le 7 décembre 2017 au PARCC-HEGP
Marie-Christine Jacquemot
OPIDOR
L'objectif de cette présentation est de proposer des pistes pour rendre un projet de bioinformatique reproductible.
Durée : 30 + 10 minutes de questions
Lieu : Roscoff, France
Construire des outils pour la gestion des données de la recherche dans une co...Lesticetlart Invisu
Construire des outils pour la gestion des données de la recherche dans une communauté d’universités Aurore Cartier, Magalie Moysan et Nathalie Reymonet [Université Paris-Descartes, Université Paris-Diderot, Sorbonne Paris Cité]
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
Ces dernières années ont vu se multiplier des plateformes d’échanges et de gestion d’information géolocalisées, prenant des formes diverses, qu’il s’agisse de catalogues de données géoréferencées ou de plateformes web SIG, souvent enrichies d’applications métiers. Beaucoup d’inventivité, d’innovation et donc d’énergie ont été mises au service de développements.
Ce séminaire se propose à partir de différentes expériences de revenir sur les usages de ces plateformes, en mettant en perspective l’ensemble du dispositif (les caractéristiques de la solution et les besoins initialement affichés, les usagers ciblés), et les utilisations effectives a posteriori, mais aussi en revenant sur les éventuelles conséquences de ces plateformes sur les pratiques professionnelles, sur les évolutions envisagées et à envisager tant pour les usages de type « consultation » que pour les usages de type « contribution ».
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
Support de l'intervention effectuée au cours de la séance dédiée aux lacs de données du séminaire "Nouveaux paradigmes de l'Archive" organisée par le DICEN-CNAM et les Archives nationales
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
Analyser les statistiques de consultation de la documentation en vue d'évaluer les besoins des chercheurs
Etre un acteur de l'indexation des données : "médiateur de la valorisation des données" (Catherine Morel-Pair)
Constituer une cellule d'appui pour la gestion des données de la recherche : l'élaboration d'un Digital Management Plan (DMP) ou Plan de Gestion des Données (PGD)
Linked open data pour la consommation des informationsEric Toguem
Dans un contexte où le volume de données produit est de plus en plus grand, et les données sont peu utilisés, pourtant pouvant être mise en valeur, un nouveau vent souflle: Le linked open data
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
Le Center for Data Science de l’université Paris Saclay met en oeuvre une solution opérationnelle depuis 2016 afin de référencer toutes les sources de données, fichiers ou d’API au sein de l’université. Nous verrons quelles opportunités apportent le respect des standards et bonnes pratiques pour faciliter la réutilisation et la valorisation des données de la recherche.
Version ouverte à tous : http://linkedwiki.com
Version de l’université Paris Saclay : https://io.datascience-paris-saclay.fr
Similaire à Séance 02, Le paysage de la publication des données en 2015, dans la formation GB22 pour points nodaux du GBIF (20)
This presentation summarises the content of the main section of the BID workshop on biodiversity data mobilization. It also describes the contents of the third section, and presents the evaluation mechanism for the workshop
---
Cette présentation résume le contenu de la section principale de l'atelier BID sur la mobilisation des données sur la biodiversité. Il décrit également le contenu de la troisième section et présente le mécanisme d'évaluation de l'atelier.
Bid ce workshop 1 Activity V.01 - Planning a biodiversity data mobilization...Alberto González-Talaván
This presentation supports a theoretical presentation and discussion around the key project planning stages for successfully implementing a digitization project and how to create a viable workflow. We will cover topics such as: What things should be formally structured just at the beginning? What can be left to ‘wait and see’?; Who needs to know what and when?
---
Cette présentation soutiens une présentation théorique et une discussion autour des étapes-clefs de la planification réussie d’un projet de numérisation et de la création d’un workflow fonctionnel. Nous aborderons des sujets tels que : Qu’est-ce qui doit être structuré de façon formelle dès le début ? ; Qu’est-ce qui peut être mis en attente et repris plus tard ? ; Qui doit savoir quoi et quand ?
Presentation by Mélianie Raymond where she explains the main components that the GBIF Secretariat has put into place to support the community associated to the Biodiversity Information for Development (BID) Programme.
Bid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and IntroductionAlberto González-Talaván
This presentation is used during the welcome and introduction video for the online version of the second section of the BID workshop.
---
Cette présentation est utilisée pour une vidéo de bienvenue et introduction à la version en ligne de la section 2 du première atelier de formation BID.
Presentation for a practical demonstration and discussion covering advanced IPT features and publication of a complex, sampling-event dataset. The emphasis will be put on the use of extensions and the core/extension relationship, but we will cover other topics such as database sources, row filtering / translation if time allows
-----
Présentation pour une démonstration pratique et discussion sur les fonctionnalités avancées de l’IPT et la publication d’un jeu de données complexe (données d’échantillonnage). L’utilisation des extensions et des relations coeur de standard/extensions sera particulièrement mise en avant, mais d’autres sujets seront également couverts comme la liaison de l’IPT à une base de données, le filtrage des lignes et la traduction en fonction du temps restant.
Presentation for a practical/theoretical session focused on easy to use tools to validate and clean datasets in three main categories: nomenclatural, format, and geographical.
---
Présentation pour une session pratique/théorique centrée sur des outils faciles d’utilisation pour valider et nettoyer les jeux de données dans trois catégories : nomenclature, format, et information géographique.
Presentation supporting a demo session focused on digitization tools and software, including a short demonstration of one example tool and discussions about other options available (e.g. citizen science transcription projects, sampling event data)
---
Présentation pour une session de démonstration et d’échanges centrée sur les outils et logiciels de numérisation, comprenant une courte démonstration d’un des outils et des discussions sur les autres options disponibles (par exemple les projets de transcription d’étiquettes grâce aux sciences participatives, les données d’échantillonnage…)
Presentation supporting a practical demonstration and discussion covering the basics of publishing using the IPT tool (principles, user interface, workflow, metadata, dataset visibility, ...) through the publication of a typical occurrence dataset stored in a spreadsheet file.
-----
Présentation pour une démonstration pratique et discussion sur les étapes de base du processus de publication des données utilisant l’outil IPT (principes, interface utilisateur, workflow, métadonnées, visibilité du jeu de données…) grâce à la publication d’un jeu de données d’occurrence typique sous la forme d’un fichier tableur.
Presentation for a theoretical and practical session focused on best practices and data quality principles in the context of data digitization. Includes a short presentation on data quality and coherence (especially on subjects like georeferencing, dates, names and taxa cross-checking), followed by a group discussion on good practices and a practical exercise using simple spreadsheets.
-----
Présentation pour une session pratique et théorique centrée sur les bonnes pratiques et les principes sur la qualité des données dans le contexte de la numérisation de données. Cette session comprend une courte présentation sur la qualité et la cohérence des données (notamment sur les sujets tels que le géoréférencement, les dates, noms scientifiques et vérification de taxons), suivie d’une discussion de groupe sur les bonnes pratiques et un exercice pratique d’utilisation de tableurs.
Presentation to be used during the last session of the event, where we will review the contents covered by the on-site workshop section, and the participants will have the opportunity to provide feedback via an evaluation session. We will also discuss the follow-up activities during the third workshop section, in particular everything connected with the assessment of the participants and the certification process.
---
Présentation pour la dernière sessiond de l'événement où nous reviendrons sur les thèmes abordés au cours de cette section de l’atelier, et les participants auront l’occasion de partager leur avis via une session d’évaluation. Nous discuterons aussi des activités de la troisième section de l’atelier, en particulier tout ce qui concerne l’auto-évaluation des participants et le processus de certification.
This presentation will be used during a session where we will have the opportunity to review the contents planned for the first BID workshop section and discuss key concepts that we will be using in all modules, in particular about biodiversity digital data management. It will be a theoretical interactive session where students will have the opportunity to contribute with their answers and experiences.
---
Cette présentation sera utilisé pendant une session où nous aurons l’opportunité de passer en revue le contenu de chaque module de la formation et de discuter les concepts-clefs que nous utiliserons dans tous les modules, en particulier ceux traitant de la gestion des données numérisées sur la biodiversité. Il s’agira d’une session interactive et théorique à laquelle les participants auront l’opportunité de contribuer avec leurs réponses et leurs expériences personnelles.
Presentation supporting a practical session to identify which kind of data people are dealing with and useful information to digitize in priority. Includes group discussions and roleplays to familiarize with different kinds of data (collections, observations, sampling-event, taxonomic, possibly pictures) and how to best share the related information.
---
Présentation utilisée dans une session pratique pour identifier les types de données avec lesquelles les participants travaillent, ainsi que les informations utiles à numériser en priorité. Cette session comprend des discussions de groupe et des jeux de rôle afin de se familiariser avec les différents types de données existants (collections, observations, données d’échantillonnage, données taxonomiques, données multimédia…) et de mieux partager les informations correspondantes.
This presentation supports a theoretical presentation and discussion around the key project planning stages for successfully implementing a digitization project and how to create a viable workflow. We will cover topics such as: What things should be formally structured just at the beginning? What can be left to ‘wait and see’?; Who needs to know what and when?
---
Cette présentation soutiens une présentation théorique et une discussion autour des étapes-clefs de la planification réussie d’un projet de numérisation et de la création d’un workflow fonctionnel. Nous aborderons des sujets tels que : Qu’est-ce qui doit être structuré de façon formelle dès le début ? ; Qu’est-ce qui peut être mis en attente et repris plus tard ? ; Qui doit savoir quoi et quand ?
This presentation allows to get familiarized with the main concepts of data cleaning, related tools, and best practices in the curation process. The second part will consist in a theoretical/practical exercise with examples of technical and consistency validation checks
---
Cette présentation permets aux participants de se familiariser avec les concepts principaux du nettoyage de données, les outils associés, et les meilleures pratiques utilisées dans le processus de curation. La seconde partie consistera en un exercice théorique/pratique avec des exemples de validation technique et de vérification de la cohérence.
Presentation for a practical/theoretical session focused on OpenRefine as an easy tool to improve the quality of biodiversity datasets by using the default features, existing web services and regular expressions.
---
Présentation pour une session pratique/théorique centrée sur OpenRefine, un outil facile à prendre en main pour améliorer la qualité des jeux de données sur la biodiversité en utilisant les fonctionnalités de base, les web services existants et les expressions régulières.
This session will include a combination of:
• a formal opening session involving representatives from the EU in Rwanda, the Rwandan government and our local host;
• an explanation of all the practical information that we will need during the course, especially about the use of digital platforms and tools; and
• a review of the outcome of the preparatory activities.
---
Cette session comprendra :
• Une cérémonie d’ouverture officielle avec des représentants de l’Union Européenne au Rwanda, du gouvernement rwandais et de l’institution accueillant l’atelier ;
• Une explication relative à toutes les informations pratiques dont nous aurons besoin durant l’atelier, notamment pour l’utilisation des plateformes et outils numériques ; et
• Un compte-rendu des activités réalisées avant la formation
This presentation summarizes the advancements towards the completing the work described in GBIF Work Programme Update 2016.
It was composed by different members from the GBIF Secretariat. This particular version was shared during the European Nodes Meeting in Lisbon the 19 April 2016.
In 2015 the GBIF Secretariat led a pilot experience on formal certification using Mozilla Open Badges as part of a training event addressed to GBIF nodes representatives. This presentation summarizes the outcome of that experience.
Séance 07. Démonstration de la publication des données d'échantillonnage. For...Alberto González-Talaván
Cette présentation guidera la démonstration sur la publication des données d'échantillonage qui fait partie de la Formation pour points nodaux GBIF à GB22.
Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.
Séance 02, Le paysage de la publication des données en 2015, dans la formation GB22 pour points nodaux du GBIF
1. GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015
Séance 02: Le paysage de la publication
de données en 2015
Laura Russell
2. INDEX
Le « paysage » de la publication des données
La publication des données sur la biodiversité
Les types de données
Les normes de données
La normalisation des données et la qualité des
données
Les méthodes de publication des données
La -promotion de la publication de données
Les cas d'utilisation
3. LE PAYSAGE DE LA PUBLICATION DES DONNÉES
DiGIR / TAPIR
très utilisé
pour publier
des données
sur la
biodiversité
Idée de
publier à base
de fichier
texte simple
et comprimé
présenté à
TDWG
Le GBIF lance
l’ IPT 1,0
Le GBIF
réaménage l’
IPT
Le GBIF lance
l’ IPT 2.0
La publication
des données
est enseigné à
la formation
des nœuds
Le points
nodaux et les
agrégateurs
commencent
à installer et à
utiliser l’ IPT
Les jeux de
données de
type
occurrence et
checklist ainsi
que le
nombre
d’installations
de l’IPT
montrent une
croissance
continue
2008 2008 2009 2010 2011 2011
2012
2011
4. LE PAYSAGE DE LA PUBLICATION DES DONNÉES -
STATISTIQUES
http://www.gbif.org/ipt/stats
No. d’installations de l’IPT enregistrées avec le GBIF
5. LE PAYSAGE DE LA PUBLICATION DES DONNÉES -
STATISTIQUES
No. de jeux de données publiées avec l’IPT
6. LE PAYSAGE DE LA PUBLICATION DES
DONNÉES EN 2015
L'engagement continue du
GBIF à améliorer l'accès
aux données de la
biodiversité
Le raffinement et
l'expansion des normes et
des logiciels de
publication
L'évolution des normes
sociales
La plupart des données sont
encore publiées avec le
« core » simple pour
occurrences
Les portails n’ont pas encore
les fonctionnalités pour
soutenir les données plus
riches
De nombreuses institutions
ont encore besoin d’ être
convaincues de publier des
données sur la biodiversité
http://www.gbif.org/page/82104
7. INDEX
Le « paysage » de la publication des données
La publication des données sur la biodiversité
Les types de données
Les normes de données
La normalisation des données et la qualité des
données
Les méthodes de publication des données
La -promotion de la publication de données
Les cas d'utilisation
8. QU'EST-CE QUE DES DONNÉES DE BIODIVERSITÉ?
Texte numérique ou donnée multimédia détaillant les
faits sur l'instance d’occurrence d'un organisme, à
savoir sur le quoi, où, quand, comment et par qui
de l’occurrence et de l'enregistrement.
9. QU'EST CE LA PUBLICATION DE DONNÉES?
La « publication » consiste à rendre des jeux de données de
la biodiversité accessibles au public et découvrable, sous une
forme standardisée, via un point d'accès, généralement une
adresse Web (URL).
IPT
∞
10. LES TYPES DE DONNÉES SUR LA BIODIVERSITÉ
http://www.gbif.org/publishing-data/summary#datatypes
Checklistes
Occurrences
Metadonnées
11. LES TYPES DE DONNÉES SUR LA BIODIVERSITÉ –
DONNÉES D’ ÉCHANTILLONNAGE
http://www.gbif.org/newsroom/news/sample-based-data
Échantillonnage
12. LES NORMES OU “STANDARDS”
http://www.tdwg.org/standards/
ABCD Access to Biological Collection
Data (2005)
DwC Darwin Core (2009)
AC Audubon Core Multimedia
Resources Metadata Schema (2013)
NCD Natural Collection Descriptions
(Draft)
13. DARWIN CORE
http://rs.tdwg.org/dwc
recordedBy: Une liste (concaténée et séparée) de noms de personnes, groupes ou
organisations responsables de l'enregistrement de l'occurrence originale. Le collecteur
ou observateur primaire, en particulier celui qui applique un identifiant personnel
(RecordNumber), doit être cité en premier. Exemples: « José E. Crespo », « Oliver P.
Pearson | Anita K. Pearson »
14. DARWIN CORE SIMPLE
SIMPLEDWC est une spécification
pour une façon particulière d'utiliser
les termes Darwin Core - de
partager des données sur les
taxons et leurs occurrences avec
une structure simple - et
probablement ce que veux dire
quelqu'un qui suggère de "formater
vos données conformément à la
Darwin Core".
http://rs.tdwg.org/dwc/terms/simple/index.htm
15. LES ARCHIVES DARWIN CORE
Une Archive Darwin Core (DwCA) est la
représentation en texte des données formatées à
Darwin Core.
Une DwCA est un fichier compressé contenant un
minimum de trois fichiers.
http://rs.tdwg.org/dwc/terms/guides/text/index.htm
17. “MAPPING CORES” OU FICHIERS CENTRALES
Taxon Core
La catégorie d'informations relatives aux noms taxonomiques, le nom du taxon, les
usages ou les concepts de taxons. Sortie en Avril 2015, cette version supprime
dcterms:source and dcterms:rights, et ajoute dcterms: licence. 43 termes.
Occurrence Core
La catégorie d'informations relatives aux preuves d’une occurrence dans la nature,
dans une collection ou dans un jeu de données (de spécimens, d’observations etc.)
Sortie en July 2015, cette version supprime les terms dcterms:source, dcterms:rights,
dwc:individualID, dwc:occurrenceDetails,et ajoute dcterms:license,
dwc:organismQuantity, dwc:organismQuantityType, dwc:organismID,
dwc:organismName, dwc:organismScope, dwc:associatedOrganisms,
dwc:organismRemarks, dwc:parentEventID, dwc:sampleSizeValue,
dwc:sampleSizeUnit. 169 termes.
Event
La catégorie des informations relatives à un événement d'échantillonnage. Sortie le 29
May 2015. 95 termes
18. EXTENSIONS
Darwin Core ne fournit pas de termes pour chaque type
de données possible.
• 22 inscrits
• 25 en cours de développement
Exemples
• Audubon Media Description (ou “Audubon Core”)
• Darwin Core Identification History (historique de
l’identification)
• Darwin Core Measurement or Facts (measures ou faits)
http://tools.gbif.org/dwca-validator/extensions.do
19. EXEMPLE SCHÉMA ÉTOILE - OCCURRENCE
Media
Occurrence
Core
Geographica
l
Determination
meta.xml
EML.xml
+
DwC Archive
Occurrence
Germoplas
m
20. EXEMPLE SCHÉMA ÉTOILE - CHECKLISTES
Literature
Taxon Core
Description
Occurrences
meta.xml
EML.xml
+
DwC Archive
Checklist
Vernacular
Distribution
Types
22. NORMALISATION DES DONNÉES
Quelle est la normalisation des données?
Raisons pour normaliser une base de données
Formes normales
http://www.essentialsql.com/get-ready-to-learn-sql-database-normalization-explained-in-simple-english/,
http://databases.about.com/od/specificproducts/a/normalization.htm, http://www.dotnet-tricks.com/Tutorial/sqlserver/756N210512-Database-Normalization-Basics.html
23. LA QUALITÉ DES DONNÉES
Encodages
Outils
Pourquoi travailler
sur l'amélioration
des données?
Importance de la
rétroaction
http://community.gbif.org/pg/pages/view/48546/precourse-activities
24. MÉTHODES DE PUBLICATION DE DONNÉES
la capacité
technique
Capacité de gestion de données
Créer vos propres DwCa
Publier avec des tableurs centre d'hébergement de données
26. MÉTHODES DE PUBLICATION DE DONNÉES –
PREMIER SONDAGE
Sondage: http://etc.ch/dQ68
Résultats: http://directpoll.com/r?XDbzPBd3ixYqg8RE6D9gU3CMFoU9fqOuh9n0P5P6
Quelles des méthodes suivantes avez-vous déjà utilisées pour
publier des données en ligne?
28. MÉTHODES DE PUBLICATION DE DONNÉES –
DEUXIÈME SONDAGE
Sondage: http://etc.ch/re74
Résultats:
http://directpoll.com/r?XDbzPBd3ixYqg8xmOHP25WFCV81TJYwb1aGgrVyX5
Quelles des méthodes suivantes utilisez-vous régulièrement à
publier des données en ligne? (à savoir l'année dernière)
29. INDEX
Le « paysage » de la publication des données
La publication des données sur la biodiversité
Les types de données
Les normes de données
La normalisation des données et la qualité des
données
Les méthodes de publication des données
La promotion de la publication de données
Les cas d'utilisation
30. PROMOTION DE LA PUBLICATION DE DONNÉES
Sujet de discussion lors de la formation de nœuds à
Berlin en 2013.
Elément clé du travail quotidien de gestionnaires de
points nodaux.
31. PROMOTION DE LA PUBLICATION DE DONNÉES
Obstacles
psychologiques
et culturels
1. Manque de connaissance
2. Manque de compréhension
3. Manque de volonté
4. Valeur perçue des données
5. Questions de confidentialité
6. Absence d’autorisation
7. Manque de temps / planning
8. Manque de moyens
9. Manque de fonds
10. Manque d’infrastructures
http://www.gbif.org/publishing-data/benefits, http://www.gbif.org/resource/81196
Obstacles
institutionnels
Obstacles liés aux
ressources
Obstacles pratiques
32. NIVEAUX DE RESTRICTION DE DONNÉES
1. Refus de partager.
2. Refus de partager jusqu'à ce que l'utilisation. prévue des
données soit terminée.
3. Partage payant des données.
4. Partage des données avec des restrictions.
5. Partage libre des données.
33. PROMOTION DE LA PUBLICATION DE DONNÉES -
STRATÉGIES
1. Faciliter l'accès à un soutien financier.
2. Appel à des engagements ou des mandats légaux.
3. Appel à un accès ouvert/principes moraux.
4. Montrer les avantages d'une meilleure gestion des données.
5. Montrer les avantages pour les carrières scientifiques.
6. Pression des pairs
7. Démarrer/soutenir de grands programmes de numérisation.
8. Démarrer/soutenir les efforts de rapatriement des données.
34. PROMOTION DE LA PUBLICATION DE DONNÉES -
DISCUSSIONS
Stratégies
• Commencez petit - seulement les
méta-données
• Promotion du fait qu’avec une
seule publication au GBIF les
données seront ensuite
exposées dans de multiples
réseaux
• Fournir des IPTs hébergés pour
éliminer les barrières technique
• Illustrer des licences avec des
exemples éloquents.
• Promouvoir et organiser des
formations sur les « data
papers »
Défis
• Ne pas voulant publier /
ne pas voulant publier
toutes les données
• Exigences/ capacities
techniques pour utliser
l’IPT
• Licences restrictives des
données
http://community.gbif.org/pg/forum/topic/48616/precourse-activity-promoting-data-publishing/
35. INDEX
Le « paysage » de la publication des données
La publication des données sur la biodiversité
Les types de données
Les normes de données
La normalisation des données et la qualité des
données
Les méthodes de publication des données
La -promotion de la publication de données
Les cas d'utilisation
36. CAS D’UTILISATION - INTRODUCTION
Explorez quatre cas d'utilisation basés sur de pratiques
de publication actuelles
• Littérature
• Données d'observation
• Collections d'histoire naturelle
• Checklistes
Remplir deux exercices
• Définition des stratégies de publication
• Publier des jeux de données
41. GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015
Séance 02: Le paysage de la publication
de données en 2015
Laura Russell
Notes de l'éditeur
Image from Piotr Lewandowski, shared via http://www.freeimages.com/photo/learning-with-pencil-1415671
Data/chart provided by Kyle Braak, GBIF.
Data/chart provided by Kyle Braak, GBIF.
Good and needs improvement
The data publishing area is in continuous evolution and expansion. The standards are refined and expanded, the software is improved and debugged, the social norms evolve. That requires that we all recycle our knowledge periodically.
Despite biodiversity data publication in a standard way is possible for a long time now, most of the data is still published in a very simple way: just the occurrence core, single identifications, few/no connections among objects, simple metadata... Much richness of the original data is still non accessible because of the way data is published. This is one of the main reasons to organize this course.
· The data already published determines (although only to a certain extent) the technical developments in the GBIF network, namely in GBIF.org and its API. Only when a certain amount of data of certain type is published (e.g. through an extension), the priority to enable discovery and retrieval of that information raises in importance. Examples of this is the indexing of occurrences published using the occurrence extension of the taxon core, and the possibility to search and retrieve images from the simple multimedia extension.
Most data still published with simple occurrence core and is missing the known richness of the original data
Without the rich data, portal developers do not have the priority to enhance with features to support rich data
Reused slide from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Modified from Reused slide from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Review of the data types for publishing (http://www.gbif.org/publishing-data/summary#datatypes). This will be the first attempt to cover the instructional objectives 1a, 1b & 1c.
GBIF now deals with four types of biodiversity data:
Occurrences (observations, specimens etc)
Checklists (names)
Metadata (data about data) - http://www.gbif.org/dataset/search?type=METADATA
Occurrences are records that document a 'collection event'—evidence that a particular, named organism was found at a particular time and place. Also known as primary biodiversity data, occurrences document the 'what, where, when, how and by whom' of our exploration of the planet's species. An occurrence record can be based on an observation in the field, vouchered (labeled) specimen in a museum or herbarium, or other evidence.
Checklists are lists of scientific names of organisms grouped into taxonomic hierarchies. They serve two main functions: first, they provide data that help to enrich information about particular species, for example by including them on national checklists, and on lists of invasive or threatened species; and they provide taxonomic 'backbones' around which species information can be organized.
Metadata are structured descriptions of datasets giving essential details such as the geographic and taxonomic scope of the data, methods of collection or observation, contact details and citation requirements. They help to give context to datasets and enable users to assess whether data are fit for use in a particular research project or application.
introduce the need/push for sample-based datasets (introduction of the event core) (http://www.gbif.org/page/82105) - released March 24, 2015
beyond “presence only” data -- more quantitative information used in other areas of scientific discovery and research, particularly ecological monitoring and assessment.
Sample-based data (ecological monitoring and assessment data)
Sample-based data are records from thousands of different kinds of environmental, ecological, and natural resource monitoring and assessment investigations. These events range from one-off surveys to ongoing monitoring and includes activities like freshwater and marine sampling, plant cover and vegetation plots, and citizen science bird counts, among others.
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
This section will cover the instructional objective 2a.
Biodiversity Information Standards (TDWG), also known as the Taxonomic Databases Working Group, is a not for profit scientific and educational association that is affiliated with the International Union of Biological Sciences.
TDWG was formed to establish international collaboration among biological database projects. TDWG promoted the wider and more effective dissemination of information about the World's heritage of biological organisms for the benefit of the world at large. Biodiversity Information Standards (TDWG) now focuses on the development of standards for the exchange of biological/biodiversity data.
Our Mission
Develop, adopt and promote standards and guidelines for the recording and exchange of data about organisms
Promote the use of standards through the most appropriate and effective means and
Act as a forum for discussion through holding meetings and through publications
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
It includes a glossary of terms intended to facilitate the sharing of information about biological diversity by providing reference definitions, examples, and commentaries.
It is primarily based on taxa, their occurrence in nature as documented by observations, specimens, and samples, and related information.
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Flat table
Few restrictions
A data file (occurrence.txt) conforming to the SIMPLEDWC in a CSV format. The first row includes Darwin Core standard term names.
A meta file (meta.xml) in an XML format. It contains technical details to instruct a computer on how to use the data file.
A meta file (eml.xml) in an XML format. It contains explanatory details about the records contained within the data file to instruct a user if the data will be fit for their use.
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Cores updated based on updated
Modified from Standards and sharing complex primary biodiversity data; and what is an extension anyway? ~ Deb Paul ~ Data Sharing, Data Standards, and Demystifying the IPT Workshop – Day 1, Jan. 13, 2015 ~ Gainesville, FL
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Modified from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Database normalization is process used to organize a database into tables and columns. The idea is that a table should be about a specific topic and that only those columns which support that topic are included.
There are three main reasons to normalize a database. The first is to minimize duplicate data, the second is to minimize or avoid data modification issues, and the third is to simplify queries.
To assist in achieving these objectives, some rules for database table organization have been developed. The stages of organization are called normal forms; there are three normal forms most databases adhere to using.
First Normal Form – The information is stored in a relational table and each column contains atomic values, and there are not repeating groups of columns.
Second Normal Form – The table is in first normal form and all the columns depend on the table’s primary key.
Third Normal Form – the table is in second normal form and all of its columns are not transitively dependent on the primary key
There are further norms if there is interest in learning more.
For the purposes of the Star Schema, you’ll find your data adhering to the…
Tweet image - https://twitter.com/Iteration23/status/646085874963337216
GBIF community group in conjunction with TDWG group on Data Quality
Excel is a wonderful tool, but you must understand how Excel works or it can change your data in unexpected ways! Suggest watching --
Encoding
Excel
OpenRefine – Tutorials
See pre-course activities for some recommendations/tutorials
Slide from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
Ways to publish (strengths and weaknesses of each; include stats for numbers of datasets published via each way; how to identify what method was used when viewing datasets on gbif.org). This will cover the instructional objective 2b.
simple spreadsheets
IPT
custom-created DwCA
Slide from 1B Publishing Primary Biodiversity Data by Alberto González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT ~ Gainesville, FL, USA. 13 January 2015
IPT currently under development with future planned updates
Web tools and templates for excel tools were contracted for development in ???? And have not been updated since then.
DiGIR protocol development ceased in 2006
TAPIR protocol last updated in 2010
BioCASE protocol last updated 2015
Online poll
Which of the following methods have you ever used to publish data online (or to help others to do so)?
o DiGIR provider
o TAPIR provider
o BioCASe provider
o IPT
o DwC-A through “DwC-A spreadsheet processor”
o Customized DwC-A through “DwC-A Assistant”
Other custom created DwC-A
o None
There are simple online poll tools that show the progress of the voting as you speak and can be displayed in the screen as people vote. It communicates very well and makes the exercise very dynamic.
Online poll
Which of the following methods do you use REGULARLY to publish data online (i.e. in the last year)
o DiGIR provider
o TAPIR provider
o BioCASE provider
o IPT
o DwC-A via“DwC-A spreadsheet processor”
o Customized DwC-A via“DwC-A Assistant”
Other custom created DwC-A
o None
Which of the following methods do you use regularly to publish data online (or to help others to do so) (i.e. used at least once in the last year)
There are simple online poll tools that show the progress of the voting as you speak and can be displayed in the screen as people vote. It communicates very well and makes the exercise very dynamic.
Online poll
Which of the following methods do you use REGULARLY to publish data online (i.e. in the last year)
o DiGIR provider
o TAPIR provider
o BioCASE provider
o IPT
o DwC-A via“DwC-A spreadsheet processor”
o Customized DwC-A via“DwC-A Assistant”
Other custom created DwC-A
o None
Which of the following methods do you use regularly to publish data online (or to help others to do so) (i.e. used at least once in the last year)
There are simple online poll tools that show the progress of the voting as you speak and can be displayed in the screen as people vote. It communicates very well and makes the exercise very dynamic.
This section will aim to start covering the instructional objective 3.
Core element for Nodes managers to do
Review from Berlin
Extended documents --- review prior to use cases and exercises on day 2
Identify and assess data holders
Slide from Module 3 – Knowledge exchange I Supporting data digitization and publishing ~ Alberto González-Talaván ~ 4 October 2013, GBIF Nodes Training ~ Berlin, Germany
Barriers to publishing
On these points:
Lack of knowledge: The holder may not be aware how sharing on the internet works, and the existence of initiatives such as GBIF.
Lack of understanding: the holder may have heard about GBIF and data publishing, but thinks it must be complicated, bureaucratic, very technical…
Lack of will: The holder understand the process but does not want to go through it because of cultural issues, perceived sensitivity of the data,
Perceived data value: the holder thinks that the data has economic or intrinsic value that (s)he wants to exploit.
Privacy concerns:
Lack of authorization: The holder would like to share the data, but institutional policies prevent it.
Lack of time / planning: The holder never finds an appropriate moment to start the digitization, data transformation or publishing. Or got discouraged after not properly planned attempts.
Lack of capacity: the holder would like to digitize and share the data, but (s)he doesn’t know what is the best (or any) way to do it.
Lack of resources/funding: the holder would like to digitize and share the data, but there is no spare capacity in the institution to carry out such tasks.
Lack of infrastructure: the holder would like to digitize and share the data, but (s)he does not have the technical infrastructure to do it.
----- Meeting Notes (10/3/15 07:09) -----
Least to most open
Objective is to get to 5 or any advancement on the scale is positive
Slide from Module 3 – Knowledge exchange I Supporting data digitization and publishing ~ Alberto González-Talaván ~ 4 October 2013, GBIF Nodes Training ~ Berlin, Germany
Least to most open
Objective is to get to 5 or any advancement on the scale is positive
Slide from Module 3 – Knowledge exchange I Supporting data digitization and publishing ~ Alberto González-Talaván ~ 4 October 2013, GBIF Nodes Training ~ Berlin, Germany
Strategies and arguments to overcome barriers/Incentives for publishing
On these points:
Facilitate access to financial support: provide digitization grants or help the data holders to obtain funding that funds directly or indirectly the digitization.
Call upon commitments or legal mandates: Try to use commitments or legal mandates that apply to the institution or the country as a way to convince the data holder.
Call upon open access / moral principles: the results of publicly funded research should be made public, access to science should not be restricted, etc.
Show the benefits of a better data management: management of digital information can facilitate the data holder’s daily work.
Show the benefit for their scientific careers: publishing data can provide scientific credit through data papers, citations and data usage indexes.
Peer pressure: competing/fellow institutions are already sharing data and the holder’s institution is being left behind.
Start / support big digitization programmes: promote the start of big digitization programmes that will benefit many holders at the same time.
Start / support data repatriation efforts: start programmes that will allow the return of digital data describing your county’s biodiversity.
Summarize community discussion on this topic
examples publishing networks/nodes and how they’ve been successful or had difficulties in publishing data?
Cees provided some great examples and strategies
Nico introduced topic of licensing, mentioning Peter Desmet’s blog post, Why we should publish under CC0 as an illustrative example of what more restrictive licenses prevent users from doing or not doing with data.
http://www.canadensys.net/2012/why-we-should-publish-our-data-under-cc0
Faustin, Hanna, and Cees provided some additional discussion on licensing
And Anne-Sophie, introduced organizing trainings on topics like Data Papers as an easier sell to data publishers as who could observe the direct impact on the visibility and numbers of downloads of their data sets for their published data papers.
4 use cases based on current publishing practices: literature, observational data, natural history collections and checklists.
The FIRST EXERCISE will last up to 20 minutes and will be around the definition of data publishing strategies. Based in the description included in their use case, each group will work on identifying suitable technical solutions, challenges and strategies. Each group will reflect the outcome of their discussions in a single page.
The SECOND EXERCISE will use the all the remaining time and will consist on the publishing of a dataset using the test IPT installation made available for the course. There are two datasets available, depending on the level of challenge that the participant is seeking. Links to the datasets will be provided as part of the use case description document. Those seeking certification, will need to fill a template describing the process and send it to the group facilitator ONLY.
Birds occurrence records from “Birds at the Danish Lighthouses 1883-1939”
Camera trap database of Tiger sightings from India
French and English
Prairie Habitat Restoration Study
VASSY, the database of vascular plants of Syldavia and Eskeastein
Image from Piotr Lewandowski, shared via http://www.freeimages.com/photo/learning-with-pencil-1415671