Presentation and discussion about topics such licenses, metadata, mandatory fields, how an IPT instance can host datasets for different publishing institutions, etc.
-----
Présentation et discussion autour de sujets tels que les licences, métadonnées, champs obligatoires, l’hébergement de jeux de données de différentes institutions sur la même installation IPT, etc
BID CE Workshop 1 - session 11 - Basic concepts about biodiversity data quality
1. August 24th, 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Data publishing concepts and
introduction to the IPT
Nicolas Noé
2. August 24th, 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Publication de données: concepts et
introduction à l’IPT Nicolas Noé
3. Publishing
“Publishing” refers to making biodiversity datasets
publicly accessible and discoverable, in a
standardized form, via an access point, typically a web
address (a URL).
Publishing
4. Publication
“La publication a pour but de rendre un jeu de
données de biodiversité accessible publiquement et
découvrables, dans un format standardisé via un point
d’accès, typiquement un adresse (URL).”
Publication
7. Classes of dataset: occurrences
Datasetclasses
Digital text or multimedia data record detailing
facts about the instance of occurrence of an
organism, i.e. on the what, where, when, how
and by whom of the occurrence and the
recording.
8. Type de jeu de donnée: occurrences
Typedejeudedonnées
Texte numérisé ou données multimédia
détaillants des faits sur l’occurrence d’un
organisme: le quoi, où, quand, comment et
par qui de l’occurrence et de son
enregistrement.
9. Classes of dataset: checklist
“A catalogue or list of named organisms, or taxa.”
Possibly also: vernacular names, literature,
relationships, ...
Typically categorize information along taxonomic,
geographic, and thematic lines, or some combination
of the three.
Datasetclasses
10. Type de jeu de données: checklist / liste
d’espèce
“Un catalogue, ou une liste de taxons.”
Éventuellement aussi: noms vernaculaires, citations, ...
Classent généralement l’information par taxonomie,
géographie et statut ou en combinant les trois.
Typedejeudedonnées
11. Classes of dataset: sampling-event
Datasets sometimes provide greater detail, not only offering evidence that a species occurred at a
given location and date, but also making it possible to assess community composition for broader
taxonomic groups or even the abundance of species at multiple times and places. These datasets
typically derive from standard protocols for measuring and monitoring biodiversity like vegetation
transects, bird censuses and freshwater or marine sampling. By indicating the methods, events and
relative abundance of species recorded in a sample, these datasets improve comparisons with data
collected using the same protocols at different times and places—in some cases, even leading
researchers to infer the absence of particular species from particular sites.
Datasetclasses
12. Type de jeu de données: données
d’échantillonage
Parfois, les ensembles de données fournissent de plus amples détails, mettant en évidence non
seulement l’enregistrement d’une espèce à un endroit et une date donnée, mais également la
possibilité d’évaluer la composition des communautés de groupes taxonomiques plus larges ou même
l’abondance des espèces en plusieurs moments et lieux. Ces ensembles de données proviennent
généralement des protocoles standards développés pour mesurer et suivre la biodiversité comme les
transects, les comptages d’oiseaux ou les prélèvements d’eau de mer ou d’eau douce. En indiquant,
lors d’un échantillonnage, les méthodes, événements et l’abondance relative des espèces
enregistrées, ces ensembles de données améliorent les comparaisons pouvant être faîtes avec des
données collectées en utilisant les mêmes protocoles à différents endroits et moments - dans certains
cas, cela permet aux chercheurs d’en déduire l’absence d’espèces particulières sur des sites
spécifiques
Typedejeudedonnées
13. Classes of dataset: metadata-only
● “Data about data”
● Always mandatory
● Very important to assess
fitness for use
Datasetclasses
14. Type de jeu de données: métadonnées
uniquement
● “Données sur les
données”
● Toujours obligatoire
● Crucial pour l’adéquation
à l’usage
Typedejeudedonnées
15. Licenses
●Everything at GBIF now has a licenses
●Choice between:
• Public domain: CC0
• Creative Commons Attribution: CC-BY
• Creative Commons Attribution Non Commercial: CC-
BY-NC
Licenses
16. Licences
●Toutes les données GBIF on maintenant une
licence claire
●Choix possibles:
• Domaine public: CC0
• Creative Commons Attribution: CC-BY
• Creative Commons Attribution Non Commercial: CC-
BY-NC
Licences
17. Darwin Core, Simple Darwin Core and Darwin
Core Archive
Darwin Core: a list of terms
Darwincore
18. Darwin Core, Simple Darwin Core et Darwin
Core Archive
Darwin Core: une liste de termes
Darwincore
19. Darwin Core, Simple Darwin Core and Darwin
Core Archive
Simple Darwin Core: Darwin Core expressed in a
simple table structure.
Darwincore
20. Darwin Core, Simple Darwin Core et Darwin
Core Archive
Simple Darwin Core: Darwin Core exprimé sous
forme de structure tabulaire simple
Darwincore
21. Darwin Core, Simple Darwin Core and Darwin
Core Archive
Darwin Core Archive: more complex format, allows
extensions.
Extensions
22. Darwin Core, Simple Darwin Core et Darwin
Core Archive
Darwin Core Archive: un format plus avancé, qui
permet l’usage d’extensions.
Extensions
25. Data Publishing method: IPT
●Server-side software, needs a stable connection
●One IPT can host many datasets, on behalf of
several institutions, while giving proper credit
●Main (but not only) publishing tool for GBIF
●Test mode and production mode
●Multilingual
IPT
26. Méthode de publication: IPT
●Logiciel serveur, nécessite une connexion stable
●Un IPT peut héberger plusieurs datasets, pour
plusieurs institutions, et toujours donner
crédit/attribution
●Modes test et production
IPT