August 24th, 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Data publishing concepts and
introduction to the IPT
Nicolas Noé
August 24th, 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Publication de données: concepts et
introduction à l’IPT Nicolas Noé
Publishing
“Publishing” refers to making biodiversity datasets
publicly accessible and discoverable, in a
standardized form, via an access point, typically a web
address (a URL).
Publishing
Publication
“La publication a pour but de rendre un jeu de
données de biodiversité accessible publiquement et
découvrables, dans un format standardisé via un point
d’accès, typiquement un adresse (URL).”
Publication
Publishing
Publishing
Publication
Publication
Classes of dataset: occurrences
Datasetclasses
Digital text or multimedia data record detailing
facts about the instance of occurrence of an
organism, i.e. on the what, where, when, how
and by whom of the occurrence and the
recording.
Type de jeu de donnée: occurrences
Typedejeudedonnées
Texte numérisé ou données multimédia
détaillants des faits sur l’occurrence d’un
organisme: le quoi, où, quand, comment et
par qui de l’occurrence et de son
enregistrement.
Classes of dataset: checklist
“A catalogue or list of named organisms, or taxa.”
Possibly also: vernacular names, literature,
relationships, ...
Typically categorize information along taxonomic,
geographic, and thematic lines, or some combination
of the three.
Datasetclasses
Type de jeu de données: checklist / liste
d’espèce
“Un catalogue, ou une liste de taxons.”
Éventuellement aussi: noms vernaculaires, citations, ...
Classent généralement l’information par taxonomie,
géographie et statut ou en combinant les trois.
Typedejeudedonnées
Classes of dataset: sampling-event
Datasets sometimes provide greater detail, not only offering evidence that a species occurred at a
given location and date, but also making it possible to assess community composition for broader
taxonomic groups or even the abundance of species at multiple times and places. These datasets
typically derive from standard protocols for measuring and monitoring biodiversity like vegetation
transects, bird censuses and freshwater or marine sampling. By indicating the methods, events and
relative abundance of species recorded in a sample, these datasets improve comparisons with data
collected using the same protocols at different times and places—in some cases, even leading
researchers to infer the absence of particular species from particular sites.
Datasetclasses
Type de jeu de données: données
d’échantillonage
Parfois, les ensembles de données fournissent de plus amples détails, mettant en évidence non
seulement l’enregistrement d’une espèce à un endroit et une date donnée, mais également la
possibilité d’évaluer la composition des communautés de groupes taxonomiques plus larges ou même
l’abondance des espèces en plusieurs moments et lieux. Ces ensembles de données proviennent
généralement des protocoles standards développés pour mesurer et suivre la biodiversité comme les
transects, les comptages d’oiseaux ou les prélèvements d’eau de mer ou d’eau douce. En indiquant,
lors d’un échantillonnage, les méthodes, événements et l’abondance relative des espèces
enregistrées, ces ensembles de données améliorent les comparaisons pouvant être faîtes avec des
données collectées en utilisant les mêmes protocoles à différents endroits et moments - dans certains
cas, cela permet aux chercheurs d’en déduire l’absence d’espèces particulières sur des sites
spécifiques
Typedejeudedonnées
Classes of dataset: metadata-only
● “Data about data”
● Always mandatory
● Very important to assess
fitness for use
Datasetclasses
Type de jeu de données: métadonnées
uniquement
● “Données sur les
données”
● Toujours obligatoire
● Crucial pour l’adéquation
à l’usage
Typedejeudedonnées
Licenses
●Everything at GBIF now has a licenses
●Choice between:
• Public domain: CC0
• Creative Commons Attribution: CC-BY
• Creative Commons Attribution Non Commercial: CC-
BY-NC
Licenses
Licences
●Toutes les données GBIF on maintenant une
licence claire
●Choix possibles:
• Domaine public: CC0
• Creative Commons Attribution: CC-BY
• Creative Commons Attribution Non Commercial: CC-
BY-NC
Licences
Darwin Core, Simple Darwin Core and Darwin
Core Archive
Darwin Core: a list of terms
Darwincore
Darwin Core, Simple Darwin Core et Darwin
Core Archive
Darwin Core: une liste de termes
Darwincore
Darwin Core, Simple Darwin Core and Darwin
Core Archive
Simple Darwin Core: Darwin Core expressed in a
simple table structure.
Darwincore
Darwin Core, Simple Darwin Core et Darwin
Core Archive
Simple Darwin Core: Darwin Core exprimé sous
forme de structure tabulaire simple
Darwincore
Darwin Core, Simple Darwin Core and Darwin
Core Archive
Darwin Core Archive: more complex format, allows
extensions.
Extensions
Darwin Core, Simple Darwin Core et Darwin
Core Archive
Darwin Core Archive: un format plus avancé, qui
permet l’usage d’extensions.
Extensions
Data Publishing method
Publishing
Méthodes de publication de données
Publication
Data Publishing method: IPT
●Server-side software, needs a stable connection
●One IPT can host many datasets, on behalf of
several institutions, while giving proper credit
●Main (but not only) publishing tool for GBIF
●Test mode and production mode
●Multilingual
IPT
Méthode de publication: IPT
●Logiciel serveur, nécessite une connexion stable
●Un IPT peut héberger plusieurs datasets, pour
plusieurs institutions, et toujours donner
crédit/attribution
●Modes test et production
IPT
STEP 1: Get access and log in an IPT instance
Etape 1: Accédez à l’IPT et connectez-vous !
STEP 2: Create a new resource
Etape 2: Création d’une nouvelle ressource
STEP 3: Get familiar with the main resource
configuration page
Etape 3: Familiarisez-vous avec la page de
configuration de la resource
STEP 4: Author metadata
Etape 4: Rédigez les métadonnées
STEP 5: Publish, make visible and register the
dataset
Etape 5: Publiez, rendez visibles et enregistrez
l’IPT
August 24th, 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Data publishing concepts and
introduction to the IPT
Nicolas Noé
August 24th, 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Publication de données: concepts et
introduction à l’IPT Nicolas Noé

BID CE Workshop 1 - session 11 - Basic concepts about biodiversity data quality

  • 1.
    August 24th, 2016 THEBID PROGRAMME IS FUNDED BY THE EUROPEAN UNION Data publishing concepts and introduction to the IPT Nicolas Noé
  • 2.
    August 24th, 2016 THEBID PROGRAMME IS FUNDED BY THE EUROPEAN UNION Publication de données: concepts et introduction à l’IPT Nicolas Noé
  • 3.
    Publishing “Publishing” refers tomaking biodiversity datasets publicly accessible and discoverable, in a standardized form, via an access point, typically a web address (a URL). Publishing
  • 4.
    Publication “La publication apour but de rendre un jeu de données de biodiversité accessible publiquement et découvrables, dans un format standardisé via un point d’accès, typiquement un adresse (URL).” Publication
  • 5.
  • 6.
  • 7.
    Classes of dataset:occurrences Datasetclasses Digital text or multimedia data record detailing facts about the instance of occurrence of an organism, i.e. on the what, where, when, how and by whom of the occurrence and the recording.
  • 8.
    Type de jeude donnée: occurrences Typedejeudedonnées Texte numérisé ou données multimédia détaillants des faits sur l’occurrence d’un organisme: le quoi, où, quand, comment et par qui de l’occurrence et de son enregistrement.
  • 9.
    Classes of dataset:checklist “A catalogue or list of named organisms, or taxa.” Possibly also: vernacular names, literature, relationships, ... Typically categorize information along taxonomic, geographic, and thematic lines, or some combination of the three. Datasetclasses
  • 10.
    Type de jeude données: checklist / liste d’espèce “Un catalogue, ou une liste de taxons.” Éventuellement aussi: noms vernaculaires, citations, ... Classent généralement l’information par taxonomie, géographie et statut ou en combinant les trois. Typedejeudedonnées
  • 11.
    Classes of dataset:sampling-event Datasets sometimes provide greater detail, not only offering evidence that a species occurred at a given location and date, but also making it possible to assess community composition for broader taxonomic groups or even the abundance of species at multiple times and places. These datasets typically derive from standard protocols for measuring and monitoring biodiversity like vegetation transects, bird censuses and freshwater or marine sampling. By indicating the methods, events and relative abundance of species recorded in a sample, these datasets improve comparisons with data collected using the same protocols at different times and places—in some cases, even leading researchers to infer the absence of particular species from particular sites. Datasetclasses
  • 12.
    Type de jeude données: données d’échantillonage Parfois, les ensembles de données fournissent de plus amples détails, mettant en évidence non seulement l’enregistrement d’une espèce à un endroit et une date donnée, mais également la possibilité d’évaluer la composition des communautés de groupes taxonomiques plus larges ou même l’abondance des espèces en plusieurs moments et lieux. Ces ensembles de données proviennent généralement des protocoles standards développés pour mesurer et suivre la biodiversité comme les transects, les comptages d’oiseaux ou les prélèvements d’eau de mer ou d’eau douce. En indiquant, lors d’un échantillonnage, les méthodes, événements et l’abondance relative des espèces enregistrées, ces ensembles de données améliorent les comparaisons pouvant être faîtes avec des données collectées en utilisant les mêmes protocoles à différents endroits et moments - dans certains cas, cela permet aux chercheurs d’en déduire l’absence d’espèces particulières sur des sites spécifiques Typedejeudedonnées
  • 13.
    Classes of dataset:metadata-only ● “Data about data” ● Always mandatory ● Very important to assess fitness for use Datasetclasses
  • 14.
    Type de jeude données: métadonnées uniquement ● “Données sur les données” ● Toujours obligatoire ● Crucial pour l’adéquation à l’usage Typedejeudedonnées
  • 15.
    Licenses ●Everything at GBIFnow has a licenses ●Choice between: • Public domain: CC0 • Creative Commons Attribution: CC-BY • Creative Commons Attribution Non Commercial: CC- BY-NC Licenses
  • 16.
    Licences ●Toutes les donnéesGBIF on maintenant une licence claire ●Choix possibles: • Domaine public: CC0 • Creative Commons Attribution: CC-BY • Creative Commons Attribution Non Commercial: CC- BY-NC Licences
  • 17.
    Darwin Core, SimpleDarwin Core and Darwin Core Archive Darwin Core: a list of terms Darwincore
  • 18.
    Darwin Core, SimpleDarwin Core et Darwin Core Archive Darwin Core: une liste de termes Darwincore
  • 19.
    Darwin Core, SimpleDarwin Core and Darwin Core Archive Simple Darwin Core: Darwin Core expressed in a simple table structure. Darwincore
  • 20.
    Darwin Core, SimpleDarwin Core et Darwin Core Archive Simple Darwin Core: Darwin Core exprimé sous forme de structure tabulaire simple Darwincore
  • 21.
    Darwin Core, SimpleDarwin Core and Darwin Core Archive Darwin Core Archive: more complex format, allows extensions. Extensions
  • 22.
    Darwin Core, SimpleDarwin Core et Darwin Core Archive Darwin Core Archive: un format plus avancé, qui permet l’usage d’extensions. Extensions
  • 23.
  • 24.
    Méthodes de publicationde données Publication
  • 25.
    Data Publishing method:IPT ●Server-side software, needs a stable connection ●One IPT can host many datasets, on behalf of several institutions, while giving proper credit ●Main (but not only) publishing tool for GBIF ●Test mode and production mode ●Multilingual IPT
  • 26.
    Méthode de publication:IPT ●Logiciel serveur, nécessite une connexion stable ●Un IPT peut héberger plusieurs datasets, pour plusieurs institutions, et toujours donner crédit/attribution ●Modes test et production IPT
  • 27.
    STEP 1: Getaccess and log in an IPT instance
  • 28.
    Etape 1: Accédezà l’IPT et connectez-vous !
  • 29.
    STEP 2: Createa new resource
  • 30.
    Etape 2: Créationd’une nouvelle ressource
  • 31.
    STEP 3: Getfamiliar with the main resource configuration page
  • 32.
    Etape 3: Familiarisez-vousavec la page de configuration de la resource
  • 33.
  • 34.
    Etape 4: Rédigezles métadonnées
  • 35.
    STEP 5: Publish,make visible and register the dataset
  • 36.
    Etape 5: Publiez,rendez visibles et enregistrez l’IPT
  • 37.
    August 24th, 2016 THEBID PROGRAMME IS FUNDED BY THE EUROPEAN UNION Data publishing concepts and introduction to the IPT Nicolas Noé
  • 38.
    August 24th, 2016 THEBID PROGRAMME IS FUNDED BY THE EUROPEAN UNION Publication de données: concepts et introduction à l’IPT Nicolas Noé