SlideShare une entreprise Scribd logo
1  sur  55
22 AUGUST 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Foundations for the Workshop
Sharon Grant
22 Août 2016
LE PROGRAMME BID EST FINANCÉ PAR L’UNION EUROPÉENNE
Les fondations pour l’atelier
Sharon Grant
Structure of this Session
Structure de cette séance
Key Concepts
Data Quality
Documentation
Standards
Data Normalization
Why Publish?
KeyConcepts
Concepts clés
Qualité des données
Documentation
Standards de données
Normalisation des données
Pourquoi publier?
Conceptsclés
"...data quality is related to use and cannot be assessed independently of the
user. In a database, the data have no actual quality or value (Dalcin 2004);
they only have potential value that is realized only when someone uses the
data to do something useful. Information quality relates to its ability to satisfy
its customers and to meet customers’ needs (English 1999).”
Quality
Reference: Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for GBIF, Copenhagen. ISBN 87-92020-03-8.
"...la qualité des données est liée à l’usage et ne peut pas être jugée
indépendamment de l’utilisateur. Dans une base de données, les données
n’ont pas de qualité ou de valeur intrinsèques (Dalcin 2004) ; elles n’ont
qu’une valeur potentielle qui se réalise seulement quand quelqu’un utilise des
données pour faire quelque chose d’utile. La qualité de l’information est liée à
sa capacité à satisfaire ses consommateurs et leurs besoins (English 1999).”
Qualité
Chapman, A. D. (2005). Les principes de qualité des données, version 1.0. Trad. Chenin, N. Copenhague: Global Biodiversity Information
Facility. ISBN 87-92020-03-8.
Quality
Quality
Activités préparatoires
Qualité
Reference: Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for GBIF, Copenhagen. ISBN 87-92020-03-8.
• accessible,
• accurate,
• timely,
• complete,
• consistent with other sources,
• relevant,
• comprehensive,
• provide a proper level of detail,
• be easy to read and easy to interpret
Quality
“Fitness for Use”
All data include error – there is no escaping it! It is knowing what the
error is that is important, and knowing if the error is within acceptable
limits for the purpose to which the data are to be put. (Chapman 2005)
• accessibles,
• exactes,
• opportunes,
• complètes,
• cohérentes avec les autres sources,
• pertinentes,
• exhaustives,
• fournissent un niveau de détail approprié,
• aisées à lire et à interpréter
Quality
“Aptitude à l’emploi”
Toute données contient des erreurs – on ne peut y échapper ! Ce qui
compte c’est d’avoir connaissance de ces erreurs et de savoir si elles
restent dans des limites acceptables au regard de ce que l’on veut en
faire. (Chapman 2005)
Chapman, A. D. (2005). Les principes de qualité des données, version 1.0. Trad. Chenin, N. Copenhague: Global Biodiversity Information
Facility. ISBN 87-92020-03-8.
Reference: http://chemistry.about.com/od/unitsconversions/fl/What-Is-the-Difference-Between-Accuracy-and-Precision.htm
• Accuracy
How close are you to the true
value.
high degree of accuracy, but low precision.
• Precision
How consistent are your
measurements.
high precision, but low degrees of accuracy.
Quality
Accuracy and Precision
“Be precise. A lack of precision is dangerous when the margin of error is
small” (Donald Rumsfeld)
Reference: http://chemistry.about.com/od/unitsconversions/fl/What-Is-the-Difference-Between-Accuracy-and-Precision.htm
• Exactitude
La proximité par rapport à la
vraie valeur
un haut degré d'exactitude, mais une faible précision
• Précision
La coherence de vos mesures
Une haute précision, mais un degré faible d’exactitude
Qualité
Exactitude et précision
« Soyez précis. Un manque de précision est dangereux lorsque la
marge d'erreur est faible. » (Donald Rumsfeld)
Reference: http://www.npl.co.uk/upload/pdf/Understanding%20uncertainty.pdf
• Uncertainty
Is the quantification of the doubt
about the measurement result.
• Error
Is difference between the
measured value and the true
value of object being measured.
Quality
Errors and Uncertainty
“As far as the law of mathematics refer to reality, they are not certain;
and as far as they are certain, they do not refer to reality. (Albert
Einstein)
Reference: http://www.npl.co.uk/upload/pdf/Understanding%20uncertainty.pdf
• Incertitude
La quantification du doute sur le
résultat de la mesure.
• Erreur
La différence entre la valeur
mesurée et la valeur réelle de
l'objet mesuré.
Qualité
Erreurs et incertitudes
« Pour autant que les lois des mathématiques reflètent la réalité, elles ne
sont pas certaines; pour autant qu’elles soient certaines, elle ne reflètent
pas la réalité. »(Albert Einstein)
“People have forgotten how to tell a story. Stories don’t have a middle
or an end any more. They usually have a beginning that never stops
beginning.” (Steven Spielberg)
Documentation
"Les gens ont oublié comment raconter une histoire. Les histoires n’ont
plus ni milieu ni fin. Elles ont généralement un début qui ne cesse de
commencer." (Steven Spielberg)
Documentation
Reference: Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for GBIF, Copenhagen. ISBN 87-92020-03-8.
• title;
• source;
• data lineage;
• accuracy;
• logical consistency;
• date and life expectancy;
• field definitions;
• collection methodology;
Documentation
Documentation
Experience has shown that treating data as a long-term asset and
managing it within a coordinated framework produces considerable
savings and ongoing value. (NLWRA 2003).
• completeness;
• conditions of use and use
constraints;
• custodianship;
• contact information
• titre ;
• source ;
• historique des données ;
• précision ;
• cohérence logique ;
• date et durée de vie des
données ;
• définition des champs ;
• méthodologie de collecte ;
Documentation
Documentation
L’expérience a montré que le fait de traiter les données comme un atout
à long terme et de les gérer dans un cadre coordonné apporte des
économies considérables et une valeur durable (NLWRA 2003).
• Methodology utilisée par la
collection;
• complétude ;
• conditions et contraintes
d’utilisation ;
• information sur la conservation ;
• contact
Chapman, A. D. (2005). Les principes de qualité des données, version 1.0. Trad. Chenin, N. Copenhague: Global Biodiversity Information
Facility. ISBN 87-92020-03-8.
Metadata = « Data about the data »
• Describe content, accessibility, completeness...
• About the dataset
• Error documentation
• Documentation of validation process, data cleaning
and data correcting
Metadata must be rich enough to allow data (re)use by a third
party without them having to refer to the data source.
Documentation
Documenting quality during digitization
Que peuvent faire les équipes de numérisation ?
1. Aider à documenter le(s) jeu(x) de données
grâce aux métadonnées et annotations sur les
occurrences
2. S’assurer de la meilleure qualité possible lors
de la numérisation :
1. Données taxonomiques
2. Données géographiques
3. Données sur la collection et le collecteur
4. Données descriptives
Documentation
"As with marathon runs and lengths of toilet paper, there had to be
standards to measure up to.” (Haruki Murakami)
Standards
«Tout comme la distance des marathons et la longueur des rouleaux
de papier toilette, il faut des standards auxquels nous puissions nous
référer. » (Haruki Murakami)
Standards de données
Source: https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt
Existing Standards
• Ecological Metadata Language
Standard (EML),
• Darwin Core,
• Audubon Media Description (aka
Audubon Core),
• Global Genome Biodiversity
Network(GGBN)
• Ocean Data Standards and Best
Practices Project (ODSBP)
• Any more..?
Reasons to Standardise
• Standards provide data
integrity, accuracy and
consistence, clarify
ambiguous meanings,
minimize redundant
data, and document
business rules.
Standards
Data Standards
“Data standards are the rules by which data are described and recorded.
In order to share, exchange, and understand data, we must standardise
the format as well as the meaning.” (USGS)
Source: https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt
Standards existants
• Ecological Metadata Language
Standard (EML),
• Darwin Core,
• Audubon Media Description (alias
Audubon Core),
• Global Genome Biodiversity
Network(GGBN)
• Ocean Data Standards et Best
Practices Project (ODSBP)
• Autres standards..?
Raisons pour standardiser
• Les standards fournissent
protection,exactitude et
cohérence aux données,
permettent d’éclaircir les
termes flous, de réduire les
répétitions d’information, et
de documenter les règles
d’utilisation des données.
Standards
Standards de données
« Les standards de données sont les règles permettant de décrire et
d’enregistrer les données. Afin de partager, échanger et comprendre les
données, nous devons standardiser la forme autant que le fond.»
(USGS)
Standards
Extensions and the Star Schema
Extensions
● GGBN Suite
● EOL References
● Germplasm Suite
● Trait measurement
● Taxon Description
● Simple Multimedia
● Literature References
● Types and Specimen
● Vernacular Names
● Audobon Media
● Darwin Core Event
Etc… etc…
Standards
Extensions et Schéma en étoile
Extensions
● GGBN Suite
● EOL References
● Germplasm Suite
● Trait measurement
● Taxon Description
● Simple Multimedia
● Literature References
● Types and Specimen
● Vernacular Names
● Audubon Media
● Darwin Core Event
Etc… etc…
"The idea is there locked inside. All you have to do is remove the
excess stone (Michelangelo).
Normalization
"L'idée est là, enfermée à l’intérieur, et tout ce que vous avez à faire
est de retirer l’excès de pierre.” (Michel-Ange)
Normalisation
Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en
First Normal Form (1NF)
• Remove duplicative columns
• Create separate tables for related data.
• Identify each row with a primary Key
Second Normal Form (2NF)
• First Normal Form +
• Remove subsets of data for multiple rows
• Create relationships with foreign keys
Third Normal Form (3NF)
• Remove columns not dependant on the
primary key
Reasons to Normalize
• To minimize duplicate
data.
• To minimize or avoid
data modification
issues.
• Simplify queries.
Normalization
What is Data Normalization?
Data Normalization is the process used to organize a database into
efficient tables and columns.
Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en
Première Forme Normale (1NF)
• Supprimer des duplications de colonnes
• Créer des tableaux différents pour les
données connexes.
• Identifier chaque ligne avec une clé primaire
Deuxième Forme Normale (2NF)
• Première Forme Normale +
• Supprimer les sous-ensembles de données
sur plusieurs lignes
• Créer des liens avec des clés étrangères
Troisième Forme Normale (3NF)
• Supprimer les colonnes ne dépendant pas
de la clé primaire
Les raisons de la
normalisation
• Minimiser la duplication
des données.
• Minimiser ou éviter les
problèmes dus aux
modifications de
données.
• Simplifier les requêtes
de données.
Normalisation
Qu’est ce que la normalisation des données?
La normalisation des données est la procédure utilisée pour organiser
de manière efficace une base de données sous forme de tableaux et de
colonnes.
"Nothing stinks like a pile of unpublished writing” Sylvia Plath
Publishing
"Rien ne pue autant qu’un tas de textes non publiés” Sylvia Plath
La Publication
Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en
Reference:1B Publishing Primary Biodiversity Data by A. González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT . 13 Jan 2015
Publishing
What is Data Publishing?
“Publishing” refers to making biodiversity datasets publicly accessible
and discoverable, in a standardized form, via an access point, typically a
web address (a URL).
Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en
Reference:1B Publishing Primary Biodiversity Data by A. González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT . 13 Jan 2015
Publication
Qu'est ce la Publication de Données ?
La « publication » consiste à rendre des jeux de données de la
biodiversité accessibles au public et découvrable, sous une forme
standardisée, via un point d'accès, généralement une adresse Web
(URL).
21st century = « century of the data »
Data quantity increases exponentially
GBIF is part of this movement!
Well curated and standardized, these data have the
potential to greatly improve our knowledge and
capacities
Publishing
Why Publish Data
Pourquoi publier les données ?
21ème siècle = « siècle des données »
La quantité de données augmente exponentiellement
Le GBIF est un acteur de ce mouvement !
Bien mises en forme et standardisées, ces données
ont le potentiel d’améliorer grandement nos
connaissances et aptitudes
Publication
Taxonomic research, niche modelling/species
distribution prediction, invasive and alien
species, habitat degradation, interspecific
relationships, ...
But also...
Conservation biology, water management,
eco-tourism, science history, hunting and
fisheries, data repatriation,..
Biodiversity Data Use
After Chapman, 2006
Publishing
Recherches taxonomiques,
modélisation/prédiction de la distribution des
espèces, espèces invasives, dégradation des
habitats, relations interspécifiques, ...
Mais aussi...
Organisation de la conservation, gestion de
l’eau, éco-tourisme, histoire des sciences,
chasse et pêche, rapatriement des données,
...
Usage des données de biodiversité
D’après Chapman, 2006
Publication
Reasons to Publish
● Taxonomy
● Biogeographic studies
● Species diversity and populations
● Life histories and phenologies
● Endangered, Migratory and Invasive
Species
● Impact of Climate Change
● Ecology, Evolution and Genetics
● Environmental Regionalisation
● Conservation Planning
Source: https://docs.google.com/presentation/d/1iYCb3EdqwcD_Nxk5j_lFgGTLFNEz0Cu54qyUvXlSMgs/edit#slide=id.g163ca52ab8_1_7
Publishing
● Natural Resource Management
● Agriculture, Forestry, Fisheries
and Mining
● Health and Public Safety
● Bioprospecting
● Forensics
● Border Control and Wildlife Trade
● Education and Public Outreach
● Ecotourism and Recreational
Activities
● Society and Politics
● Human Infrastructure Planning
Raisons de Publier
● Taxonomie
● Études biogéographiques
● Diversité des espèces et Populations
● Traits de vie and phénologies
● Espèces Menacées, Migratoires et
Envahissantes
● Conséquences du Changement
Climatique
● Écologie, Évolution et Génétique
● Régionalisation Environnementale
● Planification de la Conservation
Source: https://docs.google.com/presentation/d/1iYCb3EdqwcD_Nxk5j_lFgGTLFNEz0Cu54qyUvXlSMgs/edit#slide=id.g163ca52ab8_1_7
Publication
● Gestion des Ressources Naturelles
● Agriculture, Sylviculture, Pêcheries et
Activités Minières
● Santé et Sécurité Publique
● Bioprospection
● Médecine Légale
● Contrôle des Frontières et du
Commerce d’Espèces Sauvages
● Éducation et Sensibilisation Publique
● Écotourisme et Activités Récréatives
● Société et Politiques
● Planification des Infrastructures
Humaines
Barriers to data publishing
Publishing
● Lack of knowledge
● Lack of understanding
● Lack of will
● Perceived data value
● Privacy concerns
● Lack of authorization
● Lack of time / planning
● Lack of capacity
● Lack of funding
● Lack of infrastructure
Psychological
&
cultural
barriers
Practical
barriers
Capacity
barriers
Institutional
barriers
Obstacles à la Publication
Publication
● Manque de connaissance
● Manque de compréhension
● Manque de volonté
● Valeur perçue des données
● Questions de confidentialité
● Absence d'autorisation
● Manque de temps/planning
● Manque de moyens
● Manque de fonds
● Manque d'infrastructures
Obstacles
psychologiques
et culturels
Obstacles
pratiques
Obstacles liés aux
ressources
Obstacles
institutionnels
● Refuse to share.
● Refuse to share until they have exhausted
the planned use of the data.
● Will only share their data for a fee.
● Will only share data under specific
restrictions.
● Agree to share data openly.
Data restriction levels
Publishing
Niveaux de restriction
Publication
● Refus de partager.
● Refus de partager jusqu'à ce que l'utilisation
prévue des données soit terminée.
● Partage payant des données.
● Partage des données sous restrictions.
● Partage libre des données.
● Facilitate access to financial support.
● Call upon commitments or legal mandates.
● Call upon open access / moral principles.
● Show the benefits of a better data management.
● Show the benefit for their scientific careers.
● Peer pressure.
● Start / support big digitization programmes.
● Start / support data repatriation efforts.
Incentives for Publishing
Publishing
Incentives pour la publication
Publication
● Faciliter l'accès à un soutien financier.
● Appel à des engagements ou des mandats légaux.
● Appel à un accès ouvert/principes moraux.
● Montrer les avantages d'une meilleure gestion des données.
● Montrer les avantages pour les carrières scientifiques.
● Pression des pairs
● Démarrer/soutenir de grands programmes de numérisation.
● Démarrer/soutenir les efforts de rapatriement des données.
Promotion of Data Publishing – EXAMPLES
http://community.gbif.org/pg/forum/topic/48616/precourse-activity-promoting-data-publishing/
Publishing
Challenges
• Not wanting to publish
and/or not wanting to
publish all the data
• Technical threshold of an
IPT
• Restrictive licensing of data
Strategies
• Start smaller – meta data only
• Promote one-off publishing
with multiple exposures
• Provide hosted IPTs to
eliminate technical threshold
• Illustrate licensing with telling
examples.
• Promote and organize
trainings to bring reluctant
publishers in with an easier
“sell” like data papers.
Promotion de la publication de données - EXEMPLE
http://community.gbif.org/pg/forum/topic/48616/precourse-activity-promoting-data-publishing/
Publication
Stratégies
• Commencez petit - seulement les
méta-données
• Promotion du fait qu’avec une
seule publication au GBIF les
données seront exposées dans
de multiples réseaux
• Fournir des IPTs hébergés pour
éliminer les barrières techniques
• Illustrer les licences avec des
exemples éloquents.
• Promouvoir et organiser des
formations sur les « data
papers »
Défis
• Ne pas vouloir publier et/
ou ne pas vouloir publier
toutes les données
• Exigences/ capacities
techniques pour utiliser
l’IPT
• Licences restrictives des
données
Useful Resources
Ressources utiles
References
● Data Quality:
• http://zookeys.pensoft.net/articles.php?id=2926%7C
• https://www.sophia.org/tutorials/accuracy-and-precision--3
• http://chem.libretexts.org/Core/Analytical_Chemistry/Quantifying_Nature/Significant_Digits/Uncertainties_in_Measuremen
ts
• http://chemistry.about.com/od/chemistrylabexperiments/qt/meniscus.htm
● Data Normalization:
• http://zookeys.pensoft.net/articles.php?id=2926%7C
• http://databases.about.com/od/specificproducts/a/normalization.htm
• http://www.slideshare.net/JohnCutajar/relational-database-examples
● Data Standards
• https://www2.usgs.gov/datamanagement/plan/datastandards.php
• https://www.researchgate.net/figure/259599014_fig1_The-star-schema-showing-the-relation-of-Darwin-Core-Archive-
extension-files-to-the-core
• https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt
● Why Publish?:
• http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en
• http://www-old.gbif.org/orc/?doc_id=1300
UsefulResources
Références
● Qualité des données :
• http://zookeys.pensoft.net/articles.php?id=2926%7C
• https://www.sophia.org/tutorials/accuracy-and-precision--3
• http://chem.libretexts.org/Core/Analytical_Chemistry/Quantifying_Nature/Significant_Digits/Uncertainties_in_Measurem
ents
• http://chemistry.about.com/od/chemistrylabexperiments/qt/meniscus.htm
● Normalisation des données :
• http://zookeys.pensoft.net/articles.php?id=2926%7C
• http://databases.about.com/od/specificproducts/a/normalization.htm
• http://www.slideshare.net/JohnCutajar/relational-database-examples
● Standards de données
• https://www2.usgs.gov/datamanagement/plan/datastandards.php
• https://www.researchgate.net/figure/259599014_fig1_The-star-schema-showing-the-relation-of-Darwin-Core-Archive-
extension-files-to-the-core
• https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt
● Raisons de Publier
• http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en
• http://www-old.gbif.org/orc/?doc_id=1300
• http://idigbio.org/sites/default/files/workshop-presentations/demystifyingIPT/IPTiDigBio-20150113-
Ressourcesutiles
22 AUGUST 2016
THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Foundations for the Workshop
Sharon Grant

Contenu connexe

Similaire à BID CE Workshop 1 session 02 - Foundations for the Workshop

La qualité des Données et Métadonnées Ouvertes
La qualité des Données et Métadonnées OuvertesLa qualité des Données et Métadonnées Ouvertes
La qualité des Données et Métadonnées OuvertesOpen Data Support
 
L’influence de la gravité des données dans les architectures des lacs de données
L’influence de la gravité des données dans les architectures des lacs de donnéesL’influence de la gravité des données dans les architectures des lacs de données
L’influence de la gravité des données dans les architectures des lacs de donnéescedrinemadera
 
Introduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuits
Introduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuitsIntroduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuits
Introduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuitsMokhtar Saada
 
Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesOpen Data Support
 
structuration des métadonnées de pérennisation
structuration des métadonnées de pérennisationstructuration des métadonnées de pérennisation
structuration des métadonnées de pérennisationPascal Romain
 
Systèmes informatiques d'aide à la décision médicale
Systèmes informatiques d'aide à la décision médicaleSystèmes informatiques d'aide à la décision médicale
Systèmes informatiques d'aide à la décision médicaleSara SI-MOUSSI
 
Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon
Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech LyonProgramme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon
Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyonalexandre bard
 
Diginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NETDiginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NETJulien Chable
 
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...ACSG Section Montréal
 
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...ACSG - Section Montréal
 
Education numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratifEducation numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratifThinkData
 
Les Services du savoir
Les Services du savoirLes Services du savoir
Les Services du savoirAlbert Simard
 
Emilie Robert Devis de recherche qualitative et mixte 2012
Emilie Robert Devis de recherche qualitative et mixte 2012Emilie Robert Devis de recherche qualitative et mixte 2012
Emilie Robert Devis de recherche qualitative et mixte 2012Emilie Robert
 
Usage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esantéUsage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esantéKarimSandid
 
préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015Pascal Romain
 
FAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdfFAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdfThomas DENECKER
 

Similaire à BID CE Workshop 1 session 02 - Foundations for the Workshop (20)

Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
Plan de Gestion de Données (PGD)_Claire Sowinski (INIST CNRS)_JeudIST IRD 202...
 
La qualité des Données et Métadonnées Ouvertes
La qualité des Données et Métadonnées OuvertesLa qualité des Données et Métadonnées Ouvertes
La qualité des Données et Métadonnées Ouvertes
 
L’influence de la gravité des données dans les architectures des lacs de données
L’influence de la gravité des données dans les architectures des lacs de donnéesL’influence de la gravité des données dans les architectures des lacs de données
L’influence de la gravité des données dans les architectures des lacs de données
 
Introduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuits
Introduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuitsIntroduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuits
Introduction mettre-en-place-un-systeme-de-veille-avec-des-outils-gratuits
 
Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnées
 
structuration des métadonnées de pérennisation
structuration des métadonnées de pérennisationstructuration des métadonnées de pérennisation
structuration des métadonnées de pérennisation
 
Systèmes informatiques d'aide à la décision médicale
Systèmes informatiques d'aide à la décision médicaleSystèmes informatiques d'aide à la décision médicale
Systèmes informatiques d'aide à la décision médicale
 
Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon
Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech LyonProgramme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon
Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon
 
Diginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NETDiginova - Session sur le machine learning avec ML.NET
Diginova - Session sur le machine learning avec ML.NET
 
Stage pgd 2021-04-07
Stage pgd 2021-04-07Stage pgd 2021-04-07
Stage pgd 2021-04-07
 
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
 
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
Act 00069 vos données ouvertes réservent-elles des surprises mesurez la matur...
 
Résumé j2
Résumé j2Résumé j2
Résumé j2
 
Webinaire - transmission des connaissances
Webinaire - transmission des connaissancesWebinaire - transmission des connaissances
Webinaire - transmission des connaissances
 
Education numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratifEducation numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratif
 
Les Services du savoir
Les Services du savoirLes Services du savoir
Les Services du savoir
 
Emilie Robert Devis de recherche qualitative et mixte 2012
Emilie Robert Devis de recherche qualitative et mixte 2012Emilie Robert Devis de recherche qualitative et mixte 2012
Emilie Robert Devis de recherche qualitative et mixte 2012
 
Usage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esantéUsage des nouvelles technologies en éducation thérapeutique DU esanté
Usage des nouvelles technologies en éducation thérapeutique DU esanté
 
préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015
 
FAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdfFAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdf
 

Plus de Alberto González-Talaván

BID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and EvaluationBID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and EvaluationAlberto González-Talaván
 
Bid ce workshop 1 Activity V.01 - Planning a biodiversity data mobilization...
Bid ce workshop 1   Activity V.01 - Planning a biodiversity data mobilization...Bid ce workshop 1   Activity V.01 - Planning a biodiversity data mobilization...
Bid ce workshop 1 Activity V.01 - Planning a biodiversity data mobilization...Alberto González-Talaván
 
BID CE Workshop 1 - Activity IV.02 - BID Community
BID CE Workshop 1 - Activity IV.02 - BID CommunityBID CE Workshop 1 - Activity IV.02 - BID Community
BID CE Workshop 1 - Activity IV.02 - BID CommunityAlberto González-Talaván
 
Bid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and Introduction
Bid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and IntroductionBid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and Introduction
Bid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and IntroductionAlberto González-Talaván
 
BID CE Workshop 1 Session 09 - Biodiversity Data Management Tools
BID CE Workshop 1   Session 09 - Biodiversity Data Management ToolsBID CE Workshop 1   Session 09 - Biodiversity Data Management Tools
BID CE Workshop 1 Session 09 - Biodiversity Data Management ToolsAlberto González-Talaván
 
BID CE Workshop 1 session 07 - Digitization Software Example - BIOTA
BID CE Workshop 1   session 07 - Digitization Software Example - BIOTABID CE Workshop 1   session 07 - Digitization Software Example - BIOTA
BID CE Workshop 1 session 07 - Digitization Software Example - BIOTAAlberto González-Talaván
 
BID CE Workshop 1 - session 12 - Basic use of the GBIF IPT
BID CE Workshop 1 -  session 12 - Basic use of the GBIF IPTBID CE Workshop 1 -  session 12 - Basic use of the GBIF IPT
BID CE Workshop 1 - session 12 - Basic use of the GBIF IPTAlberto González-Talaván
 
BID CE Workshop 1 Session 15 - Wrap-up and Evaluation
BID CE Workshop 1   Session 15 - Wrap-up and EvaluationBID CE Workshop 1   Session 15 - Wrap-up and Evaluation
BID CE Workshop 1 Session 15 - Wrap-up and EvaluationAlberto González-Talaván
 
BID CE workshop 1 session 10 - presentation - Open Refine
BID CE workshop 1   session 10 - presentation - Open RefineBID CE workshop 1   session 10 - presentation - Open Refine
BID CE workshop 1 session 10 - presentation - Open RefineAlberto González-Talaván
 
GBIF Pilot Experience Using Mozilla Open Badges
GBIF Pilot Experience Using Mozilla Open BadgesGBIF Pilot Experience Using Mozilla Open Badges
GBIF Pilot Experience Using Mozilla Open BadgesAlberto González-Talaván
 
Séance 07. Démonstration de la publication des données d'échantillonnage. For...
Séance 07. Démonstration de la publication des données d'échantillonnage. For...Séance 07. Démonstration de la publication des données d'échantillonnage. For...
Séance 07. Démonstration de la publication des données d'échantillonnage. For...Alberto González-Talaván
 
Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.
Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.
Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.Alberto González-Talaván
 
Session 09, Wrap up and evaluation. GB22 Nodes training event.
Session 09, Wrap up and evaluation. GB22 Nodes training event.Session 09, Wrap up and evaluation. GB22 Nodes training event.
Session 09, Wrap up and evaluation. GB22 Nodes training event.Alberto González-Talaván
 
Session 07, Sample-data publishing demo. GB22 Nodes training event.
Session 07, Sample-data publishing demo. GB22 Nodes training event. Session 07, Sample-data publishing demo. GB22 Nodes training event.
Session 07, Sample-data publishing demo. GB22 Nodes training event. Alberto González-Talaván
 
Session 03, Practical demo on how to prepare and map different types of data....
Session 03, Practical demo on how to prepare and map different types of data....Session 03, Practical demo on how to prepare and map different types of data....
Session 03, Practical demo on how to prepare and map different types of data....Alberto González-Talaván
 
Séance 03, Démonstration pratique de comment préparer et mapper different dyp...
Séance 03, Démonstration pratique de comment préparer et mapper different dyp...Séance 03, Démonstration pratique de comment préparer et mapper different dyp...
Séance 03, Démonstration pratique de comment préparer et mapper different dyp...Alberto González-Talaván
 
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Alberto González-Talaván
 
Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...
Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...
Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...Alberto González-Talaván
 

Plus de Alberto González-Talaván (20)

BID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and EvaluationBID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
BID CE Workshop 1 - Activity X.01 - Wrap-up and Evaluation
 
Bid ce workshop 1 Activity V.01 - Planning a biodiversity data mobilization...
Bid ce workshop 1   Activity V.01 - Planning a biodiversity data mobilization...Bid ce workshop 1   Activity V.01 - Planning a biodiversity data mobilization...
Bid ce workshop 1 Activity V.01 - Planning a biodiversity data mobilization...
 
BID CE Workshop 1 - Activity IV.02 - BID Community
BID CE Workshop 1 - Activity IV.02 - BID CommunityBID CE Workshop 1 - Activity IV.02 - BID Community
BID CE Workshop 1 - Activity IV.02 - BID Community
 
Bid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and Introduction
Bid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and IntroductionBid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and Introduction
Bid CE Workshop 1 - ONLINE VERSION - Activity 01 - Welcome and Introduction
 
BID CE Workshop 1 Session 09 - Biodiversity Data Management Tools
BID CE Workshop 1   Session 09 - Biodiversity Data Management ToolsBID CE Workshop 1   Session 09 - Biodiversity Data Management Tools
BID CE Workshop 1 Session 09 - Biodiversity Data Management Tools
 
BID CE Workshop 1 session 07 - Digitization Software Example - BIOTA
BID CE Workshop 1   session 07 - Digitization Software Example - BIOTABID CE Workshop 1   session 07 - Digitization Software Example - BIOTA
BID CE Workshop 1 session 07 - Digitization Software Example - BIOTA
 
BID CE Workshop 1 - session 12 - Basic use of the GBIF IPT
BID CE Workshop 1 -  session 12 - Basic use of the GBIF IPTBID CE Workshop 1 -  session 12 - Basic use of the GBIF IPT
BID CE Workshop 1 - session 12 - Basic use of the GBIF IPT
 
BID CE Workshop 1 Session 15 - Wrap-up and Evaluation
BID CE Workshop 1   Session 15 - Wrap-up and EvaluationBID CE Workshop 1   Session 15 - Wrap-up and Evaluation
BID CE Workshop 1 Session 15 - Wrap-up and Evaluation
 
BID CE workshop 1 session 10 - presentation - Open Refine
BID CE workshop 1   session 10 - presentation - Open RefineBID CE workshop 1   session 10 - presentation - Open Refine
BID CE workshop 1 session 10 - presentation - Open Refine
 
BID CE WORKSHOP 1 - Session 01 - Introduction
BID CE WORKSHOP 1 -  Session 01 - IntroductionBID CE WORKSHOP 1 -  Session 01 - Introduction
BID CE WORKSHOP 1 - Session 01 - Introduction
 
GBIF Work Programme 2016 Update
GBIF Work Programme 2016 UpdateGBIF Work Programme 2016 Update
GBIF Work Programme 2016 Update
 
GBIF Pilot Experience Using Mozilla Open Badges
GBIF Pilot Experience Using Mozilla Open BadgesGBIF Pilot Experience Using Mozilla Open Badges
GBIF Pilot Experience Using Mozilla Open Badges
 
Séance 07. Démonstration de la publication des données d'échantillonnage. For...
Séance 07. Démonstration de la publication des données d'échantillonnage. For...Séance 07. Démonstration de la publication des données d'échantillonnage. For...
Séance 07. Démonstration de la publication des données d'échantillonnage. For...
 
Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.
Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.
Session 09, Sommaire et évaluation. Formation GB22 pour points nodaux.
 
Session 09, Wrap up and evaluation. GB22 Nodes training event.
Session 09, Wrap up and evaluation. GB22 Nodes training event.Session 09, Wrap up and evaluation. GB22 Nodes training event.
Session 09, Wrap up and evaluation. GB22 Nodes training event.
 
Session 07, Sample-data publishing demo. GB22 Nodes training event.
Session 07, Sample-data publishing demo. GB22 Nodes training event. Session 07, Sample-data publishing demo. GB22 Nodes training event.
Session 07, Sample-data publishing demo. GB22 Nodes training event.
 
Session 03, Practical demo on how to prepare and map different types of data....
Session 03, Practical demo on how to prepare and map different types of data....Session 03, Practical demo on how to prepare and map different types of data....
Session 03, Practical demo on how to prepare and map different types of data....
 
Séance 03, Démonstration pratique de comment préparer et mapper different dyp...
Séance 03, Démonstration pratique de comment préparer et mapper different dyp...Séance 03, Démonstration pratique de comment préparer et mapper different dyp...
Séance 03, Démonstration pratique de comment préparer et mapper different dyp...
 
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
 
Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...
Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...
Session 02, Introduction to the 2015 Data Publishing Landscape at the GB22 No...
 

Dernier

gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...Faga1939
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 

Dernier (13)

gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 

BID CE Workshop 1 session 02 - Foundations for the Workshop

  • 1. 22 AUGUST 2016 THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION Foundations for the Workshop Sharon Grant
  • 2. 22 Août 2016 LE PROGRAMME BID EST FINANCÉ PAR L’UNION EUROPÉENNE Les fondations pour l’atelier Sharon Grant
  • 5. Key Concepts Data Quality Documentation Standards Data Normalization Why Publish? KeyConcepts
  • 6. Concepts clés Qualité des données Documentation Standards de données Normalisation des données Pourquoi publier? Conceptsclés
  • 7. "...data quality is related to use and cannot be assessed independently of the user. In a database, the data have no actual quality or value (Dalcin 2004); they only have potential value that is realized only when someone uses the data to do something useful. Information quality relates to its ability to satisfy its customers and to meet customers’ needs (English 1999).” Quality Reference: Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for GBIF, Copenhagen. ISBN 87-92020-03-8.
  • 8. "...la qualité des données est liée à l’usage et ne peut pas être jugée indépendamment de l’utilisateur. Dans une base de données, les données n’ont pas de qualité ou de valeur intrinsèques (Dalcin 2004) ; elles n’ont qu’une valeur potentielle qui se réalise seulement quand quelqu’un utilise des données pour faire quelque chose d’utile. La qualité de l’information est liée à sa capacité à satisfaire ses consommateurs et leurs besoins (English 1999).” Qualité Chapman, A. D. (2005). Les principes de qualité des données, version 1.0. Trad. Chenin, N. Copenhague: Global Biodiversity Information Facility. ISBN 87-92020-03-8.
  • 11. Reference: Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for GBIF, Copenhagen. ISBN 87-92020-03-8. • accessible, • accurate, • timely, • complete, • consistent with other sources, • relevant, • comprehensive, • provide a proper level of detail, • be easy to read and easy to interpret Quality “Fitness for Use” All data include error – there is no escaping it! It is knowing what the error is that is important, and knowing if the error is within acceptable limits for the purpose to which the data are to be put. (Chapman 2005)
  • 12. • accessibles, • exactes, • opportunes, • complètes, • cohérentes avec les autres sources, • pertinentes, • exhaustives, • fournissent un niveau de détail approprié, • aisées à lire et à interpréter Quality “Aptitude à l’emploi” Toute données contient des erreurs – on ne peut y échapper ! Ce qui compte c’est d’avoir connaissance de ces erreurs et de savoir si elles restent dans des limites acceptables au regard de ce que l’on veut en faire. (Chapman 2005) Chapman, A. D. (2005). Les principes de qualité des données, version 1.0. Trad. Chenin, N. Copenhague: Global Biodiversity Information Facility. ISBN 87-92020-03-8.
  • 13. Reference: http://chemistry.about.com/od/unitsconversions/fl/What-Is-the-Difference-Between-Accuracy-and-Precision.htm • Accuracy How close are you to the true value. high degree of accuracy, but low precision. • Precision How consistent are your measurements. high precision, but low degrees of accuracy. Quality Accuracy and Precision “Be precise. A lack of precision is dangerous when the margin of error is small” (Donald Rumsfeld)
  • 14. Reference: http://chemistry.about.com/od/unitsconversions/fl/What-Is-the-Difference-Between-Accuracy-and-Precision.htm • Exactitude La proximité par rapport à la vraie valeur un haut degré d'exactitude, mais une faible précision • Précision La coherence de vos mesures Une haute précision, mais un degré faible d’exactitude Qualité Exactitude et précision « Soyez précis. Un manque de précision est dangereux lorsque la marge d'erreur est faible. » (Donald Rumsfeld)
  • 15. Reference: http://www.npl.co.uk/upload/pdf/Understanding%20uncertainty.pdf • Uncertainty Is the quantification of the doubt about the measurement result. • Error Is difference between the measured value and the true value of object being measured. Quality Errors and Uncertainty “As far as the law of mathematics refer to reality, they are not certain; and as far as they are certain, they do not refer to reality. (Albert Einstein)
  • 16. Reference: http://www.npl.co.uk/upload/pdf/Understanding%20uncertainty.pdf • Incertitude La quantification du doute sur le résultat de la mesure. • Erreur La différence entre la valeur mesurée et la valeur réelle de l'objet mesuré. Qualité Erreurs et incertitudes « Pour autant que les lois des mathématiques reflètent la réalité, elles ne sont pas certaines; pour autant qu’elles soient certaines, elle ne reflètent pas la réalité. »(Albert Einstein)
  • 17. “People have forgotten how to tell a story. Stories don’t have a middle or an end any more. They usually have a beginning that never stops beginning.” (Steven Spielberg) Documentation
  • 18. "Les gens ont oublié comment raconter une histoire. Les histoires n’ont plus ni milieu ni fin. Elles ont généralement un début qui ne cesse de commencer." (Steven Spielberg) Documentation
  • 19. Reference: Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for GBIF, Copenhagen. ISBN 87-92020-03-8. • title; • source; • data lineage; • accuracy; • logical consistency; • date and life expectancy; • field definitions; • collection methodology; Documentation Documentation Experience has shown that treating data as a long-term asset and managing it within a coordinated framework produces considerable savings and ongoing value. (NLWRA 2003). • completeness; • conditions of use and use constraints; • custodianship; • contact information
  • 20. • titre ; • source ; • historique des données ; • précision ; • cohérence logique ; • date et durée de vie des données ; • définition des champs ; • méthodologie de collecte ; Documentation Documentation L’expérience a montré que le fait de traiter les données comme un atout à long terme et de les gérer dans un cadre coordonné apporte des économies considérables et une valeur durable (NLWRA 2003). • Methodology utilisée par la collection; • complétude ; • conditions et contraintes d’utilisation ; • information sur la conservation ; • contact Chapman, A. D. (2005). Les principes de qualité des données, version 1.0. Trad. Chenin, N. Copenhague: Global Biodiversity Information Facility. ISBN 87-92020-03-8.
  • 21. Metadata = « Data about the data » • Describe content, accessibility, completeness... • About the dataset • Error documentation • Documentation of validation process, data cleaning and data correcting Metadata must be rich enough to allow data (re)use by a third party without them having to refer to the data source. Documentation Documenting quality during digitization
  • 22. Que peuvent faire les équipes de numérisation ? 1. Aider à documenter le(s) jeu(x) de données grâce aux métadonnées et annotations sur les occurrences 2. S’assurer de la meilleure qualité possible lors de la numérisation : 1. Données taxonomiques 2. Données géographiques 3. Données sur la collection et le collecteur 4. Données descriptives Documentation
  • 23. "As with marathon runs and lengths of toilet paper, there had to be standards to measure up to.” (Haruki Murakami) Standards
  • 24. «Tout comme la distance des marathons et la longueur des rouleaux de papier toilette, il faut des standards auxquels nous puissions nous référer. » (Haruki Murakami) Standards de données
  • 25. Source: https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt Existing Standards • Ecological Metadata Language Standard (EML), • Darwin Core, • Audubon Media Description (aka Audubon Core), • Global Genome Biodiversity Network(GGBN) • Ocean Data Standards and Best Practices Project (ODSBP) • Any more..? Reasons to Standardise • Standards provide data integrity, accuracy and consistence, clarify ambiguous meanings, minimize redundant data, and document business rules. Standards Data Standards “Data standards are the rules by which data are described and recorded. In order to share, exchange, and understand data, we must standardise the format as well as the meaning.” (USGS)
  • 26. Source: https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt Standards existants • Ecological Metadata Language Standard (EML), • Darwin Core, • Audubon Media Description (alias Audubon Core), • Global Genome Biodiversity Network(GGBN) • Ocean Data Standards et Best Practices Project (ODSBP) • Autres standards..? Raisons pour standardiser • Les standards fournissent protection,exactitude et cohérence aux données, permettent d’éclaircir les termes flous, de réduire les répétitions d’information, et de documenter les règles d’utilisation des données. Standards Standards de données « Les standards de données sont les règles permettant de décrire et d’enregistrer les données. Afin de partager, échanger et comprendre les données, nous devons standardiser la forme autant que le fond.» (USGS)
  • 27. Standards Extensions and the Star Schema Extensions ● GGBN Suite ● EOL References ● Germplasm Suite ● Trait measurement ● Taxon Description ● Simple Multimedia ● Literature References ● Types and Specimen ● Vernacular Names ● Audobon Media ● Darwin Core Event Etc… etc…
  • 28. Standards Extensions et Schéma en étoile Extensions ● GGBN Suite ● EOL References ● Germplasm Suite ● Trait measurement ● Taxon Description ● Simple Multimedia ● Literature References ● Types and Specimen ● Vernacular Names ● Audubon Media ● Darwin Core Event Etc… etc…
  • 29. "The idea is there locked inside. All you have to do is remove the excess stone (Michelangelo). Normalization
  • 30. "L'idée est là, enfermée à l’intérieur, et tout ce que vous avez à faire est de retirer l’excès de pierre.” (Michel-Ange) Normalisation
  • 31. Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en First Normal Form (1NF) • Remove duplicative columns • Create separate tables for related data. • Identify each row with a primary Key Second Normal Form (2NF) • First Normal Form + • Remove subsets of data for multiple rows • Create relationships with foreign keys Third Normal Form (3NF) • Remove columns not dependant on the primary key Reasons to Normalize • To minimize duplicate data. • To minimize or avoid data modification issues. • Simplify queries. Normalization What is Data Normalization? Data Normalization is the process used to organize a database into efficient tables and columns.
  • 32. Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en Première Forme Normale (1NF) • Supprimer des duplications de colonnes • Créer des tableaux différents pour les données connexes. • Identifier chaque ligne avec une clé primaire Deuxième Forme Normale (2NF) • Première Forme Normale + • Supprimer les sous-ensembles de données sur plusieurs lignes • Créer des liens avec des clés étrangères Troisième Forme Normale (3NF) • Supprimer les colonnes ne dépendant pas de la clé primaire Les raisons de la normalisation • Minimiser la duplication des données. • Minimiser ou éviter les problèmes dus aux modifications de données. • Simplifier les requêtes de données. Normalisation Qu’est ce que la normalisation des données? La normalisation des données est la procédure utilisée pour organiser de manière efficace une base de données sous forme de tableaux et de colonnes.
  • 33. "Nothing stinks like a pile of unpublished writing” Sylvia Plath Publishing
  • 34. "Rien ne pue autant qu’un tas de textes non publiés” Sylvia Plath La Publication
  • 35. Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en Reference:1B Publishing Primary Biodiversity Data by A. González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT . 13 Jan 2015 Publishing What is Data Publishing? “Publishing” refers to making biodiversity datasets publicly accessible and discoverable, in a standardized form, via an access point, typically a web address (a URL).
  • 36. Source: http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en Reference:1B Publishing Primary Biodiversity Data by A. González-Talaván1~ Data Sharing, Data Standards, and Demystifying the IPT . 13 Jan 2015 Publication Qu'est ce la Publication de Données ? La « publication » consiste à rendre des jeux de données de la biodiversité accessibles au public et découvrable, sous une forme standardisée, via un point d'accès, généralement une adresse Web (URL).
  • 37. 21st century = « century of the data » Data quantity increases exponentially GBIF is part of this movement! Well curated and standardized, these data have the potential to greatly improve our knowledge and capacities Publishing Why Publish Data
  • 38. Pourquoi publier les données ? 21ème siècle = « siècle des données » La quantité de données augmente exponentiellement Le GBIF est un acteur de ce mouvement ! Bien mises en forme et standardisées, ces données ont le potentiel d’améliorer grandement nos connaissances et aptitudes Publication
  • 39. Taxonomic research, niche modelling/species distribution prediction, invasive and alien species, habitat degradation, interspecific relationships, ... But also... Conservation biology, water management, eco-tourism, science history, hunting and fisheries, data repatriation,.. Biodiversity Data Use After Chapman, 2006 Publishing
  • 40. Recherches taxonomiques, modélisation/prédiction de la distribution des espèces, espèces invasives, dégradation des habitats, relations interspécifiques, ... Mais aussi... Organisation de la conservation, gestion de l’eau, éco-tourisme, histoire des sciences, chasse et pêche, rapatriement des données, ... Usage des données de biodiversité D’après Chapman, 2006 Publication
  • 41. Reasons to Publish ● Taxonomy ● Biogeographic studies ● Species diversity and populations ● Life histories and phenologies ● Endangered, Migratory and Invasive Species ● Impact of Climate Change ● Ecology, Evolution and Genetics ● Environmental Regionalisation ● Conservation Planning Source: https://docs.google.com/presentation/d/1iYCb3EdqwcD_Nxk5j_lFgGTLFNEz0Cu54qyUvXlSMgs/edit#slide=id.g163ca52ab8_1_7 Publishing ● Natural Resource Management ● Agriculture, Forestry, Fisheries and Mining ● Health and Public Safety ● Bioprospecting ● Forensics ● Border Control and Wildlife Trade ● Education and Public Outreach ● Ecotourism and Recreational Activities ● Society and Politics ● Human Infrastructure Planning
  • 42. Raisons de Publier ● Taxonomie ● Études biogéographiques ● Diversité des espèces et Populations ● Traits de vie and phénologies ● Espèces Menacées, Migratoires et Envahissantes ● Conséquences du Changement Climatique ● Écologie, Évolution et Génétique ● Régionalisation Environnementale ● Planification de la Conservation Source: https://docs.google.com/presentation/d/1iYCb3EdqwcD_Nxk5j_lFgGTLFNEz0Cu54qyUvXlSMgs/edit#slide=id.g163ca52ab8_1_7 Publication ● Gestion des Ressources Naturelles ● Agriculture, Sylviculture, Pêcheries et Activités Minières ● Santé et Sécurité Publique ● Bioprospection ● Médecine Légale ● Contrôle des Frontières et du Commerce d’Espèces Sauvages ● Éducation et Sensibilisation Publique ● Écotourisme et Activités Récréatives ● Société et Politiques ● Planification des Infrastructures Humaines
  • 43. Barriers to data publishing Publishing ● Lack of knowledge ● Lack of understanding ● Lack of will ● Perceived data value ● Privacy concerns ● Lack of authorization ● Lack of time / planning ● Lack of capacity ● Lack of funding ● Lack of infrastructure Psychological & cultural barriers Practical barriers Capacity barriers Institutional barriers
  • 44. Obstacles à la Publication Publication ● Manque de connaissance ● Manque de compréhension ● Manque de volonté ● Valeur perçue des données ● Questions de confidentialité ● Absence d'autorisation ● Manque de temps/planning ● Manque de moyens ● Manque de fonds ● Manque d'infrastructures Obstacles psychologiques et culturels Obstacles pratiques Obstacles liés aux ressources Obstacles institutionnels
  • 45. ● Refuse to share. ● Refuse to share until they have exhausted the planned use of the data. ● Will only share their data for a fee. ● Will only share data under specific restrictions. ● Agree to share data openly. Data restriction levels Publishing
  • 46. Niveaux de restriction Publication ● Refus de partager. ● Refus de partager jusqu'à ce que l'utilisation prévue des données soit terminée. ● Partage payant des données. ● Partage des données sous restrictions. ● Partage libre des données.
  • 47. ● Facilitate access to financial support. ● Call upon commitments or legal mandates. ● Call upon open access / moral principles. ● Show the benefits of a better data management. ● Show the benefit for their scientific careers. ● Peer pressure. ● Start / support big digitization programmes. ● Start / support data repatriation efforts. Incentives for Publishing Publishing
  • 48. Incentives pour la publication Publication ● Faciliter l'accès à un soutien financier. ● Appel à des engagements ou des mandats légaux. ● Appel à un accès ouvert/principes moraux. ● Montrer les avantages d'une meilleure gestion des données. ● Montrer les avantages pour les carrières scientifiques. ● Pression des pairs ● Démarrer/soutenir de grands programmes de numérisation. ● Démarrer/soutenir les efforts de rapatriement des données.
  • 49. Promotion of Data Publishing – EXAMPLES http://community.gbif.org/pg/forum/topic/48616/precourse-activity-promoting-data-publishing/ Publishing Challenges • Not wanting to publish and/or not wanting to publish all the data • Technical threshold of an IPT • Restrictive licensing of data Strategies • Start smaller – meta data only • Promote one-off publishing with multiple exposures • Provide hosted IPTs to eliminate technical threshold • Illustrate licensing with telling examples. • Promote and organize trainings to bring reluctant publishers in with an easier “sell” like data papers.
  • 50. Promotion de la publication de données - EXEMPLE http://community.gbif.org/pg/forum/topic/48616/precourse-activity-promoting-data-publishing/ Publication Stratégies • Commencez petit - seulement les méta-données • Promotion du fait qu’avec une seule publication au GBIF les données seront exposées dans de multiples réseaux • Fournir des IPTs hébergés pour éliminer les barrières techniques • Illustrer les licences avec des exemples éloquents. • Promouvoir et organiser des formations sur les « data papers » Défis • Ne pas vouloir publier et/ ou ne pas vouloir publier toutes les données • Exigences/ capacities techniques pour utiliser l’IPT • Licences restrictives des données
  • 53. References ● Data Quality: • http://zookeys.pensoft.net/articles.php?id=2926%7C • https://www.sophia.org/tutorials/accuracy-and-precision--3 • http://chem.libretexts.org/Core/Analytical_Chemistry/Quantifying_Nature/Significant_Digits/Uncertainties_in_Measuremen ts • http://chemistry.about.com/od/chemistrylabexperiments/qt/meniscus.htm ● Data Normalization: • http://zookeys.pensoft.net/articles.php?id=2926%7C • http://databases.about.com/od/specificproducts/a/normalization.htm • http://www.slideshare.net/JohnCutajar/relational-database-examples ● Data Standards • https://www2.usgs.gov/datamanagement/plan/datastandards.php • https://www.researchgate.net/figure/259599014_fig1_The-star-schema-showing-the-relation-of-Darwin-Core-Archive- extension-files-to-the-core • https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt ● Why Publish?: • http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en • http://www-old.gbif.org/orc/?doc_id=1300 UsefulResources
  • 54. Références ● Qualité des données : • http://zookeys.pensoft.net/articles.php?id=2926%7C • https://www.sophia.org/tutorials/accuracy-and-precision--3 • http://chem.libretexts.org/Core/Analytical_Chemistry/Quantifying_Nature/Significant_Digits/Uncertainties_in_Measurem ents • http://chemistry.about.com/od/chemistrylabexperiments/qt/meniscus.htm ● Normalisation des données : • http://zookeys.pensoft.net/articles.php?id=2926%7C • http://databases.about.com/od/specificproducts/a/normalization.htm • http://www.slideshare.net/JohnCutajar/relational-database-examples ● Standards de données • https://www2.usgs.gov/datamanagement/plan/datastandards.php • https://www.researchgate.net/figure/259599014_fig1_The-star-schema-showing-the-relation-of-Darwin-Core-Archive- extension-files-to-the-core • https://www.idigbio.org/content/data-standards-sharing-hands-experience-integrated-publishing-toolkit-ipt ● Raisons de Publier • http://community.gbif.org/pg/file/read/49318/gb22-nodes-course-session-02-2015-data-publishing-landscape-en • http://www-old.gbif.org/orc/?doc_id=1300 • http://idigbio.org/sites/default/files/workshop-presentations/demystifyingIPT/IPTiDigBio-20150113- Ressourcesutiles
  • 55. 22 AUGUST 2016 THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION Foundations for the Workshop Sharon Grant