SlideShare une entreprise Scribd logo
1  sur  57
Les standards en biodiversitéPartie 2 1er juillet 2010 Natural Solutions
Ma donnée Un gobe-mouche gris à Natural Solutions,   Donnée :  Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc. Identifié par Amandine avec des jumelles  Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
Partager ma donnée (1) Taxon scientificName : Muscicapastriata class:Aves order : Passeriformes  genus:Muscicapa Location           country:  France countryCode: FR            locality: Marseilles decimalLatitude:  43.17203           decimalLongitude:  5.22445   ,[object Object]
 Reconnu par la communauté Comprendre et utiliser la donnée  Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes.  Standard de données
Partager ma donnée (2)  Utiliser la donnée au sein au sein d’un programme / système informatique  <dwc:Taxon> <dwc:scientificName>Muscicapastriata</dwc:scientificName> <dwc:class>Aves</dwc:class>                   <dwc:order>Passeriformes </dwc:order> <dwc:genus>Muscicapa</dwc:genus> </dwc:Taxon> < dcterms:Location >  	 < dwc:country > France < dwc:country >  	 < dwc:countryCode > FR < dwc:countryCode >   	 < dwc:locality > Marseille < dwc:locality >   < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude >  	 < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >   </dcterms:Location >  Implémentation XML
Partager ma donnée (3) < protocol  id =NSprotocol.1 > < title> Identification in a corridor </title> < creator> < individualName > < surName > Sahl </ surName > </ individualName > </ creator> 	< proceduralStep >  	< description >  			 < para>Bird identification on a working place</ para >  </ description >  < instrumentation > binocular</ instrumentation >  	</proceduralStep> </protocol>  Standard de metadonnées
Partager ma donnée (4)  Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
3 groupes de standards Les standards de métadonnées    Comment sont mes données? Dublin Core EML Les standard de données   Quelles sont les données à partager? DwC ABCD  TCS Les protocoles d’échange ,[object Object],TAPIR  LSID  IPT …
Les standards de métadonnées Problématique Différents types de données de biodiversité Stockagesvariés Echellesdifférentes Données dispersées Objectif Accéder aux jeux de données de biodiversité sur le Web Quellessont les donnéesdisponibles? Comment accéder à cesdonnées ?
Définitions Les métadonnéesdécrivent les ressources et leuraccessibilité identification qualité contexte spatial distribution des jeux de données Utiliser un standard de métadonnées uneterminologie commune un ensemble de définition Eviteruneperte du sens original des données
Dublin Core Standard de metadonnées le mieux connu actuellement Initié en 1995 Objectif : découvrir les ressourcesdocumentaires du Web 15 descripteurs minimums Implémentation XML http://dublincore.org/
Exemple
EcologicalMetadataLanguage Standard de metadonnéesdéveloppé par la communautéécologique Initié en 1997 par « Ecological Society of America »   Objectif : fournirsuffisamentd’information pour être capable de réutiliser les donnéesd’unemanièrescientifique ,[object Object],Implémentation XML 1500 projets, 65 milliards d’observations de tout types (i.e. organismes, climat, etc.) http://knb.ecoinformatics.org/
Organisation EML Descripteursorganisés en classes décrivant :  le jeu de données (dataset)  l’origine des données (citation) la structure des données (software) les méthodes de création du jeu de données (protocol) l’accessibilité des données (access)
Exemple http://harvardforest.fas.harvard.edu
Standard de données de biodiversité ,[object Object],Echange de donnéesd’occurrenced’espèces Spécimensdans les collections d’histoirenaturelle et herbiers (collections vivantesincluses) Observations des organismesvivantssur le terrain 2 standards Darwin Core ABCD schema
TDWG TaxonomicDatabaseWorking Group Biodiversity Information Standards Uneorganisationinternationale à but non lucratif Développe des standards et des protocoles pour partager les données de biodiversité www.tdwg.org
Historique TDWG/CODATA (Committee on Data for Science and Technology) Sous groupe  «  Access to Biological Collections Data » 2000  Protocole de recherche des données de biodiversité Spécification des données des collections biologiques Projet BioCase DwC  + protocole DIGIR ABCD Schema GBIF Protocole BioCase
DarwinCore Définition d’un ensemble d’éléments de données (data element)   Unitéd’information de base : sens unique + valeursdistinctes Norme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des données Attributs/champs  de base de données Objectif : partage et intégration des donnéesd’observationprimaires Initialement : organisation des collections de specimens  Extensible (ajoutd’éléments de données) : fct des besoinsspécifiques http://rs.tdwg.org/dwc/
Les catégories  172 éléments de données  Organisés en 8 catégories/classes taxonID scientificNameID taxonConceptID scientificName kingdom phylum class order family genus subgenus taxonRank scientificNameAuthorship vernacularName nomenclaturalCode taxonomicStatus nomenclaturalStatus taxonRemarks … Dublin Core
Des metadonnées? Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude données institutionID collectionID datasetID institutionCode collectionCode datasetName ownerInstitutionCode basisOfRecord informationWithheld dataGeneralizations dynamicProperties Darwin Core Type Vocabulary  Valeur de l’élément de données Nature des données  Occurrence  Event Location  Taxon PreservedSpecimen FossilSpecimen LivingSpecimen HumanObservation MachineObservation NomenclaturalChecklist
Le partage Tous les termessontassignés à une URI occurenceID  :  http://rs.tdwg.org/dwc/terms/occurrenceID implementation XML + XML/RDF
Extensions Information spécifique à une discipline  Geospatial DecimalLatitude- DecimalLongitude – VerbatimCoordinates - … Paleontologie EarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - …	 Nettoyage ( Curation ) IdentifiedBy- DateIdentified -  FieldNotes - …
Simple Darwin Core  Sous ensemble de 46 éléments de données Attributs des tableurs et bases de données Pas les termesreprésentant les différentescatégories (liste plate) Partage simple des donnéestaxonomiques et de leurs occurrences
Exemple <dwc:Taxon> <dwc:scientificName>Anthuscorrendera</dwc:scientificName> <dwc:class>Aves</dwc:class> <dwc:genus>Anthus</dwc:genus> <dwc:specificEpithet>correndera</dwc:specificEpithet> <dwc:occurrenceID>urn:catalog:AUDCLO:EBIRD:OBS64515286</dwc:occurrenceID> </dwc:Taxon>
Utilisation Largement utilisé GBIF  (Global Biodiversity information facility) www.gbif.org OBIS  (OceanBiogeographic Information System) www.iobis.org ALA (Atlas of Living Australia)  	www.ala.org.au Inventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour …
ABCD schema Schémahierarchique de spécification de données Echange des données de collections  Specimens Observations Completdonccomplexe  1200 éléments de données Capable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiques Suffisammentd’éléments de données pour être compatible avec beaucoup de standards  Implémentation XML www.tdwg.org/activities/abcd/
Extrait Metadonnées?
Exemple
Visualiser ABCD schema http://www.bgbm.org/scripts/ASP/TDWG/frame.asp?config=0&configurl=http://www.bgbm.org/TDWG/CODATA/Schema/schemaviewer_configs/conf_abcd_206.xml
Extensions Extension pour les Geosciences (EFG) http://www.geocase.eu/ Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/ Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
MappingDwC – ABCD schema
Utilisation Largement utilisé aussi (par les mêmes?) GBIF ALA …
Taxon Concept schema(Taxonomic taxon transfert schema) Problématique Données de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomique Partager les donnéesnécessitentd’utiliser la mêmetaxonomie www.tdwg.org/standards/117/
Objectifs Développer un modèleabstrait de concepts taxonomiques Etablir des relations entre les concepts taxonomiques des fournisseurs de données Standard XML pour faciliterl’échange de données entre les différentsfournisseurs faciliterl’interrogation des données
Définitions  TCS est un format d’échange de données ,[object Object],2 élémentsclés <TaxonConcept> : monde réel, exprimeune opinion sur le taxon et ses relations avec d’autrestaxons <TaxonName> : nomenclature abstraite, encapsule les règles des différentes nomenclatures
Extrait
Exemple (1) <TaxonNames>  	<TaxonName id="123" nomenclaturalCode="Botanical">  	<Simple>Dianthus</Simple>  	<Rank code="gen">genus</Rank>  </TaxonName>  <TaxonName id="124" nomenclaturalCode="Botanical">  	<Simple>DianthusgratianopolitanusVill.</Simple>  	<Rank code="sp">species</Rank>  	<CanonicalName>  	<Simple>Dianthusgratianopolitanus</Simple>  	<Genusref="123">Dianthus</Genus>  	</CanonicalName>  </TaxonName>  	<TaxonName id="125" nomenclaturalCode="Botanical">  	<Simple>Dianthuscaesius Sm.</Simple>  	<Rank code="sp">species</Rank>  	<CanonicalName>  	<Simple>Dianthuscaesius</Simple>  	<Genusref="123">Dianthus</Genus>  	<SpecificEpithet>caesius</SpecificEpithet>  </CanonicalName>  	</TaxonName>
Exemple (2) <TaxonConcepts>                           <TaxonConcept id="988">                        <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name>                        <AccordingTo>                                      <AccordingToSimple>  Clapham, Tutin &amp; Moore (1987)                                        </AccordingToSimple>                          </AccordingTo>              <TaxonRelationships>                        <TaxonRelationship type="has synonym">                        <ToTaxonConceptref="989"/>                         </TaxonRelationship>             </TaxonRelationships>               </TaxonConcept>             <TaxonConcept type="nominal" id="989">             		< Name scientific="true" ref="125">Dianthus caesius</Name>              </TaxonConcept>
Utilisation GBIF dans son projet de « Global Names Architecture » TCS est utilisé pour faciliter l’échange des données taxonomiques.
Conclusion sur les standards de données DwC, ABCD schema et TSC spécifiques aux collections Moinsappropriés (pour l’instant) aux observations – Protocoles ? – Données manquantes ? – Regroupementautrequetaxonomique ? – Attributs spatiaux ? ,[object Object]
Utilisation conjointe avec les standards de métadonnées,[object Object]
Les protocoles Protocole = comment lierouéchanger les données • Protocoles existants – TAPIR LSID & RDF – DwC-A IPT
TAPIR Protocole pour interroger les bases de données existantes Remplace : DiGIR (utilisant DwC comme standard) BioCASe (utilisant ABCD schema comme standard) Indépendant du standard, mais un standard de donnéesestnécessaire Utilisé principalement par GBIF www.tdwg.org/activities/tapir
TAPIR
TAPIR
TAPIR
TAPIR
TAPIR
LSID & RDF LSID = Life Science Identifier Type de GUID = Global Unique Identifier LSID = chaîne de caractères + format urn:lsid:ubio.org:namebank:11815 http://lsids.sourceforge.net/
LSID & RDF Utilisation : Identification d’un objet Retrouver les metadonnées associées (standard) RDF = Resource Description Framework RDF = Format de réponse des requêtes sur le LSID Nombreuxoutils pour résoudre et échanger les LSID  http://lsid.tdwg.org/
LSID & RDF http://lsid.tdwg.org/urn:lsid:ubio.org:namebank:11815
Darwin Core archive Pas vraiment un protocole Moyen de publier les données au sein du GBIF DwC-A contient un jeu de donnéesentierbasésur des fichierstextes Le format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions  Une archive = un ensemble de fichiertexteszippés
Dwc-A
IntegratedPublishingToolkit IPT = Une application web ,[object Object],	Données primaires 	Information sur les espèces 	Métadonnées sur les ressources ,[object Object],Fichier plat Base de données Pour rendre ces données visibles sur le réseau distribué du GBIF
IPT -Portails de données -Réseaux distribués -Accès aux enregistrements  individuels -Clients GIS -GeoPortals Catalogues de Métadonnées -Transport rapide des    données -Création d’index

Contenu connexe

Similaire à Geo web standards for biodiversity

Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...Fleury Christine
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheAgropolis International
 
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Alberto González-Talaván
 
Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Esther Kaboré Dzalé
 
Databases for Bioinformatics
Databases for BioinformaticsDatabases for Bioinformatics
Databases for BioinformaticsKarim Mezhoud
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Desconnets Jean-Christophe
 
Introduction à l'informatique documentaire
Introduction à l'informatique documentaireIntroduction à l'informatique documentaire
Introduction à l'informatique documentaireSylvain Machefert
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesY. Nicolas
 
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEXJABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEXABES
 
le web sémantique : un web de métadonnées
le web sémantique : un web de métadonnéesle web sémantique : un web de métadonnées
le web sémantique : un web de métadonnéesABES
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sensFabien Gandon
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDAnonue12
 
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...Lesticetlart Invisu
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèseY. Nicolas
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introductionjbcomte
 
Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texteEstelle Delpech
 
Présentation genève 20130617
Présentation genève 20130617Présentation genève 20130617
Présentation genève 20130617Tobias Wildi
 

Similaire à Geo web standards for biodiversity (20)

Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
 
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
 
Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...
 
Databases for Bioinformatics
Databases for BioinformaticsDatabases for Bioinformatics
Databases for Bioinformatics
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...
 
Introduction à l'informatique documentaire
Introduction à l'informatique documentaireIntroduction à l'informatique documentaire
Introduction à l'informatique documentaire
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEXJABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
 
le web sémantique : un web de métadonnées
le web sémantique : un web de métadonnéesle web sémantique : un web de métadonnées
le web sémantique : un web de métadonnées
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
Gestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUEGestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUE
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDA
 
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introduction
 
Presentation Dess Ebi
Presentation Dess EbiPresentation Dess Ebi
Presentation Dess Ebi
 
Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texte
 
Présentation genève 20130617
Présentation genève 20130617Présentation genève 20130617
Présentation genève 20130617
 

Plus de Olivier Rovellotti (20)

Hack4 nature Tree from satellite
Hack4 nature Tree from satelliteHack4 nature Tree from satellite
Hack4 nature Tree from satellite
 
Etoile du berger
Etoile du bergerEtoile du berger
Etoile du berger
 
Methode ux
Methode uxMethode ux
Methode ux
 
Opendata arles
Opendata arlesOpendata arles
Opendata arles
 
Ns biodiversity next julien corny rovellotti olivier 2
Ns biodiversity next julien corny rovellotti olivier 2Ns biodiversity next julien corny rovellotti olivier 2
Ns biodiversity next julien corny rovellotti olivier 2
 
The quest for new empowered citizen scientists
The quest for new empowered citizen scientistsThe quest for new empowered citizen scientists
The quest for new empowered citizen scientists
 
A la découverte de l'ux design
A la découverte de l'ux designA la découverte de l'ux design
A la découverte de l'ux design
 
Gamification, Ludification de l’expérience énergie
Gamification, Ludification de l’expérience énergie Gamification, Ludification de l’expérience énergie
Gamification, Ludification de l’expérience énergie
 
Le donut tour metropole
Le donut tour metropoleLe donut tour metropole
Le donut tour metropole
 
Ns ux-emotion
Ns ux-emotionNs ux-emotion
Ns ux-emotion
 
Ns ux-ethique
Ns ux-ethiqueNs ux-ethique
Ns ux-ethique
 
Datasud barcamp
Datasud barcampDatasud barcamp
Datasud barcamp
 
Datasud barcamp 2
Datasud barcamp 2Datasud barcamp 2
Datasud barcamp 2
 
Scapin et bastien
Scapin et bastienScapin et bastien
Scapin et bastien
 
Ns cleo lodel ux
Ns cleo lodel uxNs cleo lodel ux
Ns cleo lodel ux
 
Ns python flask 3
Ns python flask 3Ns python flask 3
Ns python flask 3
 
Ns python flask 2
Ns python flask 2Ns python flask 2
Ns python flask 2
 
Ns python-flask
Ns python-flaskNs python-flask
Ns python-flask
 
Ns python web 1
Ns python web 1Ns python web 1
Ns python web 1
 
Ns python-exercices
Ns python-exercicesNs python-exercices
Ns python-exercices
 

Geo web standards for biodiversity

  • 1. Les standards en biodiversitéPartie 2 1er juillet 2010 Natural Solutions
  • 2. Ma donnée Un gobe-mouche gris à Natural Solutions,  Donnée : Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc. Identifié par Amandine avec des jumelles  Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
  • 3.
  • 4. Reconnu par la communauté Comprendre et utiliser la donnée  Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes.  Standard de données
  • 5. Partager ma donnée (2)  Utiliser la donnée au sein au sein d’un programme / système informatique <dwc:Taxon> <dwc:scientificName>Muscicapastriata</dwc:scientificName> <dwc:class>Aves</dwc:class> <dwc:order>Passeriformes </dwc:order> <dwc:genus>Muscicapa</dwc:genus> </dwc:Taxon> < dcterms:Location >   < dwc:country > France < dwc:country >  < dwc:countryCode > FR < dwc:countryCode >   < dwc:locality > Marseille < dwc:locality > < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude >   < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >  </dcterms:Location >  Implémentation XML
  • 6. Partager ma donnée (3) < protocol id =NSprotocol.1 > < title> Identification in a corridor </title> < creator> < individualName > < surName > Sahl </ surName > </ individualName > </ creator> < proceduralStep > < description >   < para>Bird identification on a working place</ para >  </ description >  < instrumentation > binocular</ instrumentation >   </proceduralStep> </protocol>  Standard de metadonnées
  • 7. Partager ma donnée (4)  Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
  • 8.
  • 9. Les standards de métadonnées Problématique Différents types de données de biodiversité Stockagesvariés Echellesdifférentes Données dispersées Objectif Accéder aux jeux de données de biodiversité sur le Web Quellessont les donnéesdisponibles? Comment accéder à cesdonnées ?
  • 10. Définitions Les métadonnéesdécrivent les ressources et leuraccessibilité identification qualité contexte spatial distribution des jeux de données Utiliser un standard de métadonnées uneterminologie commune un ensemble de définition Eviteruneperte du sens original des données
  • 11. Dublin Core Standard de metadonnées le mieux connu actuellement Initié en 1995 Objectif : découvrir les ressourcesdocumentaires du Web 15 descripteurs minimums Implémentation XML http://dublincore.org/
  • 13.
  • 14. Organisation EML Descripteursorganisés en classes décrivant : le jeu de données (dataset) l’origine des données (citation) la structure des données (software) les méthodes de création du jeu de données (protocol) l’accessibilité des données (access)
  • 15.
  • 17.
  • 18. TDWG TaxonomicDatabaseWorking Group Biodiversity Information Standards Uneorganisationinternationale à but non lucratif Développe des standards et des protocoles pour partager les données de biodiversité www.tdwg.org
  • 19. Historique TDWG/CODATA (Committee on Data for Science and Technology) Sous groupe «  Access to Biological Collections Data » 2000 Protocole de recherche des données de biodiversité Spécification des données des collections biologiques Projet BioCase DwC + protocole DIGIR ABCD Schema GBIF Protocole BioCase
  • 20. DarwinCore Définition d’un ensemble d’éléments de données (data element) Unitéd’information de base : sens unique + valeursdistinctes Norme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des données Attributs/champs de base de données Objectif : partage et intégration des donnéesd’observationprimaires Initialement : organisation des collections de specimens Extensible (ajoutd’éléments de données) : fct des besoinsspécifiques http://rs.tdwg.org/dwc/
  • 21. Les catégories 172 éléments de données Organisés en 8 catégories/classes taxonID scientificNameID taxonConceptID scientificName kingdom phylum class order family genus subgenus taxonRank scientificNameAuthorship vernacularName nomenclaturalCode taxonomicStatus nomenclaturalStatus taxonRemarks … Dublin Core
  • 22. Des metadonnées? Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude données institutionID collectionID datasetID institutionCode collectionCode datasetName ownerInstitutionCode basisOfRecord informationWithheld dataGeneralizations dynamicProperties Darwin Core Type Vocabulary  Valeur de l’élément de données Nature des données Occurrence Event Location Taxon PreservedSpecimen FossilSpecimen LivingSpecimen HumanObservation MachineObservation NomenclaturalChecklist
  • 23. Le partage Tous les termessontassignés à une URI occurenceID : http://rs.tdwg.org/dwc/terms/occurrenceID implementation XML + XML/RDF
  • 24. Extensions Information spécifique à une discipline Geospatial DecimalLatitude- DecimalLongitude – VerbatimCoordinates - … Paleontologie EarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - … Nettoyage ( Curation ) IdentifiedBy- DateIdentified - FieldNotes - …
  • 25. Simple Darwin Core Sous ensemble de 46 éléments de données Attributs des tableurs et bases de données Pas les termesreprésentant les différentescatégories (liste plate) Partage simple des donnéestaxonomiques et de leurs occurrences
  • 26. Exemple <dwc:Taxon> <dwc:scientificName>Anthuscorrendera</dwc:scientificName> <dwc:class>Aves</dwc:class> <dwc:genus>Anthus</dwc:genus> <dwc:specificEpithet>correndera</dwc:specificEpithet> <dwc:occurrenceID>urn:catalog:AUDCLO:EBIRD:OBS64515286</dwc:occurrenceID> </dwc:Taxon>
  • 27. Utilisation Largement utilisé GBIF (Global Biodiversity information facility) www.gbif.org OBIS (OceanBiogeographic Information System) www.iobis.org ALA (Atlas of Living Australia) www.ala.org.au Inventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour …
  • 28. ABCD schema Schémahierarchique de spécification de données Echange des données de collections Specimens Observations Completdonccomplexe  1200 éléments de données Capable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiques Suffisammentd’éléments de données pour être compatible avec beaucoup de standards Implémentation XML www.tdwg.org/activities/abcd/
  • 31. Visualiser ABCD schema http://www.bgbm.org/scripts/ASP/TDWG/frame.asp?config=0&configurl=http://www.bgbm.org/TDWG/CODATA/Schema/schemaviewer_configs/conf_abcd_206.xml
  • 32. Extensions Extension pour les Geosciences (EFG) http://www.geocase.eu/ Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/ Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
  • 34. Utilisation Largement utilisé aussi (par les mêmes?) GBIF ALA …
  • 35. Taxon Concept schema(Taxonomic taxon transfert schema) Problématique Données de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomique Partager les donnéesnécessitentd’utiliser la mêmetaxonomie www.tdwg.org/standards/117/
  • 36. Objectifs Développer un modèleabstrait de concepts taxonomiques Etablir des relations entre les concepts taxonomiques des fournisseurs de données Standard XML pour faciliterl’échange de données entre les différentsfournisseurs faciliterl’interrogation des données
  • 37.
  • 39. Exemple (1) <TaxonNames> <TaxonName id="123" nomenclaturalCode="Botanical"> <Simple>Dianthus</Simple> <Rank code="gen">genus</Rank> </TaxonName> <TaxonName id="124" nomenclaturalCode="Botanical"> <Simple>DianthusgratianopolitanusVill.</Simple> <Rank code="sp">species</Rank> <CanonicalName> <Simple>Dianthusgratianopolitanus</Simple> <Genusref="123">Dianthus</Genus> </CanonicalName> </TaxonName> <TaxonName id="125" nomenclaturalCode="Botanical"> <Simple>Dianthuscaesius Sm.</Simple> <Rank code="sp">species</Rank> <CanonicalName> <Simple>Dianthuscaesius</Simple> <Genusref="123">Dianthus</Genus> <SpecificEpithet>caesius</SpecificEpithet> </CanonicalName> </TaxonName>
  • 40. Exemple (2) <TaxonConcepts> <TaxonConcept id="988"> <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name> <AccordingTo> <AccordingToSimple> Clapham, Tutin &amp; Moore (1987) </AccordingToSimple> </AccordingTo> <TaxonRelationships> <TaxonRelationship type="has synonym"> <ToTaxonConceptref="989"/> </TaxonRelationship> </TaxonRelationships> </TaxonConcept> <TaxonConcept type="nominal" id="989"> < Name scientific="true" ref="125">Dianthus caesius</Name> </TaxonConcept>
  • 41. Utilisation GBIF dans son projet de « Global Names Architecture » TCS est utilisé pour faciliter l’échange des données taxonomiques.
  • 42.
  • 43.
  • 44. Les protocoles Protocole = comment lierouéchanger les données • Protocoles existants – TAPIR LSID & RDF – DwC-A IPT
  • 45. TAPIR Protocole pour interroger les bases de données existantes Remplace : DiGIR (utilisant DwC comme standard) BioCASe (utilisant ABCD schema comme standard) Indépendant du standard, mais un standard de donnéesestnécessaire Utilisé principalement par GBIF www.tdwg.org/activities/tapir
  • 46. TAPIR
  • 47. TAPIR
  • 48. TAPIR
  • 49. TAPIR
  • 50. TAPIR
  • 51. LSID & RDF LSID = Life Science Identifier Type de GUID = Global Unique Identifier LSID = chaîne de caractères + format urn:lsid:ubio.org:namebank:11815 http://lsids.sourceforge.net/
  • 52. LSID & RDF Utilisation : Identification d’un objet Retrouver les metadonnées associées (standard) RDF = Resource Description Framework RDF = Format de réponse des requêtes sur le LSID Nombreuxoutils pour résoudre et échanger les LSID http://lsid.tdwg.org/
  • 53. LSID & RDF http://lsid.tdwg.org/urn:lsid:ubio.org:namebank:11815
  • 54. Darwin Core archive Pas vraiment un protocole Moyen de publier les données au sein du GBIF DwC-A contient un jeu de donnéesentierbasésur des fichierstextes Le format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions Une archive = un ensemble de fichiertexteszippés
  • 55. Dwc-A
  • 56.
  • 57. IPT -Portails de données -Réseaux distribués -Accès aux enregistrements individuels -Clients GIS -GeoPortals Catalogues de Métadonnées -Transport rapide des données -Création d’index
  • 58. Conclusion Partager les données de biodiversité : Utiliser un standard de données Utiliser un standard de metadonnées Utiliser un protocole d’échange Applications