SlideShare une entreprise Scribd logo
Les standards en biodiversité 1er juillet 2010 Natural Solutions julie_chabalier@natural-solutions.eu
Ma donnée Un gobe-mouche gris à Natural Solutions,   Donnée :  Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc. Identifié par Amandine avec des jumelles  Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
Partager ma donnée (1) Taxon scientificName : Muscicapastriata class:Aves order : Passeriformes  genus:Muscicapa Location           country:  France countryCode: FR            locality: Marseilles decimalLatitude:  43.17203           decimalLongitude:  5.22445   ,[object Object]
 Reconnu par la communauté Comprendre et utiliser la donnée  Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes.  Standard de données
Partager ma donnée (2)  Utiliser la donnée au sein au sein d’un programme / système informatique  <dwc:Taxon> <dwc:scientificName>Muscicapastriata</dwc:scientificName> <dwc:class>Aves</dwc:class>                   <dwc:order>Passeriformes </dwc:order> <dwc:genus>Muscicapa</dwc:genus> </dwc:Taxon> < dcterms:Location >  	 < dwc:country > France < dwc:country >  	 < dwc:countryCode > FR < dwc:countryCode >   	 < dwc:locality > Marseille < dwc:locality >   < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude >  	 < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >   </dcterms:Location >  Implémentation XML
Partager ma donnée (3) < protocol  id =NSprotocol.1 > < title> Identification in a corridor </title> < creator> < individualName > < surName > Sahl </ surName > </ individualName > </ creator> 	< proceduralStep >  	< description >  			 < para>Bird identification on a working place</ para >  </ description >  < instrumentation > binocular</ instrumentation >  	</proceduralStep> </protocol>  Standard de metadonnées
Partager ma donnée (4)  Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
3 groupes de standards Les standards de métadonnées    Comment sont mes données? Dublin Core EML Les standard de données   Quelles sont les données à partager? DwC ABCD  TCS Les protocoles d’échange ,[object Object],TAPIR  LSID  IPT …
Les standards de métadonnées Problématique Différents types de données de biodiversité Stockagesvariés Echellesdifférentes Données dispersées Objectif Accéder aux jeux de données de biodiversité sur le Web Quellessont les donnéesdisponibles? Comment accéder à cesdonnées ?
Définitions Les métadonnéesdécrivent les ressources et leuraccessibilité identification qualité contexte spatial distribution des jeux de données Utiliser un standard de métadonnées uneterminologie commune un ensemble de définition Eviteruneperte du sens original des données
Dublin Core Standard de metadonnées le mieux connu actuellement Initié en 1995 Objectif : découvrir les ressourcesdocumentaires du Web 15 descripteurs minimums Implémentation XML http://dublincore.org/
Exemple
EcologicalMetadataLanguage Standard de metadonnéesdéveloppé par la communautéécologique Initié en 1997 par « Ecological Society of America »   Objectif : fournirsuffisamentd’information pour être capable de réutiliser les donnéesd’unemanièrescientifique ,[object Object],Implémentation XML 1500 projets, 65 milliards d’observations de tout types (i.e. organismes, climat, etc.) http://knb.ecoinformatics.org/
Organisation EML Descripteursorganisés en classes décrivant :  le jeu de données (dataset)  l’origine des données (citation) la structure des données (software) les méthodes de création du jeu de données (protocol) l’accessibilité des données (access)
Exemple http://harvardforest.fas.harvard.edu
Standard de données de biodiversité ,[object Object],Echange de donnéesd’occurrenced’espèces Spécimensdans les collections d’histoirenaturelle et herbiers (collections vivantesincluses) Observations des organismesvivantssur le terrain 2 standards Darwin Core ABCD schema
TDWG TaxonomicDatabaseWorking Group Biodiversity Information Standards Uneorganisationinternationale à but non lucratif Développe des standards et des protocoles pour partager les données de biodiversité www.tdwg.org
Historique TDWG/CODATA (Committee on Data for Science and Technology) Sous groupe  «  Access to Biological Collections Data » 2000  Protocole de recherche des données de biodiversité Spécification des données des collections biologiques Projet BioCase DwC  + protocole DIGIR ABCD Schema GBIF Protocole BioCase
DarwinCore Définition d’un ensemble d’éléments de données (data element)   Unitéd’information de base : sens unique + valeursdistinctes Norme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des données Attributs/champs  de base de données Objectif : partage et intégration des donnéesd’observationprimaires Initialement : organisation des collections de specimens  Extensible (ajoutd’éléments de données) : fct des besoinsspécifiques http://rs.tdwg.org/dwc/
Les catégories  172 éléments de données  Organisés en 8 catégories/classes taxonID scientificNameID taxonConceptID scientificName kingdom phylum class order family genus subgenus taxonRank scientificNameAuthorship vernacularName nomenclaturalCode taxonomicStatus nomenclaturalStatus taxonRemarks … Dublin Core
Des metadonnées? Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude données institutionID collectionID datasetID institutionCode collectionCode datasetName ownerInstitutionCode basisOfRecord informationWithheld dataGeneralizations dynamicProperties Darwin Core Type Vocabulary  Valeur de l’élément de données Nature des données  Occurrence  Event Location  Taxon PreservedSpecimen FossilSpecimen LivingSpecimen HumanObservation MachineObservation NomenclaturalChecklist
Le partage Tous les termessontassignés à une URI occurenceID  :  http://rs.tdwg.org/dwc/terms/occurrenceID implementation XML + XML/RDF
Extensions Information spécifique à une discipline  Geospatial DecimalLatitude- DecimalLongitude – VerbatimCoordinates - … Paleontologie EarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - …	 Nettoyage ( Curation ) IdentifiedBy- DateIdentified -  FieldNotes - …
Simple Darwin Core  Sous ensemble de 46 éléments de données Attributs des tableurs et bases de données Pas les termesreprésentant les différentescatégories (liste plate) Partage simple des donnéestaxonomiques et de leurs occurrences
Exemple <dwc:Taxon> <dwc:scientificName>Anthuscorrendera</dwc:scientificName> <dwc:class>Aves</dwc:class> <dwc:genus>Anthus</dwc:genus> <dwc:specificEpithet>correndera</dwc:specificEpithet> <dwc:occurrenceID>urn:catalog:AUDCLO:EBIRD:OBS64515286</dwc:occurrenceID> </dwc:Taxon>
Utilisation Largement utilisé GBIF  (Global Biodiversity information facility) www.gbif.org OBIS  (OceanBiogeographic Information System) www.iobis.org ALA (Atlas of Living Australia)  	www.ala.org.au Inventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour …
ABCD schema Schémahierarchique de spécification de données Echange des données de collections  Specimens Observations Completdonccomplexe  1200 éléments de données Capable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiques Suffisammentd’éléments de données pour être compatible avec beaucoup de standards  Implémentation XML www.tdwg.org/activities/abcd/
Extrait Metadonnées?
Exemple
Visualiser ABCD schema http://www.bgbm.org/scripts/ASP/TDWG/frame.asp?config=0&configurl=http://www.bgbm.org/TDWG/CODATA/Schema/schemaviewer_configs/conf_abcd_206.xml
Extensions Extension pour les Geosciences (EFG) http://www.geocase.eu/ Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/ Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
MappingDwC – ABCD schema
Utilisation Largement utilisé aussi (par les mêmes?) GBIF ALA …
Taxon Concept schema(Taxonomic taxon transfert schema) Problématique Données de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomique Partager les donnéesnécessitentd’utiliser la mêmetaxonomie www.tdwg.org/standards/117/
Objectifs Développer un modèleabstrait de concepts taxonomiques Etablir des relations entre les concepts taxonomiques des fournisseurs de données Standard XML pour faciliterl’échange de données entre les différentsfournisseurs faciliterl’interrogation des données
Définitions  TCS est un format d’échange de données ,[object Object],2 élémentsclés <TaxonConcept> : monde réel, exprimeune opinion sur le taxon et ses relations avec d’autrestaxons <TaxonName> : nomenclature abstraite, encapsule les règles des différentes nomenclatures
Extrait
Exemple (1) <TaxonNames>  	<TaxonName id="123" nomenclaturalCode="Botanical">  	<Simple>Dianthus</Simple>  	<Rank code="gen">genus</Rank>  </TaxonName>  <TaxonName id="124" nomenclaturalCode="Botanical">  	<Simple>DianthusgratianopolitanusVill.</Simple>  	<Rank code="sp">species</Rank>  	<CanonicalName>  	<Simple>Dianthusgratianopolitanus</Simple>  	<Genusref="123">Dianthus</Genus>  	</CanonicalName>  </TaxonName>  	<TaxonName id="125" nomenclaturalCode="Botanical">  	<Simple>Dianthuscaesius Sm.</Simple>  	<Rank code="sp">species</Rank>  	<CanonicalName>  	<Simple>Dianthuscaesius</Simple>  	<Genusref="123">Dianthus</Genus>  	<SpecificEpithet>caesius</SpecificEpithet>  </CanonicalName>  	</TaxonName>
Exemple (2) <TaxonConcepts>                           <TaxonConcept id="988">                        <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name>                        <AccordingTo>                                      <AccordingToSimple>  Clapham, Tutin &amp; Moore (1987)                                        </AccordingToSimple>                          </AccordingTo>              <TaxonRelationships>                        <TaxonRelationship type="has synonym">                        <ToTaxonConceptref="989"/>                         </TaxonRelationship>             </TaxonRelationships>               </TaxonConcept>             <TaxonConcept type="nominal" id="989">             		< Name scientific="true" ref="125">Dianthus caesius</Name>              </TaxonConcept>
Utilisation GBIF dans son projet de « Global Names Architecture » TCS est utilisé pour faciliter l’échange des données taxonomiques.
Conclusion sur les standards de données DwC, ABCD schema et TSC spécifiques aux collections Moinsappropriés (pour l’instant) aux observations – Protocoles ? – Données manquantes ? – Regroupementautrequetaxonomique ? – Attributs spatiaux ? ,[object Object]
Utilisation conjointe avec les standards de métadonnées,[object Object]
Les protocoles Protocole = comment lierouéchanger les données • Protocoles existants – TAPIR LSID & RDF – DwC-A IPT
TAPIR Protocole pour interroger les bases de données existantes Remplace : DiGIR (utilisant DwC comme standard) BioCASe (utilisant ABCD schema comme standard) Indépendant du standard, mais un standard de donnéesestnécessaire Utilisé principalement par GBIF www.tdwg.org/activities/tapir
TAPIR
TAPIR
TAPIR
TAPIR
TAPIR
LSID & RDF LSID = Life Science Identifier Type de GUID = Global Unique Identifier LSID = chaîne de caractères + format urn:lsid:ubio.org:namebank:11815 http://lsids.sourceforge.net/
LSID & RDF Utilisation : Identification d’un objet Retrouver les metadonnées associées (standard) RDF = Resource Description Framework RDF = Format de réponse des requêtes sur le LSID Nombreuxoutils pour résoudre et échanger les LSID  http://lsid.tdwg.org/
LSID & RDF http://lsid.tdwg.org/urn:lsid:ubio.org:namebank:11815
Darwin Core archive Pas vraiment un protocole Moyen de publier les données au sein du GBIF DwC-A contient un jeu de donnéesentierbasésur des fichierstextes Le format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions  Une archive = un ensemble de fichiertexteszippés
Dwc-A
IntegratedPublishingToolkit IPT = Une application web ,[object Object],	Données primaires 	Information sur les espèces 	Métadonnées sur les ressources ,[object Object],Fichier plat Base de données Pour rendre ces données visibles sur le réseau distribué du GBIF
IPT -Portails de données -Réseaux distribués -Accès aux enregistrements  individuels -Clients GIS -GeoPortals Catalogues de Métadonnées -Transport rapide des    données -Création d’index

Contenu connexe

En vedette

Le japonais et le riz
Le japonais et le rizLe japonais et le riz
Le japonais et le riz
denis
 
Perfection.prof bouctouche.aout2011
Perfection.prof bouctouche.aout2011Perfection.prof bouctouche.aout2011
Perfection.prof bouctouche.aout2011
langisj
 
Fabulas presentacion
Fabulas presentacionFabulas presentacion
Fabulas presentacion
maestro08
 
Trabajo de red inalámbrica
Trabajo de red inalámbrica Trabajo de red inalámbrica
Trabajo de red inalámbrica
lorena salazar
 
Ce pc8 guia9
Ce pc8 guia9Ce pc8 guia9
Ce pc8 guia9
vaninac
 
Valijas viajera ppt
Valijas viajera pptValijas viajera ppt
Valijas viajera ppt
ana carcamo
 
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
Save Solutions
 
Bloque cero pacie
Bloque cero pacieBloque cero pacie
Bloque cero pacie
Ligia
 

En vedette (20)

Chapitres 8 9-10 - étude du vivant
Chapitres 8 9-10 - étude du vivantChapitres 8 9-10 - étude du vivant
Chapitres 8 9-10 - étude du vivant
 
Le japonais et le riz
Le japonais et le rizLe japonais et le riz
Le japonais et le riz
 
Ch35 23
Ch35 23Ch35 23
Ch35 23
 
Perfection.prof bouctouche.aout2011
Perfection.prof bouctouche.aout2011Perfection.prof bouctouche.aout2011
Perfection.prof bouctouche.aout2011
 
Pratiques écologiques
Pratiques écologiquesPratiques écologiques
Pratiques écologiques
 
Google Scholar : un moteur de recherche pour l'information scientifique
Google Scholar : un moteur de recherche pour l'information scientifiqueGoogle Scholar : un moteur de recherche pour l'information scientifique
Google Scholar : un moteur de recherche pour l'information scientifique
 
Inteligencia Competitiva
Inteligencia CompetitivaInteligencia Competitiva
Inteligencia Competitiva
 
Fabulas presentacion
Fabulas presentacionFabulas presentacion
Fabulas presentacion
 
Trabajo de red inalámbrica
Trabajo de red inalámbrica Trabajo de red inalámbrica
Trabajo de red inalámbrica
 
PLAN ORGÁNICO INSPECTORIAL 2010 - 2014
PLAN ORGÁNICO INSPECTORIAL 2010 - 2014PLAN ORGÁNICO INSPECTORIAL 2010 - 2014
PLAN ORGÁNICO INSPECTORIAL 2010 - 2014
 
Ce pc8 guia9
Ce pc8 guia9Ce pc8 guia9
Ce pc8 guia9
 
Valijas viajera ppt
Valijas viajera pptValijas viajera ppt
Valijas viajera ppt
 
Ghandi paz
Ghandi pazGhandi paz
Ghandi paz
 
Aplicaciones
AplicacionesAplicaciones
Aplicaciones
 
El aire acondicionado
El aire acondicionadoEl aire acondicionado
El aire acondicionado
 
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
 
Mon idole. ana
Mon idole. anaMon idole. ana
Mon idole. ana
 
Proyecto de Capacitación Fatla Grupo U, CAPACITACIÓN VIRTUAL EN EL USO DE LA ...
Proyecto de Capacitación Fatla Grupo U, CAPACITACIÓN VIRTUAL EN EL USO DE LA ...Proyecto de Capacitación Fatla Grupo U, CAPACITACIÓN VIRTUAL EN EL USO DE LA ...
Proyecto de Capacitación Fatla Grupo U, CAPACITACIÓN VIRTUAL EN EL USO DE LA ...
 
Bloque cero pacie
Bloque cero pacieBloque cero pacie
Bloque cero pacie
 
Carnes
CarnesCarnes
Carnes
 

Similaire à Les standards en biodiversité

Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...
Esther Kaboré Dzalé
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introduction
jbcomte
 
Présentation genève 20130617
Présentation genève 20130617Présentation genève 20130617
Présentation genève 20130617
Tobias Wildi
 

Similaire à Les standards en biodiversité (20)

Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
 
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
 
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
 
Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...Publication de données d'observation dans le Web de données - Retour d'expéri...
Publication de données d'observation dans le Web de données - Retour d'expéri...
 
Databases for Bioinformatics
Databases for BioinformaticsDatabases for Bioinformatics
Databases for Bioinformatics
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 
Introduction à l'informatique documentaire
Introduction à l'informatique documentaireIntroduction à l'informatique documentaire
Introduction à l'informatique documentaire
 
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEXJABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 
Gestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUEGestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUE
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
le web sémantique : un web de métadonnées
le web sémantique : un web de métadonnéesle web sémantique : un web de métadonnées
le web sémantique : un web de métadonnées
 
JIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - IntroductionJIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - Introduction
 
Presentation Dess Ebi
Presentation Dess EbiPresentation Dess Ebi
Presentation Dess Ebi
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDA
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introduction
 
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
 
Présentation genève 20130617
Présentation genève 20130617Présentation genève 20130617
Présentation genève 20130617
 
Vers une intégration complète des standards de description du Conseil interna...
Vers une intégration complète des standards de description du Conseil interna...Vers une intégration complète des standards de description du Conseil interna...
Vers une intégration complète des standards de description du Conseil interna...
 

Plus de jchabalier (8)

ecoOnto - une ontologie pour la biodiversité
ecoOnto - une ontologie pour la biodiversitéecoOnto - une ontologie pour la biodiversité
ecoOnto - une ontologie pour la biodiversité
 
Thesauform - ecoOnto meeting
Thesauform - ecoOnto meetingThesauform - ecoOnto meeting
Thesauform - ecoOnto meeting
 
Presentation Natura 2000 - ecoOnto meeting
Presentation Natura 2000 - ecoOnto meetingPresentation Natura 2000 - ecoOnto meeting
Presentation Natura 2000 - ecoOnto meeting
 
Les mesures de biodiversite - ecoOnto meeting
Les mesures de biodiversite - ecoOnto meetingLes mesures de biodiversite - ecoOnto meeting
Les mesures de biodiversite - ecoOnto meeting
 
Transformation de modèles - ecoOnto meeting
Transformation de modèles - ecoOnto meetingTransformation de modèles - ecoOnto meeting
Transformation de modèles - ecoOnto meeting
 
Ontologies introduction - ecoOnto meeting
Ontologies introduction - ecoOnto meetingOntologies introduction - ecoOnto meeting
Ontologies introduction - ecoOnto meeting
 
Le projet EcoOnto - avancees.
Le projet EcoOnto  - avancees.Le projet EcoOnto  - avancees.
Le projet EcoOnto - avancees.
 
Projet ecoOnto
Projet ecoOntoProjet ecoOnto
Projet ecoOnto
 

Les standards en biodiversité

  • 1. Les standards en biodiversité 1er juillet 2010 Natural Solutions julie_chabalier@natural-solutions.eu
  • 2. Ma donnée Un gobe-mouche gris à Natural Solutions,  Donnée : Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc. Identifié par Amandine avec des jumelles  Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
  • 3.
  • 4. Reconnu par la communauté Comprendre et utiliser la donnée  Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes.  Standard de données
  • 5. Partager ma donnée (2)  Utiliser la donnée au sein au sein d’un programme / système informatique <dwc:Taxon> <dwc:scientificName>Muscicapastriata</dwc:scientificName> <dwc:class>Aves</dwc:class> <dwc:order>Passeriformes </dwc:order> <dwc:genus>Muscicapa</dwc:genus> </dwc:Taxon> < dcterms:Location >   < dwc:country > France < dwc:country >  < dwc:countryCode > FR < dwc:countryCode >   < dwc:locality > Marseille < dwc:locality > < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude >   < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >  </dcterms:Location >  Implémentation XML
  • 6. Partager ma donnée (3) < protocol id =NSprotocol.1 > < title> Identification in a corridor </title> < creator> < individualName > < surName > Sahl </ surName > </ individualName > </ creator> < proceduralStep > < description >   < para>Bird identification on a working place</ para >  </ description >  < instrumentation > binocular</ instrumentation >   </proceduralStep> </protocol>  Standard de metadonnées
  • 7. Partager ma donnée (4)  Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
  • 8.
  • 9. Les standards de métadonnées Problématique Différents types de données de biodiversité Stockagesvariés Echellesdifférentes Données dispersées Objectif Accéder aux jeux de données de biodiversité sur le Web Quellessont les donnéesdisponibles? Comment accéder à cesdonnées ?
  • 10. Définitions Les métadonnéesdécrivent les ressources et leuraccessibilité identification qualité contexte spatial distribution des jeux de données Utiliser un standard de métadonnées uneterminologie commune un ensemble de définition Eviteruneperte du sens original des données
  • 11. Dublin Core Standard de metadonnées le mieux connu actuellement Initié en 1995 Objectif : découvrir les ressourcesdocumentaires du Web 15 descripteurs minimums Implémentation XML http://dublincore.org/
  • 13.
  • 14. Organisation EML Descripteursorganisés en classes décrivant : le jeu de données (dataset) l’origine des données (citation) la structure des données (software) les méthodes de création du jeu de données (protocol) l’accessibilité des données (access)
  • 15.
  • 17.
  • 18. TDWG TaxonomicDatabaseWorking Group Biodiversity Information Standards Uneorganisationinternationale à but non lucratif Développe des standards et des protocoles pour partager les données de biodiversité www.tdwg.org
  • 19. Historique TDWG/CODATA (Committee on Data for Science and Technology) Sous groupe «  Access to Biological Collections Data » 2000 Protocole de recherche des données de biodiversité Spécification des données des collections biologiques Projet BioCase DwC + protocole DIGIR ABCD Schema GBIF Protocole BioCase
  • 20. DarwinCore Définition d’un ensemble d’éléments de données (data element) Unitéd’information de base : sens unique + valeursdistinctes Norme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des données Attributs/champs de base de données Objectif : partage et intégration des donnéesd’observationprimaires Initialement : organisation des collections de specimens Extensible (ajoutd’éléments de données) : fct des besoinsspécifiques http://rs.tdwg.org/dwc/
  • 21. Les catégories 172 éléments de données Organisés en 8 catégories/classes taxonID scientificNameID taxonConceptID scientificName kingdom phylum class order family genus subgenus taxonRank scientificNameAuthorship vernacularName nomenclaturalCode taxonomicStatus nomenclaturalStatus taxonRemarks … Dublin Core
  • 22. Des metadonnées? Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude données institutionID collectionID datasetID institutionCode collectionCode datasetName ownerInstitutionCode basisOfRecord informationWithheld dataGeneralizations dynamicProperties Darwin Core Type Vocabulary  Valeur de l’élément de données Nature des données Occurrence Event Location Taxon PreservedSpecimen FossilSpecimen LivingSpecimen HumanObservation MachineObservation NomenclaturalChecklist
  • 23. Le partage Tous les termessontassignés à une URI occurenceID : http://rs.tdwg.org/dwc/terms/occurrenceID implementation XML + XML/RDF
  • 24. Extensions Information spécifique à une discipline Geospatial DecimalLatitude- DecimalLongitude – VerbatimCoordinates - … Paleontologie EarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - … Nettoyage ( Curation ) IdentifiedBy- DateIdentified - FieldNotes - …
  • 25. Simple Darwin Core Sous ensemble de 46 éléments de données Attributs des tableurs et bases de données Pas les termesreprésentant les différentescatégories (liste plate) Partage simple des donnéestaxonomiques et de leurs occurrences
  • 26. Exemple <dwc:Taxon> <dwc:scientificName>Anthuscorrendera</dwc:scientificName> <dwc:class>Aves</dwc:class> <dwc:genus>Anthus</dwc:genus> <dwc:specificEpithet>correndera</dwc:specificEpithet> <dwc:occurrenceID>urn:catalog:AUDCLO:EBIRD:OBS64515286</dwc:occurrenceID> </dwc:Taxon>
  • 27. Utilisation Largement utilisé GBIF (Global Biodiversity information facility) www.gbif.org OBIS (OceanBiogeographic Information System) www.iobis.org ALA (Atlas of Living Australia) www.ala.org.au Inventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour …
  • 28. ABCD schema Schémahierarchique de spécification de données Echange des données de collections Specimens Observations Completdonccomplexe  1200 éléments de données Capable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiques Suffisammentd’éléments de données pour être compatible avec beaucoup de standards Implémentation XML www.tdwg.org/activities/abcd/
  • 31. Visualiser ABCD schema http://www.bgbm.org/scripts/ASP/TDWG/frame.asp?config=0&configurl=http://www.bgbm.org/TDWG/CODATA/Schema/schemaviewer_configs/conf_abcd_206.xml
  • 32. Extensions Extension pour les Geosciences (EFG) http://www.geocase.eu/ Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/ Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
  • 34. Utilisation Largement utilisé aussi (par les mêmes?) GBIF ALA …
  • 35. Taxon Concept schema(Taxonomic taxon transfert schema) Problématique Données de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomique Partager les donnéesnécessitentd’utiliser la mêmetaxonomie www.tdwg.org/standards/117/
  • 36. Objectifs Développer un modèleabstrait de concepts taxonomiques Etablir des relations entre les concepts taxonomiques des fournisseurs de données Standard XML pour faciliterl’échange de données entre les différentsfournisseurs faciliterl’interrogation des données
  • 37.
  • 39. Exemple (1) <TaxonNames> <TaxonName id="123" nomenclaturalCode="Botanical"> <Simple>Dianthus</Simple> <Rank code="gen">genus</Rank> </TaxonName> <TaxonName id="124" nomenclaturalCode="Botanical"> <Simple>DianthusgratianopolitanusVill.</Simple> <Rank code="sp">species</Rank> <CanonicalName> <Simple>Dianthusgratianopolitanus</Simple> <Genusref="123">Dianthus</Genus> </CanonicalName> </TaxonName> <TaxonName id="125" nomenclaturalCode="Botanical"> <Simple>Dianthuscaesius Sm.</Simple> <Rank code="sp">species</Rank> <CanonicalName> <Simple>Dianthuscaesius</Simple> <Genusref="123">Dianthus</Genus> <SpecificEpithet>caesius</SpecificEpithet> </CanonicalName> </TaxonName>
  • 40. Exemple (2) <TaxonConcepts> <TaxonConcept id="988"> <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name> <AccordingTo> <AccordingToSimple> Clapham, Tutin &amp; Moore (1987) </AccordingToSimple> </AccordingTo> <TaxonRelationships> <TaxonRelationship type="has synonym"> <ToTaxonConceptref="989"/> </TaxonRelationship> </TaxonRelationships> </TaxonConcept> <TaxonConcept type="nominal" id="989"> < Name scientific="true" ref="125">Dianthus caesius</Name> </TaxonConcept>
  • 41. Utilisation GBIF dans son projet de « Global Names Architecture » TCS est utilisé pour faciliter l’échange des données taxonomiques.
  • 42.
  • 43.
  • 44. Les protocoles Protocole = comment lierouéchanger les données • Protocoles existants – TAPIR LSID & RDF – DwC-A IPT
  • 45. TAPIR Protocole pour interroger les bases de données existantes Remplace : DiGIR (utilisant DwC comme standard) BioCASe (utilisant ABCD schema comme standard) Indépendant du standard, mais un standard de donnéesestnécessaire Utilisé principalement par GBIF www.tdwg.org/activities/tapir
  • 46. TAPIR
  • 47. TAPIR
  • 48. TAPIR
  • 49. TAPIR
  • 50. TAPIR
  • 51. LSID & RDF LSID = Life Science Identifier Type de GUID = Global Unique Identifier LSID = chaîne de caractères + format urn:lsid:ubio.org:namebank:11815 http://lsids.sourceforge.net/
  • 52. LSID & RDF Utilisation : Identification d’un objet Retrouver les metadonnées associées (standard) RDF = Resource Description Framework RDF = Format de réponse des requêtes sur le LSID Nombreuxoutils pour résoudre et échanger les LSID http://lsid.tdwg.org/
  • 53. LSID & RDF http://lsid.tdwg.org/urn:lsid:ubio.org:namebank:11815
  • 54. Darwin Core archive Pas vraiment un protocole Moyen de publier les données au sein du GBIF DwC-A contient un jeu de donnéesentierbasésur des fichierstextes Le format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions Une archive = un ensemble de fichiertexteszippés
  • 55. Dwc-A
  • 56.
  • 57. IPT -Portails de données -Réseaux distribués -Accès aux enregistrements individuels -Clients GIS -GeoPortals Catalogues de Métadonnées -Transport rapide des données -Création d’index
  • 58. Conclusion Partager les données de biodiversité : Utiliser un standard de données Utiliser un standard de metadonnées Utiliser un protocole d’échange Applications