Les avancées du projet ecoOnto : un
exemple spécifique aux observations
           naturalistes
      Réunion ecoOnto – 29 novembre 2010
          Faculté de Saint Jérôme, Marseille
                    Julie Chabalier
Plan

• Introduction
  – Le projet ecoOnto
  – Les outils collaboratifs


• Le projet ecoOnto
  – Les résultats globaux
  – Un exemple
Le projet ecoOnto
• Conception d’une ontologie de la biodiversité
• Projet open source collaboratif
   –   Soutenu par le MEEDDM, porté par Natural Solutions
   –   Supervisé par un comité scientifique
   –   Actuellement 24 membres
   –   18 mois (initialement janvier 2010 – juillet 2011)
   –   1er rapport d’étape : décembre.
Conception de l’ontologie

• Une conception « bottom-up » en 4 phases
  –   Inventaire des concepts environnementaux
  –   Etude des standards actuels
  –   Modélisation de ontologie de la biodiversité
  –   Enrichissement de l’ontologie et validation
Les outils collaboratifs
• Un site Web
http://www.natural-solutions.eu/nslabs/


• Une liste de diffusion/discussion
ecoonto-project@googlegroups.com


• Un nouveau logo !
http://r21854.ovh.net/xwiki/bin/download/Main/WebHome/logo-ecoOnto.jpg


• Un wiki
http://r21854.ovh.net/xwiki/
ecoOnto Wiki

• Droit d’accès :
   – En lecture à tous
   – En lecture/écriture aux membres (mdp sur demande)


• Modification
   – WYSIWYG
   – Source (syntaxes implémentées : MediaWiki, Confluence,
     JSPWiki, Creole, TWiki, etc.)
L’écriture sur le wiki
L’écriture sur le wiki
Les résultats / WP

WP 1 : Inventaire des concepts environnementaux
      WP1.1. Lister les questions environnementales
      WP1.2. Décomposer les questions
       WP1.3. Définir les concepts impliqués
WP 2 : Etude des standards en biodiversité
WP 3 : Etude des ontologies existantes
WP1 .1 - Lister les questions

    • 35 questions (fr/en)
    • Classées en 3 catégories (Fondation pour la
    Recherche en Biodiversité, avril 2010)
        • Questions scientifiques
        • Questions politiques
        • Questions locales
WP1 .1 - Lister les questions
• Scientifiques : 5 questions
   – Quelles sont les conséquences de l’introduction de la
     coccinelle orientale, Harmonia axyridis Pallas, sur
     l’écosystème européen ?
   – Quelle taille et quelle forme le corridor du Siju-Rewat
     devraient avoir pour améliorer les chances de survies de la
     population locale d'éléphant ?
• Politiques : 12 questions
   – Quelles sont les méthodes pour évaluer la biodiversité de
     ma région ?
   – Comment délimiter le cœur de parc du futur Parc National
     des calanques ?
WP1 .1 - Lister les questions
• Locales : 6 questions
   – Quel est l’impact de la mise en place d’une aire de
     stationnement de poids lourds au niveau de l’aire
     d’autoroute de Vidauban ?
   – Puis-je observer des Bouquetins dans le Parc National des
     Ecrins?
• Non classées : 12 questions
    concernent la collecte de données.
   – Quels sont les principaux protocoles d'échantillonnage
     pour estimer la taille/densité d'une population d'oiseaux ?
   – Combien de quadrats devraient être utilisés pour
     échantillonner efficacement l'aire X ?
WP1 .2 - Décomposer les questions
7 questions ont été décomposées en 52 sous-questions
 Question 22 : Combien de quadrats devraient être utilisés pour
 échantillonner efficacement l'aire X ?
 1. Quelles sont les espèces à observer ?
 2. Quelle est la distribution spatiale des variables à mesurer (en massif, au
 hasard ou uniformément réparties, communes ou rares) ?
 3. Quels sont les protocoles associés aux espèces à observer ?
 4. Quelle est la taille de l’aire à étudier?
 5. Quelles sont les ressources disponibles pour cet échantillonnage ( temps
 et argent) ?
 6. Quels sont les résultats des tests préliminaires sur le terrain ?
WP1 .2 - Définir les concepts
 • 51 concepts définis (fr/en)

Terme         Synonymes    Définition   Référence   Termes
préféré                                             associés


           Plusieurs définitions/concept
           Choix dans le cadre ecoOnto ?
WP1 .2 - Définir les concepts
WP1 .2 - Définir les concepts
• Apport de la décomposition

    7 questions : 15 concepts définis ou à définir
52 sous-questions : 40 concepts définis ou à définir

      + 25 termes (2,7 fois + de termes)
WP2 - Etude des standards actuels


                                Dublin Core       Standards de
                                   EML            métadonnées


              Darwin Core
                                                 GML
             ABCD schema
                                              ISO 19115
         Taxon Concept Schema


Standards de données                              Standards de données
de biodiversité                                   géographiques
WP3 - Etude des ontologies existantes
• 30 ontologies de domaine :
   • Seronto, Oboe, BFO, DOLCE, Gazetter ontology, geonames,
     ENVO, Fly taxonomy, etc.

         Biologie      17    OWL    16
         Géographie    11    OBO    12
         Haut niveau   4     RDFS   2

   • Visualisation : Ontology Browser (v1.4.1), Université de
   Manchester
Ontology Browser : OBOE
A faire …
• Court terme :
   – Valider (choix) les définitions par les experts
   – Ajouter des définitions / questions existantes
     (éventuellement ajouter des questions)
• Moyen terme :
   – Mappings concepts – standards – ontologies
   – Modélisation des concepts manquants
• Long terme :
   – Validation de l’ontologie
Les observations naturalistes


Une observation est une action dont le résultat est une
estimation de la valeur de certaines propriétés d’une
caractéristique d'intérêt. Cette valeur est obtenue en utilisant
une procédure spécifique.
Open Geospatial Consortium
Choix des questions
• Les critères
   – Collecte de données
   – Méthodes d’échantillonnage
   – Identification
   – Préparation de la collecte (recherche d’information
     cartographique, par exemple)
   – Données collectées
Les questions
     • 10 questions
Combien d'observations sont présentes dans le rectangle de sélection ?
Combien d'individus de l'espèce X ont été vus sur la zone Y ?
Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une
population d'oiseaux ?
Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner
efficacement l'aire X ?
Quelle est la précision et l'exactitude de ce jeu de données ?
Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du
domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?
Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ?
Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
Classification & décomposition

• Non classées
• 10 questions : + 12 sous-questions

            questions simples
Les concepts associés aux questions
• 19 concepts à définir
Combien d'observations sont présentes dans le rectangle de sélection ?
Combien d'individus de l'espèce X ont été vus sur la zone Y ?
Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une
population d'oiseaux ?
Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner
efficacement l'aire X ?
Quelle est la précision et l'exactitude de ce jeu de données ?
Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du
domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?
Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ?
Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
Les concepts associés aux sous-
                                       questions
  • 8 concepts supplémentaires à définir
Quel est le polygone correspondant à la zone étudiée ?
Combien d’observations se trouvent dans ce polygone ?
Combien d’individus de l’espèce X ont été observés dans ce polygone ?
Quelles sont les espèces à observer ?
Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément,
communes ou rares) ?
Quels sont les protocoles associés à ces espèces ?
Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent)?
Quels sont les resultats des tests préliminaires sur le terrain ?
Quelle est la date de l’échantillonage ?
Combien d’unités d’échantillonage ont été visitées ?
Les définitions
• Les publications
•   Dajoz R. Précis d'écologie, 615 p, Dunod, 2000.
•   Hellmann J. J., Fowler G. W. (1999) Bias, precision, and accuracy of four measures of species
    richness. Ecological Applications, Vol. 9, No. 3., pp. 824-834.
•   Mackay R.J. and Oldford R.W. (2000) Scientific Method, Statistical Method, and the Speed of
    Light. Working Paper.
•   Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for
    describing and synthesizing ecological observation data. Ecological Informatics, Vol.2,
    No.3,pp 279-296 .
•   Mayr E. (1940) Speciation phenomena in birds. The American Naturalist
    Vol. 74, No. 752, pp. 249-278
•   Mayr E. (1992) Species Concepts and their Application. The units of evolution: essays on the
    nature of species, Ereshefsky ed. The MIT Press.
•   de Quieroz K., Donoghe M.J. (1990) Phylogenetic systematics and species revisited. Cladistics
    Vol. 6, No. 1, pp 83–90.
•   Ridley M. (1993) Evolution. Journal of Evolutionary Biology, Vol. 6, No. 4, pp 615–617, July
    1993
•   Wiley E. O. (1981) Phylogenetics: the theory and practice of phylogenetic systematics. John
    Wiley and Sons, New York.
Les définitions
• Les glossaires, codes et dictionnaires
•   Glossary for exploring GIS by Nicholas Chrismas
•   Glossary of the Federal Geographic Data Committee
•   Glossary of the Great Lakes Environmental Indicators Project
•   Glossary of terms and acronyms, Fisheries and Aquaculture Department of
    FAO
•   Glossary of statistical terms, Organization for economic co-operation and
    development
•   OceanLink’s Glossary of Common Terms and Definitions in Marine Biology
•   International Code of Zoological Nomenclature 1999
•   Larousse
•   Wiktionary
Mappings avec les standards
• Méthode : mapping syntaxique simple + validation
 Standards            Nb mappings exacts             Nb mappings partiels
 ABCD Schema (2.06)                             2                           26
 Darwin Core                                    1                           12
 (450-2991-1-SP)
 GML                                            2                           8
 (3.2.1)
                      Accuracy (ABCD Schema)           ABCD Schema :
                      Identification (ABCD Schema)     dateLastEdited
                      Taxon (DwC)                      AcquisitionDate
                      Observation (GML)                AccessionDate
                      Polygon (GML)                    MeasurementDate
                                                       …
Mappings avec les ontologies

• Choix des ontologies : observations

    SERONTO : Socio-Ecological Research and Observation
    oNTology

    OBOE : Extensible Observational Ontology
SERONTO core

• Projet européen dont l’objectif est de faciliter
  l’intégration des données de biodiversité à partir des
  sources de données dispersées dans l’union
  européenne.

• ALTER-net : A Long-Term Biodiversity, Ecosystem and
  Awareness Research Network (UE)
SERONTO Core
Mapping SERONTO core

• Méthode : mapping syntaxique simple (classes et/ou
  propriétés)
 Nb mappings exacts       Nb mappings partiels
                      5                          7


 Accuracy                  Landcore_area
 Area                      Political_area
 Population_Size           IntendedSampleSize
 Precision                 hasSample
 Sampling_Protocol         isSampleOf
                           hasSamplingMethod
OBOE
• Ontologie issue du projet SEEK (Science Environment
  for Ecological Knowledge) dont l’objectif était de
  créer une « cyberinfrastructure » pour la recherche
  en biodiversité, environnement et écologie et pour
  éduquer la communauté à l’écoinformatique (projet
  US).
• LTER : Long Term Ecological Research (US)
• http://seek.ecoinformatics.org.
OBOE core
Mapping OBOE core

• Méthode : mapping syntaxique simple (classes et/ou
  propriétés)
 Nb mappings exacts         Nb mappings partiels
                        2                          3


 Observation                protocolFor
 Protocol                   UsesProtocol
                            hasPrecision
Extension OBOE core

• Créer un module observation ecoOnto
  – S’appuie sur les points d’extension décrits dans Madin et
    al. 2007
  – Classification des concepts définis suivant les points
    d’extension :
     • Entity
     • Characteristic
     • Measurement
  – Modélisation des propriétés et classes supplémentaires
Les concepts
• 15 concepts classés (sur 27)

Entity             Characteristic            Measurement
Sample             Date                      SamplingProtocol
Population         Area                      Identification
Polygon            PopulationSize
Quadrat            PopulationDensity
Transect           SpatialPattern
Individu           Criteria
                   EnvironnementalVariable
Les concepts (suite)
• 12 concepts restants
   • 2 concepts existants (oboe:observation, oboe:hasPrecision)
   • 4 non classés (Protocol ≠ oboe:protocol, Resource, Layer,
   TaxonomicKey)
   • 3 concepts  associations (Observer, Accuracy,
   ConfidenceLevel)
   • 3 concepts exclus (Species, Taxon, Result)

• Nouveaux concepts et propriétés
   • 7 classes supplémentaires (FieldSurvey,
   PopulationCharacteristic, SpatialLocation, etc.)
   • 5 propriétés supplémentaires (hasResource, isIdentifiedBy,
   includedEntity,etc.)
La classe Resource
La classe Entity




             Open Geospatial
             Consortium
Les classes Characteristic &
       Measurement
Intégration   seronto:Accuracy
                                                seronto:Area
                                                seronto:Population_Size
Accuracy (ABCD Schema)                         seronto:Precision
 Identification (ABCD Schema)                  seronto:Sampling_Protocol
Taxon (DwC)
 Observation (GML)
 Polygon (GML)
En cours et à suivre …


• Implémentation en OWL-DL
• Validation (cohérence + questions)
Le projet EcoOnto  - avancees.

Le projet EcoOnto - avancees.

  • 1.
    Les avancées duprojet ecoOnto : un exemple spécifique aux observations naturalistes Réunion ecoOnto – 29 novembre 2010 Faculté de Saint Jérôme, Marseille Julie Chabalier
  • 2.
    Plan • Introduction – Le projet ecoOnto – Les outils collaboratifs • Le projet ecoOnto – Les résultats globaux – Un exemple
  • 3.
    Le projet ecoOnto •Conception d’une ontologie de la biodiversité • Projet open source collaboratif – Soutenu par le MEEDDM, porté par Natural Solutions – Supervisé par un comité scientifique – Actuellement 24 membres – 18 mois (initialement janvier 2010 – juillet 2011) – 1er rapport d’étape : décembre.
  • 4.
    Conception de l’ontologie •Une conception « bottom-up » en 4 phases – Inventaire des concepts environnementaux – Etude des standards actuels – Modélisation de ontologie de la biodiversité – Enrichissement de l’ontologie et validation
  • 5.
    Les outils collaboratifs •Un site Web http://www.natural-solutions.eu/nslabs/ • Une liste de diffusion/discussion ecoonto-project@googlegroups.com • Un nouveau logo ! http://r21854.ovh.net/xwiki/bin/download/Main/WebHome/logo-ecoOnto.jpg • Un wiki http://r21854.ovh.net/xwiki/
  • 6.
    ecoOnto Wiki • Droitd’accès : – En lecture à tous – En lecture/écriture aux membres (mdp sur demande) • Modification – WYSIWYG – Source (syntaxes implémentées : MediaWiki, Confluence, JSPWiki, Creole, TWiki, etc.)
  • 7.
  • 8.
  • 9.
    Les résultats /WP WP 1 : Inventaire des concepts environnementaux WP1.1. Lister les questions environnementales WP1.2. Décomposer les questions WP1.3. Définir les concepts impliqués WP 2 : Etude des standards en biodiversité WP 3 : Etude des ontologies existantes
  • 10.
    WP1 .1 -Lister les questions • 35 questions (fr/en) • Classées en 3 catégories (Fondation pour la Recherche en Biodiversité, avril 2010) • Questions scientifiques • Questions politiques • Questions locales
  • 11.
    WP1 .1 -Lister les questions • Scientifiques : 5 questions – Quelles sont les conséquences de l’introduction de la coccinelle orientale, Harmonia axyridis Pallas, sur l’écosystème européen ? – Quelle taille et quelle forme le corridor du Siju-Rewat devraient avoir pour améliorer les chances de survies de la population locale d'éléphant ? • Politiques : 12 questions – Quelles sont les méthodes pour évaluer la biodiversité de ma région ? – Comment délimiter le cœur de parc du futur Parc National des calanques ?
  • 12.
    WP1 .1 -Lister les questions • Locales : 6 questions – Quel est l’impact de la mise en place d’une aire de stationnement de poids lourds au niveau de l’aire d’autoroute de Vidauban ? – Puis-je observer des Bouquetins dans le Parc National des Ecrins? • Non classées : 12 questions  concernent la collecte de données. – Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une population d'oiseaux ? – Combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ?
  • 13.
    WP1 .2 -Décomposer les questions 7 questions ont été décomposées en 52 sous-questions Question 22 : Combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ? 1. Quelles sont les espèces à observer ? 2. Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément réparties, communes ou rares) ? 3. Quels sont les protocoles associés aux espèces à observer ? 4. Quelle est la taille de l’aire à étudier? 5. Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent) ? 6. Quels sont les résultats des tests préliminaires sur le terrain ?
  • 14.
    WP1 .2 -Définir les concepts • 51 concepts définis (fr/en) Terme Synonymes Définition Référence Termes préféré associés  Plusieurs définitions/concept  Choix dans le cadre ecoOnto ?
  • 15.
    WP1 .2 -Définir les concepts
  • 16.
    WP1 .2 -Définir les concepts • Apport de la décomposition 7 questions : 15 concepts définis ou à définir 52 sous-questions : 40 concepts définis ou à définir  + 25 termes (2,7 fois + de termes)
  • 17.
    WP2 - Etudedes standards actuels Dublin Core Standards de EML métadonnées Darwin Core GML ABCD schema ISO 19115 Taxon Concept Schema Standards de données Standards de données de biodiversité géographiques
  • 18.
    WP3 - Etudedes ontologies existantes • 30 ontologies de domaine : • Seronto, Oboe, BFO, DOLCE, Gazetter ontology, geonames, ENVO, Fly taxonomy, etc. Biologie 17 OWL 16 Géographie 11 OBO 12 Haut niveau 4 RDFS 2 • Visualisation : Ontology Browser (v1.4.1), Université de Manchester
  • 19.
  • 20.
    A faire … •Court terme : – Valider (choix) les définitions par les experts – Ajouter des définitions / questions existantes (éventuellement ajouter des questions) • Moyen terme : – Mappings concepts – standards – ontologies – Modélisation des concepts manquants • Long terme : – Validation de l’ontologie
  • 21.
    Les observations naturalistes Uneobservation est une action dont le résultat est une estimation de la valeur de certaines propriétés d’une caractéristique d'intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. Open Geospatial Consortium
  • 22.
    Choix des questions •Les critères – Collecte de données – Méthodes d’échantillonnage – Identification – Préparation de la collecte (recherche d’information cartographique, par exemple) – Données collectées
  • 23.
    Les questions • 10 questions Combien d'observations sont présentes dans le rectangle de sélection ? Combien d'individus de l'espèce X ont été vus sur la zone Y ? Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une population d'oiseaux ? Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ? Quelle est la précision et l'exactitude de ce jeu de données ? Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ? Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ? Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ? Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ? Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
  • 24.
    Classification & décomposition •Non classées • 10 questions : + 12 sous-questions  questions simples
  • 25.
    Les concepts associésaux questions • 19 concepts à définir Combien d'observations sont présentes dans le rectangle de sélection ? Combien d'individus de l'espèce X ont été vus sur la zone Y ? Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une population d'oiseaux ? Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ? Quelle est la précision et l'exactitude de ce jeu de données ? Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ? Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ? Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ? Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ? Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
  • 26.
    Les concepts associésaux sous- questions • 8 concepts supplémentaires à définir Quel est le polygone correspondant à la zone étudiée ? Combien d’observations se trouvent dans ce polygone ? Combien d’individus de l’espèce X ont été observés dans ce polygone ? Quelles sont les espèces à observer ? Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément, communes ou rares) ? Quels sont les protocoles associés à ces espèces ? Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent)? Quels sont les resultats des tests préliminaires sur le terrain ? Quelle est la date de l’échantillonage ? Combien d’unités d’échantillonage ont été visitées ?
  • 27.
    Les définitions • Lespublications • Dajoz R. Précis d'écologie, 615 p, Dunod, 2000. • Hellmann J. J., Fowler G. W. (1999) Bias, precision, and accuracy of four measures of species richness. Ecological Applications, Vol. 9, No. 3., pp. 824-834. • Mackay R.J. and Oldford R.W. (2000) Scientific Method, Statistical Method, and the Speed of Light. Working Paper. • Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological observation data. Ecological Informatics, Vol.2, No.3,pp 279-296 . • Mayr E. (1940) Speciation phenomena in birds. The American Naturalist Vol. 74, No. 752, pp. 249-278 • Mayr E. (1992) Species Concepts and their Application. The units of evolution: essays on the nature of species, Ereshefsky ed. The MIT Press. • de Quieroz K., Donoghe M.J. (1990) Phylogenetic systematics and species revisited. Cladistics Vol. 6, No. 1, pp 83–90. • Ridley M. (1993) Evolution. Journal of Evolutionary Biology, Vol. 6, No. 4, pp 615–617, July 1993 • Wiley E. O. (1981) Phylogenetics: the theory and practice of phylogenetic systematics. John Wiley and Sons, New York.
  • 28.
    Les définitions • Lesglossaires, codes et dictionnaires • Glossary for exploring GIS by Nicholas Chrismas • Glossary of the Federal Geographic Data Committee • Glossary of the Great Lakes Environmental Indicators Project • Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO • Glossary of statistical terms, Organization for economic co-operation and development • OceanLink’s Glossary of Common Terms and Definitions in Marine Biology • International Code of Zoological Nomenclature 1999 • Larousse • Wiktionary
  • 29.
    Mappings avec lesstandards • Méthode : mapping syntaxique simple + validation Standards Nb mappings exacts Nb mappings partiels ABCD Schema (2.06) 2 26 Darwin Core 1 12 (450-2991-1-SP) GML 2 8 (3.2.1) Accuracy (ABCD Schema) ABCD Schema : Identification (ABCD Schema) dateLastEdited Taxon (DwC) AcquisitionDate Observation (GML) AccessionDate Polygon (GML) MeasurementDate …
  • 30.
    Mappings avec lesontologies • Choix des ontologies : observations  SERONTO : Socio-Ecological Research and Observation oNTology  OBOE : Extensible Observational Ontology
  • 31.
    SERONTO core • Projeteuropéen dont l’objectif est de faciliter l’intégration des données de biodiversité à partir des sources de données dispersées dans l’union européenne. • ALTER-net : A Long-Term Biodiversity, Ecosystem and Awareness Research Network (UE)
  • 32.
  • 33.
    Mapping SERONTO core •Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 5 7 Accuracy Landcore_area Area Political_area Population_Size IntendedSampleSize Precision hasSample Sampling_Protocol isSampleOf hasSamplingMethod
  • 34.
    OBOE • Ontologie issuedu projet SEEK (Science Environment for Ecological Knowledge) dont l’objectif était de créer une « cyberinfrastructure » pour la recherche en biodiversité, environnement et écologie et pour éduquer la communauté à l’écoinformatique (projet US). • LTER : Long Term Ecological Research (US) • http://seek.ecoinformatics.org.
  • 35.
  • 36.
    Mapping OBOE core •Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 2 3 Observation protocolFor Protocol UsesProtocol hasPrecision
  • 37.
    Extension OBOE core •Créer un module observation ecoOnto – S’appuie sur les points d’extension décrits dans Madin et al. 2007 – Classification des concepts définis suivant les points d’extension : • Entity • Characteristic • Measurement – Modélisation des propriétés et classes supplémentaires
  • 38.
    Les concepts • 15concepts classés (sur 27) Entity Characteristic Measurement Sample Date SamplingProtocol Population Area Identification Polygon PopulationSize Quadrat PopulationDensity Transect SpatialPattern Individu Criteria EnvironnementalVariable
  • 39.
    Les concepts (suite) •12 concepts restants • 2 concepts existants (oboe:observation, oboe:hasPrecision) • 4 non classés (Protocol ≠ oboe:protocol, Resource, Layer, TaxonomicKey) • 3 concepts  associations (Observer, Accuracy, ConfidenceLevel) • 3 concepts exclus (Species, Taxon, Result) • Nouveaux concepts et propriétés • 7 classes supplémentaires (FieldSurvey, PopulationCharacteristic, SpatialLocation, etc.) • 5 propriétés supplémentaires (hasResource, isIdentifiedBy, includedEntity,etc.)
  • 40.
  • 41.
    La classe Entity Open Geospatial Consortium
  • 42.
  • 43.
    Intégration seronto:Accuracy  seronto:Area  seronto:Population_Size Accuracy (ABCD Schema) seronto:Precision  Identification (ABCD Schema)  seronto:Sampling_Protocol Taxon (DwC)  Observation (GML)  Polygon (GML)
  • 44.
    En cours età suivre … • Implémentation en OWL-DL • Validation (cohérence + questions)