Le projet EcoOnto - avancees.

758 vues

Publié le

Présentation des avancées du projet ecoOnto lors de la journée ecoOnto, 29 novembre 2010, Marseille.

Publié dans : Technologie, Business
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
758
Sur SlideShare
0
Issues des intégrations
0
Intégrations
18
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Le projet EcoOnto - avancees.

  1. 1. Les avancées du projet ecoOnto : unexemple spécifique aux observations naturalistes Réunion ecoOnto – 29 novembre 2010 Faculté de Saint Jérôme, Marseille Julie Chabalier
  2. 2. Plan• Introduction – Le projet ecoOnto – Les outils collaboratifs• Le projet ecoOnto – Les résultats globaux – Un exemple
  3. 3. Le projet ecoOnto• Conception d’une ontologie de la biodiversité• Projet open source collaboratif – Soutenu par le MEEDDM, porté par Natural Solutions – Supervisé par un comité scientifique – Actuellement 24 membres – 18 mois (initialement janvier 2010 – juillet 2011) – 1er rapport d’étape : décembre.
  4. 4. Conception de l’ontologie• Une conception « bottom-up » en 4 phases – Inventaire des concepts environnementaux – Etude des standards actuels – Modélisation de ontologie de la biodiversité – Enrichissement de l’ontologie et validation
  5. 5. Les outils collaboratifs• Un site Webhttp://www.natural-solutions.eu/nslabs/• Une liste de diffusion/discussionecoonto-project@googlegroups.com• Un nouveau logo !http://r21854.ovh.net/xwiki/bin/download/Main/WebHome/logo-ecoOnto.jpg• Un wikihttp://r21854.ovh.net/xwiki/
  6. 6. ecoOnto Wiki• Droit d’accès : – En lecture à tous – En lecture/écriture aux membres (mdp sur demande)• Modification – WYSIWYG – Source (syntaxes implémentées : MediaWiki, Confluence, JSPWiki, Creole, TWiki, etc.)
  7. 7. L’écriture sur le wiki
  8. 8. L’écriture sur le wiki
  9. 9. Les résultats / WPWP 1 : Inventaire des concepts environnementaux WP1.1. Lister les questions environnementales WP1.2. Décomposer les questions WP1.3. Définir les concepts impliquésWP 2 : Etude des standards en biodiversitéWP 3 : Etude des ontologies existantes
  10. 10. WP1 .1 - Lister les questions • 35 questions (fr/en) • Classées en 3 catégories (Fondation pour la Recherche en Biodiversité, avril 2010) • Questions scientifiques • Questions politiques • Questions locales
  11. 11. WP1 .1 - Lister les questions• Scientifiques : 5 questions – Quelles sont les conséquences de l’introduction de la coccinelle orientale, Harmonia axyridis Pallas, sur l’écosystème européen ? – Quelle taille et quelle forme le corridor du Siju-Rewat devraient avoir pour améliorer les chances de survies de la population locale déléphant ?• Politiques : 12 questions – Quelles sont les méthodes pour évaluer la biodiversité de ma région ? – Comment délimiter le cœur de parc du futur Parc National des calanques ?
  12. 12. WP1 .1 - Lister les questions• Locales : 6 questions – Quel est l’impact de la mise en place d’une aire de stationnement de poids lourds au niveau de l’aire d’autoroute de Vidauban ? – Puis-je observer des Bouquetins dans le Parc National des Ecrins?• Non classées : 12 questions  concernent la collecte de données. – Quels sont les principaux protocoles déchantillonnage pour estimer la taille/densité dune population doiseaux ? – Combien de quadrats devraient être utilisés pour échantillonner efficacement laire X ?
  13. 13. WP1 .2 - Décomposer les questions7 questions ont été décomposées en 52 sous-questions Question 22 : Combien de quadrats devraient être utilisés pour échantillonner efficacement laire X ? 1. Quelles sont les espèces à observer ? 2. Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément réparties, communes ou rares) ? 3. Quels sont les protocoles associés aux espèces à observer ? 4. Quelle est la taille de l’aire à étudier? 5. Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent) ? 6. Quels sont les résultats des tests préliminaires sur le terrain ?
  14. 14. WP1 .2 - Définir les concepts • 51 concepts définis (fr/en)Terme Synonymes Définition Référence Termespréféré associés  Plusieurs définitions/concept  Choix dans le cadre ecoOnto ?
  15. 15. WP1 .2 - Définir les concepts
  16. 16. WP1 .2 - Définir les concepts• Apport de la décomposition 7 questions : 15 concepts définis ou à définir52 sous-questions : 40 concepts définis ou à définir  + 25 termes (2,7 fois + de termes)
  17. 17. WP2 - Etude des standards actuels Dublin Core Standards de EML métadonnées Darwin Core GML ABCD schema ISO 19115 Taxon Concept SchemaStandards de données Standards de donnéesde biodiversité géographiques
  18. 18. WP3 - Etude des ontologies existantes• 30 ontologies de domaine : • Seronto, Oboe, BFO, DOLCE, Gazetter ontology, geonames, ENVO, Fly taxonomy, etc. Biologie 17 OWL 16 Géographie 11 OBO 12 Haut niveau 4 RDFS 2 • Visualisation : Ontology Browser (v1.4.1), Université de Manchester
  19. 19. Ontology Browser : OBOE
  20. 20. A faire …• Court terme : – Valider (choix) les définitions par les experts – Ajouter des définitions / questions existantes (éventuellement ajouter des questions)• Moyen terme : – Mappings concepts – standards – ontologies – Modélisation des concepts manquants• Long terme : – Validation de l’ontologie
  21. 21. Les observations naturalistesUne observation est une action dont le résultat est uneestimation de la valeur de certaines propriétés d’unecaractéristique dintérêt. Cette valeur est obtenue en utilisantune procédure spécifique.Open Geospatial Consortium
  22. 22. Choix des questions• Les critères – Collecte de données – Méthodes d’échantillonnage – Identification – Préparation de la collecte (recherche d’information cartographique, par exemple) – Données collectées
  23. 23. Les questions • 10 questionsCombien dobservations sont présentes dans le rectangle de sélection ?Combien dindividus de lespèce X ont été vus sur la zone Y ?Quels sont les principaux protocoles déchantillonnage pour estimer la taille/densité dunepopulation doiseaux ?Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonnerefficacement laire X ?Quelle est la précision et lexactitude de ce jeu de données ?Quel est le degré de confiance accordé à la détermination despèce réalisée par lobservateur X ?Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (dudomaine, i.e. taxon le plus élevé, à lespèce/sous-espèce, i.e. taxon le plus bas) ?Quelles étaient les valeurs des variables denvironnement pour cet échantillon de données ?Existe-t-il des couches de végétation disponibles pour laire détude ?
  24. 24. Classification & décomposition• Non classées• 10 questions : + 12 sous-questions  questions simples
  25. 25. Les concepts associés aux questions• 19 concepts à définirCombien dobservations sont présentes dans le rectangle de sélection ?Combien dindividus de lespèce X ont été vus sur la zone Y ?Quels sont les principaux protocoles déchantillonnage pour estimer la taille/densité dunepopulation doiseaux ?Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonnerefficacement laire X ?Quelle est la précision et lexactitude de ce jeu de données ?Quel est le degré de confiance accordé à la détermination despèce réalisée par lobservateur X ?Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (dudomaine, i.e. taxon le plus élevé, à lespèce/sous-espèce, i.e. taxon le plus bas) ?Quelles étaient les valeurs des variables denvironnement pour cet échantillon de données ?Existe-t-il des couches de végétation disponibles pour laire détude ?
  26. 26. Les concepts associés aux sous- questions • 8 concepts supplémentaires à définirQuel est le polygone correspondant à la zone étudiée ?Combien d’observations se trouvent dans ce polygone ?Combien d’individus de l’espèce X ont été observés dans ce polygone ?Quelles sont les espèces à observer ?Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément,communes ou rares) ?Quels sont les protocoles associés à ces espèces ?Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent)?Quels sont les resultats des tests préliminaires sur le terrain ?Quelle est la date de l’échantillonage ?Combien d’unités d’échantillonage ont été visitées ?
  27. 27. Les définitions• Les publications• Dajoz R. Précis décologie, 615 p, Dunod, 2000.• Hellmann J. J., Fowler G. W. (1999) Bias, precision, and accuracy of four measures of species richness. Ecological Applications, Vol. 9, No. 3., pp. 824-834.• Mackay R.J. and Oldford R.W. (2000) Scientific Method, Statistical Method, and the Speed of Light. Working Paper.• Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological observation data. Ecological Informatics, Vol.2, No.3,pp 279-296 .• Mayr E. (1940) Speciation phenomena in birds. The American Naturalist Vol. 74, No. 752, pp. 249-278• Mayr E. (1992) Species Concepts and their Application. The units of evolution: essays on the nature of species, Ereshefsky ed. The MIT Press.• de Quieroz K., Donoghe M.J. (1990) Phylogenetic systematics and species revisited. Cladistics Vol. 6, No. 1, pp 83–90.• Ridley M. (1993) Evolution. Journal of Evolutionary Biology, Vol. 6, No. 4, pp 615–617, July 1993• Wiley E. O. (1981) Phylogenetics: the theory and practice of phylogenetic systematics. John Wiley and Sons, New York.
  28. 28. Les définitions• Les glossaires, codes et dictionnaires• Glossary for exploring GIS by Nicholas Chrismas• Glossary of the Federal Geographic Data Committee• Glossary of the Great Lakes Environmental Indicators Project• Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO• Glossary of statistical terms, Organization for economic co-operation and development• OceanLink’s Glossary of Common Terms and Definitions in Marine Biology• International Code of Zoological Nomenclature 1999• Larousse• Wiktionary
  29. 29. Mappings avec les standards• Méthode : mapping syntaxique simple + validation Standards Nb mappings exacts Nb mappings partiels ABCD Schema (2.06) 2 26 Darwin Core 1 12 (450-2991-1-SP) GML 2 8 (3.2.1) Accuracy (ABCD Schema) ABCD Schema : Identification (ABCD Schema) dateLastEdited Taxon (DwC) AcquisitionDate Observation (GML) AccessionDate Polygon (GML) MeasurementDate …
  30. 30. Mappings avec les ontologies• Choix des ontologies : observations  SERONTO : Socio-Ecological Research and Observation oNTology  OBOE : Extensible Observational Ontology
  31. 31. SERONTO core• Projet européen dont l’objectif est de faciliter l’intégration des données de biodiversité à partir des sources de données dispersées dans l’union européenne.• ALTER-net : A Long-Term Biodiversity, Ecosystem and Awareness Research Network (UE)
  32. 32. SERONTO Core
  33. 33. Mapping SERONTO core• Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 5 7 Accuracy Landcore_area Area Political_area Population_Size IntendedSampleSize Precision hasSample Sampling_Protocol isSampleOf hasSamplingMethod
  34. 34. OBOE• Ontologie issue du projet SEEK (Science Environment for Ecological Knowledge) dont l’objectif était de créer une « cyberinfrastructure » pour la recherche en biodiversité, environnement et écologie et pour éduquer la communauté à l’écoinformatique (projet US).• LTER : Long Term Ecological Research (US)• http://seek.ecoinformatics.org.
  35. 35. OBOE core
  36. 36. Mapping OBOE core• Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 2 3 Observation protocolFor Protocol UsesProtocol hasPrecision
  37. 37. Extension OBOE core• Créer un module observation ecoOnto – S’appuie sur les points d’extension décrits dans Madin et al. 2007 – Classification des concepts définis suivant les points d’extension : • Entity • Characteristic • Measurement – Modélisation des propriétés et classes supplémentaires
  38. 38. Les concepts• 15 concepts classés (sur 27)Entity Characteristic MeasurementSample Date SamplingProtocolPopulation Area IdentificationPolygon PopulationSizeQuadrat PopulationDensityTransect SpatialPatternIndividu Criteria EnvironnementalVariable
  39. 39. Les concepts (suite)• 12 concepts restants • 2 concepts existants (oboe:observation, oboe:hasPrecision) • 4 non classés (Protocol ≠ oboe:protocol, Resource, Layer, TaxonomicKey) • 3 concepts  associations (Observer, Accuracy, ConfidenceLevel) • 3 concepts exclus (Species, Taxon, Result)• Nouveaux concepts et propriétés • 7 classes supplémentaires (FieldSurvey, PopulationCharacteristic, SpatialLocation, etc.) • 5 propriétés supplémentaires (hasResource, isIdentifiedBy, includedEntity,etc.)
  40. 40. La classe Resource
  41. 41. La classe Entity Open Geospatial Consortium
  42. 42. Les classes Characteristic & Measurement
  43. 43. Intégration seronto:Accuracy  seronto:Area  seronto:Population_SizeAccuracy (ABCD Schema) seronto:Precision Identification (ABCD Schema)  seronto:Sampling_ProtocolTaxon (DwC) Observation (GML) Polygon (GML)
  44. 44. En cours et à suivre …• Implémentation en OWL-DL• Validation (cohérence + questions)

×