ecoOnto - une ontologie pour la biodiversité

1 106 vues

Publié le

Workshop Sémantique & Ontologies AnaEE-France

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 106
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1
Actions
Partages
0
Téléchargements
29
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

ecoOnto - une ontologie pour la biodiversité

  1. 1. EcoOnto, une ontologie pour la Biodiversité Acquisition, structuration et valorisation de données issues d’observations biologiques Workshop Sémantique & Ontologies AnaEE-France 6 décembre 2013 - Moulis Julie Chabalier
  2. 2. Plan glossary ecoOnto-Med 2010 2011 2012 2013 La genèse … Le projet …………. La suite ……………………..........
  3. 3. 2002 1998 Marseille
  4. 4. 2002 1998 olivier coullet 2008 amandine sahl carole duval Marseille
  5. 5. Rennes 2004 olivier coullet 2008 amandine sahl carole duval Marseille
  6. 6. olivier coullet 2008 amandine sahl carole duval 2009 Marseille
  7. 7. Des outils numériques pour la nature DONNÉES EXISTANTES COLLECTE ACQUÉRIR CARTES SI STRUCTURER BD VALORISER GRAPHES Aide à la décision : Risque de perte de biodiversité ? Espèces / écosystèmes à préserver ?
  8. 8. Idée Quelles sont les zones à protéger en PACA? Proposition de zones à protéger en PACA ? Recherche des données existantes Observations à collecter pour répondre à la question Web
  9. 9. Données de biodiversité
  10. 10. Données de biodiversité Multi-formats Multi-sites Géographie Multiobservateurs Biologie Multi-modèles Hétérogènes Pédologie Génétique
  11. 11. Données de biodiversité liées
  12. 12. Projet ECO-INC ECOlogical INtelligent Census Quelles sont les zones à protéger en PACA? Proposition de zones à protéger en PACA Recherche des données existantes ecoRelevé Knowledge Module de connaissances Module de données Observations à collecter pour répondre à la question
  13. 13. AAP « Eco-industries » Avril 2009 • ADEME – OSEO – DGCIS (Fonds de compétitivité des entreprises) • Type de projets : projet de développement expérimental et d’innovation individuel (PME) • Axe : surveiller et tracer • Thème : observer davantage et mieux l’environnement • Projet déposé : 30 avril 2009 • Demande de financement : 390 k€ sur 3 ans
  14. 14. Projet Lauréat ! Financement après négociation Subvention 150k€ sur 1,5 an • 50 k€ OSEO AFI – Faisabilité du système : ecoQuery • 100 k€ Ministère écologie – Ontologie : ecoOnto • Début des travaux janvier 2010
  15. 15. ecoOnto Une ontologie de la biodiversité glossary ecoOnto-Med 2010 2011 2012 2013
  16. 16. Comité scientifique Institution Domaine d’expertise Thierry Bourgoin MNHN, FRB Systématique Olivier Dameron INSERM/Université de Rennes 1 Web sémantique Sophie Gachet IMEP Ecologie Wilfried Heintz GIP ECOFOR Geomatique LIRMM Informatique Ammar Mechouche IGN Web sémantique Isabelle Mougenot LIRMM Bioinformatique Emmanuelle Porcher MNHN Ecologie Comité Scientifique et technique Thérèse Libourel
  17. 17. La conception de l’ontologie Concepts environnementaux WP1 – Définition des concepts
  18. 18. La conception de l’ontologie WP2 – Mapping avec les standards Concepts environnementaux Standards en biodiversité
  19. 19. La conception de l’ontologie WP3 – Top domaine ontologie Concepts environnementaux Standards en biodiversité
  20. 20. La conception de l’ontologie WP4 – Mapping et extension Top domaine ontologie Concepts environnementaux Standards en biodiversité
  21. 21. Inventaire des concepts
  22. 22. Un glossaire pour la biodiversité 1. Lister un ensemble de questions environnementales 2. Extraire les concepts 3. Définir des concepts Exemple : Quels sont les impacts sur l’environnement si l'étang de Mauguio s'assèche?
  23. 23. Un concept [fr] : Le glossaire [label préféré; synonymes; Définitions; Références; termes associés] label préféré : Impact sur l’environnement Synonymes : Conséquence sur l’environnement, effet sur l’environnement Définitions : 1. Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique d'écosystème. 2. Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement des activités, produits ou services d’un organisme. Références : 1. P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4, pp. 215-306. 2. Norme ISO 14001. Terme associé : Etude d’impact
  24. 24. Le glossaire Un concept [fr] : [label préféré; synonymes; Définitions; Références; termes associés] label préféré : Impact sur l’environnement Synonymes : Conséquence sur l’environnement, effet sur l’environnement Définitions : 1. Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique d'écosystème. 2. Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement des activités, produits ou services d’un organisme. Références : label préféré : Etude d’impact P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4, pp. 215-306. Synonyme : Etude d’incidence 2. Norme ISO 14001. Définitions : Terme associé : Etude d’impact 1. Processus d’identification des conséquences probables pour l’environnement biogéophysique, pour la santé de l’homme et pour son bien-être, de la mise en œuvre Enrichissement de certaines activités et transmission de ces informations aux responsables capables de sanctionner les propositions. du glossaire 1. Références : 1. Wathern (Ed.), 1988, Environmental Impact Assessment: Theory and Practice, Routledge, London Terme associé : Impact sur l’environnement
  25. 25. Enrichissement du glossaire Décomposition des questions : Quels sont les impacts sur la biodiversité si l'étang de Mauguio s'assèche? • Quel est le polygone correspondant à l’étang de Mauguio ? • Quelles sont les espèces observées dans le polygone? • Parmi les espèces observées, quelles espèces pourraient disparaître s’il y avait assèchement ? – Rechercher les habitats des espèces observées? – Sélectionner les espèces observées qui ont pour habitat les zones humides
  26. 26. Définir les termes Polygone Aire formée d'une surface intérieure, d'un anneau extérieur et qui peut comporter plusieurs anneaux intérieurs qui ne se croisent pas ni ne s'imbriquent. Glossaire - Exploring GIS, by Nicholas Chrisman. [Aire] Etang Etendue d'eau stagnante, peu profonde, de surface inférieure à 8 hectares résultant de l'imperméabilité du sol. Convention de Ramsar, 1971. Observation 1.Une observation est une action dont le résultat est une estimation de la valeur de certaines propriétés de la caractéristique d’intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. SEEgrid,”OGC Standard - Observations and Measurements” 2. Une observation est une affirmation selon laquelle une entité a été observée. Une observation peut consister en des mesures qui se réfèrent à une ou plusieurs caractéristiques de l’entité. Les observations sont effectuées dans un contexte. Le contexte d’une observation se compose d’autres observations. Par exemple, une observation d’un lieu particulier peut servir de cadre pour une observation d’un organisme. Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological observation data. Ecological Informatics, Vol2,3,pp 279-296 [Observateur] Habitat 1. Ensemble de caractéristiques environnementales qui, pour les animaux terrestres, est généralement assimilé à une communauté végétale, une association végétale, ou un type de couverture . Garshelis,2000, Delusions in habitat Evaluation: Measuring Use, Selection, and Importance in Research techniques in animal ecology 2. Lieu ou type de site dans lequel un organisme ou une population existe à l'état naturel. Convention sur la diversité biologique, 1992. Zone humide 1. terrains, exploités ou non, habituellement inondés ou gorgés d'eau douce […] Article 2 de la loi du 3 janvier 1992 Codifié à l'article L 211-1 du code de l'environnement. 2.les zones humides sont des étendues de marais, de fagnes, de tourbières ou d'eaux naturelles ou artificielles […] Article 1.1 Convention de Ramsar, 1971.
  27. 27. Un Wiki pour collaborer XWiki : un moteur de wiki open source • Edition collaborative via un navigateur Web  view/edit/preview/save • Edition WYSIWYG • Gestion des versions • Gestion des droits http://www.xwiki.com/
  28. 28. 35 questions [fr- en] 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. Quels sont les impacts sur l’environnement si l'étang de Mauguio s'assèche? Quelles sont les conséquences de l'introduction de la coccinelle orientale, Harmonia axyridis Pallas sur l'écosystème européen? Est-ce que les campagnes entourant Lunel ont un niveau de biodiversité élevée? Quelles sont les méthodes pour évaluer la biodiversité de ma région? Pourquoi malgré son statut d’espèce protégée, l’Esturgeon européen est en train de disparaître? Depuis le début de sa protection en 1979, comment évolue la taille de la population de la genette (Genetta genetta) en France? Quel est l'impact de la mise en place d’une aire de stationnement de poids lourds, au niveau de l’aire d’autoroute de Vidauban ? Le fauchage en juin n’est-il pas un puits écologique pour la biodiversité pour mon pâturage, en Auvergne, Marcenat ? Pourquoi je ne vois plus de chouettes lorsque je me balade en Camargue? Puis-je observer des Bouquetins dans le Parc National des Ecrins? Quels sont les impacts sur la biodiversité s'il n'y a plus de paturage dans les montagnes alpines? Combien d'espèces en danger y a-t-il autour de ma zone? Comment pouvons nous atteindre l'objectif de la CDB (Convention sur la diversité biologique) dans l'aire méditerranéenne de protéger 10% desécorégions du monde ? Comment délimiter le territoire du futur Parc National en forêt feuillus de plaine (entre Champagne et Bourgogne) ? Comment délimiter le cœur de parc du futur Parc National des calanques ? Quels terrains sont prioritaires à l'achat pour le Conservatoire du Littoral en region PACA ? Quels terrains sont prioritaires à l'achat par la "CDC Biodiversité" pour la protection du Coussoul de Craux? Quelle est l'évolution de la taille de la population des insectes pollinisateurs dans la plaine de Beauce depuis les révolutions agricoles? Combien d'observations sont présentes dans la zone sélectionnées? Combien d'individus de l'espèce X ont été vus sur la zone Y ? Quels sont les principaux protocoles d'échantillonnage pour estimer la taille d'une population/densité d'une population d'oiseaux ? Quelles est la taille, la forme et le nombre de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ? Quelle est la précision et l'exactitude de ce jeu de données ? Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ? Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ? Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élévé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ? Quelles étaient les valeurs des variables d'environnement pour cet échantillon ? Existe-t-il des couches de végétation disponibles pour l'aire d'étude ? Existe-t-il des modèles numériques de terrain disponibles pour l'aire d'étude ? Existe-t-il des images rasters disponibles pour l'aire d'étude ? Quelles sont les differentes categories d'Aires Protegées? Comment pouvons-nous sauvegarder l'agrobiodiversité des bananes cultivées dans le contexte de la mondialisation? Politiques Scientifiques Locales
  29. 29. ~100 termes définis Références bibliographiques Glossaires Dictionnaires Glossary for exploring GIS by Nicholas Chrismas Glossary of the Federal Geographic Data Committee Glossary of the Great Lakes Environmental Indicators Project Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO Glossary of statistical terms, Organization for economic co-operation and development OceanLink’s Glossary of Common Terms and Definitions in Marine Biology International Code of Zoological Nomenclature 1999 Larousse Wiktionary
  30. 30. Etude des standards Dublin Core EML Darwin Core ABCD schema Taxon Concept Schema Standards de données de biodiversité Standards de métadonnées GML ISO 19115 Standards de données géographiques
  31. 31. ALTER-Net Ontologies (SERONTO) Amphibien taxonomy Basis Formal Ontology Biological Taxonomy Vocabulary Biotop Cereal plant trait< Crop ontology Darwin-SW DOLCE Environment Ontology Extensible Observation Ontology Fly taxonomy Gazetteer Ontology GeoConcepts Ontology Geonames geo OWL geoSpecies ontology INSEE ontology NCBI organismal classification OBO relationship types ontology of geographical region (from UMLS) Ordnance Survey Ontologies Plant environmental conditions Spire: ethan ontology SUMO Sweet ontologies Taxonomic rank vocabulary Taxon concept ontology Taxonomy Ontology Teleost taxonomy Wildlife Ontology (BBC) Les ontologies en biodiversité 30 ontologies de domaine Biologie 17 OWL 16 Géographie 11 OBO 12 Haut niveau 4 RDFS 2
  32. 32. Construction de l’ontologie Domaine « Observations » « Action dont le résultat est une estimation de la valeur de certaines propriétés de la caractéristique d’intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. » OGC • • • • Collecte de données Méthodes d’échantillonnage Identification Préparation de la collecte (recherche d’information cartographique, par exemple) • Données collectées
  33. 33. ~30 termes du glossaire Dans les Standards ? Accuracy (ABCD) Identification (ABCD) Taxon (DwC) Observation (GML) Polygon (GML)
  34. 34. Top domaine ontologie Concepts environnementaux Standards en biodiversité
  35. 35. Top domaine ontologie • OBOE, extensible Observational ontology • Ontologie issue du projet SEEK (Science Environment for Ecological Knowledge) • LTER : Long Term Ecological Research (US) • http://seek.ecoinformatics.org. • Madin et al, 2007
  36. 36. OBOE-core Une entité peut être observée dans le contexte de plusieurs entités  un individu peut être observé dans le contexte d’un habitat et d’une date. Les caractéristiques observées sont mesurées suivant un protocole et un standard.  Taille en cm
  37. 37. Extension OBOE core Les points d’extension : • Entity • Characteristic • Measurement Classification des concepts définis suivant les points d’extension Modélisation des propriétés et classes supplémentaires
  38. 38. Les concepts Entity Characteristic Measurement Sample Population Polygon Quadrat Transect Individu Date Area PopulationSize PopulationDensity SpatialPattern Criteria EnvironnementalVariable SamplingProtocol Identification
  39. 39. Les ressources externes • Wgs84_pos geo:lat geo:long geo:alt • Dublin core dc:Location • Foaf foaf:person • Taxon concept txn:speciesConcept txn:hasGBIF txn: hasEOL …
  40. 40. Measurement
  41. 41. Entity
  42. 42. Knowledge
  43. 43. ecoOnto • Réflexion sur les concepts • Etat de l’art sur les standards, les ontologies, les technologies • Ontologie pas vraiment aboutie – Rôle de NS ? Du comité scientifique ? – Fin de projet – Pas de validation des acteurs du domaine
  44. 44. ecoQuery Extraire et exploiter les données de biodiversité glossary ecoOnto-Med 2010 2011 2012 2013
  45. 45. Etude de la faisabilité du système ECO-INC Quelles sont les zones à protéger en PACA? Proposition de zones à protéger en PACA Recherche des données existantes ecoRelevé Knowledge Module de connaissances Module de données Observations à collecter pour répondre à la question
  46. 46. Etude de la faisabilité du système LOD Quelles sont les zones à protéger en PACA? Proposition de zones à protéger en PACA ecoRelevé Knowledge Module de connaissances Module de données Recherche des données existantes Observations à collecter pour répondre à la question
  47. 47. Web de données et biodiversité +200 jeux de données 40 en biologie/15 en géographie Des bonnes pratiques  Identification des éléments par des URI  Utilisation d'URI HTTP déréférençables  Fournir des informations lisibles par les humains et les machines  Ajouter des URI externes http://datahub.io/dataset//
  48. 48. La plateforme ecoRelevé ecoRelevé Explorer Core Service Web Data Espèces Temps Localisation http://naturalsolutions.github.io/ecoReleve/
  49. 49. La plateforme ecoRelevé ecoRelevé Knowlege Sparql Ontologie Explorer Core Service Web Data Espèces Temps Localisation http://naturalsolutions.github.io/ecoReleve/
  50. 50. Cas d’utilisation Étude de l’impact sur l’avifaune de la restructuration des dispositifs de protection contre les crues Sénas - Cheval Blanc
  51. 51. Démarche Collecte de données (web, terrain) • Occurrence des taxons • Statut de protection  Détermination de l'importance du site pour l'avifaune
  52. 52. Inventaire de l’avifaune Recherche des données Web GeoNames : Communes de Cheval Blanc Taxon Concepts : Occurrence d’espèces Taxon Concepts : Dates RDFization des données de l’Avian Knowledge Network http://www.avianknowledge.net/ 6 taxons
  53. 53. Inventaire de l’avifaune Collecte des données Terrain 17 taxons Import dans ecoRelevé Data Enrichissement DBpedia - statuts IUCN - photos Acrocephalus arundinaceus (Linnaeus, 1758) Rousserolle turdoïde
  54. 54. Inventaire de l’avifaune Enrichissement GeoNames : Département du Vaucluse AKN : occurrences Dbpedia : statuts, photos 49 taxons
  55. 55. Etude de la faisabilité du système   Utilisation des technologies du Web Sémantique pour intégrer des données de biodiversité Mise à disposition de ces technologies pour les acteurs de la biodiversité
  56. 56. Bémol Faible volume d’observations disponibles dans le LOD  Utilisation de l’ontologie de la biodiversité pour intégrer plus de données ! ecoOnto Module de données
  57. 57. Et la suite ? Les acteurs du domaine pas prêts pour accueillir ces nouvelles technologies • Besoin de définir les concepts du domaine • Besoin d’outils pour définir ces concepts et pour les utiliser  2 Projets • ecoOnto-Med • ecoRelevé glossary
  58. 58. ecoOnto-Med Glossaire en ligne trilingue pour un développement durable en Méditerranée glossary ecoOnto-Med 2010 2011 2012 2013
  59. 59. ecoOnto-Med Résoudre les problèmes d’interprétation et de traduction des connaissances scientifiques sur la biodiversité dans les pays arabophone Glossaire trilingue (Français/Anglais/Arabe) de la biodiversité en Méditerranée
  60. 60. Besoins Etablir un glossaire Anglais – Français – Arabe [Terme préféré – Définition – Références - Synonymes – Termes reliés] Editable en ligne dans toute les langues (avec prise en compte de l’écriture droite-vers-gauche) Mettre en place un workflow collaboratif d’édition des termes Rédaction/Traduction/Validation
  61. 61. MediaWiki Un moteur de Wiki open source Wikipedia, Wikitionary, Wikimedia Commons (+4000 services) • Ajouter, modifier, supprimer les contenus via un navigateur • Edition collaborative avec prise en compte de l’écriture droite-vers-gauche • Gestion des droits
  62. 62. ecoOnto-Med http://ecoonto.cmimarseille.org/
  63. 63. ~150 concepts Blondel J., Aronson J., Bodiou J.Y. and Boeuf G. (2010); The Mediterranean region: biological diversity in space and time
  64. 64. Edition via des formulaires
  65. 65. ecoOnto-Med Sur les traces du projet ecoOnto … • Un glossaire de la biodiversité • Une édition collaborative • Pas de relation en les termes • Pas d’utilisation de standards existants Vers le web sémantique…
  66. 66. ecoRelevé Glossary Un éditeur de vocabulaires contrôlés glossary ecoOnto-Med 2010 2011 2012 2013
  67. 67. Gestion des données de biodiversité Controlled Controlled Vocabulaires vocabularies vocabularies contrôlés Annotation Données de biodiversité • Ajouter du sens auX données • Domaines de valeurs • Design de protocoles • Communication
  68. 68. Communication Vocabulaires contrôlés Données de Biodiv
  69. 69. Communication Vocabulaires contrôlés Données de Biodiv
  70. 70. Communication Vocabulaires contrôlés Données de Biodiv
  71. 71. Communication Vocabulaires contrôlés Données de Biodiv
  72. 72. Besoins Accompagner le changement pour interopérer avec le monde Controlled Controlled Vocabulaires vocabularies vocabularies contrôlés Données de biodiversité
  73. 73. Solution souscription Extrait de vocabulaires extract Editeur de vocabulaires Controlled Controlled Vocabulaires vocabularies vocabularies contrôlés Données de biodiversité
  74. 74. Solution souscription Editeur de vocabulaire  Interopérabilité
  75. 75. Editeur de vocabulaires Besoins • Web • Open source • Edition collaborative • Gestion des versions • Fédérer une communauté • Importer and réutiliser des vocabulaires existants • Compatible avec les technologies du sémantique Web  Extension de Semantic MediaWiki
  76. 76. Semantic MediaWiki Une extension de MediaWiki ajoutant des annotations semantiques • • • • Ajouter des propriétés à aux pages Interroger de manière sémantique Importer and réutiliser vocabulaires Exporter en RDF
  77. 77. ecoRelevé Glossary Import des vocabulaires •SKOS •Dubin Core •Bibo •RDF/RDFS skos:definition dcterms:identifier skos:prefLabel Glossary:concept bibo:document 1 page = 1 concept skos:altLabel • URI déréférencées • Propriétés extraites des vocabulaires pour décrire les concepts skos:exactMatch
  78. 78. Hiérarchie simple rdf:type skos:broader/skos:narrower skos:hasTopConcept Glossary:category Glossary:topConcept Glossary:concept Glossary:concept Glossary:concept
  79. 79. Fonctionnalités spécifiques • Gestion des références bibliographiques • Navigation via fil d’ariane • Import de vocabulaires SKOS
  80. 80. L’interface
  81. 81. Le connecteur Comment utiliser ces vocabulaires pour annoter les données ? 1. Définir une thésaurus via la page de souscription 2. Un thesaurus = une requête sémantique à partir du glossaire • un ensemble de concepts • un ensemble de propriétés 3. Souscrire à ce thésaurus via la page des préférences utilisateur 4. Appeler ce thésaurus • via le web • via un client glossary 5. Voir les logs des événements à partir du menu utilisateur • Initialisation • Mise à jour
  82. 82. Définir le thésaurus
  83. 83. Souscrire
  84. 84. Client Glossary getData Client Glossary ecoRelevé Glossary Gestion de la souscription Logs Export du Thésaurus/logs Connexion à mon système Controlled Controlled Controlled vocabularies vocabularies vocabularies Une solution non intrusive pour se connecter au monde ! Biodiversity data
  85. 85. ecoRelevé Glossary Un système de gestion de vocabulaires Une solution pour se connecter aux vocabulaires En développement ! Besoin de sensibiliser les acteurs du domaine à l’annotation dans le contexte du partage de données http://ecoreleveglossary.natural-solutions.eu/
  86. 86. Conclusion Acteurs du domaine prêts Données disponibles ***** • EOL • GBIF • wikidata •… Outil d’exploration • Datahub Outil d’annotation sémantique • ecoRelevé Glossary
  87. 87. Merci ! www.natural-solutions.eu Amandine Sahl http://www.ecobalade.fr/ http://sauvagesdepaca.fr/ julie_chabalier@natural-solutions.eu http://www.naturalsolutions.eu/biodiversity-game

×