1. EcoOnto, une ontologie pour la
Biodiversité
Acquisition, structuration et valorisation de données issues
d’observations biologiques
Workshop Sémantique & Ontologies AnaEE-France
6 décembre 2013 - Moulis
Julie Chabalier
7. Des outils numériques pour la nature
DONNÉES
EXISTANTES
COLLECTE
ACQUÉRIR
CARTES
SI
STRUCTURER
BD
VALORISER
GRAPHES
Aide à la décision :
Risque de perte de
biodiversité ?
Espèces / écosystèmes à
préserver ?
8. Idée
Quelles sont les
zones à protéger
en PACA?
Proposition de
zones à protéger
en PACA
?
Recherche
des
données
existantes
Observations à collecter
pour répondre à la
question
Web
12. Projet ECO-INC
ECOlogical INtelligent Census
Quelles sont les
zones à protéger
en PACA?
Proposition de
zones à
protéger en
PACA
Recherche
des données
existantes
ecoRelevé Knowledge
Module de
connaissances
Module de
données
Observations à
collecter pour répondre
à la question
13. AAP « Eco-industries »
Avril 2009
• ADEME – OSEO – DGCIS (Fonds de compétitivité
des entreprises)
• Type de projets : projet de développement
expérimental et d’innovation individuel (PME)
• Axe : surveiller et tracer
• Thème : observer davantage et mieux
l’environnement
• Projet déposé : 30 avril 2009
• Demande de financement : 390 k€ sur 3 ans
14. Projet Lauréat !
Financement après
négociation
Subvention 150k€ sur 1,5 an
• 50 k€ OSEO AFI –
Faisabilité du système :
ecoQuery
• 100 k€ Ministère écologie –
Ontologie : ecoOnto
• Début des travaux janvier
2010
22. Un glossaire pour la biodiversité
1. Lister un ensemble de questions environnementales
2. Extraire les concepts
3. Définir des concepts
Exemple :
Quels sont les impacts sur l’environnement si l'étang de
Mauguio s'assèche?
23. Un concept [fr] :
Le glossaire
[label préféré; synonymes; Définitions; Références; termes
associés]
label préféré : Impact sur l’environnement
Synonymes : Conséquence sur l’environnement, effet sur l’environnement
Définitions :
1.
Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique
d'écosystème.
2.
Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement
des activités, produits ou services d’un organisme.
Références :
1.
P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4,
pp. 215-306.
2.
Norme ISO 14001.
Terme associé : Etude d’impact
24. Le glossaire
Un concept [fr] :
[label préféré; synonymes; Définitions; Références; termes
associés]
label préféré : Impact sur l’environnement
Synonymes : Conséquence sur l’environnement, effet sur l’environnement
Définitions :
1.
Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique d'écosystème.
2.
Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement des activités,
produits ou services d’un organisme.
Références :
label préféré : Etude d’impact
P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4, pp. 215-306.
Synonyme : Etude d’incidence
2. Norme ISO 14001.
Définitions :
Terme associé : Etude d’impact
1. Processus d’identification des conséquences probables pour l’environnement biogéophysique, pour la santé de l’homme et pour son bien-être, de la mise en œuvre
Enrichissement
de certaines activités et transmission de ces informations aux responsables
capables de sanctionner les propositions.
du glossaire
1.
Références :
1.
Wathern (Ed.), 1988, Environmental Impact Assessment: Theory and Practice,
Routledge, London
Terme associé : Impact sur l’environnement
25. Enrichissement du glossaire
Décomposition des questions :
Quels sont les impacts sur la biodiversité si l'étang de Mauguio
s'assèche?
• Quel est le polygone correspondant à l’étang de Mauguio ?
• Quelles sont les espèces observées dans le polygone?
• Parmi les espèces observées, quelles espèces pourraient disparaître s’il y
avait assèchement ?
– Rechercher les habitats des espèces observées?
– Sélectionner les espèces observées qui ont pour habitat les zones humides
26. Définir les termes
Polygone Aire formée d'une surface intérieure, d'un anneau extérieur et qui peut comporter plusieurs anneaux
intérieurs qui ne se croisent pas ni ne s'imbriquent. Glossaire - Exploring GIS, by Nicholas Chrisman. [Aire]
Etang Etendue d'eau stagnante, peu profonde, de surface inférieure à 8 hectares résultant de l'imperméabilité du
sol. Convention de Ramsar, 1971.
Observation
1.Une observation est une action dont le résultat est une estimation de la valeur de certaines propriétés de la
caractéristique d’intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. SEEgrid,”OGC Standard
- Observations and Measurements”
2. Une observation est une affirmation selon laquelle une entité a été observée. Une observation peut consister
en des mesures qui se réfèrent à une ou plusieurs caractéristiques de l’entité. Les observations sont effectuées
dans un contexte. Le contexte d’une observation se compose d’autres observations. Par exemple, une
observation d’un lieu particulier peut servir de cadre pour une observation d’un organisme. Madin J., Bowers S.,
Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological
observation data. Ecological Informatics, Vol2,3,pp 279-296 [Observateur]
Habitat
1. Ensemble de caractéristiques environnementales qui, pour les animaux terrestres, est généralement assimilé
à une communauté végétale, une association végétale, ou un type de couverture . Garshelis,2000, Delusions in
habitat Evaluation: Measuring Use, Selection, and Importance in Research techniques in animal ecology
2. Lieu ou type de site dans lequel un organisme ou une population existe à l'état naturel. Convention sur la
diversité biologique, 1992.
Zone humide 1. terrains, exploités ou non, habituellement inondés ou gorgés d'eau douce […] Article 2 de la loi du 3
janvier 1992 Codifié à l'article L 211-1 du code de l'environnement. 2.les zones humides sont des étendues de
marais, de fagnes, de tourbières ou d'eaux naturelles ou artificielles […] Article 1.1 Convention de Ramsar, 1971.
27. Un Wiki pour collaborer
XWiki : un moteur de wiki open source
• Edition collaborative via un navigateur Web
view/edit/preview/save
• Edition WYSIWYG
• Gestion des versions
• Gestion des droits
http://www.xwiki.com/
28. 35 questions [fr- en]
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
Quels sont les impacts sur l’environnement si l'étang de Mauguio s'assèche?
Quelles sont les conséquences de l'introduction de la coccinelle orientale, Harmonia axyridis Pallas sur l'écosystème européen?
Est-ce que les campagnes entourant Lunel ont un niveau de biodiversité élevée?
Quelles sont les méthodes pour évaluer la biodiversité de ma région?
Pourquoi malgré son statut d’espèce protégée, l’Esturgeon européen est en train de disparaître?
Depuis le début de sa protection en 1979, comment évolue la taille de la population de la genette (Genetta genetta) en France?
Quel est l'impact de la mise en place d’une aire de stationnement de poids lourds, au niveau de l’aire d’autoroute de Vidauban ?
Le fauchage en juin n’est-il pas un puits écologique pour la biodiversité pour mon pâturage, en Auvergne, Marcenat ?
Pourquoi je ne vois plus de chouettes lorsque je me balade en Camargue?
Puis-je observer des Bouquetins dans le Parc National des Ecrins?
Quels sont les impacts sur la biodiversité s'il n'y a plus de paturage dans les montagnes alpines?
Combien d'espèces en danger y a-t-il autour de ma zone?
Comment pouvons nous atteindre l'objectif de la CDB (Convention sur la diversité biologique) dans l'aire méditerranéenne de protéger 10% desécorégions du monde
?
Comment délimiter le territoire du futur Parc National en forêt feuillus de plaine (entre Champagne et Bourgogne) ?
Comment délimiter le cœur de parc du futur Parc National des calanques ?
Quels terrains sont prioritaires à l'achat pour le Conservatoire du Littoral en region PACA ?
Quels terrains sont prioritaires à l'achat par la "CDC Biodiversité" pour la protection du Coussoul de Craux?
Quelle est l'évolution de la taille de la population des insectes pollinisateurs dans la plaine de Beauce depuis les révolutions agricoles?
Combien d'observations sont présentes dans la zone sélectionnées?
Combien d'individus de l'espèce X ont été vus sur la zone Y ?
Quels sont les principaux protocoles d'échantillonnage pour estimer la taille d'une population/densité d'une population d'oiseaux ?
Quelles est la taille, la forme et le nombre de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ?
Quelle est la précision et l'exactitude de ce jeu de données ?
Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élévé, à l'espèce/sous-espèce, i.e. taxon le
plus bas) ?
Quelles étaient les valeurs des variables d'environnement pour cet échantillon ?
Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
Existe-t-il des modèles numériques de terrain disponibles pour l'aire d'étude ?
Existe-t-il des images rasters disponibles pour l'aire d'étude ?
Quelles sont les differentes categories d'Aires Protegées?
Comment pouvons-nous sauvegarder l'agrobiodiversité des bananes cultivées dans le contexte de la mondialisation?
Politiques
Scientifiques
Locales
29. ~100 termes définis
Références
bibliographiques
Glossaires
Dictionnaires
Glossary for exploring GIS by Nicholas Chrismas
Glossary of the Federal Geographic Data Committee
Glossary of the Great Lakes Environmental Indicators Project
Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO
Glossary of statistical terms, Organization for economic co-operation and development
OceanLink’s Glossary of Common Terms and Definitions in Marine Biology
International Code of Zoological Nomenclature 1999
Larousse
Wiktionary
30. Etude des standards
Dublin Core
EML
Darwin Core
ABCD schema
Taxon Concept Schema
Standards de données
de biodiversité
Standards de
métadonnées
GML
ISO 19115
Standards de données
géographiques
32. Construction de l’ontologie
Domaine « Observations »
« Action dont le résultat est une estimation de la valeur de certaines
propriétés de la caractéristique d’intérêt. Cette valeur est obtenue en
utilisant une procédure spécifique. » OGC
•
•
•
•
Collecte de données
Méthodes d’échantillonnage
Identification
Préparation de la collecte (recherche d’information
cartographique, par exemple)
• Données collectées
33. ~30 termes du glossaire
Dans les Standards ?
Accuracy (ABCD)
Identification (ABCD)
Taxon (DwC)
Observation (GML)
Polygon (GML)
35. Top domaine ontologie
• OBOE, extensible Observational ontology
• Ontologie issue du projet SEEK (Science Environment
for Ecological Knowledge)
• LTER : Long Term Ecological Research (US)
• http://seek.ecoinformatics.org.
• Madin et al, 2007
36. OBOE-core
Une entité peut être observée dans le
contexte de plusieurs entités
un individu peut être observé dans
le contexte d’un habitat et d’une date.
Les caractéristiques observées sont
mesurées suivant un protocole et un
standard.
Taille en cm
37. Extension OBOE core
Les points d’extension :
• Entity
• Characteristic
• Measurement
Classification des concepts définis suivant les points
d’extension
Modélisation des propriétés et classes supplémentaires
44. ecoOnto
• Réflexion sur les concepts
• Etat de l’art sur les standards, les ontologies, les
technologies
• Ontologie pas vraiment aboutie
– Rôle de NS ? Du comité scientifique ?
– Fin de projet
– Pas de validation des acteurs du domaine
46. Etude de la faisabilité du système
ECO-INC
Quelles sont les
zones à protéger
en PACA?
Proposition de
zones à
protéger en
PACA
Recherche
des données
existantes
ecoRelevé Knowledge
Module de
connaissances
Module de
données
Observations à
collecter pour répondre
à la question
47. Etude de la faisabilité du système
LOD
Quelles sont les
zones à protéger
en PACA?
Proposition de
zones à
protéger en
PACA
ecoRelevé Knowledge
Module de
connaissances
Module de
données
Recherche
des données
existantes
Observations à
collecter pour répondre
à la question
48. Web de données et biodiversité
+200 jeux de données
40 en biologie/15 en géographie
Des bonnes pratiques
Identification des éléments par des URI
Utilisation d'URI HTTP déréférençables
Fournir des informations lisibles par les humains
et les machines
Ajouter des URI externes
http://datahub.io/dataset//
50. La plateforme ecoRelevé
ecoRelevé Knowlege
Sparql
Ontologie
Explorer
Core
Service
Web
Data
Espèces
Temps
Localisation
http://naturalsolutions.github.io/ecoReleve/
51. Cas d’utilisation
Étude de l’impact sur l’avifaune de la
restructuration des dispositifs de
protection contre les crues
Sénas - Cheval Blanc
52. Démarche
Collecte de données (web, terrain)
• Occurrence des taxons
• Statut de protection
Détermination de l'importance du site pour
l'avifaune
53. Inventaire de l’avifaune
Recherche des données
Web
GeoNames : Communes de Cheval Blanc
Taxon Concepts : Occurrence d’espèces
Taxon Concepts : Dates
RDFization des
données de l’Avian
Knowledge Network
http://www.avianknowledge.net/
6 taxons
54. Inventaire de l’avifaune
Collecte des données
Terrain
17 taxons
Import dans ecoRelevé Data
Enrichissement
DBpedia
- statuts IUCN
- photos
Acrocephalus
arundinaceus
(Linnaeus, 1758)
Rousserolle
turdoïde
56. Etude de la faisabilité du système
Utilisation des technologies du Web
Sémantique pour intégrer des données de
biodiversité
Mise à disposition de ces technologies pour
les acteurs de la biodiversité
57. Bémol
Faible volume d’observations disponibles dans le
LOD
Utilisation de l’ontologie de la biodiversité pour
intégrer plus de données !
ecoOnto
Module de
données
58. Et la suite ?
Les acteurs du domaine pas prêts pour accueillir ces
nouvelles technologies
• Besoin de définir les concepts du domaine
• Besoin d’outils pour définir ces concepts et pour les utiliser
2 Projets
• ecoOnto-Med
• ecoRelevé glossary
60. ecoOnto-Med
Résoudre les problèmes d’interprétation et de traduction des
connaissances scientifiques sur la biodiversité dans les
pays arabophone
Glossaire trilingue (Français/Anglais/Arabe) de la biodiversité
en Méditerranée
61. Besoins
Etablir un glossaire Anglais – Français – Arabe
[Terme préféré – Définition – Références - Synonymes –
Termes reliés]
Editable en ligne dans toute les langues (avec prise en
compte de l’écriture droite-vers-gauche)
Mettre en place un workflow collaboratif d’édition des
termes
Rédaction/Traduction/Validation
62. MediaWiki
Un moteur de Wiki open source
Wikipedia, Wikitionary, Wikimedia Commons (+4000
services)
• Ajouter, modifier, supprimer les contenus via un
navigateur
• Edition collaborative avec prise en compte de
l’écriture droite-vers-gauche
• Gestion des droits
66. ecoOnto-Med
Sur les traces du projet ecoOnto …
• Un glossaire de la biodiversité
• Une édition collaborative
• Pas de relation en les termes
• Pas d’utilisation de standards existants
Vers le web sémantique…
68. Gestion des données de biodiversité
Controlled
Controlled
Vocabulaires
vocabularies
vocabularies
contrôlés
Annotation
Données de
biodiversité
• Ajouter du sens auX
données
• Domaines de valeurs
• Design de protocoles
• Communication
76. Editeur de vocabulaires
Besoins
• Web
• Open source
• Edition collaborative
• Gestion des versions
• Fédérer une communauté
• Importer and réutiliser des vocabulaires existants
• Compatible avec les technologies du sémantique Web
Extension de Semantic MediaWiki
77. Semantic MediaWiki
Une extension de MediaWiki ajoutant des
annotations semantiques
•
•
•
•
Ajouter des propriétés à aux pages
Interroger de manière sémantique
Importer and réutiliser vocabulaires
Exporter en RDF
78. ecoRelevé Glossary
Import des vocabulaires
•SKOS
•Dubin Core
•Bibo
•RDF/RDFS
skos:definition
dcterms:identifier
skos:prefLabel
Glossary:concept
bibo:document
1 page = 1 concept
skos:altLabel
• URI déréférencées
• Propriétés extraites des vocabulaires pour
décrire les concepts
skos:exactMatch
82. Le connecteur
Comment utiliser ces vocabulaires pour annoter les
données ?
1. Définir une thésaurus via la page de souscription
2. Un thesaurus = une requête sémantique à partir du glossaire
•
un ensemble de concepts
•
un ensemble de propriétés
3. Souscrire à ce thésaurus via la page des préférences utilisateur
4. Appeler ce thésaurus
•
via le web
•
via un client glossary
5. Voir les logs des événements à partir du menu utilisateur
• Initialisation
• Mise à jour
85. Client Glossary
getData
Client Glossary
ecoRelevé Glossary
Gestion de la souscription
Logs
Export du Thésaurus/logs
Connexion à mon système
Controlled
Controlled
Controlled
vocabularies
vocabularies
vocabularies
Une solution non
intrusive pour se
connecter au monde !
Biodiversity
data
86. ecoRelevé Glossary
Un système de gestion de vocabulaires
Une solution pour se connecter aux vocabulaires
En développement !
Besoin de sensibiliser les acteurs du domaine à
l’annotation dans le contexte du partage de données
http://ecoreleveglossary.natural-solutions.eu/