Présentation faite lors d'une réunion du projet animitex à montpellier en aôut 2014. Cette présentation introduit certains formats du web sémantique en particulier ceux accessible sur le web de données . Ensuite les travaux de Fabien Amarger sur la transformation de SKOS en ontologies OWL sont survollés.
Présentation faite lors d'une réunion du projet animitex à Montpellier en aôut 2014. Cette présentation brosse un apercu des standards du web sémantique disponible sur le web de données. Puis nous introduisons brièvement les travaux de Fabien Amarger sur la transformation de SKOS en ontologie.
Présentation sur la démarche de l'Open Data (quelles données ? Quels acteurs ?) et sur les technologies gravitant autour du Linked Data (le modèle RDF, RDFS, OWL, les ontologies, les triplestores, etc).
Introduction au web des données (Linked Data)BorderCloud
L'Open Data, le Big Data, le Web des données, le Web sémantique, les ontologies, le NoSql et le SPARQL sont autant de notions qu'il faut comprendre pour ne pas rater la prochaine rupture technologique du Web.
Cette présentation est l'introduction de la formation sur le Web sémantique que donne la société BorderCloud pour prendre un peu de recule sur les buzzwords du moment et savoir si vous avez besoin de faire du Big Data ou bien du Linked Data.
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
Présentation faite lors d'une réunion du projet animitex à Montpellier en aôut 2014. Cette présentation brosse un apercu des standards du web sémantique disponible sur le web de données. Puis nous introduisons brièvement les travaux de Fabien Amarger sur la transformation de SKOS en ontologie.
Présentation sur la démarche de l'Open Data (quelles données ? Quels acteurs ?) et sur les technologies gravitant autour du Linked Data (le modèle RDF, RDFS, OWL, les ontologies, les triplestores, etc).
Introduction au web des données (Linked Data)BorderCloud
L'Open Data, le Big Data, le Web des données, le Web sémantique, les ontologies, le NoSql et le SPARQL sont autant de notions qu'il faut comprendre pour ne pas rater la prochaine rupture technologique du Web.
Cette présentation est l'introduction de la formation sur le Web sémantique que donne la société BorderCloud pour prendre un peu de recule sur les buzzwords du moment et savoir si vous avez besoin de faire du Big Data ou bien du Linked Data.
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
Presentation faite pour la formation enitab a partir d'un chapitre d'ouvrage ROUSSEY, C., FRANÇOIS PINET, KANG, M.A., CORCHO, O. - 2009. How ontologies are used for software interoperability. Chapter to appear in: Use of Ontologies to Support Information Interoperability, Springer, 52 pages disponible ici http://www.towntology.net/towntologyreferences.php
Le Web sémantique (plus techniquement appelé « le Web de données ») permet aux machines de comprendre la sémantique, la signification de l'information sur le Web.
Le terme a été inventé par Tim Berners-Lee, coinventeur du Web et directeur du W3C, qui supervise l'élaboration des propositions de standards du Web sémantique.
Support 4 (web de données) des journées de formation sur l'évolution des catalogues organisées par MédiaLille et le groupe technique sur l'adoption de RDA en France.
Slides de l'atelier JDEV2017 : SPARQL, avancé
Vous saurez après cet atelier : lire un document RDF écrit en Turtle, découvrir une ontologie au travers d’un service SPARQL et lire la documentation officielle de SPARQL.
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
Le web sémantique, théorisé il y a déjà longtemps par Tim Berners-Lee, a tardé à prendre son envol. Mais aujourd'hui la vague est là et les premiers à la surfer sont les grands acteurs du web, comme Google qui bâtit son Knowledge Graph. Les standards sont aujourd'hui matures, et des organisations de toutes tailles les mettent en oeuvre dans des projets concrets, avec un vrai retour sur investissement. Cependant faire une application à l’aide des technologies du Web Sémantique peut s’avérer être une tâche fastidieuse pour ceux qui souhaitent découvrir ce domaine. De nombreuses questions restent souvent en suspens. Quel est le rôle des ontologies ? Pourquoi utiliser RDF et SPARQL ? Qu’est ce qu’un triplestore et comment l’exploiter ? Comment tirer parti du Web de données pour enrichir ses données métier à l'aide de ces outils ? Autant de questions auxquelles nous essaieront de répondre à partir d’un exemple concret : les données de l'institution culturelle Les Champs Libres à Rennes.
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
Diaporama de la présentation faite à l'occasion du Co-lab Semantique organisé par le consortium Scribo. L'enjeu était de présenter en 45-60min les enjeux du Web sémantique.
Cette présentation a été conçue pour les journées d'études 2009 de Medial Nancy dont le thème était : "Les catalogues de bibliothèques de nouvelle génération".
Presentation faite pour la formation enitab a partir d'un chapitre d'ouvrage ROUSSEY, C., FRANÇOIS PINET, KANG, M.A., CORCHO, O. - 2009. How ontologies are used for software interoperability. Chapter to appear in: Use of Ontologies to Support Information Interoperability, Springer, 52 pages disponible ici http://www.towntology.net/towntologyreferences.php
Le Web sémantique (plus techniquement appelé « le Web de données ») permet aux machines de comprendre la sémantique, la signification de l'information sur le Web.
Le terme a été inventé par Tim Berners-Lee, coinventeur du Web et directeur du W3C, qui supervise l'élaboration des propositions de standards du Web sémantique.
Support 4 (web de données) des journées de formation sur l'évolution des catalogues organisées par MédiaLille et le groupe technique sur l'adoption de RDA en France.
Slides de l'atelier JDEV2017 : SPARQL, avancé
Vous saurez après cet atelier : lire un document RDF écrit en Turtle, découvrir une ontologie au travers d’un service SPARQL et lire la documentation officielle de SPARQL.
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
Le web sémantique, théorisé il y a déjà longtemps par Tim Berners-Lee, a tardé à prendre son envol. Mais aujourd'hui la vague est là et les premiers à la surfer sont les grands acteurs du web, comme Google qui bâtit son Knowledge Graph. Les standards sont aujourd'hui matures, et des organisations de toutes tailles les mettent en oeuvre dans des projets concrets, avec un vrai retour sur investissement. Cependant faire une application à l’aide des technologies du Web Sémantique peut s’avérer être une tâche fastidieuse pour ceux qui souhaitent découvrir ce domaine. De nombreuses questions restent souvent en suspens. Quel est le rôle des ontologies ? Pourquoi utiliser RDF et SPARQL ? Qu’est ce qu’un triplestore et comment l’exploiter ? Comment tirer parti du Web de données pour enrichir ses données métier à l'aide de ces outils ? Autant de questions auxquelles nous essaieront de répondre à partir d’un exemple concret : les données de l'institution culturelle Les Champs Libres à Rennes.
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
Diaporama de la présentation faite à l'occasion du Co-lab Semantique organisé par le consortium Scribo. L'enjeu était de présenter en 45-60min les enjeux du Web sémantique.
Cette présentation a été conçue pour les journées d'études 2009 de Medial Nancy dont le thème était : "Les catalogues de bibliothèques de nouvelle génération".
L'ingénierie des ENA fondée sur le web des données ouvertes et liéesGilbert Paquette
Cette présentation à ACFAS-2017 reprend les travaux sur les typologies MISA d'un point de vue ontologique, notamment en ce qui concerne les compétences, les scénarios et les outils de web social.
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationAntidot
Toute organisation subit les limites de son système d’information : entrepôts de données cloisonnés, données hétérogènes, documents non structurés, thésaurus incomplets, taxonomies incohérentes…
Les utilisateurs en souffrent et attendent un véritable « accès unifié à l’information » : trouver l’information par les concepts plutôt que la chercher par les mots, naviguer aisément dans l’information, mieux l’exploiter en collaborant. L’entreprise doit évoluer vers un « espace informationnel enrichi », servant différents usages selon le profil ou la mission de chaque collaborateur.
La vision innovante d'Antidot permet d’aller bien au-delà de ce que permettent les approchent traditionnelles comme la « recherche fédérée » ou encore les « search based applications » car Antidot Information Factory et Antidot Finder Suite permettent de modéliser l’information, de capter, normaliser, décrire et agréger des données puis d’en inférer des informations nouvelles, facilement accessibles.
Intégrant nativement les technologies du web sémantique, Antidot apporte les solutions les plus en pointe dans le domaine et démontre à travers une réalisation emblématique - le projet ISIDORE du CNRS TGE Adonis - comment capter, remodeler et rendre accessible une information à forte valeur ajoutée.
L'utilisation d’ontologies dans le cadre de BiblissimaEquipex Biblissima
Présentation du travail en cours sur le portail Biblissima aux journées "Ontologie en Sciences Humaines et Sociales" par Stefanie Gehrke (MSH Val de Loire, Tours, 09/11/2015)
Séminaire Inria IST - Référentiels et interoperabilité (1)Antoine Isaac
2nde partie : http://www.slideshare.net/antoineisaac/sminaire-inria-ist-rfrentiels-et-interoperabilit-2
Présentation pour le Séminaire IST organisé par Inria
http://www.inria.fr/actualite/agenda/document-numerique
La recherche sur les EIAH couvre un large champ de problèmes en étroite interaction depuis la conception jusqu’au déploiement. De nombreuses disciplines sont impliquées. Leur diversité entraine celle des discours et des pratiques scientifiques en particulier lorsque sont soulevées les questions sur la nature des résultats, leur validité et leur légitimité. Les malentendus sont nombreux et les approximations courantes. L’entente est souvent locale et provisoire, à l’occasion d’un projet ou d’un congrès, et rend difficile la constitution d'un corps de connaissances stable. Pour dépasser cette difficulté, nous avons choisi une approche pragmatique en partant des mots du discours pour en faire l’inventaire et poser la question de leurs définitions. Il ne s’agit pas d'imposer une vision unique, mais d'explorer la richesse lexicale du domaine et d’établir, par ce moyen, des relations entre disciplines et traditions scientifiques. Ce dernier point est particulièrement important. S’il est vrai que la recherche sur les EIAH est internationale et que son vocabulaire est le plus souvent forgé par la sphère anglo-saxonne, il n’en reste pas moins que la plupart des chercheurs travaillent d'abord dans la langue de leur institution et pensent encore -- pour beaucoup d’entre eux -- dans leur langue maternelle. La question de la traduction ou de l’interprétation des termes se pose et peut faire apparaître plus que des nuances. La construction d’un Thesaurus de la recherche sur les EIAH a donc été engagée pour répondre au double besoin de consolider la communication entre chercheurs de différentes disciplines et locuteurs des diverses langues. Je présenterai au cours du séminaire la procédure adoptée pour constituer le thésaurus, le dictionnaire et la stratégie éditoriale. La conclusion évoquera les leçons que l'on peut retenir, et proposera des perspectives de développement du projet.
Irstea Use Case: Integration of Crop Observations using Semantic Web Technolo...catherine roussey
Présentation of AgroTechnopole where Irstea develops a use case of data integration of Crop observation. Participation Panel Session on "Semantics to enable sharing and interoperability of data in agriculture.
What do we need?" 10th International Conference on Metadata and Semantics Research 22-25 November 2016, Göttingen, Germany MTSR 2016
PhD subject of Jie Sun. Simulation tool based on JADE , jess rule engine and ontology. The goal is to prove that a sensor that can adapt its behaviour based on observed phenomenon state will libve longer
Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...catherine roussey
annotation des Bulletins de Santé du Végétal en utilisant les technologies web sémantique. Objectif final développer le web de données agricol en proposant des ontologies dédiées et des méthodes d'enrichissement et de mises à jour propres à ce domaine
Semantic Sensor Network Ontology: Description et usagecatherine roussey
cours à l'école d'Été Web Intelligence 2013 « Le Web des objets » 3 septembre 2013, Saint-Germain-Au-Mont-d'Or, Franc. 67 slides.
ce cours en plus de décrire l'ontology ssn présente certains usages.
Semantic Sensor Network Ontology: Description et usage
Skos transformation
1. Pour mieux
affirmer
ses missions,
le Cemagref
devient Irstea
www.irstea.fr
Ontologies, Web de Données
et SKOS Transformation
Catherine ROUSSEY
Projet Animitex
28 aout 2014, Montpellier
Merci à
Fabien Amarger
Fabien Gandon
2. 2
Plan
• Définitions de base: de l’Ontologie aux ontologies
• Données Information Connaissances
• Interopérabilité et ontologies
• Format et standard du web sémantique
• Ontologie linguistique système de recherche d’information
• Exemple SKOS
• Ontologie de données web de données
• Exemple RDFS, OWL
• Ontologie Logique…
3. 3
Définitions:
DONNÉES, INFORMATIONS, CONNAISSANCES
Donnée: un élément d’information,
percevable,
manipulable
Information: donnée +
sens + contexte
type
Connaissance: information +
stabilité + croyance
abstraction + traitement
généralisation d’un ensemble d’information = modèle
toujours propre à une personne
partagée avec d’autres personnes
4. 4
Schéma général
DONNÉES, INFORMATIONS, CONNAISSANCES
Connaissances
Information
Données
Résultat d’un processus d’apprentissage: une
généralisation d’un ensemble d’information que
l’on va mémoriser
Sens dans un contexte
Perception
Classes en POO
BD Relationnelle Données fortement structurées optimisées pour le
Données typées
Données
Description sous forme d’attribut (description
quantitative & qualitative ) + méthodes
(traitements)
Connaissances en IA
Des traitement particuliers sur les données
qualitatives
stockage
Différent niveau de granularité : information
structurée non structurées
5. 5
Définition
ONTOLOGIE
Ontologie avec un O majuscule (philosophie):
Une science: une branche de la métaphysique qui a pour objectif
l’étude de l’être, c'est-à-dire l'étude des propriétés générales de tout
ce qui est…
Ontologies au pluriel avec un o minuscule (informatique):
Outils informatiques
résultat d’une modélisation d’un domaine d’étude
défini pour un objectif donné
acceptée par une communauté d’utilisateurs
…
6. 6
Ontologies …
Gruber 1993 : « une ontologie est une spécification explicite d’une
conceptualisation »
• Conceptualisation: modèle abstrait du domaine: quelles entités?
• Spécification explicite: les types et leurs contraintes d’usage sont définis
dans un langage…
Exemples:
• Un thésaurus : vocabulaire normalisé
• Un schéma de BD : un modèle structuré d'un domaine
• Un système expert : un modèle du domaine formalisé pour les
inférences, des conditions exprimées à l'aide de formules logiques
Ontologie linguistique, ressource termino-ontologique, ontologie de
domaine, ontologie de haut niveau, vocabulaire de métadonnées…
Thomas R. Gruber. “A translation approach to portable ontology specifications”,
Knowledge Acquisition, Volume 5, Issue 2, June 1993, Pages 199–220
7. 7
Différent niveau d’Intéropérabilité
Increasing Knowledge
Logical
Theory
Conceptual Model
Taxonomy
Thesaurus
List
ER Model
DB
Schema
XML Schema
SKOS
RDF
Lexical Database
Controlled Vocabulary
Glossary
Lexical
Interoperability
UML
Data
Interoperability
OWL
Description
Logic
Object
Interoperability
7 Increasing Interoperability Capability
8. 8
Web sémantique, ontologies, web de données
World Wide Web Consortium
(W3C)
Credit Benjamin Nowak
9. 9
Syntaxe de base du web sémantique
RDF: RESOURCE DESCRIPTION FRAMEWORK
is a triple model i.e. every
piece of knowledge is broken down into
( subject , predicate , object )
RDF
Credit Fabien GANDON
14. 14
Problème de l’interopérabilité lexicale
Le même terme est utilisé pour représenter différents objets
Le même objet est référencé par des termes différents
Credit Fabien GANDON
15. 15
A relatively large
natural stream of
A relatively large
natural stream of
water
water
15
rivière
fleuve
river
rio
Water course
Una corriente
relativamente larga
corriente de agua natural
Cours d’eau naturel de moyenne
ou de faible importance, qui en
principe n’aboutit pas directement
à la mer
Cours d’eau naturel
généralement important
(plus spécialement lorsque
ce cours d’eau se jette
dans la mer)
16. 16
A relatively large
natural stream of
A relatively large
natural stream of
water
water
16
rivière
fleuve
river
rio
Water course
Una corriente
relativamente larga
corriente de agua natural
Cours d’eau naturel de moyenne
ou de faible importance, qui en
principe n’aboutit pas directement
à la mer
Cours d’eau naturel
généralement important
(plus spécialement lorsque
ce cours d’eau se jette
dans la mer)
18. 18
Système de Recherche d’Information
Matchin
g
Docum
ent
index
and
user
query
1
2
3
Multilingual Corpora
Query
Ordered list of documents
Terminological
Ontology
Information
Retrieval
System
indexing
19. 19
Système de Recherche sur le web
mapping
annotation
Query annotation
Results
annotation
20. 20
Format des ontologies terminologiques
SKOS: SIMPLE KNOWLEDGE ORGANIZATION SYSTEM
Credit http://www.w3.org/2004/02/skos/intro
23. 23
Intéropérabilité de données
LES FORMATS D’ÉCHANGE DE DONNÉES (SCHÉMA XML)
Blue
system
Blue
data
Green
system
Green
data
Red
system
Red
data
24. 24
Intéropérabilité de données
LE WEB DE DONNÉES OU LINKED DATA
An extension of the
current Web…
… where data are given
well-defined and
explicitly represented
meaning, …
… so that it can be
shared and used by
humans and machines,
...
... better enabling them
to work in cooperation
And clear principles on
how to publish data
25. 25
Les ontologies dans le web de données
Une ontologie contient un vocabulaire et un schéma de données:
• consensuels,
• publiés sur le web et documentés
• formalisés avec des standards du web (RDF, OWL, SPARQL)
• Avec des contraintes en DL (conditions nécessaires et/ou suffisantes)
= un schéma de données pour le web de données
26. 26
The Linking Open Data cloud
2
6
Credit Linking Open Data cloud diagram, by Richard Cyganiak and Anja
Jentzsch. http://lod-cloud.net/
Credit Bill ROBERTS
27. 27
Format des ontologies de données
RDF SCHEMA
define classes and relations of resources and organize their hierarchy
define signatures of relations (domain, range)
document them with labels and comments
define associated inference rules
Credit Fabien Gandon
#12
#21
"document"
"book"
#47 #48
"livre"
"novel"
"roman"
"short story"
"nouvelle"
29. 29
Format des ontologies de données
OWL WEB ONTOLOGY LANGUAGE
OWL is based on Description Logics
The logical theory (model) can be define using different knowledge
representation Languages:
Description Logics, Frames, Conceptual Graphs
OWL Profiles
EL: large numbers of properties and/or classes and polynomial time.
QL: large volumes of instance data, and conjunctive query answering
using conventional relational database in LOGSPACE
RL: scalable reasoning without sacrificing too much expressive power
using rule-based reasoning in polynomial time
Credit Fabien Gandon
30. 30
Ou trouver des ontologies ?
SWOOGLE
http://swoogle.umbc.edu/
Watson
http://watson.kmi.open.ac.uk/WatsonWUI/
LOV Linked Open Vocabulary
http://lov.okfn.org/dataset/lov/
W3C groups
http://www.w3.org/Consortium/activities
Credit Fabien Gandon
31. Pour mieux
affirmer
ses missions,
le Cemagref
devient Irstea
www.irstea.fr
Thèse de Fabien Amarger
construction d’ontologies
agricoles …
C. Roussey J.P. Chanet (Irstea)
N. Hernandez O. Haemmerlé (IRIT)
32. 32
Plan
Motivation
Cas d’étude : projet sur les BSV
Interrogation avec SWIP
Thème de la thèse
Comment construire des ontologies à partir de sources non ontologiques
Etat de l’art:
Méthodologie Néon
Transformation SKOS
Notre proposition
Ontology Design Pattern
Multiplier les Sources
Calculer la confiance des éléments + filtrage
33. 33
Motivations
• Volonté d’aider les agriculteurs à diminuer l’usage des produits
phytosanitaires
• Augmentation du nombre de données dans le domaine de l’agriculture
• Bulletins de Santé du Végétal
• thésaurus AGROVOC
• base de données publique e-phy
• etc.
• Volonté de contribuer au Linked Open Data (LOD)
• Interrogation de l’ontologie par requête en langage naturel (projet
SWIP)
• Méthodologie de construction d’ontologies à partir de divers sources
• Interrogation intelligente des informations collectées
35. 35
Cas d'étude:
Bulletin de Sante du Végétal (BSV)
Bulletin d’alerte français contient des observations sur le
développement des cultures et les risques d’attaques de leurs
agresseurs
BSV distribués sur le web au format pdf
BSV hétérogènes: Différents auteurs, Différents style de
présentation, Différents contenus (texte structuré, tableau, image)
Aider la recherche d'information dans ces BSV + reconstruire
des données d'observation des cultures documentées par les
BSV
Comment faciliter la recherche des BSV ?
Trouver les BSV qui correspondent à un besoin
Identifier la partie des BSV intéressante
Un système de Recherche d’Information ?
36. 36
Processus d'Interrogation SWIP de l'IRIT
SEMANTIC WEB INTERFACE USING PATTERN
Interrogation en français d’une base de triplets RDF
Interprétation de la
requête en langage
naturel
Ontologie
+ triplets
RDF
Requête exprimée en langage naturel
Requête exprimée en langage pivot
Liste de requêtes formelles classées
Patrons
Formalisation de la
requête en langage pivot
phrases explicatives
Credit Camille Pradel
37. 37
Le Système d'Interrogation
SWIP
pdf Internet
Archive
url
Annotation Triple store RDF
pdf
Stockage
Interrogation
Modélisation
Ontologies
annotations
38. 38
Cas d'étude: Annotations des BSV
PROCESSUS ITÉRATIFS D'ANNOTATION
Ontologies
agricoles
1) Reformater les BSV
2) Tenir compte de la structure
des textes pour déduire des
données utiles
Annotation complexes=
•Attaque d'un type de culture
•Par un bio-agresseur
•Quand
•Où
•A quel niveau de risque
outil d'extraction d'information
BD d'annotations = ontologie
peuplée d'observations des
Annotations cultures
RDF
40. 40
Etat de l’Art
• Processus incrémentale: Utilisation que d’une seule source
• Possibilité d’extraction :
• Classes
• Relations non nommées
• Intuition de relation de subsomption (rdfs:subClassOf)
• Techniques de désambiguïsation
• Contraignantes ou pas suffisantes
• Validation peu existante
• Validation de la conceptualisation manuelle
• Validation structurelle automatique
Méthodologie de construction d’ontologie exploitant la
multiplication des sources d’informations disponibles et dirigée par des
patrons de conceptions (Ontology Design Pattern)
43. 43
Proposition
Hypothèses générales
• Chaque source est modelisée en fonction de son usage
• Besoin de remodeliser
• Toutes les sources n’ont pas la même qualité
• La présence de la même information dans plusieurs sources implique
une augmentation de la confiance attribuée à cette information
Motivations
• Construire des ontologies modulaires, Ontologie de domaine de haut
niveau centrée sur une fonctionnalité
• Premier cas d’étude module sur la taxonomie agricole
• Enrichissement de module AgronomicTaxon
45. 45
Irstea Agronomic Taxon
DESIGN PATTERN ONTOLOGIQUES (ODP)
Il existe déjà des ODP en lien
avec l'agriculture
• FAO (projet Neon): isPestOf,
LinneanTaxonomy
• Données observations des
espèces disponibles sur le
Web de données :Geospecies
ontology, TaxonConcept, …
Fusion, intégration et
enrichissement de ces ODP
Pour répondre à nos besoins.
• Méthode de développement d’
ontologies à partir d’ODP
52. 52
Expérimentation
3 sources de bonne qualité:
Thésaurus Agrovoc
Classification TaxRef
Classification NCBI
Construction d’un gold standard à partir de la validation de 3 agronomes
INRA et Irstea.
Extraction des instances F measure > 0.74 très bonne précision
Extraction des relations à améliorer F measure < 0,45
53. 53
Conclusion et Perspectives
Extraction de classes, de labels, de relation d'instanciation
Besoin de définir un modèle d’annotations spatio-temporelles des
observations
Construction d’une ontologie modulaire : 1 module créé / 5
Des spécifications du workflow d’annotation en devenir
more on googlesite agriontology
54. 54
Réutilisation de sources agricoles
Sources agricoles: Thésaurus (Agrovoc) ou classification TaxRef, NCBI
Extraire des données de chaque source et les agréger en suivant les ODP
Construction d'ontologies modulaires
Notes de l'éditeur
IA des formules logiques qui peuvent etre evaluées à vrai, faux ou je ne sais pas….
Il existe differents modeles informatiques
Chacun utilise des principes de modelisation differents
On ne modelise pas une BD relationnnelle comme un programme object (partage de données versus partage de méthode)
Les ontologies ont plusieurs usages informatiques
Je ne vais parler que des ontologies qui sont utilisées sur le web
Conceptualisation: on fait le choix de ce qui existe dans le domaine
Specification = formalisation
Mes compétences sont les ontologies en générales et les technologies du web sémantique
Le W3C a proposé plusieurs standards pour développer le web
Je ne vais parler que d’une petite partie des standards proposés par le W3C pour la publication de données que le web
RDF permet de présenter les données avec une syntaxe sous forme de triplet
RDF S et OWL permettent de définir les schéma associés à ces données.
Lorsque le schéma est plutôt complexe on parle d’ontologies sinon on parle de vocabulaire de métadonnées.
Par exemple OWL-DL permet de poser des contraintes sur l’appartenance d’un individu à une classe.
Le web de données aussi appelée Linked Open Data
Est une initiative pour publier des données ouvertes et leurs schémas sur le web.
So how do terminological ontology resolve ambiguity.
Let take for example a thesaurus in hydrology
We have 5 terms :
- two English term “river” and “water course” that are defined by the same definition …
- A Spanish term “rio”
- And two french terms « riviere » and « fleuve » that are defined by two different definitions.
Normaliser le vocabulaire: construire un language documentaire.
Différence entre water et “water course”
Comment retrouver les expressions les termes composés
So how do terminological ontology resolve ambiguity.
Let take for example a thesaurus in hydrology
We have 5 terms :
- two English term “river” and “water course” that are defined by the same definition …
- A Spanish term “rio”
- And two french terms « riviere » and « fleuve » that are defined by two different definitions.
Reconstruire une BD d’observation des cultures et de leur agresseurs
Pas de la RI sémantique….ce n’est pas des textes que l’on traite mais des données sctructurées.
Mettrre en avant que nous réutilisons et enrichissons
Mettrre en avant que nous réutilisons et enrichissons