Ontologies et système d’information=
Interopérabilité?
Catherine ROUSSEY
Objectifs
 Interopérabilité des Systèmes d’Information:
 Capacité d’un SI ou de ses composants de
partager des informations ou des applications.
 Comment l’usage de référentiel métier peut
améliorer la communication entre des systèmes
d’information…
 Vrai pour les thematiciens et aussi vrai pour les
informaticiens
 Mais attention il y a plusieurs niveaux d’interopérabilité…
 Objectif facile a atteindre techniquement ?
 eXtensive Markup Language (XML)?
 Et dans la réalité qu’est ce qui se passe…
ENITAB 2010
2
Plan
 Introduction
• Données, informations, connaissances
• Modèles informatique
• Ontologies
 Types d’ontologies / Différents objectifs
 Ontologies Terminologiques : interopérabilité lexicale
• Exemple, Format, Type de Système d’information
 Ontologie de Données: interopérabilité de données
 Ontologie Logique: interopérabilité d’objets
 Construction d’ontologies
3
ENITAB 2010
Données, Informations, Connaissances
 Donnée: un élément d’information
percevable
manipulable
 Information: donnée +
sens + contexte
type
 Connaissance: information +
stabilité + croyance
abstraction+ traitement
 généralisation d’un ensemble d’information
 toujours propre à une personne
 partagée par d’autres personnes
4
ENITAB 2010
Données, Informations, Connaissances
5
Donnée
Information
Connaissances
Données Données typées
Modèle Classes POO
Modèle Classe IA
Modèle Entité BD
ENITAB 2010
Modèle informatique
Entités en BD Relationnelle:
information + regroupement
+ vérification
 Données quantitatives et
qualitatives
 Stocker une grande masse de
données dans le but de faciliter
leur interrogation et leur gestion.
 Éviter la redondance pour éliminer
les incohérences de Mise à Jour
 Organisation se construit sur le
partage de données communes
(inclusion d’attributs).
 Vérifier la cohérence des données
lors de l’insertion et de la MàJ
contraintes d’intégrité
 Hypothèses du monde fermé
 Ce qui n’est pas dans la BD n’existe
pas…
Animal
IdentificationCode: String
SexCode: String
BirthDay: Date
RaceCode: String
EspeceCode: String
Weight: Number
Espece
IdentificationCode: String
Name: String
6
ENITAB 2010
Modèle informatique
Classes objet au sens POO:
information + généralisation + traitement
 Données quantitatives et qualitatives
 Organiser les traitements complexes sur ces données
 La classe « animal » a des données avec des méthodes
associées « beDeseased »
 La hiérarchie des classes est construite sur les méthodes
(les comportements)
 Grace au typage (la classe) certains traitements sont
impossibles « getMarried »
Animal
Identification: String
Sex: String
BirthDay: Date
Race: String
Bovin
beDeseased() getMilkProduction()
7
ENITAB 2010
Modèle informatique
Connaissances formelles en IA:
information + généralisation + vérification +
raisonnement
 Description qualitative des objets
 Type + conditions d’appartenances d’un objet à un type
 Il n’y a pas d’entreprise agricole sans exploitation agricole
 Raisonnement = traitement particulier
 Validation du modèle
 Classification automatique de la hiérarchie
 Inférence = création de nouvelles connaissances
 Hypothèse du monde ouvert
EntrepriseAgricole ExploitationAgricole
estAssocié
Organisation
*1
8
ENITAB 2010
Schéma général: donnée, information,
connaissances
Données
Information
Connaissances
Perception
Sens dans un contexte
Résultat d’un processus d’apprentissage: une
généralisation d’un ensemble d’information que
l’on va mémoriser
Données
Données typées
Classes en POO
Description sous forme d’attribut (description
quantitative & qualitative ) + méthodes
(traitements)
Classes en IA
Des traitement particuliers sur les données
qualitatives
Différent niveau de granularité : information
structurée  non structurées
BD Relationnelle Données fortement structurées optimisées pour le
stockage
9
ENITAB 2010
Exercices: formes géométriques
 Point
 Ligne
 Triangle
 Triangle rectangle
 Carré
 Rectangle
 Trapèze
 Parallélogramme
 Cercle
ENITAB 2010
10
Ontologies définition
 Ontologie avec un O majuscule
(philosophie):
Une science: une branche de la métaphysique
qui a pour objectif l’étude de l’être, c'est-à-dire
l'étude des propriétés générales de tout ce qui
est…
 Ontologies au pluriel avec un o minuscule
(informatique):
Outils informatiques
résultat d’une modélisation d’un domaine
d’étude
défini pour un objectif donné
acceptée par une communauté d’utilisateurs …
11
ENITAB 2010
Term
Les composants des ontologies
12
Concept
Instance
Semantic Relation
Instance
Relation
Logical Definition
Concept
Term
Instance
Property
Semantic Relation
Term Linguistic Relation
Textual Definition
Classe
Term
Instance
Relation
hasLabel
Property
Semantic Relation
Linguistic Relation
Natural language
Definition
Logical formula
isInstanceOf
hasArgument
hasID hasArgument
hasArgument
hasName
hasName
*
*
*
1
*
*
1
1
* *
**
1
*
* *
*
*
Terminological
Ontology
Data Ontology Logical Ontology
Semantic
Relation
Instance
Relation
ENITAB 2010
Ontologies Terminologiques: Composants
13
Classe
Terme
Instance
Relation
hasLabel
Linguistic Relation
Natural language
Definition
hasArgument
hasID
hasName
*
*
*
1
1
*
* *
*
*
ENITAB 2010
A relatively large
natural stream of
water
Ontologies Terminologiques: Exemple
14
rivière
fleuve
river
rio
A relatively large
natural stream of
water
Water course
Una corriente
relativamente larga
corriente de agua natural
Cours d’eau naturel de moyenne ou
de faible importance, qui en
principe n’aboutit pas directement à
la mer
Cours d’eau naturel
généralement important
(plus spécialement lorsque
ce cours d’eau se jette dans
la mer)
ENITAB 2010
Ontologies Terminologiques: Exemple
15
rivière
fleuve
river
rio
A relatively large
natural stream of
water
Water course
Una corriente
relativamente larga
corriente de agua natural
Cours d’eau naturel de moyenne ou
de faible importance, qui en
principe n’aboutit pas directement à
la mer
Cours d’eau naturel
généralement important
(plus spécialement lorsque
ce cours d’eau se jette dans
la mer)
A relatively large
natural stream of
water
ENITAB 2010
Ontologies Terminologiques: Autres exemples
 GEMET Thesaurus
http://www.eionet.europa.eu/gemet/index_html?lan
gcode=fr
 AGROVOC thesaurus http://aims.fao.org
 International Hydrographic Dictionary
http://www.iho.int/english/home/
 Wordnet lexical database: http://www.wordnet-
online.com/
ENITAB 2010
16
Ontologies terminologiques: format
SKOS:
Simple
Knowledge
Organization
System
http://www.w3.org/2004/02/skos/intro
17
ENITAB 2010
Ontologies terminologiques: format
RDF
Resource
Description
Framework
Douglas Richard Hofstadter. Gödel, Escher, Bach: an Eternal Golden
Braid. Basic Book 1999 (ISBN 0-465-02656-7)
<rdf:Description
rdf:about='http://cemagref/enitab/module7'>
<titre>Les Ontologies dans les Systèmes
d’Information</titre>
<enseignant>Catherine Roussey</enseignant>
</rdf:Description> 18
ENITAB 2010
Interopérabilité lexicale: Système de
Recherche d’Information
Système de
Recherche
d’Information
Multilingue
1
2
3
Corpus multilingue Requête
Liste de documents
ordonnés
Ressource
sémantique
multilingue
Ontologie
terminologique
19
ENITAB 2010
Interopérabilité lexicale:
Semantic Web Search Engine
mapping
annotationrequête
résultat
Moteur
d’inférence
Ontologie
du web
Base
d’annotation
Pages Web
identifiées par
des URI
20
annotation
annotation
ENITAB 2010
Ontologies de Données: Composants
21
Classe
Term
Instance
Relation
hasLabel
Property
Semantic Relation
isInstanceOf
hasID hasArgument
hasArgument
hasName
hasName
1
1
*
1
*
* *
*
1
*
1
1
Instance
Relation
Natural language
Definition
*
1
ENITAB 2010
Ontologies de Données: Exemple GIEA
22
ENITAB 2010
Ontologies de Données: Exemple SANDRE
23
Périmetre
d’épandage
Zone
homogene
Produit
Parcelle du
périmètre
Exploitation
agricole
Champ
Parcelle
culturale
Parcelle
d’épandage
Unité
culturale
Parcelle
épandue
Parcelle
prévue
ENITAB 2010
Ontologies de Données: Exemple OTAG
ENITAB 2010
24
Ontologie de données: Format XML
 Unified Modeling Language (UML)
 XML Metadata Interchange (XMI)
 http://www.omg.org/technology/documents/formal/xmi.htm
 Geographic Markup Language (GML)
 http://www.opengis.net/gml/
ENITAB 2010
25
Interopérabilité de Données: Format d’échange
de données
Blue
data
Blue
system
Green
data
Green
system
Red
data
Red
system
Standard
d’échange de
données
Ontologie de
Données
26
Project: SYGEMO, SIE Pesticide
ENITAB 2010
Interopérabilité des modèles UML
Stage de Marc Zimmermann soutenue en sept 2010
 Au Cemagref les modèles de données sont décrit
avec UML à l’aide d’Ateliers de Génie Logiciel
(AGL) :
 décrire les modèles grâce à UML
 générer du code
 stocker le modèle dans un fichier XMI
27
ENITAB 2010
Interopérabilité des modèles UML: Problème
 Evolution de la norme UML (1.3, 1.4, 2.0, 2.1,…)
 Evolution de la norme XMI (1.0, 1.1, 1.2, 2.0, 2.1,…)
 1 modèle UML = 1 version de UML + 1 version de XMI
 De nombreux AGL (dans plusieurs versions) sont
utilisés par des agents du CEMAGREF
Est-ce qu’un modèle généré à Anthony en 1998 peut être
utilisé à Clermont en 2010 ?
Interopérabilité ?
28
ENITAB 2010
Interopérabilité des modèles UML: Problème
 Réseau des AGL utilisés au CEMAGREF
Interopérabilité des modèles UML: Solution
UML
(XMI)
UML
(XMI)ontologie
(OWL)
 Construire le workflow XML pour l’interopérabilité
des données
 Application Model Ontology StyleSheet
Transformation (MOST) disponible
 XML, XMI, XSLT, OWL
30
ENITAB 2010
31
Interopérabilité des modèles UML: Conclusion
Modèles de données incorrectes
 Mauvaise sérialisation en XMI des AGL:
• XML non conforme
• L’instance XMI ne suit pas la DTD ou le XSD associé à la
norme UML
• Le norme UML 2.1 semble être plus stable.
 Mauvaise modélisation des utilisateurs
• Redéfinition de type simple,
• Utilisation de classes non définies
• Redéfinition d’attributs déjà existants: name, label, nom, id
• Manque de commentaires
• Manque de modularité
ENITAB 2010
32
Interopérabilité des modèles UML: Conclusion
Correction des modèles
 par transformation des erreurs types (antipatrons)
 Définir des bonnes pratiques (patrons de conception):
• Modèles de données de qualité et validé
• Normaliser le vocabulaire
• Réutilisable et combinable (modularité)
• Consensuel: Fusionner des modèles existants
ENITAB 2010
Ontologies Logiques: Composants
33
Classe
Term
Instance
Relation
hasLabel
Property
Semantic Relation
Natural language
Definition
Logical formula
isInstanceOf
hasID hasArgument
hasArgument
hasName
hasName
*
*
*
1
*
*
1
1
* *
**
1
*
*
*
Instance
Relation
ENITAB 2010
Ontologies Logiques: Exemple Hydrontology
34
ENITAB 2010
Ontologies Logiques: Exemple Hydrontology
35
ENITAB 2010
Ontologies Logiques: Exemple Hydrontology
36
ENITAB 2010
Ontologies Logiques: Exemple Hydrontology
37
ENITAB 2010
Ontologies Logiques: Exemple
Relations
topologiques définies
par l’utilisateur
NTPP (object1, object2)
EC (object2, object3)
NTPP (object3, object4)
…
code
generator
Fichiers de configuration
Transformation
rules
<owl:Class
rdf:about="#object1 ">
<rdfs:subClassOf
rdf:resource="#i_object2"/>
<rdfs:subClassOf
rdf:resource="&owl;Thing"/>
</owl:Class>
Ontologie logique
object1
object6
Protégé
+
DIG
reasoner
6
1 3
52 4
Liste des incohérences
Validation automatique de contraintes topologiques
38
ENITAB 2010
Ontologies Logiques: : format
OWL:
Ontology
Web
Language
 OWL Lite
 OWL DL
 OWL Full
39
www.w3.org 2007
ENITAB 2010
Interopérabilité d’Objets:
médiation et intégration de bases de données
Blue
data
Green
data
Red data
query
retrieve
Wrapper for
the Blue DB
local schema Wrapper for
the Red DB
Mediator
mapping
local schema
Mediated
virtual
database
local schema
Global
schema
40
FORUM project
ENITAB 2010
Interopérabilité d’Objets:
médiation et intégration de bases de données
41
query
retrieve
PhenomenOntology
Mapping
blue
database
blue
database
Gomez-Pérez, A Ramos Gargantilla JA, Rodríguez Pascual A, Vilches Blázquez LM (2008). The
IGN-E case: Integrating through a hidden ontology Lecture notes in geoinformation and
cartography p 417-434
IGN-E project : the Phenomen Ontology
ENITAB 2010
Conclusion
42Increasing Interoperability Capability
IncreasingKnowledge
Lexical
Interoperability
Data
Interoperability
Knowledge Model
Interoperability
Object
Interoperability
List
Thesaurus
Taxonomy
Conceptual Model
Logical
Theory
Controlled Vocabulary
Glossary
UML
DB Schema
XML Schema
ER Model
OWL
Description
Logic
Lexical Database
RDF
SKOS
ENITAB 2010
Ontologies = des choix
1. Choix des traitements/ usage: pourquoi faire?
2. K partagée
  consensus sur un domaine
 Théorie minimale pour comprendre le domaine
3. Modélisation
 Choisir des concepts
 Choisir des invariants ou primitives qui permettent de
différencier les concepts les uns des autres
• propriétés
• relations
  construire une taxonomie (une hiérarchie)
4. Nommer les éléments
 Vocabulaire normalisé
5. Formalisme:
 choix d’un langage capable d’effectuer les traitements
demandé en 1.
43
ENITAB 2010
Méthodes de construction d’ontologies
Cycle de vie en plusieurs étapes
1. Spécification
2. Acquisition de Connaissances
3. Formalisation
4. Évaluation
5. Documentation
44
ENITAB 2010
Spécification
 a quoi va servir l’ontologie?
 Identifier le but de l’application
 limiter le domaine
 les objets
 les usagers, les points de vues
 les sources documentaires
 Les autres ontologies
 Trouver les questions auxquelles devra répondre
l’ontologie.
 Trouver les scénarios d’utilisation des connaissances
45
ENITAB 2010
Acquisition des connaissances
 Réutiliser des ontologies existantes
 top level ontology
 Ontologie d’une partie du domaine ex. ontologie des unités
 Identifier les termes importants
 normaliser le vocabulaire
 Identifier les concepts et les relations du domaine
 Définition écrite en Langue Naturelle
 Trouver les conditions minimales et suffisantes pour dire qu’un objet
appartient à une classe donnée.
 Trouver les différences entre classes sœurs et classe mère/ classe fille
 Stratégie différente suivant les sources étudiées:
 Thesaurus,
 Base de données,
 texte etc…
46
ENITAB 2010
Construire la taxonomie de concepts
 Hiérarchie avec une relation is a ou relation de
subsomption
 3 stratégies pour identifier les concepts
 Bottom-up :
 spécialisé  général,
 concepts très détaillés pas nécessairement utiles
 Top-down:
 général  spécialisé,
 facilite la cohérence et la réutilisation mais dirige la
conception suivant un point de vue
 Middle-out:
 concept important  spécialisé, général;
 ontologies modulaires, facilite la stabilité des résultats
47
ENITAB 2010
Formalisation
 Coder l’ontologie dans un langage formel
 des outils: Protégé, Kaon, OntoEdit …
 Trouver les classes, les attributs, les types, les
contraintes
 Peupler l’ontologie: instancier les classes  base
de connaissances
48
ENITAB 2010
Evaluation
 Construction d’ontologie: un domaine récent
 Valider la taxonomie:
 Pas de cycle
 Toutes les instances d’une classe sont aussi les instances
de la classe mère
 Hiérarchie homogène: pas de classe isolée, pas de listes
de sous classes trop importante
 Tester l’application
 Répondre aux questions de la phase de spécification
49
ENITAB 2010
Documentation
 Donner des explications
 Expliquer les choix de modélisation
 Définition en langage naturel
 Concepts, propriétés, relations, contraintes
 Lier les concepts aux sources dont sont issues les
définitions
50
ENITAB 2010
Conclusion
 Toutes les méthodes sont faites pour des experts en
ontologies qui communiquent avec des experts du
domaine
 La phase d’acquisition des connaissances est la
plus longue et la plus fastidieuse.
 Écrire une ontologie valide n’est pas évident
 Différence entre un concept et un terme, une instance et
une classe, …
 Trouver un consensus entre experts du domaine
 La relation partie-de n’est pas la relation hiérarchique de
la taxonomie
51
ENITAB 2010
Bibliographie sur la construction d’ontologies
 Outils
 Neon Toolkit
 KAON
 Protégé
 …
 Article de Références
 Gómez-Pérez, A. (1998). Knowledge sharing and reuse.
Handbook of Applied Expert Systems. Liebowitz, editor,
CRC Press.
 Gómez-Pérez, A., Fernandez-Lopéz, M., Corcho, 0 (2003).
Ontological Engineering, Springer Editor.
 Uschold, M. and Gruninger, M. (1996). Ontologies:
Principles, Methods and Applications. Knowledge
Engineering Review 11(2)
 Gruber, T. R. Toward principles for the design of ontologies
used for knowledge sharing. Padova, Italy, 1992.
52
ENITAB 2010
Conclusion: réutilisation de connaissances?
Fichier XMI
Ontologie de données
Fichier OWL
« ontologie logique »
Extraction
Enrichissement
Fichier OWL
amélioré
Détection
d’erreurs
53
ENITAB 2010
Construction d’une ontologie logique à partir
d’une ontologie de données.
 Extraction des concepts et de leurs relations à partir
des classes et des associations
 Enrichissement à partir des commentaires et de la
documentations de chaque classe: contraintes,
détection d’erreurs, ajout de nouveaux concepts
 Vérification de la cohérence du modèle final
Ontologies in Agriculture
Catherine ROUSSEY
Vincent SOULIGNAC, François PINET, Jean-Claude
CHAMPOMIER, Vincent ABT, Jean-Pierre CHANET,
Stephan BERNARD, Marc Zimmermann

interopérabilité en informatique

  • 1.
    Ontologies et systèmed’information= Interopérabilité? Catherine ROUSSEY
  • 2.
    Objectifs  Interopérabilité desSystèmes d’Information:  Capacité d’un SI ou de ses composants de partager des informations ou des applications.  Comment l’usage de référentiel métier peut améliorer la communication entre des systèmes d’information…  Vrai pour les thematiciens et aussi vrai pour les informaticiens  Mais attention il y a plusieurs niveaux d’interopérabilité…  Objectif facile a atteindre techniquement ?  eXtensive Markup Language (XML)?  Et dans la réalité qu’est ce qui se passe… ENITAB 2010 2
  • 3.
    Plan  Introduction • Données,informations, connaissances • Modèles informatique • Ontologies  Types d’ontologies / Différents objectifs  Ontologies Terminologiques : interopérabilité lexicale • Exemple, Format, Type de Système d’information  Ontologie de Données: interopérabilité de données  Ontologie Logique: interopérabilité d’objets  Construction d’ontologies 3 ENITAB 2010
  • 4.
    Données, Informations, Connaissances Donnée: un élément d’information percevable manipulable  Information: donnée + sens + contexte type  Connaissance: information + stabilité + croyance abstraction+ traitement  généralisation d’un ensemble d’information  toujours propre à une personne  partagée par d’autres personnes 4 ENITAB 2010
  • 5.
    Données, Informations, Connaissances 5 Donnée Information Connaissances DonnéesDonnées typées Modèle Classes POO Modèle Classe IA Modèle Entité BD ENITAB 2010
  • 6.
    Modèle informatique Entités enBD Relationnelle: information + regroupement + vérification  Données quantitatives et qualitatives  Stocker une grande masse de données dans le but de faciliter leur interrogation et leur gestion.  Éviter la redondance pour éliminer les incohérences de Mise à Jour  Organisation se construit sur le partage de données communes (inclusion d’attributs).  Vérifier la cohérence des données lors de l’insertion et de la MàJ contraintes d’intégrité  Hypothèses du monde fermé  Ce qui n’est pas dans la BD n’existe pas… Animal IdentificationCode: String SexCode: String BirthDay: Date RaceCode: String EspeceCode: String Weight: Number Espece IdentificationCode: String Name: String 6 ENITAB 2010
  • 7.
    Modèle informatique Classes objetau sens POO: information + généralisation + traitement  Données quantitatives et qualitatives  Organiser les traitements complexes sur ces données  La classe « animal » a des données avec des méthodes associées « beDeseased »  La hiérarchie des classes est construite sur les méthodes (les comportements)  Grace au typage (la classe) certains traitements sont impossibles « getMarried » Animal Identification: String Sex: String BirthDay: Date Race: String Bovin beDeseased() getMilkProduction() 7 ENITAB 2010
  • 8.
    Modèle informatique Connaissances formellesen IA: information + généralisation + vérification + raisonnement  Description qualitative des objets  Type + conditions d’appartenances d’un objet à un type  Il n’y a pas d’entreprise agricole sans exploitation agricole  Raisonnement = traitement particulier  Validation du modèle  Classification automatique de la hiérarchie  Inférence = création de nouvelles connaissances  Hypothèse du monde ouvert EntrepriseAgricole ExploitationAgricole estAssocié Organisation *1 8 ENITAB 2010
  • 9.
    Schéma général: donnée,information, connaissances Données Information Connaissances Perception Sens dans un contexte Résultat d’un processus d’apprentissage: une généralisation d’un ensemble d’information que l’on va mémoriser Données Données typées Classes en POO Description sous forme d’attribut (description quantitative & qualitative ) + méthodes (traitements) Classes en IA Des traitement particuliers sur les données qualitatives Différent niveau de granularité : information structurée  non structurées BD Relationnelle Données fortement structurées optimisées pour le stockage 9 ENITAB 2010
  • 10.
    Exercices: formes géométriques Point  Ligne  Triangle  Triangle rectangle  Carré  Rectangle  Trapèze  Parallélogramme  Cercle ENITAB 2010 10
  • 11.
    Ontologies définition  Ontologieavec un O majuscule (philosophie): Une science: une branche de la métaphysique qui a pour objectif l’étude de l’être, c'est-à-dire l'étude des propriétés générales de tout ce qui est…  Ontologies au pluriel avec un o minuscule (informatique): Outils informatiques résultat d’une modélisation d’un domaine d’étude défini pour un objectif donné acceptée par une communauté d’utilisateurs … 11 ENITAB 2010
  • 12.
    Term Les composants desontologies 12 Concept Instance Semantic Relation Instance Relation Logical Definition Concept Term Instance Property Semantic Relation Term Linguistic Relation Textual Definition Classe Term Instance Relation hasLabel Property Semantic Relation Linguistic Relation Natural language Definition Logical formula isInstanceOf hasArgument hasID hasArgument hasArgument hasName hasName * * * 1 * * 1 1 * * ** 1 * * * * * Terminological Ontology Data Ontology Logical Ontology Semantic Relation Instance Relation ENITAB 2010
  • 13.
    Ontologies Terminologiques: Composants 13 Classe Terme Instance Relation hasLabel LinguisticRelation Natural language Definition hasArgument hasID hasName * * * 1 1 * * * * * ENITAB 2010
  • 14.
    A relatively large naturalstream of water Ontologies Terminologiques: Exemple 14 rivière fleuve river rio A relatively large natural stream of water Water course Una corriente relativamente larga corriente de agua natural Cours d’eau naturel de moyenne ou de faible importance, qui en principe n’aboutit pas directement à la mer Cours d’eau naturel généralement important (plus spécialement lorsque ce cours d’eau se jette dans la mer) ENITAB 2010
  • 15.
    Ontologies Terminologiques: Exemple 15 rivière fleuve river rio Arelatively large natural stream of water Water course Una corriente relativamente larga corriente de agua natural Cours d’eau naturel de moyenne ou de faible importance, qui en principe n’aboutit pas directement à la mer Cours d’eau naturel généralement important (plus spécialement lorsque ce cours d’eau se jette dans la mer) A relatively large natural stream of water ENITAB 2010
  • 16.
    Ontologies Terminologiques: Autresexemples  GEMET Thesaurus http://www.eionet.europa.eu/gemet/index_html?lan gcode=fr  AGROVOC thesaurus http://aims.fao.org  International Hydrographic Dictionary http://www.iho.int/english/home/  Wordnet lexical database: http://www.wordnet- online.com/ ENITAB 2010 16
  • 17.
  • 18.
    Ontologies terminologiques: format RDF Resource Description Framework DouglasRichard Hofstadter. Gödel, Escher, Bach: an Eternal Golden Braid. Basic Book 1999 (ISBN 0-465-02656-7) <rdf:Description rdf:about='http://cemagref/enitab/module7'> <titre>Les Ontologies dans les Systèmes d’Information</titre> <enseignant>Catherine Roussey</enseignant> </rdf:Description> 18 ENITAB 2010
  • 19.
    Interopérabilité lexicale: Systèmede Recherche d’Information Système de Recherche d’Information Multilingue 1 2 3 Corpus multilingue Requête Liste de documents ordonnés Ressource sémantique multilingue Ontologie terminologique 19 ENITAB 2010
  • 20.
    Interopérabilité lexicale: Semantic WebSearch Engine mapping annotationrequête résultat Moteur d’inférence Ontologie du web Base d’annotation Pages Web identifiées par des URI 20 annotation annotation ENITAB 2010
  • 21.
    Ontologies de Données:Composants 21 Classe Term Instance Relation hasLabel Property Semantic Relation isInstanceOf hasID hasArgument hasArgument hasName hasName 1 1 * 1 * * * * 1 * 1 1 Instance Relation Natural language Definition * 1 ENITAB 2010
  • 22.
    Ontologies de Données:Exemple GIEA 22 ENITAB 2010
  • 23.
    Ontologies de Données:Exemple SANDRE 23 Périmetre d’épandage Zone homogene Produit Parcelle du périmètre Exploitation agricole Champ Parcelle culturale Parcelle d’épandage Unité culturale Parcelle épandue Parcelle prévue ENITAB 2010
  • 24.
    Ontologies de Données:Exemple OTAG ENITAB 2010 24
  • 25.
    Ontologie de données:Format XML  Unified Modeling Language (UML)  XML Metadata Interchange (XMI)  http://www.omg.org/technology/documents/formal/xmi.htm  Geographic Markup Language (GML)  http://www.opengis.net/gml/ ENITAB 2010 25
  • 26.
    Interopérabilité de Données:Format d’échange de données Blue data Blue system Green data Green system Red data Red system Standard d’échange de données Ontologie de Données 26 Project: SYGEMO, SIE Pesticide ENITAB 2010
  • 27.
    Interopérabilité des modèlesUML Stage de Marc Zimmermann soutenue en sept 2010  Au Cemagref les modèles de données sont décrit avec UML à l’aide d’Ateliers de Génie Logiciel (AGL) :  décrire les modèles grâce à UML  générer du code  stocker le modèle dans un fichier XMI 27 ENITAB 2010
  • 28.
    Interopérabilité des modèlesUML: Problème  Evolution de la norme UML (1.3, 1.4, 2.0, 2.1,…)  Evolution de la norme XMI (1.0, 1.1, 1.2, 2.0, 2.1,…)  1 modèle UML = 1 version de UML + 1 version de XMI  De nombreux AGL (dans plusieurs versions) sont utilisés par des agents du CEMAGREF Est-ce qu’un modèle généré à Anthony en 1998 peut être utilisé à Clermont en 2010 ? Interopérabilité ? 28 ENITAB 2010
  • 29.
    Interopérabilité des modèlesUML: Problème  Réseau des AGL utilisés au CEMAGREF
  • 30.
    Interopérabilité des modèlesUML: Solution UML (XMI) UML (XMI)ontologie (OWL)  Construire le workflow XML pour l’interopérabilité des données  Application Model Ontology StyleSheet Transformation (MOST) disponible  XML, XMI, XSLT, OWL 30 ENITAB 2010
  • 31.
    31 Interopérabilité des modèlesUML: Conclusion Modèles de données incorrectes  Mauvaise sérialisation en XMI des AGL: • XML non conforme • L’instance XMI ne suit pas la DTD ou le XSD associé à la norme UML • Le norme UML 2.1 semble être plus stable.  Mauvaise modélisation des utilisateurs • Redéfinition de type simple, • Utilisation de classes non définies • Redéfinition d’attributs déjà existants: name, label, nom, id • Manque de commentaires • Manque de modularité ENITAB 2010
  • 32.
    32 Interopérabilité des modèlesUML: Conclusion Correction des modèles  par transformation des erreurs types (antipatrons)  Définir des bonnes pratiques (patrons de conception): • Modèles de données de qualité et validé • Normaliser le vocabulaire • Réutilisable et combinable (modularité) • Consensuel: Fusionner des modèles existants ENITAB 2010
  • 33.
    Ontologies Logiques: Composants 33 Classe Term Instance Relation hasLabel Property SemanticRelation Natural language Definition Logical formula isInstanceOf hasID hasArgument hasArgument hasName hasName * * * 1 * * 1 1 * * ** 1 * * * Instance Relation ENITAB 2010
  • 34.
    Ontologies Logiques: ExempleHydrontology 34 ENITAB 2010
  • 35.
    Ontologies Logiques: ExempleHydrontology 35 ENITAB 2010
  • 36.
    Ontologies Logiques: ExempleHydrontology 36 ENITAB 2010
  • 37.
    Ontologies Logiques: ExempleHydrontology 37 ENITAB 2010
  • 38.
    Ontologies Logiques: Exemple Relations topologiquesdéfinies par l’utilisateur NTPP (object1, object2) EC (object2, object3) NTPP (object3, object4) … code generator Fichiers de configuration Transformation rules <owl:Class rdf:about="#object1 "> <rdfs:subClassOf rdf:resource="#i_object2"/> <rdfs:subClassOf rdf:resource="&owl;Thing"/> </owl:Class> Ontologie logique object1 object6 Protégé + DIG reasoner 6 1 3 52 4 Liste des incohérences Validation automatique de contraintes topologiques 38 ENITAB 2010
  • 39.
    Ontologies Logiques: :format OWL: Ontology Web Language  OWL Lite  OWL DL  OWL Full 39 www.w3.org 2007 ENITAB 2010
  • 40.
    Interopérabilité d’Objets: médiation etintégration de bases de données Blue data Green data Red data query retrieve Wrapper for the Blue DB local schema Wrapper for the Red DB Mediator mapping local schema Mediated virtual database local schema Global schema 40 FORUM project ENITAB 2010
  • 41.
    Interopérabilité d’Objets: médiation etintégration de bases de données 41 query retrieve PhenomenOntology Mapping blue database blue database Gomez-Pérez, A Ramos Gargantilla JA, Rodríguez Pascual A, Vilches Blázquez LM (2008). The IGN-E case: Integrating through a hidden ontology Lecture notes in geoinformation and cartography p 417-434 IGN-E project : the Phenomen Ontology ENITAB 2010
  • 42.
    Conclusion 42Increasing Interoperability Capability IncreasingKnowledge Lexical Interoperability Data Interoperability KnowledgeModel Interoperability Object Interoperability List Thesaurus Taxonomy Conceptual Model Logical Theory Controlled Vocabulary Glossary UML DB Schema XML Schema ER Model OWL Description Logic Lexical Database RDF SKOS ENITAB 2010
  • 43.
    Ontologies = deschoix 1. Choix des traitements/ usage: pourquoi faire? 2. K partagée   consensus sur un domaine  Théorie minimale pour comprendre le domaine 3. Modélisation  Choisir des concepts  Choisir des invariants ou primitives qui permettent de différencier les concepts les uns des autres • propriétés • relations   construire une taxonomie (une hiérarchie) 4. Nommer les éléments  Vocabulaire normalisé 5. Formalisme:  choix d’un langage capable d’effectuer les traitements demandé en 1. 43 ENITAB 2010
  • 44.
    Méthodes de constructiond’ontologies Cycle de vie en plusieurs étapes 1. Spécification 2. Acquisition de Connaissances 3. Formalisation 4. Évaluation 5. Documentation 44 ENITAB 2010
  • 45.
    Spécification  a quoiva servir l’ontologie?  Identifier le but de l’application  limiter le domaine  les objets  les usagers, les points de vues  les sources documentaires  Les autres ontologies  Trouver les questions auxquelles devra répondre l’ontologie.  Trouver les scénarios d’utilisation des connaissances 45 ENITAB 2010
  • 46.
    Acquisition des connaissances Réutiliser des ontologies existantes  top level ontology  Ontologie d’une partie du domaine ex. ontologie des unités  Identifier les termes importants  normaliser le vocabulaire  Identifier les concepts et les relations du domaine  Définition écrite en Langue Naturelle  Trouver les conditions minimales et suffisantes pour dire qu’un objet appartient à une classe donnée.  Trouver les différences entre classes sœurs et classe mère/ classe fille  Stratégie différente suivant les sources étudiées:  Thesaurus,  Base de données,  texte etc… 46 ENITAB 2010
  • 47.
    Construire la taxonomiede concepts  Hiérarchie avec une relation is a ou relation de subsomption  3 stratégies pour identifier les concepts  Bottom-up :  spécialisé  général,  concepts très détaillés pas nécessairement utiles  Top-down:  général  spécialisé,  facilite la cohérence et la réutilisation mais dirige la conception suivant un point de vue  Middle-out:  concept important  spécialisé, général;  ontologies modulaires, facilite la stabilité des résultats 47 ENITAB 2010
  • 48.
    Formalisation  Coder l’ontologiedans un langage formel  des outils: Protégé, Kaon, OntoEdit …  Trouver les classes, les attributs, les types, les contraintes  Peupler l’ontologie: instancier les classes  base de connaissances 48 ENITAB 2010
  • 49.
    Evaluation  Construction d’ontologie:un domaine récent  Valider la taxonomie:  Pas de cycle  Toutes les instances d’une classe sont aussi les instances de la classe mère  Hiérarchie homogène: pas de classe isolée, pas de listes de sous classes trop importante  Tester l’application  Répondre aux questions de la phase de spécification 49 ENITAB 2010
  • 50.
    Documentation  Donner desexplications  Expliquer les choix de modélisation  Définition en langage naturel  Concepts, propriétés, relations, contraintes  Lier les concepts aux sources dont sont issues les définitions 50 ENITAB 2010
  • 51.
    Conclusion  Toutes lesméthodes sont faites pour des experts en ontologies qui communiquent avec des experts du domaine  La phase d’acquisition des connaissances est la plus longue et la plus fastidieuse.  Écrire une ontologie valide n’est pas évident  Différence entre un concept et un terme, une instance et une classe, …  Trouver un consensus entre experts du domaine  La relation partie-de n’est pas la relation hiérarchique de la taxonomie 51 ENITAB 2010
  • 52.
    Bibliographie sur laconstruction d’ontologies  Outils  Neon Toolkit  KAON  Protégé  …  Article de Références  Gómez-Pérez, A. (1998). Knowledge sharing and reuse. Handbook of Applied Expert Systems. Liebowitz, editor, CRC Press.  Gómez-Pérez, A., Fernandez-Lopéz, M., Corcho, 0 (2003). Ontological Engineering, Springer Editor.  Uschold, M. and Gruninger, M. (1996). Ontologies: Principles, Methods and Applications. Knowledge Engineering Review 11(2)  Gruber, T. R. Toward principles for the design of ontologies used for knowledge sharing. Padova, Italy, 1992. 52 ENITAB 2010
  • 53.
    Conclusion: réutilisation deconnaissances? Fichier XMI Ontologie de données Fichier OWL « ontologie logique » Extraction Enrichissement Fichier OWL amélioré Détection d’erreurs 53 ENITAB 2010 Construction d’une ontologie logique à partir d’une ontologie de données.  Extraction des concepts et de leurs relations à partir des classes et des associations  Enrichissement à partir des commentaires et de la documentations de chaque classe: contraintes, détection d’erreurs, ajout de nouveaux concepts  Vérification de la cohérence du modèle final
  • 54.
    Ontologies in Agriculture CatherineROUSSEY Vincent SOULIGNAC, François PINET, Jean-Claude CHAMPOMIER, Vincent ABT, Jean-Pierre CHANET, Stephan BERNARD, Marc Zimmermann