19. Sur qu’elle plateforme déposer et identifier facilement une terminologie
ou une ontologie dans le domaine de la santé en France ?
Pas nécessairement des terminologies standards
Les petits vocabulaires fait dans le cadre d’un projet
Les alignements
Les projets, la communauté, etc.
Se rapprocher du web sémantique
Quels outils sont disponibles facilement pour annoter sémantiquement du
texte avec des concepts d’ontologies ?
Je donne mon texte
Je ne me soucie pas des aspects sémantiques ou linguistique
Importance des aspects pratiques (en plus de la qualité): disponibilité,
service, abstraction, URI, paramétrables, etc.
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
19
20. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
20
Des projets (santé)
UMLF / VUMeF
InterSTIS (2007‐2010)
Des recensements
Neveol et al.,LREC 2014
Rapport ASIP Santé 2015: 71 terminologies recensées
Des ontologies/vocabulaires publiés sur des thématiques particulières
e.g., LIMICS, Bordeaux, Rouen, etc.
Des plateformes / outils pour la gestion de ressources sémantiques
ITM de Mondeca (et CAM)
HeTOP et F‐MTi/ECMT (CISMEF)
Des travaux sur la de fouille de texte et de données …
Des choses non limitées à la santé
TermSciences (INIST) … bientôt LOTERRE
22. Un portail
d’ontologies
pourquoi faire ?
Si j’ai développé une ontologie, comment je la met à disposition des
autres à moindre coût ?
Si j’ai besoin d’une ontologie, où est‐ce que je la récupère dans le
format de mon choix ou l’utilise en ligne ?
S’il existe plusieurs possibilités, comment savoir qu’elle ontologie
utiliser, laquelle est la plus appropriée pour ma tâche ?
Comment est‐ce que je peux utiliser les ontologies pour lier/annoter
mes données ?
Comment utiliser les ontologies sans avoir à les gérer ?
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
22
23. Ontology
libraries &
repositories
Ontology libraries defined as
“a library system that offers various functions for managing,
adapting and standardizing groups of ontologies. It should fulfill
the needs for re‐use of ontologies. In this sense, an ontology
library system should be easily accessible and offer efficient
support for re‐using existing relevant ontologies and
standardizing them based on upper‐level ontologies and ontology
representation languages.” [Ding & Fensel, 2001]
Ontology repositories defined as
“a structured collection of ontologies (…) by using an Ontology
Metadata Vocabulary. References and relations between
ontologies and their modules build the semantic model of an
ontology repository. Access to resources is realized through
semantically‐enabled interfaces applicable for humans and
machines. Therefore a repository provides a formal query
language” [Hartmann, Palma, Gomez‐Perez, 2009]
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
23
24. Qu’est ce qui
existe comme
librairie et portail
d’ontologies ?
Ontology repositories / portal
NCBO BioPortal
Ontobee
AberOWL
EBI Ontology Lookup Service
OKFN Linked Open Vocabularies
ONKI Ontology Library Service
MMI Ontology Registry and
Repository
ESIPportal
AgroPortal
SIFR BioPortal
CISMEF HeTOP
OntoHub
Bartoc
TermSciences
Web indexes
Watson, Swoogle,
Sindice, Falcons
Ontology libraries / listings (more or
less updated)
OBO Foundry
WebProtégé
Romulus
DAML ontology library
Colore
FAO VEST Registry
Orhtolang
BioSharing
DERI Vocabularies ,
OntologyDesignPatterns,
Semanticweb.org, W3C Good
ontologies
Platform technology
Mondeca ITM, LexEVS, SKOSMOS
Abandoned projects
Cubboard, Knoodl, Schemapedia,
SchemaWeb, OntoSelect,
OntoSearch, TONES
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
24
31. C. Jonquet, A. Annane, K. Bouarech, V. Emonet & S. Melzi.
SIFR BioPortal: French biomedical ontologies and
terminologies available for semantic annotation, In 16th
Journées Francophones d'Informatique Médicale
JFIM'16. Genève, Suisse, July 2016.
SIFR BioPortal
Une plateforme ouverte et
générique pour les ontologies
françaises
http://bioportal.lirmm.fr
25 ontologies/terminologies
• Importées d’UMLS et d’HeTOP
• Connectées au NCBO BioPortal
• Déposées par les utilisateurs
31
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
32. Elément
complémentaire
dans le paysage
français
Ouverte
N’importe qui peut soumettre du contenu
Générique
N’importe quel type de contenu et de format
Version spécifique du portail d’ontologie développé par le NCBO
Plateforme de rattachement pour le service d’annotation
25 (+4 privées) ontologies/terminologies médicales en français
Extraites de l’UMLS
Fournies par CISMeF (via export OWL)
Chargées directement par des utilisateurs
Construites à partir de format ad‐hoc
Connectées au NCBO BioPortal
255K classes
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
32
http://bioportal.lirmm.fr
47. AgroPortal:
ontology
repository for
the agronomic
domain
http://agroportal.lirmm.fr
Develop and support a reference ontology repository
Primary focus on the agronomy & close related domains (food, plant
sciences, and biodiversity)
Reusing the NCBO BioPortal technology
Avoid to re‐implement what has been done, facilitate interoperability
Reusing the scientific outcomes, experience & methods of the
biomedical domain
Enable straightforward use of agronomic related ontologies
Respect the requirements & specificities of the agronomic community
Fully semantic web compliant infrastructure
Enable new science
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
47
C. Jonquet, A. Toulet, E. Arnaud, S. Aubin, E. Dzalé‐Yeumo, V. Emonet, J. Graybeal, M‐A. Laporte, M. A.
Musen, V. Pesce & P. Larmande. AgroPortal: an ontology repository for agronomy, Computers and
Electronics in Agriculture. IN PRESS, 2017. pp. 30. Elsevier.
49. 5 Driving
AgronomicUse
Cases
IBC Rice Genomics & AgroLD project
Data integration and knowledge management related to rice (P.
Larmande)
RDA Wheat Data Interoperability working group
Common framework for publishing wheat data (E. Dzalé-Yeumo)
LovInra : INRA Linked Open Vocabularies
Vocabularies produced by INRA scientists (S. Aubin)
Crop Ontology project
Ontologies for describing crop germplasm & traits (E. Arnaud)
GODAN global map of agri-food data standards
VEST/AgroPortal MAP of standards (V. Pesce)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
49
Plus recement:
GDR SemanDiv
51. Ontology groups
and categories
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
Category Number
Plant Phenotypes andTraits 21
Plant Anatomy and Development 3
Natural Resources, Earth and Environment 9
Animal Science and Animal Products 6
Agricultural Research,Technology and Engineering 10
Breeding and Genetic Improvement 1
Plant Science and Plant Products 5
Plant Genetic Resources 2
Food and Human Nutrition 6
Taxonomic Classifications of Organisms 2
Farms and Farming Systems 3
Specific slices display to use only the
ontologies of a group
http://inra.agroportal.lirmm.fr/
51
67. Ontology – data
cycle Ontologies and data change everyday
Need to be able to handle the “deltas” only
Work on terminology and knowledge extraction from text
BioTex (http://tubo.lirmm.fr/biotex)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
67
J.A. Lossio-Ventura, C. Jonquet, M. Roche & M. Teisseire. Biomedical
term extraction: overview and a new methodology, Information
Retrieval, Special issue on Medical Information Retrieval. August 2015.
Vol. 19 (1), pp. 59-99. Springer.
73. Scoring of
annotations
Improve the NCBO Annotator results by ranking the
annotations according to their relevance
While not changing the service implementation
Take into account their frequencies (as originally proposed in 2009 and
removed)
Add a term extraction measure, called C‐Value, used to positively
discriminate annotations generated from matches with multi‐word
terms.
Mostly improves annotations done with multiword terms
2 new scoring methods allowing to score and rank annotations
by their importance in the given input data
Interesting results validated against PubMed manual annotations
S. Melzi & C. Jonquet. Scoring semantic annotations returned by the NCBO Annotator, In 7th International Semantic
Web Applications and Tools for Life Sciences, SWAT4LS'14. Berlin, Germany, Dec. 2014.
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
73
79. Network of
interconnected
BioPortalS – a
few thoughts
UI does not really matter
We should be able to make a new
portal for another community in minutes
Avoid duplicating ontologies
Connect portals one another
Through mappings as we did with translation mappings
The annotator proxy feature
Implement and discuss standards
SKOS handling in BioPortal
Ontology metadata description
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
79
84. Convergence
avec les travaux
de l’INIST
Projet VisaTM: Offre de fouille de texte via OpenMinted
Vous emmenez les corpus (ISTEX) nous emmenons les ontologies
(AgroPortal)
Si on fait le boulot pour connecter la technologie NCBO a OpenMinted,
autant le réutiliser
Projet LOTERRE et ORHTOLANG
Ressources en OWL, SKOS… pourquoi pas essayer une instance de la
technologie NCBO ?
Harmoniser nos métadonnées
Partager nos efforts, passer à d’autres domaines, d’autres échelles.
GDR SemanDiv
AgroPortal, alignements entre thesaurus et ontologies
FAIR Data Management Plan
Aider a identification des ontologies adequate pour les données
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
84