Christophe Debruyne. Projet TOXIN : Des graphes de connaissances pour la recherche en toxicologie. INRS Symposium on "L'informatique au service de l'évaluation du risque chimique" (10 November 2022, Nancy, France)
Un plan de gestion de données (PGD ou DMP pour Data Management Plan) est un document qui spécifie quelles données sont collectées ou générées, et comment elles seront gérées, partagées et préservées pendant et après un projet. Le support de ce webinaire donne les clés pour pouvoir amorcer la rédaction d’un PGD en toute sérénité en présentant les enjeux et objectifs d’un PGD, son contenu et un outil d’aide à la rédaction : DMP OPIDOR.
Claire SOWINSKI est responsable du service formation-DoRANum de l’Inist-CNRS (Institut de l’Information Scientifique et Technique).
Cette présentation définit rapidement le Plan de gestion de données dans le cadre du Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis.
Formation sur les approches d'activation de la découvrabilité pour les contenus culturels incluant 12 mesures à adopter tout en ayant recours aux communs numériques.
De l'intelligence dans les données ouvertes - Problèmes et solutions dans les...Mathieu d'Aquin
Presentation a la matinee Donnees Ouverte LIRMM - Montpellier - 28/11/2013
Presentation at the Open Data workshop LIRMM
http://odrg.lirmm.fr/index.php/event-details?id=14
Projets d'Humanités numérique et collaboration de différents métiersEmmanuelle Morlock
Support de l'intervention intitulée "Collaboration de métiers différents dans les projets d'humanités numériques : quel serait le socle commun idéal de connaissances techniques et méthodologiques ?", donnée à l'Institut des Sciences humaines et Sociales dans le cadre de la journée d'étude "Bap F" le 21 novembre 2014 (Paris)
Gestion des données scientifiques en imagerie in vivo – Journée scientifique organisée par PIV le 7 décembre 2017 au PARCC-HEGP
Marie-Christine Jacquemot
OPIDOR
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
Foire aux questions - FAQ sur les donnnées de la recherche
Fiche créée en septembre 2015 et révisée en octobre 2016
Qu'est-ce que l'ouverture des données (Open Data) ?
Quelles données préserver ?
Où déposer mes données ?
Comment définir les conditions de réutilisation de mes données ?
Et si mes données sont déjà déposées dans les réseaux sociaux (ResearchGate, Academia...) ?
Qu'est-ce qu'un jeu de données ?
Où rechercher des jeux de données ?
Qu'est-ce qu'un DOI ?
Comment citer un jeu de données ?
Qu'est-ce qu'un PGD ?
A quelles questions répond un PGD ?
De quels outils je dispose pour rédiger un PGD ?
Avec qui interagir pour élaborer un PGD ?
L'éthique du partage et moi ?
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Fiche créée en septembre 2015 et révisée en octobre 2016
Un plan de gestion de données (PGD ou DMP pour Data Management Plan) est un document qui spécifie quelles données sont collectées ou générées, et comment elles seront gérées, partagées et préservées pendant et après un projet. Le support de ce webinaire donne les clés pour pouvoir amorcer la rédaction d’un PGD en toute sérénité en présentant les enjeux et objectifs d’un PGD, son contenu et un outil d’aide à la rédaction : DMP OPIDOR.
Claire SOWINSKI est responsable du service formation-DoRANum de l’Inist-CNRS (Institut de l’Information Scientifique et Technique).
Cette présentation définit rapidement le Plan de gestion de données dans le cadre du Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis.
Formation sur les approches d'activation de la découvrabilité pour les contenus culturels incluant 12 mesures à adopter tout en ayant recours aux communs numériques.
De l'intelligence dans les données ouvertes - Problèmes et solutions dans les...Mathieu d'Aquin
Presentation a la matinee Donnees Ouverte LIRMM - Montpellier - 28/11/2013
Presentation at the Open Data workshop LIRMM
http://odrg.lirmm.fr/index.php/event-details?id=14
Projets d'Humanités numérique et collaboration de différents métiersEmmanuelle Morlock
Support de l'intervention intitulée "Collaboration de métiers différents dans les projets d'humanités numériques : quel serait le socle commun idéal de connaissances techniques et méthodologiques ?", donnée à l'Institut des Sciences humaines et Sociales dans le cadre de la journée d'étude "Bap F" le 21 novembre 2014 (Paris)
Gestion des données scientifiques en imagerie in vivo – Journée scientifique organisée par PIV le 7 décembre 2017 au PARCC-HEGP
Marie-Christine Jacquemot
OPIDOR
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
Foire aux questions - FAQ sur les donnnées de la recherche
Fiche créée en septembre 2015 et révisée en octobre 2016
Qu'est-ce que l'ouverture des données (Open Data) ?
Quelles données préserver ?
Où déposer mes données ?
Comment définir les conditions de réutilisation de mes données ?
Et si mes données sont déjà déposées dans les réseaux sociaux (ResearchGate, Academia...) ?
Qu'est-ce qu'un jeu de données ?
Où rechercher des jeux de données ?
Qu'est-ce qu'un DOI ?
Comment citer un jeu de données ?
Qu'est-ce qu'un PGD ?
A quelles questions répond un PGD ?
De quels outils je dispose pour rédiger un PGD ?
Avec qui interagir pour élaborer un PGD ?
L'éthique du partage et moi ?
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Fiche créée en septembre 2015 et révisée en octobre 2016
> Faites connaître votre entreprise et vos métiers auprès des étudiants,
> Renforcez votre notoriété,
> Dynamisez votre image de marque,
> Participez à la vie de l’école,
> Recrutez vos stagiaires / ingénieurs / Mastères Spécialisés® / doctorants.
TABLEAU DE COMPARAISON ENTRE LES REFERENTIELS B2IA, C2I niveau 1 et C2I2e
Sources des référentiels:
- B2IA (circulaire du 12 mai 2010) : http://www.education.gouv.fr/cid51718/mene1011027c.html
- C2i niveau 1 (circulaire du 14 juillet 20111) : http://www.enseignementsup-recherche.gouv.fr/pid20536/bulletin-officiel.html?cid_bo=56848
- C2i2e (Bulletin officiel n° 5 du 3 février 2011) : http://bit.ly/WGlxfO
Contenu d'un nouveau cours sur les Technologies sémantiquesGilbert Paquette
Le cours INF 6070 est un nouveau cours de la maîtrise en technologies de l'informations qui traite des applications du Web sémantique à la gestion des connaissances.
Atelier Data&Musée au Ministère de la culture - 12/12/18Sandra Davené
L'atelier "Mutualisation et exploitation des données des structures culturelles" avait pour objectif d'expliquer comment la plateforme de mutualisation des données des structures culturelles – Data&Musée – permet de créer de nouveaux outils de pilotage pour aider au développement de leurs activités.
--
www.datamusee.fr
@DataMusee
Contact :
Sandra Davené, coordinatrice Data&Musée
sandra@orpheo.fr
01 86 27 51 89
Support de mon intervention sur la médiation scientifique
Ecole Doctorale du Pacifique
#mediationscientifique
+ d'info
https://christophe-batier.blogspot.com/p/formations-ecole-doctorale.html
Les experts de Bpifrance et du CNRS Innovation vous accompagnent dans l'accélération de vos projets deeptech en vous présentant de nouvelles ressources de financement et d'accompagnement.
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevinNathalie Clot
Enjeux et stratégie Open Access : présentation faite par l'équipe BUA et le VP numérique de l'université d'Angers, le 21/10/2013, devant le président de l'unistra, de l'UHA, et d'une partie de l'équipe de gouvernance et administrative recherche et numérique.
Mise à jour, datée de novembre 2017, d’un support de formation à un atelier Canopé sur le thème de la publication et l’édition d’informations sur le portail documentaire E-sidoc à destination des professeurs documentalistes.
Mise à jour d'un support de formation à un atelier Canopé sur le thème de la publication et l’édition d’informations sur le portail documentaire E-sidoc à destination des professeurs documentalistes.
BURPing Through RML Test Cases (presented at KGC Workshop @ ESWC 2024)KGChristophe Debruyne
Recently, the W3C Community Group on Knowledge Graph Construction created a suite of test cases for all RML modules developed in the Community Group to verify implementations’ compliance with the new RML specifications. However, these RML test cases could not be tested because no existing RML Processor supports them. In this paper, we report on our process of testing the new RML test cases while at the same time implementing support for the new RML modules in a reference implementation, which we call `BURP' (Basic and Unassuming RML Processor), to investigate the feasibility and possible mistakes of the new RML test cases and specifications. We found several problems in the RML modules, ranging from mismatches between the test cases and their specification and invalid SHACL shapes to edge cases not covered by the specifications. Through this work, we improve the quality of RML test cases and the coverage of their corresponding specifications to increase adoption and conformance among RML Processors.
One year of DALIDA Data Literacy Workshops for Adults: a ReportChristophe Debruyne
Christophe Debruyne, Laura Grehan, Mairéad Hurley, Anne Kearns, Ciaran O'Neill. One year of DALIDA Data Literacy Workshops for Adults: a Report. In Frédérique Laforest, Raphaël Troncy, Elena Simperl, Deepak Agarwal, Aristides Gionis, Ivan Herman, and Lionel Médini, editors, Companion of The Web Conference 2022, Virtual Event / Lyon, France, April 25 - 29, 2022, pages 403-407. ACM, 2022
Contenu connexe
Similaire à Projet TOXIN : Des graphes de connaissances pour la recherche en toxicologie
> Faites connaître votre entreprise et vos métiers auprès des étudiants,
> Renforcez votre notoriété,
> Dynamisez votre image de marque,
> Participez à la vie de l’école,
> Recrutez vos stagiaires / ingénieurs / Mastères Spécialisés® / doctorants.
TABLEAU DE COMPARAISON ENTRE LES REFERENTIELS B2IA, C2I niveau 1 et C2I2e
Sources des référentiels:
- B2IA (circulaire du 12 mai 2010) : http://www.education.gouv.fr/cid51718/mene1011027c.html
- C2i niveau 1 (circulaire du 14 juillet 20111) : http://www.enseignementsup-recherche.gouv.fr/pid20536/bulletin-officiel.html?cid_bo=56848
- C2i2e (Bulletin officiel n° 5 du 3 février 2011) : http://bit.ly/WGlxfO
Contenu d'un nouveau cours sur les Technologies sémantiquesGilbert Paquette
Le cours INF 6070 est un nouveau cours de la maîtrise en technologies de l'informations qui traite des applications du Web sémantique à la gestion des connaissances.
Atelier Data&Musée au Ministère de la culture - 12/12/18Sandra Davené
L'atelier "Mutualisation et exploitation des données des structures culturelles" avait pour objectif d'expliquer comment la plateforme de mutualisation des données des structures culturelles – Data&Musée – permet de créer de nouveaux outils de pilotage pour aider au développement de leurs activités.
--
www.datamusee.fr
@DataMusee
Contact :
Sandra Davené, coordinatrice Data&Musée
sandra@orpheo.fr
01 86 27 51 89
Support de mon intervention sur la médiation scientifique
Ecole Doctorale du Pacifique
#mediationscientifique
+ d'info
https://christophe-batier.blogspot.com/p/formations-ecole-doctorale.html
Les experts de Bpifrance et du CNRS Innovation vous accompagnent dans l'accélération de vos projets deeptech en vous présentant de nouvelles ressources de financement et d'accompagnement.
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevinNathalie Clot
Enjeux et stratégie Open Access : présentation faite par l'équipe BUA et le VP numérique de l'université d'Angers, le 21/10/2013, devant le président de l'unistra, de l'UHA, et d'une partie de l'équipe de gouvernance et administrative recherche et numérique.
Mise à jour, datée de novembre 2017, d’un support de formation à un atelier Canopé sur le thème de la publication et l’édition d’informations sur le portail documentaire E-sidoc à destination des professeurs documentalistes.
Mise à jour d'un support de formation à un atelier Canopé sur le thème de la publication et l’édition d’informations sur le portail documentaire E-sidoc à destination des professeurs documentalistes.
Similaire à Projet TOXIN : Des graphes de connaissances pour la recherche en toxicologie (20)
BURPing Through RML Test Cases (presented at KGC Workshop @ ESWC 2024)KGChristophe Debruyne
Recently, the W3C Community Group on Knowledge Graph Construction created a suite of test cases for all RML modules developed in the Community Group to verify implementations’ compliance with the new RML specifications. However, these RML test cases could not be tested because no existing RML Processor supports them. In this paper, we report on our process of testing the new RML test cases while at the same time implementing support for the new RML modules in a reference implementation, which we call `BURP' (Basic and Unassuming RML Processor), to investigate the feasibility and possible mistakes of the new RML test cases and specifications. We found several problems in the RML modules, ranging from mismatches between the test cases and their specification and invalid SHACL shapes to edge cases not covered by the specifications. Through this work, we improve the quality of RML test cases and the coverage of their corresponding specifications to increase adoption and conformance among RML Processors.
One year of DALIDA Data Literacy Workshops for Adults: a ReportChristophe Debruyne
Christophe Debruyne, Laura Grehan, Mairéad Hurley, Anne Kearns, Ciaran O'Neill. One year of DALIDA Data Literacy Workshops for Adults: a Report. In Frédérique Laforest, Raphaël Troncy, Elena Simperl, Deepak Agarwal, Aristides Gionis, Ivan Herman, and Lionel Médini, editors, Companion of The Web Conference 2022, Virtual Event / Lyon, France, April 25 - 29, 2022, pages 403-407. ACM, 2022
Knowledge Graphs: Concept, mogelijkheden en aandachtspuntenChristophe Debruyne
Kennis en informatie in een bedrijfsorganisatorische context zijn doorgaans versnipperd en verspreid over databases, rekenbladen, documenten, etc. Daarnaast bezitten kenniswerkers ook domeinexpertise die niet in een systeem wordt opgeslagen. Maar wat als men die kennis en informatie wenst te integreren om, bijvoorbeeld, processen te automatiseren of nieuwe inzichten te verwerven?
Knowledge graphs bieden hiervoor een oplossing. In deze presentatie werpt Christophe Debruyne zijn licht op het concept van de knowledge graphs en hun mogelijkheden. Hij behandelt daarvoor de volgende punten:
Wat is een knowledge graph?
Knowledge graphs versus andere initiatieven
Knowledge graphs versus andere AI technieken
Toepassingsgebied van knowledge graphs
Bouwen en onderhouden van een knowledge graph
SAI.be avondseminarie van 16-11-2021
Reusable SHACL Constraint Components for Validating Geospatial Linked DataChristophe Debruyne
Reusable SHACL Constraint Components for Validating Geospatial Linked Data. Paper presented at the 4th International Workshop on Geospatial Linked Data (GeoLD 2021)
This document discusses the creation of a knowledge graph for Irish history called the Beyond 2022 Knowledge Graph. It describes knowledge graphs and how the Beyond 2022 graph was constructed using open standards like RDF to link information. The graph was generated from spreadsheets about Irish financial records using tools like CSVW, R2RML, and SHACL. The knowledge graph deals with conflicting information by using containers, versioning, and provenance. Tools like Ontodia and YASGUI allow exploring and querying the knowledge graph.
Facilitating Data Curation: a Solution Developed in the Toxicology DomainChristophe Debruyne
Christophe Debruyne, Jonathan Riggio, Emma Gustafson, Declan O'Sullivan, Mathieu Vinken, Tamara Vanhaecke, Olga De Troyer.
Presented at the 2020 IEEE 14th International Conference on Semantic Computing, San Diego, California, 3-5 February 2020
Toxicology aims to understand the adverse effects of
chemical compounds or physical agents on living organisms. For
chemicals, much information regarding safety testing of cosmetic
ingredients is now scattered in a plethora of safety evaluation
reports. Toxicologists in our university intend to collect this
information into a single repository. Their current approach uses
spreadsheets, does not scale well, and makes data curation and
querying cumbersome. Semantic technologies (e.g., RDF, OWL,
and Linked Data principles) would be more appropriate for
this purpose. However, this technology is not very accessible to
toxicologists without extensive training. In this paper, we report
on a tool that supports subject matter experts in the construction
of an RDF–based knowledge base for the toxicology domain. The
tool is using the jigsaw metaphor for guiding the subject matter
experts. We demonstrate that the jigsaw metaphor is a viable
option for generating RDF. Future work includes investigating
appropriate methods and tools for knowledge evolution and data
analysis.
Linked Data Publication and Interlinking Research within the SFI funded ADAPT...Christophe Debruyne
Linked Data Publication and Interlinking Research within the SFI funded ADAPT Centre. This presentation was given at the LIBER LOD workshop during the 48th LIBER Annual Conference is in Dublin, 26-28 June 2019.
"Towards GeneratingPolicy-compliant Datasets" by Christophe Debruyne, Harshvardhan J. Pandit, Dave Lewis, Declan O’Sullivan. Presented at the The 13th IEEE International Conference on SEMANTIC COMPUTING
Jan 30 - Feb 1, 2019, Newport Beach, California
"Towards GeneratingPolicy-compliant Datasets" by Christophe Debruyne, Harshvardhan J. Pandit, Dave Lewis, Declan O’Sullivan. Presented at the The 13th IEEE International Conference on SEMANTIC COMPUTING
Jan 30 - Feb 1, 2019, Newport Beach, California
Generating Executable Mappings from RDF Data Cube Data Structure DefinitionsChristophe Debruyne
Data processing is increasingly the subject of various internal and external regulations, such as GDPR which has recently come into effect. Instead of assuming that such processes avail of data sources (such as files and relational databases), we approach the problem in a more abstract manner and view these processes as taking datasets as input. These datasets are then created by pulling data from various data sources. Taking a W3C Recommendation for prescribing the structure of and for describing datasets, we investigate an extension of that vocabulary for the generation of executable R2RML mappings. This results in a top-down approach where one prescribes the dataset to be used by a data process and where to find the data, and where that prescription is subsequently used to retrieve the data for the creation of the dataset “just in time”. We argue that this approach to the generation of an R2RML mapping from a dataset description is the first step towards policy-aware mappings, where the generation takes into account regulations to generate mappings that are compliant. In this paper, we describe how one can obtain an R2RML mapping from a data structure definition in a declarative manner using SPARQL CONSTRUCT queries, and demonstrate it using a running example. Some of the more technical aspects are also described.
Reference: Christophe Debruyne, Dave Lewis, Declan O'Sullivan: Generating Executable Mappings from RDF Data Cube Data Structure Definitions. OTM Conferences (2) 2018: 333-350
Uplift – Generating RDF datasets from non-RDF data with R2RMLChristophe Debruyne
The document discusses generating RDF datasets from non-RDF data sources using R2RML (RDB to RDF Mapping Language). It provides background on RDF, RDF Schema, SPARQL, Linked Data, and describes how R2RML can be used to map relational databases to RDF according to the W3C recommendation. Direct mappings are discussed as well as content negotiation in transforming data to RDF.
A Lightweight Approach to Explore, Enrich and Use Data with a Geospatial Dime...Christophe Debruyne
Paper presentation: Christophe Debruyne, Kris McGlinn, Lorraine McNerney and Declan O'Sullivan: A Lightweight Approach to Explore, Enrich and Use Data with a Geospatial Dimension with Semantic Web Technologies. Presented at the Fourth International ACM SIGMOD Workshop on Managing and Mining Enriched Geo-Spatial Data GeoRich 2017 Co-located with SIGMOD/PODS 2017 in Chicago, IL, USA
Client-side Processing of GeoSPARQL Functions with Triple Pattern FragmentsChristophe Debruyne
Christophe Debruyne, Éamonn Clinton, Declan O'Sullivan: Client-side Processing of GeoSPARQL Functions with Triple Pattern Fragments. Presented at the Linked Data on the Web (LDOW 2017), colocated with the 26th International World Wide Web Conference, 2017 (WWW 2017)
Available at: http://events.linkeddata.org/ldow2017/papers/LDOW_2017_paper_8.pdf
Presentation about the collaboration between ADAPT and the Ordnance Survey Ireland at Linked Data Seminar -- Culture, Base Registries & Visualisations held in Amsterdam, The Netherlands on the 2nd of December 2016
Serving Ireland's Geospatial Information as Linked Data (ISWC 2016 Poster)Christophe Debruyne
Christophe Debruyne, Eamonn Clinton, Lorraine McNerney, Atul Nautiyal, Declan O'Sullivan:
Serving Ireland's Geospatial Information as Linked Data. International Semantic Web Conference (Posters & Demos) 2016
We present data.geohive.ie, which aims to provide an authoritative
platform for serving Ireland’s national geospatial data, including Linked Data. Currently, the platform provides information on Irish administrative boundaries and was designed to support two use cases: serving boundary data of geographic features at various level of detail and capturing the evolution of administrative boundaries. We report on the decisions taken for modeling and serving the data such as the adoption of an appropriate URI strategy, the development of necessary ontologies, and the use of (named) graphs to support aforementioned use cases.
http://ceur-ws.org/Vol-1690/paper14.pdf
R2RML-F: Towards Sharing and Executing Domain Logic in R2RML MappingsChristophe Debruyne
Christophe Debruyne and Declan O'Sullivan: R2RML-F: Towards Sharing and Executing Domain Logic in R2RML Mappings
Paper presented at Linked Data on the Web (LDOW2016, collocated with WWW2016)
http://events.linkeddata.org/ldow2016/papers/LDOW2016_paper_14.pdf
Towards a Project Centric Metadata Model and Lifecycle for Ontology Mapping G...Christophe Debruyne
Christophe Debruyne, Brian Walshe, Declan O'Sullivan: Towards a Project Centric Metadata Model and Lifecycle for Ontology Mapping Governance. Paper presented at iiWAS 2015 on the 13th of December 2015, Brussels, Belgium.
Creating and Consuming Metadata from Transcribed Historical Vital Records for...Christophe Debruyne
Dolores Grant, Christophe Debruyne, Rebecca Grant, Sandra Collins:
Creating and Consuming Metadata from Transcribed Historical Vital Records for Ingestion in a Long-Term Digital Preservation Platform - (Short Paper). OTM Workshops 2015: 445-450
What is Linked Data?
Presented at the Linked Data for Libraries on Thursday, November 6, 2014 at Trinity College Dublin
http://www.dri.ie/linked-data-libraries
Projet TOXIN : Des graphes de connaissances pour la recherche en toxicologie
1. Projet TOXIN :
Des graphes de connaissances pour
la recherche en toxicologie
Christophe Debruyne
Montefiore Institute - Université de Liège
2022-11-10 @ INRS Symposium
Des diapositives avec une étoile ont été ajoutées juste avant que je monte
sur scène pour fournir plus de contexte ou pour lier cette présentation aux
défis mentionnés précédemment (e.g., la provenance).
2. ▶ TOXIN: Non-Animal Methodologies for Toxicity Testing of Chemical
Compounds est un projet financé par le Interdisciplinary Research
Program (IRP) de la Vrije Universiteit Brussel.
▶ Cette présentation est principalement basée sur :
Audrey Sanctorum, Jonathan Riggio, Jan Maushagen, Sara Sepehri, Emma
Arnesdotter, Mona Delagrange, Joery De Kock, Tamara Vanhaecke,
Christophe Debruyne & Olga De Troyer (2022) End-user engineering of
ontology-based knowledge bases, Behaviour & Information Technology,
41:9, 1811-1829, DOI: 10.1080/0144929X.2022.2092032
Remerciements
Le graphe de connaissances de TOXIN 2
3. Le graphe de connaissances de TOXIN 3
▶ Que sont les graphes de connaissances ?
▶ Le projet TOXIN : une brève description
▶ Outils dédiés pour le graphe de connaissances en TOXIN : prototypes
▶ Démonstration
▶ Résumé
Structure
4. Que sont les graphes de
connaissances ?
Le graphe de connaissances de TOXIN 4
5. Connaissances d'experts
Données structurées
Une mine de connaissances est cachée, n'est pas intégrée, et leur exploitation ainsi limitée.
Problématique
Données non structurées
Un graphe de connaissances structure ces connaissances et rend les connexions sémantiques et explicites.
… à travers les départements, les processus, les organisations, etc.
Le graphe de connaissances de TOXIN 5
6. Un graphe de connaissances consiste en un
graphe qui satisfait certaines conditions
Qu'est-ce qu'un graphe de connaissances ?
https://www.pexels.com/photo/banking-business-checklist-commerce-416322/
Le graphe de connaissances de TOXIN 6
7. Représentent des "choses"
dans un domaine.
Représentent les relations
entre les entités.
Représentent des
"catégories" d'entités.
Représentent des types de
chaînes : dates, nombres, etc.
Le graphe d'un graphe de connaissances
Entités
Relations
Types
Attributs xxxx-2020
Christophe
Trinity
College
Dublin
Certificat
A1
Personne
Employeur
titulaire
employeur
type
type
type
"2020-01-01"
"Christophe"
"1234-5678"
"2020-06-30"
employeur
id
prénom
Le graphe de connaissances de TOXIN 7
8. xxxx-2020
Christophe
Trinity
College
Dublin
Certificat
A1
Personne
Employeur
titulaire
employeur
type
type
type
"2020-01-01"
"Christophe"
"1234-5678"
"2020-06-30"
employeur
id
prénom
Les conditions d'un graphe de connaissances
1. Les types et les relations sont
formellement décrits et
documentés dans un schéma que
nous nommons une ontologie
(définitions, propriétés).
2. Intégration d'informations
provenant de différents
domaines, organisations,
départements et même de
différentes sources
3. Soutien pour dériver des relations
implicites, des idées, des
connaissances,…
Document
spécialisation
de
"Eine A1-
Bescheinigung …"
définition
"Een A1-
Attest …"
définition
Sécurité
sociale
Banque-Carrefour
des Entreprises
Lois et règlements
à travaillé pour
Le graphe de connaissances de TOXIN 8
• Pour chaque personne, max 1 date de naissance
• Pour chaque certificat, valable du < valable jusqu'au
• Si une personne est titulaire d'un certificat A1 pour un
employeur, cette personne a travaillé pour cet employeur.
• …
9. Le graphe de connaissances de TOXIN 9
An ontology is “a [formal,] explicit specification of a [shared] conceptualization" [Gru95] and extended
by [Stu98]
▶ Explicit → externalized in a document to be shared and used by agents
▶ Formal → a mathematical or logic foundation to allow reasoning
▶ Shared → for it to be meaningful
- Danger Noodle vs. Snake
Ontologies
∋ ∀𝑥(𝐶𝑎𝑡 𝑥 → 𝐴𝑛𝑖𝑚𝑎𝑙 𝑥 )
[Gru95] T. Gruber. Toward principles for the design of ontologies used for
knowledge sharing? Int. J. Hum.-Comput. Stud., 43(5-6):907–928, 1995.
[Stu98] R. Studer, R. Benjamins, and D. Fensel. Knowledge engineering: Principles
and methods. Data & Knowledge Engineering, 25(1–2):161–198, 1998.
10. Créer, enrichir, affiner et gérer les GDCs
Interpretation
Application
Développement de
schéma
Transformation des
données
Annotation des
données
Assurance qualité
Collection et intégration Usage
Stockage
Image basée sur
Denaux et al., 2017
Le graphe de connaissances de TOXIN 10
11. Développement de
schéma
Transformation des
données
Annotation des
données
Assurance qualité
Collection et intégration
Créer, enrichir, affiner et gérer les GDCs
Principalement manuel
De non-GDC vers GDC
Principalement (semi-)automatique
Enrichir un GDC
Manuel et (semi-)automatique
Manuel avec des outils
• Construire et entretenir un
GDC n'est pas anodin.
• Il existe des outils et des
techniques pour chaque
activité.
• Les outils et techniques
adéquats dépendent du
projet.
Image basée sur
Denaux et al., 2017
Le graphe de connaissances de TOXIN 11
12. 11/12/2022 Christophe Debruyne 12
▶ RDF is not really an ontology language but a data model (!!!)
▶ RDF is a W3C Recommendation
▶ RDF is for describing resources on the Web
▶ RDF is designed to be read by computers
▶ RDF uses URIs to identify and reference resources on the Web
RDF/XML is just one way of serializing RDF. Other serializations format include TURTLE and N3. NQuads and Trig
even support (named) graphs.
The data "building blocks" are called triples: <Subject, Predicate, Object>
▶ Subjects are resources, and may be identified by a URI
▶ Predicates are resources that must be identified by a URI
▶ Objects are either resources (and may be identified by a URI) or literal values
A graph data model:
Resource Description Framework
14. Resource Description Framework
Christophe Debruyne
11/12/2022 14
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix dc: <http://purl.org/dc/terms/> .
<#Christophe> a foaf:Person .
<#Christophe> foaf:name "Christophe Debruyne" .
<#Christophe> foaf:member <http://www.adaptcentre.ie/>.
<#Christophe> foaf:based_near <http://dbpedia.org/resource/Brussels> .
<urn:isbn:9789057183607> a foaf:Document .
<urn:isbn:9789057183607> a bibo:Thesis .
<urn:isbn:9789057183607> dc:date "2013-09-30" .
<urn:isbn:9789057183607> dc:title "Grounding..."@en .
<urn:isbn:9789057183607> dc:creator <#Christophe> .
What we obtain is a:
• Directed graph with
• Links between data contained within the same document, and
• Links between data across documents (i.e., distributed)
But… how does this data become meaningful?
16. Le graphe de connaissances de TOXIN 16
▶ Le contexte : les principes 3R → Reduction, Replacement, Refinement de
l'expérimentation animale.
▶ L'Europe a totalement interdit l'utilisation d'animaux à des fins de test.
▶ Actuellement, il n'existe aucune méthode sans animaux validée pour évaluer
la toxicité de doses répétées (pour remplacer les autres méthodes).
▶ Cela pose un problème pour le développement de nouveaux composés
chimiques dans des secteurs tels que la cosmétique.
Ce projet explore et établit des stratégies non animales et pertinentes pour
l'homme pour évaluer la toxicité de doses répétées (concentré sur le foie).
Context
17. Le graphe de connaissances de TOXIN 17
Slide courtesy of Sara Sepehri (Vrije Universiteit Brussel)
18. Le graphe de connaissances de TOXIN 18
▶ Développer des systèmes de culture de cellules humaines qui prédisent avec
précision la toxicité hépatique ;
▶ Établir des approches informatiques intégrées qui soutiennent de manière
optimale la recherche in vitro ;
▶ Faire des recherches sur les préoccupations éthiques pouvant survenir à la
suite des nouvelles méthodes ;
▶ Veiller à ce que les stratégies non animales développées soient conformes à
toutes les exigences légales ;
▶ Former une nouvelle génération de chercheurs interdisciplinaires dans les
différents domaines scientifiques concernés par le projet ;
▶ Assurer la visibilité des stratégies développées.
Objectifs
19. Le graphe de connaissances de TOXIN 19
Outils dédiés pour le GDC
en TOXIN : prototypes
20. Le graphe de connaissances de TOXIN 20
▶ De nombreuses informations sont écrites dans des "opinions", des
documents contenant des descriptions d'expériences de recherche sur
des composés chimiques spécifiques.
- Ces informations ne sont pas structurées et nécessitent un expert
pour les interpréter.
- Ces informations peuvent évoluer dans le temps.
- Ces informations ne peuvent pas être facilement combinées avec
d'autres ensembles de données.
Problématique
21. Le graphe de connaissances de TOXIN 21
Avant : utilization des tableurs
22. Le graphe de connaissances de TOXIN 22
▶ Tableurs :
- Facile pour les utilisateurs, mais...
- Problèmes de redondance
- Problèmes d'évolutivité
- Données "plates"
- Qualité
- ...
▶ Les technologies de GCDs peuvent résoudre bon nombre de ces
problèmes, mais ont une courbe d'apprentissage abrupte.
▶ Les outils dédiés peuvent-ils fournir une solution ?
Problématique
23. Le graphe de connaissances de TOXIN 23
▶ Une métaphore d'interface s'appuie sur la connaissance de concepts
familiers pour faciliter l'apprentissage et l'utilisation d'un système.
▶ La métaphore du puzzle s'appuie sur la familiarité avec les pièces de
puzzle et a été couronnée de succès pour d'autres tâches :
programmation, interrogation et intégration de données...
▶ Dans notre solution proposée, les pièces du puzzle guident les experts en
la matière dans la création d'entrées de données valides.
Métaphore du puzzle
24. Le graphe de connaissances de TOXIN 24
Le(s) prototype(s)
Le prototype est
construit sur
Google Blockly pour
la métaphore et
Apache Jena pour
le GDC.
25. Le graphe de connaissances de TOXIN 25
Ontodia
Mouromtsev, D., Pavlov, D., Emelyanov, Y., Morozov, A., Razdyakonov, D.
and Galkin, M., 2015. The Simple Web-based Tool for Visualization and
Sharing of Semantic Data and Ontologies. In International Semantic Web
Conference (Posters & Demos).
Ontodia est un
logiciel libre qui
« comprend »
les GDCs stockés
en RDF. Il nous
permet
d'explorer le
contenu du GDC.
26. Démonstration !
Le graphe de connaissances de TOXIN 26
Développement de
schéma
Transformation des
données
Annotation des
données
Assurance qualité
Collection et intégration
27. Le graphe de connaissances de TOXIN 27
Avantages et inconvénients
▶ Avantages
- Les utilisateurs sont guides
- Les mappages évitent les erreurs
- "Fun"
▶ Inconvénients
- Potentiellement chronophage
- Structure et pensée linéaires (arbres vs. graphes)
- Contraintes (mais…)
▶ Compromis: tableurs revisités + controlled vocabularies et l'outil
▶ Création des concepts de domaine? Voire rapport.
28. Le graphe de connaissances de TOXIN 28
Faceted
browser
communicant
avec le GDC de
TOXIN
Screenshot
courtesy of Jan Maushagen
(Vrije Universiteit Brussel)
29. Le graphe de connaissances de TOXIN 29
Future work
30. Le graphe de connaissances de TOXIN 30
Vers l'enrichissement du GDC TOXIN
TOXIN KG
Toxicological
ecosystem
Conclusion
Domain expert
Slide courtesy of Guillaume Vrijens (Université de Liège)
31. Le graphe de connaissances de TOXIN 31
Vers l'enrichissement du GDC TOXIN
Slide courtesy of Guillaume Vrijens (Université de Liège)
TOXIN data
Identification
with rules Pathways
Genes,
biological
processes,...
Compound:
- Basic Red 51
Observations:
- ↑ Cholesterol
- ↑ Triglycerides
- …
- Steatosis
- …
Non-alcoholic
fatty liver disease
pathways
Fatty acid
biosynthesis
Integrate and store information from
different datasets in the TOXIN KG.
32. Le graphe de connaissances de TOXIN 32
Provenance – (in the Beyond 2022 project)
Cette image, développée dans un autre
projet, montre comment les graphes
nommés peuvent être utilisés pour
séparer et gérer différentes
interprétations dans un graphe de
connaissances.
Référence : C. Debruyne, G. Munnelly, L. Kilgallon,
D. O'Sullivan, and P. Crooks. Creating a knowledge
graph for ireland's lost history: Knowledge
engineering and curation in the beyond 2022
project. ACM Journal on Computing and Cultural
Heritage, 15(2):25:1-25:25, 2022
33. Le graphe de connaissances de TOXIN 33
▶ Les GDCs peuvent résoudre de nombreux objectifs de TOXIN
▶ Mais les technologies GCD sont difficiles (à apprendre, à utiliser, à mettre
en œuvre, ...)
▶ Le développement d'outils dédiés peut apporter une solution à ces
problèmes, et nous l'avons démontré dans le cadre de ce projet.
Résumé
34. Merci !
Pour des questions ou intéressés par une éventuelle collaboration : c.debruyne@uliege.be
Le graphe de connaissances de TOXIN 34
35. ▶ A. Hogan, E. Blomqvist, M. Cochez, C. d'Amato, G. de Melo, C. Gutierrez, J. E. Labra Gayo, S. Kirrane, S. Neumaier, A. Polleres,
R. Navigli, A.-C. Ngonga Ngomo, S. M. Rashid, A. Rula, L. Schmelzeisen, J. F. Sequeda, S. Staab, A. Zimmermann: Knowledge
Graphs. CoRR abs/2003.02320 (2020)
▶ J. Z. Pan, G. Vetere, J. M. Gómez-Pérez, H. Wu: Exploiting Linked Data and Knowledge Graphs in Large Organisations. Springer
2017, ISBN 978-3-319-45652-2
- R. Denaux, Y. Ren, B. Villazón-Terrazas, P. Alexopoulos, A. Faraotti, H. Wu: Knowledge Architecture for Organisations.
Exploiting Linked Data and Knowledge Graphs in Large Organisations 2017: 57-84
▶ Audrey Sanctorum, Jonathan Riggio, Jan Maushagen, Sara Sepehri, Emma Arnesdotter, Mona Delagrange, Joery De Kock,
Tamara Vanhaecke, Christophe Debruyne & Olga De Troyer (2022) End-user engineering of ontology-based knowledge bases,
Behaviour & Information Technology, 41:9, 1811-1829, DOI: 10.1080/0144929X.2022.2092032
Sources
Le graphe de connaissances de TOXIN 35