1. Concevoir une preuve de concepts
web sémantique
Michel Héon PhD
Informaticien indépendant en web des données
Professeur associé université du Québec à Montréal
Chargé de cours École des Sciences de la Gestion-UQAM
Troisième conférence sur le web sémantique au Québec
http://websemantique.ca
19 juin 2018
2. Michel Héon PhD
http://www.cotechnoe.com
Il était une fois…
"Il paraît que le web sémantique c'est une bonne
solution pour réutiliser les données du web et les
lier avec nos données … et qu'on pourrait même
faire de l'IA avec cela?"
"Oui, mais on ne connaît rien là-dedans
et il paraît que c'est hyper compliqué. Je le sais!
Mon voisin me là dit…"
"Peut-être… mais a-t-il fait une preuve de
concept bien orchestré ?"
"Wein…Ok! Mais, on fait ça comment une preuve de
concept web sémantique ?"
22018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
3. Michel Héon PhD
http://www.cotechnoe.com
Je vous propose une méthodologie de
preuve de concept web sémantique
• Qui se fonde sur une méthodologie de type
"Agile"
• Que j'ai moi-même expérimenté à quelques
reprises dans les milieux académiques, pour
un ministère, en entreprises en start-up ainsi
qu'en grande entreprise
32018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
4. Michel Héon PhD
http://www.cotechnoe.com
La méthodologie
• La méthodologie répartit les
tâches à réaliser en
"Disciplines"
• Le processus de réalisation
se divise en quatre phases
• Chaque phase se divise en
itération ponctuée par un
livrable à chaque fin
d'itération et un plan
d'itération pour démarrer le
nouveau cycle
• Les courbes représentent la
distribution de la charge de
travail attendue par itération
pour chaque des disciplines
42018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
Bienvenue sur IBM Rational Unified
Process. RUP présente les meilleures
pratiques ainsi que des conseils pour la
réussite de votre développement logiciel.
5. Michel Héon PhD
http://www.cotechnoe.com
Le matériel
52018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
Apache Jena: est une boîte à outils gratuite utile au traitement
des données web sémantique ainsi qu'à la publication et à la
liaison des données sur le web
TopBraid Composer de la
compagnie TopQuadrant est
un outil servant à l'édition
d'ontologies. Il existe chez
TopQuadrant une édition
gratuite de TopBraid
Composer. Surtout utile pour
POC en web de données
liées
Protégé de l'Université Stanford est une alternative à TopBraid composer. Il
est particulièrement adapté à la visualisation schématique d'ontologies et
mieux adapté aux POC liées à l'informatique cognitive et à la déduction
automatique (inférence)
FileZila pour le transfert de fichiers
PUTTY connexion ssh à un serveur
Système d'exploitation Linux pour
l'installation de Jena-Fuseki
6. Michel Héon PhD
http://www.cotechnoe.com
Compétences de l'équipe
• Gestion de projets
• Architecture logicielle
• Programmation Java
• Modélisation de données
• Environnement Unix (Linux)
• Conseillé expert dans les technologies
sémantiques responsables de guider l'équipe
(ça, c'est mon rôle! )
62018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
7. Michel Héon PhD
http://www.cotechnoe.com
Les objectifs par phase, adaptée à la
mise en œuvre de la preuve de concept
Rappel sur les quatre phases de la
méthodologie
• Phase 1) Création
• Phase 2) Élaboration
• Phase 3) Construction
• Phase 4) Transition
72018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
8. Michel Héon PhD
http://www.cotechnoe.com
Objectifs à atteindre à la
Phase 1) Création
• Recueil des exigences
– Déterminer les objectifs et les attendus du projet:
– Réaliser le scénario d'utilisation du système à venir
• Analyse et conception
– Esquisse de la description du système attendu
– Analyse de la structure des données en jeux
– Cibler dans le web les jeux de données à intégrer
• Déploiement
– Acquérir et installer les outils
• Gestion de projet
– Première mise à niveau de l'équipe au sujet des technologies
sémantiques
– Attribuer les rôles (architecte, modélisateur de données, gestion de
projet, programmation)
– Déterminer les livrables attendus pour la phase et faire le plan des
tâches pour la réalisation des livrables
82018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
9. Michel Héon PhD
http://www.cotechnoe.com
Objectifs à atteindre à la
Phase 2) Élaboration
• Recueil des exigences
– Ajuster les exigences en fonction des découvertes terrain
• Analyse et conception
– Raffiner l'architecture logicielle de la solution
– Esquisser les requêtes SPARQL à déployer pour amalgamer les
données avec celles du web
• Implémentation
– Traduction des jeux de données locaux en RDF
(Sans doute l'objectif le plus difficile à atteindre)
– Construire les ontologies de la solution
• Déploiement
– Démarrer les processus d'homologation dans l'organisation des logiciels
à acquérir
– Soutenir l'équipe d'implémentation
• Gestion de projet
– Poursuivre la mise à niveau des membres de l'équipe
92018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
10. Michel Héon PhD
http://www.cotechnoe.com
Objectifs à atteindre à la
Phase 3) Construction
• Implémentation
– Construction des interfaces utilisateurs
– Développent des requêtes SPARQL
– Interfacer le résultat des requêtes avec les composants qui
exploitent les résultats
– Compléter l'implémentation des ontologies
• Test
– Comparer les résultats obtenus aux résultats attendus
• Déploiement
– Réaliser une première mise en exécution des divers modules du
système attendu
• Gestion de projet
– Poursuive la mise à niveau de l'équipe en mode
accompagnement dans le processus de résolution de problèmes
102018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
11. Michel Héon PhD
http://www.cotechnoe.com
Phase 4) Transition
• Implémentation
– L'énergie de développement est surtout utilisée à la
résolution des problèmes
• Test
– Appliquées pour valider les fonctionnalités
– Aussi pour vérifier la solidité du logiciel et de l'architecture
• Déploiement
– Dans le cas d'une preuve de concept, les efforts sont
déployés pour soutenir les tests et l'implémentation
– Préparation d'une démo
• Gestion de projet
– Toujours soutenir l'équipe en mode accompagnement
112018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
12. Michel Héon PhD
http://www.cotechnoe.com
Exemples
• Contexte
– Deux preuves de concepts sont réalisées dans le
cadre d'une formation universitaire de deuxième
cycle dans un programme de gestion des TI
– La formation est de type réalisation de projet où
je joue le rôle de conseiller en web sémantique
– Trois personnes par équipe
– Sept semaines pour réaliser le projet
122018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
13. Michel Héon PhD
http://www.cotechnoe.com
Faits saillants:
Les questions d'intelligence d'affaires
pointées par les équipes
132018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
Équipe 1 Équipe 2
• Quel était le nombre de places de
stationnement gratuits par habitant
(et par arrondissement) pour la
saison de déneigement 2017-2018
pour le différents arrondissements
de la ville de Mtl?
• Analyser le temps moyen par
véhicule remorqué par rue
d’origine, arrondissement
d’origine, motif de remorquage,
journée de remorquage ?
• Même type d’analyse pour la
distance moyenne de
déplacement par véhicule pour
la ville de Mtl ?
14. Michel Héon PhD
http://www.cotechnoe.com
Les données d'origine:
Données provenant du site des données
ouvertes du Gouvernement du Québec
• Critiques. Les données sont ouvertes- certes! Mais non liable
dans le web puisque :
a. Elles sont de format CSV et non pas RDF
b. Elles ne sont pas accessibles par une requête SPARQL
c. Elles sont de format tabulaire et non sous la forme d'un graphe
142018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
https://www.donneesquebec.ca/recherche/fr/da
taset/vmtl-remorquages-de-vehicules-genants
15. Michel Héon PhD
http://www.cotechnoe.com
Informations nécessaires, mais
manquantes pour réaliser l'analyse BI
• Coordonnées GPS de chaque
arrondissement
• La population totale pour chaque
arrondissement
152018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
17. Michel Héon PhD
http://www.cotechnoe.com
Architecture déployée
172018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
Source: 2018 - Rapport de projet ESG-MET8605, Claudia Gaboriault-Oligny, Mihaela Pascu, Maxime Pelletier-Gaudreau
a) Extraire les données ouvertes CSV
c) Amalgamer avec les
données DBpedia
d) Publier dans
l'analyseur BI
18. Michel Héon PhD
http://www.cotechnoe.com
Résultats pour chaque preuve de
concepts
182018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
Source: 2018 - Rapport de projet ESG-MET8605, Claudia Gaboriault-Oligny,
Mihaela Pascu, Maxime Pelletier-Gaudreau
le nombre de places de
stationnement gratuit par
habitant pour la saison de
déneigement 2017-2018
Nombre de remorquage par
arrondissement entre 2005 et 2015
Source: 2018 - Rapport de projet ESG-MET8605, Bonam Mingole,
Pablo Mario Aceiton Campos, Jean-Pierre Gagné
19. Michel Héon PhD
http://www.cotechnoe.com
Remarques émises par les étudiants au
sujet de ces expérimentations
• Le questionnement BI n'aurait pas pu être
réalisé avec les seules données de la ville de
Montréal
• La connexion avec Dbpedia a permis de
compléter le questionnement BI
• L'apprentissage de SPARQL nécessite un
certain investissement en temps mais le ROI est
considérable compte tenu de la possibilité de
réutiliser les données du web
• Le nettoyage des données est une tâche
fastidieuse et chronophage
192018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
20. Michel Héon PhD
http://www.cotechnoe.com
Constats empiriques sur la réussite de la
réalisation d'une preuve de concepts
1) Le degré de réussite est tributaire du degré de
compétence du conseiller à transmettre et guider l'équipe
dans le domaine du web sémantique
2) On ne fait pas une POC pour convaincre, on la fait pour
confirmer une conviction
3) Il doit y avoir un engagement ferme de l'ensemble de
l'équipe (directions & employés) dans le processus, et ce,
à tous les niveaux de la hiérarchie organisationnelle
4) Prévoir consacrer beaucoup de ressources (temps,
disponibilité, argent, espace physique pour les multiples
réunions)
5) Accepter de vivre une expérience avec beaucoup
d'incertitude et de chaos… c'est du chaos que surgit la
lumière
202018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
21. Michel Héon PhD
http://www.cotechnoe.com
Avez-vous songé aux divers programmes
d'aide gouvernementale
212018-06-193e édition de websemantique.ca: Faire une preuve de concept web sémantique
Programme de bourses de stage en entreprise
pour des étudiants de maîtrise, doctorat et
d'étude postdoctoral
https://www.mitacs.ca/fr
RS&DE
Recherche scientifique et
développement expérimental –
Programme d'encouragements fiscaux
Programme d'aide à la recherche
industrielle (PARI)
https://www.nrc-cnrc.gc.ca/fra/pari/index.html
https://www.canada.ca/fr/agence-revenu/services/recherche-scientifique-
developpement-experimental-programme-encouragements-fiscaux.html
Subventions d'engagement partenarial
Les chercheurs universitaires et collégiaux ont la possibilité de
présenter une demande de subvention en vue d’établir, avec
une entreprise partenaire, une nouvelle collaboration de
recherche
http://www.nserc-crsng.gc.ca/Professors-Professeurs/RPP-
PP/Engage-Engagement_fra.asp
…et bien d'autres…
Nous offrons des services-conseils en innovation et du financement adaptés
à vos besoins particuliers. Notre objectif? Vous aider à accélérer la
croissance de votre entreprise grâce à l'innovation et à la technologie.
22. Concevoir une preuve de concepts
web sémantique
Michel Héon PhD
Informaticien indépendant en web des données
Professeur associé université du Québec à Montréal
Chargé de cours École des Sciences de la Gestion-UQAM
Troisième conférence sur le web sémantique au Québec
http://websemantique.ca
19 juin 2018