SlidesTRAIL.pdf

Apprentissage et utilisation de modèles graphiques
probabilistes pour la modélisation de systèmes
complexes
vers des modèles d'IA compréhensibles et soutenables
Philippe Leray
Nantes Université, LS2N, Capacités
Philippe.Leray@ls2n.fr

Plan
2/27
applicable dans de
nombreux contextes et
domaines d’application
3. applicables dans de
2. réseaux bayésiens
1. introduction

Qui suis-je ?

1993 : Ingénieur ISEP, option Informatique

1993 : DEA Intelligence Artificielle, Reconnaissance des Formes et Applications, Univ. Paris 6

1998 : Thèse de Doctorat, Univ. Paris 6

apprentissage et diagnostic de systèmes complexes : réseaux de neurones et réseaux bayésiens

1999 : Maître de conférences, INSA Rouen

2006 : Habilitation à Diriger les Recherches, Univ. Rouen

réseaux bayésiens : apprentissage et modélisation de systèmes complexes

2007 : Professeur des Universités, Polytech'Nantes - Univ. Nantes

2017 : Responsable scientifique Capacités SAS, cellule Data-IA
3/27

Intérêt pour l’Intelligence Artificielle

198x : Que peut-on faire d'intelligent avec un TRS 80 ou un Amstrad CPC 6128 ?

1994 : Découverte des réseaux de neurones :
construire un modèle intelligent à partir de données !

1997 : Découverte des réseaux bayésiens (RB) : et en plus on peut raisonner !!!

1999 : Apprentissage des RB sous toutes leurs formes
applications à la modélisation de systèmes complexes

2007 : PILGRIM, bibliothèque C++ dédiée aux modèles graphiques probabilistes

2023 : Bientôt 30 thèses encadrées sur le sujet, du très théorique au très appliqué

Des projets R&D dans des domaines très larges : fiabilité, maintenance, sécurité,
bio-informatique, santé, recommandation, ...
4/27

Un peu d’histoire
1970-90 : L’ère des systèmes experts

des connaissances décrites sous forme de règles logiques

des mécanismes de raisonnement à partir d’observation
Judea Pearl (1936-…) : et si on rajoutait de l’incertain ?

1982 : Reverent Bayes on inference engines: a distributed hierarchical approach

1988 : Probabilistic Reasoning in Intelligent Systems

2000 : Causality : Models, reasoning, inference

2012 : ACM A.M. Turing Award for contributions that transformed AI

2018 : The Book of Why: The New Science of Cause and Effect
5/27

Model-based vs. Model-blind learning
6/27

Model-based learning
représentation mentale du système
manipulable à volonté (« What if »)
réseaux bayésiens

Model-blind learning
Pearl, J. (2018). Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution, January 15, 2018,

Plan
7/27
applicable dans de
3. applicables dans de
1. introduction

Qu’est-ce qu’un réseau bayésien ?
Est-ce que je vais me casser la jambe aujourd’hui ?

pour cela, il faudrait que je glisse dans la rue

ce qui s’explique généralement par le fait que
le sol est mouillé, et/ou que je suis dans la lune

mais si je suis dans la lune, je risque aussi
d’oublier mes papiers
description graphique des connaissances
représentation intuitive, compréhensible
interprétation causale (parfois)
8/27

Et l’incertain dans tout cela ?

si je fais pas attention, il est rare que
j’oublie mes papiers (une fois sur dix)

par contre si je je fais pas attention,
il y a 3 chances sur 4 que j’oublie mes papiers !

je n’ai jamais eu la jambe cassée
sans avoir glissé avant

et en glissant, il y a généralement 9 chances sur 10
que je ne me casse pas la jambe
représentation probabiliste de l’incertain
9/27

Et à quoi cela peut bien servir ?

je me réveille ce matin,
sans rien connaître de ma journée

risque d’oublier mes papiers : 23 %

risque d’inattention : 20 %

risque de glissade : 22 %

risque de jambe cassée : 2 %
un modèle qui n’a pas « d’entrées » ou de « sorties »
10/27


aujourd’hui est un bon jour : pas de pluie
et je n’ai pas oublié mes papiers !

risque d’inattention : 20 % → 6 %

risque de glissade : 22 % → 1 %

risque de jambe cassée : 2 % → presque 0 % !
raisonnement en présence de données incomplètes
11/27


aujourd’hui est un mauvais jour : il pleut
et j’ai oublié mes papiers !


risque de glissade : 22 % → 81 %

risque de jambe cassée : 2 % → 8 % !
12/27


j’ai glissé, mais il ne pleut pas aujourd’hui !


risque d’oublier mes papiers : 23 % → 73 %

risque de jambe cassée : 2 % → 10 % !
13/27
déduction : glissade sans pluie donc inattention

Réseaux bayésiens et Machine Learning
Small Data

construction du graphe par formalisation des
connaissances expertes

élicitation des probabilités : idem

validation du modèle en illustrant son
comportement dans des cas d’utilisations
connus, ou en utilisant les quelques données
disponibles
on peut construire un modèle réaliste même sans données !
14/27

Medium Data

construction du graphe par formalisation
des connaissances expertes

apprentissage des probabilités
par des approches statistiques standards,

avec données complètes ou incomplètes
vers une IA plus soutenable
15/27

Big Data

apprentissage du graphe
à partir des données

combinaison possible avec
des connaissances
expertes
découverte de connaissances
à partir de données
avec un modèle appris interprétable
16/27

La descendance
De nombreuses extensions pour traiter des problèmes de plus en plus complexes

données discrètes et continues : réseaux conditionnels gaussiens

prise en compte de décisions et de leur coût : diagrammes d’influence

données séquentielles : réseaux bayésiens dynamiques

fichiers de logs : modèles graphiques d’événements

données relationnelles : modèles relationnels probabilistes

bases de données de graphe : modèles entité-association probabilistes
17/27

Plan
18/27
3. applicables
dans de
nombreux
contextes et
domaines
d’application
1. introduction

Des exemples récents
Medical Companion – prévention de la récidive de tentative de suicide
19/27
- l’assistant pose des questions au
patient
- les résultats aux questions
permettent d’évaluer différentes
« dimensions » de l’état du patient
(anxiété, appétit, sommeil, …), et
son état global
- des préconisations sont
proposées au patient en fonction
des variations de son état
Mouchabac, S., Leray, P., Adrien, V., Gollier-Briant, F., and Bonnot, O. (2021). Beyond big data in behavioral psychiatry, the place of bayesian network. / example from a preclinical trial of an innovative smartphone
application to prevent suicide relapse. Journal of Medical Internet Research,

Apprentissage fédéré préservant la confidentialité pour des applications médicales
personnalisées
20/27
- chaque assistant recueille les données de son patient
- ces données peuvent servir à
personnaliser le modèle pour ce patient
- mais comment faire pour qu’elles puissent aussi aider à
améliorer les autres modèles ?
= apprentissage fédéré / multi-tâches
et en garantissant la confidentialité des données ?
= confidentialité préférentielle
Benikhlef, S., Leray, P., Raschia, G., M.Ben Messaoud, and Sakly, F. (2021). Multi-task transfer learning for Bayesian network structures. In Proceedings of the 16th European Conference on Symbolic and
Quantitative Approaches to Reasoning with Uncertainty (ECSQARU 2021), pages 217-228, Prague, Czechia.

Modèles graphiques d’événements pour la modélisation du processus chirurgical
21/27
- les robots chirurgicaux sont commandés par des
chirurgiens
- des données brutes concernant les actions sont recueillies
- les chirurgies sont annotées
Objectif :
- construire/apprendre des modèles graphiques
d’événements à partir de ces logs, et d’ontologies,
pour décrire les séquencements d’actions possibles,
et la variabilité inhérente à une chirurgie

Détection d’outliers dans des données tabulaires mixtes
22/27
- le réseau bayésien « capture » des dépendances
probabilistes entre les variables du tableau de
données
- des groupes de variables incohérents peuvent être
identifiés et montrés à l’utilisateur
- le modèle peut aussi proposer des corrections les
plus probables
Dufraisse, E., Leray, P., Nedellec, R., and Benkhelif, T. (2020). Interactive anomaly detection in mixed tabular data using bayesian networks. In Jaeger, M. and Nielsen, T. D., editors, Proceedings of the 10th
International Conference on Probabilistic Graphical Models (PGM 2020), volume 138 of Proceedings of Machine Learning Research, pages 1-12, Aalborg, Denmark. PMLR.

Modèle de vieillissement des composants d’une maison et estimation des coûts associés
23/27
Blanchard J., Leray, P., Marandel, F.. and Piton, T. (2023). Une extension des modèles graphiques de durée pour estimer l'évolution des coûts de maintenance dans le logement résidentiel, JFRB 2023, Nantes,
France

Réseaux bayésiens pour l’usinage intelligent
24/27
Construire un réseau bayésien
- pour prédire l’usure de l’électro-broche utilisée dans
les machines-outils d’usinage à grande vitesse
- pendant la surveillance du processus
- mais de manière non supervisée ?
- et se servant aussi d’autres données capturées
(par d’autres capteurs) en dehors du processus
d’usinage ?
= co-training non supervisé
Monvoisin, M., Leray, P., and Ritou, M. (2021). Unsupervised co-training of bayesian networks for condition prediction. In 34th International Conference on Industrial Engineering and Other Applications of Applied
Intelligent Systems, IEA/AIE 2021, July 26-29, 2021, Kuala Lumpur, Malaysia, pages 577-588.

Bayesian Knowledge Tracing : estimation du niveau de compétence d’apprenants
25/27
- on observe les résultats d’un apprenant sur
différents exercices réalisés au cours du temps
- on peut prédire l’évolution de son niveau dans
les compétences associées
- et s’appuyer sur ce modèle pour différentes
tâches de plus haut niveau :
* recommander l’exercice suivant
* qualifier des stratégies d’auto-régulation, ...
Couland Q. , Leray, P. and Boulahmel A. (2023). Un modèle générique avec structuration des compétences et facteurs externes pour le Bayesian Knowledge Tracing, JFRB 2023, Nantes, France

En conclusion
Une famille de modèles
graphiques probabilistes,
représentation compacte de
connaissances
pouvant modéliser efficacement
des systèmes complexes
apprentissage possible,
de manière itérative,
du 100 % expert
au 100 % données
explicable, ouvert, interprétable moteur de raisonnement
à partir de données
incomplètes ou imprécises
small
data
medium
data
big
data
26/27
applicable dans de

Nos compétences
De l’étude théorique, ou la preuve de concept, … jusqu’à la solution embarquée
PILGRIM
Projets R&D
collaboratifs
Prestations
Dévelop. spécifiques
Maintenance
Licencing
Maturation
Librairie C++
27/27
Philippe.Leray@ls2n.fr

SlidesTRAIL.pdf

Contenu connexe

Similaire à SlidesTRAIL.pdf

Plus de University of Nantes

SlidesTRAIL.pdf