2. Une introduction
aux Réseaux Bayésiens
Philippe Leray,
Université de Nantes, LS2N, Capacités
Sponsors GOLD édition 2020 :
3. Qui suis-je ?
Twitter : @salondata
#SalonData2020
1993 : Ingénieur ISEP, option Informatique
1993 : DEA Intelligence Artificielle, Reconnaissance des Formes et Applications, Univ. Paris 6
1998 : Thèse de Doctorat, Univ. Paris 6
apprentissage et diagnostic de systèmes complexes : réseaux de neurones et réseaux bayésiens
1999 : Maître de conférences, INSA Rouen
2006 : Habilitation à Diriger les Recherches, Univ. Rouen
réseaux bayésiens : apprentissage et modélisation de systèmes complexes
2007 : Professeur des Universités, Polytech'Nantes - Univ. Nantes
2017 : Responsable scientifique Capacités SAS, cellule KnowEdge
3/23
4. Intérêt pour l’Intelligence Artificielle
Twitter : @salondata
#SalonData2020
198x : Que peut-on faire d'intelligent avec un TRS 80 ou un Amstrad CPC 6128 ?
1994 : Découverte des réseaux de neurones :
construire un modèle intelligent à partir de données !
1997 : Découverte des réseaux bayésiens (RB) : et en plus on peut raisonner !!!
1999 : Apprentissage des RB sous toutes leurs formes
applications à la modélisation de systèmes complexes
2007 : PILGRIM, bibliothèque C++ dédiée aux modèles graphiques probabilistes
Plus de 20 thèses encadrées sur le sujet
Des projets R&D dans des domaines très larges : fiabilité, maintenance, sécurité,
bio-informatique, santé, recommandation, ...
4/23
5. Un peu d’histoire
Twitter : @salondata
#SalonData2020
1970-90 : L’ère des systèmes experts
des connaissances décrites sous forme de règle logique
des mécanismes de raisonnement à partir d’observation
Judea Pearl (1936-…) : et si on rajoutait de l’incertain ?
1982 : Reverent Bayes on inference engines: a distributed hierarchical approach
1988 : Probabilistic Reasoning in Intelligent Systems
2000 : Causality : Models, reasoning, inference
2012 : ACM A.M. Turing Award for contributions that transformed AI
5/23
6. Qu’est-ce qu’un réseau bayésien ?
Twitter : @salondata
#SalonData2020
Est-ce que je vais me casser la jambe aujourd’hui ?
pour cela, il faudrait que je glisse dans la rue
ce qui s’explique généralement par le fait que
le sol est mouillé, et/ou que je suis dans la lune
mais si je suis dans la lune, je risque aussi
d’oublier mes papiers
description graphique des connaissances
représentation intuitive, compréhensible
interprétation causale (parfois)
6/23
7. Qu’est-ce qu’un réseau bayésien ?
Twitter : @salondata
#SalonData2020
Et l’incertain dans tout cela ?
si je ne suis pas dans la lune, il est rare que
j’oublie mes papiers (une fois sur dix)
par contre si je suis dans la lune, il y a 3 chances sur 4
que j’oublie mes papiers !
je n’ai jamais eu la jambe cassée
sans avoir glissé avant
et en glissant, il y a généralement 9 chances sur 10
que je ne me casse pas la jambe
représentation probabiliste de l’incertain
7/23
8. Qu’est-ce qu’un réseau bayésien ?
Twitter : @salondata
#SalonData2020
Et à quoi cela peut bien servir ?
je me réveille ce matin,
sans rien connaître de ma journée
risque d’oublier mes papiers : 23 %
risque d’être dans la lune : 20 %
risque de glissade : 22 %
risque de jambe cassée : 2 %
un modèle qui n’a pas « d’entrées » ou de « sorties »
8/23
9. Qu’est-ce qu’un réseau bayésien ?
Twitter : @salondata
#SalonData2020
Et à quoi cela peut bien servir ?
aujourd’hui est un bon jour :
pas de pluie
et je n’ai pas oublié mes papiers !
risque d’être dans la lune : 20 % → 6 %
risque de glissade : 22 % → 1 %
risque de jambe cassée : 2 % → presque 0 % !
raisonnement en présence de données incomplètes
9/23
10. Qu’est-ce qu’un réseau bayésien ?
Twitter : @salondata
#SalonData2020
Et à quoi cela peut bien servir ?
aujourd’hui est un mauvais jour :
il pleut
et j’ai pas oublié mes papiers !
risque d’être dans la lune : 20 % → 65 %
risque de glissade : 22 % → 81 %
risque de jambe cassée : 2 % → 8 % !
10/23
11. Qu’est-ce qu’un réseau bayésien ?
Twitter : @salondata
#SalonData2020
Et à quoi cela peut bien servir ?
j’ai glissé,
mais il ne pleut pas aujourd’hui !
risque d’être dans la lune : 20 % → 96 %
risque d’oublier mes papiers : 23 % → 73 %
risque de jambe cassée : 2 % → 10 % !
11/23
12. Et les data dans tout ça ?
Twitter : @salondata
#SalonData2020
Comment construire un réseau bayésien ?
Small data
construction du graphe par formalisation des
connaissances expertes
élicitation des probabilités : idem
validation du modèle en illustrant son
comportement dans des cas d’utilisations
connus, ou en utilisant les quelques données
disponibles
on peut construire un modèle réaliste même sans données !
12/23
13. Et les data dans tout ça ?
Twitter : @salondata
#SalonData2020
Comment construire un réseau bayésien ?
Medium data
construction du graphe par formalisation
des connaissances expertes
apprentissage des probabilités par des approches
statistiques standards,
avec données complètes ou incomplètes
vers une IA plus soutenable
13/23
14. Et les data dans tout ça ?
Twitter : @salondata
#SalonData2020
Comment construire un réseau bayésien ?
Big data
apprentissage du graphe à partir des données
combinaison possible avec des connaissances
expertes
découverte de connaissances à partir de données
et un modèle appris interprétable
14/23
15. La descendance
Twitter : @salondata
#SalonData2020
De nombreuses extensions pour traiter des problèmes de plus en plus complexes
données discrètes et continues : réseaux conditionnels gaussiens
prise en compte de décisions et de leur coût : diagramme d’influence
données séquentielles : réseaux bayésiens dynamiques
fichiers de logs : modèles graphiques d’événements
données relationnelles : modèles relationnels probabilistes
bases de données de graphe : modèles entité-association probabilistes
15/23
16. La descendance
Twitter : @salondata
#SalonData2020
Et des challenges en IA et en Machine Learning
vers un apprentissage
incrémental,
préservant la confidentialité,
multi-tâches,
par transfert,
fédéré,
...
16/23
pour une IA
plus soutenable,
plus acceptable,
plus ouverte,
plus éthique,
...
17. Nos compétences
De l’étude théorique, ou la preuve de concept, … jusqu’à la solution embarquée
Twitter : @salondata
#SalonData2020
PILGRIM
Projets R&D
collaboratifs
Prestations
Dévelop. spécifiques
Formation
LicencingLibrairie C++
17/23
19. Des exemples d’applications
Modèle de vieillissement des composants d’une maison et estimation des coûts associés
Twitter : @salondata
#SalonData2020 19/23
22. En conclusion
Twitter : @salondata
#SalonData2020
un modèle graphique
probabiliste, représentation
compacte de connaissances
pouvant modéliser efficacement
des systèmes complexes
apprentissage possible,
de manière itérative,
du 100 % expert
au 100 % données
explicable, ouvert, interprétable moteur de raisonnement
à partir de données
incomplètes ou imprécises
small
data
medium
data
big
data
22/23
applicable dans de
nombreux contextes et
domaines d’application