SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
Organiser la fusion d’information par
l’analyse formelle de concepts
Z. Assaghir, M. Kaytoue, A. Napoli et H. Prade
{assaghiz,kaytouem,napoli}@loria.fr , prade@irit.fr
Journées d’Intelligence Artificielle Fondamentale
29–30 Juin 2010, Strasbourg
Fusion d’information numériques
Dans de nombreux cas l’information délivrée par des sources
est incertaine, imprécise, et représentée par un intervalle
(opinions, capteurs)
Combiner des informations hétérogènes fournies par
différentes sources
Produire une information synthétique et utilisable dans un
processus de décision
A partir d’un ensemble de sources et leur information pour
une variable donnée, un opérateur de fusion fm produit
cette information synthétique
m1
g1 [1, 5]
g2 [2, 3]
g3 [4, 7]
g4 [6, 10]
De nombreux opérateurs – Bloch et al., IJIS01 – Dubois et Prade, DFP01
2 / 26
Opérateurs de fusion basiques
Opérateur conjonctif
est le pendant de l’intersection ensembliste
part de l’hypothèse que toutes les sources sont fiables
fournit une information plus précise et certaine, mais peut
être vide
fm1
(Im1
) = [1, 5] ∩ [2, 3] ∩ [4, 7] ∩ [6, 10] = ∅
Opérateur disjonctif
est le pendant de l’union ensembliste
part de l’hypothèse qu’au moins une des sources est fiable
fournit une information moins précise et certaine, souvent
considérée comme peu informative
fm1
(Im1
) = [1, 5] ∪ [2, 3] ∪ [4, 7] ∪ [6, 10] = [1, 10]
m1
g1 [1, 5]
g2 [2, 3]
g3 [4, 7]
g4 [6, 10] 3 / 26
Opérateurs compromis : le cas des SMC
Opérateurs compromis
Se situent entre les opérateurs conjonctif et disjonctif
Utilisés lorsque les sources sont partiellement en conflit
L’opérateur basé sur les SMC
Un ensemble d’intervalles est cohérent si leur intersection
est non-vide
Un ensemble cohérent est maximal si aucun sur-ensemble
est cohérent
L’opérateur basé sur les SMC retourne l’union des
ensembles maximaux cohérents
fm1
(Im1
) = [2, 3] ∪ [4, 5] ∪ [6, 7]
m1
g1 [1, 5]
g2 [2, 3]
g3 [4, 7]
g4 [6, 10]
4 / 26
Problème et proposition
Problème de globalité. La fusion des informations de toutes
les sources peut être inutile (trop imprécise ou précise...)
Idée. Considérer des sous-ensembles maximaux de sources
avec leur résultat de fusion. Lesquels ? 2n sous-ensembles
possibles pour n sources différentes !
Proposition. Utiliser l’analyse formelle de concepts pour
organiser les sources suivant leurs résultats de fusion.
Construit un treillis de concepts qui fournit une
classification des sources selon les résultats de fusion par
un opérateur donné
Ordonne des résultats partiels et le résultat global des
méthodes de fusion
Assaghir, Kaytoue, Napoli et Prade, MDAI 2010
5 / 26
Plan
1 Analyse Formelle de Concepts
2 Organiser la fusion d’information
3 Une première application
4 Conclusion
Contexte formel
C’est un triplet (G, M, I)
G est un ensemble d’objets
M est un ensemble de propriétés
I met en relation objets et propriétés :
(g, m) ∈ I signifie que l’objet g possède la propriété m
qui se représente par une table binaire, par exemple
m1 m2 m3
g1 × ×
g2 × ×
g3 × ×
g4 × ×
g5 × × ×
G = {g1, . . . , g5}
M = {m1, m2, m3}
(g1, m3) ∈ I
L’objet g1 possède les attributs m1 et m3.
L’attribut m1 est possédé par g1, g2 et g5.
7 / 26
Connexion de Galois
Deux opérateurs
à un ensemble d’objets A, associe l’ensemble maximal de
propriétés que tous possèdent
A = {m ∈ M | ∀g ∈ A ⊆ G : (g, m) ∈ I}
à un ensemble de propriétés B, associe l’ensemble
maximal des objets qui les possèdent tous
B = {g ∈ G | ∀m ∈ B ⊆ M : (g, m) ∈ I}
(A, B) avec A = B et B = A est un concept formel
A est l’extension du concept et B est son intension.
8 / 26
Illustration
Construction d’un concept : application
des opérateurs
{g1} = {m1, m3}
{m1, m3} = {g1, g5}
{g1, g5} = {m1, m3}
({g1, g5}, {m1, m3}) est un concept formel
Construction du treillis : ordre des
concepts
(A1, B1) ≤ (A2, B2) ⇔ A1 ⊆ A2 (⇔ B2 ⊆ B1)
({g1, g5}, {m1, m3}) ≤ ({g1, g2, g5}, {m1})
m1 m2 m3
g1 × ×
g2 × ×
g3 × ×
g4 × ×
g5 × × ×
Nombreux algorithmes, Kuznetsov & Obiedkov, JETAI02
9 / 26
Cas des données numériques
Discrétisation ou échelonnage conceptuel : compromis
Perte d’information importante / problème des seuils
Sinon calculabilité/interprétation plus complexes
Utiliser les structures de patrons
Extension de l’AFC pour les données complexes
Évite la binarisation des données
Pas de perte d’information
Algorithmes performants
Données numériques
Ganter & Kuznetsov, ICCS01 – Kaytoue et al., IAF09, ICFCA09, RFIA10, FoIKS10
10 / 26
Premiers éléments
11 / 26
Comment ordonner des descriptions d’objets ?
Cas classique
Considérons le treillis des attributs (2M, ⊆). Avec
N, O ∈ 2M, on a
N ⊆ O ⇐⇒ N ∩ O = N
Avec M = {a, b}, on a par exemple
{a} ⊆ {a, b} ⇐⇒ {a} ∩ {a, b} = {a}
Cas de descriptions complexes
s’inspirer du cas classique : ∩ possède les propriétés d’un
infimum dans un demi-treillis.
12 / 26
Structure de patrons
C’est un triplet (G, (D, ), δ)
G est un ensemble d’objets
D est infimum-demi-treillis de descriptions ou patrons
δ est une fonction qui associe à tout objet g ∈ G sa
description δ(g) ∈ D
L’infimum est un opérateur idempotent, commutatif et
associatif qui induit un ordre partiel (D, ) des patrons :
c d ⇐⇒ c d = c ∀c, d ∈ D
Une connexion de Galois entre (2G, ⊆) et (D, ) permet de
construire un treillis de concepts.
Les algorithmes existants et performants de l’AFC classique
peuvent donc être utilisés pour tous types de patrons
Ganter & Kuznetsov, ICCS01
13 / 26
1 Analyse Formelle de Concepts
2 Organiser la fusion d’information
3 Une première application
4 Conclusion
Opérateurs de fusion comme un infimum
Espace de fusion Dm. Composé des informations fournies par
les sources pour la variable m, et de tous leurs résultats de
fusion suivant un opérateur de fusion fm.
Si fm est idempotent, commutatif, et associatif alors c’est un
infimum qui induit un ordre partiel (Dm, fm)
Exemple
Soit fm1
l’opérateur conjonctif
Dm1
= {[1, 5], [4, 7], [6, 10], [2, 3], [4, 5], [6, 7], ∅}
(Dm1
, fm1
) est un inf.demi-treillis
ce qui équivaut à (Dm1
, ⊆)
m1
g1 [1, 5]
g2 [2, 3]
g3 [4, 7]
g4 [6, 10]
15 / 26
Construction du treillis de concepts
(G, (Dm1
, fm1
), δ) est une structure de patrons
G est ensemble de source
(Dm1
, fm1
) est un espace de fusion ordonné
δ associe à chaque source son information
Correspondance de Galois entre (2G, ⊆) et (Dm1
, fm1
)
Premier opérateur : retourne la fusion des informations
associées aux sources en argument
{g1, g2} = fm1
([1, 5], [2, 3]) = [2, 3]
Second opérateur : donne l’ensemble d’objets maximal
dont la fusion est représentée par son argument
[2, 3] = {g ∈ G | [2, 3] ⊆ δ(g)} = {g1, g2}
({g1, g2}, [2, 3]) est un concept formel
16 / 26
Treillis de concepts et interprétation
Soit un concept (A, d), par exemple, ({g1, g2}, [2, 3])
Son intension d fournit le résultat de fusion des objets de
son extension A, l’origine de l’information fusionnée
A est maximal, i.e. tout ajout d’un objet dans A change d
La cardinalité de l’extension donne le nombre de sources
supportant le résultat de fusion
le concept donne le résultat de fusion global
classiquement calculé
L’ordre des concepts suit celui de la précision
17 / 26
Le cas de l’opérateur basé sur les SMC
N’est pas un opérateur associatif et n’induit pas d’ordre
fm1
(fm1
([1, 5], [2, 3]), [4, 7]) = [2, 3] ∪ [4, 7]
fm1
(fm1
([1, 5], [4, 7]), [2, 3]) = [4, 5] ∪ [2, 3]
Mais il retourne une disjonction de SMC
Chercher les SMC
Utiliser l’opérateur de fusion disjonctif
m1
(g1, g2) [2, 3]
(g1, g3) [4, 5]
(g3, g4) [6, 7]
18 / 26
Considérer plusieurs variables
Structure de patrons (G, (D, ), δ)
L’information de g1 est δ(g1) = [1, 5], [1, 9]
Chaque variable est indépendante
Un opérateur de fusion par dimension du vecteur
Induit un ordre partiel de vecteurs (D, )
{g1, g2} = [1, 5], [1, 9] [2, 3], [1, 3]
= fm1
([1, 5], [2, 3]), fm2
([1, 9], [1, 3])
= [2, 3], [1, 3]
[2, 3], [1, 3] = {g ∈ G | [2, 3], [1, 3] δ(g)}
= {g1, g2}
({g1, g2}, [2, 3], [1, 3] ) est un concept formel
m1 m2
g1 [1, 5] [1, 9]
g2 [2, 3] [1, 3]
g3 [4, 7] [6, 7]
g4 [6, 10] [8, 9]
19 / 26
1 Analyse Formelle de Concepts
2 Organiser la fusion d’information
3 Une première application
4 Conclusion
Évaluation de pratiques agricoles
Est-il dangereux d’appliquer un pesticide à un champ ?
selon divers caractéristiques du pesticide (DT50, koc)
données par divers sources
selon les propriétés du champ (exposition, type, etc.)
Calcul d’un indicateur Igro
Reçoit une valeur synthétique et convexe de chaque
caractéristique ainsi que les propriétés
Retourne un intervalle dans [0, 10]
valeurs < 7 : danger ; valeurs ≥ 7 : pas de danger
autrement, aucune évaluation ne peut être prise
DT50 koc
day L/kg
BUS [2,74]
PM11 [15,72]
PM12 [44,940]
PM13 [44,940]
INRA [1.08,8.98]
Com98 [2,6] [17,160]
AGXf [2,6] [1.08,160]
AGXl [15,74] [1.08,160]
21 / 26
Évaluation de pratiques agricoles
Premier travail, Assaghir et al., EUSFLAT 2009
Opérateur fondé sur les SMC : convexification du résultat
global, et Igro retourne un intervalle qui ne permet pas
d’évaluer la pratique
DT50 koc
day L/kg
BUS [2,74]
PM11 [15,72]
PM12 [44,940]
PM13 [44,940]
INRA [1.08,8.98]
Com98 [2,6] [17,160]
AGXf [2,6] [1.08,160]
AGXl [15,74] [1.08,160]
22 / 26
Application
DT50 koc
day L/kg
BUS [2,74]
PM11 [15,72]
PM12 [44,940]
PM13 [44,940]
INRA [1.08,8.98]
Com98 [2,6] [17,160]
AGXf [2,6] [1.08,160]
AGXl [15,74] [1.08,160]
DT50 (days) koc (L/kg)
K1 [2,6] ∅
K2 [15,72] ∅
K3 ∅ [1.08,8.98]
K4 ∅ [44,160]
23 / 26
1 Analyse Formelle de Concepts
2 Organiser la fusion d’information
3 Une première application
4 Conclusion
Conclusion
En résumé
Organiser des résultats de fusion au sein d’un treillis de
concepts
Identifier des résultats partiels et le résultat global
Les ordonner selon leur précision et leur origine
Considérer des opérateurs disjonctif, conjonctif, SMC
Considérer une ou plusieurs variables
Passer à l’échelle grâce aux structures de patrons
Perspectives
Étude systématique d’autres opérateurs de fusion existants
Extension aux intervalles flous
Appliquer aux données symboliques.
Assaghir, Kaytoue, Prade – SUM 2010
25 / 26
Références
Z. Assaghir, M. Kaytoue, A. Napoli et H. Prade. Managing Information Fusion with Formal Concept Analysis.
In Modelling Decision in Artificial Intelligence (MDAI), LNCS/LNAI, Springer, 2010.
Z. Assaghir, M. Kaytoue, et H. Prade. A possibility theory-oriented discussion of conceptual pattern
structures In Scalable Uncertainty Management (SUM), LNCS, Springer, 2010.
Z. Assaghir et P. Girardin et A. Napoli Fuzzy Logic Approach to Represent and Propagate Imprecision in
Agri-Environmental Indicator Assessment In IFSA/EUSFLAT, 2009.
B. Ganter et R. Wille. Formal Concept Analysis. Mathematical Foundations, Springer, 1999.
B. Ganter et S. O. Kuznetsov. Pattern Structures and Their Projections. In International Conference on
Conceptual Structures, LNCS (2120), Springer, 2001
M. Kaytoue, S. Duplessis, S. O. Kuznetsov, et A. Napoli. Two FCA-Based Methods for Mining Gene
Expression Data. In Formal Concept Analysis (ICFCA), LNCS (5548), Springer, pages 251–266, 2009.
M. Kaytoue et A. Napoli. Classification de données numériques par treillis de concepts et structures de
patrons. Journées Nationales de l’Intelligence Artificielle Fondamentale (IAF), 2010
M. Kaytoue, Z. Assaghir, N. Messai, et A. Napoli. Two Complementary Classification Methods for Designing
a Concept Lattice from Interval Data. In Foundations of Information and Knowledge Systems (FoIKS),
LNCS (5956), Springer, pages 345–362, 2010.
26 / 26

Contenu connexe

Similaire à Organiser la fusion d’information par l’analyse formelle de concepts

Similaire à Organiser la fusion d’information par l’analyse formelle de concepts (6)

Devoirs Algorithme + correction pour 4 si
Devoirs Algorithme + correction pour 4 siDevoirs Algorithme + correction pour 4 si
Devoirs Algorithme + correction pour 4 si
 
Poster PFE_MATURATION DE CONCEPTS DE STRUCTURES AÉRONAUTIQUES ISSUS D’OPTIMIS...
Poster PFE_MATURATION DE CONCEPTS DE STRUCTURES AÉRONAUTIQUES ISSUS D’OPTIMIS...Poster PFE_MATURATION DE CONCEPTS DE STRUCTURES AÉRONAUTIQUES ISSUS D’OPTIMIS...
Poster PFE_MATURATION DE CONCEPTS DE STRUCTURES AÉRONAUTIQUES ISSUS D’OPTIMIS...
 
Theme2
Theme2Theme2
Theme2
 
ENSEIRB - Stage 3A @IIT Chicago
ENSEIRB - Stage 3A @IIT ChicagoENSEIRB - Stage 3A @IIT Chicago
ENSEIRB - Stage 3A @IIT Chicago
 
Presentation of SOMbrero
Presentation of SOMbreroPresentation of SOMbrero
Presentation of SOMbrero
 
EUSIPCO_2017__10349172xthsfvtvhmwx_.pdf
EUSIPCO_2017__10349172xthsfvtvhmwx_.pdfEUSIPCO_2017__10349172xthsfvtvhmwx_.pdf
EUSIPCO_2017__10349172xthsfvtvhmwx_.pdf
 

Plus de INSA Lyon - L'Institut National des Sciences Appliquées de Lyon

Watch me playing, I am a professional. A first study on video game live strea...
Watch me playing, I am a professional. A first study on video game live strea...Watch me playing, I am a professional. A first study on video game live strea...
Watch me playing, I am a professional. A first study on video game live strea...
INSA Lyon - L'Institut National des Sciences Appliquées de Lyon
 

Plus de INSA Lyon - L'Institut National des Sciences Appliquées de Lyon (8)

Triggering patterns of topology changes in dynamic attributed graphs
Triggering patterns of topology changes in dynamic attributed graphsTriggering patterns of topology changes in dynamic attributed graphs
Triggering patterns of topology changes in dynamic attributed graphs
 
Olfamining: caractériserisation des qualités d'odeurs
Olfamining: caractériserisation des qualités d'odeursOlfamining: caractériserisation des qualités d'odeurs
Olfamining: caractériserisation des qualités d'odeurs
 
Discovering openings and their balance in competitive RTS gaming. An approach...
Discovering openings and their balance in competitive RTS gaming. An approach...Discovering openings and their balance in competitive RTS gaming. An approach...
Discovering openings and their balance in competitive RTS gaming. An approach...
 
Extracting biclusters of similar values with Triadic Concept Analysis
Extracting biclusters of similar values with Triadic Concept AnalysisExtracting biclusters of similar values with Triadic Concept Analysis
Extracting biclusters of similar values with Triadic Concept Analysis
 
Characterizing and mining numerical patterns, an FCA point of view
Characterizing and mining numerical patterns, an FCA point of viewCharacterizing and mining numerical patterns, an FCA point of view
Characterizing and mining numerical patterns, an FCA point of view
 
On the Mining of Numerical Data with Formal Concept Analysis
On the Mining of Numerical Data with Formal Concept AnalysisOn the Mining of Numerical Data with Formal Concept Analysis
On the Mining of Numerical Data with Formal Concept Analysis
 
Watch me playing, I am a professional. A first study on video game live strea...
Watch me playing, I am a professional. A first study on video game live strea...Watch me playing, I am a professional. A first study on video game live strea...
Watch me playing, I am a professional. A first study on video game live strea...
 
Interval Pattern Structures: An introdution
Interval Pattern Structures: An introdutionInterval Pattern Structures: An introdution
Interval Pattern Structures: An introdution
 

Dernier

L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
Faga1939
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 

Dernier (13)

gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 

Organiser la fusion d’information par l’analyse formelle de concepts

  • 1. Organiser la fusion d’information par l’analyse formelle de concepts Z. Assaghir, M. Kaytoue, A. Napoli et H. Prade {assaghiz,kaytouem,napoli}@loria.fr , prade@irit.fr Journées d’Intelligence Artificielle Fondamentale 29–30 Juin 2010, Strasbourg
  • 2. Fusion d’information numériques Dans de nombreux cas l’information délivrée par des sources est incertaine, imprécise, et représentée par un intervalle (opinions, capteurs) Combiner des informations hétérogènes fournies par différentes sources Produire une information synthétique et utilisable dans un processus de décision A partir d’un ensemble de sources et leur information pour une variable donnée, un opérateur de fusion fm produit cette information synthétique m1 g1 [1, 5] g2 [2, 3] g3 [4, 7] g4 [6, 10] De nombreux opérateurs – Bloch et al., IJIS01 – Dubois et Prade, DFP01 2 / 26
  • 3. Opérateurs de fusion basiques Opérateur conjonctif est le pendant de l’intersection ensembliste part de l’hypothèse que toutes les sources sont fiables fournit une information plus précise et certaine, mais peut être vide fm1 (Im1 ) = [1, 5] ∩ [2, 3] ∩ [4, 7] ∩ [6, 10] = ∅ Opérateur disjonctif est le pendant de l’union ensembliste part de l’hypothèse qu’au moins une des sources est fiable fournit une information moins précise et certaine, souvent considérée comme peu informative fm1 (Im1 ) = [1, 5] ∪ [2, 3] ∪ [4, 7] ∪ [6, 10] = [1, 10] m1 g1 [1, 5] g2 [2, 3] g3 [4, 7] g4 [6, 10] 3 / 26
  • 4. Opérateurs compromis : le cas des SMC Opérateurs compromis Se situent entre les opérateurs conjonctif et disjonctif Utilisés lorsque les sources sont partiellement en conflit L’opérateur basé sur les SMC Un ensemble d’intervalles est cohérent si leur intersection est non-vide Un ensemble cohérent est maximal si aucun sur-ensemble est cohérent L’opérateur basé sur les SMC retourne l’union des ensembles maximaux cohérents fm1 (Im1 ) = [2, 3] ∪ [4, 5] ∪ [6, 7] m1 g1 [1, 5] g2 [2, 3] g3 [4, 7] g4 [6, 10] 4 / 26
  • 5. Problème et proposition Problème de globalité. La fusion des informations de toutes les sources peut être inutile (trop imprécise ou précise...) Idée. Considérer des sous-ensembles maximaux de sources avec leur résultat de fusion. Lesquels ? 2n sous-ensembles possibles pour n sources différentes ! Proposition. Utiliser l’analyse formelle de concepts pour organiser les sources suivant leurs résultats de fusion. Construit un treillis de concepts qui fournit une classification des sources selon les résultats de fusion par un opérateur donné Ordonne des résultats partiels et le résultat global des méthodes de fusion Assaghir, Kaytoue, Napoli et Prade, MDAI 2010 5 / 26
  • 6. Plan 1 Analyse Formelle de Concepts 2 Organiser la fusion d’information 3 Une première application 4 Conclusion
  • 7. Contexte formel C’est un triplet (G, M, I) G est un ensemble d’objets M est un ensemble de propriétés I met en relation objets et propriétés : (g, m) ∈ I signifie que l’objet g possède la propriété m qui se représente par une table binaire, par exemple m1 m2 m3 g1 × × g2 × × g3 × × g4 × × g5 × × × G = {g1, . . . , g5} M = {m1, m2, m3} (g1, m3) ∈ I L’objet g1 possède les attributs m1 et m3. L’attribut m1 est possédé par g1, g2 et g5. 7 / 26
  • 8. Connexion de Galois Deux opérateurs à un ensemble d’objets A, associe l’ensemble maximal de propriétés que tous possèdent A = {m ∈ M | ∀g ∈ A ⊆ G : (g, m) ∈ I} à un ensemble de propriétés B, associe l’ensemble maximal des objets qui les possèdent tous B = {g ∈ G | ∀m ∈ B ⊆ M : (g, m) ∈ I} (A, B) avec A = B et B = A est un concept formel A est l’extension du concept et B est son intension. 8 / 26
  • 9. Illustration Construction d’un concept : application des opérateurs {g1} = {m1, m3} {m1, m3} = {g1, g5} {g1, g5} = {m1, m3} ({g1, g5}, {m1, m3}) est un concept formel Construction du treillis : ordre des concepts (A1, B1) ≤ (A2, B2) ⇔ A1 ⊆ A2 (⇔ B2 ⊆ B1) ({g1, g5}, {m1, m3}) ≤ ({g1, g2, g5}, {m1}) m1 m2 m3 g1 × × g2 × × g3 × × g4 × × g5 × × × Nombreux algorithmes, Kuznetsov & Obiedkov, JETAI02 9 / 26
  • 10. Cas des données numériques Discrétisation ou échelonnage conceptuel : compromis Perte d’information importante / problème des seuils Sinon calculabilité/interprétation plus complexes Utiliser les structures de patrons Extension de l’AFC pour les données complexes Évite la binarisation des données Pas de perte d’information Algorithmes performants Données numériques Ganter & Kuznetsov, ICCS01 – Kaytoue et al., IAF09, ICFCA09, RFIA10, FoIKS10 10 / 26
  • 12. Comment ordonner des descriptions d’objets ? Cas classique Considérons le treillis des attributs (2M, ⊆). Avec N, O ∈ 2M, on a N ⊆ O ⇐⇒ N ∩ O = N Avec M = {a, b}, on a par exemple {a} ⊆ {a, b} ⇐⇒ {a} ∩ {a, b} = {a} Cas de descriptions complexes s’inspirer du cas classique : ∩ possède les propriétés d’un infimum dans un demi-treillis. 12 / 26
  • 13. Structure de patrons C’est un triplet (G, (D, ), δ) G est un ensemble d’objets D est infimum-demi-treillis de descriptions ou patrons δ est une fonction qui associe à tout objet g ∈ G sa description δ(g) ∈ D L’infimum est un opérateur idempotent, commutatif et associatif qui induit un ordre partiel (D, ) des patrons : c d ⇐⇒ c d = c ∀c, d ∈ D Une connexion de Galois entre (2G, ⊆) et (D, ) permet de construire un treillis de concepts. Les algorithmes existants et performants de l’AFC classique peuvent donc être utilisés pour tous types de patrons Ganter & Kuznetsov, ICCS01 13 / 26
  • 14. 1 Analyse Formelle de Concepts 2 Organiser la fusion d’information 3 Une première application 4 Conclusion
  • 15. Opérateurs de fusion comme un infimum Espace de fusion Dm. Composé des informations fournies par les sources pour la variable m, et de tous leurs résultats de fusion suivant un opérateur de fusion fm. Si fm est idempotent, commutatif, et associatif alors c’est un infimum qui induit un ordre partiel (Dm, fm) Exemple Soit fm1 l’opérateur conjonctif Dm1 = {[1, 5], [4, 7], [6, 10], [2, 3], [4, 5], [6, 7], ∅} (Dm1 , fm1 ) est un inf.demi-treillis ce qui équivaut à (Dm1 , ⊆) m1 g1 [1, 5] g2 [2, 3] g3 [4, 7] g4 [6, 10] 15 / 26
  • 16. Construction du treillis de concepts (G, (Dm1 , fm1 ), δ) est une structure de patrons G est ensemble de source (Dm1 , fm1 ) est un espace de fusion ordonné δ associe à chaque source son information Correspondance de Galois entre (2G, ⊆) et (Dm1 , fm1 ) Premier opérateur : retourne la fusion des informations associées aux sources en argument {g1, g2} = fm1 ([1, 5], [2, 3]) = [2, 3] Second opérateur : donne l’ensemble d’objets maximal dont la fusion est représentée par son argument [2, 3] = {g ∈ G | [2, 3] ⊆ δ(g)} = {g1, g2} ({g1, g2}, [2, 3]) est un concept formel 16 / 26
  • 17. Treillis de concepts et interprétation Soit un concept (A, d), par exemple, ({g1, g2}, [2, 3]) Son intension d fournit le résultat de fusion des objets de son extension A, l’origine de l’information fusionnée A est maximal, i.e. tout ajout d’un objet dans A change d La cardinalité de l’extension donne le nombre de sources supportant le résultat de fusion le concept donne le résultat de fusion global classiquement calculé L’ordre des concepts suit celui de la précision 17 / 26
  • 18. Le cas de l’opérateur basé sur les SMC N’est pas un opérateur associatif et n’induit pas d’ordre fm1 (fm1 ([1, 5], [2, 3]), [4, 7]) = [2, 3] ∪ [4, 7] fm1 (fm1 ([1, 5], [4, 7]), [2, 3]) = [4, 5] ∪ [2, 3] Mais il retourne une disjonction de SMC Chercher les SMC Utiliser l’opérateur de fusion disjonctif m1 (g1, g2) [2, 3] (g1, g3) [4, 5] (g3, g4) [6, 7] 18 / 26
  • 19. Considérer plusieurs variables Structure de patrons (G, (D, ), δ) L’information de g1 est δ(g1) = [1, 5], [1, 9] Chaque variable est indépendante Un opérateur de fusion par dimension du vecteur Induit un ordre partiel de vecteurs (D, ) {g1, g2} = [1, 5], [1, 9] [2, 3], [1, 3] = fm1 ([1, 5], [2, 3]), fm2 ([1, 9], [1, 3]) = [2, 3], [1, 3] [2, 3], [1, 3] = {g ∈ G | [2, 3], [1, 3] δ(g)} = {g1, g2} ({g1, g2}, [2, 3], [1, 3] ) est un concept formel m1 m2 g1 [1, 5] [1, 9] g2 [2, 3] [1, 3] g3 [4, 7] [6, 7] g4 [6, 10] [8, 9] 19 / 26
  • 20. 1 Analyse Formelle de Concepts 2 Organiser la fusion d’information 3 Une première application 4 Conclusion
  • 21. Évaluation de pratiques agricoles Est-il dangereux d’appliquer un pesticide à un champ ? selon divers caractéristiques du pesticide (DT50, koc) données par divers sources selon les propriétés du champ (exposition, type, etc.) Calcul d’un indicateur Igro Reçoit une valeur synthétique et convexe de chaque caractéristique ainsi que les propriétés Retourne un intervalle dans [0, 10] valeurs < 7 : danger ; valeurs ≥ 7 : pas de danger autrement, aucune évaluation ne peut être prise DT50 koc day L/kg BUS [2,74] PM11 [15,72] PM12 [44,940] PM13 [44,940] INRA [1.08,8.98] Com98 [2,6] [17,160] AGXf [2,6] [1.08,160] AGXl [15,74] [1.08,160] 21 / 26
  • 22. Évaluation de pratiques agricoles Premier travail, Assaghir et al., EUSFLAT 2009 Opérateur fondé sur les SMC : convexification du résultat global, et Igro retourne un intervalle qui ne permet pas d’évaluer la pratique DT50 koc day L/kg BUS [2,74] PM11 [15,72] PM12 [44,940] PM13 [44,940] INRA [1.08,8.98] Com98 [2,6] [17,160] AGXf [2,6] [1.08,160] AGXl [15,74] [1.08,160] 22 / 26
  • 23. Application DT50 koc day L/kg BUS [2,74] PM11 [15,72] PM12 [44,940] PM13 [44,940] INRA [1.08,8.98] Com98 [2,6] [17,160] AGXf [2,6] [1.08,160] AGXl [15,74] [1.08,160] DT50 (days) koc (L/kg) K1 [2,6] ∅ K2 [15,72] ∅ K3 ∅ [1.08,8.98] K4 ∅ [44,160] 23 / 26
  • 24. 1 Analyse Formelle de Concepts 2 Organiser la fusion d’information 3 Une première application 4 Conclusion
  • 25. Conclusion En résumé Organiser des résultats de fusion au sein d’un treillis de concepts Identifier des résultats partiels et le résultat global Les ordonner selon leur précision et leur origine Considérer des opérateurs disjonctif, conjonctif, SMC Considérer une ou plusieurs variables Passer à l’échelle grâce aux structures de patrons Perspectives Étude systématique d’autres opérateurs de fusion existants Extension aux intervalles flous Appliquer aux données symboliques. Assaghir, Kaytoue, Prade – SUM 2010 25 / 26
  • 26. Références Z. Assaghir, M. Kaytoue, A. Napoli et H. Prade. Managing Information Fusion with Formal Concept Analysis. In Modelling Decision in Artificial Intelligence (MDAI), LNCS/LNAI, Springer, 2010. Z. Assaghir, M. Kaytoue, et H. Prade. A possibility theory-oriented discussion of conceptual pattern structures In Scalable Uncertainty Management (SUM), LNCS, Springer, 2010. Z. Assaghir et P. Girardin et A. Napoli Fuzzy Logic Approach to Represent and Propagate Imprecision in Agri-Environmental Indicator Assessment In IFSA/EUSFLAT, 2009. B. Ganter et R. Wille. Formal Concept Analysis. Mathematical Foundations, Springer, 1999. B. Ganter et S. O. Kuznetsov. Pattern Structures and Their Projections. In International Conference on Conceptual Structures, LNCS (2120), Springer, 2001 M. Kaytoue, S. Duplessis, S. O. Kuznetsov, et A. Napoli. Two FCA-Based Methods for Mining Gene Expression Data. In Formal Concept Analysis (ICFCA), LNCS (5548), Springer, pages 251–266, 2009. M. Kaytoue et A. Napoli. Classification de données numériques par treillis de concepts et structures de patrons. Journées Nationales de l’Intelligence Artificielle Fondamentale (IAF), 2010 M. Kaytoue, Z. Assaghir, N. Messai, et A. Napoli. Two Complementary Classification Methods for Designing a Concept Lattice from Interval Data. In Foundations of Information and Knowledge Systems (FoIKS), LNCS (5956), Springer, pages 345–362, 2010. 26 / 26