SlideShare une entreprise Scribd logo
Arbres de
décision
Motivation
Pour certains domaines d’application, il est essentiel de produire des
classifications compréhensibles pour l’utilisateur
Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron
multi-couches), l’information est perdue dans les classes
Arbres de décision
Arbres de
décision
Exemple
Décider si un patient est malade ou bien portant selon sa température et s’il a la
gorge irritée
Arbre de décision
2 classes (malade, bien portant)
2 variables (température, gorge irritée)
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Arbres de
décision
Généralités
Arbre de décision :
Algorithme de classification supervisée
Méthode statistique non-paramétrique
Permet de classer un ensemble d’individus décrits par des variables qualitatives
et quantitatives
Produit des classes les plus homogènes possibles
Arbres de
décision
Un peu de vocabulaire
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Noeud terminal ou feuille
Noeud intermediaire ou test
(chaque noeud intermediaire
est defini par un test construit
a partir d’une variable)
Arbres de
décision
Données et notations
Algorithme CART ←→ Algorithme d’apprentissage
Entrées :
n individus
p variables continues ou discrètes
une variable supplémentaire contenant la classe de chaque individu (c classes)
Sortie :
l’arbre de décision T
Arbres de
décision
Données et notations
N (p) = nombre d’individus associés à la position (noeud) p
N (k|p) = nombre d’individus appartenant à la classe k en sachant
qu’ils sont associés à la position p
P (k|p) =
N(k|p)
N(p)
= proportion des individus appartenant à la classe k
parmi ceux de la position p
Remarque :
Un noeud est pur si tous les individus associés appartiennent à la même classe !
Arbres de
décision
Construction de l’algorithme - exemple
But → construire un arbre de décision qui classe et détermine les caractéristiques des
clients qui consultent leurs comptes sur internet
Variables
M : moyenne des montants sur le compte
A : âge du client
R : lieu de résidence du client
E : le client à des études supérieures ?
I : le client consulte ses comptes sur internet ?
Arbres de
décision
Construction de l’algorithme - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
Arbres de
décision
Construction de l’algorithme - exemple
La construction est descendante
Au début tous les individus sont regroupés
Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut
construire un test sur une variable qui permettra de mieux discriminer les
individus ?
Quatre constructions possibles, suivant les variables Montant (M), Age (A),
Résidence (R) et Etudes (E)
Arbres de
décision
Construction de l’algorithme - exemple
1. Construction selon la variable Montant (M)
Client M I
1 moyen oui
2 élevé non
3 faible non
4 faible oui
5 moyen oui
6 élevé non
7 moyen non
8 faible non
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Arbres de
décision
Construction de l’algorithme - exemple
2. Construction selon la variable Age (A)
Client A I
1 moyen oui
2 moyen non
3 âgé non
4 moyen oui
5 jeune oui
6 âgé non
7 âgé non
8 moyen non
(3,5)
Moyen
Age
Jeune Age
(1,0) (2,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
3. Construction selon la variable Résidence (R)
Client R I
1 village oui
2 bourg non
3 bourg non
4 bourg oui
5 ville oui
6 ville non
7 ville non
8 village non
(3,5)
Residence
Ville Bourg Village
(1,2) (1,2) (1,1)
Arbres de
décision
Construction de l’algorithme - exemple
4. Construction selon la variable Etudes (E)
Client E I
1 oui oui
2 non non
3 non non
4 oui oui
5 oui oui
6 oui non
7 oui non
8 non non
(3,5)
Oui Non
Etudes
(3,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,2),(2,1),(0,2)
Age (A) (1,0),(2,2),(0,3)
Résidence (R) (1,2),(1,2),(1,1)
Etudes (E) (3,2),(0,3)
Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce
test !
Sur A, deux noeuds sur trois sont “purs” !
Comment tout écrire mathématiquement ?
Arbres de
décision
Degré de mélangeance
On a besoin de comparer les différents choix possibles
On introduit des fonctions qui permettent de mesurer le degré de mélangeance
dans les différentes classes
Propriétés des fonctions :
Le minimum est atteint lorsque tous les noeuds sont “purs”
Le maximum est atteint lorsque les individus sont équirepartis entre les classes
Arbres de
décision
Degré de mélangeance
Exemples de fonctions
Fonction d’entropie :
Entropie (p) = −
C
k=1
P (k|p) ln P (k|p)
Fonction de Gini :
Gini (p) = 1 −
C
k=1
P2
(k|p) = 2
k<k′
P (k|p) P k′
|p
Arbres de
décision
Degré de mélangeance
p p. . .
p
p
1 2 n
Test t a n modalites
t = le test (la variable)
n = le nombre de modalités
de t
i = la fonction pour mesurer
le degré de mélangeance
On introduit la fonction de gain :
Gain (p, t) = i (p) −
n
j=1
Pj i pj
Pj = la proportion des individus de la position p qui vont en position pj
La position p est fixée !
On cherche le test qui maximise le gain !
Arbres de
décision
Calcul du degré de mélangeance - exemple
Tester sur la variable Montant (M)
On considère le noeud 0 : (3,5)
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Gain (0, M) = i (0) − 3
8
i (1) + 3
8
i (2) + 2
8
i (3)
On choisit i = l’entropie !
Entropie (1) = −
1
3
ln
1
3
−
2
3
ln
2
3
= 0.64
Entropie (2) = −
2
3
ln
2
3
−
1
3
ln
1
3
= 0.64
Entropie (3) = −
2
2
ln
2
2
= 0
Arbres de
décision
Calcul du degré de mélangeance - exemple
On considère le noeud 0 : (3,5)
Variable test Gain
Montant (M) Gain (0, M) = Entropie (0) − 0.48
Age (A) Gain (0, A) = Entropie (0) − 0.35
Résidence (R) Gain (0, R) = Entropie (0) − 0.65
Etudes (E) Gain (0, R) = Entropie (0) − 0.42
Arbres de
décision
Calcul du degré de mélangeance - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
On continue!
(2,2)
(3,5)
Arbres de
décision
Suite de la construction - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
⇓
Client M R E I
1 moyen village oui oui
2 élevé bourg non non
4 faible bourg oui oui
8 faible village non non
Arbres de
décision
Suite de la construction - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,1),(1,0),(0,1)
Résidence (R) (1,1),(1,1)
Etudes (E) (2,0),(0,2)
Calculer le gain pour chaque test ?
Arbres de
décision
Suite de la construction - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
(2,2)
(3,5)
(2,0) (0,2)
Etudes
oui non
OUI NON

Contenu connexe

Tendances

Data Mining
Data MiningData Mining
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
Mariem Chaaben
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
Mohamed Heny SELMI
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression
Mariem Chaaben
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5
Amal Abid
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
sarah Benmerzouk
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
Mohamed Heny SELMI
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
Cynapsys It Hotspot
 
Corrige tp java
Corrige tp javaCorrige tp java
Corrige tp java
Maya Medjdoub
 
Règles d’association
Règles d’associationRègles d’association
Règles d’association
Hassine Hammami
 
Data mining - Associativité
Data mining - AssociativitéData mining - Associativité
Data mining - Associativité
Mohamed Heny SELMI
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
Amal Abid
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
Yassine Badri
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
Ismail CHAIB
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Intelligence Artificielle - Algorithmes de recherche
Intelligence Artificielle - Algorithmes de rechercheIntelligence Artificielle - Algorithmes de recherche
Intelligence Artificielle - Algorithmes de recherche
Mohamed Heny SELMI
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMajid CHADAD
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi
 

Tendances (20)

Data Mining
Data MiningData Mining
Data Mining
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Bi
BiBi
Bi
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
Corrige tp java
Corrige tp javaCorrige tp java
Corrige tp java
 
Règles d’association
Règles d’associationRègles d’association
Règles d’association
 
Data mining - Associativité
Data mining - AssociativitéData mining - Associativité
Data mining - Associativité
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Intelligence Artificielle - Algorithmes de recherche
Intelligence Artificielle - Algorithmes de rechercheIntelligence Artificielle - Algorithmes de recherche
Intelligence Artificielle - Algorithmes de recherche
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigés
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 

En vedette

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)
Pierrick REVOL
 
Rédiger des User Stories
Rédiger des User StoriesRédiger des User Stories
Rédiger des User Stories
Yannick Quenec'hdu
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexité
Sana Aroussi
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshop
aymenli
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintes
Orochi Krizalid
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
Yassine Badri
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décision
ARIJ BenHarrath
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite completChahrawoods Dmz
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercise
Peter Antman
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigéshadhoum
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ?
Thiga
 

En vedette (12)

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)
 
Methodes agile
Methodes agileMethodes agile
Methodes agile
 
Rédiger des User Stories
Rédiger des User StoriesRédiger des User Stories
Rédiger des User Stories
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexité
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshop
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintes
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décision
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercise
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ?
 

Similaire à Arbre de décision

Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
Adad Med Chérif
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
OuailChoukhairi
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
imane26
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 Sigma
XL Formation
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
Adad Med Chérif
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
Jean-Michel POU
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
ibtissam el hassani
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big Data
Jeremy Greze
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringFranck Dernoncourt
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
Jean-Louis ESTRADE
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlibebiznext
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
nesrinetaamallah
 
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptsphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
Mohamed EL KIHEL
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
FootballLovers9
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritère
Groupe ARTICQUE
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Adad Med Chérif
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et FiabiliteRémi Bachelet
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
Jean-Louis ESTRADE
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisions
Jean-Michel POU
 

Similaire à Arbre de décision (20)

Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 Sigma
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big Data
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type Clustering
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlib
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
 
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptsphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritère
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et Fiabilite
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisions
 

Plus de Yassine Badri

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de données
Yassine Badri
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationelles
Yassine Badri
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du merise
Yassine Badri
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de données
Yassine Badri
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
Yassine Badri
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentation
Yassine Badri
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock
Yassine Badri
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php
Yassine Badri
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EE
Yassine Badri
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock
Yassine Badri
 
cours base de données
cours base de donnéescours base de données
cours base de données
Yassine Badri
 
Cours php
Cours php Cours php
Cours php
Yassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
Yassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
Yassine Badri
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]
Yassine Badri
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2
Yassine Badri
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1
Yassine Badri
 
Chap 02 poo en java
Chap 02 poo en javaChap 02 poo en java
Chap 02 poo en java
Yassine Badri
 
Ch 01 poo
Ch 01 pooCh 01 poo
Ch 01 poo
Yassine Badri
 

Plus de Yassine Badri (19)

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de données
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationelles
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du merise
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de données
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentation
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EE
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock
 
cours base de données
cours base de donnéescours base de données
cours base de données
 
Cours php
Cours php Cours php
Cours php
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1
 
Chap 02 poo en java
Chap 02 poo en javaChap 02 poo en java
Chap 02 poo en java
 
Ch 01 poo
Ch 01 pooCh 01 poo
Ch 01 poo
 

Dernier

Mémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et auditMémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et audit
MelDjobo
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Oscar Smith
 
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24Newsletter SPW Agriculture en province du Luxembourg du 03-06-24
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24
BenotGeorges3
 
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
IES Turina/Rodrigo/Itaca/Palomeras
 
Cours SE - Gestion de la mémoire- Cours IG IPSET.pdf
Cours SE - Gestion de la mémoire- Cours IG IPSET.pdfCours SE - Gestion de la mémoire- Cours IG IPSET.pdf
Cours SE - Gestion de la mémoire- Cours IG IPSET.pdf
MedBechir
 
Calendrier du 3 juin 2024 et compte rendu.pdf
Calendrier du 3 juin 2024 et compte rendu.pdfCalendrier du 3 juin 2024 et compte rendu.pdf
Calendrier du 3 juin 2024 et compte rendu.pdf
frizzole
 
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
SYLLABUS DU COURS  MARKETING DTS 1-2.pdfSYLLABUS DU COURS  MARKETING DTS 1-2.pdf
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
Moukagni Evrard
 
Iris et les hommes.pptx
Iris      et         les      hommes.pptxIris      et         les      hommes.pptx
Iris et les hommes.pptx
Txaruka
 
4 expositions à voir à Paris.pptx
4   expositions    à   voir   à Paris.pptx4   expositions    à   voir   à Paris.pptx
4 expositions à voir à Paris.pptx
Txaruka
 
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Formation
 
Projet de fin d'étude licence en sciece.pptx
Projet de fin d'étude licence en sciece.pptxProjet de fin d'étude licence en sciece.pptx
Projet de fin d'étude licence en sciece.pptx
elfangourabdelouahab
 
Contrôle fiscale en république de guinée
Contrôle fiscale en république de guinéeContrôle fiscale en république de guinée
Contrôle fiscale en république de guinée
bangalykaba146
 
Exame DELF - A2 Francês pout tout public
Exame DELF - A2  Francês pout tout publicExame DELF - A2  Francês pout tout public
Exame DELF - A2 Francês pout tout public
GiselaAlves15
 

Dernier (13)

Mémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et auditMémoire de licence en finance comptabilité et audit
Mémoire de licence en finance comptabilité et audit
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
 
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24Newsletter SPW Agriculture en province du Luxembourg du 03-06-24
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24
 
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
Evaluación docentes "Un cielo, dos países: El camino de los descubrimientos"
 
Cours SE - Gestion de la mémoire- Cours IG IPSET.pdf
Cours SE - Gestion de la mémoire- Cours IG IPSET.pdfCours SE - Gestion de la mémoire- Cours IG IPSET.pdf
Cours SE - Gestion de la mémoire- Cours IG IPSET.pdf
 
Calendrier du 3 juin 2024 et compte rendu.pdf
Calendrier du 3 juin 2024 et compte rendu.pdfCalendrier du 3 juin 2024 et compte rendu.pdf
Calendrier du 3 juin 2024 et compte rendu.pdf
 
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
SYLLABUS DU COURS  MARKETING DTS 1-2.pdfSYLLABUS DU COURS  MARKETING DTS 1-2.pdf
SYLLABUS DU COURS MARKETING DTS 1-2.pdf
 
Iris et les hommes.pptx
Iris      et         les      hommes.pptxIris      et         les      hommes.pptx
Iris et les hommes.pptx
 
4 expositions à voir à Paris.pptx
4   expositions    à   voir   à Paris.pptx4   expositions    à   voir   à Paris.pptx
4 expositions à voir à Paris.pptx
 
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
 
Projet de fin d'étude licence en sciece.pptx
Projet de fin d'étude licence en sciece.pptxProjet de fin d'étude licence en sciece.pptx
Projet de fin d'étude licence en sciece.pptx
 
Contrôle fiscale en république de guinée
Contrôle fiscale en république de guinéeContrôle fiscale en république de guinée
Contrôle fiscale en république de guinée
 
Exame DELF - A2 Francês pout tout public
Exame DELF - A2  Francês pout tout publicExame DELF - A2  Francês pout tout public
Exame DELF - A2 Francês pout tout public
 

Arbre de décision

  • 1. Arbres de décision Motivation Pour certains domaines d’application, il est essentiel de produire des classifications compréhensibles pour l’utilisateur Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron multi-couches), l’information est perdue dans les classes Arbres de décision
  • 2. Arbres de décision Exemple Décider si un patient est malade ou bien portant selon sa température et s’il a la gorge irritée Arbre de décision 2 classes (malade, bien portant) 2 variables (température, gorge irritée) malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON
  • 3. Arbres de décision Généralités Arbre de décision : Algorithme de classification supervisée Méthode statistique non-paramétrique Permet de classer un ensemble d’individus décrits par des variables qualitatives et quantitatives Produit des classes les plus homogènes possibles
  • 4. Arbres de décision Un peu de vocabulaire malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON Noeud terminal ou feuille Noeud intermediaire ou test (chaque noeud intermediaire est defini par un test construit a partir d’une variable)
  • 5. Arbres de décision Données et notations Algorithme CART ←→ Algorithme d’apprentissage Entrées : n individus p variables continues ou discrètes une variable supplémentaire contenant la classe de chaque individu (c classes) Sortie : l’arbre de décision T
  • 6. Arbres de décision Données et notations N (p) = nombre d’individus associés à la position (noeud) p N (k|p) = nombre d’individus appartenant à la classe k en sachant qu’ils sont associés à la position p P (k|p) = N(k|p) N(p) = proportion des individus appartenant à la classe k parmi ceux de la position p Remarque : Un noeud est pur si tous les individus associés appartiennent à la même classe !
  • 7. Arbres de décision Construction de l’algorithme - exemple But → construire un arbre de décision qui classe et détermine les caractéristiques des clients qui consultent leurs comptes sur internet Variables M : moyenne des montants sur le compte A : âge du client R : lieu de résidence du client E : le client à des études supérieures ? I : le client consulte ses comptes sur internet ?
  • 8. Arbres de décision Construction de l’algorithme - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non
  • 9. Arbres de décision Construction de l’algorithme - exemple La construction est descendante Au début tous les individus sont regroupés Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut construire un test sur une variable qui permettra de mieux discriminer les individus ? Quatre constructions possibles, suivant les variables Montant (M), Age (A), Résidence (R) et Etudes (E)
  • 10. Arbres de décision Construction de l’algorithme - exemple 1. Construction selon la variable Montant (M) Client M I 1 moyen oui 2 élevé non 3 faible non 4 faible oui 5 moyen oui 6 élevé non 7 moyen non 8 faible non Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen
  • 11. Arbres de décision Construction de l’algorithme - exemple 2. Construction selon la variable Age (A) Client A I 1 moyen oui 2 moyen non 3 âgé non 4 moyen oui 5 jeune oui 6 âgé non 7 âgé non 8 moyen non (3,5) Moyen Age Jeune Age (1,0) (2,2) (0,3)
  • 12. Arbres de décision Construction de l’algorithme - exemple 3. Construction selon la variable Résidence (R) Client R I 1 village oui 2 bourg non 3 bourg non 4 bourg oui 5 ville oui 6 ville non 7 ville non 8 village non (3,5) Residence Ville Bourg Village (1,2) (1,2) (1,1)
  • 13. Arbres de décision Construction de l’algorithme - exemple 4. Construction selon la variable Etudes (E) Client E I 1 oui oui 2 non non 3 non non 4 oui oui 5 oui oui 6 oui non 7 oui non 8 non non (3,5) Oui Non Etudes (3,2) (0,3)
  • 14. Arbres de décision Construction de l’algorithme - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,2),(2,1),(0,2) Age (A) (1,0),(2,2),(0,3) Résidence (R) (1,2),(1,2),(1,1) Etudes (E) (3,2),(0,3) Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce test ! Sur A, deux noeuds sur trois sont “purs” ! Comment tout écrire mathématiquement ?
  • 15. Arbres de décision Degré de mélangeance On a besoin de comparer les différents choix possibles On introduit des fonctions qui permettent de mesurer le degré de mélangeance dans les différentes classes Propriétés des fonctions : Le minimum est atteint lorsque tous les noeuds sont “purs” Le maximum est atteint lorsque les individus sont équirepartis entre les classes
  • 16. Arbres de décision Degré de mélangeance Exemples de fonctions Fonction d’entropie : Entropie (p) = − C k=1 P (k|p) ln P (k|p) Fonction de Gini : Gini (p) = 1 − C k=1 P2 (k|p) = 2 k<k′ P (k|p) P k′ |p
  • 17. Arbres de décision Degré de mélangeance p p. . . p p 1 2 n Test t a n modalites t = le test (la variable) n = le nombre de modalités de t i = la fonction pour mesurer le degré de mélangeance On introduit la fonction de gain : Gain (p, t) = i (p) − n j=1 Pj i pj Pj = la proportion des individus de la position p qui vont en position pj La position p est fixée ! On cherche le test qui maximise le gain !
  • 18. Arbres de décision Calcul du degré de mélangeance - exemple Tester sur la variable Montant (M) On considère le noeud 0 : (3,5) Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen Gain (0, M) = i (0) − 3 8 i (1) + 3 8 i (2) + 2 8 i (3) On choisit i = l’entropie ! Entropie (1) = − 1 3 ln 1 3 − 2 3 ln 2 3 = 0.64 Entropie (2) = − 2 3 ln 2 3 − 1 3 ln 1 3 = 0.64 Entropie (3) = − 2 2 ln 2 2 = 0
  • 19. Arbres de décision Calcul du degré de mélangeance - exemple On considère le noeud 0 : (3,5) Variable test Gain Montant (M) Gain (0, M) = Entropie (0) − 0.48 Age (A) Gain (0, A) = Entropie (0) − 0.35 Résidence (R) Gain (0, R) = Entropie (0) − 0.65 Etudes (E) Gain (0, R) = Entropie (0) − 0.42
  • 20. Arbres de décision Calcul du degré de mélangeance - exemple (1,0) Age jeune moyen age (0,3) OUI NON On continue! (2,2) (3,5)
  • 21. Arbres de décision Suite de la construction - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non ⇓ Client M R E I 1 moyen village oui oui 2 élevé bourg non non 4 faible bourg oui oui 8 faible village non non
  • 22. Arbres de décision Suite de la construction - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,1),(1,0),(0,1) Résidence (R) (1,1),(1,1) Etudes (E) (2,0),(0,2) Calculer le gain pour chaque test ?
  • 23. Arbres de décision Suite de la construction - exemple (1,0) Age jeune moyen age (0,3) OUI NON (2,2) (3,5) (2,0) (0,2) Etudes oui non OUI NON