SlideShare une entreprise Scribd logo
Les arbres de décisions
Realisé par : Chaabene Mariem
Encadré par : Mourad Tissaoui
11
Le plan
• Introduction
• Origines
• Définition
• Comment dessiner un arbre de décision ?
• Les avantages
• Inconvénients
• Qu’est-ce que sont les arbres de classification et les arbres de régression ?
• Arbres de classification et Arbres de classification et algorithme CART
• Le pré-élagage
• Le post-élagage
• conclusion
•
•
•
•
•
22
Introduction
Depuis déjà quelques années, la Business Intelligence
occupe une place de choix dans la liste des priorités des
entreprises.
Les techniques et les méthodes d'analyse des données de
l'entreprise améliorent la prise de décision. Et dans ce
contexte on site : Les incontournables arbre de décision,
les Arbre de décision, outil d'analyse de la Business
Intelligence
3
Origines
• Ces méthodes ont pris essentiellement leur essor dans le
cadre des approches d'apprentissage automatique
(machine learning) en Intelligence Artificielle.
• Particularités (de l'I.A. en général): met l'accent sur sur la
convivialité et l'intelligibilité (ou la lisibilité) des résultats =>
en classification supervisée: sortie de résultats sous la
forme de règles logiques de classification: "SI tel ensemble
de conditions sur telles variables est satis fait ALORS le cas
appartient à telle classe".
=> résultats plus facilement interprétables et donc exploitables
=> communication plus aisée avec les spécialistes du
domaine traité.
44
• Ex d'algorithme: ID3 (Inductive Decision Tree) et son
successeur C4.5, CART (Classification and Regression
Tree), CHAID (Chi-Square Automatic Interaction
Detection), QUEST (Quick, Unbiased, Efficient Statistical
Trees).
5
6
Définition
• Un arbre de décision est un schéma représentant les
résultats possibles d'une série de choix interconnectés.
• Il permet à une personne ou une organisation d'évaluer
différentes actions possibles en fonction de leur coût,
leur probabilité et leurs bénéfices.
• Il peut être utilisé pour alimenter une discussion informelle
ou pour générer un algorithme qui détermine le meilleur
choix de façon mathématique.
77
Définition
• Un arbre de décision commence généralement par un
nœud d'où découlent plusieurs résultats possibles.
Chacun de ces résultats mène à d'autres nœuds, d'où
émanent d'autres possibilités.
88
Comment dessiner un arbre de décision ?
Les noeuds
• Il existe trois types de nœuds différents : des nœuds de
hasard, des nœuds de décision et des nœuds terminaux.
• Un nœud de hasard: représenté par un cercle, montre les
probabilités de certains résultats.
• Un nœud de décision: représenté par un carré, illustre une
décision à prendre,
• un nœud terminal: le résultat final d'un chemin de décision
99
1010
• Les arbres de décision peuvent aussi être dessinés avec
des symboles d’organigramme .
• Certaines personnes jugent que ce procédé génère des
schémas plus simples à lire et à comprendre.
•
1111
1212
Comment dessiner un arbre de décision ?
• Pour dessiner un arbre de décision, choisissez d'abord un
support. Vous pouvez le dessiner à main levée sur du
papier ou sur un tableau blanc, ou vous pouvez utiliser
un logiciel d'arbres de décision spécialisé.
• Exemple : Sipina ,Edraw
•
1313
L'interface de l’outil Edraw
14
Dans tous les cas, voici les étapes à
suivre :• Commencez par la décision principal Dessinez une
petite boîte pour la représenter, puis dessinez une ligne
partant de la boîte vers la droite pour chaque solution ou
action possible. Étiquetez-les.
•
1515
• Ajoutez des nœuds de hasard et de décision pour
développer l'arborescence comme suit :
• Si une autre décision est nécessaire, dessinez une autre
boîte.
• Si le résultat est incertain, dessinez un cercle (les cercles
représentent les nœuds de hasard).
• Si le problème est résolu, n'ajoutez rien.
1616
1717
• 3. Continuez à développer l'arbre jusqu'à ce que
chaque ligne débouche sur un nœud terminal,
indiquant qu'il n'y a plus de choix à faire ni de résultats
possibles à prendre en considération. Ensuite, assignez
une valeur à chaque résultat possible. Cela peut être un
score abstrait ou une somme d'argent. Ajoutez des
triangles pour signaler les nœuds terminaux.
1818
1919
•
• Une fois l'arbre de décision terminé, vous pouvez
commencer à analyser la décision qui s'impose à vous.
2020
Exemple d'analyse d'un arbre de
décision• En calculant l'utilité ou la valeur attendue de chaque choix
de l'arbre, vous pouvez minimiser les risques et
optimiser les chances de parvenir à un résultat
satisfaisant.
• Pour calculer l'utilité espérée d'un choix, il vous suffit de
soustraire le coût de cette décision des bénéfices
attendus.
• Les bénéfices attendus sont égaux à la valeur totale de
tous les résultats qui pourraient être dus à ce choix,
chaque valeur étant multipliée par la probabilité de
réalisation du choix qui lui est associé. Voici comment
nous calculerions ces valeurs pour l'exemple ci-dessus :
•
2121
2222
• Lors de l'identification du résultat le plus souhaitable, il est
important de prendre en compte les préférences du
décideur.
• Par exemple, certains peuvent préférer des options à
faible risque tandis que d'autres sont prêts à prendre
des risques pour gagner davantage.
•
2323
les Avantages
• La popularité des arbres de décision se justifie par les raisons suivantes :
• Ils sont faciles à comprendre.
• De nouvelles options peuvent être ajoutées aux arbres existants.
• Ils permettent de sélectionner l'option la plus appropriée parmi plusieurs.
• Il est facile de les associer à d'autres outils de prise de décision.
•
2424
Les inconvénients
• L'apprentissage de l'arbre de décision optimal est NP-
complet concernant plusieurs aspects de l'optimalité
• L'apprentissage par arbre de décision peut amener des
arbres de décision très complexes, qui généralisent mal
l'ensemble d'apprentissage (il s'agit du problème
de surapprentissage On utilise des procédures
d'élagage pour contourner ce problème
25
Les inconvénients
• Certains concepts sont difficiles à exprimer à l'aide
d'arbres de décision (comme XOR ou la Parité). Pour
résoudre ce problème, plusieurs moyens existent, tels
que la proportionnalisation, ou l'utilisation d'algorithmes
d'apprentissage utilisant des représentations plus
expressives (par exemple la programmation logique
inductive).
•
26
Critère de segmentation
• Usuellement, les algorithmes pour construire les arbres
de décision sont construits en divisant l'arbre du sommet
vers les feuilles en choisissant à chaque étape une
variable d'entrée qui réalise le meilleur partage de
l'ensemble d'objets, comme décrit précédemment. Pour
choisir la variable de séparation sur un nœud, les
algorithmes testent les différentes variables d'entrée
possibles et sélectionnent celle qui maximise un critère
donné.
2727
Qu’est-ce que sont les arbres de classification,
et les arbres de régression ?
• Les arbres de classification et de régression (parfois
aussi appelés arbres de segmentation ou de décision)
sont des méthodes qui permettent d’obtenir des
modèles à la fois explicatifs et prédictifs.
• Parmi leurs avantages on notera d’une part leur simplicité
du fait de la visualisation sous forme d’arbres, d’autre
part la possibilité d’obtenir des règles en langage
naturel.
28
Les arbres de classification et de
régression
• On distingue notamment deux cas d’utilisation de ces
modèles :
• on utilise les arbres de classification pour expliquer et/ou
prédire l’appartenance d’objets (observations, individus)
à une classe (ou modalité ou catégorie) d’une variable
qualitative, sur la base de variables explicatives
quantitatives et/ou qualitatives.
29
Les arbres de classification et de
régression• Dans le cas des arbres de classification, il s'agit d'un problème
de classification automatique .
• Le critère d’évaluation des partitions caractérise l'homogénéité
(ou le gain en homogénéité) des sous-ensembles obtenus par
division de l'ensemble.
• Ces métriques sont appliquées à chaque sous-ensemble candidat
et les résultats sont combinés (par exemple, moyennés) pour
produire une mesure de la qualité de la séparation
• Il existe un grand nombre de critères de ce type, les plus utilisés
sont l’Entropie de Shanon, le coefficient de GINI et leurs
variantes.
•
30
31
•
•
•
•
• Définition de la régression
• La régression est un ensemble de méthodes statistiques 
très utilisées pour analyser la relation d'une variable par 
rapport à une ou plusieurs autres.
•
• on utilise les arbres de régression pour expliquer et/ou 
prédire les valeurs prise par une variable dépendante 
quantitative, en fonction de variables explicatives 
quantitatives et/ou qualitatives.
•
32
Le pré-élagage
• La première stratégie utilisable pour éviter un 
surapprentissage des arbres de décision consiste à 
proposer des critères d’arrêt lors de la phase 
d’expansion. 
33
Le post-élagage
• La seconde stratégie consiste à construire l’arbre en deux 
temps : on produit d'abord l’arbre dont les feuilles sont le 
plus homogènes possibles dans une phase 
d’expansion, 
• en utilisant une première fraction de l’échantillon de 
données (échantillon d’apprentissage à ne pas 
confondre avec la totalité de l’échantillon, appelé en 
anglais growing set pour lever l'ambiguïté), puis on 
réduit l’arbre, en s’appuyant sur une autre fraction des 
données de manière à optimiser les performances de 
l’arbre, c’est la phase de post-élagage
34
CONCLUSION
• Les arbres de décision sont largement utilisés pour aider 
à faire de bons choix dans de nombreuses disciplines 
différentes, y compris le diagnostic médical, le science 
cognitive, l'intelligence artificielle, la théorie du 
programme, l'ingénierie et l'exploration de données.
35
webographie
• https://www.google.tn/search?q=Un+arbre+de+décision+comm
:
•
3636
37

Contenu connexe

Tendances

Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learningQuentin Ambard
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction généraleMohamed Heny SELMI
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentationDonia Hammami
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-miningSawsen Larbi
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Chapitre v algorithmes gloutons
Chapitre v algorithmes gloutonsChapitre v algorithmes gloutons
Chapitre v algorithmes gloutonsSana Aroussi
 
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfChapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfZizoAziz
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningHakim Nasaoui
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesJaouad Dabounou
 
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdfSYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdfDhiaeddineabdelli
 
Biométrie d'Empreinte Digitale Power Point
Biométrie d'Empreinte Digitale Power PointBiométrie d'Empreinte Digitale Power Point
Biométrie d'Empreinte Digitale Power PointIntissar Dguechi
 
Chapitre 3 NP-complétude
Chapitre 3 NP-complétudeChapitre 3 NP-complétude
Chapitre 3 NP-complétudeSana Aroussi
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdfOuailChoukhairi
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoiresBoris Guarisma
 
Analyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURIAnalyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURIMansouri Khalifa
 
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Adad Med Chérif
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 

Tendances (20)

Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentation
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Les systèmes de recommandations
Les systèmes de recommandationsLes systèmes de recommandations
Les systèmes de recommandations
 
Chapitre v algorithmes gloutons
Chapitre v algorithmes gloutonsChapitre v algorithmes gloutons
Chapitre v algorithmes gloutons
 
Arbre de décision
Arbre de décisionArbre de décision
Arbre de décision
 
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfChapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learning
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des Correspondances
 
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdfSYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
 
Biométrie d'Empreinte Digitale Power Point
Biométrie d'Empreinte Digitale Power PointBiométrie d'Empreinte Digitale Power Point
Biométrie d'Empreinte Digitale Power Point
 
Chapitre 3 NP-complétude
Chapitre 3 NP-complétudeChapitre 3 NP-complétude
Chapitre 3 NP-complétude
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires
 
Analyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURIAnalyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURI
 
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 
Règles d’association
Règles d’associationRègles d’association
Règles d’association
 

Similaire à Les arbres de décisions

diagrame d'affinité.pptx
diagrame d'affinité.pptxdiagrame d'affinité.pptx
diagrame d'affinité.pptxYacineBou1
 
Outils d'aides à la décision multicritere
Outils d'aides à la décision multicritereOutils d'aides à la décision multicritere
Outils d'aides à la décision multicriteremahraznajib
 
Prioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation LabPrioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation LabSylvain Loubradou
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning Novagen Conseil
 
Web-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de ProblèmesWeb-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de ProblèmesXL Groupe
 
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...SanaAkherraz
 
Théorie de la decision
Théorie de la decisionThéorie de la decision
Théorie de la decisionSoufiane MIR
 
Présentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptxPrésentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptxYassineBakhraoui
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])elmahoti
 
Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016Sylvain Loubradou
 
Evaluation de la competence
Evaluation de la competenceEvaluation de la competence
Evaluation de la competencePape Kamara
 
Outils et méthodes de traitement de problèmes
Outils et méthodes de traitement de problèmesOutils et méthodes de traitement de problèmes
Outils et méthodes de traitement de problèmesMouhcine Nahal
 

Similaire à Les arbres de décisions (20)

diagrame d'affinité.pptx
diagrame d'affinité.pptxdiagrame d'affinité.pptx
diagrame d'affinité.pptx
 
WAAUB_DIAPO_2_2.pdf
WAAUB_DIAPO_2_2.pdfWAAUB_DIAPO_2_2.pdf
WAAUB_DIAPO_2_2.pdf
 
Intervenir efficacement
Intervenir efficacementIntervenir efficacement
Intervenir efficacement
 
Outils d'aides à la décision multicritere
Outils d'aides à la décision multicritereOutils d'aides à la décision multicritere
Outils d'aides à la décision multicritere
 
Prioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation LabPrioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation Lab
 
_1_expo_SIAD.pdf
_1_expo_SIAD.pdf_1_expo_SIAD.pdf
_1_expo_SIAD.pdf
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning
 
Web-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de ProblèmesWeb-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de Problèmes
 
Partie1BI-DW2019
Partie1BI-DW2019Partie1BI-DW2019
Partie1BI-DW2019
 
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
 
Théorie de la decision
Théorie de la decisionThéorie de la decision
Théorie de la decision
 
Branch and bound
Branch and boundBranch and bound
Branch and bound
 
Recheche tabou
Recheche tabouRecheche tabou
Recheche tabou
 
Brainstorming
BrainstormingBrainstorming
Brainstorming
 
Présentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptxPrésentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptx
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])
 
Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016
 
test
testtest
test
 
Evaluation de la competence
Evaluation de la competenceEvaluation de la competence
Evaluation de la competence
 
Outils et méthodes de traitement de problèmes
Outils et méthodes de traitement de problèmesOutils et méthodes de traitement de problèmes
Outils et méthodes de traitement de problèmes
 

Plus de Mariem Chaaben

Les intelligences multiples
Les intelligences multiplesLes intelligences multiples
Les intelligences multiplesMariem Chaaben
 
La différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérationsLa différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérationsMariem Chaaben
 
Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-Mariem Chaaben
 
La communication-non-verbale
La communication-non-verbaleLa communication-non-verbale
La communication-non-verbaleMariem Chaaben
 
Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet Mariem Chaaben
 
Processus managerial (1)
Processus managerial (1)Processus managerial (1)
Processus managerial (1)Mariem Chaaben
 
Etude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veilleEtude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veilleMariem Chaaben
 
Cluster imee de sousse
Cluster imee de sousseCluster imee de sousse
Cluster imee de sousseMariem Chaaben
 
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...Mariem Chaaben
 

Plus de Mariem Chaaben (15)

E administration
E administrationE administration
E administration
 
Les intelligences multiples
Les intelligences multiplesLes intelligences multiples
Les intelligences multiples
 
Le GRH
Le GRH Le GRH
Le GRH
 
La différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérationsLa différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérations
 
Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-
 
La communication-non-verbale
La communication-non-verbaleLa communication-non-verbale
La communication-non-verbale
 
Pp1
Pp1Pp1
Pp1
 
Chapitre 13
Chapitre 13Chapitre 13
Chapitre 13
 
Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet
 
Veille technologique
Veille technologiqueVeille technologique
Veille technologique
 
Processus managerial (1)
Processus managerial (1)Processus managerial (1)
Processus managerial (1)
 
Etude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veilleEtude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veille
 
Cluster imee de sousse
Cluster imee de sousseCluster imee de sousse
Cluster imee de sousse
 
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
 
Knowledge management
Knowledge managementKnowledge management
Knowledge management
 

Les arbres de décisions

  • 1. Les arbres de décisions Realisé par : Chaabene Mariem Encadré par : Mourad Tissaoui 11
  • 2. Le plan • Introduction • Origines • Définition • Comment dessiner un arbre de décision ? • Les avantages • Inconvénients • Qu’est-ce que sont les arbres de classification et les arbres de régression ? • Arbres de classification et Arbres de classification et algorithme CART • Le pré-élagage • Le post-élagage • conclusion • • • • • 22
  • 3. Introduction Depuis déjà quelques années, la Business Intelligence occupe une place de choix dans la liste des priorités des entreprises. Les techniques et les méthodes d'analyse des données de l'entreprise améliorent la prise de décision. Et dans ce contexte on site : Les incontournables arbre de décision, les Arbre de décision, outil d'analyse de la Business Intelligence 3
  • 4. Origines • Ces méthodes ont pris essentiellement leur essor dans le cadre des approches d'apprentissage automatique (machine learning) en Intelligence Artificielle. • Particularités (de l'I.A. en général): met l'accent sur sur la convivialité et l'intelligibilité (ou la lisibilité) des résultats => en classification supervisée: sortie de résultats sous la forme de règles logiques de classification: "SI tel ensemble de conditions sur telles variables est satis fait ALORS le cas appartient à telle classe". => résultats plus facilement interprétables et donc exploitables => communication plus aisée avec les spécialistes du domaine traité. 44
  • 5. • Ex d'algorithme: ID3 (Inductive Decision Tree) et son successeur C4.5, CART (Classification and Regression Tree), CHAID (Chi-Square Automatic Interaction Detection), QUEST (Quick, Unbiased, Efficient Statistical Trees). 5
  • 6. 6
  • 7. Définition • Un arbre de décision est un schéma représentant les résultats possibles d'une série de choix interconnectés. • Il permet à une personne ou une organisation d'évaluer différentes actions possibles en fonction de leur coût, leur probabilité et leurs bénéfices. • Il peut être utilisé pour alimenter une discussion informelle ou pour générer un algorithme qui détermine le meilleur choix de façon mathématique. 77
  • 8. Définition • Un arbre de décision commence généralement par un nœud d'où découlent plusieurs résultats possibles. Chacun de ces résultats mène à d'autres nœuds, d'où émanent d'autres possibilités. 88
  • 9. Comment dessiner un arbre de décision ? Les noeuds • Il existe trois types de nœuds différents : des nœuds de hasard, des nœuds de décision et des nœuds terminaux. • Un nœud de hasard: représenté par un cercle, montre les probabilités de certains résultats. • Un nœud de décision: représenté par un carré, illustre une décision à prendre, • un nœud terminal: le résultat final d'un chemin de décision 99
  • 10. 1010
  • 11. • Les arbres de décision peuvent aussi être dessinés avec des symboles d’organigramme . • Certaines personnes jugent que ce procédé génère des schémas plus simples à lire et à comprendre. • 1111
  • 12. 1212
  • 13. Comment dessiner un arbre de décision ? • Pour dessiner un arbre de décision, choisissez d'abord un support. Vous pouvez le dessiner à main levée sur du papier ou sur un tableau blanc, ou vous pouvez utiliser un logiciel d'arbres de décision spécialisé. • Exemple : Sipina ,Edraw • 1313
  • 15. Dans tous les cas, voici les étapes à suivre :• Commencez par la décision principal Dessinez une petite boîte pour la représenter, puis dessinez une ligne partant de la boîte vers la droite pour chaque solution ou action possible. Étiquetez-les. • 1515
  • 16. • Ajoutez des nœuds de hasard et de décision pour développer l'arborescence comme suit : • Si une autre décision est nécessaire, dessinez une autre boîte. • Si le résultat est incertain, dessinez un cercle (les cercles représentent les nœuds de hasard). • Si le problème est résolu, n'ajoutez rien. 1616
  • 17. 1717
  • 18. • 3. Continuez à développer l'arbre jusqu'à ce que chaque ligne débouche sur un nœud terminal, indiquant qu'il n'y a plus de choix à faire ni de résultats possibles à prendre en considération. Ensuite, assignez une valeur à chaque résultat possible. Cela peut être un score abstrait ou une somme d'argent. Ajoutez des triangles pour signaler les nœuds terminaux. 1818
  • 19. 1919
  • 20. • • Une fois l'arbre de décision terminé, vous pouvez commencer à analyser la décision qui s'impose à vous. 2020
  • 21. Exemple d'analyse d'un arbre de décision• En calculant l'utilité ou la valeur attendue de chaque choix de l'arbre, vous pouvez minimiser les risques et optimiser les chances de parvenir à un résultat satisfaisant. • Pour calculer l'utilité espérée d'un choix, il vous suffit de soustraire le coût de cette décision des bénéfices attendus. • Les bénéfices attendus sont égaux à la valeur totale de tous les résultats qui pourraient être dus à ce choix, chaque valeur étant multipliée par la probabilité de réalisation du choix qui lui est associé. Voici comment nous calculerions ces valeurs pour l'exemple ci-dessus : • 2121
  • 22. 2222
  • 23. • Lors de l'identification du résultat le plus souhaitable, il est important de prendre en compte les préférences du décideur. • Par exemple, certains peuvent préférer des options à faible risque tandis que d'autres sont prêts à prendre des risques pour gagner davantage. • 2323
  • 24. les Avantages • La popularité des arbres de décision se justifie par les raisons suivantes : • Ils sont faciles à comprendre. • De nouvelles options peuvent être ajoutées aux arbres existants. • Ils permettent de sélectionner l'option la plus appropriée parmi plusieurs. • Il est facile de les associer à d'autres outils de prise de décision. • 2424
  • 25. Les inconvénients • L'apprentissage de l'arbre de décision optimal est NP- complet concernant plusieurs aspects de l'optimalité • L'apprentissage par arbre de décision peut amener des arbres de décision très complexes, qui généralisent mal l'ensemble d'apprentissage (il s'agit du problème de surapprentissage On utilise des procédures d'élagage pour contourner ce problème 25
  • 26. Les inconvénients • Certains concepts sont difficiles à exprimer à l'aide d'arbres de décision (comme XOR ou la Parité). Pour résoudre ce problème, plusieurs moyens existent, tels que la proportionnalisation, ou l'utilisation d'algorithmes d'apprentissage utilisant des représentations plus expressives (par exemple la programmation logique inductive). • 26
  • 27. Critère de segmentation • Usuellement, les algorithmes pour construire les arbres de décision sont construits en divisant l'arbre du sommet vers les feuilles en choisissant à chaque étape une variable d'entrée qui réalise le meilleur partage de l'ensemble d'objets, comme décrit précédemment. Pour choisir la variable de séparation sur un nœud, les algorithmes testent les différentes variables d'entrée possibles et sélectionnent celle qui maximise un critère donné. 2727
  • 28. Qu’est-ce que sont les arbres de classification, et les arbres de régression ? • Les arbres de classification et de régression (parfois aussi appelés arbres de segmentation ou de décision) sont des méthodes qui permettent d’obtenir des modèles à la fois explicatifs et prédictifs. • Parmi leurs avantages on notera d’une part leur simplicité du fait de la visualisation sous forme d’arbres, d’autre part la possibilité d’obtenir des règles en langage naturel. 28
  • 29. Les arbres de classification et de régression • On distingue notamment deux cas d’utilisation de ces modèles : • on utilise les arbres de classification pour expliquer et/ou prédire l’appartenance d’objets (observations, individus) à une classe (ou modalité ou catégorie) d’une variable qualitative, sur la base de variables explicatives quantitatives et/ou qualitatives. 29
  • 30. Les arbres de classification et de régression• Dans le cas des arbres de classification, il s'agit d'un problème de classification automatique . • Le critère d’évaluation des partitions caractérise l'homogénéité (ou le gain en homogénéité) des sous-ensembles obtenus par division de l'ensemble. • Ces métriques sont appliquées à chaque sous-ensemble candidat et les résultats sont combinés (par exemple, moyennés) pour produire une mesure de la qualité de la séparation • Il existe un grand nombre de critères de ce type, les plus utilisés sont l’Entropie de Shanon, le coefficient de GINI et leurs variantes. • 30
  • 32. • Définition de la régression • La régression est un ensemble de méthodes statistiques  très utilisées pour analyser la relation d'une variable par  rapport à une ou plusieurs autres. • • on utilise les arbres de régression pour expliquer et/ou  prédire les valeurs prise par une variable dépendante  quantitative, en fonction de variables explicatives  quantitatives et/ou qualitatives. • 32
  • 34. Le post-élagage • La seconde stratégie consiste à construire l’arbre en deux  temps : on produit d'abord l’arbre dont les feuilles sont le  plus homogènes possibles dans une phase  d’expansion,  • en utilisant une première fraction de l’échantillon de  données (échantillon d’apprentissage à ne pas  confondre avec la totalité de l’échantillon, appelé en  anglais growing set pour lever l'ambiguïté), puis on  réduit l’arbre, en s’appuyant sur une autre fraction des  données de manière à optimiser les performances de  l’arbre, c’est la phase de post-élagage 34
  • 37. 37

Notes de l'éditeur

  1. réorganiser l'application existante
  2. 76+62=138-75=63