SlideShare une entreprise Scribd logo
Les arbres de décisions
Realisé par : Chaabene Mariem
Encadré par : Mourad Tissaoui
11
Le plan
• Introduction
• Origines
• Définition
• Comment dessiner un arbre de décision ?
• Les avantages
• Inconvénients
• Qu’est-ce que sont les arbres de classification et les arbres de régression ?
• Arbres de classification et Arbres de classification et algorithme CART
• Le pré-élagage
• Le post-élagage
• conclusion
•
•
•
•
•
22
Introduction
Depuis déjà quelques années, la Business Intelligence
occupe une place de choix dans la liste des priorités des
entreprises.
Les techniques et les méthodes d'analyse des données de
l'entreprise améliorent la prise de décision. Et dans ce
contexte on site : Les incontournables arbre de décision,
les Arbre de décision, outil d'analyse de la Business
Intelligence
3
Origines
• Ces méthodes ont pris essentiellement leur essor dans le
cadre des approches d'apprentissage automatique
(machine learning) en Intelligence Artificielle.
• Particularités (de l'I.A. en général): met l'accent sur sur la
convivialité et l'intelligibilité (ou la lisibilité) des résultats =>
en classification supervisée: sortie de résultats sous la
forme de règles logiques de classification: "SI tel ensemble
de conditions sur telles variables est satis fait ALORS le cas
appartient à telle classe".
=> résultats plus facilement interprétables et donc exploitables
=> communication plus aisée avec les spécialistes du
domaine traité.
44
• Ex d'algorithme: ID3 (Inductive Decision Tree) et son
successeur C4.5, CART (Classification and Regression
Tree), CHAID (Chi-Square Automatic Interaction
Detection), QUEST (Quick, Unbiased, Efficient Statistical
Trees).
5
6
Définition
• Un arbre de décision est un schéma représentant les
résultats possibles d'une série de choix interconnectés.
• Il permet à une personne ou une organisation d'évaluer
différentes actions possibles en fonction de leur coût,
leur probabilité et leurs bénéfices.
• Il peut être utilisé pour alimenter une discussion informelle
ou pour générer un algorithme qui détermine le meilleur
choix de façon mathématique.
77
Définition
• Un arbre de décision commence généralement par un
nœud d'où découlent plusieurs résultats possibles.
Chacun de ces résultats mène à d'autres nœuds, d'où
émanent d'autres possibilités.
88
Comment dessiner un arbre de décision ?
Les noeuds
• Il existe trois types de nœuds différents : des nœuds de
hasard, des nœuds de décision et des nœuds terminaux.
• Un nœud de hasard: représenté par un cercle, montre les
probabilités de certains résultats.
• Un nœud de décision: représenté par un carré, illustre une
décision à prendre,
• un nœud terminal: le résultat final d'un chemin de décision
99
1010
• Les arbres de décision peuvent aussi être dessinés avec
des symboles d’organigramme .
• Certaines personnes jugent que ce procédé génère des
schémas plus simples à lire et à comprendre.
•
1111
1212
Comment dessiner un arbre de décision ?
• Pour dessiner un arbre de décision, choisissez d'abord un
support. Vous pouvez le dessiner à main levée sur du
papier ou sur un tableau blanc, ou vous pouvez utiliser
un logiciel d'arbres de décision spécialisé.
• Exemple : Sipina ,Edraw
•
1313
L'interface de l’outil Edraw
14
Dans tous les cas, voici les étapes à
suivre :• Commencez par la décision principal Dessinez une
petite boîte pour la représenter, puis dessinez une ligne
partant de la boîte vers la droite pour chaque solution ou
action possible. Étiquetez-les.
•
1515
• Ajoutez des nœuds de hasard et de décision pour
développer l'arborescence comme suit :
• Si une autre décision est nécessaire, dessinez une autre
boîte.
• Si le résultat est incertain, dessinez un cercle (les cercles
représentent les nœuds de hasard).
• Si le problème est résolu, n'ajoutez rien.
1616
1717
• 3. Continuez à développer l'arbre jusqu'à ce que
chaque ligne débouche sur un nœud terminal,
indiquant qu'il n'y a plus de choix à faire ni de résultats
possibles à prendre en considération. Ensuite, assignez
une valeur à chaque résultat possible. Cela peut être un
score abstrait ou une somme d'argent. Ajoutez des
triangles pour signaler les nœuds terminaux.
1818
1919
•
• Une fois l'arbre de décision terminé, vous pouvez
commencer à analyser la décision qui s'impose à vous.
2020
Exemple d'analyse d'un arbre de
décision• En calculant l'utilité ou la valeur attendue de chaque choix
de l'arbre, vous pouvez minimiser les risques et
optimiser les chances de parvenir à un résultat
satisfaisant.
• Pour calculer l'utilité espérée d'un choix, il vous suffit de
soustraire le coût de cette décision des bénéfices
attendus.
• Les bénéfices attendus sont égaux à la valeur totale de
tous les résultats qui pourraient être dus à ce choix,
chaque valeur étant multipliée par la probabilité de
réalisation du choix qui lui est associé. Voici comment
nous calculerions ces valeurs pour l'exemple ci-dessus :
•
2121
2222
• Lors de l'identification du résultat le plus souhaitable, il est
important de prendre en compte les préférences du
décideur.
• Par exemple, certains peuvent préférer des options à
faible risque tandis que d'autres sont prêts à prendre
des risques pour gagner davantage.
•
2323
les Avantages
• La popularité des arbres de décision se justifie par les raisons suivantes :
• Ils sont faciles à comprendre.
• De nouvelles options peuvent être ajoutées aux arbres existants.
• Ils permettent de sélectionner l'option la plus appropriée parmi plusieurs.
• Il est facile de les associer à d'autres outils de prise de décision.
•
2424
Les inconvénients
• L'apprentissage de l'arbre de décision optimal est NP-
complet concernant plusieurs aspects de l'optimalité
• L'apprentissage par arbre de décision peut amener des
arbres de décision très complexes, qui généralisent mal
l'ensemble d'apprentissage (il s'agit du problème
de surapprentissage On utilise des procédures
d'élagage pour contourner ce problème
25
Les inconvénients
• Certains concepts sont difficiles à exprimer à l'aide
d'arbres de décision (comme XOR ou la Parité). Pour
résoudre ce problème, plusieurs moyens existent, tels
que la proportionnalisation, ou l'utilisation d'algorithmes
d'apprentissage utilisant des représentations plus
expressives (par exemple la programmation logique
inductive).
•
26
Critère de segmentation
• Usuellement, les algorithmes pour construire les arbres
de décision sont construits en divisant l'arbre du sommet
vers les feuilles en choisissant à chaque étape une
variable d'entrée qui réalise le meilleur partage de
l'ensemble d'objets, comme décrit précédemment. Pour
choisir la variable de séparation sur un nœud, les
algorithmes testent les différentes variables d'entrée
possibles et sélectionnent celle qui maximise un critère
donné.
2727
Qu’est-ce que sont les arbres de classification,
et les arbres de régression ?
• Les arbres de classification et de régression (parfois
aussi appelés arbres de segmentation ou de décision)
sont des méthodes qui permettent d’obtenir des
modèles à la fois explicatifs et prédictifs.
• Parmi leurs avantages on notera d’une part leur simplicité
du fait de la visualisation sous forme d’arbres, d’autre
part la possibilité d’obtenir des règles en langage
naturel.
28
Les arbres de classification et de
régression
• On distingue notamment deux cas d’utilisation de ces
modèles :
• on utilise les arbres de classification pour expliquer et/ou
prédire l’appartenance d’objets (observations, individus)
à une classe (ou modalité ou catégorie) d’une variable
qualitative, sur la base de variables explicatives
quantitatives et/ou qualitatives.
29
Les arbres de classification et de
régression• Dans le cas des arbres de classification, il s'agit d'un problème
de classification automatique .
• Le critère d’évaluation des partitions caractérise l'homogénéité
(ou le gain en homogénéité) des sous-ensembles obtenus par
division de l'ensemble.
• Ces métriques sont appliquées à chaque sous-ensemble candidat
et les résultats sont combinés (par exemple, moyennés) pour
produire une mesure de la qualité de la séparation
• Il existe un grand nombre de critères de ce type, les plus utilisés
sont l’Entropie de Shanon, le coefficient de GINI et leurs
variantes.
•
30
31
•
•
•
•
• Définition de la régression
• La régression est un ensemble de méthodes statistiques 
très utilisées pour analyser la relation d'une variable par 
rapport à une ou plusieurs autres.
•
• on utilise les arbres de régression pour expliquer et/ou 
prédire les valeurs prise par une variable dépendante 
quantitative, en fonction de variables explicatives 
quantitatives et/ou qualitatives.
•
32
Le pré-élagage
• La première stratégie utilisable pour éviter un 
surapprentissage des arbres de décision consiste à 
proposer des critères d’arrêt lors de la phase 
d’expansion. 
33
Le post-élagage
• La seconde stratégie consiste à construire l’arbre en deux 
temps : on produit d'abord l’arbre dont les feuilles sont le 
plus homogènes possibles dans une phase 
d’expansion, 
• en utilisant une première fraction de l’échantillon de 
données (échantillon d’apprentissage à ne pas 
confondre avec la totalité de l’échantillon, appelé en 
anglais growing set pour lever l'ambiguïté), puis on 
réduit l’arbre, en s’appuyant sur une autre fraction des 
données de manière à optimiser les performances de 
l’arbre, c’est la phase de post-élagage
34
CONCLUSION
• Les arbres de décision sont largement utilisés pour aider 
à faire de bons choix dans de nombreuses disciplines 
différentes, y compris le diagnostic médical, le science 
cognitive, l'intelligence artificielle, la théorie du 
programme, l'ingénierie et l'exploration de données.
35
webographie
• https://www.google.tn/search?q=Un+arbre+de+décision+comm
:
•
3636
37

Contenu connexe

Tendances

Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
nesrinetaamallah
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
Mohamed Heny SELMI
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
Mohamed Heny SELMI
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
Donia Hammami
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires
Boris Guarisma
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
Mehdi Aman
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
Quentin Ambard
 
Intelligence artificielle
Intelligence artificielleIntelligence artificielle
Intelligence artificielle
hadjerdermane
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels
Oussama Werfelli
 
Exercice arbre de décision
Exercice arbre de décision Exercice arbre de décision
Exercice arbre de décision
Yassine Badri
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
Mohamed Heny SELMI
 
Chapitre v algorithmes gloutons
Chapitre v algorithmes gloutonsChapitre v algorithmes gloutons
Chapitre v algorithmes gloutonsSana Aroussi
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
sarah Benmerzouk
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning
Niji
 
Intelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielleIntelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielle
ECAM Brussels Engineering School
 
Méthodes agiles vs méthodes classiques
Méthodes agiles vs méthodes classiquesMéthodes agiles vs méthodes classiques
Méthodes agiles vs méthodes classiquesSirine Barguaoui
 
Les systèmes intelligents
Les systèmes intelligentsLes systèmes intelligents
Les systèmes intelligents
Nour El Houda Megherbi
 

Tendances (20)

Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Intelligence artificielle
Intelligence artificielleIntelligence artificielle
Intelligence artificielle
 
Algorithme knn
Algorithme knnAlgorithme knn
Algorithme knn
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels
 
Exercice arbre de décision
Exercice arbre de décision Exercice arbre de décision
Exercice arbre de décision
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Chapitre v algorithmes gloutons
Chapitre v algorithmes gloutonsChapitre v algorithmes gloutons
Chapitre v algorithmes gloutons
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning
 
Intelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielleIntelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielle
 
clustering
clusteringclustering
clustering
 
Méthodes agiles vs méthodes classiques
Méthodes agiles vs méthodes classiquesMéthodes agiles vs méthodes classiques
Méthodes agiles vs méthodes classiques
 
Les systèmes intelligents
Les systèmes intelligentsLes systèmes intelligents
Les systèmes intelligents
 

Similaire à Les arbres de décisions

SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdfSYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
Dhiaeddineabdelli
 
diagrame d'affinité.pptx
diagrame d'affinité.pptxdiagrame d'affinité.pptx
diagrame d'affinité.pptx
YacineBou1
 
Intervenir efficacement
Intervenir efficacementIntervenir efficacement
Intervenir efficacement
Gérard van Klaveren
 
Outils d'aides à la décision multicritere
Outils d'aides à la décision multicritereOutils d'aides à la décision multicritere
Outils d'aides à la décision multicritere
mahraznajib
 
Prioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation LabPrioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation Lab
Sylvain Loubradou
 
_1_expo_SIAD.pdf
_1_expo_SIAD.pdf_1_expo_SIAD.pdf
_1_expo_SIAD.pdf
OuailChoukhairi
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning
Novagen Conseil
 
Web-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de ProblèmesWeb-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de Problèmes
XL Groupe
 
Partie1BI-DW2019
Partie1BI-DW2019Partie1BI-DW2019
Partie1BI-DW2019
Aziz Darouichi
 
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
SanaAkherraz
 
Théorie de la decision
Théorie de la decisionThéorie de la decision
Théorie de la decision
Soufiane MIR
 
Branch and bound
Branch and boundBranch and bound
Branch and bound
TAOUFIQ ELFILALI
 
Recheche tabou
Recheche tabouRecheche tabou
Recheche tabou
Nesrine khelifi
 
Présentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptxPrésentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptx
YassineBakhraoui
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])elmahoti
 
Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016
Sylvain Loubradou
 
test
testtest
test
dehbimoad
 
Evaluation de la competence
Evaluation de la competenceEvaluation de la competence
Evaluation de la competencePape Kamara
 

Similaire à Les arbres de décisions (20)

SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdfSYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
SYSTEMES-INTERACTIFS-D-AIDE-A-LA-DECISION-SIAD-1.pdf
 
diagrame d'affinité.pptx
diagrame d'affinité.pptxdiagrame d'affinité.pptx
diagrame d'affinité.pptx
 
WAAUB_DIAPO_2_2.pdf
WAAUB_DIAPO_2_2.pdfWAAUB_DIAPO_2_2.pdf
WAAUB_DIAPO_2_2.pdf
 
Intervenir efficacement
Intervenir efficacementIntervenir efficacement
Intervenir efficacement
 
Outils d'aides à la décision multicritere
Outils d'aides à la décision multicritereOutils d'aides à la décision multicritere
Outils d'aides à la décision multicritere
 
Prioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation LabPrioriser dans un contexte incertain - Espace Innovation Lab
Prioriser dans un contexte incertain - Espace Innovation Lab
 
_1_expo_SIAD.pdf
_1_expo_SIAD.pdf_1_expo_SIAD.pdf
_1_expo_SIAD.pdf
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning
 
Web-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de ProblèmesWeb-formation | La Méthode de Résolution de Problèmes
Web-formation | La Méthode de Résolution de Problèmes
 
Partie1BI-DW2019
Partie1BI-DW2019Partie1BI-DW2019
Partie1BI-DW2019
 
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
delivered_OutAiD – Part 2-2_C-Les facteurs de succès dun outil d aide à la dé...
 
Théorie de la decision
Théorie de la decisionThéorie de la decision
Théorie de la decision
 
Branch and bound
Branch and boundBranch and bound
Branch and bound
 
Recheche tabou
Recheche tabouRecheche tabou
Recheche tabou
 
Brainstorming
BrainstormingBrainstorming
Brainstorming
 
Présentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptxPrésentation Modèle de la Poubelle.pptx
Présentation Modèle de la Poubelle.pptx
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])
 
Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016Betaleadership - Conférence Una Mai 2016
Betaleadership - Conférence Una Mai 2016
 
test
testtest
test
 
Evaluation de la competence
Evaluation de la competenceEvaluation de la competence
Evaluation de la competence
 

Plus de Mariem Chaaben

E administration
E administrationE administration
E administration
Mariem Chaaben
 
Les intelligences multiples
Les intelligences multiplesLes intelligences multiples
Les intelligences multiples
Mariem Chaaben
 
Le GRH
Le GRH Le GRH
La différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérationsLa différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérations
Mariem Chaaben
 
Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-
Mariem Chaaben
 
La communication-non-verbale
La communication-non-verbaleLa communication-non-verbale
La communication-non-verbale
Mariem Chaaben
 
Pp1
Pp1Pp1
Chapitre 13
Chapitre 13Chapitre 13
Chapitre 13
Mariem Chaaben
 
Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet
Mariem Chaaben
 
Veille technologique
Veille technologiqueVeille technologique
Veille technologique
Mariem Chaaben
 
Processus managerial (1)
Processus managerial (1)Processus managerial (1)
Processus managerial (1)
Mariem Chaaben
 
Etude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veilleEtude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veille
Mariem Chaaben
 
Cluster imee de sousse
Cluster imee de sousseCluster imee de sousse
Cluster imee de sousse
Mariem Chaaben
 
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Mariem Chaaben
 
Knowledge management
Knowledge managementKnowledge management
Knowledge management
Mariem Chaaben
 

Plus de Mariem Chaaben (15)

E administration
E administrationE administration
E administration
 
Les intelligences multiples
Les intelligences multiplesLes intelligences multiples
Les intelligences multiples
 
Le GRH
Le GRH Le GRH
Le GRH
 
La différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérationsLa différence entre le management des opérations et le management des opérations
La différence entre le management des opérations et le management des opérations
 
Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-Article des-equipes-de-travail-efficaces-
Article des-equipes-de-travail-efficaces-
 
La communication-non-verbale
La communication-non-verbaleLa communication-non-verbale
La communication-non-verbale
 
Pp1
Pp1Pp1
Pp1
 
Chapitre 13
Chapitre 13Chapitre 13
Chapitre 13
 
Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet Les nouvelles-techniques-de-la-communication-sur-internet
Les nouvelles-techniques-de-la-communication-sur-internet
 
Veille technologique
Veille technologiqueVeille technologique
Veille technologique
 
Processus managerial (1)
Processus managerial (1)Processus managerial (1)
Processus managerial (1)
 
Etude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veilleEtude de-cas-cellule-de-veille
Etude de-cas-cellule-de-veille
 
Cluster imee de sousse
Cluster imee de sousseCluster imee de sousse
Cluster imee de sousse
 
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
Diagnostic et définition de la stratégie d'un cluster ;Etude de cas du cluste...
 
Knowledge management
Knowledge managementKnowledge management
Knowledge management
 

Dernier

Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdfBarometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Paperjam_redaction
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
contact Elabe
 
Webinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptxWebinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptx
Institut de l'Elevage - Idele
 
Productivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointementProductivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointement
La Fabrique de l'industrie
 
Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
contact Elabe
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
contact Elabe
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
contact Elabe
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
contact Elabe
 
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Institut de l'Elevage - Idele
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
contact Elabe
 

Dernier (10)

Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdfBarometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
 
Webinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptxWebinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptx
 
Productivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointementProductivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointement
 
Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
 
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
 

Les arbres de décisions

  • 1. Les arbres de décisions Realisé par : Chaabene Mariem Encadré par : Mourad Tissaoui 11
  • 2. Le plan • Introduction • Origines • Définition • Comment dessiner un arbre de décision ? • Les avantages • Inconvénients • Qu’est-ce que sont les arbres de classification et les arbres de régression ? • Arbres de classification et Arbres de classification et algorithme CART • Le pré-élagage • Le post-élagage • conclusion • • • • • 22
  • 3. Introduction Depuis déjà quelques années, la Business Intelligence occupe une place de choix dans la liste des priorités des entreprises. Les techniques et les méthodes d'analyse des données de l'entreprise améliorent la prise de décision. Et dans ce contexte on site : Les incontournables arbre de décision, les Arbre de décision, outil d'analyse de la Business Intelligence 3
  • 4. Origines • Ces méthodes ont pris essentiellement leur essor dans le cadre des approches d'apprentissage automatique (machine learning) en Intelligence Artificielle. • Particularités (de l'I.A. en général): met l'accent sur sur la convivialité et l'intelligibilité (ou la lisibilité) des résultats => en classification supervisée: sortie de résultats sous la forme de règles logiques de classification: "SI tel ensemble de conditions sur telles variables est satis fait ALORS le cas appartient à telle classe". => résultats plus facilement interprétables et donc exploitables => communication plus aisée avec les spécialistes du domaine traité. 44
  • 5. • Ex d'algorithme: ID3 (Inductive Decision Tree) et son successeur C4.5, CART (Classification and Regression Tree), CHAID (Chi-Square Automatic Interaction Detection), QUEST (Quick, Unbiased, Efficient Statistical Trees). 5
  • 6. 6
  • 7. Définition • Un arbre de décision est un schéma représentant les résultats possibles d'une série de choix interconnectés. • Il permet à une personne ou une organisation d'évaluer différentes actions possibles en fonction de leur coût, leur probabilité et leurs bénéfices. • Il peut être utilisé pour alimenter une discussion informelle ou pour générer un algorithme qui détermine le meilleur choix de façon mathématique. 77
  • 8. Définition • Un arbre de décision commence généralement par un nœud d'où découlent plusieurs résultats possibles. Chacun de ces résultats mène à d'autres nœuds, d'où émanent d'autres possibilités. 88
  • 9. Comment dessiner un arbre de décision ? Les noeuds • Il existe trois types de nœuds différents : des nœuds de hasard, des nœuds de décision et des nœuds terminaux. • Un nœud de hasard: représenté par un cercle, montre les probabilités de certains résultats. • Un nœud de décision: représenté par un carré, illustre une décision à prendre, • un nœud terminal: le résultat final d'un chemin de décision 99
  • 10. 1010
  • 11. • Les arbres de décision peuvent aussi être dessinés avec des symboles d’organigramme . • Certaines personnes jugent que ce procédé génère des schémas plus simples à lire et à comprendre. • 1111
  • 12. 1212
  • 13. Comment dessiner un arbre de décision ? • Pour dessiner un arbre de décision, choisissez d'abord un support. Vous pouvez le dessiner à main levée sur du papier ou sur un tableau blanc, ou vous pouvez utiliser un logiciel d'arbres de décision spécialisé. • Exemple : Sipina ,Edraw • 1313
  • 15. Dans tous les cas, voici les étapes à suivre :• Commencez par la décision principal Dessinez une petite boîte pour la représenter, puis dessinez une ligne partant de la boîte vers la droite pour chaque solution ou action possible. Étiquetez-les. • 1515
  • 16. • Ajoutez des nœuds de hasard et de décision pour développer l'arborescence comme suit : • Si une autre décision est nécessaire, dessinez une autre boîte. • Si le résultat est incertain, dessinez un cercle (les cercles représentent les nœuds de hasard). • Si le problème est résolu, n'ajoutez rien. 1616
  • 17. 1717
  • 18. • 3. Continuez à développer l'arbre jusqu'à ce que chaque ligne débouche sur un nœud terminal, indiquant qu'il n'y a plus de choix à faire ni de résultats possibles à prendre en considération. Ensuite, assignez une valeur à chaque résultat possible. Cela peut être un score abstrait ou une somme d'argent. Ajoutez des triangles pour signaler les nœuds terminaux. 1818
  • 19. 1919
  • 20. • • Une fois l'arbre de décision terminé, vous pouvez commencer à analyser la décision qui s'impose à vous. 2020
  • 21. Exemple d'analyse d'un arbre de décision• En calculant l'utilité ou la valeur attendue de chaque choix de l'arbre, vous pouvez minimiser les risques et optimiser les chances de parvenir à un résultat satisfaisant. • Pour calculer l'utilité espérée d'un choix, il vous suffit de soustraire le coût de cette décision des bénéfices attendus. • Les bénéfices attendus sont égaux à la valeur totale de tous les résultats qui pourraient être dus à ce choix, chaque valeur étant multipliée par la probabilité de réalisation du choix qui lui est associé. Voici comment nous calculerions ces valeurs pour l'exemple ci-dessus : • 2121
  • 22. 2222
  • 23. • Lors de l'identification du résultat le plus souhaitable, il est important de prendre en compte les préférences du décideur. • Par exemple, certains peuvent préférer des options à faible risque tandis que d'autres sont prêts à prendre des risques pour gagner davantage. • 2323
  • 24. les Avantages • La popularité des arbres de décision se justifie par les raisons suivantes : • Ils sont faciles à comprendre. • De nouvelles options peuvent être ajoutées aux arbres existants. • Ils permettent de sélectionner l'option la plus appropriée parmi plusieurs. • Il est facile de les associer à d'autres outils de prise de décision. • 2424
  • 25. Les inconvénients • L'apprentissage de l'arbre de décision optimal est NP- complet concernant plusieurs aspects de l'optimalité • L'apprentissage par arbre de décision peut amener des arbres de décision très complexes, qui généralisent mal l'ensemble d'apprentissage (il s'agit du problème de surapprentissage On utilise des procédures d'élagage pour contourner ce problème 25
  • 26. Les inconvénients • Certains concepts sont difficiles à exprimer à l'aide d'arbres de décision (comme XOR ou la Parité). Pour résoudre ce problème, plusieurs moyens existent, tels que la proportionnalisation, ou l'utilisation d'algorithmes d'apprentissage utilisant des représentations plus expressives (par exemple la programmation logique inductive). • 26
  • 27. Critère de segmentation • Usuellement, les algorithmes pour construire les arbres de décision sont construits en divisant l'arbre du sommet vers les feuilles en choisissant à chaque étape une variable d'entrée qui réalise le meilleur partage de l'ensemble d'objets, comme décrit précédemment. Pour choisir la variable de séparation sur un nœud, les algorithmes testent les différentes variables d'entrée possibles et sélectionnent celle qui maximise un critère donné. 2727
  • 28. Qu’est-ce que sont les arbres de classification, et les arbres de régression ? • Les arbres de classification et de régression (parfois aussi appelés arbres de segmentation ou de décision) sont des méthodes qui permettent d’obtenir des modèles à la fois explicatifs et prédictifs. • Parmi leurs avantages on notera d’une part leur simplicité du fait de la visualisation sous forme d’arbres, d’autre part la possibilité d’obtenir des règles en langage naturel. 28
  • 29. Les arbres de classification et de régression • On distingue notamment deux cas d’utilisation de ces modèles : • on utilise les arbres de classification pour expliquer et/ou prédire l’appartenance d’objets (observations, individus) à une classe (ou modalité ou catégorie) d’une variable qualitative, sur la base de variables explicatives quantitatives et/ou qualitatives. 29
  • 30. Les arbres de classification et de régression• Dans le cas des arbres de classification, il s'agit d'un problème de classification automatique . • Le critère d’évaluation des partitions caractérise l'homogénéité (ou le gain en homogénéité) des sous-ensembles obtenus par division de l'ensemble. • Ces métriques sont appliquées à chaque sous-ensemble candidat et les résultats sont combinés (par exemple, moyennés) pour produire une mesure de la qualité de la séparation • Il existe un grand nombre de critères de ce type, les plus utilisés sont l’Entropie de Shanon, le coefficient de GINI et leurs variantes. • 30
  • 32. • Définition de la régression • La régression est un ensemble de méthodes statistiques  très utilisées pour analyser la relation d'une variable par  rapport à une ou plusieurs autres. • • on utilise les arbres de régression pour expliquer et/ou  prédire les valeurs prise par une variable dépendante  quantitative, en fonction de variables explicatives  quantitatives et/ou qualitatives. • 32
  • 34. Le post-élagage • La seconde stratégie consiste à construire l’arbre en deux  temps : on produit d'abord l’arbre dont les feuilles sont le  plus homogènes possibles dans une phase  d’expansion,  • en utilisant une première fraction de l’échantillon de  données (échantillon d’apprentissage à ne pas  confondre avec la totalité de l’échantillon, appelé en  anglais growing set pour lever l'ambiguïté), puis on  réduit l’arbre, en s’appuyant sur une autre fraction des  données de manière à optimiser les performances de  l’arbre, c’est la phase de post-élagage 34
  • 37. 37

Notes de l'éditeur

  1. réorganiser l'application existante
  2. 76+62=138-75=63