SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
TP n°3 : Règles d’associations
Ben harrath arij 4infini
Note
Ce TP est à rendre en fin de séance.
Objectifs généraux
Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire
des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés
dans le cours (support, confidence, lift)
I. Etude des profils de demandes de Crédits
library : arules
//voir la description du dataset en pièce jointe (credit-german.doc)
1. Chargement du package :
2. Importation des données :
3. Transformation des données :
library(arules)
credit<-read.table(file="credit-german.txt",sep="t",header=T)
#transformer les données attributs-variables en données transactionnelles
cerdit1=as(credit,"transactions")
cerdit1
On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
4. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.25
- confiance 0.75
5. Affichage des dix premières règles :
#extraction des règles
rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule"))
inspect(head(sort(rules ),10))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Affichages des cinq premiers lift :
#afficher les 5 règles avec le lift le + élevé
inspect(head(sort(rules,by="lift"),5))
On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une
coloration négative
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
II. Etude des relations entre les produits vendus dans une épicerie
library : arules, arulesViz
Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec
169 catégories de produits, prises durant un mois.
1. Chargement du package :
2. Importation des données :
3. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.001
- confiance 0.5
#charger les packages
library(arulesViz)
data("Groceries")
#affichage des transactions
LIST(Groceries)
#statistiques descriptives
…
rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift
de 1.957 à 18.996
On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive
Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles
Interpréter les résultats :
rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules"))
on a changé les valeurs de support et de confiance
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Si on change les valeurs de support et de confiance les règles diminuent plus précisément :
Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles
augmente.
Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles
diminue.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le
nombre des règles varient .
4. Affichages des dix premiers lift :
On remarque que lift est toujours positive donc il s’agit une forte corrélation
5. Interprétation
Proposer un nouveau rangement des produits dans l’épicerie.
Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles
diminue.
inspect(head(sort(rules, by="lift"),10))
On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé
ensemble ensemble.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Visualisation des Règles d’Association :
plot(rules)
#Paramétrage avancé de la visualisation
sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Le résultat de l'interaction. En utilisant une sélection de boîte les règles
avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées
dans la borne-dessous du dispositif de traçage
plot(rules, method="matrix", measure=c("lift", "confidence"))
plot(rules, method="matrix", measure=c("lift", "confidence"),
control=list(reorder=TRUE))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
plot(rules, method="grouped")
Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents.
La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes
selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent
des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est
hamburger meat
plot(rules, method="matrix", measure=c("lift", "confidence"))
La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs.
En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la
fois, le support et la confidence
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
III. Market Basket Analyse
Importation des données :
market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2));
market_basket<-read.table(file="market_basket.txt",sep="t",header=T)
market <- as(as.matrix(market_basket), "transactions")
basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules"))
summary(basket_rules )
On Remarque que le nombre deS règles est 23058938
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules"))
summary(rules)
inspect(head(sort(basket_rules),10))
Les valeurs de lift sont égaux a 1 donc on peut rien remarquer
On va varier les valeurs de confiance et de support
Après la variance on remarque que le nombre des règles est 50
plot(basket_rules, method="graph", control=list(type="items"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
. Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des
spectacles qui partagent les règles.
plot(basket_rules, method="matrix3D", measure="lift")
Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les
antécédents en fonction des lifts
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)

Contenu connexe

Tendances

Cours des bases de données
Cours des bases de données Cours des bases de données
Cours des bases de données yassine kchiri
 
Théorie de graphe
Théorie de grapheThéorie de graphe
Théorie de grapheTECOS
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olapCynapsys It Hotspot
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression Mariem Chaaben
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMJaouad Dabounou
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_amanMehdi Aman
 
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursBases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursHatim CHAHDI
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesHassan Lâasri
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
interopérabilité en informatique
interopérabilité en informatiqueinteropérabilité en informatique
interopérabilité en informatiquecatherine roussey
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian Lilia Sfaxi
 
Les systèmes experts
Les systèmes expertsLes systèmes experts
Les systèmes expertsBruno Delb
 
Python For Data Science - French Course
Python For Data Science - French CoursePython For Data Science - French Course
Python For Data Science - French CourseHaytam EL YOUSSFI
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4JLilia Sfaxi
 

Tendances (20)

Cours des bases de données
Cours des bases de données Cours des bases de données
Cours des bases de données
 
Théorie de graphe
Théorie de grapheThéorie de graphe
Théorie de graphe
 
Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Chapitre 2 hadoop
Chapitre 2 hadoopChapitre 2 hadoop
Chapitre 2 hadoop
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTM
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursBases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologies
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Cours Génie Logiciel - Introduction
Cours Génie Logiciel - IntroductionCours Génie Logiciel - Introduction
Cours Génie Logiciel - Introduction
 
interopérabilité en informatique
interopérabilité en informatiqueinteropérabilité en informatique
interopérabilité en informatique
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 
Les systèmes experts
Les systèmes expertsLes systèmes experts
Les systèmes experts
 
Python For Data Science - French Course
Python For Data Science - French CoursePython For Data Science - French Course
Python For Data Science - French Course
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
 

En vedette

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013CollectifEtc
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erikaErikaHorcajo
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelairemanubusta03
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingConnected-Blog
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Françoise Grave
 
Vivre en France
Vivre en France Vivre en France
Vivre en France Denis Papy
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateriayulissalizz
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmokss23
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizajeramirez34
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivakportilla
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaadaniela4562
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenConnected-Blog
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du mondeVictor REIBEL
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
AbwasserförderschneckenBittorf
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Nicolas Gillet
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundoAngelitaNR
 

En vedette (20)

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erika
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelaire
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
 
Presentación1
Presentación1Presentación1
Presentación1
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015
 
Vivre en France
Vivre en France Vivre en France
Vivre en France
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateria
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmo
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectiva
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaa
 
Hecho bebes
Hecho bebesHecho bebes
Hecho bebes
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-Systemen
 
Lync Conference France – avril 2014
Lync Conference France – avril 2014Lync Conference France – avril 2014
Lync Conference France – avril 2014
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du monde
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
Abwasserförderschnecken
 
eReserve Produktpräsentation
eReserve ProduktpräsentationeReserve Produktpräsentation
eReserve Produktpräsentation
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundo
 

Similaire à Ben harrath arijtp3 les règles d'association

Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationHajer Trabelsi
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineBoubaker KHMILI
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Aichétou Djimé Gallédou
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdfOuailChoukhairi
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 

Similaire à Ben harrath arijtp3 les règles d'association (9)

Analyzing a churn data set
Analyzing a churn data set Analyzing a churn data set
Analyzing a churn data set
 
Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d association
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage Machine
 
Data Mining
Data MiningData Mining
Data Mining
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
P15 Eda05 V D
P15 Eda05 V DP15 Eda05 V D
P15 Eda05 V D
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 

Dernier

JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfInstitut de l'Elevage - Idele
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfInstitut de l'Elevage - Idele
 
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...Institut de l'Elevage - Idele
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusInstitut de l'Elevage - Idele
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesInstitut de l'Elevage - Idele
 
WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfWBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfSophie569778
 
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...Institut de l'Elevage - Idele
 
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...Institut de l'Elevage - Idele
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfmia884611
 
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...Institut de l'Elevage - Idele
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageInstitut de l'Elevage - Idele
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)Sana REFAI
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfInstitut de l'Elevage - Idele
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...Institut de l'Elevage - Idele
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéInstitut de l'Elevage - Idele
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestionyakinekaidouchi1
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...Institut de l'Elevage - Idele
 

Dernier (20)

JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdf
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdf
 
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentes
 
WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfWBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
 
JTC 2024 Bâtiment et Photovoltaïque.pdf
JTC 2024  Bâtiment et Photovoltaïque.pdfJTC 2024  Bâtiment et Photovoltaïque.pdf
JTC 2024 Bâtiment et Photovoltaïque.pdf
 
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
 
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
 
CAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptxCAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptx
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdf
 
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
 
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdfJTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversité
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestion
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
 

Ben harrath arijtp3 les règles d'association

  • 1. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 TP n°3 : Règles d’associations Ben harrath arij 4infini Note Ce TP est à rendre en fin de séance. Objectifs généraux Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés dans le cours (support, confidence, lift) I. Etude des profils de demandes de Crédits library : arules //voir la description du dataset en pièce jointe (credit-german.doc) 1. Chargement du package : 2. Importation des données : 3. Transformation des données : library(arules) credit<-read.table(file="credit-german.txt",sep="t",header=T) #transformer les données attributs-variables en données transactionnelles cerdit1=as(credit,"transactions") cerdit1 On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
  • 2. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 4. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.25 - confiance 0.75 5. Affichage des dix premières règles : #extraction des règles rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule")) inspect(head(sort(rules ),10))
  • 3. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Affichages des cinq premiers lift : #afficher les 5 règles avec le lift le + élevé inspect(head(sort(rules,by="lift"),5)) On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une coloration négative
  • 4. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 II. Etude des relations entre les produits vendus dans une épicerie library : arules, arulesViz Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec 169 catégories de produits, prises durant un mois. 1. Chargement du package : 2. Importation des données : 3. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.001 - confiance 0.5 #charger les packages library(arulesViz) data("Groceries") #affichage des transactions LIST(Groceries) #statistiques descriptives … rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
  • 5. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift de 1.957 à 18.996 On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles Interpréter les résultats : rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules")) on a changé les valeurs de support et de confiance
  • 6. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Si on change les valeurs de support et de confiance les règles diminuent plus précisément : Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles augmente. Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles diminue.
  • 7. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le nombre des règles varient . 4. Affichages des dix premiers lift : On remarque que lift est toujours positive donc il s’agit une forte corrélation 5. Interprétation Proposer un nouveau rangement des produits dans l’épicerie. Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles diminue. inspect(head(sort(rules, by="lift"),10)) On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé ensemble ensemble.
  • 8. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Visualisation des Règles d’Association : plot(rules) #Paramétrage avancé de la visualisation sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
  • 9. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Le résultat de l'interaction. En utilisant une sélection de boîte les règles avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées dans la borne-dessous du dispositif de traçage plot(rules, method="matrix", measure=c("lift", "confidence")) plot(rules, method="matrix", measure=c("lift", "confidence"), control=list(reorder=TRUE))
  • 10. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 plot(rules, method="grouped") Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents. La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est hamburger meat plot(rules, method="matrix", measure=c("lift", "confidence")) La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs. En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la fois, le support et la confidence
  • 11. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 III. Market Basket Analyse Importation des données : market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2)); market_basket<-read.table(file="market_basket.txt",sep="t",header=T) market <- as(as.matrix(market_basket), "transactions") basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules")) summary(basket_rules ) On Remarque que le nombre deS règles est 23058938
  • 12. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules")) summary(rules) inspect(head(sort(basket_rules),10)) Les valeurs de lift sont égaux a 1 donc on peut rien remarquer On va varier les valeurs de confiance et de support Après la variance on remarque que le nombre des règles est 50 plot(basket_rules, method="graph", control=list(type="items"))
  • 13. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 . Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des spectacles qui partagent les règles. plot(basket_rules, method="matrix3D", measure="lift") Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les antécédents en fonction des lifts
  • 14. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)