SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
TP n°3 : Règles d’associations
Ben harrath arij 4infini
Note
Ce TP est à rendre en fin de séance.
Objectifs généraux
Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire
des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés
dans le cours (support, confidence, lift)
I. Etude des profils de demandes de Crédits
library : arules
//voir la description du dataset en pièce jointe (credit-german.doc)
1. Chargement du package :
2. Importation des données :
3. Transformation des données :
library(arules)
credit<-read.table(file="credit-german.txt",sep="t",header=T)
#transformer les données attributs-variables en données transactionnelles
cerdit1=as(credit,"transactions")
cerdit1
On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
4. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.25
- confiance 0.75
5. Affichage des dix premières règles :
#extraction des règles
rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule"))
inspect(head(sort(rules ),10))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Affichages des cinq premiers lift :
#afficher les 5 règles avec le lift le + élevé
inspect(head(sort(rules,by="lift"),5))
On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une
coloration négative
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
II. Etude des relations entre les produits vendus dans une épicerie
library : arules, arulesViz
Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec
169 catégories de produits, prises durant un mois.
1. Chargement du package :
2. Importation des données :
3. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.001
- confiance 0.5
#charger les packages
library(arulesViz)
data("Groceries")
#affichage des transactions
LIST(Groceries)
#statistiques descriptives
…
rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift
de 1.957 à 18.996
On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive
Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles
Interpréter les résultats :
rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules"))
on a changé les valeurs de support et de confiance
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Si on change les valeurs de support et de confiance les règles diminuent plus précisément :
Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles
augmente.
Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles
diminue.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le
nombre des règles varient .
4. Affichages des dix premiers lift :
On remarque que lift est toujours positive donc il s’agit une forte corrélation
5. Interprétation
Proposer un nouveau rangement des produits dans l’épicerie.
Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles
diminue.
inspect(head(sort(rules, by="lift"),10))
On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé
ensemble ensemble.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Visualisation des Règles d’Association :
plot(rules)
#Paramétrage avancé de la visualisation
sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Le résultat de l'interaction. En utilisant une sélection de boîte les règles
avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées
dans la borne-dessous du dispositif de traçage
plot(rules, method="matrix", measure=c("lift", "confidence"))
plot(rules, method="matrix", measure=c("lift", "confidence"),
control=list(reorder=TRUE))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
plot(rules, method="grouped")
Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents.
La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes
selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent
des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est
hamburger meat
plot(rules, method="matrix", measure=c("lift", "confidence"))
La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs.
En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la
fois, le support et la confidence
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
III. Market Basket Analyse
Importation des données :
market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2));
market_basket<-read.table(file="market_basket.txt",sep="t",header=T)
market <- as(as.matrix(market_basket), "transactions")
basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules"))
summary(basket_rules )
On Remarque que le nombre deS règles est 23058938
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules"))
summary(rules)
inspect(head(sort(basket_rules),10))
Les valeurs de lift sont égaux a 1 donc on peut rien remarquer
On va varier les valeurs de confiance et de support
Après la variance on remarque que le nombre des règles est 50
plot(basket_rules, method="graph", control=list(type="items"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
. Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des
spectacles qui partagent les règles.
plot(basket_rules, method="matrix3D", measure="lift")
Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les
antécédents en fonction des lifts
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)

Contenu connexe

Tendances

Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction généraleMohamed Heny SELMI
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIsmail CHAIB
 
Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationHajer Trabelsi
 
Datamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunicationsDatamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunicationsabdelmoumène taleb
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionARIJ BenHarrath
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Benharratharijtp2 classification
Benharratharijtp2 classificationBenharratharijtp2 classification
Benharratharijtp2 classificationARIJ BenHarrath
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBaseAmal Abid
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introductionMouna Torjmen
 
BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopLilia Sfaxi
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning Niji
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystèmeKhanh Maudoux
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Mohamed Heny SELMI
 

Tendances (20)

Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
FP Growth Algorithm
FP Growth AlgorithmFP Growth Algorithm
FP Growth Algorithm
 
Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d association
 
Datamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunicationsDatamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunications
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décision
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Benharratharijtp2 classification
Benharratharijtp2 classificationBenharratharijtp2 classification
Benharratharijtp2 classification
 
Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBase
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 
BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans Hadoop
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
 
Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 

En vedette

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013CollectifEtc
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erikaErikaHorcajo
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelairemanubusta03
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingConnected-Blog
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Françoise Grave
 
Vivre en France
Vivre en France Vivre en France
Vivre en France Denis Papy
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateriayulissalizz
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmokss23
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizajeramirez34
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivakportilla
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaadaniela4562
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenConnected-Blog
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du mondeVictor REIBEL
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
AbwasserförderschneckenBittorf
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Nicolas Gillet
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundoAngelitaNR
 

En vedette (20)

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erika
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelaire
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
 
Presentación1
Presentación1Presentación1
Presentación1
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015
 
Vivre en France
Vivre en France Vivre en France
Vivre en France
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateria
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmo
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectiva
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaa
 
Hecho bebes
Hecho bebesHecho bebes
Hecho bebes
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-Systemen
 
Lync Conference France – avril 2014
Lync Conference France – avril 2014Lync Conference France – avril 2014
Lync Conference France – avril 2014
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du monde
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
Abwasserförderschnecken
 
eReserve Produktpräsentation
eReserve ProduktpräsentationeReserve Produktpräsentation
eReserve Produktpräsentation
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundo
 

Similaire à Ben harrath arijtp3 les règles d'association

TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineBoubaker KHMILI
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Aichétou Djimé Gallédou
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdfOuailChoukhairi
 

Similaire à Ben harrath arijtp3 les règles d'association (7)

Analyzing a churn data set
Analyzing a churn data set Analyzing a churn data set
Analyzing a churn data set
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage Machine
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
P15 Eda05 V D
P15 Eda05 V DP15 Eda05 V D
P15 Eda05 V D
 

Dernier

webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...Institut de l'Elevage - Idele
 
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdfwebinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdfInstitut de l'Elevage - Idele
 
QCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdfQCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdfAyoub893663
 
2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULT2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULTBassamRhouma
 
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdfwebinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdfInstitut de l'Elevage - Idele
 
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptxBassamRhouma
 
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...NiHad27
 

Dernier (7)

webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
 
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdfwebinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
 
QCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdfQCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdf
 
2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULT2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULT
 
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdfwebinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
 
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
 
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...
 

Ben harrath arijtp3 les règles d'association

  • 1. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 TP n°3 : Règles d’associations Ben harrath arij 4infini Note Ce TP est à rendre en fin de séance. Objectifs généraux Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés dans le cours (support, confidence, lift) I. Etude des profils de demandes de Crédits library : arules //voir la description du dataset en pièce jointe (credit-german.doc) 1. Chargement du package : 2. Importation des données : 3. Transformation des données : library(arules) credit<-read.table(file="credit-german.txt",sep="t",header=T) #transformer les données attributs-variables en données transactionnelles cerdit1=as(credit,"transactions") cerdit1 On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
  • 2. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 4. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.25 - confiance 0.75 5. Affichage des dix premières règles : #extraction des règles rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule")) inspect(head(sort(rules ),10))
  • 3. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Affichages des cinq premiers lift : #afficher les 5 règles avec le lift le + élevé inspect(head(sort(rules,by="lift"),5)) On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une coloration négative
  • 4. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 II. Etude des relations entre les produits vendus dans une épicerie library : arules, arulesViz Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec 169 catégories de produits, prises durant un mois. 1. Chargement du package : 2. Importation des données : 3. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.001 - confiance 0.5 #charger les packages library(arulesViz) data("Groceries") #affichage des transactions LIST(Groceries) #statistiques descriptives … rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
  • 5. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift de 1.957 à 18.996 On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles Interpréter les résultats : rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules")) on a changé les valeurs de support et de confiance
  • 6. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Si on change les valeurs de support et de confiance les règles diminuent plus précisément : Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles augmente. Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles diminue.
  • 7. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le nombre des règles varient . 4. Affichages des dix premiers lift : On remarque que lift est toujours positive donc il s’agit une forte corrélation 5. Interprétation Proposer un nouveau rangement des produits dans l’épicerie. Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles diminue. inspect(head(sort(rules, by="lift"),10)) On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé ensemble ensemble.
  • 8. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Visualisation des Règles d’Association : plot(rules) #Paramétrage avancé de la visualisation sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
  • 9. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Le résultat de l'interaction. En utilisant une sélection de boîte les règles avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées dans la borne-dessous du dispositif de traçage plot(rules, method="matrix", measure=c("lift", "confidence")) plot(rules, method="matrix", measure=c("lift", "confidence"), control=list(reorder=TRUE))
  • 10. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 plot(rules, method="grouped") Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents. La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est hamburger meat plot(rules, method="matrix", measure=c("lift", "confidence")) La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs. En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la fois, le support et la confidence
  • 11. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 III. Market Basket Analyse Importation des données : market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2)); market_basket<-read.table(file="market_basket.txt",sep="t",header=T) market <- as(as.matrix(market_basket), "transactions") basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules")) summary(basket_rules ) On Remarque que le nombre deS règles est 23058938
  • 12. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules")) summary(rules) inspect(head(sort(basket_rules),10)) Les valeurs de lift sont égaux a 1 donc on peut rien remarquer On va varier les valeurs de confiance et de support Après la variance on remarque que le nombre des règles est 50 plot(basket_rules, method="graph", control=list(type="items"))
  • 13. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 . Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des spectacles qui partagent les règles. plot(basket_rules, method="matrix3D", measure="lift") Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les antécédents en fonction des lifts
  • 14. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)