SlideShare une entreprise Scribd logo
Règles d’association
Réaliser par : CHERIF ASMA && HASSINE HAMMAMI
plan
DATA MINING REGLES
D’ASSOCIATION
LES
ALGORITHMES
EXEMPLE
WEKA
DATA MINING
un processus itératif par lequel on
extrait des connaissances:
valides
Nouvelles
potentiellement utiles
compréhensibles
DATA MINING
Descriptif
Mettre en évidence des informations
présentes
Prédictif
Extrapoler des nouvelles informations à
partir de données existantes.
Techniques
prédictives
•Classification
•Régression
•Association
Techniques
descriptives
•Visualisation
•Regroupement
•Association
Règles d’association
 une implication conditionnelle entre ensembles d'attributs appelés items.
 Le processus d’association se décompose en deux sous processus :
la recherche des ensembles fréquents d'items
la génération des règles d'association à partir de ces ensembles
L’objectif est de trouver tous les ensembles d’items qui satisfont le seuil minsup.
Association
Support
L’occurrence
de règle
dans la base
Sup(x->y)
=
Segma(x &
y)/N
Confiance
mesure la validité
de la règle:
pourcentage
d’exemples qui
vérifient la
conclusion
Conf(X ⇒ Y)
= Supp(X &
Y) / Supp(X)
DESCRIPTION d’exemple :
Un exemple classique de l’utilité de cette approche est le panier du
ménagère qui décrit un ensemble d’achats effectué au supermarché
Les règles d’association permet de découvrir de régularités dans l’ensemble de
transactions comme par exemple : Si fromage alors vin rouge, etc.
Ces règles permettent par exemple au gérant de proposer des bons de
réductions significatifs sur les achats futurs des clients ! !
Un domaine d’application donné doit être décrit par une liste limitée
d’atomes qu’on appelle items. Par exemple, pour l’application du panier de
ménagère la liste des items correspond à l’ensemble d’articles disponibles
dans le supermarché [vin; fromage; chocolat;..].
 Un ensemble d’items est une succession d’items exprimée dans un ordre
donné et prédéfini.
 Une transaction est un ensemble d’items I {i1, i2,i3,..} . Un ensemble de
transactions T {t1,t2,t3,t4, ..} correspond à un ensemble d’apprentissage
qu’on va utiliser dans la suite pour déterminer les règles d’associations.
Par exemple, deux transactions possibles qui décrivent les achats dans un
supermarché Sont :
t1 = {Vin Fromage Viande} et t2 = {Vin Fromage Chocolat}
Exemple
Représentation binaire de données
transactions
produits
Vin Fromage Chocolat Viande Coca chips
T1 1 1 1 0 0 0
T2 1 1 0 1 0 0
T3 0 1 1 1 0 0
T4 1 1 1 0 0 0
t5 1 0 0 0 1 1
minsupp =0,4
minconf=60%
Considérons la règle {vin , fromage} {chocolat}
Le support du l’ensemble {vin , fromage, chocolat} étant égal à 2
nombre total du transaction est égal à 5, le support de la règle est égal 2/5 =0.4
la confiance de cette règle est 2/3=0.67 (67%)
Considérons la règle { fromage} {viande}
Le support de cette règle est de 2/5=0,4
La confiance de cette règle est de (2/5)/(4/5)=50%
Le support est important parce qu’une règle qui à un support faible peut être
observé seulement par hasard.
Les algorithme utilisé
APRIORI (Agrawal & Srikant, 1994)
Close (Pasquier et al, 1998 )
OCD (Mannila & al, 1994)
GEN-REGLES (Agrawal & Al, 1994)
OPUS (Webb, G.I. (1995) )
GEN_RULES, Eclat, GUHA,Tertius…
Algorithme APRIORI
Principe de l’algorithme A Priori:
Génération d’ensembles d’items
Calcul des fréquences des ensembles d’items
On garde les ensembles d’items avec un support minimum:
les ensembles d’items fréquents
Points faibles (algorithme apriori) :
 Le calcul des supports est coûteux
 La générations des règles est coûteuse
 Le parcours des données initiales est récurrent
Algorithme Close
repose sur l'extraction de générateurs d'ensemble de mots
fermés fréquents
La fermeture d'un ensemble de mots A est un ensemble de mots
B tel que B apparait dans les mêmes textes que A.
Pour la calculer on utilise deux fonctions :
F : Associe à un ensemble de mots les textes où il apparait
g : associe à un ensemble de textes les mots qu'ils ont en commun
20
Principe de l’algorithme Close
Initialisation de l'ensemble des générateurs avec
l'ensemble des singletons formés par les mots du corpus
Calcul de la fermeture des générateurs de niveau k et
de leur support
Ajout des fermetures des générateurs à l'ensemble des
ensembles de mots fermes fréquents
Génération des générateurs de niveau k + 1
Règles d’association
Règles d’association
Règles d’association
Règles d’association
Règles d’association
Règles d’association
Règles d’association

Contenu connexe

Tendances

Data Mining
Data MiningData Mining
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
hanamettali
 
FP Growth Algorithm
FP Growth AlgorithmFP Growth Algorithm
FP Growth Algorithm
CHOUAIB EL HACHIMI
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
Mohamed Heny SELMI
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
Yassine Badri
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
Ismail CHAIB
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
Amal Abid
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
OuailChoukhairi
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
Lilia Sfaxi
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
Lilia Sfaxi
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
Amal Abid
 
AI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine LearnigAI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine Learnig
Felipe Sanchez Garzon
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
Sawsen Larbi
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
Lilia Sfaxi
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentation
Donia Hammami
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
khlifi z
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
Lilia Sfaxi
 

Tendances (20)

Data Mining
Data MiningData Mining
Data Mining
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
 
FP Growth Algorithm
FP Growth AlgorithmFP Growth Algorithm
FP Growth Algorithm
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
 
AI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine LearnigAI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine Learnig
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentation
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 

Similaire à Règles d’association

associations5.ppt
associations5.pptassociations5.ppt
associations5.ppt
JaberYassine
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
Jihane Elârrouchi
 
Etude comparative des classifieurs Naïve Bayes et SVM
Etude comparative des classifieurs Naïve Bayes et SVMEtude comparative des classifieurs Naïve Bayes et SVM
Etude comparative des classifieurs Naïve Bayes et SVM
SamirAwad14
 
Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association
ARIJ BenHarrath
 
Initiation à l'algorithmique
Initiation à l'algorithmiqueInitiation à l'algorithmique
Initiation à l'algorithmique
Abdoulaye Dieng
 
Machine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxMachine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptx
bely26
 

Similaire à Règles d’association (6)

associations5.ppt
associations5.pptassociations5.ppt
associations5.ppt
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
Etude comparative des classifieurs Naïve Bayes et SVM
Etude comparative des classifieurs Naïve Bayes et SVMEtude comparative des classifieurs Naïve Bayes et SVM
Etude comparative des classifieurs Naïve Bayes et SVM
 
Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association
 
Initiation à l'algorithmique
Initiation à l'algorithmiqueInitiation à l'algorithmique
Initiation à l'algorithmique
 
Machine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxMachine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptx
 

Dernier

OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO Technology
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
OCTO Technology
 
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
Université de Franche-Comté
 
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Laurent Speyser
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
UNITECBordeaux
 
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
OCTO Technology
 

Dernier (6)

OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
 
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
 
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
 
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
 

Règles d’association

  • 1. Règles d’association Réaliser par : CHERIF ASMA && HASSINE HAMMAMI
  • 3. DATA MINING un processus itératif par lequel on extrait des connaissances: valides Nouvelles potentiellement utiles compréhensibles
  • 4. DATA MINING Descriptif Mettre en évidence des informations présentes Prédictif Extrapoler des nouvelles informations à partir de données existantes. Techniques prédictives •Classification •Régression •Association Techniques descriptives •Visualisation •Regroupement •Association
  • 5. Règles d’association  une implication conditionnelle entre ensembles d'attributs appelés items.  Le processus d’association se décompose en deux sous processus : la recherche des ensembles fréquents d'items la génération des règles d'association à partir de ces ensembles L’objectif est de trouver tous les ensembles d’items qui satisfont le seuil minsup.
  • 6. Association Support L’occurrence de règle dans la base Sup(x->y) = Segma(x & y)/N Confiance mesure la validité de la règle: pourcentage d’exemples qui vérifient la conclusion Conf(X ⇒ Y) = Supp(X & Y) / Supp(X)
  • 7. DESCRIPTION d’exemple : Un exemple classique de l’utilité de cette approche est le panier du ménagère qui décrit un ensemble d’achats effectué au supermarché Les règles d’association permet de découvrir de régularités dans l’ensemble de transactions comme par exemple : Si fromage alors vin rouge, etc. Ces règles permettent par exemple au gérant de proposer des bons de réductions significatifs sur les achats futurs des clients ! !
  • 8. Un domaine d’application donné doit être décrit par une liste limitée d’atomes qu’on appelle items. Par exemple, pour l’application du panier de ménagère la liste des items correspond à l’ensemble d’articles disponibles dans le supermarché [vin; fromage; chocolat;..].  Un ensemble d’items est une succession d’items exprimée dans un ordre donné et prédéfini.  Une transaction est un ensemble d’items I {i1, i2,i3,..} . Un ensemble de transactions T {t1,t2,t3,t4, ..} correspond à un ensemble d’apprentissage qu’on va utiliser dans la suite pour déterminer les règles d’associations. Par exemple, deux transactions possibles qui décrivent les achats dans un supermarché Sont : t1 = {Vin Fromage Viande} et t2 = {Vin Fromage Chocolat}
  • 10. Représentation binaire de données transactions produits Vin Fromage Chocolat Viande Coca chips T1 1 1 1 0 0 0 T2 1 1 0 1 0 0 T3 0 1 1 1 0 0 T4 1 1 1 0 0 0 t5 1 0 0 0 1 1 minsupp =0,4 minconf=60%
  • 11. Considérons la règle {vin , fromage} {chocolat} Le support du l’ensemble {vin , fromage, chocolat} étant égal à 2 nombre total du transaction est égal à 5, le support de la règle est égal 2/5 =0.4 la confiance de cette règle est 2/3=0.67 (67%)
  • 12. Considérons la règle { fromage} {viande} Le support de cette règle est de 2/5=0,4 La confiance de cette règle est de (2/5)/(4/5)=50% Le support est important parce qu’une règle qui à un support faible peut être observé seulement par hasard.
  • 13. Les algorithme utilisé APRIORI (Agrawal & Srikant, 1994) Close (Pasquier et al, 1998 ) OCD (Mannila & al, 1994) GEN-REGLES (Agrawal & Al, 1994) OPUS (Webb, G.I. (1995) ) GEN_RULES, Eclat, GUHA,Tertius…
  • 14. Algorithme APRIORI Principe de l’algorithme A Priori: Génération d’ensembles d’items Calcul des fréquences des ensembles d’items On garde les ensembles d’items avec un support minimum: les ensembles d’items fréquents
  • 15.
  • 16. Points faibles (algorithme apriori) :  Le calcul des supports est coûteux  La générations des règles est coûteuse  Le parcours des données initiales est récurrent
  • 17. Algorithme Close repose sur l'extraction de générateurs d'ensemble de mots fermés fréquents La fermeture d'un ensemble de mots A est un ensemble de mots B tel que B apparait dans les mêmes textes que A. Pour la calculer on utilise deux fonctions : F : Associe à un ensemble de mots les textes où il apparait g : associe à un ensemble de textes les mots qu'ils ont en commun 20
  • 18.
  • 19. Principe de l’algorithme Close Initialisation de l'ensemble des générateurs avec l'ensemble des singletons formés par les mots du corpus Calcul de la fermeture des générateurs de niveau k et de leur support Ajout des fermetures des générateurs à l'ensemble des ensembles de mots fermes fréquents Génération des générateurs de niveau k + 1