Dokumen ini membahas algoritme Apriori untuk menemukan aturan asosiasi dalam data mining. Algoritme ini bekerja dengan menghasilkan itemset yang sering muncul, melakukan join untuk menciptakan kandidat baru, dan menghasilkan aturan dengan menghitung dukungan dan keyakinan. Beberapa masalah yang dijelaskan termasuk keterbatasan skalabilitas dan representasi data transaksi.
3. ISD314 - Teknik Data Mining
Pendahuluan
Association Rule
Jika kita ingin mulai usaha berjualan produk A, produk lain
apa yang bisa kita jual, yang bisa meningkatkan pendapatan?
Jika kita memiliki sebuah dokumen tentang topik tertentu,
dokumen mana topik apa yang mungkin berkaitan?
4. ISD314 - Teknik Data Mining
Pendahuluan
Association Rule
Bentuk umum Association Rule
if x1 ∧ x2 ∧ . . . ∧ xnthen y1 ∧ y2 ∧ . . . ∧ ym
Head: xi
Body: yj
Contoh
Jika seorang pengunjung toko membeli Roti, Maka dia juga
akan membeli Susu.
Catatan: Belum tentu berlaku rule dalam arah sebaliknya
(contrapositive)
5. ISD314 - Teknik Data Mining
Pendahuluan
Support dan Condence
Support: Jumlah sub-himpunan yang ditemukan dalam data
transaksi
Condence: Jumlah sub-himpunan yang menyusun bagian
head dari aturan asosiasi yang terbentuk
Support dan Condence biasanya dinyatakan dalam persentase
6. ISD314 - Teknik Data Mining
Algoritme Apriori
Algoritme Apriori
Prinsip Apriori
Jika sebuah itemset bersifat frequent,
Maka sub-himpunan dari itemset tersebut juga bersifat
frequent.
Secara apriori meyakini bahwa sub-himpunan bersifat frequent.
7. ISD314 - Teknik Data Mining
Algoritme Apriori
Algoritme Apriori
Ck ← candidate item-set of size k
Lk ← frequent item-set of size k
L1 ← {frquentitems}
for k ← 1; Lk = ∅; k + + do
Ck+1 ← candidates generated from Lk
for each transaction t in databse D do
increment the count of all candidates in Ck+1 those are
contained in t
Lk+1 ← candidates in Ck+1 with minimum support
end for
end for
return ∪kLk
8. ISD314 - Teknik Data Mining
Algoritme Apriori
Frequent Itemset Generation
Contoh Data
Data transaksi (?, ?)
TID Items
100 1, 3, 4
200 2, 3, 5
300 1, 2, 3, 5
400 2, 5
Minimum Support σ = 50%
Minimum Condence c = 70%
9. ISD314 - Teknik Data Mining
Algoritme Apriori
Frequent Itemset Generation
Contoh Data C1
Generate C1, candidate 1-item-set
TID Items
100 1, 3, 4
200 2, 3, 5
300 1, 2, 3, 5
400 2, 5
item-set support count
{1} 2
{2} 3
{3} 3
{4} 1
{5} 3
10. ISD314 - Teknik Data Mining
Algoritme Apriori
Frequent Itemset Generation
Contoh Data: L1
Generate L1dari C1dengan menghapus 1-item-set yang kurang
dari σ.
TID Items
100 1, 3, 4
200 2, 3, 5
300 1, 2, 3, 5
400 2, 5
item-set support count
{1} 2
{2} 3
{3} 3
{5} 3
11. ISD314 - Teknik Data Mining
Algoritme Apriori
Join Step
Join Step
Pola umum
{a1, a2, . . . , ak−1, ak}
{b1, b2, . . . , bk−1, bk}
{a1, a2, . . . , ak−1, ak, bk}
ai = bi untuk 1 ≤ i k, unsur akberbeda dari unsur bk.
Contoh
L3 = { {a, b, c}, {a, b, d}, {a, c, d}, {a, c, e}, {b, c, d} }
C4 = { {a, b, c, d}, {a, c, d, e} }
12. ISD314 - Teknik Data Mining
Algoritme Apriori
Join Step
Contoh Data: Join and Prune
Generate C2, candidate 2-item-set dari L1dengan melakukan
join step
TID Items
100 1, 3, 4
200 2, 3, 5
300 1, 2, 3, 5
400 2, 5
item-set support count
{1, 2} 1
{1, 3} 2
{1, 5} 1
{2, 3} 2
{2, 5} 3
{3, 5} 2
Prune jika diperlukan untuk membuat C2
Ulang hingga dihasilkan largest itemset
13. ISD314 - Teknik Data Mining
Algoritme Apriori
Join Step
Contoh Data: Frequent Item-set
F = {2, 3, 5}
support count = 2
Bentuk rule dengan pola Head dan Body
H ⇒ B
H = ∅
B = ∅
Head = H ⊂ F
Body = B = F − H