3. MEMORY BASED REASONING
1. Introduction Memory Based Reasoning
2. Cara Kerja Memory Based Reasoning
Tiga masalah utama dalam menyelesaikan masalah dengan MBR
3. Study Kasus : Mengklasifikasikan berita
4. Mengukur Jarak
5. Fungsi Kombinasi
4. 1. INTRODUCTION
Penalaran Berbasis Memori (MBR) adalah
◼ Mengidentifikasi kasus serupa dari pengalaman
◼ Menerapkan informasi dari kasus ini ke masalah yang dihadapi.
◼ MBR menemukan contoh serupa (neighbor) yang mirip dengan record baru dan
menggunakan contoh serupa (neighbor) untuk klasifikasi dan prediksi.
Itu peduli dengan keberadaan dua operasi
◼ Fungsi jarak; memberikan jarak antara dua catatan
◼ Fungsi kombinasi ; menggabungkan hasil dari contoh serupa (neighbor) untuk sampai pada
sebuah jawaban.
Aplikasi MBR menjangkau banyak area;
◼ Deteksi penipuan
◼ Prediksi respons customer
◼ Perawatan medis
◼ Mengklasifikasikan tanggapan
5. 2. BAGAIMANA CARA KERJA MBR?
Film apa yang paling mungkin terakhir dilihat oleh responden berdasarkan sumber
rekaman dan usia individu?
MBR memiliki dua fase berbeda
◼ Fase pembelajaran menghasilkan database historis
◼ Fase prediksi menerapkan MBR ke kasus baru
6. 2.1. TIGA MASALAH UTAMA DALAM
MENYELESAIKAN MASALAH DENGAN MBR
Memilih kumpulan catatan sejarah yang sesuai
◼ Catatan sejarah, juga dikenal sebagai set pelatihan, adalah bagian dari catatan yang
tersedia.
◼ Training set perlu memberikan cakupan yang baik dari catatan sehingga contoh serupa
(neighbor) terdekat dengan catatan yang tidak diketahui, berguna untuk tujuan
prediksi.
Mewakili catatan sejarah
◼ Kinerja MBR dalam membuat prediksi bergantung pada bagaimana training set
direpresentasikan di komputer.
Menentukan fungsi jarak, fungsi kombinasi, dan jumlah contoh serupa (neighbor)
◼ Fungsi jarak, fungsi kombinasi, dan jumlah contoh serupa (neighbor) adalah bahan
utama dalam menentukan seberapa baik MBR dalam menghasilkan hasil.
7. 3. STUDI KASUS; MENGKLASIFIKASIKAN
BERITA
Apa kodenya?
◼ Penyedia berita memberikan kode pada berita untuk mendeskripsikan konten berita. Kode-
kode ini membantu pengguna mencari cerita yang menarik.
Menerapkan MBR
◼ Memilih training set
Set pelatihan terdiri dari 49.652 berita
◼ Memilih fungsi Jarak
Dalam hal ini, fungsi jarak sudah ada, berdasarkan gagasan yang disebut relevansi umpan balik
yang mengukur kesamaan dua dokumen berdasarkan kata-kata yang dikandungnya.
8. 3. STUDI KASUS; MENGKLASIFIKASIKAN
BERITA
Fungsi Umpan Balik Relevansi
◼ Memilih fungsi kombinasi
Fungsi kombinasi menggunakan teknik penjumlahan berbobot.
◼ Memilih jumlah contoh serup (neighbor)
Investigasi memvariasikan jumlah contoh serupa terdekat antara 1 dan 11 inklusif.
)
,
(
)
,
(
1
)
,
(
A
A
score
B
A
score
B
A
d tion
classifica −
=
9. 3. STUDI KASUS; MENGKLASIFIKASIKAN
BERITA
Hasil
◼ Penarikan dan presisi adalah dua pengukuran yang berguna saat mengukur seberapa
baik serangkaian kode ditetapkan.
Penarikan; “Berapa banyak kode yang benar yang diberikan MBR ke cerita?”
Presisi; “Berapa banyak kode yang ditetapkan oleh MBR yang benar?”
Kode oleh MBR Kode yang benar Penarikan Presisi
A, B A, B, C, D 50% 100%
ABCD EFGH A, B, C, D 100% 50%
Kategori Penarikan Presisi
Pemerintah 85% 87%
Industri 91% 85%
Sektor Pasar 93% 91%
Produk 69% 89%
Wilayah 86% 64%
Subyek 72% 53%
10. 4. MENGUKUR JARAK
Tiga fungsi jarak paling umum
◼ Nilai mutlak dari perbedaan; | AB |
◼ Kuadrat selisih; (AB)2
◼ Nilai absolut yang dinormalkan = | AB | / (perbedaan maksimum)
Contoh
◼ Jenis kelamin
Djenis kelamin(wanita, wanita) = 0, Djenis kelamin(pria, wanita) = 1
Djenis kelamin(wanita, pria) = 1, Djenis kelamin(pria, pria) = 0
Recnum Jenis kelamin Usia Gaji
1 Perempuan 27 $ 19.000
2 Pria 51 $ 64,000
3 Pria 52 $ 105.000
4 Perempuan 33 $ 55.000
5 Pria 45 $ 48,000
11. 4. MENGUKUR JARAK
◼ Usia
◼ Gabungkan menjadi satu fungsi jarak rekaman.
Penjumlahan; djumlah(A, B) = djenis kelamin(A, B) + dusia(A, B) + dgaji(A, B)
Penjumlahan yang dinormalkan; dnorma(A, B) = djumlah(A, B) / maks (djumlah)
Jarak Euclidean ; deuclid(A, B) = akar persegi (djenis kelamin(A, B)2 + dusia(A, B)2 + dgaji(A, B)2)
27 51 52 33 45
27 0,00 0.96 1.00 0.24 0.72
51 0.96 0,00 0,04 0.72 0.24
52 1.00 0,04 0,00 0.76 0.28
33 0.24 0.72 0.76 0,00 0.48
45 0.72 0.24 0.28 0.48 0,00
12. 4. MENGUKUR JARAK
Set contoh serupa ( neighbor ) terdekat untuk tiga fungsi jarak
Masukkan customer baru
◼ Gender; Perempuan,Umur; 45,Gaji; $ 100.000
Set contoh erupa (neighbor) terdekat untuk pelanggan baru
djumlah dnorma deuclid
1 1,4,5,2,3 1,4,5,2,3 1,4,5,2,3
2 2,5,3,4,1 2,5,3,4,1 2,5,3,4,1
3 3,2,5,4,1 3,2,5,4,1 3,2,5,4,1
4 4,1,5,2,3 4,1,5,2,3 4,1,5,2,3
5 5,2,3,4,1 5,2,3,4,1 5,2,3,4,1
1 2 3 4 5 neighbors
djumlah 1.662 1.659 1.338 1.003 1.640 4,3,5,2,1
dnorma 0,554 0,553 0.446 0,334 0,547 4,3,5,2,1
deuclid 0.781 1.052 1.251 0.494 1.000 4,1,5,2,3
13. 5. FUNGSI KOMBINASI; MEMINTA JAWABAN NEIGHBOR
Pendekatan dasar; Demokrasi
◼ Fungsi kombinasi dasar yang digunakan untuk MBR adalah memiliki K contoh serupa
(neighbor) terdekat memberikan suara pada jawaban- "demokrasi" di data mining.
◼ customer dengan Sejarah Attrisi
Recnum Jenis kelamin Usia Gaji Attriter
1 Perempuan 27 $ 19.000 Tidak
2 Pria 51 $ 64,000 Iya
3 Pria 52 $ 105.000 Iya
4 Perempuan 33 $ 55.000 Iya
5 Pria 45 $ 48,000 Tidak
baru Perempuan 45 $ 100.000 ?
14. 5. FUNGSI KOMBINASI; MEMINTA JAWABAN NEIGHBOR
◼ Menggunakan MBR untuk menentukan apakah customer baru akan menarik
◼ Prediksi atrisi dengan percaya diri
Neighbor Attrisi
Neighbor
K = 1 K = 2 K = 3 K = 4 K = 5
djumlah 4,3,5,2,1 Y, Y, N, Y,
N
Iya Iya Iya Iya Iya
deuclid 4,1,5,2,3 Y, N, N, Y,
Y
Iya ? tidak ? Iya
K = 1 K = 2 K = 3 K = 4 K = 5
djumlah Ya, 100% Ya, 100% Iya, 67% Ya, 75% Ya, 60%
deuclid Ya, 100% Ya, 50% Ya, 67% Ya, 50% Ya, 60%
15. 5. FUNGSI KOMBINASI; MEMINTA JAWABAN NEIGHBOR
Voting berbobot
◼ Voting berbobot mirip dengan voting kecuali bahwa contoh serupa (neighbor) tidak semuanya diciptakan sama
◼ Neighbor yang lebih dekat memiliki suara yang lebih kuat daripada neighbor yang lebih jauh.
◼ Besarnya perolehan suara berbanding terbalik dengan jarak rekor baru.
◼ Untuk mencegah masalah ketika jaraknya mungkin 0, adalah umum untuk menambahkan 1 ke jarak sebelum melakukan invers.
◼ Prediksi atrisi dengan voting berbobot
◼ Keyakinan dengan pemungutan suara berbobot
K = 1 K = 2 K = 3 K = 4 K = 5
dnorma 0,749 hingga 0 1,441 hingga 0 1,441 hingga 0,647 2.085 hingga 0.647 2.085 hingga 1.290
deuclid 0,669 menjadi 0 0,669 hingga 0,562 0,669 hingga 1,062 1,157 hingga 1,062 1,601 hingga 1,062
K = 1 K = 2 K = 3 K = 4 K = 5
dnorma Ya, 100% Ya, 100% Ya, 69% Ya, 76% Ya, 62%
deuclid Ya, 100% Ya, 54% Ya, 61% Ya, 52% Ya, 60%
16. 6. KESIMPULAN
Kekuatan Penalaran Berbasis Memori (Memory Based Reason)
◼ Ini menghasilkan hasil yang mudah dimengerti.
◼ Ini berlaku untuk tipe data arbitrer, bahkan data non-relasional.
◼ Ia bekerja secara efisien di hampir semua bidang.
◼ Mempertahankan training set membutuhkan sedikit usaha.
Kelemahan Penalaran Berbasis Memori (Memory Based Reason)
◼ Ini mahal secara komputasi saat melakukan klasifikasi dan prediksi.
◼ Ini membutuhkan sejumlah besar penyimpanan untuk training set.
◼ Hasil dapat bergantung pada pilihan fungsi jarak, fungsi kombinasi, dan jumlah neighbor