SlideShare une entreprise Scribd logo
1  sur  23
Klasifikasi dengan Naive Bayes
Business Intelligent
Naive Bayes
• Simple Naive Bayesian Classifier merupakan salah
satu metode pengklasifikasi berpeluang
sederhana yang berdasarkan pada penerapan
Teorema Bayes dengan asumsi antar variabel
penjelas saling bebas (independen).
• Algoritma ini memanfaatkan metode probabilitas
dan statistik yang dikemukakan oleh ilmuwan
Inggris Thomas Bayes, yaitu memprediksi
probabilitas di masa depan berdasarkan
pengalaman di masa sebelumnya.
...
• Dua kelompok peneliti, satu oleh Pantel dan Lin, dan
yang lain oleh Microsoft Research memperkenalkan
metode statistik Bayesian ini pada teknologi anti spam
filter.
• Tetapi yang membuat algoritma Bayesian filtering ini
popular adalah pendekatan yang dilakukan oleh Paul
Graham. Dasar dari teorema naive digunakan dalam
pemrograman adalah rumus Bayes berikut ini:
P (A|B) = (P(B|A) * P(A))/P(B)
Artinya Peluang kejadian A sebagai B ditentukan dari
peluang B saat A, peluang A, dan peluang B.
Penerapan Naive Bayes
• Untuk klasifikasi Dokumen
• Untuk deteksi SPAM atau fitering SPAM
Contoh Kasus (1)
• Misalnya terdapat ingin diketahui apakah
suatu objek masuk dalam ketegori dipilih
untuk perumahan atau tidak dengan algoritma
Naive Bayes Classifier. Untuk menetapkan
suatu daerah akan dipilih sebagai lokasi untuk
mendirikan perumahan, telah dihimpun 10
aturan.
...
• Ada 4 atribut yang digunakan, yaitu:
– harga tanah per meter persegi (C1),
– jarak daerah tersebut dari pusat kota (C2),
– ada atau tidaknya angkutan umum di daerah
tersebut (C3), dan
– keputusan untuk memilih daerah tersebut sebagai
lokasi perumahan (C4).
...
...
• Probabilitas kemunculan setiap nilai untuk atribut
Harga Tanah (C1)
...
• Probabilitas kemunculan setiap nilai untuk atribut
Jarak dari Pusat Kota (C2)
...
• Probabilitas kemunculan setiap nilai untuk atribut
Ada Angkutan Umum (C3)
...
• Probabilitas kemunculan setiap nilai untuk atribut
Dipilih untuk perumahan (C4)
...
• Test Set: Berdasarkan data tersebut, apabila diketahui
suatu daerah dengan harga tanah MAHAL, jarak dari
pusat kota SEDANG, dan ADA angkutan umum, maka
dapat dihitung:
YA = P(Ya|Tanah=MAHAL) . P(Ya|Jarak=SEDANG) .
P(Ya|Angkutan=ADA) . P(Ya)
= 1/5 x 2/5 x 1/5 x 5/10 = 2/125 = 0,008
TIDAK = P(Tidak| Tanah=MAHAL) . P(Tidak|Jarak=SEDANG) .
P(Tidak|Angkutan=ADA) . P(Tidak)
= 3/5 x 1/5 x 3/5 x 5/10 = 2/125 = 0,036
...
• Nilai probabilitas dapat dihitung dengan melakukan
normalisasi terhadap likelihood tersebut sehingga
jumlah nilai yang diperoleh = 1
Contoh Kasus (2)
• Untuk jenis data harga tanah dan jarak pusat kota
yang kontinue, misalnya :
...
• Namun jika atribut ke-i bersifat kontinu, maka P(xi|C)
diestimasi dengan fungsi densitas Gauss.
• Distribusi normal adalah distribusi dari variabel acak
kontinu. Kadang-kadang distribusi normal disebut
juga dengan distribusi Gauss. Distribusi ini
merupakan distribusi yang paling penting dan paling
banyak digunakan di bidang statistika.
e = 2,7183
...
• Probabilitas kemunculan setiap nilai untuk
atribut Harga Tanah (C1)
...
• Probabilitas kemunculan setiap nilai untuk
atribut Jarak dari Pusat Kota (C2)
...
• Probabilitas kemunculan setiap nilai untuk
atribut Angkutan Umum (C3)
...
• Probabilitas kemunculan setiap nilai untuk
atribut Dipilih untuk Perumahan (C4)
=NORMDIST(300,212,168.8787,0)
• Apabila diberikan C1 = 300, C2 = 17, C3 =
Tidak, maka:
...
Likelihood Ya = (0,0021) x (0,0009) x 4/5 x 5/10
= 0,000000756.
Likelihood Tidak = (0,0013) x (0,0633) x 2/5 x 5/10
= 0,000016458.
...
• Nilai probabilitas dapat dihitung dengan melakukan
normalisasi terhadap likelihood tersebut sehingga
jumlah nilai yang diperoleh = 1
Terima Kasih 

Contenu connexe

Plus de nyomans1

fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...nyomans1
 
10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptx10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptxnyomans1
 
08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptx08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptxnyomans1
 
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptxnyomans1
 
04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptx04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptxnyomans1
 
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptxnyomans1
 
03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptx03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptxnyomans1
 
Q-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptxQ-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptxnyomans1
 
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptxBAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptxnyomans1
 
Support-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptxSupport-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptxnyomans1
 
06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptx06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptxnyomans1
 
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptxnyomans1
 
nlp dl 1.pdf
nlp dl 1.pdfnlp dl 1.pdf
nlp dl 1.pdfnyomans1
 
DT3 In.pptx
DT3 In.pptxDT3 In.pptx
DT3 In.pptxnyomans1
 
DT3 In.pptx
DT3 In.pptxDT3 In.pptx
DT3 In.pptxnyomans1
 
04-Digitalisasi-citra.pptx
04-Digitalisasi-citra.pptx04-Digitalisasi-citra.pptx
04-Digitalisasi-citra.pptxnyomans1
 
vision_2.ppt
vision_2.pptvision_2.ppt
vision_2.pptnyomans1
 
vision.ppt
vision.pptvision.ppt
vision.pptnyomans1
 

Plus de nyomans1 (20)

fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
 
10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptx10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptx
 
08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptx08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptx
 
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
 
04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptx04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptx
 
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
 
03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptx03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptx
 
Q-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptxQ-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptx
 
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptxBAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
 
Support-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptxSupport-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptx
 
06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptx06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptx
 
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
 
nlp2.pdf
nlp2.pdfnlp2.pdf
nlp2.pdf
 
nlp dl 1.pdf
nlp dl 1.pdfnlp dl 1.pdf
nlp dl 1.pdf
 
nlp 1.pdf
nlp 1.pdfnlp 1.pdf
nlp 1.pdf
 
DT3 In.pptx
DT3 In.pptxDT3 In.pptx
DT3 In.pptx
 
DT3 In.pptx
DT3 In.pptxDT3 In.pptx
DT3 In.pptx
 
04-Digitalisasi-citra.pptx
04-Digitalisasi-citra.pptx04-Digitalisasi-citra.pptx
04-Digitalisasi-citra.pptx
 
vision_2.ppt
vision_2.pptvision_2.ppt
vision_2.ppt
 
vision.ppt
vision.pptvision.ppt
vision.ppt
 

Dernier

Instrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptxInstrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptxZhardestiny
 
Menggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxMenggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxImahMagwa
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksdanzztzy405
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Shary Armonitha
 
PPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptxPPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptxsitifaiza3
 
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugaslisapalena
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxzidanlbs25
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningSamFChaerul
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfAuliaAulia63
 

Dernier (9)

Instrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptxInstrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptx
 
Menggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxMenggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptx
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
 
PPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptxPPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptx
 
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data mining
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdf
 

Naive Bayes Klasifikasi 40

  • 1. Klasifikasi dengan Naive Bayes Business Intelligent
  • 2. Naive Bayes • Simple Naive Bayesian Classifier merupakan salah satu metode pengklasifikasi berpeluang sederhana yang berdasarkan pada penerapan Teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen). • Algoritma ini memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya.
  • 3. ... • Dua kelompok peneliti, satu oleh Pantel dan Lin, dan yang lain oleh Microsoft Research memperkenalkan metode statistik Bayesian ini pada teknologi anti spam filter. • Tetapi yang membuat algoritma Bayesian filtering ini popular adalah pendekatan yang dilakukan oleh Paul Graham. Dasar dari teorema naive digunakan dalam pemrograman adalah rumus Bayes berikut ini: P (A|B) = (P(B|A) * P(A))/P(B) Artinya Peluang kejadian A sebagai B ditentukan dari peluang B saat A, peluang A, dan peluang B.
  • 4. Penerapan Naive Bayes • Untuk klasifikasi Dokumen • Untuk deteksi SPAM atau fitering SPAM
  • 5. Contoh Kasus (1) • Misalnya terdapat ingin diketahui apakah suatu objek masuk dalam ketegori dipilih untuk perumahan atau tidak dengan algoritma Naive Bayes Classifier. Untuk menetapkan suatu daerah akan dipilih sebagai lokasi untuk mendirikan perumahan, telah dihimpun 10 aturan.
  • 6. ... • Ada 4 atribut yang digunakan, yaitu: – harga tanah per meter persegi (C1), – jarak daerah tersebut dari pusat kota (C2), – ada atau tidaknya angkutan umum di daerah tersebut (C3), dan – keputusan untuk memilih daerah tersebut sebagai lokasi perumahan (C4).
  • 7. ...
  • 8. ... • Probabilitas kemunculan setiap nilai untuk atribut Harga Tanah (C1)
  • 9. ... • Probabilitas kemunculan setiap nilai untuk atribut Jarak dari Pusat Kota (C2)
  • 10. ... • Probabilitas kemunculan setiap nilai untuk atribut Ada Angkutan Umum (C3)
  • 11. ... • Probabilitas kemunculan setiap nilai untuk atribut Dipilih untuk perumahan (C4)
  • 12. ... • Test Set: Berdasarkan data tersebut, apabila diketahui suatu daerah dengan harga tanah MAHAL, jarak dari pusat kota SEDANG, dan ADA angkutan umum, maka dapat dihitung: YA = P(Ya|Tanah=MAHAL) . P(Ya|Jarak=SEDANG) . P(Ya|Angkutan=ADA) . P(Ya) = 1/5 x 2/5 x 1/5 x 5/10 = 2/125 = 0,008 TIDAK = P(Tidak| Tanah=MAHAL) . P(Tidak|Jarak=SEDANG) . P(Tidak|Angkutan=ADA) . P(Tidak) = 3/5 x 1/5 x 3/5 x 5/10 = 2/125 = 0,036
  • 13. ... • Nilai probabilitas dapat dihitung dengan melakukan normalisasi terhadap likelihood tersebut sehingga jumlah nilai yang diperoleh = 1
  • 14. Contoh Kasus (2) • Untuk jenis data harga tanah dan jarak pusat kota yang kontinue, misalnya :
  • 15. ... • Namun jika atribut ke-i bersifat kontinu, maka P(xi|C) diestimasi dengan fungsi densitas Gauss. • Distribusi normal adalah distribusi dari variabel acak kontinu. Kadang-kadang distribusi normal disebut juga dengan distribusi Gauss. Distribusi ini merupakan distribusi yang paling penting dan paling banyak digunakan di bidang statistika. e = 2,7183
  • 16. ... • Probabilitas kemunculan setiap nilai untuk atribut Harga Tanah (C1)
  • 17. ... • Probabilitas kemunculan setiap nilai untuk atribut Jarak dari Pusat Kota (C2)
  • 18. ... • Probabilitas kemunculan setiap nilai untuk atribut Angkutan Umum (C3)
  • 19. ... • Probabilitas kemunculan setiap nilai untuk atribut Dipilih untuk Perumahan (C4)
  • 20. =NORMDIST(300,212,168.8787,0) • Apabila diberikan C1 = 300, C2 = 17, C3 = Tidak, maka:
  • 21. ... Likelihood Ya = (0,0021) x (0,0009) x 4/5 x 5/10 = 0,000000756. Likelihood Tidak = (0,0013) x (0,0633) x 2/5 x 5/10 = 0,000016458.
  • 22. ... • Nilai probabilitas dapat dihitung dengan melakukan normalisasi terhadap likelihood tersebut sehingga jumlah nilai yang diperoleh = 1