SlideShare une entreprise Scribd logo
1  sur  6
Télécharger pour lire hors ligne
TUGAS DATA MINING 
Algoritma Covering dan Penerapannya 
Khairul Sani ( 13/359750/PTK/9462) 
Syamsul Mujahidin (13/359465/PTK/9440) 
S2 Teknologi Informasi 
Teknik Elektro dan Teknologi Informasi 
Universitas Gadjah Mada 
Dalam teknik klasifikasi ada banyak pendekatan yang dapat dilakukan, antara lain separate and conquer, divide and conquer, dan covering and statistical. Algoritma covering memiliki karakteristik yaitu mepertimbangkan hubungan antara nilai atribut dan spesifikasi klasifikasinya. Algoritma ini akan mengklasifikasi data berdasarkan nilai maksimal dari tiap kemungkinan nilai atribut. Nilai maksimal antribut didapat dari banyak data dalam tiap katagori dibagi dengan banyak data keseluruhan. Prolehan nilai maksimal dari tiap atribut kemudian akan dikombinasikan. Hasil yang didapatkan berupa kumpulan aturan-aturan dari atribut yang diproses. 
Algortima ini digunakan karena memiliki tingkat akurasi yang bagus, daya belajar yang cepat, kapasitas dalam hal proses data secara masif, dan kemudahan dalam menganalisis aturan-aturan yang dibentuk sehingga sering digunakan untuk menangani kasus tertentu. Salah satu bentuk penerapan dari algoritma covering adalah penangan pada masalah klasifikasi teks. Klasifikasi teks merupakan kegiatan mengurutkan kumpulan dokumen secara otomatis ke dalam kategori yang sudah didefinisikan. Dalam hal ini metode yang biasa digunakan adalah metode machine learning dan statistical learning. Metode tersebut memiliki keunggulan efektif dalam menangani noise data. Namun demikian, algoritma ini masih lemah dalam hal pembentukan aturan-aturan yang kuat dari domain pengetahuan sehingga digunakanlah algoritma covering untuk mengatasi masalah tersebut. 
Prosedur dari algoritma covering untuk mengatasi masalah klasifikasi teks adalah ekstrasi dari sejumlah prase yang akan menjadi calon aturan. Kemudian
melakukan klasifikasi terhadap prase tersebut, apakah masuk dalam sempel positif atau negatif. Sempel positif akan dimaksukkan dalam data latihan, sementara negatif sempel akan dibuang. Masing - masing data training (prase) akan dihitung frekuensi kenampakannya dalam dokumen kemudian dibagi dengan jumlah dokumen yang ada. Nilai maksimum dari perhitungan tersebut akan digunakan sebagai dasar untuk membentu aturan - aturan. Aturan – aturan tersebut nantinya akan digunakan untuk klasifikasi teks pada data yang baru. 
Pada jurnal lainnya yang berjudul Cross Covering Algorithm Based on Simulated Annealing mendeskripsikan terkait algoritma untuk untuk optimisasi yang bersifat generic. Simulated annealing (SA) adalah salah satu algoritma untuk untuk optimisasi yang bersifat generik. Berbasiskan probabilitas dan mekanika statistik, algoritma ini dapat digunakan untuk mencari pendekatan terhadap solusi optimum global dari suatu permasalahan. Masalah yang membutuhkan pendekatan SA adalah masalah-masalah optimisasi kombinatorial, di mana ruang pencarian solusi yang ada terlalu besar, sehingga hampir tidak mungkin ditemukan solusi eksak terhadap permasalahan itu. Publikasi tentang pendekatan ini pertama kali dilakukan oleh S. Kirkpatrick, C. D. Gelatt dan M. P. Vecchi, diaplikasikan pada desain optimal hardware komputer, dan juga pada salah satu masalah klasik ilmu komputer yaitu Traveling Salesman Problem. Annealing adalah satu teknik yang dikenal dalam bidang metalurgi, digunakan dalam mempelajari proses pembentukan kristal dalam suatu materi. Agar dapat terbentuk susunan kristal yang sempurna, diperlukan pemanasan sampai suatu tingkat tertentu, kemudian dilanjutkan dengan pendinginan yang perlahan-lahan dan terkendali dari materi tersebut. Pemanasan materi di awal proses annealing, memberikan kesempatan pada atom-atom dalam materi itu untuk bergerak secara bebas, mengingat tingkat energi dalam kondisi panas ini cukup tinggi. Proses pendinginan yang perlahan-lahan memungkinkan atom-atom yang tadinya bergerak bebas itu, pada akhirnya menemukan tempat yang optimum, di mana energi internal
yang dibutuhkan atom itu untuk mempertahankan posisinya adalah minimum, Metropolis et al. pada tahun 1953. 
Profesor Zhang menyatakan bahwa arti geometri M-Ps neuron, dan menunjukkan bahwa tiga lapis saraf pada jaringan untuk membangun classifier yang sama dengan mencari dan mengumpulkan domain yang mampu untuk dipartisi dari berbagai jenis masukan seperti vektor, dan disediakan covering algoritma yang lebih lanjut: Inti dari covering algoritma adalah menggunakan covering domain sebagai lapisan tersembunyi dari tiga lapisan jaringan saraf, yang diinput pada lapisan sampel set, hasil output berdasarkan hasil klasifikasi. Oleh karena itu, keutamaan dari covering algoritma adalah untuk membangun covering cluster. Adapun konsep dari covering model sebagai berikut : 
Pada penelitian tersebut menggunakan suatu algoritma covering karena memiliki kecepatan lebih rendah, dengan kompleksitas lebih rendah, tetapi dengan presisi yang tinggi. Tetapi pada construction berat pusat neuron biasanya domainnya memiliki kriteria sendiri, dan tidak dapat mengikuti distribusi sample untuk mencapai solusi yang omptimal. Pada penelitian tersebut membuat suatu algoritma baru menggabungkan antara cross covering algorithm dan penyajian dalam simulated annealing. Pada tahapan ini didapat pusat covering berdasarkan pencarian teori simulasi annealing. Hasil penelitian ini menampilkan algoritma dapat mengurangi jumlah dari covering dengan pengenalan akurasi yang lebih tinggi.
Pada penelitian ini untuk mengevaluasi kinerja algortima, mengambil empat data set dari University of california untuk repository mechine learning yang diterapkan. 
Dalam simulasi komputer, semua nilai atribut dalam set data linear berubah menjadi interval satuan. Dengan demikian, kita dapat menangani setiap set data sebagai masalah klasifikasi pola dalam n-dimensi satuan kubus [0,1] n. Pada exsperiment ini menggunakan sepuluh kali lipat crossvalidation (10-CV) teknik untuk setiap data set 10 kali, dengan menggunakan partisi yang berbeda dari kumpulan data. Dalam 10-CV, kumpulan data dibagi menjadi 10 subset dari ukuran yang sama. Sembilan subset digunakan sebagai pola pelatihan, dan bagian lainnya digunakan sebagai pola uji. Hasilnya ditunjukkan pada Gambar dibawah. Akurasi pengenalan pada Gambar dibawah ini menunjukan rata-rata dari sepuluh kali pelatihan dan pengujian. 
Hal ini dapat dilihat dari Gambar tersebut bahwa akurasi pengenalan rata-rata Sacca jelas lebih baik daripada CCA dan LIBSVM. Terutama pada dataset Kaca, kinerja Sacca ditingkatkan 9.55 poin persentase dari CCA, dan 10.91 persen dibanding classifier LIBSVM terkenal. Ini menunjukkan bahwa dengan titik yang mendapatkan dari penelusuran dari teori simulated annealing untuk pusat meliputi bisa memberikan perintah yang lebih baik untuk studi sampel, dan membuat pusat sampel keterwakilan sehingga domain meliputi dapat mencakup informasi lebih lanjut tentang predikasi. Pada penelitian mendapatkan kesimpulan dari data publik
hanya set, pada percobaan berikutnya, kita akan membuktikan algoritma praktis meskipun memilih data yang memiliki nilai lebih praktis. Dengan menggunakan data, kita akan menunjukkan keuntungan dari Sacca dalam aplikasi praktis. 
Gambar : results for LIBSVM, CCA and SACCA 
Kesimpulan: 
Dalam jurnal tersebut, konstruktif algoritma, cross covering algoritma dan berdasarkan simulasi annealing (Sacca) menunjukkan, hasil pada beberapa UCI database dan teks kategorisasi menunjukkan bahwa Sacca adalah performas yang bagus untuk classifier. Dapat digunakan simulasi annealing algoritma untuk mencari pusat covering, secara efektif dapat meningkatkan daerah covering serta mengurangi jumlah covering. 
Algoritma ini mengurangi kompleksitas dan meningkatkan kemampuan generalisasi dan menjaga kinerja pada tingkat tinggi. Penelitian tersebut dapat digunakan pada search enggine untuk melakukan penelitian serta pengembangan pada masa depan.
Referensi : 
[1] Cheng-Gang He, Yan-ping Zhang, Hui Sun, and Jin-Wei Gen, “A Novel Regression Method Research Based on Covering Algorithm,” Intell. Inf. Process. Trust. Comput. IPTC 2010 Int. Symp. On, pp. 41–44, Oct. 2010. 
[2] Jin-Hong Liu and Yu-Liang Lu, “Strong Rules Learning Algorithm for Ensemble Text Classification,” Mach. Learn. Cybern. 2007 Int. Conf. On, vol. 6, pp. 3601– 3606, Aug. 2007. 
[3] Zhang Yanping , Liu Chao,"Cross covering algoritma based on Simulated annealing," School of Computer Science and Technology, Anhui University, Hefei, China,2010.

Contenu connexe

Similaire à Data mining algoritma covering dan penerapannya

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
butest
 
perbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesiaperbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesia
BoyMorenaAllzytoroto
 
Ppt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andiniPpt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andini
Nita NTD
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Andika Dwi Hadiri
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
DeiHart DeiHart
 
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
Epul Logariasmoú
 

Similaire à Data mining algoritma covering dan penerapannya (20)

PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptxPPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
Pertemuan 4.pdf
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
 
PTLF PPT.pptx
PTLF PPT.pptxPTLF PPT.pptx
PTLF PPT.pptx
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
MAKALAH TENTANG ALGORITMA GENETIKA
MAKALAH TENTANG ALGORITMA GENETIKAMAKALAH TENTANG ALGORITMA GENETIKA
MAKALAH TENTANG ALGORITMA GENETIKA
 
Makalah Algoritma DAA 1
Makalah Algoritma DAA 1Makalah Algoritma DAA 1
Makalah Algoritma DAA 1
 
Pengantar komputasi modern: tugas 2
Pengantar komputasi modern: tugas 2Pengantar komputasi modern: tugas 2
Pengantar komputasi modern: tugas 2
 
perbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesiaperbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesia
 
Ppt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andiniPpt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andini
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
 
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
 
1.Pendahuluan PO_1.ppt
1.Pendahuluan PO_1.ppt1.Pendahuluan PO_1.ppt
1.Pendahuluan PO_1.ppt
 
04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt
 
Tutorial WEKA.ppt
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.ppt
 
Materi 2 Konsep Dasar Simulasi.pptx
Materi 2 Konsep Dasar Simulasi.pptxMateri 2 Konsep Dasar Simulasi.pptx
Materi 2 Konsep Dasar Simulasi.pptx
 

Plus de Universitas Gadjah Mada (6)

Jaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDUJaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDU
 
Perkembangan Piranti Multimedia
Perkembangan Piranti MultimediaPerkembangan Piranti Multimedia
Perkembangan Piranti Multimedia
 
Audit fraud and corruption
Audit   fraud and corruptionAudit   fraud and corruption
Audit fraud and corruption
 
Information system in bussines today
Information system in bussines todayInformation system in bussines today
Information system in bussines today
 
Tugas switching khairul sani
Tugas switching khairul saniTugas switching khairul sani
Tugas switching khairul sani
 
Tugas 1 data mining publish
Tugas 1 data mining publishTugas 1 data mining publish
Tugas 1 data mining publish
 

Dernier

Kenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).pptKenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).ppt
novibernadina
 
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 20241. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
DessyArliani
 
PPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptx
PPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptxPPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptx
PPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptx
MaskuratulMunawaroh
 
HAK DAN KEWAJIBAN WARGA NEGARA ppkn i.ppt
HAK DAN KEWAJIBAN WARGA NEGARA ppkn i.pptHAK DAN KEWAJIBAN WARGA NEGARA ppkn i.ppt
HAK DAN KEWAJIBAN WARGA NEGARA ppkn i.ppt
nabilafarahdiba95
 
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdfAksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
JarzaniIsmail
 
Contoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxContoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptx
IvvatulAini
 

Dernier (20)

Kenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).pptKenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).ppt
 
Pengenalan Figma, Figma Indtroduction, Figma
Pengenalan Figma, Figma Indtroduction, FigmaPengenalan Figma, Figma Indtroduction, Figma
Pengenalan Figma, Figma Indtroduction, Figma
 
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
 
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
 
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdfMODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
 
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 20241. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
 
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
 
Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...
Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...
Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...
 
power point bahasa indonesia "Karya Ilmiah"
power point bahasa indonesia "Karya Ilmiah"power point bahasa indonesia "Karya Ilmiah"
power point bahasa indonesia "Karya Ilmiah"
 
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMMPenyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
 
PPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptx
PPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptxPPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptx
PPT SOSIALISASI PENGELOLAAN KINERJA GURU DAN KS 2024.pptx
 
HAK DAN KEWAJIBAN WARGA NEGARA ppkn i.ppt
HAK DAN KEWAJIBAN WARGA NEGARA ppkn i.pptHAK DAN KEWAJIBAN WARGA NEGARA ppkn i.ppt
HAK DAN KEWAJIBAN WARGA NEGARA ppkn i.ppt
 
AKSI NYATA Numerasi Meningkatkan Kompetensi Murid_compressed (1) (1).pptx
AKSI NYATA  Numerasi  Meningkatkan Kompetensi Murid_compressed (1) (1).pptxAKSI NYATA  Numerasi  Meningkatkan Kompetensi Murid_compressed (1) (1).pptx
AKSI NYATA Numerasi Meningkatkan Kompetensi Murid_compressed (1) (1).pptx
 
Aksi Nyata Menyebarkan (Pemahaman Mengapa Kurikulum Perlu Berubah) Oleh Nur A...
Aksi Nyata Menyebarkan (Pemahaman Mengapa Kurikulum Perlu Berubah) Oleh Nur A...Aksi Nyata Menyebarkan (Pemahaman Mengapa Kurikulum Perlu Berubah) Oleh Nur A...
Aksi Nyata Menyebarkan (Pemahaman Mengapa Kurikulum Perlu Berubah) Oleh Nur A...
 
Modul Ajar IPAS Kelas 4 Fase B Kurikulum Merdeka [abdiera.com]
Modul Ajar IPAS Kelas 4 Fase B Kurikulum Merdeka [abdiera.com]Modul Ajar IPAS Kelas 4 Fase B Kurikulum Merdeka [abdiera.com]
Modul Ajar IPAS Kelas 4 Fase B Kurikulum Merdeka [abdiera.com]
 
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdfAksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
 
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
 
Contoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxContoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptx
 
Penyuluhan DM Tipe II Kegiatan Prolanis.ppt
Penyuluhan DM Tipe II Kegiatan Prolanis.pptPenyuluhan DM Tipe II Kegiatan Prolanis.ppt
Penyuluhan DM Tipe II Kegiatan Prolanis.ppt
 
PPT PENDIDIKAN KELAS RANGKAP MODUL 3 KELOMPOK 3.pptx
PPT PENDIDIKAN KELAS RANGKAP MODUL 3 KELOMPOK 3.pptxPPT PENDIDIKAN KELAS RANGKAP MODUL 3 KELOMPOK 3.pptx
PPT PENDIDIKAN KELAS RANGKAP MODUL 3 KELOMPOK 3.pptx
 

Data mining algoritma covering dan penerapannya

  • 1. TUGAS DATA MINING Algoritma Covering dan Penerapannya Khairul Sani ( 13/359750/PTK/9462) Syamsul Mujahidin (13/359465/PTK/9440) S2 Teknologi Informasi Teknik Elektro dan Teknologi Informasi Universitas Gadjah Mada Dalam teknik klasifikasi ada banyak pendekatan yang dapat dilakukan, antara lain separate and conquer, divide and conquer, dan covering and statistical. Algoritma covering memiliki karakteristik yaitu mepertimbangkan hubungan antara nilai atribut dan spesifikasi klasifikasinya. Algoritma ini akan mengklasifikasi data berdasarkan nilai maksimal dari tiap kemungkinan nilai atribut. Nilai maksimal antribut didapat dari banyak data dalam tiap katagori dibagi dengan banyak data keseluruhan. Prolehan nilai maksimal dari tiap atribut kemudian akan dikombinasikan. Hasil yang didapatkan berupa kumpulan aturan-aturan dari atribut yang diproses. Algortima ini digunakan karena memiliki tingkat akurasi yang bagus, daya belajar yang cepat, kapasitas dalam hal proses data secara masif, dan kemudahan dalam menganalisis aturan-aturan yang dibentuk sehingga sering digunakan untuk menangani kasus tertentu. Salah satu bentuk penerapan dari algoritma covering adalah penangan pada masalah klasifikasi teks. Klasifikasi teks merupakan kegiatan mengurutkan kumpulan dokumen secara otomatis ke dalam kategori yang sudah didefinisikan. Dalam hal ini metode yang biasa digunakan adalah metode machine learning dan statistical learning. Metode tersebut memiliki keunggulan efektif dalam menangani noise data. Namun demikian, algoritma ini masih lemah dalam hal pembentukan aturan-aturan yang kuat dari domain pengetahuan sehingga digunakanlah algoritma covering untuk mengatasi masalah tersebut. Prosedur dari algoritma covering untuk mengatasi masalah klasifikasi teks adalah ekstrasi dari sejumlah prase yang akan menjadi calon aturan. Kemudian
  • 2. melakukan klasifikasi terhadap prase tersebut, apakah masuk dalam sempel positif atau negatif. Sempel positif akan dimaksukkan dalam data latihan, sementara negatif sempel akan dibuang. Masing - masing data training (prase) akan dihitung frekuensi kenampakannya dalam dokumen kemudian dibagi dengan jumlah dokumen yang ada. Nilai maksimum dari perhitungan tersebut akan digunakan sebagai dasar untuk membentu aturan - aturan. Aturan – aturan tersebut nantinya akan digunakan untuk klasifikasi teks pada data yang baru. Pada jurnal lainnya yang berjudul Cross Covering Algorithm Based on Simulated Annealing mendeskripsikan terkait algoritma untuk untuk optimisasi yang bersifat generic. Simulated annealing (SA) adalah salah satu algoritma untuk untuk optimisasi yang bersifat generik. Berbasiskan probabilitas dan mekanika statistik, algoritma ini dapat digunakan untuk mencari pendekatan terhadap solusi optimum global dari suatu permasalahan. Masalah yang membutuhkan pendekatan SA adalah masalah-masalah optimisasi kombinatorial, di mana ruang pencarian solusi yang ada terlalu besar, sehingga hampir tidak mungkin ditemukan solusi eksak terhadap permasalahan itu. Publikasi tentang pendekatan ini pertama kali dilakukan oleh S. Kirkpatrick, C. D. Gelatt dan M. P. Vecchi, diaplikasikan pada desain optimal hardware komputer, dan juga pada salah satu masalah klasik ilmu komputer yaitu Traveling Salesman Problem. Annealing adalah satu teknik yang dikenal dalam bidang metalurgi, digunakan dalam mempelajari proses pembentukan kristal dalam suatu materi. Agar dapat terbentuk susunan kristal yang sempurna, diperlukan pemanasan sampai suatu tingkat tertentu, kemudian dilanjutkan dengan pendinginan yang perlahan-lahan dan terkendali dari materi tersebut. Pemanasan materi di awal proses annealing, memberikan kesempatan pada atom-atom dalam materi itu untuk bergerak secara bebas, mengingat tingkat energi dalam kondisi panas ini cukup tinggi. Proses pendinginan yang perlahan-lahan memungkinkan atom-atom yang tadinya bergerak bebas itu, pada akhirnya menemukan tempat yang optimum, di mana energi internal
  • 3. yang dibutuhkan atom itu untuk mempertahankan posisinya adalah minimum, Metropolis et al. pada tahun 1953. Profesor Zhang menyatakan bahwa arti geometri M-Ps neuron, dan menunjukkan bahwa tiga lapis saraf pada jaringan untuk membangun classifier yang sama dengan mencari dan mengumpulkan domain yang mampu untuk dipartisi dari berbagai jenis masukan seperti vektor, dan disediakan covering algoritma yang lebih lanjut: Inti dari covering algoritma adalah menggunakan covering domain sebagai lapisan tersembunyi dari tiga lapisan jaringan saraf, yang diinput pada lapisan sampel set, hasil output berdasarkan hasil klasifikasi. Oleh karena itu, keutamaan dari covering algoritma adalah untuk membangun covering cluster. Adapun konsep dari covering model sebagai berikut : Pada penelitian tersebut menggunakan suatu algoritma covering karena memiliki kecepatan lebih rendah, dengan kompleksitas lebih rendah, tetapi dengan presisi yang tinggi. Tetapi pada construction berat pusat neuron biasanya domainnya memiliki kriteria sendiri, dan tidak dapat mengikuti distribusi sample untuk mencapai solusi yang omptimal. Pada penelitian tersebut membuat suatu algoritma baru menggabungkan antara cross covering algorithm dan penyajian dalam simulated annealing. Pada tahapan ini didapat pusat covering berdasarkan pencarian teori simulasi annealing. Hasil penelitian ini menampilkan algoritma dapat mengurangi jumlah dari covering dengan pengenalan akurasi yang lebih tinggi.
  • 4. Pada penelitian ini untuk mengevaluasi kinerja algortima, mengambil empat data set dari University of california untuk repository mechine learning yang diterapkan. Dalam simulasi komputer, semua nilai atribut dalam set data linear berubah menjadi interval satuan. Dengan demikian, kita dapat menangani setiap set data sebagai masalah klasifikasi pola dalam n-dimensi satuan kubus [0,1] n. Pada exsperiment ini menggunakan sepuluh kali lipat crossvalidation (10-CV) teknik untuk setiap data set 10 kali, dengan menggunakan partisi yang berbeda dari kumpulan data. Dalam 10-CV, kumpulan data dibagi menjadi 10 subset dari ukuran yang sama. Sembilan subset digunakan sebagai pola pelatihan, dan bagian lainnya digunakan sebagai pola uji. Hasilnya ditunjukkan pada Gambar dibawah. Akurasi pengenalan pada Gambar dibawah ini menunjukan rata-rata dari sepuluh kali pelatihan dan pengujian. Hal ini dapat dilihat dari Gambar tersebut bahwa akurasi pengenalan rata-rata Sacca jelas lebih baik daripada CCA dan LIBSVM. Terutama pada dataset Kaca, kinerja Sacca ditingkatkan 9.55 poin persentase dari CCA, dan 10.91 persen dibanding classifier LIBSVM terkenal. Ini menunjukkan bahwa dengan titik yang mendapatkan dari penelusuran dari teori simulated annealing untuk pusat meliputi bisa memberikan perintah yang lebih baik untuk studi sampel, dan membuat pusat sampel keterwakilan sehingga domain meliputi dapat mencakup informasi lebih lanjut tentang predikasi. Pada penelitian mendapatkan kesimpulan dari data publik
  • 5. hanya set, pada percobaan berikutnya, kita akan membuktikan algoritma praktis meskipun memilih data yang memiliki nilai lebih praktis. Dengan menggunakan data, kita akan menunjukkan keuntungan dari Sacca dalam aplikasi praktis. Gambar : results for LIBSVM, CCA and SACCA Kesimpulan: Dalam jurnal tersebut, konstruktif algoritma, cross covering algoritma dan berdasarkan simulasi annealing (Sacca) menunjukkan, hasil pada beberapa UCI database dan teks kategorisasi menunjukkan bahwa Sacca adalah performas yang bagus untuk classifier. Dapat digunakan simulasi annealing algoritma untuk mencari pusat covering, secara efektif dapat meningkatkan daerah covering serta mengurangi jumlah covering. Algoritma ini mengurangi kompleksitas dan meningkatkan kemampuan generalisasi dan menjaga kinerja pada tingkat tinggi. Penelitian tersebut dapat digunakan pada search enggine untuk melakukan penelitian serta pengembangan pada masa depan.
  • 6. Referensi : [1] Cheng-Gang He, Yan-ping Zhang, Hui Sun, and Jin-Wei Gen, “A Novel Regression Method Research Based on Covering Algorithm,” Intell. Inf. Process. Trust. Comput. IPTC 2010 Int. Symp. On, pp. 41–44, Oct. 2010. [2] Jin-Hong Liu and Yu-Liang Lu, “Strong Rules Learning Algorithm for Ensemble Text Classification,” Mach. Learn. Cybern. 2007 Int. Conf. On, vol. 6, pp. 3601– 3606, Aug. 2007. [3] Zhang Yanping , Liu Chao,"Cross covering algoritma based on Simulated annealing," School of Computer Science and Technology, Anhui University, Hefei, China,2010.