SlideShare une entreprise Scribd logo
1  sur  13
Similarity and
Disimilarity
Irwansyah Saputra, S.Kom., M.Kom., MTA
Founder of Multinity Indonesia
Tentang Saya
• Irwansyah Saputra
• Dosen Ilmu Komputer
• Mahasiswa S3 Ilmu Komputer IPB University
• Bidang Kajian: Computational Intelligence &
Optimization (Data mining, machine
learning, artificial intelligence)
Halo semuanya, saya suka belajar tentang
segala hal dan suka berbagi pengetahuan. Saya
juga sering menjadi pembicara di berbagai
seminar.
Kontak yang bisa dihubungi:
WhatsApp: 0895323302241
Instagram: @irwansight_
Web: https://irw.one
Disclaimer
Materi ini digunakan sebagai bahan ajar Program Data Mining di
Multinity.id
Silakan gunakan, mohon untuk tidak mengubah template.
Jika Anda memiliki kesulitan dalam memahami materi pada slide
ini, silakan belajar di Multinity.id
Referensi
1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Third
Edition, Elsevier, 2012
2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning
Tools and Techniques 3rd Edition, Elsevier, 2011
3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and
Business Analytics Applications, CRC Press Taylor & Francis Group, 2014
4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining,
John Wiley & Sons, 2005
5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press, 2014
6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer,
2011
7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook
Second Edition, Springer, 2010
8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining
of Enterprise Data: Algorithms and Applications, World Scientific, 2007
9. Suyanto, DATA MINING: Untuk klasifikasi dan klasterisasi data, Penerbit
Informatika, 2017
Euclidian Distance
• Teknik pengukuran jarak Euclidian Distance merupakan teknik yang
sangat populer digunakan untuk atribut dengan tipe data numerik.
• Rumus:
𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 =
𝑖=1
𝑛
𝑝𝑖 − 𝑞𝑖
2
= 𝑝1 − 𝑞1
2 + 𝑝2 − 𝑞2
2 + ⋯ + 𝑝𝑛 − 𝑞𝑛
2
Keterangan:
P, Q : Tupel dari tiap atribut yang akan dihitung
Euclidian Distance
• Teknik euclidian distance memiliki cara kerja dengan mencari jarak
terpendek antar dua objek tanpa melihat rintangan pada jalur yang
dilaluinya.
• Euclidian distance tidak dapat memberi informasi jarak terpendek
dalam dunia penerbangan karena (dunia penerbangan) mengikuti
kelengkungan bumi.
Manhattan Distance
• Teknik ini sedikit kalah populer dengan euclidian distance, namun penting
untuk dibahas karena memiliki pendekatan yang berbeda.
• Secara fungsi, manhattan distance juga dapat digunakan untuk tugas
klasifikasi, klaster, pengolahan citra dan kasus lainnya.
• Cara kerja manhattan berbeda dengan teknik sebelumnya, karena ia berjalan
pada grid, tidak menerobos rintangan seperti euclidian.
• Rumusnya
𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 = 𝑝𝑖 − 𝑞𝑖
2
Keterangan:
P, Q : Tupel dari tiap atribut yang akan dihitung
Manhattan Distance
• Manhattan lebih cepat dalam proses komputasi dan dapat digunakan untuk
menghitung jarak antar lokasi titik pada peta, karena jalan raya memiliki
jalurnya tersendiri dan terdapat penghalang seperti gedung atau objek lain.
• Sehingga, sangat tidak mungkin jika perhitungan jarak antar lokasi nyata ini
menggunakan euclidian distance.
Chebyshev Distance
• Berbeda dengan kedua teknik pengukuran jarak sebelumnya, Chebyshev
distance didefinisikan sebagai perbedaan terbesar antara dua vektor di
sepanjang dimensi koordinat apa pun.
• Maksudnya, teknik ini hanyalah jarak maksimum dari suatu sumbu.
𝑑 𝑃, 𝑄 = max 𝑃 − 𝑄 = 𝑚𝑎𝑥 𝑝𝑖 − 𝑞𝑖
• Pada rumus tersebut kita bisa melihat bahwa cara kerja Chebyshev distance
adalah mencari selisih maksimum di antara kedua vektor.
• Selisih tersebut kemudian diabsolutkan untuk mencegah terjadinya minus.
Karena tidak mungkin ada jarak yang minus dalam kehidupan nyata.
Chebyshev Distance
• Agar lebih memahami tentang ini, kita bisa
gunakan gerakan raja pada permainan catur.
• Misalnya raja ingin berjalan mencapai titik
lingkaran.
• Ada berbagai kemungkinan cara
melangkahnya, namun di sini kita gunakan dua
pilihan saja agar lebih mudah dipahami, yaitu
jalur kanan dan jalur kiri.
• Jika kita melihat dengan baik, jalur kanan
memiliki langkah lebih cepat dari yang kiri
karena hanya 4 langkah saja, raja sudah
sampai tujuan.
• Berbeda dengan yang kiri, raja membutuhkan
6 langkah untuk menuju ke tujuan.
4
2
Cosine Similarity
• Teknik cosine similarity biasanya digunakan untuk mengatasi data yang
berdimensi tinggi seperti data teks.
• cosine similarity mengabaikan nilai dari suatu vektor, yang akan dihitung
adalah arahnya saja.
• Misalnya pada kata “baik” dan “jahat”. Kedua kata tersebut akan dinilai 1 oleh
cosine similarity.
• Rumus:
𝐷 𝑥, 𝑦 = cos 𝜃 =
𝑥. 𝑦
𝑥 𝑦
Cosine Similarity
• Untuk memahami lebih dalam terkait teknik cosine similarity, kita akan
menggunakan contoh dua dokumen sebagai berikut:
• D1 : “Kerja Kerja Kerja Typus”
• D2 : “Typus Typus Kerja Kerja”
• Kita anggap “Kerja” menjadi sumbu x, sedangkan “Typus” menjadi sumbu y. Maka
kita akan mendapatkan vektor A (3,1), vektor B (2,2). Langkah perhitungannya
menjadi:
cos 𝜃 =
𝑥. 𝑦
𝑥 𝑦
=
𝑥1𝑦1 + 𝑥2𝑦2
𝑥1
2
+ 𝑥2
2
. 𝑦1
2
+ 𝑦2
2
=
3.2 + 1.2
32 + 12 . 22 + 22
=
8
10 . 8
= 0.894
Cosine Similarity
• Berdasarkan hasil tersebut berarti dokumen A dan dokumen B memiliki
kemiripan yang dekat.
• Namun nilai tersebut tidak bisa kita ubah ke dalam persen, misalnya menjadi
89,4% dan mengatakan bahwa kemiripan dua dokumen tersebut adalah
sebesar 89,4%.
• Jika kita ingin melihat seberapa dekat kedua dokumen tersebut dalam bentuk
visual, maka ubah saja hasil 0,894 ke bentuk sudut cosinus, maka akan
didapatkan sudut sebesar 26.619729544329°. Hasilnya:
A
B
26°

Contenu connexe

Tendances

Penyederhanaan Fungsi Boolean
Penyederhanaan Fungsi BooleanPenyederhanaan Fungsi Boolean
Penyederhanaan Fungsi Boolean
Fahrul Razi
 
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Kelinci Coklat
 

Tendances (20)

Sistem Pakar Certainty factor
Sistem Pakar Certainty factor Sistem Pakar Certainty factor
Sistem Pakar Certainty factor
 
Slide minggu 6 (citra digital)
Slide minggu 6 (citra digital)Slide minggu 6 (citra digital)
Slide minggu 6 (citra digital)
 
Algoritma flowchart
Algoritma flowchartAlgoritma flowchart
Algoritma flowchart
 
Matematika Diskrit kombinatorial
Matematika Diskrit  kombinatorialMatematika Diskrit  kombinatorial
Matematika Diskrit kombinatorial
 
Penyederhanaan Fungsi Boolean
Penyederhanaan Fungsi BooleanPenyederhanaan Fungsi Boolean
Penyederhanaan Fungsi Boolean
 
Fungsi Dua Peubah ( Kalkulus 2 )
Fungsi Dua Peubah ( Kalkulus 2 )Fungsi Dua Peubah ( Kalkulus 2 )
Fungsi Dua Peubah ( Kalkulus 2 )
 
Perbandingan algoritma brute force , divide and conquer
Perbandingan algoritma brute force , divide and conquerPerbandingan algoritma brute force , divide and conquer
Perbandingan algoritma brute force , divide and conquer
 
Rantai Markov 1
Rantai Markov 1Rantai Markov 1
Rantai Markov 1
 
2. galat
2. galat2. galat
2. galat
 
Analisis regresi.
Analisis regresi.Analisis regresi.
Analisis regresi.
 
Data mining 5 klasifikasi decision tree dan random forest
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forest
 
Matematika Diskrit - 11 kompleksitas algoritma - 03
Matematika Diskrit - 11 kompleksitas algoritma - 03Matematika Diskrit - 11 kompleksitas algoritma - 03
Matematika Diskrit - 11 kompleksitas algoritma - 03
 
Integral Lipat Tiga
Integral Lipat TigaIntegral Lipat Tiga
Integral Lipat Tiga
 
Jaringan Syaraf Tiruan (JST)
Jaringan Syaraf Tiruan (JST)Jaringan Syaraf Tiruan (JST)
Jaringan Syaraf Tiruan (JST)
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
 
Variabel acak dan nilai harapan (Statistik Ekonomi II)
Variabel acak dan nilai harapan (Statistik Ekonomi II)Variabel acak dan nilai harapan (Statistik Ekonomi II)
Variabel acak dan nilai harapan (Statistik Ekonomi II)
 
Data mining 2 exploratory data analysis
Data mining 2   exploratory data analysisData mining 2   exploratory data analysis
Data mining 2 exploratory data analysis
 
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
 
TEKNIK ENKRIPSI DAN DEKRIPSI HILL CIPHER
TEKNIK ENKRIPSI DAN DEKRIPSI HILL CIPHERTEKNIK ENKRIPSI DAN DEKRIPSI HILL CIPHER
TEKNIK ENKRIPSI DAN DEKRIPSI HILL CIPHER
 
Metode numerik pertemuan 7 (interpolasi lagrange)
Metode numerik pertemuan 7 (interpolasi lagrange)Metode numerik pertemuan 7 (interpolasi lagrange)
Metode numerik pertemuan 7 (interpolasi lagrange)
 

Similaire à Data mining 3 similarity and disimilarity

Use Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On SocietyUse Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On Society
Jennifer Perry
 
Additional mathematics project 2014
Additional mathematics project 2014Additional mathematics project 2014
Additional mathematics project 2014
Nabila Syuhada
 

Similaire à Data mining 3 similarity and disimilarity (20)

Use Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On SocietyUse Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On Society
 
Additional mathematics project 2014
Additional mathematics project 2014Additional mathematics project 2014
Additional mathematics project 2014
 
DAA Notes.pdf
DAA Notes.pdfDAA Notes.pdf
DAA Notes.pdf
 
Tda presentation
Tda presentationTda presentation
Tda presentation
 
Search problems in Artificial Intelligence
Search problems in Artificial IntelligenceSearch problems in Artificial Intelligence
Search problems in Artificial Intelligence
 
Dimensions
DimensionsDimensions
Dimensions
 
chapter3part1.ppt
chapter3part1.pptchapter3part1.ppt
chapter3part1.ppt
 
Engineering mathematics presentation
Engineering mathematics presentationEngineering mathematics presentation
Engineering mathematics presentation
 
Kinematics-linear-motion.ppt
Kinematics-linear-motion.pptKinematics-linear-motion.ppt
Kinematics-linear-motion.ppt
 
Kinematics-linear-motion.ppt
Kinematics-linear-motion.pptKinematics-linear-motion.ppt
Kinematics-linear-motion.ppt
 
Kinematics-linear-motion.ppt
Kinematics-linear-motion.pptKinematics-linear-motion.ppt
Kinematics-linear-motion.ppt
 
1.1 1.4-introduction
1.1 1.4-introduction1.1 1.4-introduction
1.1 1.4-introduction
 
Data mining 8 estimasi linear regression
Data mining 8   estimasi linear regressionData mining 8   estimasi linear regression
Data mining 8 estimasi linear regression
 
Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
Data mining 7   klasifikasi k nearest neighbor and pseudo k nnData mining 7   klasifikasi k nearest neighbor and pseudo k nn
Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
 
Practical Digital Image Processing 3
 Practical Digital Image Processing 3 Practical Digital Image Processing 3
Practical Digital Image Processing 3
 
ODSC India 2018: Topological space creation & Clustering at BigData scale
ODSC India 2018: Topological space creation & Clustering at BigData scaleODSC India 2018: Topological space creation & Clustering at BigData scale
ODSC India 2018: Topological space creation & Clustering at BigData scale
 
Introduction to machine learning
Introduction to machine learningIntroduction to machine learning
Introduction to machine learning
 
How people use maths
How people use mathsHow people use maths
How people use maths
 
artifical intelligence final paper
artifical intelligence final paperartifical intelligence final paper
artifical intelligence final paper
 
Application of Trigonometry in Data Science and AI
Application of Trigonometry in Data Science and AIApplication of Trigonometry in Data Science and AI
Application of Trigonometry in Data Science and AI
 

Dernier

Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...
Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...
Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...
gajnagarg
 
Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...
Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...
Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...
only4webmaster01
 
Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...
Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...
Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...
amitlee9823
 
CHEAP Call Girls in Rabindra Nagar (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Rabindra Nagar  (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICECHEAP Call Girls in Rabindra Nagar  (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Rabindra Nagar (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
9953056974 Low Rate Call Girls In Saket, Delhi NCR
 
Call Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night StandCall Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night Stand
amitlee9823
 
Abortion pills in Doha Qatar (+966572737505 ! Get Cytotec
Abortion pills in Doha Qatar (+966572737505 ! Get CytotecAbortion pills in Doha Qatar (+966572737505 ! Get Cytotec
Abortion pills in Doha Qatar (+966572737505 ! Get Cytotec
Abortion pills in Riyadh +966572737505 get cytotec
 
Call Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts Service
Call Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts ServiceCall Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts Service
Call Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts Service
9953056974 Low Rate Call Girls In Saket, Delhi NCR
 
➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men 🔝Dindigul🔝 Escor...
➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men  🔝Dindigul🔝   Escor...➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men  🔝Dindigul🔝   Escor...
➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men 🔝Dindigul🔝 Escor...
amitlee9823
 
Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
ZurliaSoop
 
➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men 🔝mahisagar🔝 Esc...
➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men  🔝mahisagar🔝   Esc...➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men  🔝mahisagar🔝   Esc...
➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men 🔝mahisagar🔝 Esc...
amitlee9823
 
👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...
👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...
👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...
karishmasinghjnh
 
Call Girls In Bellandur ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Bellandur ☎ 7737669865 🥵 Book Your One night StandCall Girls In Bellandur ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Bellandur ☎ 7737669865 🥵 Book Your One night Stand
amitlee9823
 
Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...
Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...
Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...
gajnagarg
 
CHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICECHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
9953056974 Low Rate Call Girls In Saket, Delhi NCR
 

Dernier (20)

Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...
Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...
Just Call Vip call girls Erode Escorts ☎️9352988975 Two shot with one girl (E...
 
Aspirational Block Program Block Syaldey District - Almora
Aspirational Block Program Block Syaldey District - AlmoraAspirational Block Program Block Syaldey District - Almora
Aspirational Block Program Block Syaldey District - Almora
 
Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...
Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...
Call Girls Indiranagar Just Call 👗 9155563397 👗 Top Class Call Girl Service B...
 
5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed
5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed
5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed
 
(NEHA) Call Girls Katra Call Now 8617697112 Katra Escorts 24x7
(NEHA) Call Girls Katra Call Now 8617697112 Katra Escorts 24x7(NEHA) Call Girls Katra Call Now 8617697112 Katra Escorts 24x7
(NEHA) Call Girls Katra Call Now 8617697112 Katra Escorts 24x7
 
Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...
Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...
Vip Mumbai Call Girls Marol Naka Call On 9920725232 With Body to body massage...
 
CHEAP Call Girls in Rabindra Nagar (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Rabindra Nagar  (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICECHEAP Call Girls in Rabindra Nagar  (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Rabindra Nagar (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
 
Call Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night StandCall Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Hsr Layout ☎ 7737669865 🥵 Book Your One night Stand
 
Thane Call Girls 7091864438 Call Girls in Thane Escort service book now -
Thane Call Girls 7091864438 Call Girls in Thane Escort service book now -Thane Call Girls 7091864438 Call Girls in Thane Escort service book now -
Thane Call Girls 7091864438 Call Girls in Thane Escort service book now -
 
Abortion pills in Doha Qatar (+966572737505 ! Get Cytotec
Abortion pills in Doha Qatar (+966572737505 ! Get CytotecAbortion pills in Doha Qatar (+966572737505 ! Get Cytotec
Abortion pills in Doha Qatar (+966572737505 ! Get Cytotec
 
Call Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts Service
Call Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts ServiceCall Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts Service
Call Girls In Shalimar Bagh ( Delhi) 9953330565 Escorts Service
 
Detecting Credit Card Fraud: A Machine Learning Approach
Detecting Credit Card Fraud: A Machine Learning ApproachDetecting Credit Card Fraud: A Machine Learning Approach
Detecting Credit Card Fraud: A Machine Learning Approach
 
➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men 🔝Dindigul🔝 Escor...
➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men  🔝Dindigul🔝   Escor...➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men  🔝Dindigul🔝   Escor...
➥🔝 7737669865 🔝▻ Dindigul Call-girls in Women Seeking Men 🔝Dindigul🔝 Escor...
 
Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Surabaya ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
 
➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men 🔝mahisagar🔝 Esc...
➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men  🔝mahisagar🔝   Esc...➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men  🔝mahisagar🔝   Esc...
➥🔝 7737669865 🔝▻ mahisagar Call-girls in Women Seeking Men 🔝mahisagar🔝 Esc...
 
👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...
👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...
👉 Amritsar Call Girl 👉📞 6367187148 👉📞 Just📲 Call Ruhi Call Girl Phone No Amri...
 
Call Girls In Bellandur ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Bellandur ☎ 7737669865 🥵 Book Your One night StandCall Girls In Bellandur ☎ 7737669865 🥵 Book Your One night Stand
Call Girls In Bellandur ☎ 7737669865 🥵 Book Your One night Stand
 
DATA SUMMIT 24 Building Real-Time Pipelines With FLaNK
DATA SUMMIT 24  Building Real-Time Pipelines With FLaNKDATA SUMMIT 24  Building Real-Time Pipelines With FLaNK
DATA SUMMIT 24 Building Real-Time Pipelines With FLaNK
 
Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...
Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...
Just Call Vip call girls Palakkad Escorts ☎️9352988975 Two shot with one girl...
 
CHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICECHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
CHEAP Call Girls in Saket (-DELHI )🔝 9953056974🔝(=)/CALL GIRLS SERVICE
 

Data mining 3 similarity and disimilarity

  • 1. Similarity and Disimilarity Irwansyah Saputra, S.Kom., M.Kom., MTA Founder of Multinity Indonesia
  • 2. Tentang Saya • Irwansyah Saputra • Dosen Ilmu Komputer • Mahasiswa S3 Ilmu Komputer IPB University • Bidang Kajian: Computational Intelligence & Optimization (Data mining, machine learning, artificial intelligence) Halo semuanya, saya suka belajar tentang segala hal dan suka berbagi pengetahuan. Saya juga sering menjadi pembicara di berbagai seminar. Kontak yang bisa dihubungi: WhatsApp: 0895323302241 Instagram: @irwansight_ Web: https://irw.one
  • 3. Disclaimer Materi ini digunakan sebagai bahan ajar Program Data Mining di Multinity.id Silakan gunakan, mohon untuk tidak mengubah template. Jika Anda memiliki kesulitan dalam memahami materi pada slide ini, silakan belajar di Multinity.id
  • 4. Referensi 1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Third Edition, Elsevier, 2012 2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, 2011 3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and Business Analytics Applications, CRC Press Taylor & Francis Group, 2014 4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining, John Wiley & Sons, 2005 5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press, 2014 6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer, 2011 7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook Second Edition, Springer, 2010 8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining of Enterprise Data: Algorithms and Applications, World Scientific, 2007 9. Suyanto, DATA MINING: Untuk klasifikasi dan klasterisasi data, Penerbit Informatika, 2017
  • 5. Euclidian Distance • Teknik pengukuran jarak Euclidian Distance merupakan teknik yang sangat populer digunakan untuk atribut dengan tipe data numerik. • Rumus: 𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 = 𝑖=1 𝑛 𝑝𝑖 − 𝑞𝑖 2 = 𝑝1 − 𝑞1 2 + 𝑝2 − 𝑞2 2 + ⋯ + 𝑝𝑛 − 𝑞𝑛 2 Keterangan: P, Q : Tupel dari tiap atribut yang akan dihitung
  • 6. Euclidian Distance • Teknik euclidian distance memiliki cara kerja dengan mencari jarak terpendek antar dua objek tanpa melihat rintangan pada jalur yang dilaluinya. • Euclidian distance tidak dapat memberi informasi jarak terpendek dalam dunia penerbangan karena (dunia penerbangan) mengikuti kelengkungan bumi.
  • 7. Manhattan Distance • Teknik ini sedikit kalah populer dengan euclidian distance, namun penting untuk dibahas karena memiliki pendekatan yang berbeda. • Secara fungsi, manhattan distance juga dapat digunakan untuk tugas klasifikasi, klaster, pengolahan citra dan kasus lainnya. • Cara kerja manhattan berbeda dengan teknik sebelumnya, karena ia berjalan pada grid, tidak menerobos rintangan seperti euclidian. • Rumusnya 𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 = 𝑝𝑖 − 𝑞𝑖 2 Keterangan: P, Q : Tupel dari tiap atribut yang akan dihitung
  • 8. Manhattan Distance • Manhattan lebih cepat dalam proses komputasi dan dapat digunakan untuk menghitung jarak antar lokasi titik pada peta, karena jalan raya memiliki jalurnya tersendiri dan terdapat penghalang seperti gedung atau objek lain. • Sehingga, sangat tidak mungkin jika perhitungan jarak antar lokasi nyata ini menggunakan euclidian distance.
  • 9. Chebyshev Distance • Berbeda dengan kedua teknik pengukuran jarak sebelumnya, Chebyshev distance didefinisikan sebagai perbedaan terbesar antara dua vektor di sepanjang dimensi koordinat apa pun. • Maksudnya, teknik ini hanyalah jarak maksimum dari suatu sumbu. 𝑑 𝑃, 𝑄 = max 𝑃 − 𝑄 = 𝑚𝑎𝑥 𝑝𝑖 − 𝑞𝑖 • Pada rumus tersebut kita bisa melihat bahwa cara kerja Chebyshev distance adalah mencari selisih maksimum di antara kedua vektor. • Selisih tersebut kemudian diabsolutkan untuk mencegah terjadinya minus. Karena tidak mungkin ada jarak yang minus dalam kehidupan nyata.
  • 10. Chebyshev Distance • Agar lebih memahami tentang ini, kita bisa gunakan gerakan raja pada permainan catur. • Misalnya raja ingin berjalan mencapai titik lingkaran. • Ada berbagai kemungkinan cara melangkahnya, namun di sini kita gunakan dua pilihan saja agar lebih mudah dipahami, yaitu jalur kanan dan jalur kiri. • Jika kita melihat dengan baik, jalur kanan memiliki langkah lebih cepat dari yang kiri karena hanya 4 langkah saja, raja sudah sampai tujuan. • Berbeda dengan yang kiri, raja membutuhkan 6 langkah untuk menuju ke tujuan. 4 2
  • 11. Cosine Similarity • Teknik cosine similarity biasanya digunakan untuk mengatasi data yang berdimensi tinggi seperti data teks. • cosine similarity mengabaikan nilai dari suatu vektor, yang akan dihitung adalah arahnya saja. • Misalnya pada kata “baik” dan “jahat”. Kedua kata tersebut akan dinilai 1 oleh cosine similarity. • Rumus: 𝐷 𝑥, 𝑦 = cos 𝜃 = 𝑥. 𝑦 𝑥 𝑦
  • 12. Cosine Similarity • Untuk memahami lebih dalam terkait teknik cosine similarity, kita akan menggunakan contoh dua dokumen sebagai berikut: • D1 : “Kerja Kerja Kerja Typus” • D2 : “Typus Typus Kerja Kerja” • Kita anggap “Kerja” menjadi sumbu x, sedangkan “Typus” menjadi sumbu y. Maka kita akan mendapatkan vektor A (3,1), vektor B (2,2). Langkah perhitungannya menjadi: cos 𝜃 = 𝑥. 𝑦 𝑥 𝑦 = 𝑥1𝑦1 + 𝑥2𝑦2 𝑥1 2 + 𝑥2 2 . 𝑦1 2 + 𝑦2 2 = 3.2 + 1.2 32 + 12 . 22 + 22 = 8 10 . 8 = 0.894
  • 13. Cosine Similarity • Berdasarkan hasil tersebut berarti dokumen A dan dokumen B memiliki kemiripan yang dekat. • Namun nilai tersebut tidak bisa kita ubah ke dalam persen, misalnya menjadi 89,4% dan mengatakan bahwa kemiripan dua dokumen tersebut adalah sebesar 89,4%. • Jika kita ingin melihat seberapa dekat kedua dokumen tersebut dalam bentuk visual, maka ubah saja hasil 0,894 ke bentuk sudut cosinus, maka akan didapatkan sudut sebesar 26.619729544329°. Hasilnya: A B 26°