Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Data Mining for Thai

5 994 vues

Publié le

This slide presents how to use Data Mining in business. All the demonstrations using RapidMiner Studio 6.

Publié dans : Données & analyses

Data Mining for Thai

  1. 1. Data Mining for Thai Eakasit Pacharawongsakda, Ph.D. Data Cube : http://facebook.com/datacube.th (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  2. 2. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • แนะนำข่าวสารข้อมูลทางด้าน Data Mining • จัดอบรมและสัมมนาการวิเคราะห์ข้อมูลทาง Data Mining • http://facebook.com/datacube.th 2
  3. 3. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • ชื่อ: เอกสิทธิ์ พัชรวงศ์ศักดา • การศึกษา: • ปริญญาเอก วิทยาการคอมพิวเตอร์ สถาบันเทคโนโลยีนานาชาติสิรินธร (SIIT) มหาวิทยาลัยธรรมศาสตร์ • ปริญญาโท วิศวกรรมคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์ • ปริญญาตรี วิศวกรรมคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์ 
 (เกียรตินิยมอันดับ 2) • ประสบการณ์ • Certified RapidMiner Analyst (คนแรกของเมืองไทย) • Data scientist at GloriSys Cloud Solutions Co., Ltd. • วิทยากรอบรมการใช้งานซอฟต์แวร์ open source ทางด้าน data mining 3
  4. 4. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube 4 RapidMiner Analyst This is to Certify that The candidate has proven the ability to: Prepare data With: Date: Eakasit Pacharawongsakda
  5. 5. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • ชื่อ: รัตนาวลี เครือสวัสดิ์ • การศึกษา: • กำลังศึกษา ปริญญาโท วิทยาการคอมพิวเตอร์ มหาวิทยาลัยธรรมศาสตร์ • ปริญญาตรี วิทยาการคอมพิวเตอร์ มหาวิทยาลัยธรรมศาสตร์ • ประสบการณ์ • ผู้ช่วยวิทยากรอบรมการใช้งานซอฟต์แวร์ RapidMiner Studio 6 ในการวิเคราะห์ ข้อมูลทางด้าน Data Mining 5
  6. 6. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • วิทยากรรับเชิญอบรมทางด้าน Data Mining ให้กับหน่วยงานต่างๆ Data Cube 6 มหาวิทยาลัย หน่วยงานและบริษัทเอกชน
  7. 7. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 1 7
  8. 8. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 2 8
  9. 9. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 3 9
  10. 10. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Outline for seminar • Data Mining for Business with RapidMiner Studio 6 • 13:00 - 14:30 โดย ดร.เอกสิทธิ์ พัชรวงศ์ศักดา
 หสม. ดาต้า คิวบ์ ! • Social Media Intelligence • 15:00 - 16:30 โดย คุณชัชวาล สังคีตตระการ และ คุณก่อเกียรติ วรรณพัฒน์
 ห้องปฏิบัติการวิจัยเทคโนโลยีเสียง 
 ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ ! • #dataminingforthai 10
  11. 11. Data Mining for Business with RapidMiner Studio 6 Eakasit Pacharawongsakda, Ph.D. Rattanawalee Khruasawat Data Cube : http://facebook.com/datacube.th (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  12. 12. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Outline • Part 1: Introduction to data mining • เทคนิคการวิเคราะห์ข้อมูลด้วย data mining คืออะไร • ตัวอย่างการนำ data mining ไปใช้งาน • Part 2: Introduction to RapidMiner Studio 6 • แนะนำส่วนประกอบต่างๆ ของ RapidMiner Studio 6 • Part 3: Data mining for business • การแบ่งกลุ่มลูกค้าด้วยเทคนิค Segmentation • การหาสินค้าที่ลูกค้ามักจะซื้อร่วมกันบ่อยๆ • การคาดการณ์การตอบรับโปรโมชันของลูกค้าแต่ละราย 12
  13. 13. Introduction to Data Mining Part 1 (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  14. 14. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Where does data come from? • ข้อมูลแบ่งตามที่มา • ภายในบริษัท/องค์กร • ข้อมูลการซื้อขาย • ข้อมูลประวัติลูกค้า • ข้อมูลประวัติพนักงาน • ภายนอกบริษัท/องค์กร • ข้อมูลจาก social media ต่างๆ • ข้อมูลข่าวต่างๆ • ข้อมูลรูปภาพและเสียง 14 source: http://dailyprivacy.files.wordpress.com/2013/02/2012_big_data_study_infographic_600.jpg
  15. 15. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Database & warehouse & mining 15 Database Sales Accounting CRM Extract
 Transform
 Load
 (ETL) Data Mining Data Warehouse Knowledge/Patterns
  16. 16. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Database & warehouse & mining • Database • ฐานข้อมูลใช้ในการจัดเก็บข้อมูล ลดความซ้ำซ้อนของข้อมูล เน้นการจัดเก็บ เพ่ิม แก้ไข และลบข้อมูล • Data warehouse • คลังข้อมูลรวบรวมช้อมูลจากหลายๆ ฐานข้อมูล แปลงข้อมูลให้มีความเหมือนกัน เหมาะสำหรับการเรียกดู (view) เพื่อสร้างรายงานสรุป • Data Mining • การวิเคราะห์ข้อมูลเพื่อค้นหาความสัมพันธ์หรือรูปแบบที่มีประโยชน์ในฐานข้อมูล 16
  17. 17. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th What is data mining • “The exploration and analysis of large quantities 
 of data in order to discover meaningful patterns and rules” – Data Mining Techniques (3rd Edition) • เป็นการวิเคราะห์ข้อมูล เพื่อหารูปแบบ (patterns) หรือความสัมพันธ์ (relation) ระหว่างข้อมูลในฐานข้อมูลขนาดใหญ่ • “Extraction of interesting (non-trivial, previously, unknown and potential useful) information from data in large databases” – Data Mining Concepts & Techniques (3rd Edition) • เป็นกระบวนการดึงข่าวสารที่น่าสนใจ และมีประโยชน์แต่ไม่เคยรู้มา ก่อนจากฐานข้อมูลขนาดใหญ่ 17
  18. 18. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • บัตรสมาชิก (loyalty card) • ติดตามพฤติกรรมการซื้อสินค้า ของลูกค้าจากบัตร loyalty • นำมาวิเคราะห์และนำเสนอเป็น โปรโมชันพิเศษให้แต่ละบุคคล • เพิ่มโอกาสในการขายสินค้าให้กับ ลูกค้า • กระตุ้นให้ลูกค้าได้ซื้อสินค้ามาก ขึ้น เช่น ซื้อสินค้าวันนี้ จะได้ ส่วนลดพิเศษ ทำให้ลูกค้าเกิดการ ตัดสินใจซื้อทันที 18 image source: http://www.positioningmag.com
  19. 19. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • ทราบพฤติกรรมการซื้อสินค้าของลูกค้า เพื่อนำมาวิเคราะห์ และนำ เสนอเป็นโปรโมชันพิเศษให้แต่ละบุคคล 19
  20. 20. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • เบียร์และผ้าอ้อม • ห้าง Walmart พบว่าทุกวันศุกร์ หลังบ่ายโมง จะมีลูกค้าเพศชาย อายุระหว่าง 25 – 35 ปี ซื้อสินค้า Beers และ Diapers มากที่สุด 20
  21. 21. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • แนะนำสินค้าที่เกี่ยวข้อง • amazon.com แนะนำหนังสือที่เกี่ยวข้องกับ RapidMiner ! ! ! ! • Netflix แนะนำภาพยนต์ที่คล้ายกับที่เคยดู เช่น Life of Pi 21
  22. 22. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • Facebook แนะนำหน้า Facebook Page ที่คล้ายๆ กัน เมื่อเรากด like 22
  23. 23. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • Commercial software • SAS Enterprise Miner ! ! ! • IBM SPSS Modeller Data mining software 23 • Open source software • RapidMiner Studio ! ! • Weka ! • R
  24. 24. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Why Data Mining ? 24 source: http://oursocialtimes.com/wp-content/uploads/2012/02/Content-Marketing1.jpg
  25. 25. Introduction to RapidMiner Studio 6 Part 2 (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  26. 26. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Why RapidMiner? • ผลการสำรวจจากเว็บไซต์ KDnuggets ในปี 2014 พบว่าผู้ร่วมตอบ แบบสำรวจใช้ RapidMiner ในการวิเคราะห์ข้อมูลมากเป็นอันดับ 1 • Gartner ได้จัดให้ RapidMiner อยู่
 ในกลุ่ม Leaders สำหรับซอฟต์แวร์
 ในการวิเคราะห์ข้อมูล • SAS • IBM • RapidMiner • Knime 26 source: http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html
 http://rapidminer.com/leader-gartners-magic-quadrant-advanced-analytics/
  27. 27. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • download ได้จาก http://rapidminer.com/download-rapidminer/ ! 27
  28. 28. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • เลือกดาวน์โหลด version ที่เหมาะสมกับระบบปฏิบัติการของเรา 28
  29. 29. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • พบกับหน้าต่าง Home Screen 29 1 สร้าง process ใหม่ 2 3 เปิด process ที่มีอยู่ เปิด process ตัวอย่าง
  30. 30. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • องค์ประกอบของ RapidMiner Studio 6 30 Operators Repositories Process Parameter help 1 2 3 4 5
  31. 31. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ตัวอย่างข้อมูลที่โหลดเข้าไปใน RapidMiner Studio 6 31 คลิกที่ header ของแต่ละ คอลัมน์เพื่อ sort
  32. 32. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ข้อมูลที่โหลดเข้าไปแสดงในรูปแบบของค่าสถิติ 32 คลิกที่แถวเพื่อแสดง
 ข้อมูลทางสถิติ
  33. 33. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ข้อมูลที่โหลดเข้าไปแสดงในรูปแบบของกราฟประเภท Histogram 33
  34. 34. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ข้อมูลที่โหลดเข้าไปแสดงในรูปแบบของกราฟประเภท Scatter Plot 34
  35. 35. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • โมเดล Decision Tree ที่สร้างได้ 35 โมเดล decision tree
  36. 36. RapidMiner Studio 6 DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  37. 37. Data Mining for Business Part 3 (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  38. 38. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation • แบ่งลูกค้าออกเป็นกลุ่มๆ ย่อย • ลูกค้าในแต่ละกลุ่มมีลักษณะที่คล้ายๆ กัน • เพื่อจะได้พิจารณาลักษณะของแต่ละกลุ่มได้ง่ายขึ้น • แบ่งตามลักษณะต่างๆ • แบ่งกลุ่มลูกค้าตามแหล่งที่อยู่ของลูกค้า (geography) • แบ่งกลุ่มลูกค้าตามวัยของลูกค้า (age) • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 38
  39. 39. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by geography • แบ่งกลุ่มลูกค้าตามแหล่งที่อยู่ของลูกค้า • ภาคเหนือ • ภาคกลาง • ภาคตะวันออกเฉียงเหนือ • ภาคตะวันออก • ภาคใต้ 39
  40. 40. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by age • แบ่งกลุ่มลูกค้าตามวัยต่างๆ เป็น 5 รุ่น (generation) 40 Silent Generation • อายุ 65 ปีขึ้นไป • ใช้ชีวิตเรียบง่าย • เคร่งครัดในแบบแผน 1 Baby Boomer • อายุ 46-64 ปี • มีความขยันอดทนมาก • ประหยัด รอบคอบ 2 Generation X • อายุ 33-45 ปี • ชอบอะไรง่ายๆ • เป็นตัวของตัวเองสูง 3 Generation Y • อายุ 17-33 ปี • มีความคิดสร้างสรรค์ • ไม่ค่อยมีความอดทน 4 Generation Z • อายุ 1-16 ปี • ใช้เทคโนโลยีได้เก่ง • เรียนรู้ได้เร็ว 5 source: Digital Marketing: Concept & Case Study, InfoPress และ http://hilight.kapook.com/view/83492
  41. 41. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 41 Customer ID Recency Frequency Monetary C10001 C10002 C10003 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  42. 42. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 42 Customer ID Recency Frequency Monetary C10001 4.47 3 60 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  43. 43. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 43 Customer ID Recency Frequency Monetary C10001 4.47 3 60 C10002 4.33 2 500 C1003 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  44. 44. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 44 Customer ID Recency Frequency Monetary C10001 4.47 3 60 C10002 4.33 2 500 C10003 5.80 1 10 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  45. 45. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าด้วยวิธี RFM • เรียงลำดับข้อมูล • Recency จากน้อยไปมาก • Frequency และ Monetary จากมากไปน้อย • แบ่งข้อมูลออกเป็น 5 กลุ่ม กลุ่มละจำนวนเท่าๆ กัน (quintile) • คำนวณคะแนน RFM ของแต่ละกลุ่ม 45 source: http://www.b-eye-network.com/view/10256 score = 5 score = 4 score = 3 score = 2 score = 1 น้อย มาก Recency score = 5 score = 4 score = 3 score = 2 score = 1 มาก น้อย Frequency score = 5 score = 4 score = 3 score = 2 score = 1 มาก น้อย Monetary 20% ของข้อมูล 20% ของข้อมูล 20% ของข้อมูล 20% ของข้อมูล 20% ของข้อมูล
  46. 46. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • แบ่งกลุ่มลูกค้าด้วยวิธี RFM • ลูกค้าในแต่ละกลุ่มจะมีลักษณะต่างๆ กัน เช่น • ลูกค้ากลุ่ม RFM = 555 • เป็นกลุ่มลูกค้าที่มีค่ามากสุด • ลูกค้ากลุ่ม RFM = 551 • เป็นกลุ่มลูกค้าที่มีการซื้อบ่อยๆ 
 แต่ซื้อจำนวนน้อย • ออก campaign กระตุ้นให้ลูกค้าซื้อสินค้าที่มีราคาสูงขึ้น (up-selling) • ลูกค้ากลุ่ม RFM = 115 • เป็นกลุ่มลูกค้าที่นานๆ จะซื้อสักครั้ง แต่ซื้อสินค้าที่มีราคาสูง • ออก campaign กระตุ้นให้ลูกค้าซื้อสินค้าบ่อยขึ้น Segmentation by RFM 46 Recency Frequency M onetary 1 2 3 4 5 5 4 3 2 1 5 4 3 2 1
  47. 47. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM in RM 6 • เลือกโอเปอเรเตอร์ต่างๆ มาวางไว้ในส่วนของ Process 47
  48. 48. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM in RM 6 • ผลการทำงานแสดงแอตทริบิวต์ rfm_score ที่เพิ่มขึ้นมา 48 RFM score
  49. 49. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM in RM 6 • RFM score ในรูปแบบกราฟ Histogram 49
  50. 50. Segmentation by RFM DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  51. 51. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket Analysis • เริ่มจากการสังเกตุการซื้อสินค้าของลูกค้าแต่ละราย • วิเคราะห์ข้อมูลเพื่อดูว่า สินค้าอะไรบ้างที่ลูกค้ามักจะซื้อร่วมกันบ่อยๆ • ใช้ในการออกโปรโมชันเพ่ือเพิ่มยอดขาย 51
  52. 52. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P CEREAL 120.00 1P DIAPERS 300.00 Total ****490.00 CASH 500.00 Change 10.00 01-13-2009 20:04Recpt#104071 THANK YOU • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 52 TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers
  53. 53. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 53 Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P BEER 25.00 1P DIAPERS 300.00 Total **** 370.00 CASH 500.00 Change 130.00 01-13-2014 20:04Recpt#104071 THANK YOU TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****155.00 CASH 500.00 Change 345.00 01-14-2014 11:30Recpt#104071 THANK YOU
  54. 54. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 54 Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P BEER 25.00 1P DIAPERS 300.00 Total **** 370.00 CASH 500.00 Change 130.00 01-13-2014 20:04Recpt#104071 THANK YOU TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****155.00 CASH 500.00 Change 345.00 01-14-2014 11:30Recpt#104071 THANK YOU Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P APPLE 45.00 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****200.00 CASH 500.00 Change 300.00 01-15-2014 14:30Recpt#104071 THANK YOU
  55. 55. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 55 Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P BEER 25.00 1P DIAPERS 300.00 Total **** 370.00 CASH 500.00 Change 130.00 01-13-2014 20:04Recpt#104071 THANK YOU TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs 4 01-16-2014 14:15 Beer 4 01-16-2014 14:15 Eggs Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****155.00 CASH 500.00 Change 345.00 01-14-2014 11:30Recpt#104071 THANK YOU Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P APPLE 45.00 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****200.00 CASH 500.00 Change 300.00 01-15-2014 14:30Recpt#104071 THANK YOU Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P EGGS 30.00 Total **** 55.00 CASH 100.00 Change 45.00 01-16-2014 14:15Recpt#104071 THANK YOU
  56. 56. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket Analysis • แปลงข้อมูลจาก POS database เป็น transaction database โดย group by ตามเวลาที่ซื้อสินค้า 56 TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs 4 01-16-2014 14:15 Beer 4 01-16-2014 14:15 Eggs Transaction ID Items 1 Apple, Cereal, Diapers 2 Beer, Cereal, Eggs 3 Apple, Beer, Cereal, Eggs 4 Beer, Eggs
  57. 57. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket Analysis • สินค้าที่มีการซื้อมากกว่าหรือเท่ากับ 50% เรียกว่า frequent itemset 57 Frequent itemset Support Size {Apple} 2/4 = 50% 1 {Beer} 3/4 = 75% 1 {Cereal} 3/4 = 75% 1 {Eggs} 3/4 = 75% 1 {Apple, Cereal} 2/4 = 50% 2 {Beer, Cereal} 2/4 = 50% 2 {Beer, Eggs} 3/4 = 75% 2 {Cereal, Eggs} 2/4 = 50% 2 {Beer, Cereal, Eggs} 2/4 = 50% 3 Transaction ID Items 1 Apple, Cereal, Diapers 2 Beer, Cereal, Eggs 3 Apple, Beer, Cereal, Eggs 4 Beer, Eggs transaction database
  58. 58. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules • กฏความสัมพันธ์ (association rules) • สร้างจากสินค้าที่ลูกค้าซื้อบ่อยๆ • รูปแบบของกฏความสัมพันธ์ คือ • LHS คือ Left Hand Side สินค้าที่ซื้อพร้อมกันบ่อยๆ ด้านซ้ายของกฏ • RHS คือ Right Hand Side สินค้าที่ซื้อพร้อมกันบ่อยๆ ด้านขวาของกฏ 58 Frequent itemset Support Size {Apple, Cereal} 2/4 = 50% 2 {Beer, Cereal} 2/4 = 50% 2 {Beer, Eggs} 3/4 = 75% 2 {Cereal, Eggs} 2/4 = 50% 2 {Beer, Cereal, Eggs} 2/4 = 50% 3 LHS RHS Apple Cereal Beer Eggs Eggs Beer Cereal Apple Beer Cereal Cereal Eggs Cereal, Eggs Beer
  59. 59. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Applications • ใช้ในการเพิ่มยอดขายโดยการแนะนำสินค้าที่ลูกค้ามักจะซื้อพร้อม
 กันบ่อยๆ (cross-selling) • ใช้ในการจัดสินค้าในร้าน • วางสินค้าที่ลูกค้ามักจะซื้อพร้อมกันไว้ใกล้ๆ กัน • วางสินค้าที่ลูกค้ามักจะซื้อพร้อมกันไว้ไกลๆ กัน 59
  60. 60. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket using RM 6 • แปลงข้อมูลจาก POS database เป็นตาราง 60 TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Beer 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs 4 01-16-2014 14:15 Beer 4 01-16-2014 14:15 Eggs TID Apple Beer Cereal Diapers Eggs 1 TRUE TRUE FALSE TRUE FALSE 2 FALSE TRUE TRUE FALSE TRUE 3 TRUE TRUE TRUE FALSE TRUE 4 FALSE TRUE FALSE FALSE TRUE
  61. 61. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data preparation in RM 6 • เลือกโอเปอเรเตอร์ที่เกี่ยวข้องมาวางใน Process 61
  62. 62. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data preparation in RM 6 • ผลการแปลงจาก POS database 62 ข้อมูลในรูปแบบ transaction database
  63. 63. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules in RM 6 • เลือกโอเปอเรเตอร์ที่เกี่ยวข้องมาวางใน Process 63 โอเปอเรเตอร์ที่เพิ่มขึ้นมา
 สำหรับการหากฏความสัมพันธ์
  64. 64. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules in RM 6 • แสดงสินค้าที่มีการซื้อร่วมกันบ่อยๆ 64 ส่วน filter ส่วนสินค้าที่พบว่าซื้อพร้อมกันบ่อยๆ คลิกที่ header ของแต่ละ คอลัมน์เพื่อ sort
  65. 65. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules in RM 6 • แสดงกฏความสัมพันธ์ที่หาได้ 65 ส่วน filter ส่วนแสดงกฏความสัมพันธ์
  66. 66. Market Basket Analysis DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  67. 67. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Mass Marketing vs Direct Marketing • การตลาดแบบ mass marketing 67 marketing 
 campaign 20 40 60 80 100 120 140 160 8 16 จำนวนผู้ตอบรับ campaign (responders) จำนวนผู้ได้รับ campaign (prospects) 24 32 40 48 56 64
  68. 68. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Mass Marketing vs Direct Marketing • การตลาดแบบ direct marketing 68 marketing 
 campaign 20 40 60 80 100 120 140 160 8 16 จำนวนผู้ตอบรับ campaign (responders) จำนวนผู้ได้รับ campaign (prospects) 24 32 40 48 56 64 Mass Direct
  69. 69. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Mass Marketing vs Direct Marketing • การตลาดแบบ direct marketing 69 marketing 
 campaign 20 40 60 80 100 120 140 160 8 16 จำนวนผู้ตอบรับ campaign (responders) จำนวนผู้ได้รับ campaign (prospects) 24 32 40 48 56 64 Benefit
  70. 70. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th How to collect data ? • แอตทริบิวต์ (attribute) คุณลักษณะของลูกค้าแต่ละราย • ในทางสถิติจะเรียกว่าตัวแปรอิสระ (independent variable) • Demographic data คือ ข้อมูลเชิงประชากร เช่น เพศ อายุ รายได้ ที่อยู่อาศัย • Behavioural data คือ ข้อมูลพฤติกรรมการใช้งานของลูกค้า • ส่วนใหญ่มักจะช่วยในการ predict ได้มากกว่า demographic data (Ref: Data Mining cookbook, Wiley) • ลาเบล (label) คำตอบที่สนใจ เช่น การตอบรับ campaign หรือไม่ • ในทางสถิติจะเรียกว่าตัวแปรตาม (dependent variable) 70 Customer_id Age Gender Area Email Mobile Logins 4 weeks Sales 4 weeks Response ID140001 64 female urban free never 1 0 no ID140002 49 male urban premium never 0 0 yes ID140003 63 male urban free never 0 0 no ID140004 75 male urban premium yes 0 0 yes demographic data labelID behavioural data
  71. 71. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th How to collect data ? • ต้องหาข้อมูลที่มีผลการตอบรับ campaign เพื่อใช้ในการสร้าง predictive model • อาจจะใช้ข้อมูลจากการตอบรับ campaign ก่อนหน้าที่ใกล้เคียงกัน • ถ้าไม่มีอาจจะต้องสร้างข้อมูลใหม่โดยการสุ่มลูกค้าและส่ง campaign ไปให้ • ข้อมูลนี้เรียกว่า training data 71 ID A G Ar E M L S R 1 .. .. .. .. .. .. .. N 2 .. .. .. .. .. .. .. Y 3 .. .. .. .. .. .. .. N 4 .. .. .. .. .. .. .. Y ข้อมูลผลการตอบรับ campaign ก่อนหน้า ID A G Ar E M L R 1 .. .. .. .. .. .. .. 2 .. .. .. .. .. .. .. 3 .. .. .. .. .. .. .. 4 .. .. .. .. .. .. .. ช่วงเวลาในการส่ง campaign ID R 1 N 2 Y 3 N 4 Y ผลการตอบรับ campaign
  72. 72. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree • เป็นเทคนิคที่นิยมใช้ในการทำ predictive modeling • ขั้นตอนการสร้าง decision tree จะเลือกแอตทริบิวต์ที่มีความสัมพันธ์ กับคลาสมาใช้งาน Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2 ! • IF Logins 4 weeks > 6.5 THEN Response = yes • IF Logins 4 weeks < 6.5 AND
 Email = premium THEN
 Response = yes • IF Logins 4 weeks < 6.5 AND
 Email = free AND
 Sales 4 weeks > 2 THEN
 Response = yes • IF Logins 4 weeks < 6.5 AND
 Email = free AND
 Sales 4 weeks < 2 THEN
 Response = no 72 business rule ที่ได้จากโมเดล decision tree
  73. 73. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Evaluate Decision Tree model • แบ่งข้อมูลที่ได้ออกเป็น 2 ส่วน • ส่วนที่ 1 training data ใช้ในการสร้างโมเดล แบ่งข้อมูลประมาณ 70% • ส่วนที่ 2 testing data ใช้ในการทดสอบโมเดล แบ่งข้อมูลประมาณ 30% • ใช้โมเดลที่ได้ทำนายผลการตอบรับ campaign • เปรียบเทียบกับข้อมูลผลการตอบรับ campaign ที่มีอยู่ 73 สร้าง Decision Tree model classification model ID R P 4 N N 5 Y Y 1 2 3 4 ID A G Ar E M L S Res 1 … … … … … … … N 2 … … … … … … … Y 3 … … … … … … … N ID A G Ar E M L S Res 4 … … … … … … … ? 5 … … … … … … … ? training data testing data
  74. 74. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Evaluate Decision Tree model • ตัววัดประสิทธิภาพของโมเดล • ค่าความถูกต้อง (Accuracy) คือจำนวนที่โมเดลทำนายได้ตรงกับผลเฉลย • จากตัวอย่างความถูกต้อง คือ 8/10 = 80% 74 ID Response Predicted 1 no no 2 yes yes 3 no yes 4 no no 5 yes yes 6 yes yes 7 yes no 8 no no 9 no no 10 yes yes ID Response Predicted 1 no no 2 yes yes 3 no yes 4 no no 5 yes yes 6 yes yes 7 yes no 8 no no 9 no no 10 yes yes
  75. 75. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 ? ID140012 premium never 3 0 ? Decision Tree model • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 75 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  76. 76. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 ? ID140012 premium never 3 0 ? Decision Tree model • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 76 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  77. 77. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree model • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 77 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2 Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 no ID140012 premium never 3 0 ?
  78. 78. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree model Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 no ID140012 premium never 3 0 ? • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 78 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  79. 79. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree model Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 no ID140012 premium never 3 0 yes • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 79 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  80. 80. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • เลือก Application Wizard จากหน้า Home 80 เลือก Application Wizard
  81. 81. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ขั้นตอนที่ 1 เลือก Direct Marketing 81 เลือก Direct Marketing
  82. 82. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ขั้นตอนที่ 2 เลือกข้อมูลตัวอย่าง (demo) 82 เลือก demo data
  83. 83. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ขั้นตอนที่ 3 เลือกแอตทริบิวต์ที่ต้องการให้เป็นคำตอบ 83 เลือกแอตทริบิวต์ เริ่มการทำงาน
  84. 84. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ผลการทำงาน 84
  85. 85. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ผลการทำงาน 85
  86. 86. Direct Marketing DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  87. 87. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th For more information • หนังสือเกี่ยวกับ RapidMiner version 5 และ 6 ! ! ! ! • Contact me: • Facebook: http://www.facebook.com/datacube.th • E-mail: sit.ake@gmail.com • Line: eakasitp 87
  88. 88. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th For more information • เปิดรับสมัครหลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining 
 โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) 
 รุ่นที่ 4 • วันที่อบรม 26-28 กันยายน 2557 • อบรมที่ โรงแรม KU Home มหาวิทยาลัยเกษตรศาสตร์ บางเขน • รายละเอียดเพิ่มเติม • http://dataminingtrend.com/2014/training/rapidminer-training-4/ 88

×