Soumettre la recherche
Mettre en ligne
機械学習勉強会 #3
•
2 j'aime
•
759 vues
K
ketancho
Suivre
2014/08/23 に行われた機械学習勉強会でグループ発表した資料。 書籍「機械学習入門」の9章と10章をベースに、クラスタリングとk近傍法を使ったレコメンドについて話ました。
Lire moins
Lire la suite
Ingénierie
Signaler
Partager
Signaler
Partager
1 sur 27
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
異常検知と変化検知 第4章 近傍法による異常検知
異常検知と変化検知 第4章 近傍法による異常検知
Ken'ichi Matsui
lsh
lsh
Shunsuke Aihara
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
Ryota Kamoshida
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Recommandé
異常検知と変化検知 第4章 近傍法による異常検知
異常検知と変化検知 第4章 近傍法による異常検知
Ken'ichi Matsui
lsh
lsh
Shunsuke Aihara
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
Ryota Kamoshida
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
ChatGPT webinar slides
ChatGPT webinar slides
Alireza Esmikhani
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
Contenu connexe
En vedette
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
ChatGPT webinar slides
ChatGPT webinar slides
Alireza Esmikhani
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
En vedette
(20)
Skeleton Culture Code
Skeleton Culture Code
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
How to have difficult conversations
How to have difficult conversations
Introduction to Data Science
Introduction to Data Science
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
The six step guide to practical project management
The six step guide to practical project management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
ChatGPT webinar slides
ChatGPT webinar slides
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
機械学習勉強会 #3
1.
機械学習勉強会 #3 9章 クラスタリング 10章 k近傍法を用いた推薦システム @ketancho
2.
アジェンダ 1. クラスタリングとは(9章) 2. k近傍法とは(10.1) 3.
k近傍法を用いた推薦システムとは(10.2) 4. 私のやりたかった推薦について皆さんに逆質問するコーナー
3.
1. クラスタリングとは(9章) 2. k近傍法とは(10.1) 3.
k近傍法を用いた推薦システムとは(10.2) 4. 私のやりたかった推薦について皆さんに逆質問するコーナー
4.
クラスタリング #とは ・ある集団における各メンバの類似度を知りたい ・ex. 「この人と女性の趣味があうかを知りたい」
5.
クラスタリング #やってみた S氏 普通
うーん まぁまぁ うーん うーん 好きや! G氏 ふつー 好き! うーん。 ふつー ふつー 大好き! ・ ・ K氏 うーん ふつー うーん うーん 大好き 好きや! (私)
6.
クラスタリング #やってみた S氏 0
-1 0 -1 0 1 G氏 0 1 -1 0 0 1 ・ ・ K氏 -1 0 -1 -1 1 1 (私)
7.
クラスタリング #やってみた 1. 評価を符号化(+1,
0, -1)して行列化する
8.
クラスタリング #やってみた 2. 行列を作って転置したものと掛け合わせる ※(互いの同意の数ー非同意の数)になる →値が正なら同意見が多く、負なら反対意見が多い
9.
クラスタリング #やってみた 3. 人ごとのn次元ユークリッド距離を求める(今回は
n = 7)
10.
クラスタリング #やってみた 4. 可視化してみる
11.
1. クラスタリングとは(9章) 2. k近傍法とは(10.1) 3.
k近傍法を用いた推薦システムとは(10.2) 4. 私のやりたかった推薦について皆さんに逆質問するコーナー
12.
k近傍法 #とは ・単純な線形の決定線境界を引けないときもある ?
13.
k近傍法 #とは ・k近傍法 =>
入力に最も近いk個の点の多数決で予測を行う k=3 の場合は○ (k=1 の場合は△) ?
14.
k近傍法 10.1でやってること 100個の x,
y, label(0 or 1) のデータがある →各点ごとの x, y から k近傍法でlabelを予想し、予想と事実の差異を比較
15.
k近傍法 10.1でやってること 1. 各点ごとの距離を表すテーブル(100x100)を作成する 2.
各点ごとに自分に近い点の順に並び替え、 上位25個(k=25)の点のLabelで多数決を取る 3. 2. で行ったk近傍法の予測値を元テーブルに付与する 4. Label と 予測値の合致率を求める →このデータでは合致率93% 私のやりたかった レコメンドとイメージが違う。。
16.
(余談)私のやりたかったレコメンド #とは 友人A氏 「さしこが好きで、ゆきりんはあまりタイプじゃないんだけど、 他に可愛いメンバ紹介してよ。」 私 「(Bもさしこ好きで、ゆきりんあんまりって言ってて、 たしかあいつさや姉も好きって言ってたな。) 山本彩っていう子がオススメだよ! あと松井玲奈ちゃんがめっちゃかわいい! 」 とか言っててもしょうがないので、10.2 を読んでみました。
17.
1. クラスタリングとは(9章) 2. k近傍法とは(10.1) 3.
k近傍法を用いた推薦システムとは(10.2) 4. 私のやりたかった推薦について皆さんに逆質問するコーナー
18.
k近傍法 10.2でやってること アイテムベースの方法を用いて、Rプログラマ50人が使用しているパッケージ情報を 元に、あるユーザが各パッケージをインストールしているかどうかを、そのユーザがイ ンストールした他のパッケージの情報を用いて予測する。 ユーザ(50人)ごとにパッケージ(2,487件)を入れているか否かのデータ
19.
k近傍法 10.2でやってること 1. 元データが縦長のデータになっているので、50
x 2,487 のテーブルに変換 2. 類似度の指標として、各列の相関係数テーブルを求める ※ 2,487 x 2,487 のテーブル(-1 ~ 1の実数が入っている) ユーザ パッケージ
20.
k近傍法 10.2でやってること 3. k近傍法を使うために類似度(相関)を距離に変換する。 類似度1を距離0、類似度-1を距離∞に変換する 4.
k近傍を取得する関数を作る
21.
k近傍法 10.2でやってること 5. 4.
の関数を用い、各パッケージごとに25つの近傍パッケージ(★)を取得。 各ユーザが★をインストールしているかを調べ、 (★の中でインストールしているパッケージの総数)/25 をそのパッケージをインストールしている確率にする ユーザ1はパッケージ1の★のうち19パッケージをインストール済なので、 パッケージ1をインストールしている確率は 0.76 となる
22.
k近傍法 10.2でやってること 6. 全てのパッケージについてインストールされている確率を計算し、 確率をソートして、上位のパッケージを推薦する やっぱり私のやりたいレコメンドとは 違った。既に分かっていることを推薦す るのって意味ないんじゃ?
23.
1. クラスタリングとは(9章) 2. k近傍法とは(10.1) 3.
k近傍法を用いた推薦システムとは(10.2) 4. 私のやりたかった推薦について皆さんに逆質問するコーナー
24.
・「協調フィルタリング」 →他の人の嗜好を蓄積しておき、似ている人を見つけ、ユーザに推薦を行う ※まさに「さしこが好きで、ゆきりんが・・」の方法 ・「内容ベースフィルタリング」 →推薦の対象物(例えばAKBGのメンバ)の特徴から、ユーザに推薦を行う ※「黒髪の子がいい」とか「背が155cmより低い子がいい」とか? 私がやりたいレコメンド #やってみた
25.
私がやりたいレコメンド #やってみた ・「アイテムベース」 →蓄積したデータから「セットで好まれる数」を計算し、推薦する ※「さしことさや姉両方好きって言う人が多い」 「この人さしこ好きらしい」 →さや姉を紹介する? ・「ユーザベース」 →好みの一致割合からユーザとの類似度を計算する
26.
私がやりたいレコメンド #やってみた
27.
私がやりたいレコメンド #やってみた 課題 ・類似度の出し方ってこれでいいの? ・類似度が同じだったときに、推薦対象は多数決で決めていいの? ・精度を上げるには蓄積データを増やす必要があるけど、 増やしすぎると処理時間かなり増えそう ・そもそも序盤のデータ蓄積どうするの? 何件あればそれなりの精度になるの? なにかと課題は多そうですが、スモールスタートでサービス作ってみます。
Télécharger maintenant