SlideShare une entreprise Scribd logo
1  sur  86
Télécharger pour lire hors ligne
情報推薦システム入門
講義スライド
2015年7月21日版
1
⽴命館大学 奥 健太
2
自分の経験の中では,あまりよく知らないものの中から,
どれかを選択しなければならないことはよくある.
It is often necessary to make choices without sufficient personal experience of
the alternatives.
[Resnick+ 97]
3
このようなときには,我々は他者からの推薦に頼るという
ことを日常的に⾏っている.⼝コミや推薦状,新聞の映画
評,書評,レストランガイドなどがそうである.
In everyday life, we rely on recommendations from other people either by word
of mouth, recommendation letters, movie and book reviews printed in
newspapers, or general surveys such as Zagat‘s restaurant guides.
[Resnick+ 97]
4
情報推薦システムは,こうした社会で普通に⾏われている
⼀連の⾏為を補助したり,促進したりするものである.
Recommender systems assist and augment this natural social process.
[Resnick+ 97]
情報推薦システム(Amazon.co.jp)
5
スクリーンショット(2015/7/17)© 1996-2015, Amazon.com, Inc.
特定のユーザの好
みに合った商品の
推薦
情報推薦システム(amazon.co.jp)
6
関連商品の推薦
スクリーンショット(2015/7/17)© 1996-2015, Amazon.com, Inc.
情報推薦システム(iTunes Store)
7
スクリーンショット(2015/7/17):© 2015 Apple Inc.
新着楽曲の
推薦
情報推薦システム(YouTube)
8
スクリーンショット(2015/7/17): © 2015 YouTube, LLC
関連動画の推薦
情報推薦システムとは
9
特定のユーザに対し,アイテムへの嗜好を予測し,
提示すべきアイテムを決定するシステム
推薦アイテム
本,音楽,映画,Webページ,ニュース記事,論⽂,TV番組,カメラ,
パソコン,家電,レストラン,料理レシピ,観光スポット,ホテル,
友⼈,自動⾞,不動産など
コンピュータは
人の嗜好を予測できるのか
10
本日の講義内容
11
情報推薦システムの基本方式
〜嗜好をどのように予測しているのか?〜
第 I 部
情報推薦システムの評価
〜嗜好の予測⽅法は正しいのか?〜
第 II 部
先端的トピック
〜多様化する利⽤場⾯での嗜好予測〜
第 III 部
12
協調フィルタリング
内容に基づくフィルタリング
ハイブリッド型推薦システム
情報推薦システムの基本方式
〜嗜好をどのように予測しているのか?〜
第 I 部
協調フィルタリング
13
Aliceはアイテムeを好む?
14
ee
Alice ?
Aliceはアイテムeを好む?
15
ユーザ-アイテム評価値⾏列
eeaa bb cc dd
Alice 5 3 4 4 ?
Bob 3 1 2 3 3
Carol 4 3 4 3 5
Dave 3 3 1 5 4
Ellen 1 5 5 2 1
Aliceと他のユーザの
評価履歴を基に,
Aliceのアイテムeへの
評価値を予測
嫌い 1 <- -> 5 好き
Aliceと嗜好が類似するユーザを⾒つける
16
aa bb cc dd
Alice 5 3 4 4
Bob 3 1 2 3
Carol 4 3 4 3
Dave 3 3 1 5
Ellen 1 5 5 2
Aliceが評価済みのアイテム
への評価付け傾向が類似する
ユーザを⾒つける
AliceとBobの類似度
17
aa bb cc dd
Alice 5 3 4 4
Bob 3 1 2 3
4.00
2.25
平均評価値
sim , =
∑ , − , −∈
∑ , −∈ ∑ , −∈
ピアソンの相関係数によるユーザ類似度
, :ユーザ のアイテム への評価値
:ユーザ の平均評価値
Aliceと各ユーザ間のユーザ類似度
18
ユーザ-アイテム評価値⾏列
eeaa bb cc dd
Alice 5 3 4 4 ?
Bob 3 1 2 3 3
Carol 4 3 4 3 5
Dave 3 3 1 5 4
Ellen 1 5 5 2 1
1.00
0.85
0.71
0.00
-0.79
類似ユーザ
Aliceとの
類似度
> 閾値
> 閾値
AliceとBob, Ellenの評価付け傾向と
ピアソンの相関係数
19
0
1
2
3
4
5
a b c d
評価値
アイテム
Alice
Bob
Ellen
-0.79
0.85
Aliceのアイテムeへの評価値を予測
20
ユーザ-アイテム評価値⾏列
eeaa bb cc dd
Alice 5 3 4 4 ?
Bob 3 1 2 3 3
Carol 4 3 4 3 5
1.00
0.85
0.71
Aliceとの
類似度
4.0
2.4
平均
評価値
3.8
類似ユーザのアイテムeへの評価値の加重平均を算出
Aliceはアイテムeを好む?
21
ee
Alice 4.87
Aliceはアイテムeを⾼い確率で好むだろう
ユーザベース協調フィルタリング
22
(1) 評価値⾏列を基に各ユーザ間の類似度を算出し,
類似ユーザを選択
(2) 類似ユーザの評価値に基づき,
対象ユーザの対象アイテムへの評価値を予測
(3) ⾼い評価値が予測されたアイテムを推薦候補とする
ユーザベース協調フィルタリングの欠点
23
100万アイテム
1,000万
ユーザ
最悪,1,000万×100万の
計算量が必要
大規模な商⽤サイトでは
実⽤的でない
i1 ...
u1
...
i2 im
un
計算量の問題
大規模オンラインショッピングサイト
24
スクリーンショット(2015/7/17)© 1996-2015, Amazon.com, Inc.
どのように実現している?
Amazon.co.jp
予めアイテム間の類似度を算出
25
アイテム類似度⾏列
eeaa bb cc dd
1.00 -0.94 -0.55 0.27
-0.94 1.00 0.62 -0.36 -0.91
-0.55 0.62 1.00 -0.88 -0.76
0.27 -0.36 -0.88 1.00 0.43
0.80 -0.91 -0.76 0.43 1.00ee
aa
bb
cc
dd
0.80
アイテムaを好む⼈は
アイテムbも好む
アイテムaとアイテムeの類似度
26
eeaa
Alice 5 ?
Bob 3 3
Carol 4 5
Dave 3 4
Ellen 1 1
4.0
2.4
平均
評価値
3.8
3.2
2.8
調整コサイン類似度
sim , =
∑ , − , −∈
∑ , −∈ ∑ , −∈
, :ユーザ のアイテム への評価値
:ユーザ の平均評価値
アイテム類似度⾏列を⽤いた推薦
27
オフライン処理で事前に作成可能
ee dd
aa を好む⼈は,
次のアイテムも好みます
アイテム類似度⾏列
アイテムベース協調フィルタリング
28
(1) 評価値⾏列を基に各アイテム間の類似度を算出し,
アイテム間の類似度⾏列を作成(オフライン処理)
(2) アイテム間の類似度⾏列を基に,対象ユーザが
興味のあるアイテムに類似するアイテムを推薦
Amazonなどの実⽤的な
アプリケーションで採⽤
[Linden+ 03]
協調フィルタリングの利点と欠点
29
利点
 ⼗分な評価履歴や購入履歴があれば,⽐較的⾼い精度
での推薦が可能
 アイテムの内容を解析する必要がない
欠点
 評価履歴や購入履歴が乏しいドメイン(⾞や不動産な
ど)やコミュニティでは適⽤が困難
 ユーザベース⽅式の場合,新規ユーザには対応できな
い(コールドスタート問題)
 ユーザーベース⽅式,アイテムベース⽅式共に,新規
アイテムには対応できない
 より詳細なユーザ嗜好を反映できない
新規ユーザのコールドスタート問題
30
ユーザ-アイテム評価値⾏列
Frankは他のユーザと
のユーザ類似度が算出
できない
新規ユーザ
新規アイテムのコールドスタート問題
31
アイテムfへの評価値
がないため,推薦候補
に入らない
新規アイテムユーザ-アイテム評価値⾏列
データの疎性(sparcity)問題
32
ユーザ-アイテム評価値⾏列
推薦システムにおいて扱う
全アイテム,全ユーザ数に
対して,評価付けされたア
イテム数が少なすぎる
sparcity = 1 −
∙
:アイテム集合
:ユーザ集合
:評価値集合
内容に基づくフィルタリング
33
Aliceが好む映画はどれ?
タイトル ジャンル 監督 主演俳優 年
アバター SF J. キャメロン S. ワーシントン 2009
ジュラシック・パーク SF S. スピルバーグ S. ニール 1993
ターミネータ― SF J. キャメロン A. シュワルツェネッガー 1984
ハリー・ポッター ファン
タジー
C. コロンバス D. ラドクリフ 2001
マイノリティ・リポート SF S. スピルバーグ T. クルーズ 2002
ロード・オブ・
ザ・リング
ファン
タジー
P. ジャクソン E. ウッド 2001
映画データベース
Aliceが好む映画はどれ?
タイトル ジャンル 監督 主演俳優 年
アバター SF J. キャメロン S. ワーシントン 2009
ジュラシック・パーク SF S. スピルバーグ S. ニール 1993
ターミネータ― SF J. キャメロン A. シュワルツェネッガー 1984
ハリー・ポッター ファン
タジー
C. コロンバス D. ラドクリフ 2001
マイノリティ・リポート SF S. スピルバーグ T. クルーズ 2002
ロード・オブ・
ザ・リング
ファン
タジー
P. ジャクソン E. ウッド 2001
映画データベース
Aliceのユーザプロファイル
タイトル ジャンル 監督 主演俳優 年
- SF J. キャメロン - -
アイテムの特徴と
ユーザプロファイルとのマッチング
内容に基づくフィルタリング
36
aa bb cc
アイテムDB
特徴抽出
アイテムの特徴
Alice
ユーザプロファイル
嗜好獲得
ユーザプロファイルとアイテムの特徴とのマッチングにより,
ユーザの嗜好に最も合致するアイテムを決定
ユーザが好む(過去に好んだ)
アイテムの特徴
ジャンルや監督,著者,価格
などのメタデータや,解析に
より抽出した特徴
ユーザプロファイルの獲得⽅法
37
ターミ
ネーターアバター
ハリー・
ポッター
明示的な評価付けによる獲得
Alice
ユーザが5段階や7段階の尺度でアイテムを評価
暗黙的な評価付けによる獲得
ユーザの⾏動からアイテムへの評価値を予測
例;アイテムを購入,アイテムの詳細ページを閲
覧,アイテムの詳細ページに⻑時間滞在Alice
アイテムの特徴抽出⽅法
38
......
......
記事
イチロー
マーリンズ メ
ディア レジェン
ド トンネル 復調
テキスト解析
音楽
音声解析
製品
属性取得
価格,画素
数,光学ズー
ム,液晶サイ
ズ,動画撮
影,…
スポット
時間解析
対象コンテンツにより⽅法は様々
画像
画像解析
特徴ベクトル
アイテムの特徴ベクトル表現
酸味
苦味
0 1
1
a
b c
def
g
h i
j
k
記号 名前 酸味 苦味
a エメラルドマウンテン 0.6 0.5
b キリマンジャロ 0.6 0.6
c グァテマラ 0.8 0.6
d ケニア 1 0.4
e コナ 0.8 0.4
f ジャワ 0.2 0.4
g トラジャ 0.4 0.6
h ブラジル 0.4 0.3
i ブルーマウンテン 0.6 0.3
j マンデリン 0.4 0.8
k モカ 0.9 0.3
コーヒーデータベース
特徴空間
j = (0.4, 0.8)
2次元空間の場合
⼀つのアイテムを⼀つのベクトルで表現
Aliceのユーザプロファイルを特徴空間上に配置
40
a
c
def
g
i
好きなコーヒー
嫌いなコーヒー
Aliceは,
酸味が強く苦味が弱い
コーヒーを好む?
システムで予測可能か?
Aliceはコーヒーk, hを好むか?
41
a
b c
def
g
h i
j
k
好きなコーヒー
嫌いなコーヒー
k近傍法による嗜好予測
42
a
b c
def
g
h i
j
k
好きなコーヒー
嫌いなコーヒー
注目アイテムに最も類似するk個のアイテムへの
評価値に基づき多数決などで予測
コーヒーkの
近傍コーヒー
コーヒーhの
近傍コーヒー
k近傍法による嗜好予測
43
de
i k
近傍k個のアイテムへの評価値から嗜好を予測(k=3の場合)
好き
3
嫌い
0
vs.
Aliceはコーヒーkを⾼い確率で好むだろう
a
f
h i
好き
1
嫌い
2
vs.
Aliceはコーヒーhを嫌う可能性が⾼い
機械学習モデルによる予測
44
a
c
def
g
i
好きなコーヒー
嫌いなコーヒー
ユーザプロファイルから好きなアイテムの特徴を学習
し,学習したモデルに基づき嗜好を予測
学習モデル
未評価アイテムの予測
Support Vector Machine (SVM) による予測
45
a
c
def
g
i
好きなコーヒー
嫌いなコーヒー
特徴空間上で,好きなアイテムと嫌いなアイテムを
最もよく分離する識別平⾯を⾒つける
Support Vector Machine (SVM) による予測
46
a
c
def
g
i
好きなコーヒー
嫌いなコーヒー
識別平⾯からどちら側に配置されるかにより,
未評価アイテムへの嗜好を予測
最適な識別平⾯
b
h
j
k
コーヒーb, jは
嫌うだろう
コーヒーkは
好むだろう
好きな領域
嫌いな領域
内容に基づくフィルタリングの利点と欠点
47
利点
 新規アイテムであっても推薦対象に含めることが可能
 対象ユーザ自身のユーザプロファイルさえあれば,
推薦可能
 より詳細なユーザ嗜好を反映可能
 推薦の質がシステムの利⽤者数に影響されない
欠点
 アイテムの特徴抽出が推薦の質に影響を与える
 ユーザプロファイルの獲得が推薦の質に影響を与える
 新規ユーザのコールドスタート問題
アイテムベース協調フィルタリング
vs. 内容に基づくフィルタリング
48
協調 内容
アイテムの特徴抽出 - 必要
ユーザプロファイルの獲得 - 必要
評価値⾏列の獲得 必要 -
より詳細なユーザ嗜好の反映 不可 可
新規アイテムの
コールドスタート問題
発生 -
新規ユーザの
コールドスタート問題
発生-
ハイブリッド型推薦システム
49
ハイブリッド型推薦システム
協調 内容
アイテムの特徴抽出 - 必要
ユーザプロファイルの獲得 - 必要
評価値⾏列の獲得 必要 -
より詳細なユーザ嗜好の反映 不可 可
新規アイテムの
コールドスタート問題
発生 -
新規ユーザの
コールドスタート問題
発生-
各々の強みを生かすように複数の推薦システムを組み合わせる
ハイブリッド化
並列型ハイブリッド
51
推薦システム1
推薦システムn
… ハイブリッド化入⼒ 出⼒
複数の推薦システムが個別に推薦リストを生成し,
最終的に集約された推薦リストを出⼒
混合
複数の推薦システムの結果を同時に提示
重み付き
複数の推薦システムによるスコアの加重和に基づき推薦リストを出⼒
切替
利⽤時の条件に応じて⽤いる推薦システムを切り替える
直列型ハイブリッド
52
推薦システム1 推薦システム1…入⼒ 出⼒
前の推薦システムの出⼒が次の推薦システムの入⼒となり,
段階的に絞り込まれた推薦リストを出⼒
縦続
前段の推薦システムにより推薦候補を選別していき,
最終的に順位付けされた推薦リストを出⼒
メタレベル
内容に基づくユーザ類似度を算出し,
そのユーザ類似度を⽤いて協調フィルタリングを実⾏
単一型ハイブリッド
53
ハイブリッド型推薦システム
推薦システム1 推薦システムn…
入⼒ 出⼒
前処理
複数の推薦システムにより前処理された入⼒データを⽤い,
推薦システムを実⾏
特徴結合
アイテム特徴(ジャンルなど)やユーザ特徴(デモグラフィックな
ど)を結合した評価値⾏列を⽤いた協調フィルタリングを実⾏
特徴拡張
⼀⽅の推薦システムで予測された評価値やアイテム分類を次の推薦シ
ステムの入⼒特徴に統合
例;協調フィルタリングで出⼒された関連著者や関連タイトルを,内容に基
づくフィルタリングに入⼒する特徴量とする
54
 推薦精度
 適合率・再現率
 ユーザ評価
 新規性,意外性,セレンディピティ
情報推薦システムの評価
〜嗜好の予測⽅法は正しいのか?〜
第 II 部
基本的な推薦精度評価
55
好き 好き 好き
好き 好き 好き 嫌い
嫌い 嫌い
嫌い
推薦精度 = 3 / 5 = 0.6
ユーザ評価
システム予測
N分割交差検定
56
学習セット テストセット
N分割
データセット
モデル構築
評価
N対の組合せでの
評価を平均
平均絶対誤差(MAE; Mean Absolute Error)
平均絶対誤差
MAE =
∑ ∑ rec , − ,∈testset∈
∑ testset∈
MAE = 3 / 5 = 0.6
*0に近いほど高精度
ユーザ
評価値
システム
予測値
アイテム
誤差の
絶対値
55
55
33
44
22
44
55
33
33
33
1
0
0
1
1
:ユーザ集合
testset :ユーザ のテスト集合
rec , :ユーザ のアイテム への予測値
, :ユーザ のアイテム への評価値
適合率・再現率
ユーザ評価
システムによる推薦
適合率=
推薦されたアイテム中の好きなアイテムの数
推薦されたアイテムの数
=
再現率=
推薦されたアイテム中の好きなアイテムの数
全アイテム中の好きなアイテムの数
=
好き
嫌い
推薦 非推薦
A B
C -
ユーザ評価
59
被験者に評価対象の推薦システムおよび
⽐較対象の推薦システムを利⽤してもらい,
質問にN段階で回答してもらう
A
被験者内実験
B
vs.
A
被験者間実験
B
vs.
質問例
60
評価尺度 質問
推薦精度 推薦されたアイテムは私の興味に合っていた
推薦新規性 推薦されたアイテムは私にとって新しい
推薦多様性 推薦されたアイテムは多様であった
インタフェース妥当性 このシステムのインタフェースは分かりやすかった
説明性 このシステムは私に本の推薦理由を説明してくれた
総合満⾜度 私は全体としてこのシステムに満足している
システム信頼度 このシステムは私にとって信頼できる
システム利⽤意図 私はこのシステムをまた利⽤したい
セレンディピティ このシステムは私に新しい興味に気付かせてくれたり,
新たな発⾒を与えてくれたりした
以下の質問について,5段階で回答してもらう
5:強くそう思う, 4:そう思う,
3:どちらともいえない,
2:そうは思わない, 1:まったくそうは思わない
[Pu+ 11]
評価尺度間の関係性
61
説明性
インタラクション
妥当性
推薦精度
推薦
新規性
推薦
多様性
情報
充足性
インタフェース
妥当性
透過性
制御性
知覚
有⽤性
知覚
簡便性
システム
信頼度
総合
満足度
アイテム
購入意図
システム
利⽤意図
ユーザ知覚品質 ユーザ信頼度 ユーザ態度 ⾏動意図
[Pu+ 11]
新規性(Novelty)
62
新規性のあるアイテム
ユーザがこれまでに未知であったアイテム
アクション映画が好き
○新規性あり
×有⽤性なし
推薦
アニメの映画は興味ない…
スパイダー
マン
スーパー
マン バットマン
ドラえもん
×既知ではあったが,意外であるようなアイテムは含まれない
×ユーザにとってのポジティブな印象は含まない
意外性(Unexpectedness)
63
意外性の高いアイテム
単純な予測⽅法では予測が困難なアイテム
単純な予測方法により
推薦可能なアイテム集合
意外なアイテム集合
推薦アイテム集合(RS)
スター
ウォーズ
ハリー・
ポッター
\
パーシー・
ジャクソン
タイタンの
戦い
センター・
オブ・ジ・
アース
[Murakami+ 08]
セレンディピティ(Serendipity)
64
セレンディピティなアイテム
意外かつ有⽤なアイテム
単純な予測方法により
推薦可能なアイテム集合
意外なアイテム集合
推薦アイテム集合(RS)
\
パーシー・
ジャクソン
タイタンの
戦い
センター・
オブ・ジ・
アース
スター
ウォーズ
ハリー・
ポッター
セレンディピティなアイテム集合 有⽤なアイテム集合
[Ge+ 10]
セレンディピティなアイテムの定義 (1)
65
Geらの定義 [Ge+ 10]
(1) ユーザによって未だ発⾒されておらず,かつ予期されないアイテム
(2) ユーザに興味を起こさせ,妥当かつ有⽤であるアイテム
AND
Herlockerらの定義 [Herlocker+ 04]
ユーザの興味を広げるきっかけとなったアイテム
 ユーザがこれまで⼀度も購入してこなかったようなジャンルのア
イテムを推薦によって支持するようになった
 推薦されたアイテムによってユーザが幸せになった
 他のアイテムに⽐べ,⾼い確率でユーザがその推薦アイテムのリ
ピータになった
セレンディピティなアイテムの定義 (2)
66
未知で自⼒では発⾒できなかったであろうが,
提示されて初めて興味をもったアイテム
提示されるまでは興味がなかったが,
提示されて初めて興味をもったアイテム
提示されることにより,
自分自身の興味を広げるきっかけとなったアイテム
奥らの定義 [奥+ 13]
OR
OR
新規性とセレンディピティの違い
67
天空の城
ラピュタ
○新規性あり
×セレンディピティなし
宮﨑駿監督の
映画が好き
いずれこの映画は
観るつもりだった…
推薦
となりの
トトロ
魔⼥の
宅急便
風⽴ちぬ
宮崎駿監督
新作
新規性とセレンディピティの違い
68
天空の城
ラピュタ
○新規性あり
○セレンディピティあり推薦
となりの
トトロ
魔⼥の
宅急便
…
新⼈監督
作風が宮﨑駿
監督と類似
この監督は知らなかったが,
彼の映画にも興味がもてそう
69
 コンテキストアウェア推薦システム
 位置情報推薦
 グループ推薦
 新規性,意外性,セレンディピティの向上
先端的トピック
〜多様化する利⽤場⾯での嗜好予測〜
第 III 部
コンテキストアウェア推薦システム
70
従来の推薦システム
ユーザプロファイルを基に,対象アイテムへの評価値を予測
Users × Items → Ratings
コンテキストアウェア推薦システム
ユーザプロファイルおよびコンテキスト情報を基に,対象アイテ
ムへの評価値を予測
Users × Items × Contexts → Ratings
推薦システムが利⽤される状況(コンテキスト)に適応し
たアイテムを推薦
例;休日に⼀⼈で⾷事 ⇒ 落ち着けるカフェ
クリスマスに恋⼈と⾷事 ⇒ おしゃれなイタリアンレストラン
コンテキスト適応推薦方式 [Adomavicius+ 11]
71
データ
U × I × C × R
コンテキスト適応
データ
U × I × R
推薦システム
U × I → R
コンテキスト適応
推薦候補
i1, i2, i3, ...
データ
U × I × C × R
データ
U × I × C × R
推薦システム
U × I → R
コンテキスト統合
推薦システム
U × I × C → R
コンテキスト適応
推薦候補
i1, i2, i3, ...
コンテキスト適応
推薦候補
i1, i2, i3, ...
推薦候補
i1, i2, i3, ...
コンテキスト
事前フィルタリング
コンテキスト
事後フィルタリング
コンテキスト
統合モデリング
c
u
c
u
c
u
位置情報推薦
72
 位置情報(Location):
ホテルやレストラン,博物館,店など,ユーザが興味をも
つ特定の機能を有する地点
 位置情報推薦(Location Recommendation):
ユーザの要求を満たし,興味を満足させる位置情報を推薦
Gaoらの定義 [Gao+ 14]
※Location = POI (Point Of Interest; 関心地点) とよぶことも多い
協調型位置情報推薦 [Ye+ 11]
73
位置情報
友人リンク
 位置d, eに訪れた⼈は,位置fにも訪れています
 友⼈のBobは,位置bにも訪れています
 興味のある地域の近くでは,位置cがお薦めです
Carolの推薦例
Alice Bob Carol Dave
ee
aa
bb
dd
cc
f
チェックイン
ユーザ
グループ推薦
74
個⼈向けではなく,家族や同伴者などのグループに適応し
たアイテムを推薦
例;家族向けのレシピ,友⼈グループで観る映画,利⽤するレス
トラン,カラオケの選曲
グループ推薦の実現⽅式 [Berkovsky+ 10]
75
推薦
システム
Alice
Bob
Carol
ユーザモデル
グループモデル
集約
候補 aa bb
推薦アイテム
集約モデル方式
Alice
Bob
Carol
ユーザモデル
推薦システム
推薦システム
推薦システム
推薦候補
推薦候補
推薦候補
集約
候補
aa bb
推薦アイテム
集約候補方式
重み付けモデル
76
Uniform model
均等に重み付け
11 11 11
Heuristic model
常識的に定義
0.5 0.3 0.1
Role-based model
他の家族内の役割を参照して重み付
け
0.1 0.5 0.7
Family-log model
家族内の活動度に基づき重み付け
0.1 0.6 0.3
Pre-defined model Interaction-based model
誰の嗜好を重視するか?
Extreme case heuristics
77
11 00
大好き! 普通
嫌い!
最大幸福法
⼀⼈でも大好きなメンバがいる場合は推薦する
00
00 00 11
好き! 大好き!
大嫌い!
最⼩不幸法
⼀⼈でも大嫌いなメンバがいる場合は推薦しない
極端な好き嫌いがある場合
新規性,意外性,セレンディピティの向上
78
ユーザモデルに基づく方式
既知/未知
プロファイル
未知のアイテムを推薦
インタラクションに基づく方式
インタラクションの過程で
アイテムを発⾒
推薦リスト編集に基づく方式
推薦リストを多様化
マイニングに基づく方式
膨大なコンテンツの中から
特殊な情報を抽出
推薦リスト内類似度(ILS)に基づく多様性評価
79
推薦リストA 推薦リストB
- 0.8 0.7 0.9
- 0.7 0.8
- 0.7
-
- 0.1 0.2 0.1
- 0.2 0.3
- 0.1
-
ILS = 0.77 ILS = 0.17
推薦リストがどの程度多様なアイテムを含んでいるか
多様性あり多様性なし
発⾒性を考慮した協調フィルタリング
[Hijikata+ 09]
80
aa bb cc
Alice 5 ? ?
Bob 3 1 2
Carol 4 3 4
ユーザ-アイテム評価値⾏列
既知 ⇒ 1 / 未知 ⇒ 0
aa bb cc
Alice 1 0 ?
Bob 1 0 0
Carol 0 1 1
ユーザ-アイテム既知/未知⾏列
知らないかつ好みのアイテムを予測
コンピュータは
人の嗜好を予測できるのか
81
まとめ
82
情報推薦システムの基本方式
〜嗜好をどのように予測しているのか?〜
第 I 部
情報推薦システムの評価
〜嗜好の予測⽅法は正しいのか?〜
第 II 部
先端的トピック
〜多様化する利⽤場⾯での嗜好予測〜
第 III 部
まとめ
83
第 I 部
第 II 部
第 III 部
 協調フィルタリング
 内容に基づくフィルタリング
 ハイブリッド型推薦システム
 推薦精度
 適合率・再現率
 ユーザ評価
 新規性,意外性,セレンディピティ
 コンテキストアウェア推薦システム
 位置情報推薦
 グループ推薦
 新規性,意外性,セレンディピティの向上
今後の注目トピック
84
特定ドメインの内容に基づくフィルタリング
 例;楽曲推薦,観光情報推薦,経路推薦
クロスドメイン推薦システム
 例;映画ドメインのプロファイルから書籍ドメイン
の嗜好を予測
ユーザインタラクティブな情報推薦システム
 例;インタラクティブな観光情報推薦
参考⽂献
• G. Adomavicius, B. Mobasher, F. Ricci, and A. Tuzhilin. Context-aware recommender systems. AI Magazine,
32(3), 2011.
• S. Berkovsky and J. Freyne, “Group-based recipe recommendations: analysis of data aggregation strategies,”
in Proceedings of the fourth ACM conference on Recommender systems, 2010, pp. 111–118.
• H. Gao, J. Tang, X. Hu, and H. Liu, “Exploring temporal effects for location recommendation on location-based
social networks,” in Proceedings of the seventh ACM conference on Recommender systems, 2013, pp. 93–100.
• M. Ge, C. Delgado-Battenfeld, and D. Jannach, “Beyond accuracy: evaluating recommender systems by
coverage and serendipity,” in Proceedings of the fourth ACM conference on Recommender systems, 2010, pp.
257–260.
• Y. Hijikata, T. Shimizu, and S. Nishida, “Discovery-oriented collaborative filtering for improving user
satisfaction,” in Proceedings of the 14th international conference on Intelligent user interfaces, 2009, pp. 67–
76.
• J. L. Herlocker, J. A. Konstan, L. G. Terveen, and J. T. Riedl, “Evaluating collaborative filtering recommender
systems,” ACM Trans. Inf. Syst., vol. 22, no. 1, pp. 5–53, 2004.
• G. Linden, B. Smith, and J. York, “Amazon.com Recommendations: Item-to-Item Collaborative Filtering,” IEEE
Internet Computing, 2003.
• T. Murakami, K. Mori, and R. Orihara, “Metrics for evaluating the serendipity of recommendation lists,” New
Front. Artif. Intell. Lect. Notes Comput. Sci., vol. 4914/2008, pp. 40–46, 2008.
• P. Pu and L. Chen, “A User-Centric Evaluation Framework for Recommender Systems,” in Proceedings of the
fifth ACM conference on Recommender systems, 2011, pp. 157–164.
• P. Resnick and H. R. Varian, “Recommender systems,” Commun. ACM, vol. 40, no. 3, pp. 56–58, 1997.
• M. Ye, P. Yin, W. C. Lee, and D. L. Lee, “Exploiting geographical influence for collaborative point-of-interest
recommendation,” in Proceedings of the 34th international ACM SIGIR conference on Research and
development in Information, 2011, pp. 325–334.
• 奥健太 & 服部⽂夫: セレンディピティ指向情報推薦のためのフュージョンベース推薦システム, 知能と情報(日本知能情
報ファジィ学会誌)- 特集:WebインテリジェンスとインタラクションII -, Vol.25, No.1, pp.524-539, 2013.
85
解説記事,書籍
• 土⽅嘉徳:推薦システムのオフライン評価手法,⼈工知能学会学会誌,Vol. 29,No. 6,pp. 658-689, 2014.
• 土⽅嘉徳:推薦システムにおけるインタラクション研究へのいざない,ヒューマンインタフェース学会誌,Vol.15, No.3,
pp.3-6, 2013.
• 土⽅嘉徳:嗜好抽出と情報推薦技術,情報処理学会誌,Vol.48, No.9, pp.957-965, 2007.
• 土⽅嘉徳:情報推薦・情報フィルタリングのためのユーザプロファイリング技術,⼈工知能学会誌,Vol.19, No.3,
pp.365–372, 2004.
• 神嶌 敏弘, 推薦システム, http://www.kamishima.net/archive/recsys.pdf
• 神嶌 敏弘 “推薦システムのアルゴリズム (3)” ⼈工知能学会誌, vol.23, no.2, pp.248-263 (2008)
• 神嶌 敏弘 “推薦システムのアルゴリズム (2)” ⼈工知能学会誌, vol.23, no.1, pp.89-103 (2008)
• 神嶌 敏弘 “推薦システムのアルゴリズム (1)” ⼈工知能学会誌, vol.22, no.6, pp.826-837 (2007)
• 奥健太: セレンディピティ指向情報推薦の研究動向, 知能と情報(日本知能情報ファジィ学会誌)- 特集:Webインテリ
ジェンスとインタラクションII -, Vol.25, No.1, pp.2-10, 2013.
• 田中克己; 角谷和俊(監訳); 奥健太; 北⼭大輔; 手塚太郎; 牛尼剛聡; 中島伸介; 土⽅嘉徳; 湯本⾼⾏; 河合由起子; 原田史
子 & 木村⽂則(訳): 情報推薦システム入門―理論と実践―, 共⽴出版, pp.384 pages, 2012.
86

Contenu connexe

Tendances

Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
Yohei Sato
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
 

Tendances (20)

勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
協調フィルタリング入門
協調フィルタリング入門協調フィルタリング入門
協調フィルタリング入門
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
レコメンド研究のあれこれ
レコメンド研究のあれこれレコメンド研究のあれこれ
レコメンド研究のあれこれ
 
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」
 
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
 
これからの仮説検証・モデル評価
これからの仮説検証・モデル評価これからの仮説検証・モデル評価
これからの仮説検証・モデル評価
 
協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tips
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
 
ユーザーサイド情報検索システム
ユーザーサイド情報検索システムユーザーサイド情報検索システム
ユーザーサイド情報検索システム
 
星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章
 
4 データ間の距離と類似度
4 データ間の距離と類似度4 データ間の距離と類似度
4 データ間の距離と類似度
 
経験ベイズ木(IBIS 2017)
経験ベイズ木(IBIS 2017)経験ベイズ木(IBIS 2017)
経験ベイズ木(IBIS 2017)
 
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 

En vedette

どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
Shuyo Nakatani
 
Latent factor models for Collaborative Filtering
Latent factor models for Collaborative FilteringLatent factor models for Collaborative Filtering
Latent factor models for Collaborative Filtering
sscdotopen
 
Ensembles of example dependent cost-sensitive decision trees slides
Ensembles of example dependent cost-sensitive decision trees slidesEnsembles of example dependent cost-sensitive decision trees slides
Ensembles of example dependent cost-sensitive decision trees slides
Alejandro Correa Bahnsen, PhD
 
機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト
Teppei Baba
 

En vedette (12)

ゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステムゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステム
 
A sequential recommendation approach for interactive personalized story gener...
A sequential recommendation approach for interactive personalized story gener...A sequential recommendation approach for interactive personalized story gener...
A sequential recommendation approach for interactive personalized story gener...
 
セレンディピティと機械学習
セレンディピティと機械学習セレンディピティと機械学習
セレンディピティと機械学習
 
国際化時代の40カ国語言語判定
国際化時代の40カ国語言語判定国際化時代の40カ国語言語判定
国際化時代の40カ国語言語判定
 
どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
 
RecSys 2015: Large-scale real-time product recommendation at Criteo
RecSys 2015: Large-scale real-time product recommendation at CriteoRecSys 2015: Large-scale real-time product recommendation at Criteo
RecSys 2015: Large-scale real-time product recommendation at Criteo
 
coordinate descent 法について
coordinate descent 法についてcoordinate descent 法について
coordinate descent 法について
 
Latent factor models for Collaborative Filtering
Latent factor models for Collaborative FilteringLatent factor models for Collaborative Filtering
Latent factor models for Collaborative Filtering
 
Deep forest
Deep forestDeep forest
Deep forest
 
JP Chaosmap 2015-2016
JP Chaosmap 2015-2016JP Chaosmap 2015-2016
JP Chaosmap 2015-2016
 
Ensembles of example dependent cost-sensitive decision trees slides
Ensembles of example dependent cost-sensitive decision trees slidesEnsembles of example dependent cost-sensitive decision trees slides
Ensembles of example dependent cost-sensitive decision trees slides
 
機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト
 

Plus de Kenta Oku

Plus de Kenta Oku (13)

データベース14 - データベース構造とインデックス
データベース14 - データベース構造とインデックスデータベース14 - データベース構造とインデックス
データベース14 - データベース構造とインデックス
 
データベース13 - トランザクションと障害回復
データベース13 - トランザクションと障害回復データベース13 - トランザクションと障害回復
データベース13 - トランザクションと障害回復
 
データベース12 - トランザクションと同時実行制御
データベース12 - トランザクションと同時実行制御データベース12 - トランザクションと同時実行制御
データベース12 - トランザクションと同時実行制御
 
データベース11 - データベースとプログラム
データベース11 - データベースとプログラムデータベース11 - データベースとプログラム
データベース11 - データベースとプログラム
 
データベース10 - 正規化
データベース10 - 正規化データベース10 - 正規化
データベース10 - 正規化
 
データベース09 - データベース設計
データベース09 - データベース設計データベース09 - データベース設計
データベース09 - データベース設計
 
データベース08 - 関係データモデルと関係代数
データベース08 - 関係データモデルと関係代数データベース08 - 関係データモデルと関係代数
データベース08 - 関係データモデルと関係代数
 
データベース01 - データベースとは
データベース01 - データベースとはデータベース01 - データベースとは
データベース01 - データベースとは
 
データベース03 - SQL(CREATE, INSERT, DELETE, UPDATEなど)
データベース03 - SQL(CREATE, INSERT, DELETE, UPDATEなど)データベース03 - SQL(CREATE, INSERT, DELETE, UPDATEなど)
データベース03 - SQL(CREATE, INSERT, DELETE, UPDATEなど)
 
データベース02 - SQL概要
データベース02 - SQL概要データベース02 - SQL概要
データベース02 - SQL概要
 
データベース06 - SQL(VIEW, ALTER, GRANTなど)
データベース06 - SQL(VIEW, ALTER, GRANTなど)データベース06 - SQL(VIEW, ALTER, GRANTなど)
データベース06 - SQL(VIEW, ALTER, GRANTなど)
 
データベース05 - SQL(SELECT:結合,副問合せ)
データベース05 - SQL(SELECT:結合,副問合せ)データベース05 - SQL(SELECT:結合,副問合せ)
データベース05 - SQL(SELECT:結合,副問合せ)
 
データベース04 - SQL(SELECT:基本)
データベース04 - SQL(SELECT:基本)データベース04 - SQL(SELECT:基本)
データベース04 - SQL(SELECT:基本)
 

情報推薦システム入門:講義スライド