SlideShare une entreprise Scribd logo
1  sur  12
Télécharger pour lire hors ligne
Matrix Factorization を使った評価予測



株式会社サイバーエージェント
アメーバ事業本部 Ameba Technology Laboratory
服部 司
株式会社サイバーエージェント
                                          2



今日紹介する話

・ ユーザーがアイテムにつける評価を予測する。
   - 大半のレビューサイトには5星評価有
   - 典型的な推薦の問題
株式会社サイバーエージェント
                                                          3



実現方法

・ 購買履歴、評価データを使った 協調 Filtering
   - 詳細は割愛
    ( “collaborative filter “ でググるべし )
株式会社サイバーエージェント
                                                                                           4



協調 Filtering のアルゴリズム

・ Netflix Prize
    -   Netflix : オンラインの映画レンタルショップ
        * user の映画の評価データいっぱい溜まってる。

    - 推薦アルゴリズムの精度(rmse)を10%改善したら100万ドル

          rmse     r           rij  n
                                      2
                     i, j   ij                ( i : user ,   j : item )




・ 流行のアルゴリズム
    -   PLSA、SlopeOne、KNN、Matrix Factorization*
             * Koren Y, Bell R : Advances in Collaborative Filtering (2011)
株式会社サイバーエージェント
                                                     5



Matrix Factorization
 ・ 概要
      - 正則化項付きのSVDの亜種

      - 利点
          *   精度がいい
          *   計算時間が速い
          *   モデルの柔軟性が非常に高い

      - 悪点
          *   並列計算が苦手
                - MapReduceと相性が悪い
株式会社サイバーエージェント
                                                                                                      6



MF の種類 ( SVD )

・ 予測モデル
     r 'ui    buser (u )  bitem (i )  U u I i                       (0  u  n , 0  i  m )

          r'ui   : 予測評価       buser   : 個人の影響       I    : 商品の属性 ( I  R k m )

                : 全体平均       bitem   : 商品の影響       U    : 個人の属性 ( U  R uk )




・ 学習方法
   min
   bU I
           (u ,i )R rui  r 'ui 2   buser 2  bitem 2  | U uT |2  I i 2 
                   最適化法 → 独特な確率的勾配法 (SGD)*
                                           ( * 本ケースでは理論的な収束保障が全くない )
株式会社サイバーエージェント
                                                                                                                  7



MF の種類 ( SVD++ )

・ 予測モデル
                                                                                       
                                                                                0.5
   r 'ui    buser (u )  bitem (i )  (U u  R(u )                                      jR ( u )
                                                                                                       y j )Ii
          R (u )   : ユーザーU が評価したアイテム集合
                                                                 k m
             y     : 商品へのあるアクションの効果 ( y  R                             )
                       - 今回は ”あるアクション = 商品を評価したという行為”



・ 学習方法
   min
   bU I
             ( u ,i )R
                           rui  r 'ui 
                                        2
                                                
                                             1 buser  bitem
                                                      2           2
                                                                         | U
                                                                            2
                                                                                   T 2
                                                                                   u   |  Ii  y j
                                                                                               2          2
                                                                                                              
                      最適化法 → SVDの方法を改良したSGD
株式会社サイバーエージェント
                                                                              8



評価実験
 データ: MovieLens 100k              ( http://www.grouplens.org/node/73 )
        ◆ user num : 938
        ◆ item num : 1682
        ◆ record num : 100,000


 評価 : MAE、RMSE ( 5fold-cross-validation )
        mae  ij rij  rij / n ( i : user, j : item )

 環境 : os : windows7              cpu : i7 (2.7G×4HT)
      memory: 8G

 比較アルゴリズム
    ・ Random、SlopeOne、SVD、SVD++
株式会社サイバーエージェント
                                                                        9



結果
 ◆ 精度
            random       SlopeOne     SVD      SVD++

     MAE    1.71757       0.74244    0.71411   0.71098

     RMSE   2.10189       0.94264    0.90573   0.90293

                                     * 精度は値が低い方が良い



 ◆ 計算時間

            random       SlopeOne     SVD      SVD++

     time
                     -       6,843    13,187   1,724,436
     (ms)
株式会社サイバーエージェント
                                                   10



雑記 ・ TIPS

・ SlopeOne を使うのなら、SVDの方が良いかも。


・ とはいえ、
    - SlopeOneに比して0.04程度(rmse)の改善幅。
    - 学習パラメータを決めるのに時間がかかる。


・ 評価予測だけでは推薦には使えない。
    - 所詮人気の商品の評価は高い。
      ( 個人の趣向による効果は薄い )
    - 評価予測をいかに推薦に昇華させる方が結構大事。
株式会社サイバーエージェント
                                                            11




・ timeSVD++
     - 時間によるユーザーの興味の編成を考慮したモデル
     - 精度は SVD++ より更に良い。
      ( rmse で 0.02 程度改善 )
     - パラメータを決めるのに時間がかかり過ぎる


・ サンプルコード
    - mf_predictor
      http://code.google.com/p/mf-predictor/
株式会社サイバーエージェント
                               12




ご清聴ありがとうございました!

Contenu connexe

Tendances

Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Fumihiko Takahashi
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用Yoshitaka Ushiku
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知Yuya Takashina
 
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with TransformersDeep Learning JP
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択kazutantan
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)Takao Yamanaka
 
識別モデルと生成モデルと損失データ
識別モデルと生成モデルと損失データ識別モデルと生成モデルと損失データ
識別モデルと生成モデルと損失データShohei Miyashita
 
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料 Ken'ichi Matsui
 
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデルKei Nakagawa
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法Deep Learning JP
 
強化学習その3
強化学習その3強化学習その3
強化学習その3nishio
 
最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向ohken
 
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリングmlm_kansai
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)Masahiro Suzuki
 
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII
 
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法智文 中野
 
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化gree_tech
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
21世紀の手法対決 (MIC vs HSIC)
21世紀の手法対決 (MIC vs HSIC)21世紀の手法対決 (MIC vs HSIC)
21世紀の手法対決 (MIC vs HSIC)Toru Imai
 

Tendances (20)

Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
 
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
【DL輪読会】A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
 
識別モデルと生成モデルと損失データ
識別モデルと生成モデルと損失データ識別モデルと生成モデルと損失データ
識別モデルと生成モデルと損失データ
 
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
 
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
 
強化学習その3
強化学習その3強化学習その3
強化学習その3
 
最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向
 
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
 
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
 
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
Chapter2.3.6
Chapter2.3.6Chapter2.3.6
Chapter2.3.6
 
21世紀の手法対決 (MIC vs HSIC)
21世紀の手法対決 (MIC vs HSIC)21世紀の手法対決 (MIC vs HSIC)
21世紀の手法対決 (MIC vs HSIC)
 

Similaire à Matrix Factorizationを使った評価予測

GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2GREE/Art
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)Shintaro Yoshida
 
DXRubyとスプライトエディタ
DXRubyとスプライトエディタDXRubyとスプライトエディタ
DXRubyとスプライトエディタmieki256 blawat
 
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)Takuji Tahara
 
20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料Kenichiro Nakajima
 
130710 02
130710 02130710 02
130710 02openrtm
 
数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强Felicia Wenyi Fei
 
Analysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization BenefitsAnalysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization Benefitsnnakagoshi
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programmingYuichi Hasegawa
 

Similaire à Matrix Factorizationを使った評価予測 (12)

GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
 
M5 sinchir0
M5 sinchir0M5 sinchir0
M5 sinchir0
 
Bee Style:vol.039
Bee Style:vol.039Bee Style:vol.039
Bee Style:vol.039
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
 
DXRubyとスプライトエディタ
DXRubyとスプライトエディタDXRubyとスプライトエディタ
DXRubyとスプライトエディタ
 
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
 
20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料20110909 品質シンポジウム2011発表資料
20110909 品質シンポジウム2011発表資料
 
130710 02
130710 02130710 02
130710 02
 
数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强数据挖掘竞赛经验分享 严强
数据挖掘竞赛经验分享 严强
 
ADVENTURE_Solidの概要
ADVENTURE_Solidの概要ADVENTURE_Solidの概要
ADVENTURE_Solidの概要
 
Analysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization BenefitsAnalysis of Service Interface International Standardization Benefits
Analysis of Service Interface International Standardization Benefits
 
[豆ナイト]Java small object programming
[豆ナイト]Java small object programming[豆ナイト]Java small object programming
[豆ナイト]Java small object programming
 

Plus de JAVA DM

MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出JAVA DM
 
芸能人推薦のしくみ
芸能人推薦のしくみ芸能人推薦のしくみ
芸能人推薦のしくみJAVA DM
 
20100930sig startups learn
20100930sig startups learn20100930sig startups learn
20100930sig startups learnJAVA DM
 
お披露目会05/2010
お披露目会05/2010お披露目会05/2010
お披露目会05/2010JAVA DM
 
双対定理
双対定理双対定理
双対定理JAVA DM
 
整数列圧縮
整数列圧縮整数列圧縮
整数列圧縮JAVA DM
 
NewPFD PForDelta
NewPFD PForDeltaNewPFD PForDelta
NewPFD PForDeltaJAVA DM
 
NaiveBayes+DAEM
NaiveBayes+DAEMNaiveBayes+DAEM
NaiveBayes+DAEMJAVA DM
 
lsh p-stable
lsh p-stablelsh p-stable
lsh p-stableJAVA DM
 

Plus de JAVA DM (9)

MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出MP Joinを使った類似データ抽出
MP Joinを使った類似データ抽出
 
芸能人推薦のしくみ
芸能人推薦のしくみ芸能人推薦のしくみ
芸能人推薦のしくみ
 
20100930sig startups learn
20100930sig startups learn20100930sig startups learn
20100930sig startups learn
 
お披露目会05/2010
お披露目会05/2010お披露目会05/2010
お披露目会05/2010
 
双対定理
双対定理双対定理
双対定理
 
整数列圧縮
整数列圧縮整数列圧縮
整数列圧縮
 
NewPFD PForDelta
NewPFD PForDeltaNewPFD PForDelta
NewPFD PForDelta
 
NaiveBayes+DAEM
NaiveBayes+DAEMNaiveBayes+DAEM
NaiveBayes+DAEM
 
lsh p-stable
lsh p-stablelsh p-stable
lsh p-stable
 

Dernier

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 

Dernier (9)

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 

Matrix Factorizationを使った評価予測

  • 2. 株式会社サイバーエージェント 2 今日紹介する話 ・ ユーザーがアイテムにつける評価を予測する。 - 大半のレビューサイトには5星評価有 - 典型的な推薦の問題
  • 3. 株式会社サイバーエージェント 3 実現方法 ・ 購買履歴、評価データを使った 協調 Filtering - 詳細は割愛 ( “collaborative filter “ でググるべし )
  • 4. 株式会社サイバーエージェント 4 協調 Filtering のアルゴリズム ・ Netflix Prize - Netflix : オンラインの映画レンタルショップ * user の映画の評価データいっぱい溜まってる。 - 推薦アルゴリズムの精度(rmse)を10%改善したら100万ドル rmse   r  rij  n 2 i, j ij ( i : user , j : item ) ・ 流行のアルゴリズム - PLSA、SlopeOne、KNN、Matrix Factorization* * Koren Y, Bell R : Advances in Collaborative Filtering (2011)
  • 5. 株式会社サイバーエージェント 5 Matrix Factorization ・ 概要 - 正則化項付きのSVDの亜種 - 利点 * 精度がいい * 計算時間が速い * モデルの柔軟性が非常に高い - 悪点 * 並列計算が苦手 - MapReduceと相性が悪い
  • 6. 株式会社サイバーエージェント 6 MF の種類 ( SVD ) ・ 予測モデル r 'ui    buser (u )  bitem (i )  U u I i (0  u  n , 0  i  m ) r'ui : 予測評価 buser : 個人の影響 I : 商品の属性 ( I  R k m )  : 全体平均 bitem : 商品の影響 U : 個人の属性 ( U  R uk ) ・ 学習方法 min bU I (u ,i )R rui  r 'ui 2   buser 2  bitem 2  | U uT |2  I i 2  最適化法 → 独特な確率的勾配法 (SGD)* ( * 本ケースでは理論的な収束保障が全くない )
  • 7. 株式会社サイバーエージェント 7 MF の種類 ( SVD++ ) ・ 予測モデル  0.5 r 'ui    buser (u )  bitem (i )  (U u  R(u ) jR ( u ) y j )Ii R (u ) : ユーザーU が評価したアイテム集合 k m y : 商品へのあるアクションの効果 ( y  R ) - 今回は ”あるアクション = 商品を評価したという行為” ・ 学習方法 min bU I  ( u ,i )R rui  r 'ui  2   1 buser  bitem 2 2    | U 2 T 2 u |  Ii  y j 2 2  最適化法 → SVDの方法を改良したSGD
  • 8. 株式会社サイバーエージェント 8 評価実験 データ: MovieLens 100k ( http://www.grouplens.org/node/73 ) ◆ user num : 938 ◆ item num : 1682 ◆ record num : 100,000 評価 : MAE、RMSE ( 5fold-cross-validation ) mae  ij rij  rij / n ( i : user, j : item ) 環境 : os : windows7 cpu : i7 (2.7G×4HT) memory: 8G 比較アルゴリズム ・ Random、SlopeOne、SVD、SVD++
  • 9. 株式会社サイバーエージェント 9 結果 ◆ 精度 random SlopeOne SVD SVD++ MAE 1.71757 0.74244 0.71411 0.71098 RMSE 2.10189 0.94264 0.90573 0.90293 * 精度は値が低い方が良い ◆ 計算時間 random SlopeOne SVD SVD++ time - 6,843 13,187 1,724,436 (ms)
  • 10. 株式会社サイバーエージェント 10 雑記 ・ TIPS ・ SlopeOne を使うのなら、SVDの方が良いかも。 ・ とはいえ、 - SlopeOneに比して0.04程度(rmse)の改善幅。 - 学習パラメータを決めるのに時間がかかる。 ・ 評価予測だけでは推薦には使えない。 - 所詮人気の商品の評価は高い。 ( 個人の趣向による効果は薄い ) - 評価予測をいかに推薦に昇華させる方が結構大事。
  • 11. 株式会社サイバーエージェント 11 ・ timeSVD++ - 時間によるユーザーの興味の編成を考慮したモデル - 精度は SVD++ より更に良い。 ( rmse で 0.02 程度改善 ) - パラメータを決めるのに時間がかかり過ぎる ・ サンプルコード - mf_predictor http://code.google.com/p/mf-predictor/
  • 12. 株式会社サイバーエージェント 12 ご清聴ありがとうございました!