SlideShare une entreprise Scribd logo
1  sur  9
RandomSortFieldとMahoutの
                                  CTR比較について




                                                             GMO インターネット
                                                             新里 祐教
Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
自己紹介
          • やってること
                     – AP、インフラ、NW … etc
                     – 最近はJava多め
                     – OSS:SIPropの中に居ます


          • Solrの利用
                     – 9199.JP街検索
                       ローカルエリア検索
                       1.3から1.4へ移行

                     – GMOとくとくショップ
                       グループの店舗・商品データ



Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
Randomなデータを表示させたい欲求・要望




                                               毎回違うデータを表示したい

                                                        とりあえず何か出したい

                                                似たようなコンテンツが良い



Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
ランダムデータを掲出する理由

                                                             サーチエンジン対策
                                                             (とにかく何かリンクが欲しい)
       PV増やしたい!!
       ・CTR(Click Through Rate)
       ・Conversion Rate                                            コストかけたくなーぃ
       ・巡回率上げたい


                  特集ページは?                                          自然な感じでお願い♪
                  ・プロモーション
                  ・キャンペーン


                                                              ランダムで・・・



Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
Solrでランダム
       •       schema.xmlに追加(1.4)
                 <fieldType name="random" class="solr.RandomSortField"
                      indexed="true" />
                 <dynamicField name="random*" type="random" />

       •       クエリ
                 – sort=randomSSS
                 – SSSはシードの文字列
                 – シードが同じ場合、検索結果も同じになる

       •       シードのローテーション
                 – AP側でシードを制御
                 – yyyymmddhh形式のシードにして時間・日
                   次のシードを生成

       •       レコメン的
                 – 検索されたキーワード
                                                                           商品と同じ
                 – 同じカテゴリ                                                カテゴリorキーワード
                 – 似たような価格帯
                 ※ MoreLikeThisという選択肢も




Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
レコメンド
         •       Mahoutを利用
                   –      機械学習のアルゴリズムが豊富
                              •    ベイジアン、K平均法、SlopeOne、K近傍法、
                                   SVD…
                   –      Hadoopとの親和性

         •       ログ解析とスコア
                   –      日次で20Gbyte程度のログを対象
                   –      Hadoopを使ってログ解析、スコアを生成
                   –      アルゴリズム
                              •    最尤法, Tanimoto係数, k近傍法
                              •    レコメン結果商品の更に先も対象

                   –      フィルター
                              •    一見さんをどうするか・・・
                              •    スパム的に商品を見ているユーザ
                              •    スコアが低すぎるのは間引く

                                                               この商品を見た人は
         •       表示される商品
                   –      似たような商品                              こんな商品も見てます
                   –      合わせて買う商品
                   –      掘り起こしの効果




Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
パフォーマンス
          •       表示エリアの工夫
                  出し位置を変えてみたり・・・
          •       インプレッション(インプレッション数/全体PV )
                     –     レコメンド
                           avg: 22.8%, max: 29.6%, min: 18.7%
                     –     Solr
                           avg: 58.1%, max: 70.4%, min: 52.6%


                                      80.0%
                                      60.0%
                              掲出率




                                      40.0%
                                      20.0%
                                        0.0%
                                                                                                           day
                                                                                                                   レコメンエリア
                                               2001/1/25                                  2001/2/1

                                                             recommend(mahout)
                                                             category keyword match(solr)


          •       CTR(クリック数/インプレッション数)
                     –     レコメンド
                           avg: 8.4%, max: 9.0%, min: 7.1%
                     –     Solr
                           avg: 1.8%, max: 2.1%, min: 1.6%

                                    10.0%
                                     8.0%
                                     6.0%
                                                                                                                 Solr Randomエリア
                              ctr




                                     4.0%
                                     2.0%
                                     0.0%
                                            2001/1/25                                2001/2/1        day
                                                           recommend(mahout)
                                                           category keyword match(solr)


Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
リファラの利用
          •       検索エンジン経由のユーザが8割以上
                     –     リファラ+カテゴリ+RandomSortFieldに変更

          •       インプレッション
                     –     レコメンド
                               avg: 30.7%, max: 34.2%, min: 27.8%
                     –     Solr
                               avg: 66.9%, max: 70.2%, min: 66.1%

                                                            80.0%

                                                            60.0%
                                                     掲出率




                                                            40.0%

                                                            20.0%

                                                             0.0%
                                                                    01/1/25     01/2/1                         01/2/8   day
                                                                               recommend(mahout)
                                                                               category keyword match(solr)

          •       CTR
                     –     レコメンド
                               avg: 8.0%, max: 8.3%, min: 7.4%
                     –     Solr
                               avg: 3.1%, max: 3,8%, min: 2.6%

                                                           10.0%
                                                            8.0%
                                                            6.0%
                                                     ctr




                                                            4.0%
                                                            2.0%
                                                            0.0%
                                                                   01/1/25     01/2/1                         01/2/8    day
                                                                              recommend(mahout)
                                                                              category keyword match(solr)


Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
終わりに…
          • カテゴリ、キーワード、リファラと組合せるとGood
                     – 商品名を形態素解析してマッチするのもアリかも


          • レコメンドはデータが無い場合、表示が無い
                     – CTRは高い半面、データ次第で表示されない
                     – 補完する意味で、RandomSortField


          • RandomSortFieldを使うと
                     – 商品のカテゴリにマッチして
                     – 検索キーワードやリファラをキーに
                     それっぽい雰囲気の商品が表示できる

Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.

Contenu connexe

Plus de Hirotaka Niisato

ポスト君とIoTとline bot
ポスト君とIoTとline botポスト君とIoTとline bot
ポスト君とIoTとline botHirotaka Niisato
 
おうちハックナイト
おうちハックナイトおうちハックナイト
おうちハックナイトHirotaka Niisato
 
QS Tools for Emotions and Communication
QS Tools for Emotions and CommunicationQS Tools for Emotions and Communication
QS Tools for Emotions and CommunicationHirotaka Niisato
 
Makeでも使われる色んなセンサー
Makeでも使われる色んなセンサーMakeでも使われる色んなセンサー
Makeでも使われる色んなセンサーHirotaka Niisato
 
How to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping ApplicationHow to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping ApplicationHirotaka Niisato
 
ネット側からの物作り
ネット側からの物作りネット側からの物作り
ネット側からの物作りHirotaka Niisato
 
Maker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshopMaker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshopHirotaka Niisato
 
android bazaar and conference 2014 spring
android bazaar and conference 2014 springandroid bazaar and conference 2014 spring
android bazaar and conference 2014 springHirotaka Niisato
 
国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみて国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみてHirotaka Niisato
 
Interactive Application using Kinect and Android
Interactive Application using Kinect and AndroidInteractive Application using Kinect and Android
Interactive Application using Kinect and AndroidHirotaka Niisato
 
Data analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centersData analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centersHirotaka Niisato
 
Android and OpenNI - NUI Application Treasure Hunter Robot
Android and OpenNI - NUI Application   Treasure Hunter RobotAndroid and OpenNI - NUI Application   Treasure Hunter Robot
Android and OpenNI - NUI Application Treasure Hunter RobotHirotaka Niisato
 
Androidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボAndroidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボHirotaka Niisato
 

Plus de Hirotaka Niisato (16)

ポスト君とIoTとline bot
ポスト君とIoTとline botポスト君とIoTとline bot
ポスト君とIoTとline bot
 
WebとIoTとMake
WebとIoTとMakeWebとIoTとMake
WebとIoTとMake
 
おうちハックナイト
おうちハックナイトおうちハックナイト
おうちハックナイト
 
QS Tools for Emotions and Communication
QS Tools for Emotions and CommunicationQS Tools for Emotions and Communication
QS Tools for Emotions and Communication
 
Makeでも使われる色んなセンサー
Makeでも使われる色んなセンサーMakeでも使われる色んなセンサー
Makeでも使われる色んなセンサー
 
How to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping ApplicationHow to MAKE HVC-C Protyping Application
How to MAKE HVC-C Protyping Application
 
ネット側からの物作り
ネット側からの物作りネット側からの物作り
ネット側からの物作り
 
Maker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshopMaker Faire Taipei 2014 workshop
Maker Faire Taipei 2014 workshop
 
android bazaar and conference 2014 spring
android bazaar and conference 2014 springandroid bazaar and conference 2014 spring
android bazaar and conference 2014 spring
 
国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみて国内外のMaker faireに参加してみて
国内外のMaker faireに参加してみて
 
3 Dセンサーの活用
3 Dセンサーの活用3 Dセンサーの活用
3 Dセンサーの活用
 
Interactive Application using Kinect and Android
Interactive Application using Kinect and AndroidInteractive Application using Kinect and Android
Interactive Application using Kinect and Android
 
Data analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centersData analytics with hadoop hive on multiple data centers
Data analytics with hadoop hive on multiple data centers
 
Android and OpenNI - NUI Application Treasure Hunter Robot
Android and OpenNI - NUI Application   Treasure Hunter RobotAndroid and OpenNI - NUI Application   Treasure Hunter Robot
Android and OpenNI - NUI Application Treasure Hunter Robot
 
Androidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボAndroidで出来る!! KinectとiPadを使った亀ロボ
Androidで出来る!! KinectとiPadを使った亀ロボ
 
Jjug 20090421
Jjug 20090421Jjug 20090421
Jjug 20090421
 

Dernier

Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 

Dernier (10)

Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 

RandomSortFieldとMahoutのCtr比較について

  • 1. RandomSortFieldとMahoutの CTR比較について GMO インターネット 新里 祐教 Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 2. 自己紹介 • やってること – AP、インフラ、NW … etc – 最近はJava多め – OSS:SIPropの中に居ます • Solrの利用 – 9199.JP街検索 ローカルエリア検索 1.3から1.4へ移行 – GMOとくとくショップ グループの店舗・商品データ Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 3. Randomなデータを表示させたい欲求・要望 毎回違うデータを表示したい とりあえず何か出したい 似たようなコンテンツが良い Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 4. ランダムデータを掲出する理由 サーチエンジン対策 (とにかく何かリンクが欲しい) PV増やしたい!! ・CTR(Click Through Rate) ・Conversion Rate コストかけたくなーぃ ・巡回率上げたい 特集ページは? 自然な感じでお願い♪ ・プロモーション ・キャンペーン ランダムで・・・ Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 5. Solrでランダム • schema.xmlに追加(1.4) <fieldType name="random" class="solr.RandomSortField" indexed="true" /> <dynamicField name="random*" type="random" /> • クエリ – sort=randomSSS – SSSはシードの文字列 – シードが同じ場合、検索結果も同じになる • シードのローテーション – AP側でシードを制御 – yyyymmddhh形式のシードにして時間・日 次のシードを生成 • レコメン的 – 検索されたキーワード 商品と同じ – 同じカテゴリ カテゴリorキーワード – 似たような価格帯 ※ MoreLikeThisという選択肢も Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 6. レコメンド • Mahoutを利用 – 機械学習のアルゴリズムが豊富 • ベイジアン、K平均法、SlopeOne、K近傍法、 SVD… – Hadoopとの親和性 • ログ解析とスコア – 日次で20Gbyte程度のログを対象 – Hadoopを使ってログ解析、スコアを生成 – アルゴリズム • 最尤法, Tanimoto係数, k近傍法 • レコメン結果商品の更に先も対象 – フィルター • 一見さんをどうするか・・・ • スパム的に商品を見ているユーザ • スコアが低すぎるのは間引く この商品を見た人は • 表示される商品 – 似たような商品 こんな商品も見てます – 合わせて買う商品 – 掘り起こしの効果 Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 7. パフォーマンス • 表示エリアの工夫 出し位置を変えてみたり・・・ • インプレッション(インプレッション数/全体PV ) – レコメンド avg: 22.8%, max: 29.6%, min: 18.7% – Solr avg: 58.1%, max: 70.4%, min: 52.6% 80.0% 60.0% 掲出率 40.0% 20.0% 0.0% day レコメンエリア 2001/1/25 2001/2/1 recommend(mahout) category keyword match(solr) • CTR(クリック数/インプレッション数) – レコメンド avg: 8.4%, max: 9.0%, min: 7.1% – Solr avg: 1.8%, max: 2.1%, min: 1.6% 10.0% 8.0% 6.0% Solr Randomエリア ctr 4.0% 2.0% 0.0% 2001/1/25 2001/2/1 day recommend(mahout) category keyword match(solr) Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 8. リファラの利用 • 検索エンジン経由のユーザが8割以上 – リファラ+カテゴリ+RandomSortFieldに変更 • インプレッション – レコメンド avg: 30.7%, max: 34.2%, min: 27.8% – Solr avg: 66.9%, max: 70.2%, min: 66.1% 80.0% 60.0% 掲出率 40.0% 20.0% 0.0% 01/1/25 01/2/1 01/2/8 day recommend(mahout) category keyword match(solr) • CTR – レコメンド avg: 8.0%, max: 8.3%, min: 7.4% – Solr avg: 3.1%, max: 3,8%, min: 2.6% 10.0% 8.0% 6.0% ctr 4.0% 2.0% 0.0% 01/1/25 01/2/1 01/2/8 day recommend(mahout) category keyword match(solr) Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.
  • 9. 終わりに… • カテゴリ、キーワード、リファラと組合せるとGood – 商品名を形態素解析してマッチするのもアリかも • レコメンドはデータが無い場合、表示が無い – CTRは高い半面、データ次第で表示されない – 補完する意味で、RandomSortField • RandomSortFieldを使うと – 商品のカテゴリにマッチして – 検索キーワードやリファラをキーに それっぽい雰囲気の商品が表示できる Copyright (C) 2007 GMO Internet, Inc. All Rights Reserved.