SlideShare une entreprise Scribd logo
1  sur  15
バリエーションの提示がもたらす
長期的効果に着目したウェブサイト最適化手法
東京大学 工学系研究科 技術経営戦略学専攻
松尾研究室 博士3年
飯塚修平
背景:ウェブサイト最適化の重要性
• ウェブサイトの収益性を仮説検証
によって改善すること.
• ユーザに異なるウェブサイトの
バリエーションを表示する.
• より望ましいユーザの反応を
引き出すバリエーションを
探索する.
▶ ユーザをサンプルとした
比較対照実験
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 2
8.54% 9.66%8.87% 5.95%
2008 年アメリカ合衆国大統領選挙の例
最もアカウント登録率の高いバリエーションを採用す
ることで,約 6000 万ドルの献金を追加で獲得した.
アカウント登録率
How Obama Raised $60 Million by Running a Simple Experiment.
https://goo.gl/Ak87lB
背景:高速化を阻む評価指標の特徴
ウェブサイト最適化の課題
高速化への要求=最小のユーザ数で最適なバリエーションを発見するための評価指標設計
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 3
• 定義上,時間がかかる
(e.g. 週間アクティブユーザ)
• ユーザの学習による遅延
(e.g. 慣れ,ロイヤリティ)
• 多様な背景を持つユーザ
(属性,利用シーン,時間帯)
• 小さな改善でも採用したい思惑
(1 %の変化が年間数百万ドルを生む)
分散が大きい 長期的効果を考慮する必要がある
モンテカルロ・シミュレーションにおける
分散低減法の利用 [Deng 13]
過去の実験データを用いた予測モデルの
構築 [Hohnhold 15, Dmitriev 17]
提案手法の概観
ユーザの振る舞いを示すフィードバック指標を利用して,高速化+予測モデルの構築を行う.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 4
フィードバック z
y
z1
z2
x1
x2
x3
バリエーション x
目的指標 y
ウェブサイト ユーザ
p(y|x), q(z|x)
ページ滞在時間,スク
ロール量,リンク遷移 etc.
目的行為の有無(広告ク
リック,商品購入 etc.)
関連研究:分散低減法の有効性
評価指標と相関関係のある変量があれば,その
変量を用いることで分散の小さい推定量を設計
できる [Deng 14].
制御変量法(層化サンプリングの一般化)
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 5
▶ 指標と相関する変量を利用することが,
探索を高速化する上で有効.
✖ ユーザ属性が常に獲得できるとは限らず,
より汎用的な手法が求められる.
層化
層化サンプリングによる分散低減
ある集団の平均身長を求める際,性別や年
齢などの属性で層分けすることで推定量の
分散を小さくできる.
関連研究:予測モデルによる評価指標の予測
観測に時間がかかる評価指標を,
バリエーションの特徴量から予測する.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 6
LTR P M aims to approximate the long-term revenue impact
of a launch.12
The interpretation of (10) is straightforward:
the expected long-term RPM e↵ect is given by the observed
instantaneous revenue change plus a correction term that
expresses how user behavior changes will alter RPM post-
launch. Note that (10) defines an OEC that focuses on long-
term business health, given that, for Google search, we did
not see changes in the first 3 terms of (2) in Section 2.
0
0 50 100 150 200
Treatment duration in days
RPM
Figur e 5: Short-term (pink) and long-term (blue) ∆ RPM
metrics for simple ad load changes on mobile Google search,
F
t
u
t
l
S
l
a
w
o
m
Google 検索結果画面における長期収益性予測
1. 広告の表示数
2. 広告と検索クエリの関連度
3. 広告のリンク先のウェブページの質
を特徴量とする線形回帰によって,長期的に不
利な修正を棄却することに成功した.
[Hohnhold 15] より引用
▶ 評価指標の予測には,過去の実験データを
用いた予測モデルの構築が有効.
✖ バリエーションの特徴量は対象のウェブ
サイトに大きく依存する→汎用化が必要
短期的パフォーマンス
長期的パフォーマンス
関連研究:ベイズ最適化
未知の関数の最大値を効率よく求める手法.
1. 目的関数の期待値分布を推定する.
2. 期待値分布から獲得関数を算出する.
3. 獲得関数を最大にする解を評価する.
4. 1〜3 を繰り返す.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 7
[Brochu 10] より引用有望な解に観測が集中している
信頼区間 獲得関数
GPUCB の動作例
GPUCB (Gaussian Process – UCB)
ガウス過程によって期待値分布を推定し,
信頼区間の上限を最大にする解を逐次的に
選択するアルゴリズム.
提案手法
• フィードバック指標をベイズ最適化の説明
変数とする.
• フィードバック空間 Z において,信頼区間
の上限を最大にする点 z* を算出する.
• z* を生み出すと最も期待される解 x を逐次
的に選択する.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 8
目的指標と相関関係にあるフィードバック
指標を探索に用いる.
▶ 相関関係を活用した高速化
得られた期待値分布が,未知のバリエー
ションに対する予測モデルとして働く.
▶ 予測モデルによる最適解予測
(e.g. クリック率)
(e.g. 滞在時間)
評価実験
実際のウェブサイトのログデータを用いたシミュレーション実験によって評価する.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 9
• フィードバック空間 Z 内で目的指標の期待
値を推定するベイズ最適化を導入すること
で,最適なバリエーションの探索を高速化
できることを評価する.
▶ 分散が大きい評価指標の問題を克服して,
高速化ができるか?
• 実験1の探索の過程で得られた期待値分布
を予測モデルとして用いることで,未知の
バリエーション集合の中から最適なバリ
エーションを推定できることを評価する.
▶ フィードバック指標さえ得られれば,
時間のかかる評価指標も予測できるのか?
実験1:高速化の評価 実験2:未知のバリエーションの推定
実験1:高速化の評価
目的指標 y:広告のクリック率
観測するフィードバック指標 z
1. 離脱の有無(二値)
2. 概要図からの遷移(二値)
3. 「もっと見る」ボタンからの遷移(二値)
4. 滞在時間(秒)
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 10
対象サイト:あのひと検索スパイシー
一日に約数万人が訪れる人物検索サイト.
スクリーンショット http://spysee.jp/1870946
広告
x y z1 z2 z3 z4
1 B(0.053
)
B(0.197) B(0.403) B(0.188) G(1.459, 21.588)
2 B(0.072
)
B(0.199) B(0.417) B(0.175) G(1.243, 22.865)
3 B(0.040
)
B(0.175) B(0.412) B(0.173) G(1.482, 21.047)
2013 年 5 月 16 日のログデータから推定された各指標の分布
評価関数
実験1:正確度・累計クリック数の推移
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 11
最適バリエーションを推定する正確度の推移 累計クリック数の推移
100 回のシミュレーションの結果の平均値を示す.
提案手法:フィードバック空間 Z における GP-UCB アルゴリズム
比較手法:フィードバック指標を利用しない単純な UCB アルゴリズム
▶ フィードバック指標を用いることが高速化に有効
実験1:フィードバック空間における期待値分布
• ガウス過程によって,フィードバック指標
とクリック率の間の非線形の関係を学習す
ることができている.
• このモデルが,未知のバリエーション集合
から最適なバリエーションを推定する目的
で活用できることを実験2で評価する.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 12
フィードバック空間 Z におけるクリック率の期待値分布
上の曲面は上側信頼限界分布を,下の曲面は期待値分布.
フィードバック指標として,ここでは z2, z4 を選択した.
実験2:未知のバリエーションの推定
• 2013 年 6 月 6 日にテストされた X = {x4,x5,x6,x7,x8} を未知のバリエーション集合とする.
• 実験1で得られた分布を初期分布として,未知のバリエーションに対する探索が高速化さ
れることを評価する.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 13
x y z1 z2 z3 z4
1 B(0.0551) B(0.183) B(0.411) B(0.174) G(1.511, 20.659)
2 B(0.0683) B(0.180) B(0.377) B(0.192) G(1.341, 21.622)
3 B(0.0594) B(0.200) B(0.391) B(0.190) G(1.189, 24.738)
4 B(0.0656) B(0.200) B(0.386) B(0.209) G(1.318, 20.656)
5 B(0.0846) B(0.193) B(0.392) B(0.172) G(1.345, 20.990)
2013 年 6 月 6 日のログデータから推定された各指標の分布
評価関数
100 回のシミュレーションの結果の平均値を示す.
提案手法:フィードバック空間 Z の初期分布に
実験1で得られた分布を用いる GP-UCB
比較手法:フィードバック空間 Z の初期分布に
一様分布を用いた GP-UCB
▶ 探索の過程で得られた期待値分布を用いることで,
未知のバリエーションに対する探索が高速化される.
▶ 期待値分布が予測モデルとして機能する可能性があ
る.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 14
実験2:未知のバリエーションの推定
正確度の推移
累計クリック数の推移
考察とまとめ
フィードバック指標を用いることで,探索の高速化および
未知のバリエーションに対する予測が可能になった.
▶ ユーザの反応を様々な指標で捉えることで,高速な最適化を実現できる.
事前実験の必要性
ガウス過程を行う領域,採用するフィードバック指標,超パラメータの設定によって大きく
パフォーマンスが左右される.
本研究の貢献
分散低減法と予測モデルのいずれも新規ではないが,
① 二つをベイズ最適化による解法として統一したこと.
② フィードバック指標という,より汎用的な指標によって検証したこと.
に貢献があると考えている.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 15

Contenu connexe

Plus de Shuhei Iitsuka

Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめるPython と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめるShuhei Iitsuka
 
リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門Shuhei Iitsuka
 
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...Shuhei Iitsuka
 
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web DataAsia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web DataShuhei Iitsuka
 
【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ Rule
【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ Rule【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ Rule
【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ RuleShuhei Iitsuka
 
UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話Shuhei Iitsuka
 
ウェブサイトで収益を得る
ウェブサイトで収益を得るウェブサイトで収益を得る
ウェブサイトで収益を得るShuhei Iitsuka
 
HTML で自己紹介ページをつくる
HTML で自己紹介ページをつくるHTML で自己紹介ページをつくる
HTML で自己紹介ページをつくるShuhei Iitsuka
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おうShuhei Iitsuka
 
ウェブサービスの企画とデザイン
ウェブサービスの企画とデザインウェブサービスの企画とデザイン
ウェブサービスの企画とデザインShuhei Iitsuka
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おうShuhei Iitsuka
 
第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会 第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会 Shuhei Iitsuka
 
かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう Shuhei Iitsuka
 
ペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプShuhei Iitsuka
 
ペルソナシナリオとプロトタイプ2
ペルソナシナリオとプロトタイプ2ペルソナシナリオとプロトタイプ2
ペルソナシナリオとプロトタイプ2Shuhei Iitsuka
 
UT Startup Gym とは @第2期製品発表
UT Startup Gym とは @第2期製品発表 UT Startup Gym とは @第2期製品発表
UT Startup Gym とは @第2期製品発表 Shuhei Iitsuka
 
Ruby on Rails の規約
Ruby on Rails の規約Ruby on Rails の規約
Ruby on Rails の規約Shuhei Iitsuka
 

Plus de Shuhei Iitsuka (20)

Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめるPython と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
 
リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門
 
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...
 
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web DataAsia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
 
【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ Rule
【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ Rule【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ Rule
【DBDA 勉強会 2013 夏】Doing Bayesian Data Analysis Chapter 4: Bayes’ Rule
 
UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話
 
ウェブサイトで収益を得る
ウェブサイトで収益を得るウェブサイトで収益を得る
ウェブサイトで収益を得る
 
HTML で自己紹介ページをつくる
HTML で自己紹介ページをつくるHTML で自己紹介ページをつくる
HTML で自己紹介ページをつくる
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おう
 
ウェブサービスの企画とデザイン
ウェブサービスの企画とデザインウェブサービスの企画とデザイン
ウェブサービスの企画とデザイン
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おう
 
第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会 第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会
 
かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう
 
ペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプ
 
ペルソナシナリオとプロトタイプ2
ペルソナシナリオとプロトタイプ2ペルソナシナリオとプロトタイプ2
ペルソナシナリオとプロトタイプ2
 
UT Startup Gym とは @第2期製品発表
UT Startup Gym とは @第2期製品発表 UT Startup Gym とは @第2期製品発表
UT Startup Gym とは @第2期製品発表
 
Webサーバ、HTML
Webサーバ、HTMLWebサーバ、HTML
Webサーバ、HTML
 
Ruby on Rails の規約
Ruby on Rails の規約Ruby on Rails の規約
Ruby on Rails の規約
 
PHP 入門
PHP 入門PHP 入門
PHP 入門
 
Git
GitGit
Git
 

バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会

Notes de l'éditeur

  1. 本研究では,ウェブサイト最適化について取り上げます. ウェブサイト最適化は,ひとことで言うと仮説検証を用いてウェブサイトの収益性を改善する手法です. 具体的に言うと,ウェブサイトを訪問するユーザに対して異なるバリエーションを表示し, その中で最もユーザの好ましい反応を引き出すものを採用することで,ウェブサイトを改善することです. すなわち,ユーザをサンプルとした比較対照実験と言うことができます. たとえば,2008年アメリカ合衆国大統領選挙では,オバマ候補がこの方法論を用いました. オバマ候補は自身のウェブサイトに異なる写真を用意し,訪問するユーザにランダムに表示しました. そして,最もユーザのアカウント登録率が高かったバリエーションを採用した結果,追加で約6000万ドルの献金を得ることができたと言われています. このように,ウェブサイト最適化は***小さな変更で大きな効果を***得ることができる手法として注目を集めています.
  2. しかし,ウェブサイト最適化にも課題はあります.それは高速化に対する要求を満たすことです. ウェブサービスを提供する各企業は,市場競争の中にある限り,できるだけ高速に収益性を向上したいと考えています. したがって,ウェブサイト最適化においても,できるだけ少ないユーザ数で最適なバリエーションを探索することが重要な課題になります. ひとくちにウェブサイト最適化を高速化するといっても,探索方法を工夫する,解空間の構成を工夫するなど,様々な側面が考えられます. ここでは,とくに高速なウェブサイト最適化を実現するための評価指標の設計について考えたいと思います.すなわち,何をKPIとするのか,ということです. では,ウェブサイト最適化の高速化を阻むKPIはどんな特徴を持っているのでしょうか? ここでは二つ特徴を上げたいと思います. ひとつめは,分散が大きいということです. 指標の分散が大きくなると,差の検定を行うために必要なサンプルサイズが大きくなることからも,このことが納得できるかと思います. 評価指標の分散が大きくなる要因のひとつは,ウェブサイトを利用するユーザが多様なバックグラウンドを持っているということです. 属性や,利用シーン,時間帯など,様々な要因が評価指標にばらつきを与えます. 分散が大きくなる要因のふたつめは,企業としては小さな改善でも採用したいという思惑があるということです. たとえば,Google や Bing のような大規模ウェブサイトでは,1% に満たないような改善でも,採用することで大きな収益増につながります. こういった小さな改善を特定するには,評価指標の分散を小さくすることが肝要になります. 評価指標の分散を小さくする方法としては,目的指標との相関関係のある制御変量を活かした分散低減法などが考えられています.これについては後ほど詳しく述べます. 一方,評価指標によっては,長期的効果を考慮しなければならないために,探索が遅延するということもあります. これが,本研究のタイトルにもなっている,バリエーションの提示がもたらす長期的効果に相当するものです. たとえば,週間アクティブユーザ数を評価指標としている場合には,その期間待たない限り,その値を測定することができません. また,評価指標によっては,ユーザの学習による遅延が発生する場合があります. これはどういうことかと言いますと,たとえばユーザインタフェースに大きな変更を加えた場合には,ユーザがそれに慣れるまでのあいだ,その修正がもたらす真の効果を測定できません. また,この後Googleの例でも述べますが,短期的な収益性の追求が長期的な収益の棄損につながるということもあります. このような問題に対しては,過去の実験データを用いて予測モデルを構築するという工夫が提案されています.
  3. 本研究では,こういった評価指標にまつわる問題を解決するために,目的指標以外のユーザからのフィードバック指標を利用することで,ウェブサイト最適化の高速化および予測モデルの構築を行う手法を提案します. これはどういうことかと言いますと, 一般的に,ウェブサイト最適化では,特定の要素のクリックの有無ですとか,購入の発生の有無といった指標を目的指標として設定することが多いです. 一方で,ユーザの行動の変化はこれ以外の指標でも捉えることができます. たとえば,ウェブページの滞在時間やスクロール量などにも,ユーザ行動の変化が現れる可能性があります. もし,こういったフィードバック指標と目的指標との間になんらかの相関関係があれば,このフィードバック指標を用いることで,より高速な最適化手法を構築できるかもしれません. さらに,このフィードバック指標から目的指標を推定する分布を獲得することができれば,これを長期的な目的指標の予測モデルとして利用できるかもしれません. そこで本研究では,このようなフィードバック指標を活用することで,ウェブサイト最適化を高速化し,さらに長期的な指標の予測を行う手法を提案したいと思います.
  4. いくつか提案手法と関連のある手法について説明してきます. まず,ウェブサイト最適化の高速化を実現する工夫として分散低減法 分散低減法とは,一言で言うと,評価指標に対して相関関係にある変量を活用することで,より分散の小さい推定量を設計することです. 最も単純な例としては,層化サンプリングによる分散低減が挙げられます. たとえば,ある集団の平均身長を求めたい場合は,あらかじめ性別や年齢などの属性で層分けすることで,推定量の分散を小さくすることができます. これを一般化したものが制御変量法で,評価関数と相関係数ローが大きい指標であればあるほど,その推定量の分散を小さくすることができます. Deng らの既存研究ではユーザ属性を制御変量として用いていますが,ウェブサイトによってはログイン機能やクッキーがないために,ユーザの属性が取得できない場合があります. そのため,一般的なウェブサイトがこの分散低減法を用いるには,より汎用的な手法が求められると考えられます.
  5. 予測モデルによる評価指標の予測も,ウェブサイト最適化に活用されています. たとえば,Google では,検索結果画面における長期的な広告のクリック率を向上するために,このアプローチを採用しました. この例では,これらの特徴量によってバリエーションを表すことで,過去の実験データを用いた予測モデルの構築を行なっています. ここでは,ある修正がもたらす短期的パフォーマンスの変化をピンク,予測される長期的なパフォーマンスの変化を青で示しています. これを見て分かるように,短期的に見ると改善に見える修正も,長期的に見ると改悪になっている場合があります. 予測モデルを用いることで,このような修正を退けることができることが報告されています. このように,観測に時間がかかる評価指標の予測には,過去の実験データを用いて予測モデルを構築することが有効であることが示されています. しかし一方で,バリエーションをあらわす特徴量はウェブサイトの性質に大きく依存します. たとえば,ここでは広告のリンク先のウェブページの質を特徴量としていますが,この品質の定義も様々ありますし,このような品質を算出するアルゴリズムを構築することも,一般的なウェブサイトにとっては容易なことではありません. したがって,バリエーションの特徴量に依存しないような,より汎用的な手法が求められていると考えられます. 提案手法は,こういった工夫をフィードバック指標を用いて実現することで,より汎用的な手法となっています.
  6. 提案手法に関連する手法として,ここではベイズ最適化について説明します. ベイズ最適化とは,未知のブラックボックス関数の最大値を効率よく求めるための手法です. ベイズ最適化では,まず目的関数の期待値分布を推定し,その期待値分布から獲得関数を算出します. そして,この獲得関数を最大にする解を選択する,という流れを繰り返すことで,ブラックボックス関数の最大値を求める手法です. ここでは,ベイズ最適化のアルゴリズムの中でも,直感的にわかりやすい GPUCBアルゴリズムをここでは説明します. GPUCBアルゴリズムでは,ガウス過程によって期待値分布を推定し,その信頼区間の上限を最大にする解を逐次的に選択するアルゴリズムです. ここに,GPUCBの動作例を示します.このように,GPUCBを用いることで,有望な解に観測が集中していることがわかります,
  7. 提案手法のアイデアは,ひとことで言うと,フォードバック指標をこのベイズ最適化の説明変数として用いるというものです. 手続きとしては,この横軸で表されるフィードバック空間 Z について信頼区間を最大にする点 z* を選択します. そして,各バリエーションにおけるフィードバック指標の平均値μと,点 z* の距離が最小となるバリエーションを逐次的に選択するアルゴリズムです. このフィードバック指標と目的指標の間に相関関係があれば,これをウェブサイト最適化の高速化に活用できるものと考えられます. また,この探索の過程で得られる期待値分布を用いることで,未知のバリエーションについても,フィードバック指標さえ得られれば,最適なバリエーションを予測できるものと考えられます.
  8. [ここまで8min] では,このふたつの性質を評価するために,実際のウェブサイトのログデータを用いたシミュレーション実験を行います. 実験1では,提案手法によって探索を高速化できることを評価します. これは,フィードバック指標を活用することによって,分散が大きい問題を克服して,ウェブサイト最適化を高速化できることを評価しようとするものです. 実験2では,実験1の探索の過程で得られた,期待値分布を予測モデルとして用いることで, 未知のバリエーション集合の中から最適なバリエーションを推定できることを評価します. これは,観測に時間がかかる評価指標であっても,フィードバック指標が即時的に得られれば予測が可能であることを評価しようとするものです.
  9. まず,実験1について説明してきます. スパイシーのサイト. ここでも,第一研究で用いた「あのひと検索スパイシー」を対象ウェブサイトとして用います. また,評価指標も同様にバナー広告のクリック率を用います. この評価指標 y にあわせて,ここではフィードバック指標としてプロフィールページからの遷移の有無と滞在時間を用います. 評価関数には,2013年5月16日に観測されたログデータを用います. ここでは,この3種類のバリエーションに対してこのような確率分布で評価指標およびフィードバック指標が与えられるものとします.
  10. 実験1の結果です. 比較手法としては,ここではフィードバック空間 Z におけるベイズ最適化を行わない,単純な UCB を設定しました.こrを記述う. 500回のシミュレーションの結果の平均値を示します. 正確度の推移に着目すると,オレンジで示した提案手法は,青で示した比較手法に比べて高速に正確度を向上することができていることがわかります. また,累計のクリック数を比較しても,提案手法が同じ期間でより多くのクリックを得ることができていることがわかります.
  11. また,実験1の探索の過程で得られたフィードバック空間 Z におけるクリック率の期待値分布の一例を掲載します. 図からわかるように,フィードバック指標とクリック率の間の非線形の関係を捉えることができていることがわかります. 実験2では,この期待値分布を用いることで,未知のバリエーションについても最適なバリエーションを推定できることを評価します.
  12. 実験2では,実験1と異なる期間にテストされた5種類のバリエーションに対して評価を行います. ここではまず,各バリエーション 100 回ずつ評価し,目的指標およびフィードバック指標を計測するものとします. そして,この情報と,実験1で得られた予測モデルから,最適なバリエーションが推定できることを評価します. この期間にテストされたバリエーションに対する評価指標およびフィードバック指標はこの確率分布に従うものとします.
  13. 実験2の結果を示します. ここでは,比較手法として,フィードバック空間 Z の初期分布に,一様分布を用いる方法を採用しました. それに対して提案手法は,実験1で得られた期待値分布を初期分布として,ベイズ最適化を行います. 評価指標としては,各手法によって推定される最適バリエーションの期待値を載せます. t検定の結果,二つの手法が示す最適バリエーションの期待値の間には,有意水準 0.05 で有意な差が見られました. このことから,探索の過程で得られた期待値分布 Z が,未知のバリエーションから最適なバリエーションを推定するのに有効であったことが示されました.
  14. 考察です, 以上の実験結果より,目的指標に加えてフィードバック指標を用いることで,探索の高速化および,最適なバリエーションの予測が可能になることを示しました. このことは,ユーザの反応を様々な指標で捉えることで,高速な最適化を実現できることを示しています. この手法を導入するためには,目的指標以外のフィードバック指標が計測できる環境であることが必要ですが, 近年では Google Analytics を始めとする無料のアクセス解析ツールが普及していることを考えると,このような指標が得られる蓋然性は高いと考えられます. 今回取りあげた散低減法と予測モデルの利用はいずれも新規のものではありませんが, これら二つを一つのベイズ最適化による解法としてて統一したこと,そして即時的フィードバックという,より汎用的な指標によって検証したことが,本研究の主な貢献であると考えています.