バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第３１回人工知能学会全国大会

バリエーションの提示がもたらす
長期的効果に着目したウェブサイト最適化手法
東京大学工学系研究科技術経営戦略学専攻
松尾研究室博士３年
飯塚修平

背景：ウェブサイト最適化の重要性
• ウェブサイトの収益性を仮説検証
によって改善すること．
• ユーザに異なるウェブサイトの
バリエーションを表示する．
• より望ましいユーザの反応を
引き出すバリエーションを
探索する．
▶ ユーザをサンプルとした
比較対照実験
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚修平 2
8.54% 9.66%8.87% 5.95%
2008 年アメリカ合衆国大統領選挙の例
最もアカウント登録率の高いバリエーションを採用す
ることで，約 6000 万ドルの献金を追加で獲得した．
アカウント登録率
How Obama Raised $60 Million by Running a Simple Experiment.
https://goo.gl/Ak87lB

背景：高速化を阻む評価指標の特徴
ウェブサイト最適化の課題
高速化への要求＝最小のユーザ数で最適なバリエーションを発見するための評価指標設計
• 定義上，時間がかかる
（e.g. 週間アクティブユーザ）
• ユーザの学習による遅延
（e.g. 慣れ，ロイヤリティ）
• 多様な背景を持つユーザ
（属性，利用シーン，時間帯）
• 小さな改善でも採用したい思惑
（1 ％の変化が年間数百万ドルを生む）
分散が大きい長期的効果を考慮する必要がある
モンテカルロ・シミュレーションにおける
分散低減法の利用 [Deng 13]
過去の実験データを用いた予測モデルの
構築 [Hohnhold 15, Dmitriev 17]

提案手法の概観
ユーザの振る舞いを示すフィードバック指標を利用して，高速化＋予測モデルの構築を行う．
フィードバック z
y
z1
z2
x1
x2
x3
バリエーション x
目的指標 y
ウェブサイトユーザ
p(y|x), q(z|x)
ページ滞在時間，スク
ロール量，リンク遷移 etc.
目的行為の有無（広告ク
リック，商品購入 etc.）

関連研究：分散低減法の有効性
評価指標と相関関係のある変量があれば，その
変量を用いることで分散の小さい推定量を設計
できる [Deng 14]．
制御変量法（層化サンプリングの一般化）
▶ 指標と相関する変量を利用することが，
探索を高速化する上で有効．
✖ ユーザ属性が常に獲得できるとは限らず，
より汎用的な手法が求められる．
層化
層化サンプリングによる分散低減
ある集団の平均身長を求める際，性別や年
齢などの属性で層分けすることで推定量の
分散を小さくできる．

関連研究：予測モデルによる評価指標の予測
観測に時間がかかる評価指標を，
バリエーションの特徴量から予測する．
LTR P M aims to approximate the long-term revenue impact
of a launch.12
The interpretation of (10) is straightforward:
the expected long-term RPM e↵ect is given by the observed
instantaneous revenue change plus a correction term that
expresses how user behavior changes will alter RPM post-
launch. Note that (10) deﬁnes an OEC that focuses on long-
term business health, given that, for Google search, we did
not see changes in the ﬁrst 3 terms of (2) in Section 2.
0
0 50 100 150 200
Treatment duration in days
RPM
Figur e 5: Short-term (pink) and long-term (blue) ∆ RPM
metrics for simple ad load changes on mobile Google search,
F
t
u
t
l
S
l
a
w
o
m
Google 検索結果画面における長期収益性予測
1. 広告の表示数
2. 広告と検索クエリの関連度
3. 広告のリンク先のウェブページの質
を特徴量とする線形回帰によって，長期的に不
利な修正を棄却することに成功した．
[Hohnhold 15] より引用
▶ 評価指標の予測には，過去の実験データを
用いた予測モデルの構築が有効．
✖ バリエーションの特徴量は対象のウェブ
サイトに大きく依存する→汎用化が必要
短期的パフォーマンス
長期的パフォーマンス

関連研究：ベイズ最適化
未知の関数の最大値を効率よく求める手法．
1. 目的関数の期待値分布を推定する．
2. 期待値分布から獲得関数を算出する．
3. 獲得関数を最大にする解を評価する．
4. 1〜3 を繰り返す．
[Brochu 10] より引用有望な解に観測が集中している
信頼区間獲得関数
GPUCB の動作例
GPUCB (Gaussian Process – UCB)
ガウス過程によって期待値分布を推定し，
信頼区間の上限を最大にする解を逐次的に
選択するアルゴリズム．

提案手法
• フィードバック指標をベイズ最適化の説明
変数とする．
• フィードバック空間 Z において，信頼区間
の上限を最大にする点 z* を算出する．
• z* を生み出すと最も期待される解 x を逐次
的に選択する．
目的指標と相関関係にあるフィードバック
指標を探索に用いる．
▶ 相関関係を活用した高速化
得られた期待値分布が，未知のバリエー
ションに対する予測モデルとして働く．
▶ 予測モデルによる最適解予測
（e.g. クリック率）
（e.g. 滞在時間）

評価実験
実際のウェブサイトのログデータを用いたシミュレーション実験によって評価する．
• フィードバック空間 Z 内で目的指標の期待
値を推定するベイズ最適化を導入すること
で，最適なバリエーションの探索を高速化
できることを評価する．
▶ 分散が大きい評価指標の問題を克服して，
高速化ができるか？
• 実験１の探索の過程で得られた期待値分布
を予測モデルとして用いることで，未知の
バリエーション集合の中から最適なバリ
エーションを推定できることを評価する．
▶ フィードバック指標さえ得られれば，
時間のかかる評価指標も予測できるのか？
実験１：高速化の評価実験２：未知のバリエーションの推定

実験１：高速化の評価
目的指標 y：広告のクリック率
観測するフィードバック指標 z
1. 離脱の有無（二値）
2. 概要図からの遷移（二値）
3. 「もっと見る」ボタンからの遷移（二値）
4. 滞在時間（秒）
対象サイト：あのひと検索スパイシー
一日に約数万人が訪れる人物検索サイト．
スクリーンショット http://spysee.jp/1870946
広告
x y z1 z2 z3 z4
1 B(0.053
)
B(0.197) B(0.403) B(0.188) G(1.459, 21.588)
2 B(0.072
)
B(0.199) B(0.417) B(0.175) G(1.243, 22.865)
3 B(0.040
)
B(0.175) B(0.412) B(0.173) G(1.482, 21.047)
2013 年 5 月 16 日のログデータから推定された各指標の分布
評価関数

実験１：正確度・累計クリック数の推移
最適バリエーションを推定する正確度の推移累計クリック数の推移
100 回のシミュレーションの結果の平均値を示す．
提案手法：フィードバック空間 Z における GP-UCB アルゴリズム
比較手法：フィードバック指標を利用しない単純な UCB アルゴリズム
▶ フィードバック指標を用いることが高速化に有効

実験１：フィードバック空間における期待値分布
• ガウス過程によって，フィードバック指標
とクリック率の間の非線形の関係を学習す
ることができている．
• このモデルが，未知のバリエーション集合
から最適なバリエーションを推定する目的
で活用できることを実験２で評価する．
フィードバック空間 Z におけるクリック率の期待値分布
上の曲面は上側信頼限界分布を，下の曲面は期待値分布．
フィードバック指標として，ここでは z2, z4 を選択した．

実験２：未知のバリエーションの推定
• 2013 年 6 月 6 日にテストされた X = {x4,x5,x6,x7,x8} を未知のバリエーション集合とする．
• 実験１で得られた分布を初期分布として，未知のバリエーションに対する探索が高速化さ
れることを評価する．
x y z1 z2 z3 z4
1 B(0.0551) B(0.183) B(0.411) B(0.174) G(1.511, 20.659)
2 B(0.0683) B(0.180) B(0.377) B(0.192) G(1.341, 21.622)
3 B(0.0594) B(0.200) B(0.391) B(0.190) G(1.189, 24.738)
4 B(0.0656) B(0.200) B(0.386) B(0.209) G(1.318, 20.656)
5 B(0.0846) B(0.193) B(0.392) B(0.172) G(1.345, 20.990)
2013 年 6 月 6 日のログデータから推定された各指標の分布
評価関数

100 回のシミュレーションの結果の平均値を示す．
提案手法：フィードバック空間 Z の初期分布に
実験１で得られた分布を用いる GP-UCB
比較手法：フィードバック空間 Z の初期分布に
一様分布を用いた GP-UCB
▶ 探索の過程で得られた期待値分布を用いることで，
未知のバリエーションに対する探索が高速化される．
▶ 期待値分布が予測モデルとして機能する可能性があ
る．
実験２：未知のバリエーションの推定
正確度の推移
累計クリック数の推移

考察とまとめ
フィードバック指標を用いることで，探索の高速化および
未知のバリエーションに対する予測が可能になった．
▶ ユーザの反応を様々な指標で捉えることで，高速な最適化を実現できる．
事前実験の必要性
ガウス過程を行う領域，採用するフィードバック指標，超パラメータの設定によって大きく
パフォーマンスが左右される．
本研究の貢献
分散低減法と予測モデルのいずれも新規ではないが，
① 二つをベイズ最適化による解法として統一したこと．
② フィードバック指標という，より汎用的な指標によって検証したこと．
に貢献があると考えている．

バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第３１回人工知能学会全国大会

Recommandé

Recommandé

Contenu connexe

Plus de Shuhei Iitsuka

Plus de Shuhei Iitsuka (20)

バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第３１回人工知能学会全国大会

Notes de l'éditeur