6. 関連研究:予測モデルによる評価指標の予測
観測に時間がかかる評価指標を,
バリエーションの特徴量から予測する.
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法, 飯塚 修平 6
LTR P M aims to approximate the long-term revenue impact
of a launch.12
The interpretation of (10) is straightforward:
the expected long-term RPM e↵ect is given by the observed
instantaneous revenue change plus a correction term that
expresses how user behavior changes will alter RPM post-
launch. Note that (10) defines an OEC that focuses on long-
term business health, given that, for Google search, we did
not see changes in the first 3 terms of (2) in Section 2.
0
0 50 100 150 200
Treatment duration in days
RPM
Figur e 5: Short-term (pink) and long-term (blue) ∆ RPM
metrics for simple ad load changes on mobile Google search,
F
t
u
t
l
S
l
a
w
o
m
Google 検索結果画面における長期収益性予測
1. 広告の表示数
2. 広告と検索クエリの関連度
3. 広告のリンク先のウェブページの質
を特徴量とする線形回帰によって,長期的に不
利な修正を棄却することに成功した.
[Hohnhold 15] より引用
▶ 評価指標の予測には,過去の実験データを
用いた予測モデルの構築が有効.
✖ バリエーションの特徴量は対象のウェブ
サイトに大きく依存する→汎用化が必要
短期的パフォーマンス
長期的パフォーマンス
まず,実験1について説明してきます.
スパイシーのサイト.
ここでも,第一研究で用いた「あのひと検索スパイシー」を対象ウェブサイトとして用います.
また,評価指標も同様にバナー広告のクリック率を用います.
この評価指標 y にあわせて,ここではフィードバック指標としてプロフィールページからの遷移の有無と滞在時間を用います.
評価関数には,2013年5月16日に観測されたログデータを用います.
ここでは,この3種類のバリエーションに対してこのような確率分布で評価指標およびフィードバック指標が与えられるものとします.
実験1の結果です.
比較手法としては,ここではフィードバック空間 Z におけるベイズ最適化を行わない,単純な UCB を設定しました.こrを記述う.
500回のシミュレーションの結果の平均値を示します.
正確度の推移に着目すると,オレンジで示した提案手法は,青で示した比較手法に比べて高速に正確度を向上することができていることがわかります.
また,累計のクリック数を比較しても,提案手法が同じ期間でより多くのクリックを得ることができていることがわかります.
また,実験1の探索の過程で得られたフィードバック空間 Z におけるクリック率の期待値分布の一例を掲載します.
図からわかるように,フィードバック指標とクリック率の間の非線形の関係を捉えることができていることがわかります.
実験2では,この期待値分布を用いることで,未知のバリエーションについても最適なバリエーションを推定できることを評価します.