6. モデル
• CTRを高める学習のための項
– 𝐶𝑇𝑅(𝑦)
• oracle modelによって予測された広告𝑦のCTR
• 先行研究(Microsoft)のCTR予測モデル[1]を使用
– large-scale logistic regression
5
[1] X. Ling, W. Deng, C. Gu, H. Zhou, C. Li, and F. Sun. Model ensemble for clickprediction in bing
search ads. InProceedings of the 26th International Conferenceon World Wide Web Companion,
pages 689–698. International World Wide WebConferences Steering Committee, 2017.
8. モデル
• Attention
– attention score[1,2]
– normalized scores[3]
• 過去ステップのscoreを用いて正規化
– context vector
7
参考
[1] M. Luong, H. Pham, and C. D. Manning. Effective approaches to attention-based neural machine
translation.CoRR, abs/1508.04025, 2015.
[2] R. Paulus, C. Xiong, and R. Socher. A deep reinforced model for abstractive summarization.arXiv
preprint arXiv:1705.04304, 2017.
[3] B. Sankaran, H. Mi, Y. Al-Onaizan, and A. Ittycheriah. Temporal attention model for neural
machine translation.CoRR, abs/1608.02927, 2016.
文献[2]から引用
9. encoder
decoder
モデル
• Output
– decoderのタイムステップ𝑖では以下のものが出力される
• LSTMのhidden state ℎ𝑖
𝐷
• attention distributions 𝛼𝑖,𝑗
𝑥 𝑇
, 𝛼𝑖,𝑗
𝑥 𝐵
• context vectors 𝑐𝑡
𝑥 𝑇
, 𝑐𝑡
𝑥 𝐵
– これらから潜在的単語出力分布𝑝 𝑣𝑜𝑐𝑎𝑏, 𝑝𝑐𝑜𝑝𝑦を予測する
8
[1] R. Paulus, C. Xiong, and R. Socher.
A deep reinforced model for abstractive
summarization.arXiv preprint
arXiv:1705.04304, 2017.
文献[1]から持ってきた図
(前ページの文献[2])
10. モデル
• Output
– 最終的な出力
9
𝑊𝑒𝑚𝑏:単語の埋め込み行列(LSTM入力前にも使用)
学習するパラメータ
• 4つのLSTM
• 𝑊𝑒𝑚𝑏, 𝑊𝑝
• 𝑏 𝑢
𝐷
, 𝑊𝑢
𝐷
• (attentionは?)
参考
[1] A. See, P. J. Liu, and C. D. Manning. Get to the point: Summarization withpointer-generator networks.CoRR, abs/1704.04368, 2017.
[2] https://www.slideshare.net/ponta63/gettothepointacl17
新しい単語を生成
原文の単語を使いまわす
11. モデル
• Output 図[1]
10
[1] A. See, P. J. Liu, and C. D. Manning. Get to the point: Summarization
withpointer-generator networks.CoRR, abs/1704.04368, 2017.
context vectorとDecoder(LSTM hidden state)
から単語分布を得る
12. モデル
• Output 図[1]
11
[1] A. See, P. J. Liu, and C. D. Manning. Get to the point: Summarization
withpointer-generator networks.CoRR, abs/1704.04368, 2017.
𝑝 𝑣𝑎𝑐𝑎𝑏
新しい単語を生成
𝑝𝑐𝑜𝑝𝑦
原文の単語を使いまわす(copy)
スイッチ変数:𝑢
16. 実験
• Training
– 事前学習
• 𝐿 𝑋𝐸で学習
– そのあと𝐿 𝑡𝑜𝑡𝑎𝑙で学習(Self Critical Sequence Training)
– 学習中CTRを推定するためにCTR予測で学習させたoracle modelを
使用
• 学習中はブラックボックスとして扱われる
• 同じくmicrosoftの人が著者の先行研究のCTR予測モデル[1]を使用
– large-scale logistic regression
15
[1] X. Ling, W. Deng, C. Gu, H. Zhou, C. Li, and F. Sun. Model ensemble for clickprediction in bing
search ads. InProceedings of the 26th International Conferenceon World Wide Web Companion,
pages 689–698. International World Wide WebConferences Steering Committee, 2017.
24. 生成例
• SCSTモデルの広告
– 無料,行動を表すフレーズ,数字などが含まれる
• 広告の魅力を高めることが知られている[1]
23
[1] S. Thomaidou. Automated Creation and Optimization of Online Advertising Campaigns. PhD thesis, Ph. D.
thesis, Department of Informatics, Athens University of Economics and Business, 2014.