3. 関連研究 & motivation
● 広告の関連研究では、広告主、パブリッシャー、ユーザーなど様々な視点で研
究が行われている
○ 見ているパブリッシャー側(サイト)の傾向で購買傾向を予測する
■ [9]N. Djuric., In IEEE International Conference on Data Mining,
Dec 2014.
● ただしpurchase intent しか分からない->ダイレクトな広告実施をしたい
● メールに限らず、レコメンデーションの研究も積極的
○ 行動が類似するユーザーから最も興味があるであろう商材を予測
■ [1]G. Linden, B. Smith, and J. York. Amazon.com
recommendations: Item-to-item collaborative filtering. IEEE
Internet Computing, 7(1):76–80, Jan. 2003.
● emailのレシートを読み込むことにより、数百の異なったe-commerceのデータか
らより精度の高い予測が可能
3
4. model : prod2vec
● Neural Language model
○ 古典的な単純な言語モデルでは限界がある
○ SGが提案されて近年、popularになってきた
○ [24]T. Mikolov, Distributed representations of
words and phrases and their
compositionality. In NIPS, pages 3111–3119,
2013.
○ 言語分野を超えて、グラフ構造内のノードなど
様々な応用がある
● 商用のレコメンデーションに使えないか?
● prod2vecの提案(fig2)
● SGを購入履歴を文、商品を単語として扱う
● 本研究の1つ目のモデルとして、商品購買すべてを
別々に考えるモデルを提案
4
5. model : prod2vec
● Objective function
○ 下記の対数尤度を目的関数として最大化したい
● Soft-max function
○ 上記のP(周辺商品の条件付き確率)は下記のソフトマックス関
数で定義され、これに従って入出力ベクトルV,V’を最適化する
○ 実際はSGDで求めたいところだが、計算を緩和するためネガ
ティブサンプリングで解いている[24]
5
7. User to product predictive model
● 3番目は、product間だけでなく、userとproduct間の関係を考慮したモデル
● Googleのparagraph2vecに影響されて用いている
○ [21]Q. V. Le and T. Mikolov. Distributed representations of sentences
and documents. arXiv preprint arXiv:1405.4053, 2014.
● モデルの構造は下記のfig4、prod2vecの逆の構造
● 目的関数は2つの対数尤度の和を取る形
7
周辺商品とユーザー
の潜在ベクトルからi
番目の商品の確率を
をアウトプット
購入履歴からユー
ザーの潜在ベクトル
の確率をアウトプット
8. データ
● 使用データ
○ March to October 2014
○ Extracted product names and purchase times
○ 280.7M purchases from 172 commercial domains made by 29M users
○ 2.1M unique bought products priced over $5
● 基礎集計
○ ユーザーは女性が多い
○ 平均購入価格は男性が高い
● 年代、地域による違い
○ 平均購入価格、購入数
○ コーホート効果の有無がある
と述べているが深い考察は無し
8
9. Experiments : popular product
● オフラインテストでの検証
● popular product
○ パフォーマンスの良い手法
○ cold start にも対処できる
● 過去dataは5日、検証期間は少なくとも3日
○ やや当たり前の結果
● セグメント毎の検証、過去データは5日に固定
● 性別、年代、地域情報(州)によるセグメントは
popular productsは全体よりも良い結果が得
られている
9