Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.
Webと経済学:
経済主体の意思決定に影響する推薦システム
株式会社サイバーエージェント 秋葉原ラボ
數⾒ 拓朗
WWW-2019 論⽂読み会
⾃⼰紹介
l 數⾒ 拓朗(かずみたくろう)
• 技術本部 秋葉原ラボ
• 経済学(博⼠) → 現職
l おしごと
• ⾃然⾔語処理技術を利⽤したプロダクトの開発
l しゅみ
• スマブラSP
• サッカー
• 漫画‧アニメ
2
取り上げる論⽂と問題意識
l ゲーム理論の視点から⾒た推薦システム
• Immorlica, N. Mao, J. Slivkins, A. Wu Z. S. 2018
Bayesian Exploration with Heterogeneo...
はじめに
4
はじめに:経済主体の意思決定への介⼊
l 経済主体の意思決定に影響を与えるとは?
5
商品を売りたい店員 商品の購⼊を検討している客
商品の性能
他店の価格
etc.
ニーズ
①推定
コミュニケーションによって経済主体の予想を変化させる
②メッ...
はじめに:経済主体の意思決定への介⼊
6
情報提供者
1. 必ず役⽴つ
2. おそらく役⽴つ
3. 役に⽴たない
シグナルの選択
l 情報提供者のメッセージ = シグナル
意思決定者
③⾏動の選択
タイプ
情報提供者の期待利得を最⼤するシグナル...
はじめに:最適シグナルの分析例
l ユーザのタイプは最適シグナルにどのような影響を与えるか?
• ユーザのタイプが公開されているケース
• ユーザのタイプがゲームが進⾏するにつれて公開されるケース
• ユーザのタイプが秘匿されているケース
l ...
はじめに:インターネットサービスの解析例
l 推薦システム
• [EC 2016] Moansour, Y. Slivkins, A. Syrgkanis, V. & Wu, Z. S.
“Bayesian Exploration: Incen...
具体例
9
推薦ゲーム:設定
l 状態‧タイプを考慮しながら、ユーザに⾏動を推奨する
10
1. 起こりうる状態の集合 : Ω = 𝜔$, 𝜔&
2. 選択可能な⾏動の集合 : 𝐴 = 𝑎$, 𝑎&
3. ユーザのタイプの集合 : Θ = 𝜃$, 𝜃&
4...
推薦ゲーム:設定
11
主体 ⾏動
1 意思決定者 タイプ 𝜃$, 𝜃& を持つユーザが推薦ゲームに参加
2 情報提供者 ⾃⾝の期待利得を最⼤にするような推奨⾏動を意思決定者に提⽰
3 意思決定者 メッセージを受け取り、利得が最⼤になる⾏動𝐴を...
推薦ゲーム:Round 1
l 具体的に、利得は以下のように設定
l Round 1
12
𝑎$ 𝑎&
𝜃$ 3 4
𝜃& 2 0
𝑎$ 𝑎&
𝜃$ 2 0
𝜃& 3 4
𝜔$のとき 𝜔&のとき
𝑎$を推奨したときの期待利得 : ̅𝜌 𝜃$ 3...
推薦ゲーム:Round 2
l タイプの秘匿は最適シグナルにどのような影響を与える?
l ユーザのタイプが明かされているとき:
• ユーザのRound 1における報酬とタイプから、推薦システムは𝜔$と𝜔&のど
ちらの状態が実現したかを知る
• ...
おわりに
14
まとめと雑感
l まとめ
• 最適シグナルの観点から推薦システムの理論的解析を試みた論⽂を紹介
• 情報提供者を推薦システム、意思決定者をユーザ、シグナルをユーザ⾏動
履歴と解釈
l 雑感
• 今回の論⽂は、理論的解析にのみスポット
• ゲーム...
Prochain SlideShare
Chargement dans…5
×

sur

Webと経済学    數見拓朗 Slide 1 Webと経済学    數見拓朗 Slide 2 Webと経済学    數見拓朗 Slide 3 Webと経済学    數見拓朗 Slide 4 Webと経済学    數見拓朗 Slide 5 Webと経済学    數見拓朗 Slide 6 Webと経済学    數見拓朗 Slide 7 Webと経済学    數見拓朗 Slide 8 Webと経済学    數見拓朗 Slide 9 Webと経済学    數見拓朗 Slide 10 Webと経済学    數見拓朗 Slide 11 Webと経済学    數見拓朗 Slide 12 Webと経済学    數見拓朗 Slide 13 Webと経済学    數見拓朗 Slide 14 Webと経済学    數見拓朗 Slide 15
Prochain SlideShare
What to Upload to SlideShare
Suivant
Télécharger pour lire hors ligne et voir en mode plein écran

1 j’aime

Partager

Télécharger pour lire hors ligne

Webと経済学 數見拓朗

Télécharger pour lire hors ligne

WWW2019 論文読み会
Webと経済学 數見拓朗

Webと経済学 數見拓朗

  1. 1. Webと経済学: 経済主体の意思決定に影響する推薦システム 株式会社サイバーエージェント 秋葉原ラボ 數⾒ 拓朗 WWW-2019 論⽂読み会
  2. 2. ⾃⼰紹介 l 數⾒ 拓朗(かずみたくろう) • 技術本部 秋葉原ラボ • 経済学(博⼠) → 現職 l おしごと • ⾃然⾔語処理技術を利⽤したプロダクトの開発 l しゅみ • スマブラSP • サッカー • 漫画‧アニメ 2
  3. 3. 取り上げる論⽂と問題意識 l ゲーム理論の視点から⾒た推薦システム • Immorlica, N. Mao, J. Slivkins, A. Wu Z. S. 2018 Bayesian Exploration with Heterogeneous Agents l 本発表では、状況設定や問題意識の注⽬して、推薦システムを ゲーム理論を通じてどのように解釈しているかを明らかにします 3
  4. 4. はじめに 4
  5. 5. はじめに:経済主体の意思決定への介⼊ l 経済主体の意思決定に影響を与えるとは? 5 商品を売りたい店員 商品の購⼊を検討している客 商品の性能 他店の価格 etc. ニーズ ①推定 コミュニケーションによって経済主体の予想を変化させる ②メッセージの選択 ③⾏動の選択 購⼊ or not
  6. 6. はじめに:経済主体の意思決定への介⼊ 6 情報提供者 1. 必ず役⽴つ 2. おそらく役⽴つ 3. 役に⽴たない シグナルの選択 l 情報提供者のメッセージ = シグナル 意思決定者 ③⾏動の選択 タイプ 情報提供者の期待利得を最⼤するシグナル = 最適シグナル 推定 メカニズムデザインと意思決定のフロンティア:第4章「最適シグナル」より
  7. 7. はじめに:最適シグナルの分析例 l ユーザのタイプは最適シグナルにどのような影響を与えるか? • ユーザのタイプが公開されているケース • ユーザのタイプがゲームが進⾏するにつれて公開されるケース • ユーザのタイプが秘匿されているケース l 意思決定者にある⾏動をとらせたい場合、どのような情報提供が 必要か? • 情報提供者による推奨⾏動以外をとるインセンティブが、意思決定にない ことを前提とする 7
  8. 8. はじめに:インターネットサービスの解析例 l 推薦システム • [EC 2016] Moansour, Y. Slivkins, A. Syrgkanis, V. & Wu, Z. S. “Bayesian Exploration: Incentivizing Exploration in Bayesian Games” • [WWW 2019] Immorlica, N. Mao, J. Slivkins, A. Wu, Z. S. “Bayesian Exploration with Heterogeneous Agents” • 情報提供者 = 推薦システム、意思決定者 = ユーザ、シグナル = ⾏動履歴 l インターネット広告:広告(出稿位置やデザインなど) • [JPE 2010] Ryao, L. & Segel, I. “Optimal Information Disclosure” • 情報提供者 = 広告プラットフォーム、意思決定者 = ユーザ、シグナル = 広 告‧デザインなど 8
  9. 9. 具体例 9
  10. 10. 推薦ゲーム:設定 l 状態‧タイプを考慮しながら、ユーザに⾏動を推奨する 10 1. 起こりうる状態の集合 : Ω = 𝜔$, 𝜔& 2. 選択可能な⾏動の集合 : 𝐴 = 𝑎$, 𝑎& 3. ユーザのタイプの集合 : Θ = 𝜃$, 𝜃& 4. ユーザの利得関数 : 𝑢(𝑎-, 𝜔., 𝜃/) 5. 状態の事前予想の確率分布 : ̅𝜇 ∈ 𝒟 Ω 6. タイプの事前予想の確率分布 : ̅𝜌 ∈ 𝒫 Θ 以下のケースでは、 ̅𝜇 𝜔$ = & 7 , ̅𝜌 𝜃$ = & 7 と考える.
  11. 11. 推薦ゲーム:設定 11 主体 ⾏動 1 意思決定者 タイプ 𝜃$, 𝜃& を持つユーザが推薦ゲームに参加 2 情報提供者 ⾃⾝の期待利得を最⼤にするような推奨⾏動を意思決定者に提⽰ 3 意思決定者 メッセージを受け取り、利得が最⼤になる⾏動𝐴を選択 4 情報提供者 意思決定者の選択した⾏動と利得を観察 主体 ⾏動 1 情報提供者 R1のシグナルより、状態と意思決定者のタイプについての信念を更新 2 情報提供者 ⾃⾝の期待利得を最⼤にするような推奨⾏動を意思決定者に提⽰ 3 意思決定者 メッセージを受け取り、利得が最⼤になる⾏動𝐴を選択 4 情報提供者 意思決定者の選択した⾏動と利得を観察 Round 1 Round 2
  12. 12. 推薦ゲーム:Round 1 l 具体的に、利得は以下のように設定 l Round 1 12 𝑎$ 𝑎& 𝜃$ 3 4 𝜃& 2 0 𝑎$ 𝑎& 𝜃$ 2 0 𝜃& 3 4 𝜔$のとき 𝜔&のとき 𝑎$を推奨したときの期待利得 : ̅𝜌 𝜃$ 3 ̅𝜇 𝜔$ + 2 ̅𝜇 𝜔& + 1 − ̅𝜌 𝜃$ 2 ̅𝜇 𝜔$ + 3 ̅𝜇 𝜔& ① 𝑎&を推奨したときの期待利得 : ̅𝜌 𝜃$ 4 ̅𝜇 𝜔$ + 0 ̅𝜇 𝜔& + 1 − ̅𝜌 𝜃$ 0 ̅𝜇 𝜔$ + 4 ̅𝜇 𝜔& ② ∴ ̅𝜇 𝜔$ = & 7 , ̅𝜌 𝜃$ = & 7 より,①>②.推薦システムの最適シグナルは⾏動𝑎$ 𝛚 𝟎が実現すると考えている確率 𝛚 𝟏が実現すると考えている確率 𝛚 𝟎が実現したときのユーザの期待利得 𝛚 𝟏が実現したときのユーザの期待利得
  13. 13. 推薦ゲーム:Round 2 l タイプの秘匿は最適シグナルにどのような影響を与える? l ユーザのタイプが明かされているとき: • ユーザのRound 1における報酬とタイプから、推薦システムは𝜔$と𝜔&のど ちらの状態が実現したかを知る • ユーザのタイプに応じて最も報酬の⾼い 𝜃$, 𝑎& もしくは 𝜃&, 𝑎& を推奨で きる l ユーザのタイプが明かされないとき: • 推薦システムの状態についての情報が更新されずに、 𝑎Cを推奨し続けるこ とになる 13
  14. 14. おわりに 14
  15. 15. まとめと雑感 l まとめ • 最適シグナルの観点から推薦システムの理論的解析を試みた論⽂を紹介 • 情報提供者を推薦システム、意思決定者をユーザ、シグナルをユーザ⾏動 履歴と解釈 l 雑感 • 今回の論⽂は、理論的解析にのみスポット • ゲーム理論の視点がインターネットサービスを良くする? ⁃ Uberの「謝罪モデルと実証分析」論⽂(Halperlin, et al., 2018)のように、インターネッ トサービスにおける現象(情報の⾮対称性など)をモデル化し施策につなげた例 15
  • syuichitsuji

    Sep. 10, 2019

WWW2019 論文読み会 Webと経済学 數見拓朗

Vues

Nombre de vues

1 844

Sur Slideshare

0

À partir des intégrations

0

Nombre d'intégrations

1 325

Actions

Téléchargements

2

Partages

0

Commentaires

0

Mentions J'aime

1

×