4. 発表の流れ
1. 計量経済学の話
a. どういう分野か?
b. Treatment Effectとその推定について
2. 機械学習との交差点
a. 全体感
b. Varian’s Idea
c. Athey’s Causal Tree
d. Policy Prediction Problem
3. まとめと疑問
4. その他のアプローチ(時間があれば)
4
14. 利用パターン
1. 機械学習で計量経済学の手法を改良する。
a. 傾向スコアの算出
b. 操作変数法の一段階目の推定
2. 機械学習を計量経済学の手法へと改良する。
a. Varian’s Idea
b. Athey’s Causal Tree
3. 機械学習を計量経済学の実用時のプロセスに追加する。
a. Prediction Policy Problem
4. 機械学習で用いられるデータ構造の考え方を計量経済学のモデルの変数
として扱う。
14
15. 今日話すパート
1. 機械学習で計量経済学の手法を改良する。
a. 傾向スコアの算出
b. 操作変数法の一段階目の推定
2. 機械学習を計量経済学の手法へと改良する。
a. Varian’s Idea
b. Athey’s Causal Tree
3. 機械学習を計量経済学の実用時のプロセスに追加する。
a. Prediction Policy Problem
4. 機械学習で用いられるデータ構造の考え方を計量経済学のモデルの変
数として扱う。
15
17. 予測モデルを使って因果推論しよう
● Big data: New tricks for econometrics.
● この中で、ある介入や施策の効果を測るためのアイデアを提
示。
● Difference in Difference Estimatorの応用。
● 時系列と変数選択で可能にしたのがCausal Impact。
17Vaian’s Idea
20. 利用例:Auction Mechanism Test
● ネット広告の一部分では、ユーザーのアクセス単位に広告を出す権利をオークショ
ンに掛けている。(RTB: Real Time Bidding)
● RTBで広告を売る側のSupply Side Platform(SSP)は売る為の価格設定やルール
を調整する事で収益を改善する。
● よって、調整した結果の効果がどうだったのか?を知りたい。
● しかし、SSP側ではA/Bテストによる効果の推定が困難。
20Vaian’s Idea
47. (おまけ)4の話
● ネットワークの構造を入れるケースはちょっと前にあった。
○ Impact of social network structure on content propagation: A study using YouTube data
○ どんなYoutuberにバイラル広告の依頼をすると効率が良いのか?
● David M. BleiはSusan Atheyと買い物の行動をトピックモデルとして考えて、大量
データの中で消費者の効用分析をしようとしてる。(スライド)
● どちらのケースも、今までの人の行動や特徴の捉え方が雑であることを認識して、
他の分野からデータの構造を輸入している。
● 今現在でapplied econometricsをやっている人が機械学習を学ぶモチベーション
はココが強そう。
47
49. 例2)Uber Surge Price
● Dynamic Pricing in a Labor Market: Surge Pricing and Flexible Work on the
Uber Platform
● タクシードライバーの労働意思決定のモデル。
● 一日の中で一定の金額を稼いだらそこで辞めるか否か。
○ Yesの場合は、賃金が上がれば労働時間は短くなる。
○ Noの場合は、賃金が上がると労働時間が長くなる。
● 運賃が労働時間に対して与える影響をモデルにしてパラメーターをみれば良い。
● 結論:Uberでは賃金が上がると労働時間が長くなる。
● 価格変動の評価に利用しているとの事。
49
50. 50
Learning Representations for
Counterfactual Inference
http://icml.cc/2016/reviews/1348.txt
In short, they optimize an objective function over
A. [a] hypotheses (i.e., a class of outcome
prediction functions, e.g., linear regressions or
neural nets) and
B. [b] representations of the input (i.e., feature
selection and re-weighting OR a non-linear
mapping via neural net)
with three terms:
1. (1) prediction error for actual observed
outcomes
2. (2) discrepancy distance between empirical
distributions over "factual" (observed) data and
"counterfactual" data (i.e., factual examples
with opposite outcomes implicitly matched
within the learned representation space)
3. (3) "counterfactual" prediction error: i.e., error
between the prediction for observed X_i with
treatment opposite of what they got (1-T_i) and
the outcome for the nearest X_j within the
learned representation space
(おまけ)Deeplearningで!
51. 参考資料
● Big Data: New Tricks for Econometrics
● INFERRING CAUSAL IMPACT USING BAYESIAN STRUCTURAL TIME-SERIES MODELS
● Demand Estimation with Machine Learning and Model Combination
● Recursive Partitioning for Heterogeneous Causal Effects
● Estimation and Inference of Heterogeneous Treatment Effects using Random Forests
● Prediction Policy Problem
● Causal Inference for Policy Evaluation - ICML
● Video) Susan Athey, "Machine Learning and Causal Inference for Policy Evaluation"
● The State of Applied Econometrics - Causality and Policy Evaluation
51