Contenu connexe
Similaire à 時系列解析の使い方 - TokyoWebMining #17 (20)
時系列解析の使い方 - TokyoWebMining #17
- 1. 時系列解析の使い方
#TokyoWebmining 17th
2012/05/20
@horihorio
- 2. 自己紹介
• Twitter ID: @horihorio
• 学位:修士(経済学)
ファイナンス周りを少々
• 仕事上の肩書き:
データマイニング・コンサルタント
• やってきたこと:一貫して金融業で、例えば
与信リスクモデル構築・導入(法人・個人)
Baselの動向の調査、導入対応
• 興味のあること:
基本的に、雑食性。金融/リスク管理/会計(IFRS)/数学
/統計/R/DB/機械学習/etc…
2012/05/20 時系列解析の使い方 2 / 32
- 3. ◇ 全体構成 ◇
1. はじめに
2. 時系列解析のフローチャート(案)
(1) 分析方針の立案
1. 分析設計
2. 状態空間モデルの検討
(2) データ加工
1. データの観察
2. 定常時系列への変換
3. 単位根検定
(3) モデリング
1. モデリング
2. 結果のチェック
2012/05/20 時系列解析の使い方 3 / 32
- 5. 1. はじめに
発表で扱うこと
• ビジネスへの適用を念頭に置いた、時系列
解析の考え方、使い方
扱わないこと
• 時系列解析の理論面の解説
• 実データの解析例
手法については、参考文献をご参照
2012/05/20 時系列解析の使い方 5 / 32
- 6. 2. 時系列解析のフローチャート(案)
(1) 分析方針の立案
いまココ
1. 分析設計
2. 状態空間モデルの検討
(2) データ加工
1. データの観察
2. 定常時系列への変換
3. 単位根検定
(3) モデリング
1. モデリング
2. 結果のチェック
2012/05/20 時系列解析の使い方 6 / 32
- 8. 2.1.1. 時系列モデルの検討事項
時系列解析を採用する際の重要事項:
分析の結果、次に何が想定されるか?
• 分析→報告・行動 がその場限り
例:サーバー異常検知、ノイズフィルタリング、
過去データの観測、スポット的な分析PJの報告、等
• 分析→報告・行動まで 反復がある
例:母集団、仮定・前提の変更、要因分解、等々…、
再度 分析→報告 のサイクルが回る
2012/05/20 時系列解析の使い方 8 / 32
- 9. 2.1.1. 時系列モデルの検討事項
時系列解析を採用する際の重要事項:
分析の結果、次に何が想定されるか?
• 分析→報告・行動まで 反復がある
例:母集団、仮定・前提の変更、要因分解、等々…、
再度 分析→報告 のサイクルが回る
このときには:
• 時系列解析以外の選択肢もあるのでは?
• するならば、状態空間モデルの導入も検討
2012/05/20 時系列解析の使い方 9 / 32
- 14. 2.1.2. 状態空間モデルの検討
状態空間モデルの数式表現
(状態方程式)
(観測方程式)
• :状態(直接観測出来ない)
• :状態ノイズ(平均ゼロの正規分布)
• :観測値
• :観測ノイズ(平均ゼロの正規分布)
• :係数行列
推定したいもの:状態方程式 と 観測方程式
2012/05/20 時系列解析の使い方 14 / 32
- 16. 2.1.3. その他のメモ
その1:多変量時系列モデル(VAR: Vector Auto Regression)
面白いのは、モデル入出力が行列:多変量 だけでない:
• 相互共分散・相関
→ 他変数との影響が、先行/一致/遅行 なのか分かる。
• Granger Causality(2003年ノーベル経済学賞)
→ Xが起きたらYが起きたの?を検定する。
ただし、日常生活での”Causality”とは異なる。
• Impulse Response Function
→ t 期のショックが t+1 期に及ぼす影響の計測
• Variance Decomposition
→ 予測誤差の要因分解
2012/05/20 時系列解析の使い方 16 / 32
- 18. 2. 時系列解析のフローチャート(案)
(1) 分析方針の立案
1. 分析設計
2. 状態空間モデルの検討 いまココ
(2) データ加工
1. データの観察
2. 定常時系列への変換
3. 単位根検定
(3) モデリング
1. モデリング
2. 結果のチェック
2012/05/20 時系列解析の使い方 18 / 32
- 21. 2.2.1. データの観察
plotでわかる事:
時系列モデルをどう適用するか
モデルは、(基本的に)定常過程でないと扱えない。
定常:以下の全てが成立することをいう(正確には弱定常性)
• (無条件)平均が有限
• (無条件)分散が有限
• 自己共分散が、時間のみに依存
数式を見たい方は、次ページ参照
先の図で、定常性を満たしているのは(1)のみ。
2012/05/20 時系列解析の使い方 21 / 32
- 22. 2.2.1. データの観察
数式表現:時系列 の
• 平均:
• 自己共分散:
• 自己相関:
注1:時系列は全て漸近理論ベース(標本数が十分大きい場合の挙動)。よって
自己共分散の分母は、nが十分大きいため、nでもn-(k+1)でも一緒。
注2:上記の自己相関の表記は、暗に定常時系列を仮定している。
2012/05/20 時系列解析の使い方 22 / 32
- 23. 2.2.2. 定常時系列への変換
非定常の場合は?
何かの加工をして、定常時系列に持ち込む
方法1:変換
• 差分 を取る(やっても2階が限度?)
• 対数や平方根の変換(一般的にはBox-Cox変換)
• 前期比、前年同期比を取る
• 移動平均値を取る
方法2:残差にも時系列構造を導入
• 分散の変動をモデル化:GARCHモデル
参考:RでGARCHモデル(私のTokyo.R#21 での発表)
http://www.slideshare.net/horihorio/garch-by-r
2012/05/20 時系列解析の使い方 23 / 32
- 24. 2.2.3. 単位根検定
時系列データでよくある話
このデータは、
Random Walk(乱数列)でないよね?
(Random Walk列でも、何かそれっぽいモデルが出来得る。
けど、そのモデルって一体何よ? てな議論になるので…)
ということで、最初に単位根検定で確認する
「Random Walkではない」の仮説検定
• Phillips-Perron検定 [stats::PP.test]
• Augmented Dickey-Fuller検定 [tseries::adf.test]
2012/05/20 時系列解析の使い方 24 / 32
- 25. 2.2.3. 単位根検定
どういうことか?
AR(1)過程:
もし ならば、
W.N.の累積
と、モデル化する意味ある?確率過程になる。
詳細:「Rで学ぶ回帰分析と単位根検定」 @teramonagi
http://www.slideshare.net/teramonagi/r-7066155
2012/05/20 時系列解析の使い方 25 / 32
- 26. 2.2.3. 単位根検定
単位根の回避方法(万能ではないが…)
• 前期との差分・変化比を取る
• 多変量時系列モデル:VAR(Vector Auto Regression) 導入
• ベクトル誤差修正モデル (VECM)導入
ただVARの場合、共和分があり得るので注意。
【共和分:単位根系列の線型結合が、定常過程になる】
共和分の検出方法は、以下の方法がある
• Engle-Grangerの二段階推定法(HamiltonのCh.19)
• Johansenの固有値検定 (HamiltonのCh.20)
単位根の処理は、Hamilton Ch.20.4.を読むと良いかも?
2012/05/20 時系列解析の使い方 26 / 32
- 27. 2. 時系列解析のフローチャート(案)
(1) 分析方針の立案
1. 分析設計
2. 状態空間モデルの検討
(2) データ加工
1. データの観察
2. 定常時系列への変換
3. 単位根検定 いまココ
(3) モデリング
1. モデリング
2. 結果のチェック
2012/05/20 時系列解析の使い方 27 / 32
- 28. 2.3. モデリング
本発表での管轄外につき、
色々な書籍・資料を参考のこと
個人的な感想:
• 残差の正規性、独立性チェックまで見事にハマっ
た経験はほぼ無い。
• 予測で、数点はまだしも、遠い点はまず当たらない。
(状態空間構造で上手くすると、結構綺麗にハマる気も?)
• 綺麗なモデルを作るには、結局は色々試行錯誤。
• 苦労の箇所が違うような気が?
時系列:モデリング
回帰とか:データの有無、検査、前加工
2012/05/20 時系列解析の使い方 28 / 32
- 29. まとめ
分析方針の立案
• 最初の分析計画の設定:分析の「背景/目的/方法」を
明確にし、結論を想定すること。
• 単純な時系列解析では、要因分解、前提や母集団を
変えた分析を行った後の比較が困難。時系列解析以
外の選択肢か、状態空間モデルの導入を検討。
データ加工
• 時系列解析で扱えるクラスは、(弱)定常過程のみ。
上手く変換して定常過程に持ち込むこと。
• 本来はW.N.だが、何かしらのモデルが出来ることもあ
る。手戻り防止のためにも、最初に単位根検定を行う。
2012/05/20 時系列解析の使い方 29 / 32
- 30. 参考文献
• J. D. Hamilton, “Time Series Analysis,” Princeton Univ.
Press, 1994
和訳:沖本・井上(上下巻)、シーエーピー出版、2006年 は絶版
• 北川源四朗 『時系列解析入門』 岩波書店、2005年
→中級者向け理論書。状態空間モデルベースの解説
• J.J.F.コマンダー、S.J.クープマン、和合肇(訳) 『状態空
間時系列分析入門』 シーエーピー出版、2008年
→具体的にデータを分析している過程もあり
2012/05/20 時系列解析の使い方 30 / 32