Contenu connexe
Similaire à 野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30 (20)
Plus de Shinichi Nakagawa (12)
野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30
- 1. The Art Of
Programming
A Baseball Game!!!
野球Hack!~Pythonを用いたデータ分析と可視化
Shinichi Nakagawa@shinyorke
Kawasaki.rb #28 2015/9/30
- 2. お前だれよ
• Shinichi Nakagawa(36)
• Recruit Sumai Company, Ltd.(入社1年)
• Web Application Engineer(メインはServer Side)
• Agile/Python/Infrastructure as a codeが大好き
• 北海道日本ハムファイターズ
&オークランド・アスレチックスの大ファン
• 中島卓也(日)、ソニー・グレイ(OAK)、ココ・クリスプ(OAK)推し
• “野生の野球アナリスト”活動とかいう伝導活動
- 4. • PyCon JP 2014 Talk Session(去年のやつ)
• MLBオープンデータ分析&可視化サービスをPythonで構築
• はてブ200超え、PV 14,000以上(slideshare)
- 5. • PyCon JP 2014 Lightning Talk(去年のやつ)
• Agileプロセス活用、アダム・ダン率の紹介
• アダム・ダン氏、Python界隈で一番有名なMLB選手に
- 23. Retrosheet is 何?
• メジャーリーグのスコアデータ集
• 1887~2014(昨シーズン)までのデータをCSVで配布 ※
1989以前は欠損有り
• スコアブックで得られる情報(得点、失点、スタメン、打席
結果etc…)と選手情報(名前、ポジションなど)がひと目
でわかる
• http://retrosheet.org/
- 24. やったこと
• Vagrant + AnsibleでMySQL Server構築
• SQLAlchemy + py-retrosheetでmigration
• Jupyter(IPython notebook)とpandasで分析
• matplotlibで可視化
- 28. PY-RETROSHEET - やきうScript
• Retrosheet専用Download&migration script
git@github.com:wellsoliver/py-retrosheet.git
• データ取得からDB(MySQLなど)へのmigrationを一気通貫に行う
• 細々と開発が続いてる(っぽい)
- 31. 松井(2004) VS 松井(2011)
• 外野に飛んだヒットを分類&可視化
• 2004・2011共にセンター~ライトへの打球が多い(センター返しor引っ張り)
• 2011年、本塁打と三塁打が恐ろしく少ないあっ(察し
2004(ヤンキース) 2011(アスレチックス)
- 35. Python + Baseball
• 「野球Hackで迷ったらPython!」
• とはいえ、目的や好みに合わせて言語やFWを選ぶの
大切!
→効率化&自分の武器が増えるという意味で
• 好きなデータを好きな言語でHackすると楽しいよ
(^O^) ※2年連続2回目