Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.
:PyCon mini Hiroshima 2016 開催記念:
PyData でみるサンフレッチェ広島
~ 強いのはカープだけじゃないんだからね・秋 ~
2016-10-31
Takahiro Ikeuchi
Agenda
1st Half : サッカーにおけるデータ とは
ポゼッション? スプリント? 指標 = Stats の紹介
Half Time : PyData の紹介
PyData とは
2nd Half : PyData でみるサンフレッ...
今日のゴール
サッカーのデータ分析を始めるにあたり、データソースの
勘どころをつけられるようになる
PyData ツールのさわりを知る
サンフレッチェ広島の魅力を知る
サンフレッチェ広島の魅力を知る
サンフレッチェ広島の魅力を知る
3
君の名は。 お前誰よ
Takahiro Ikeuchi @iktakahiro
Company / Community
eurie Inc. Founder & CEO
SQUEEZE Inc. Tech Adviser
PyData.Toky...
   
共著本↑
5
eurie Inc.
カスタマーサポート支援クラウドサービス
eurie Desk (https://eurie.io) の開発と運営
パブリック・ベータ提供中
Go言語 4割, TypeScript (React) 4割, Python 2割...
データ分析とわたし- かつては
2011年 ~ 2015年
データ分析コンサルティング企業の技術部門におりまして
AWS 導入事例: 株式会社ALBERT(アルベルト) | AWS
import pytest
def test_who_am_i...
データ分析とわたし- いまでは
メインは Web アプリケーションの開発をしてます
PyData 的には...
サービスで取り扱うデータがテキストメッセージであるため、
テキスト解析がおも
自然言語処理 による重要語抽出などを活用した機能を準備...
広島東洋カープ
リーグ優勝おめでとうございます!
9
本日は サンフレッチェ広島 特集!!
10
なお正装画像は CC BY 4.0 でお使いいただけます
11
広島とわたし
特に縁なし(出身: 神奈川県横浜市)
本日の NG ワード
横浜・F・マリノス
お願い
ピッチ内にものを投げ込まないでください
12
1st Half : サッカーにおけるデータとは
13
サッカーデータ= Stats
14
最も代表的な指標
ゴール数
シュート数
ファール数
警告、退場数
コーナーキック数
フリーキック数
ポゼッション
15
ポゼッションとは
ゲーム時間中、ボールをどの程度保持していたかを示す割合で、
ゲーム支配率とも呼ばれることがある。
一定以上のレベルでは、多くて6割台。7割近くなると相当なワンサイ
ドゲームだったと言える。
ボール保持率を高めてゲームを自分たち...
ポゼッションが高い= 強いチーム?
スペイン代表やクラブチーム・バルセロナのイメージから、
ポゼッションサッカーに対する信仰は根強い
日本国内においては、日本代表が比較的ポゼッションサッカーを
目指しているため、関心が持たれやすい数値の1つにな...
ポゼッションと強さ
必ずしもそうとはいえない
チームのスタイルに依存する = カウンターサッカー
15/18 イングランドプレミアリーグ・レスターシティ
※ 後半で Jリーグのデータを見ます
18
サッカーのデータはチームから個人へ
19
走行距離
選手が1試合を通じてどの程度走ったのかを示す数値。
10km を超えると運動量が多いと言われる。
ポジションによって意味合いが異なる。
サイドバックの場合 : 攻守に渡って貢献している
中盤の場合 : ピッチのさまざまな場所に顔を出し...
スプリント回数
いわゆる「ダッシュ」を何回行ったかという数値。
基準がリーグにより異なる。
Jリーグ 24km/h 以上の走行
イングランド・プレミアリーグ 25.2km/h 以上の走行
21
パス成功率
パス成功数 / パス数
中盤の選手やゲームメイク担当選手の評価によく用いられる。
(母数や状況によるが) 9割を超えていると高い。
22
シュート成功率
ゴール数 / シュート数
Shot on Target (枠内シュート)
ゴール枠を捉えたシュート数 / シュート数
シュート精度の指標として利用される。
23
ほか
セーブ率
PK 阻止率
1対1 勝率
などなど
24
"Stats" を見る
25
欧州サッカーとOpta
Opta Sports
Opta の情報は欧州サッカー中継の解説のなかでも頻繁に引用される
=> リアルタイムでデータ収集と解析が行われている
Web Page : FourFourTwo - Stats ZONE
Ap...
27
28
公式サイトでも Stats を閲覧可
Bundesliga - Matchday 8 | FCインゴルシュタット04 - ボルシア・
ドルトムント
29
https://www.premierleague.com/match/14137
30
Shinji Okazaki Statistics | Premier League
31
Valencia Club de Fútbol SAD | Team of LaLiga Santander
32
そろそろ PyData を使ってデータを見てみましょう
33
※ Notebook へ
http://nbviewer.jupyter.org/github/iktakahiro
/football-hack/blob/develop/bpstudy-
110/EuropeSoccerAnalytics....
1st Half のまとめ
サッカーのデータ = Stats は個人データまで収集、利用されるように
なってきている
欧州サッカーデータを見る・知るには Opta にお世話になる
サッカーはゴールの入らない酢ポート
ゴールの分布はポアソン分布
...
Half Time : PyData とは
36
PyData とは
データ分析やデータ活用に Python ならびに Python Library を
利用しようという人類の営みの総称
http://pydata.org/
37
PyData Conferences
October 7-9, 2016 WASHINGTON DC
August 26-28, 2016 CHICAGO
June 14-15, 2016 PARIS
May 6-8, 2016 LONDON ...
Sessions
Bayesian Network Modeling using R and Python
Open Data Dashboards & Python Web Scraping
Data Transformation: A Fr...
PyData Libraries
行列計算 : NumPy - http://www.numpy.org/
科学計算 : SciPy - https://www.scipy.org/
データ処理 : pandas - http://pandas...
今回利用しているおもなライブラリ / ツール
実行環境 : Jupyter Notebook - http://jupyter.org/
データ処理 : pandas
可視化 : Bokeh - http://bokeh.pydata.org/...
42
43
Half Time のまとめ
PyData は Python + Data の人類の営み
世界的に PyData Conference が開催されているよ!
PyData.Tokyo もよろしく (・ω<)
Python は伝統的に分析系ツール...
2nd half : PyData でみるサンフレッチェ広島
45
サンフレッチェ広島とは
46
http://www.sanfrecce.co.jp/club/
47
サンフレッチェ広島
ホームタウン : 広島県広島市
三 + frecce (イタリア語で矢) => 三本の矢
1992年 Jリーグ発足時の10チームのうちの1つ
前身は東洋工業 (現マツダ) サッカー部
48
J1 年間優勝3回(2012年, 2013年, 2015年)
天皇杯 準優勝1回
49
著名な在籍選手
佐藤 寿人
浅野 琢磨(現日本代表)
森崎 浩司/和幸
槙野 智章 (現日本代表)
柏木 陽介 (現日本代表)
西川 周作 (現日本代表)
青山 敏弘
など
50
主力級移籍の歴史
2008年 駒野 友一 => ジュビロ磐田
2009年 柏木 陽介 => 浦和レッズ
2012年 李 忠成 => 同上
2012年 槙野 智章 => (※ FCケルン経由) => 同上
2013年 森脇 良太 => 同上
20...
そこはかとなく ただよう 既視感
52
2012年 ペトロヴィッチ監督 => 浦和レッズ
53
_人人人人人人人人人人人_
> ペトロヴィッチ監督 <
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄
54
とはいえ移籍はつきものですし、サンフレッチェ広島も
下位チームから有力選手を積極的に獲得したりしているので
55
なんかちょっと特定のチーム多いなーと思うだけで
(他|悪|敵)意はありません
56
(・ω<)
57
特集: 佐藤寿人
58
佐藤 寿人 とは
ポジション : FW
身長 : 170cm
出身 : 1982年3月12日 埼玉県春日部市
利き足 : 左
憧れの選手 : Filippo Inzaghi
59
佐藤 寿人 とは
歴代通算 J1リーグ得点数 : 2位 (161点)
(1位 大久保 嘉人, 3位 中山 雅史)
J1ハットトリック : 6回
J1リーグ得点王 : 1回 (2012年)
J1リーグ MVP : 1回 (2012年)
10年連続...
そろそろ PyData を使ってデータを見てみましょう
61
……の前にJリーグのStats について
62
JリーグのStats
Football LAB(フットボールラボ)とは | Football LAB ~サッカー
をデータで楽しむ~
J. League Data Site
Stats Stadium | 試合分析
63
J. League Data Site
https://data.j-league.or.jp/SFTD09/search?
selectFlag=3&competition_frames=1&competition_year_from=200...
Football LAB
65
※ Notebook へ
http://nbviewer.jupyter.org/github/iktakahiro
/football-hack/blob/develop/bpstudy-
110/J1SoccerAnalytics.ipyn...
2nd Half のまとめ
寿人ーーーーーーーーッ!!!!
2010年~ のサンフレッチェ広島はとても強い (優勝 3回)
広島県は選手育成力が高い(???)
67
強いのはカープだけじゃないんだからねっ
(タイトル回収)
68
Additional Time
69
推薦図書
70
Prochain SlideShare
Chargement dans…5
×

PyData で見るサンフレッチェ広島 〜 強いのはカープだけじゃないんだからね・秋 〜

6 190 vues

Publié le

BPStudy #110 (http://bpstudy.connpass.com/event/40354/) のトークで利用した資料です

前半では、サッカーリーグのデータ = Stats とはどのようなものか、という初歩的な内容にはじまり、欧州サッカーリーグの stats をどこで閲覧できるか、といった内容や、手軽に利用できるデータソースを元に、データの可視化を行います。

後半では、サンフレッチェ広島にフォーカスをあてつつ、日本の Jリーグの stats を利用してデータを見ていきます。

Publié dans : Sports
  • Soyez le premier à commenter

PyData で見るサンフレッチェ広島 〜 強いのはカープだけじゃないんだからね・秋 〜

  1. 1. :PyCon mini Hiroshima 2016 開催記念: PyData でみるサンフレッチェ広島 ~ 強いのはカープだけじゃないんだからね・秋 ~ 2016-10-31 Takahiro Ikeuchi
  2. 2. Agenda 1st Half : サッカーにおけるデータ とは ポゼッション? スプリント? 指標 = Stats の紹介 Half Time : PyData の紹介 PyData とは 2nd Half : PyData でみるサンフレッチェ広島 チームの魅力 特集:佐藤寿人 Additional Time : 質疑応答 2
  3. 3. 今日のゴール サッカーのデータ分析を始めるにあたり、データソースの 勘どころをつけられるようになる PyData ツールのさわりを知る サンフレッチェ広島の魅力を知る サンフレッチェ広島の魅力を知る サンフレッチェ広島の魅力を知る 3
  4. 4. 君の名は。 お前誰よ Takahiro Ikeuchi @iktakahiro Company / Community eurie Inc. Founder & CEO SQUEEZE Inc. Tech Adviser PyData.Tokyo Organizer Specialties (or just a dabbler :-D Go lang, Python, React.js, TypeScript Cloud Infrastructure, UI Design etc... 4
  5. 5.     共著本↑ 5
  6. 6. eurie Inc. カスタマーサポート支援クラウドサービス eurie Desk (https://eurie.io) の開発と運営 パブリック・ベータ提供中 Go言語 4割, TypeScript (React) 4割, Python 2割 くらい イルカのロゴがかわいい。 6
  7. 7. データ分析とわたし- かつては 2011年 ~ 2015年 データ分析コンサルティング企業の技術部門におりまして AWS 導入事例: 株式会社ALBERT(アルベルト) | AWS import pytest def test_who_am_i(): actual = who_am_i() assert actual != "Data Scientist" expect = "Software Engineer & Architect" assert actual == expect # ??? 7
  8. 8. データ分析とわたし- いまでは メインは Web アプリケーションの開発をしてます PyData 的には... サービスで取り扱うデータがテキストメッセージであるため、 テキスト解析がおも 自然言語処理 による重要語抽出などを活用した機能を準備中 8
  9. 9. 広島東洋カープ リーグ優勝おめでとうございます! 9
  10. 10. 本日は サンフレッチェ広島 特集!! 10
  11. 11. なお正装画像は CC BY 4.0 でお使いいただけます 11
  12. 12. 広島とわたし 特に縁なし(出身: 神奈川県横浜市) 本日の NG ワード 横浜・F・マリノス お願い ピッチ内にものを投げ込まないでください 12
  13. 13. 1st Half : サッカーにおけるデータとは 13
  14. 14. サッカーデータ= Stats 14
  15. 15. 最も代表的な指標 ゴール数 シュート数 ファール数 警告、退場数 コーナーキック数 フリーキック数 ポゼッション 15
  16. 16. ポゼッションとは ゲーム時間中、ボールをどの程度保持していたかを示す割合で、 ゲーム支配率とも呼ばれることがある。 一定以上のレベルでは、多くて6割台。7割近くなると相当なワンサイ ドゲームだったと言える。 ボール保持率を高めてゲームを自分たちのペースで運ぶ戦略 => ポゼッションサッカー 16
  17. 17. ポゼッションが高い= 強いチーム? スペイン代表やクラブチーム・バルセロナのイメージから、 ポゼッションサッカーに対する信仰は根強い 日本国内においては、日本代表が比較的ポゼッションサッカーを 目指しているため、関心が持たれやすい数値の1つになっている 17
  18. 18. ポゼッションと強さ 必ずしもそうとはいえない チームのスタイルに依存する = カウンターサッカー 15/18 イングランドプレミアリーグ・レスターシティ ※ 後半で Jリーグのデータを見ます 18
  19. 19. サッカーのデータはチームから個人へ 19
  20. 20. 走行距離 選手が1試合を通じてどの程度走ったのかを示す数値。 10km を超えると運動量が多いと言われる。 ポジションによって意味合いが異なる。 サイドバックの場合 : 攻守に渡って貢献している 中盤の場合 : ピッチのさまざまな場所に顔を出している 攻撃的選手の場合 : 守備への貢献が大きい 20
  21. 21. スプリント回数 いわゆる「ダッシュ」を何回行ったかという数値。 基準がリーグにより異なる。 Jリーグ 24km/h 以上の走行 イングランド・プレミアリーグ 25.2km/h 以上の走行 21
  22. 22. パス成功率 パス成功数 / パス数 中盤の選手やゲームメイク担当選手の評価によく用いられる。 (母数や状況によるが) 9割を超えていると高い。 22
  23. 23. シュート成功率 ゴール数 / シュート数 Shot on Target (枠内シュート) ゴール枠を捉えたシュート数 / シュート数 シュート精度の指標として利用される。 23
  24. 24. ほか セーブ率 PK 阻止率 1対1 勝率 などなど 24
  25. 25. "Stats" を見る 25
  26. 26. 欧州サッカーとOpta Opta Sports Opta の情報は欧州サッカー中継の解説のなかでも頻繁に引用される => リアルタイムでデータ収集と解析が行われている Web Page : FourFourTwo - Stats ZONE App Store : Stats Zone: Live scores & soccer statistics 26
  27. 27. 27
  28. 28. 28
  29. 29. 公式サイトでも Stats を閲覧可 Bundesliga - Matchday 8 | FCインゴルシュタット04 - ボルシア・ ドルトムント 29
  30. 30. https://www.premierleague.com/match/14137 30
  31. 31. Shinji Okazaki Statistics | Premier League 31
  32. 32. Valencia Club de Fútbol SAD | Team of LaLiga Santander 32
  33. 33. そろそろ PyData を使ってデータを見てみましょう 33
  34. 34. ※ Notebook へ http://nbviewer.jupyter.org/github/iktakahiro /football-hack/blob/develop/bpstudy- 110/EuropeSoccerAnalytics.ipynb 34
  35. 35. 1st Half のまとめ サッカーのデータ = Stats は個人データまで収集、利用されるように なってきている 欧州サッカーデータを見る・知るには Opta にお世話になる サッカーはゴールの入らない酢ポート ゴールの分布はポアソン分布 35
  36. 36. Half Time : PyData とは 36
  37. 37. PyData とは データ分析やデータ活用に Python ならびに Python Library を 利用しようという人類の営みの総称 http://pydata.org/ 37
  38. 38. PyData Conferences October 7-9, 2016 WASHINGTON DC August 26-28, 2016 CHICAGO June 14-15, 2016 PARIS May 6-8, 2016 LONDON etc... 38
  39. 39. Sessions Bayesian Network Modeling using R and Python Open Data Dashboards & Python Web Scraping Data Transformation: A Framework for Exploratory Data Analysis Python + Data にまつわるさまざまな Presentation や Tutorial が 行われている 39
  40. 40. PyData Libraries 行列計算 : NumPy - http://www.numpy.org/ 科学計算 : SciPy - https://www.scipy.org/ データ処理 : pandas - http://pandas.pydata.org/ データ可視可 : matplotlib - http://matplotlib.org/ 機械学習 : scikit-learn - http://scikit-learn.org/ 深層学習 : Tensor ow - https://www.tensor ow.org/ 深層学習 : Keras https://keras.io/ 40
  41. 41. 今回利用しているおもなライブラリ / ツール 実行環境 : Jupyter Notebook - http://jupyter.org/ データ処理 : pandas 可視化 : Bokeh - http://bokeh.pydata.org/en/latest/ Python 環境 : Anaconda - https://www.continuum.io/anaconda- overview 41
  42. 42. 42
  43. 43. 43
  44. 44. Half Time のまとめ PyData は Python + Data の人類の営み 世界的に PyData Conference が開催されているよ! PyData.Tokyo もよろしく (・ω<) Python は伝統的に分析系ツールが充実していた 深層学習のニーズ拡大や Tensor ow の登場により 一層の Commodity 化が進んでいる 44
  45. 45. 2nd half : PyData でみるサンフレッチェ広島 45
  46. 46. サンフレッチェ広島とは 46
  47. 47. http://www.sanfrecce.co.jp/club/ 47
  48. 48. サンフレッチェ広島 ホームタウン : 広島県広島市 三 + frecce (イタリア語で矢) => 三本の矢 1992年 Jリーグ発足時の10チームのうちの1つ 前身は東洋工業 (現マツダ) サッカー部 48
  49. 49. J1 年間優勝3回(2012年, 2013年, 2015年) 天皇杯 準優勝1回 49
  50. 50. 著名な在籍選手 佐藤 寿人 浅野 琢磨(現日本代表) 森崎 浩司/和幸 槙野 智章 (現日本代表) 柏木 陽介 (現日本代表) 西川 周作 (現日本代表) 青山 敏弘 など 50
  51. 51. 主力級移籍の歴史 2008年 駒野 友一 => ジュビロ磐田 2009年 柏木 陽介 => 浦和レッズ 2012年 李 忠成 => 同上 2012年 槙野 智章 => (※ FCケルン経由) => 同上 2013年 森脇 良太 => 同上 2014年 西川 周作 => 同上 51
  52. 52. そこはかとなく ただよう 既視感 52
  53. 53. 2012年 ペトロヴィッチ監督 => 浦和レッズ 53
  54. 54. _人人人人人人人人人人人_ > ペトロヴィッチ監督 <  ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄ 54
  55. 55. とはいえ移籍はつきものですし、サンフレッチェ広島も 下位チームから有力選手を積極的に獲得したりしているので 55
  56. 56. なんかちょっと特定のチーム多いなーと思うだけで (他|悪|敵)意はありません 56
  57. 57. (・ω<) 57
  58. 58. 特集: 佐藤寿人 58
  59. 59. 佐藤 寿人 とは ポジション : FW 身長 : 170cm 出身 : 1982年3月12日 埼玉県春日部市 利き足 : 左 憧れの選手 : Filippo Inzaghi 59
  60. 60. 佐藤 寿人 とは 歴代通算 J1リーグ得点数 : 2位 (161点) (1位 大久保 嘉人, 3位 中山 雅史) J1ハットトリック : 6回 J1リーグ得点王 : 1回 (2012年) J1リーグ MVP : 1回 (2012年) 10年連続 J1二桁得点 (記録保持者) 出典 : https://ja.wikipedia.org/wiki/佐藤寿人, http://www.jleague.jp/club/hiroshima/player/detail/2709/ 60
  61. 61. そろそろ PyData を使ってデータを見てみましょう 61
  62. 62. ……の前にJリーグのStats について 62
  63. 63. JリーグのStats Football LAB(フットボールラボ)とは | Football LAB ~サッカー をデータで楽しむ~ J. League Data Site Stats Stadium | 試合分析 63
  64. 64. J. League Data Site https://data.j-league.or.jp/SFTD09/search? selectFlag=3&competition_frames=1&competition_year_from=200 5&competition_year_to=2015&player_name= 64
  65. 65. Football LAB 65
  66. 66. ※ Notebook へ http://nbviewer.jupyter.org/github/iktakahiro /football-hack/blob/develop/bpstudy- 110/J1SoccerAnalytics.ipynb 66
  67. 67. 2nd Half のまとめ 寿人ーーーーーーーーッ!!!! 2010年~ のサンフレッチェ広島はとても強い (優勝 3回) 広島県は選手育成力が高い(???) 67
  68. 68. 強いのはカープだけじゃないんだからねっ (タイトル回収) 68
  69. 69. Additional Time 69
  70. 70. 推薦図書 70

×