RとPythonを比較する

RとPythonを比較する
- 機械学習の数理100問シリーズを
2冊ずつ執筆してみて –
2020年 12月19日@ R集会
鈴木讓（大阪大学）

useR 2015 @デンマーク
R集会に参加するきっかけ: 藤野、服部両氏と一緒だった

データサイエンス分野機械学習
35-50歳中心年齢層 25-40歳
大学大学/企業企業
データサイエンス業務機械学習
深層学習
豊富 (S言語時代も) 実績急激にユーザが増加
すぐに使えるプログラム言語オブジェクト指向
Rの問題を改善している

機械学習の数理100問シリーズ (共立出版, Springer)

機械学習の数理100問シリーズ: タイトル発行時期 R Python
統計的機械学習の数理100問 2020年3月4月 ○ ○
スパース推定100問 2020年10月12月 ○ ○
グラフィカルモデルと因果推論100問 2021年 ○ ○
機械学習のためのカーネル100問 2021年 ○ ○
渡辺澄夫ベイズ理論100問未定 ○ ○
統計検定1級100問未定 ○

○○ with Math and R/Python
100 Exercises for Building Logic
(Springer)

スパース推定
2021年1月25日発売2020年10月25日発売
移植に3ヶ月を要した
RとPythonの違い
(今日のメインの話)

Bitbucketにソースプログラム
https://bitbucket.org/prof-joe/workspace/projects/BSC
Prof-joe, bitbucket で検索

線形回帰のLassoとRidge
正則化
最小となる
βを求める L2正則化
(Ridge)
L1正則化
(Lasso)

R言語のNipponMap vs Pythonのjapanmap
三重大谷村先生

Fused Lasso
1次元
グラフ
データの平滑化

glmnet J. Friedman, T. Hastie, R. Tibshirani
Balasubramanian Narasimhan, Kenneth Tay, Noah
Simon, Junyang Qian
R言語 (CRAN) 著者が開発、どの環境でもok
Python
(Stanford)
Linuxのみ
Google Colabやwin (Jupyter Note)で動作しない
scikit-learn 専門家ではなくボランティアが開発
本家のglmnetと違う動作, オプションが異なる
DSや機械学習の研究者だと、論文では怖くて使えない
glasso J. Friedman, T. Hastie, R. Tibshirani
R言語 (CRAN) 著者が開発、どの環境でもok
Python
(Stanford)
Linuxのみ
Google Colabやwin (Jupyter Note)で動作しない
scikit-learn 専門家ではなくボランティアが開発
本家のglassoと違う動作

グラフィカルモデルの同定

むすびにかえて
• 専門的な処理は、専門家が開発したパッケージが安心
• Stanford統計学科をはじめ、データサイエンスではRが強い
• 業務などでは、R/Pythonの両方できるようにするのが普通

予告: 機械学習の数理100問シリーズ
機械学習のためのカーネル
関数解析の基礎がなく、めげる人が多い

RとPythonを比較する

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

Plus de Joe Suzuki

Plus de Joe Suzuki (20)

RとPythonを比較する