Soumettre la recherche
Mettre en ligne
simputatoinで欠損値補完 - Tokyo.R #65
•
2 j'aime
•
5,749 vues
Atsushi Hayakawa
Suivre
simputatoinで欠損値補完
Lire moins
Lire la suite
Technologie
Signaler
Partager
Signaler
Partager
1 sur 21
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
ライントレースで役立った「キュー」の話し
ライントレースで役立った「キュー」の話し
noanoa07
みどりぼん読書会 第4章
みどりぼん読書会 第4章
Masanori Takano
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Atsushi Hayakawa
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
Atsushi Hayakawa
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
Atsushi Hayakawa
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
Atsushi Hayakawa
バンクーバー旅行記
バンクーバー旅行記
Atsushi Hayakawa
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Atsushi Hayakawa
Recommandé
ライントレースで役立った「キュー」の話し
ライントレースで役立った「キュー」の話し
noanoa07
みどりぼん読書会 第4章
みどりぼん読書会 第4章
Masanori Takano
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Atsushi Hayakawa
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
Atsushi Hayakawa
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
Atsushi Hayakawa
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
Atsushi Hayakawa
バンクーバー旅行記
バンクーバー旅行記
Atsushi Hayakawa
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Atsushi Hayakawa
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
Atsushi Hayakawa
useR!2017 in Brussels
useR!2017 in Brussels
Atsushi Hayakawa
Japan.R 2016の運営
Japan.R 2016の運営
Atsushi Hayakawa
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Atsushi Hayakawa
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Atsushi Hayakawa
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
Atsushi Hayakawa
gepuro task views
gepuro task views
Atsushi Hayakawa
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
Atsushi Hayakawa
イケてる分析基盤をつくる
イケてる分析基盤をつくる
Atsushi Hayakawa
らずぱいラジコン
らずぱいラジコン
Atsushi Hayakawa
らずぱいカー
らずぱいカー
Atsushi Hayakawa
らずぱいでウィーン!!!!!
らずぱいでウィーン!!!!!
Atsushi Hayakawa
赤外線カメラでストリーミング配信
赤外線カメラでストリーミング配信
Atsushi Hayakawa
「Japan.R開催のお知らせ」と「Rでワンライナー」
「Japan.R開催のお知らせ」と「Rでワンライナー」
Atsushi Hayakawa
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
みどりぼん第11回 前半
みどりぼん第11回 前半
Atsushi Hayakawa
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
Contenu connexe
Plus de Atsushi Hayakawa
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
Atsushi Hayakawa
useR!2017 in Brussels
useR!2017 in Brussels
Atsushi Hayakawa
Japan.R 2016の運営
Japan.R 2016の運営
Atsushi Hayakawa
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Atsushi Hayakawa
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Atsushi Hayakawa
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
Atsushi Hayakawa
gepuro task views
gepuro task views
Atsushi Hayakawa
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
Atsushi Hayakawa
イケてる分析基盤をつくる
イケてる分析基盤をつくる
Atsushi Hayakawa
らずぱいラジコン
らずぱいラジコン
Atsushi Hayakawa
らずぱいカー
らずぱいカー
Atsushi Hayakawa
らずぱいでウィーン!!!!!
らずぱいでウィーン!!!!!
Atsushi Hayakawa
赤外線カメラでストリーミング配信
赤外線カメラでストリーミング配信
Atsushi Hayakawa
「Japan.R開催のお知らせ」と「Rでワンライナー」
「Japan.R開催のお知らせ」と「Rでワンライナー」
Atsushi Hayakawa
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
みどりぼん第11回 前半
みどりぼん第11回 前半
Atsushi Hayakawa
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
Plus de Atsushi Hayakawa
(20)
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
useR!2017 in Brussels
useR!2017 in Brussels
Japan.R 2016の運営
Japan.R 2016の運営
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
gepuro task views
gepuro task views
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
イケてる分析基盤をつくる
イケてる分析基盤をつくる
らずぱいラジコン
らずぱいラジコン
らずぱいカー
らずぱいカー
らずぱいでウィーン!!!!!
らずぱいでウィーン!!!!!
赤外線カメラでストリーミング配信
赤外線カメラでストリーミング配信
「Japan.R開催のお知らせ」と「Rでワンライナー」
「Japan.R開催のお知らせ」と「Rでワンライナー」
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
みどりぼん第11回 前半
みどりぼん第11回 前半
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Dernier
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
Dernier
(11)
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
simputatoinで欠損値補完 - Tokyo.R #65
1.
simputationで 欠損値補完 第65回R勉強会@東京 1 @gepuro
2.
自己紹介 • @gepuro • 本業:ネット広告の分析 •
副業:Hoxo-M Inc. • 趣味: サッカー,トライアスロン • 著書 2
3.
{simputation} • 欠損値補完を良い感じにやってく れるパッケージ 3
4.
データ例 4
5.
データの作り方 5
6.
重回帰分析で補完 6
7.
補完後 7
8.
解説 • Sepal.Length を
Sepal.Width と Speciesで重回帰する • 説明変数のいずれも欠損してない 場合にSepal.Lengthを重回帰で欠 損値補完する 8 impute_lm(dat, Sepal.Length ~ Sepal.Width + Species)
9.
表で理解 Sepal.Length(目的変数) Sepal.Width Species NA
3.5 setosa NA NA setosa NA 3.0 NA 9 impute_lm(dat, Sepal.Length ~ Sepal.Width + Species) 補完できる 補完できない 補完できない
10.
Q. 補完できな場合は? 10 A. 説明変数を減らす
11.
表で理解 Sepal.Length(目的変数) Sepal.Width Species NA
3.5 setosa NA NA setosa NA 3.0 NA 11 impute_lm(dat, Sepal.Length ~ Sepal.Width) 補完できる 補完できない 補完できる
12.
中央値での補完 12
13.
複数パターンの欠損の場合 13 %>%でつなげる。{dplyr}の利用
14.
impute_ほげほげ • impute_cart • impute_const •
impute_em • impute_en • impute_knn • impute_lm • impute_median 14 • impute_mf • impute_pmm • impute_proxy • impute_rf • impute_rhd • impute_rlm • impute_shd
15.
%>% の 代わりに
%>>% を使う 補完のロギング • 欠損値をどのように補完したかを 振り返るようにする 15 {lumberjack}の利用
16.
cellwise.csv に保存される サンプルコード 16
17.
cellwise.csv 項目名 意味 中身 Step
? 1 Time 実行時刻 2017-09-23 15:14:07 JST Expression 補完に利用したメソッド impute_lm(Sepal.Length ~ Sepal.Width + Species) Key cellwise$new(key=“id”) で指定したkey 1 Variable 変数名 Sepal.Length Old 変更前 NA new 変更後 5.07657863284595 17
18.
{simputation}で 快適な欠損値補完 ライフを 18
19.
参考 • http://schd.ws/hosted_files/user2017 /e8/user2017markvanderloo.pdf • https://github.com/markvanderloo/si mputation •
https://cran.r- project.org/web/packages/simputati on/vignettes/intro.html 19
20.
告知 20
21.
Japan.R 2017 • 運営メンバーの募集 •
https://r-wakalang.slack.com – #japan-r で開催準備をしてます • 気軽に覗いてください!! 21 2017年12月2日 開催決定
Télécharger maintenant