Soumettre la recherche
Mettre en ligne
TokyoR79 beginnerssession1
•
0 j'aime
•
414 vues
K
kotora_0507
Suivre
TokyoR#79の初心者セッション1の資料です。
Lire moins
Lire la suite
Technologie
Affichage du diaporama
Signaler
Partager
Affichage du diaporama
Signaler
Partager
1 sur 31
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
Sendai r01 beginnerssession1
Sendai r01 beginnerssession1
kotora_0507
Juliaで前処理
Juliaで前処理
weda654
続・わかりやすいパターン認識_3章
続・わかりやすいパターン認識_3章
weda654
Rとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.R
Takashi Minoda
Tokyo r80 beginnerssession1
Tokyo r80 beginnerssession1
kotora_0507
TokyoR101_BeginnersSession2.pdf
TokyoR101_BeginnersSession2.pdf
kotora_0507
TokyoR101_BeginnersSession1.pdf
TokyoR101_BeginnersSession1.pdf
kotora_0507
TokyoR98_BeginnersSession1.pdf
TokyoR98_BeginnersSession1.pdf
kotora_0507
Recommandé
Sendai r01 beginnerssession1
Sendai r01 beginnerssession1
kotora_0507
Juliaで前処理
Juliaで前処理
weda654
続・わかりやすいパターン認識_3章
続・わかりやすいパターン認識_3章
weda654
Rとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.R
Takashi Minoda
Tokyo r80 beginnerssession1
Tokyo r80 beginnerssession1
kotora_0507
TokyoR101_BeginnersSession2.pdf
TokyoR101_BeginnersSession2.pdf
kotora_0507
TokyoR101_BeginnersSession1.pdf
TokyoR101_BeginnersSession1.pdf
kotora_0507
TokyoR98_BeginnersSession1.pdf
TokyoR98_BeginnersSession1.pdf
kotora_0507
リクルートライフスタイルの売上を支える共通分析基盤
リクルートライフスタイルの売上を支える共通分析基盤
Yu Yamada
リクルートライフスタイルの売上を支える共通分析基盤
リクルートライフスタイルの売上を支える共通分析基盤
Recruit Lifestyle Co., Ltd.
Rをはじめからていねいに
Rをはじめからていねいに
Tsukasa Fukunaga
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
BrainPad Inc.
研究・企業・生き方について 情報科学若手の会2011
研究・企業・生き方について 情報科学若手の会2011
Preferred Networks
neural network introduction yapc asia tokyo
neural network introduction yapc asia tokyo
Daichi Morifuji
tut_pfi_2012
tut_pfi_2012
Preferred Networks
なめるな!plot
なめるな!plot
itoyan110
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
Recruit Lifestyle Co., Ltd.
アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出
Shintaro Fukushima
Tokyo r94 beginnerssession3
Tokyo r94 beginnerssession3
kotora_0507
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
Preferred Networks
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
TokyoR102_BeginnersSession.pdf
TokyoR102_BeginnersSession.pdf
kotora_0507
ロジカルコミュニケーション力養成・実践講座
ロジカルコミュニケーション力養成・実践講座
Yusuke Kuroda
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
Core Concept Technologies
コンピュータの舞台裏 Vol.08 - 身近な事例からひも解く人工知能
コンピュータの舞台裏 Vol.08 - 身近な事例からひも解く人工知能
TATSUYA HAYAMIZU
データ分析スクリプトのツール化入門 - PyConJP 2016
データ分析スクリプトのツール化入門 - PyConJP 2016
Akinori Kohno
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
Kanji Takahashi
Reinvent first-participation-report
Reinvent first-participation-report
j3miyake
Beginners session2 in TokyoR69
Beginners session2 in TokyoR69
kotora_0507
Beginners session2 68
Beginners session2 68
kotora_0507
Contenu connexe
Similaire à TokyoR79 beginnerssession1
リクルートライフスタイルの売上を支える共通分析基盤
リクルートライフスタイルの売上を支える共通分析基盤
Yu Yamada
リクルートライフスタイルの売上を支える共通分析基盤
リクルートライフスタイルの売上を支える共通分析基盤
Recruit Lifestyle Co., Ltd.
Rをはじめからていねいに
Rをはじめからていねいに
Tsukasa Fukunaga
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
BrainPad Inc.
研究・企業・生き方について 情報科学若手の会2011
研究・企業・生き方について 情報科学若手の会2011
Preferred Networks
neural network introduction yapc asia tokyo
neural network introduction yapc asia tokyo
Daichi Morifuji
tut_pfi_2012
tut_pfi_2012
Preferred Networks
なめるな!plot
なめるな!plot
itoyan110
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
Recruit Lifestyle Co., Ltd.
アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出
Shintaro Fukushima
Tokyo r94 beginnerssession3
Tokyo r94 beginnerssession3
kotora_0507
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
Preferred Networks
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
TokyoR102_BeginnersSession.pdf
TokyoR102_BeginnersSession.pdf
kotora_0507
ロジカルコミュニケーション力養成・実践講座
ロジカルコミュニケーション力養成・実践講座
Yusuke Kuroda
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
Core Concept Technologies
コンピュータの舞台裏 Vol.08 - 身近な事例からひも解く人工知能
コンピュータの舞台裏 Vol.08 - 身近な事例からひも解く人工知能
TATSUYA HAYAMIZU
データ分析スクリプトのツール化入門 - PyConJP 2016
データ分析スクリプトのツール化入門 - PyConJP 2016
Akinori Kohno
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
Kanji Takahashi
Reinvent first-participation-report
Reinvent first-participation-report
j3miyake
Similaire à TokyoR79 beginnerssession1
(20)
リクルートライフスタイルの売上を支える共通分析基盤
リクルートライフスタイルの売上を支える共通分析基盤
リクルートライフスタイルの売上を支える共通分析基盤
リクルートライフスタイルの売上を支える共通分析基盤
Rをはじめからていねいに
Rをはじめからていねいに
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
研究・企業・生き方について 情報科学若手の会2011
研究・企業・生き方について 情報科学若手の会2011
neural network introduction yapc asia tokyo
neural network introduction yapc asia tokyo
tut_pfi_2012
tut_pfi_2012
なめるな!plot
なめるな!plot
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
アクションマイニングを用いた最適なアクションの導出
アクションマイニングを用いた最適なアクションの導出
Tokyo r94 beginnerssession3
Tokyo r94 beginnerssession3
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
TokyoR102_BeginnersSession.pdf
TokyoR102_BeginnersSession.pdf
ロジカルコミュニケーション力養成・実践講座
ロジカルコミュニケーション力養成・実践講座
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
コンピュータの舞台裏 Vol.08 - 身近な事例からひも解く人工知能
コンピュータの舞台裏 Vol.08 - 身近な事例からひも解く人工知能
データ分析スクリプトのツール化入門 - PyConJP 2016
データ分析スクリプトのツール化入門 - PyConJP 2016
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
Reinvent first-participation-report
Reinvent first-participation-report
Plus de kotora_0507
Beginners session2 in TokyoR69
Beginners session2 in TokyoR69
kotora_0507
Beginners session2 68
Beginners session2 68
kotora_0507
Tokyo rの運営方針 2017
Tokyo rの運営方針 2017
kotora_0507
TokyoR58 初心者セッション
TokyoR58 初心者セッション
kotora_0507
TokyoR #57 初心者セッション
TokyoR #57 初心者セッション
kotora_0507
TokyoR#53初心者セッション
TokyoR#53初心者セッション
kotora_0507
Plus de kotora_0507
(6)
Beginners session2 in TokyoR69
Beginners session2 in TokyoR69
Beginners session2 68
Beginners session2 68
Tokyo rの運営方針 2017
Tokyo rの運営方針 2017
TokyoR58 初心者セッション
TokyoR58 初心者セッション
TokyoR #57 初心者セッション
TokyoR #57 初心者セッション
TokyoR#53初心者セッション
TokyoR#53初心者セッション
Dernier
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
Dernier
(9)
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
TokyoR79 beginnerssession1
1.
初心者セッション1 - Rスタートアップ- Tokyo.R #79 @kotatyamtema 1
2.
自己紹介 TwitterID : @kotatyamtema 大学での専門:
行動生態学 立案 捕獲 実験 分析までワンオペ 論文で上皇陛下の論文を引用しました 今まで : 客先ぼっち分析屋→アパレル通販会社 現在 : new医療検査会社! R歴 : 10年過ぎたかも?永遠の初心者 近況 : 引越しの荷物がまだ片付かない… 久々のR&D/アカデミア寄りの部署で 脳の衰えを自覚する日々…
3.
目的 Rとは何かの大雑把な理解と Rを使うための環境設定が できるようにする Rで扱うデータの種類の理解と 外部データの取り込みが できるようにする
4.
目次 1. Rとは何か 2. Rを使う環境設定 3.
packageによる機能拡張 4. データ型とデータ構造 5. 外部データのinput方法の紹介 6. データのoutput方法の紹介
5.
MENU 1. Rとは何か 2. Rを使うための環境設定 -
RとRStudioのインストール 3. Rの機能拡張 - Packageの取り込みと呼び出し 4. データ型とデータ構造 -データ型:数値型、文字型、ファクター型 -データ構造:ベクトル、データフレーム、リスト 5. 外部データのImput方法 - table形式 - その他 6. 結果のoutput方法 - dataframe形式 - 画像形式
6.
MENU 1. Rとは何か 2. Rを使うための環境設定 -
RとRStudioのインストール 3. Rの機能拡張 - Packageの取り込みと呼び出し 4. データ型とデータ構造 -データ型:数値型、文字型、ファクター型 -データ構造:ベクトル、データフレーム、リスト 5. 外部データのImput方法 - table形式 - その他 6. 結果のoutput方法 - dataframe形式 - 画像形式
7.
Rとは何か 統計学のために特化したプログラム 及び開発環境 - データの読み込み - 前処理 -
基礎集計 - 統計解析 - 可視化 これらが簡単にできるように設計
8.
MENU 1. Rとは何か 2. Rを使うための環境設定 -
RとRStudioのインストール 3. Rの機能拡張 - Packageの取り込みと呼び出し 4. データ型とデータ構造 -データ型:数値型、文字型、ファクター型 -データ構造:ベクトル、データフレーム、リスト 5. 外部データのImput方法 - table形式 - その他 6. 結果のoutput方法 - dataframe形式 - 画像形式
9.
Rを使うための環境設定 R本体のインストール CRAN(Comprehensive R Archive
Network) ・CRANとは: 公式の本体及びパッケージ配信用Webサイト Mac環境の場合はhomebrewでもインストール可 homebrewのHP(https://brew.sh/index_ja)
10.
Rを使うための環境設定 おすすめIDE(統合開発環境)はRStudio RStudio Mac環境の場合はhomebrew caskでもインストール可 RStudioとは: その名もRStudio社が提供するRに特化した 開発プラットホーム RmarkdownやShiny、DWHとの連携がスムース コーディング中にサジェストや補完機能が充実
11.
MENU 1. Rとは何か 2. Rを使うための環境設定 -
RとRStudioのインストール 3. Rの機能拡張 - Packageの取り込みと呼び出し 4. データ型とデータ構造 -データ型:数値型、文字型、ファクター型 -データ構造:ベクトル、データフレーム、リスト 5. 外部データのImput方法 - table形式 - その他 6. 結果のoutput方法 - dataframe形式 - 画像形式
12.
Rの機能拡張 package を追加することで簡単に機能拡張ができる - 世界中で開発されていて便利な手法がすぐ使える -
デモ実行のためのサンプルデータも使える R公式のpackage集 - CRAN - https://cran.ism.ac.jp/ githubに公開されている個人作成package - こちらは自己責任で
13.
packageの追加 packageの追加方法 1. RStudioのPackagesタブを使う 2. install.package関数を自分で書く 今回の範囲 ・オンラインでCRANからインストール *オフラインでインストールする場合は下記参照 http://datasciesotist.hatenablog.jp/entry/2015/03/24/004539 ・miniCRANパッケージが必要なので最初はオンラインで 注意点 ・依存packageを一緒にインストールすること
14.
packageの追加 packageの追加方法 1. RStudioのPackagesタブを使う - Repository(CRAN)にチェック -
インストールしたいpackage名を入力 - installを押す チェックを 外さないこと
15.
packageの追加 packageの追加方法 2. install.package関数を自分で書く - 複数インストールする時はc()で囲む -
依存packageのうちSuggestsまでインストールする時は dependencise = TRUE を追加 Example install.pakcages(c( readr , data.table ), dependencies = TRUE) 参照: https://stats.biopapyrus.jp/r/basic/package.html
16.
packageの呼び出し 使う時には library() or
require() で環境に呼び出す > library(dplyr) or require(dplyr) 何が違うか? - packageがインストールされていなかった場合の挙動 ・library():packgeないよとエラー出して終了 実はlibrary(., logical.return = TRUE)だと require()と同じ挙動 ・require():packageがあると TRUE 、ないと FALSE を返す 参照: https://stackoverflow.com/questions/5595512/what-is-the- difference-between-require-and-library
17.
if(require(tidyr)){ print(paste0("tidyr", " is
loaded correctly")) } else { print("trying to install tidyr") install.packages(tidyr) if(require(tidyr)){ print("tidyr installed and loaded") } else { stop("could not install tidyr") } }
18.
MENU 1. Rとは何か 2. Rを使うための環境設定 -
RとRStudioのインストール 3. Rの機能拡張 - Packageの取り込みと呼び出し 4. データ型とデータ構造 -データ型:数値型、文字型、ファクター型 -データ構造:ベクトル、データフレーム、リスト 5. 外部データのImput方法 - table形式 - その他 6. 結果のoutput方法 - dataframe形式 - 画像形式
19.
データ型とデータ構造 データ型とはRが区別しているデータの扱い - Rでは大雑把に以下の3つの区分 1.数値型 - numeric:四則演算ができ大小関係がある 2.文字型 -
character: で囲んで表現 3.因子(ファクター)型 - factor:文字の裏に順序が定義してあるもの それぞれ is.**** で確認、 as.**** で変換
20.
データ型とデータ構造 データ構造とは - Rでは大雑把に以下の3つの区分 1.ベクトル型 - 同じデータ型をまとめた1行だけのデータ列 2.データフレーム型 -
異なるデータ型のベクトルをテーブル構造で格納 3.リスト型 - 大きさも型も異なるデータを格納 外部から取り入れるデータはほぼデータフレーム型 (一部JSON形式のリスト型もあり)
21.
MENU 1. Rとは何か 2. Rを使うための環境設定 -
RとRStudioのインストール 3. Rの機能拡張 - Packageの取り込みと呼び出し 4. データ型とデータ構造 -データ型:数値型、文字型、ファクター型 -データ構造:ベクトル、データフレーム、リスト 5. 外部データのImput方法 - table形式 - その他 6. 結果のoutput方法 - dataframe形式 - 画像形式
22.
外部データのinput方法 table形式の場合、方法は3つ - baseか、packageの data.table
/ readr 1.base utils::read.table(file_path) 2.data.table data.table::fread(file_path) 3.readr readr::readr_delim(file_path)
23.
外部データのinput方法 良いところ悪いところ 1.utils::read.table 良い ・すぐ使える ・ほぼ全てのfile形式に対してwrapperがある 悪い ・file形式によってwrapperを指定するか引数を つける必要がある ・データ量が増えると読み込みが遅い ・カラム名が勝手に変わることがある
24.
外部データのinput方法 良いところ悪いところ 2.data.table::fread 良い ・読み込みが早い(大きいファイルほど顕著) ・自動的にfile形式に合わせて読み込む 悪い ・ data.table =
FALSE という指定が必要 ・ERRORが出た時に融通が効かない
25.
外部データのinput方法 良いところ悪いところ 3.readr::readr_delim 良い ・読み込みが早い ・ほぼ全てのfile形式に対するwrapperがある ・カラム名をほぼそのまま読み込む 悪い ・file形式によってwrapperを指定するか引数を つける必要がある
26.
外部データのinput方法 その他の形式 - 癖が強いのでオススメしません… Excelデータ readxl::read_excel( file_path
) SPSSデータ haven::read_spss( file_path ) SASデータ haven::read_sas( file_path )
27.
MENU 1. Rとは何か 2. Rを使うための環境設定 -
RとRStudioのインストール 3. Rの機能拡張 - Packageの取り込みと呼び出し 4. データ型とデータ構造 -データ型:数値型、文字型、ファクター型 -データ構造:ベクトル、データフレーム、リスト 5. 外部データのImput方法 - table形式 - その他 6. 結果のoutput方法 - dataframe形式 - 画像形式
28.
結果のoutput方法 table形式の場合 1.base utils::write.table(data, file_path , row.names
= FALSE) 注意点 指定しないとカラム名と一緒に列名も出力する 列名の出力をしない指定が row.names = FALSE 2.readr readr::write_csv(data, file_path )
29.
結果のoutput方法 画像の場合(png形式) 1.base png( file_path ,
dpi = …, width = …, height = …) plot(….) dev.off() *ファイル形式ごとに関数がある 2.ggplot2 p=plot(….) ggplot2::ggsave(file = file_path.png , plot = p, dpi = …, width = …, height = …) *fileの拡張子によって形式を指定
30.
最後に Rはpackageを始め先人の知恵をうまく使えば やりたいことのほとんどはできるように なっています Rの使い方に困ったら… 1. help()を使う 2. CRANの公式pdfを読む 3.
r-wakalangに質問する 4. google先生のお世話になる
31.
ENJOY!
Télécharger maintenant