SlideShare une entreprise Scribd logo
1  sur  13
Télécharger pour lire hors ligne
Тема 3
Сергей Мастицкий
БГУ, Минск, май 2014
3.1. Использование Excel для
подготовки данных
 Microsoft Excel – одна из наиболее
распространенных программ для подготовки
данных для R
 Перед загрузкой в R, Excel-файл обычно
сохраняют как текстовый файл.txt or .csv
 Имеется возможность работать и с др.
форматами (SPSS, SAS, Access, SQL, и др.)
– см. пакет foreign
Author: Sergey Mastitsky
 Никаких пустых ячеек – отсутствующие
значения обозначаются как NA
 Присвойте имя каждой
переменной:
 Никаких пробелов в именах
 Имена не должны начинаться с точек или
чисел
 Файл стоит поместить в текущую рабочую
папку
Author: Sergey Mastitsky
 Эксперимент по влиянию pH на рост
Dreissena polymorpha*
 4 pH-группы: Control (вода из оз.
Онтарио), A (7.3), B (7.1), and C (6.9)
 Три повтора на группу: Control1-
Control3, A1-A3, B1-B3, и C1-C3
WikipediaAuthor: Sergey Mastitsky
* Claudi R, Graves A, Taraborelli AC, Prescott RJ, Mastitsky SE (2012)
Impact of pH on survival and settlement of dreissenid mussels. Aquatic
Invasions 7(1): 21-28
3.2. Загрузка данных
Подробнее см.:
http://r-analytics.blogspot.de/2011/11/r_08.html
 Из командной строки:
> setwd("~/Introductory R
Course/R_Course_Datasets")
 Или в RStudio:
Session -> Set Working Directory -> Choose
Directory -> …
Author: Sergey Mastitsky
 Откройте файл pH_down_experiment.xls
 Ознакомьтесь с данными
 Сохраните как файл с разделителем в виде
табуляции
 Откройте файл
в текстовом редакторе
и посмотрите, как
он выглядит
Author: Sergey Mastitsky
 "Рабочая лошадка" для загрузки данных
 Основные аргументы:
- file = "имя.txt": имя файла (или
URL-ссылка)
- header = TRUE: есть ли в файле
заголовки столбцов
- sep = "t" или sep = "," :
разделитель значений в файле
Author: Sergey Mastitsky
> LWdata <- read.table(
file = "pH_down_experiment.txt",
header = TRUE,
sep = "t")
> names(LWdata)
> head(LWdata)
> LWdata
Author: Sergey Mastitsky
Author: Sergey Mastitsky
Author: Sergey Mastitsky
> save.image(file =
"pH_experiment.rda")
 Или в RStudio:
Environment -> Save Workspace As…
pH_experiment.rda
Author: Sergey Mastitsky

Contenu connexe

Plus de Sergey Mastitsky

Karataev_et_al._2003_Conchophthirus_emergenece.PDF
Karataev_et_al._2003_Conchophthirus_emergenece.PDFKarataev_et_al._2003_Conchophthirus_emergenece.PDF
Karataev_et_al._2003_Conchophthirus_emergenece.PDFSergey Mastitsky
 
AI_2007_2_1_Mastitsky_Makarevich
AI_2007_2_1_Mastitsky_MakarevichAI_2007_2_1_Mastitsky_Makarevich
AI_2007_2_1_Mastitsky_MakarevichSergey Mastitsky
 
Karatayev et al 2008 Aquatic invasions in Belarus
Karatayev et al 2008 Aquatic invasions in BelarusKaratayev et al 2008 Aquatic invasions in Belarus
Karatayev et al 2008 Aquatic invasions in BelarusSergey Mastitsky
 
Дисперсионный анализ (ANOVA) в системе R
Дисперсионный анализ (ANOVA) в системе RДисперсионный анализ (ANOVA) в системе R
Дисперсионный анализ (ANOVA) в системе RSergey Mastitsky
 
Простая линейная регрессия в системе R
Простая линейная регрессия в системе RПростая линейная регрессия в системе R
Простая линейная регрессия в системе RSergey Mastitsky
 
Инсталляция системы статистических вычислений R
Инсталляция системы статистических вычислений RИнсталляция системы статистических вычислений R
Инсталляция системы статистических вычислений RSergey Mastitsky
 

Plus de Sergey Mastitsky (9)

Karataev_et_al._2003_Conchophthirus_emergenece.PDF
Karataev_et_al._2003_Conchophthirus_emergenece.PDFKarataev_et_al._2003_Conchophthirus_emergenece.PDF
Karataev_et_al._2003_Conchophthirus_emergenece.PDF
 
AI_2007_2_1_Mastitsky_Makarevich
AI_2007_2_1_Mastitsky_MakarevichAI_2007_2_1_Mastitsky_Makarevich
AI_2007_2_1_Mastitsky_Makarevich
 
mastitsky_article
mastitsky_articlemastitsky_article
mastitsky_article
 
Karatayev et al 2008 Aquatic invasions in Belarus
Karatayev et al 2008 Aquatic invasions in BelarusKaratayev et al 2008 Aquatic invasions in Belarus
Karatayev et al 2008 Aquatic invasions in Belarus
 
AI_2012_1_Claudi_etal
AI_2012_1_Claudi_etalAI_2012_1_Claudi_etal
AI_2012_1_Claudi_etal
 
Дисперсионный анализ (ANOVA) в системе R
Дисперсионный анализ (ANOVA) в системе RДисперсионный анализ (ANOVA) в системе R
Дисперсионный анализ (ANOVA) в системе R
 
Простая линейная регрессия в системе R
Простая линейная регрессия в системе RПростая линейная регрессия в системе R
Простая линейная регрессия в системе R
 
Основы языка R
Основы языка RОсновы языка R
Основы языка R
 
Инсталляция системы статистических вычислений R
Инсталляция системы статистических вычислений RИнсталляция системы статистических вычислений R
Инсталляция системы статистических вычислений R
 

Загрузка данных в системе R

  • 2. 3.1. Использование Excel для подготовки данных
  • 3.  Microsoft Excel – одна из наиболее распространенных программ для подготовки данных для R  Перед загрузкой в R, Excel-файл обычно сохраняют как текстовый файл.txt or .csv  Имеется возможность работать и с др. форматами (SPSS, SAS, Access, SQL, и др.) – см. пакет foreign Author: Sergey Mastitsky
  • 4.  Никаких пустых ячеек – отсутствующие значения обозначаются как NA  Присвойте имя каждой переменной:  Никаких пробелов в именах  Имена не должны начинаться с точек или чисел  Файл стоит поместить в текущую рабочую папку Author: Sergey Mastitsky
  • 5.  Эксперимент по влиянию pH на рост Dreissena polymorpha*  4 pH-группы: Control (вода из оз. Онтарио), A (7.3), B (7.1), and C (6.9)  Три повтора на группу: Control1- Control3, A1-A3, B1-B3, и C1-C3 WikipediaAuthor: Sergey Mastitsky * Claudi R, Graves A, Taraborelli AC, Prescott RJ, Mastitsky SE (2012) Impact of pH on survival and settlement of dreissenid mussels. Aquatic Invasions 7(1): 21-28
  • 6. 3.2. Загрузка данных Подробнее см.: http://r-analytics.blogspot.de/2011/11/r_08.html
  • 7.  Из командной строки: > setwd("~/Introductory R Course/R_Course_Datasets")  Или в RStudio: Session -> Set Working Directory -> Choose Directory -> … Author: Sergey Mastitsky
  • 8.  Откройте файл pH_down_experiment.xls  Ознакомьтесь с данными  Сохраните как файл с разделителем в виде табуляции  Откройте файл в текстовом редакторе и посмотрите, как он выглядит Author: Sergey Mastitsky
  • 9.  "Рабочая лошадка" для загрузки данных  Основные аргументы: - file = "имя.txt": имя файла (или URL-ссылка) - header = TRUE: есть ли в файле заголовки столбцов - sep = "t" или sep = "," : разделитель значений в файле Author: Sergey Mastitsky
  • 10. > LWdata <- read.table( file = "pH_down_experiment.txt", header = TRUE, sep = "t") > names(LWdata) > head(LWdata) > LWdata Author: Sergey Mastitsky
  • 13. > save.image(file = "pH_experiment.rda")  Или в RStudio: Environment -> Save Workspace As… pH_experiment.rda Author: Sergey Mastitsky