3. Microsoft Excel – одна из наиболее
распространенных программ для подготовки
данных для R
Перед загрузкой в R, Excel-файл обычно
сохраняют как текстовый файл.txt or .csv
Имеется возможность работать и с др.
форматами (SPSS, SAS, Access, SQL, и др.)
– см. пакет foreign
Author: Sergey Mastitsky
4. Никаких пустых ячеек – отсутствующие
значения обозначаются как NA
Присвойте имя каждой
переменной:
Никаких пробелов в именах
Имена не должны начинаться с точек или
чисел
Файл стоит поместить в текущую рабочую
папку
Author: Sergey Mastitsky
5. Эксперимент по влиянию pH на рост
Dreissena polymorpha*
4 pH-группы: Control (вода из оз.
Онтарио), A (7.3), B (7.1), and C (6.9)
Три повтора на группу: Control1-
Control3, A1-A3, B1-B3, и C1-C3
WikipediaAuthor: Sergey Mastitsky
* Claudi R, Graves A, Taraborelli AC, Prescott RJ, Mastitsky SE (2012)
Impact of pH on survival and settlement of dreissenid mussels. Aquatic
Invasions 7(1): 21-28
7. Из командной строки:
> setwd("~/Introductory R
Course/R_Course_Datasets")
Или в RStudio:
Session -> Set Working Directory -> Choose
Directory -> …
Author: Sergey Mastitsky
8. Откройте файл pH_down_experiment.xls
Ознакомьтесь с данными
Сохраните как файл с разделителем в виде
табуляции
Откройте файл
в текстовом редакторе
и посмотрите, как
он выглядит
Author: Sergey Mastitsky
9. "Рабочая лошадка" для загрузки данных
Основные аргументы:
- file = "имя.txt": имя файла (или
URL-ссылка)
- header = TRUE: есть ли в файле
заголовки столбцов
- sep = "t" или sep = "," :
разделитель значений в файле
Author: Sergey Mastitsky