1. НАЧАЛО РАБОТЫ В R: ПЕРЕМЕННЫЕ,
ВЕКТОРЫ, МАТРИЦЫ
Бахрушин Владимир Евгеньевич,
профессор, д.ф.-м.н.
Vladimir.Bakhrushin@gmail.com
2. Общая информация
R – это объектно-ориентированный язык и среда
программирования. Его отличительной чертой является
наличие большого числа библиотек для статистического
анализа данных.
R – это свободно распространяемое ПО с открытым
кодом. Еще одной его особенностью является то, что R
можно использовать во многих операционных системах, в
частности, в Windows, Linux, Mac OS и др.
В 1997 г. был создан проект CRAN (Comprehensive R Archive
Network (http://cran.r-project.org). Это репозиторий,
содержащий систему R, библиотеки, материалы и другие
относящиеся к R ресурсы.
4. Рабочая директория
По умолчанию, программы и данные сохраняют и ищут в
рабочей директории. Определить, какая директория
является рабочей, можно с помощью команды:
> getwd().
Изменить рабочую директорию можно с помощью
команды:
> setwd(“…”)
В скобках надо указать путь к нужной директории.
В RGui это можно сделать, выбирая в меню: "File - Change
Folder".
5. Скрипты
Для создания программ используют скрипты, которые
можно создавать с помощью любого текстового редактора, а
также в специальном окне, возникающем при выборе в
главном меню: “Файл – Новый скрипт”.
Для открытия уже имеющихся скриптов в главном меню
надо выбрать: “Файл – Открыть скрипт”.
6. Векторы
Базовой структурой в R является вектор. Его элементы –
это одно или несколько однотипных значений данных.
Скалярную величину можно представить как вектор,
содержащий одно значение. Из векторов можно создавать
более сложные структуры – матрицы, массивы и др.
Элементы вектора могут принадлежать к таким типам
данных: numeric, integer, character, complex, logical, raw и др.
NaN это результат вычислений, приводящих к
неопределенностям вида 0/0, ∞/∞, ∞ − ∞ и др.
NA используют как синоним неопределенного на данный
момент значения (аналог NULL для систем управления
базами данных).
9. Некоторые функции для работы
с векторами
sort(x)
var(x)
mean(x)
sum(x)
prod(x)
Функции
max(x)
min(x)
length(x)
10. Матрицы
Любой вектор можно преобразовать в матрицу, указав
способ размещения его элементов в этой матрице.
Функция m=matrix(data = y, nrow = n, ncol = m)
размещает элементы вектора y в матрице m размерности
nm так, что сначала сверху вниз заполняется первый
столбец, потом второй и т. д.
Если длина вектора меньше nm, то его элементы
используют снова, начиная с первого.
Если длина вектора больше nm, то часть его элементов
останется неиспользованной.
Можно объединить два вектора в матрицу, используя
функцию c().
17. Массивы
Векторы и матрицы – частные случаи массивов,
имеющих, соответственно, одно или два измерения.
В общем случае для создания массива используют
функцию: array(<вектор-данных>, <вектор-измерений>).
<Вектор-данных> – это вектор чисел, из которых
формируют массив.
<Вектор-измерений> – это вектор чисел, количество
которых задает количество измерений, а их значения –
размерность массива в соответствующем измерении.
20. Литература
1. Зарядов И.С. Введение в статистический пакет R / И.С.
Зарядов. – М.: Изд. РУДН, 2010 – 207 с.
2. Статистический анализ данных в системе R. Учебное
пособие / А.Г. Буховец, П.В. Москалев, В.П. Богатова, Т.Я.
Бирючинская; Под ред. проф. Буховца А.Г. –– Воронеж: ВГАУ,
2010. –– 124 с.
3. Язык программирования R: Викиучебник.