2. Корреляция отражает степень связи
между двумя переменными
Коэффициент корреляции выражает эту
степень количественно
-1 ≤ r ≤ +1
Author: Sergey Mastitsky
5. Предполагает, что:
обе переменные распределены нормально
связь линейна
Коэффициент корреляции Пирсона основан
на расчете ковариации между двумя
переменными:
22
)()(
))((
yyxx
yyxx
r
ii
ii
Author: Sergey Mastitsky
7. > logL <- log(LWdata$Length)
> logW <- log(LWdata$Weight)
> cor(logL, logW)
[1] 0.9807
# Если бы имелись отсутствующие значения:
> cor(logL, logW,
use = "complete.obs")
# Для расчета r между всеми количественными
переменными в таблице данных, следует просто
подать эту таблицу на функцию cor()
Author: Sergey Mastitsky
11. Histogram of logL
logL
Frequency
2.0 2.5 3.0 3.5
0204060
Histogram of logW
logW
Frequency
-4 -3 -2 -1 0
0204060
Histogram of exp(logL)
Length
Frequency
5 10 15 20 25 30 35
010203040
Histogram of exp(logW)
Weight
Frequency
0.0 0.2 0.4 0.6 0.8 1.0 1.2
04080120
Author: Sergey Mastitsky
12. Не предполагает, что данные
распределены каким-то особым образом
Вместо исходных значений использует их
ранги
(!) Интерпретация не настолько проста,
как в случае с коэффициентом Пирсона
(т.к. связь необязательно линейна)
Author: Sergey Mastitsky