推計学のすすめ4の2順位相関係数
- 1. 美人コンテストの審査員をする話
ースピアマンの順位相関係数ー
『推計学のすすめ』第4章2説
2012/07/02 担当:伊藤
12年6月30日土曜日
- 2. 美人コンテスト
• A、Bの2名が審査(順位付け)を行う
• A、Bの結果が全く不一致では審査とし
て適切ではない
• A、Bの結果の一致程度を表す測度はあ
るだろうか?
12年6月30日土曜日
- 3. 最初の手がかり
• 2人の審査結果の積和を計算すると…
2人のつけた順位が全く一緒の場合 2人のつけた順位が全く逆の場合
審A 審B 積和 審A 審B 積和
美A 1 1 1 美A 1 3 3
美B 2 2 4 美B 2 2 4
美C 3 3 9 美C 3 1 3
積和の合計V 14 積和の合計V 10
似ているほど大 違うほど小
12年6月30日土曜日
- 4. 普遍化すること
• 測度Vは美人の数が増えれば大きくなる
→ 最大値1、最小値-1にできないか?
→ 一致している: 1
逆順: -1
関係ない: 0
順位に対するこの指標を
(スピアマンの)順位相関係数と呼ぶ
12年6月30日土曜日
- 5. 順位相関係数を導く
1. VからVの中点の値を引く
(中点がゼロになる)
2. 最大値と最小値の差で割り、2倍する
(最大値が1、最小値が-1になる)
12年6月30日土曜日
- 6. 具体的には?
積和 中点を引く
2
n(n+1)
V
n(n
4
2 1) 2
6
最大値と最小値の差で割って二倍
※ 最大値や最小値、中点は自乗和の公式とかいうのを使って求めますが、何か面倒そうなので説明しません。
12年6月30日土曜日
- 8. 本来は…
• 今の2式はタイの順位が無いときにのみ
使える裏ワザ的な式で、以下の式でも
計算が面倒なだけで結果は一緒
(xi x)(yi y )
¯ ¯
= i
i (xi x)2 i (yi y )2
¯ ¯
次節で出てくるピアソンの積率相関係数
12年6月30日土曜日
- 9. 順位相関係数とは
• 定義:2つの順位がどれだけ似ているか
の指標
• 応用:普通の2変数でも順位に変換すれ
ば適用できる
12年6月30日土曜日
- 10. 順位に変換すると…?
• 「xが増えるとyも増
える」を見ることが
できる
• 関係が直線でなくと
も良い
http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient
12年6月30日土曜日
- 11. 順位に変換すると…?
• ピアソンの積率相関
係数よりも外れ値に
強い
http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient
12年6月30日土曜日
- 12. もう一つの順位相関係数
4P
• ケンドールの順位相関係数 =
n(n 1)
1
• 解説は http://www.tamagaki.com/math/
Statistics610.html が詳しい
• 実用上はどちらを使用しても大差ない
(悩むよりまず散布図を書け!)
12年6月30日土曜日