スピアマンの順位相関係数(Spearman’s rank correlation coefficient)について
統計学において、データの関係性を測るためにはさまざまな手法が存在します。特に、順序尺度(ordinal scale)や間隔尺度(interval scale)のデータの相関を調べるために広く用いられている手法の一つが「スピアマンの順位相関係数」です。スピアマンの順位相関係数は、変数間の単調な関係を評価するために用いられます。この記事では、スピアマンの順位相関係数について、その定義、計算方法、用途、そして解釈について詳しく説明します。

1. スピアマンの順位相関係数の定義
スピアマンの順位相関係数(Spearman’s rank correlation coefficient)は、二つの変数間の順序の一致度を測る指標です。変数がどの程度単調(増加または減少)に関連しているかを示すもので、相関係数は -1 から +1 の範囲に収まります。具体的には、相関係数が +1 に近いほど、二つの変数は完全に単調に増加していることを示し、-1 に近いほど完全に単調に減少していることを示します。相関係数が 0 に近ければ、二つの変数間には単調な関係がないことを示します。
2. スピアマンの順位相関係数の計算方法
スピアマンの順位相関係数は、次の手順で計算されます。
-
データの順位付け:
まず、各変数に対して値に順位を付けます。例えば、変数Aと変数Bにそれぞれ順位を付ける場合、最小の値に1番目の順位を、次に小さい値に2番目の順位を付けていきます。同じ値がある場合は、その順位の平均を使用します。 -
順位の差の計算:
各データ点における順位の差(d)を計算します。つまり、変数Aの順位と変数Bの順位との差を求めます。di=RA(i)−RB(i)
ここで、RA(i) は変数Aのi番目のデータ点の順位、RB(i) は変数Bのi番目のデータ点の順位です。
-
差の二乗を計算:
各差の二乗を計算します。di2=(RA(i)−RB(i))2
-
スピアマンの順位相関係数の計算:
最後に、スピアマンの順位相関係数は次の式で計算されます。ρ=1−n(n2−1)6∑di2
ここで、∑di2 は順位差の二乗の合計、n はデータ点の数です。この式により、スピアマンの順位相関係数を求めることができます。
3. スピアマンの順位相関係数の解釈
スピアマンの順位相関係数は、-1から+1の範囲で結果が出ます。
-
+1: 完全に単調増加の関係がある。すべてのデータ点が順位において完全に一致する場合。
-
0: 変数間に単調な関係がない。すなわち、順位がランダムである場合。
-
-1: 完全に単調減少の関係がある。すべてのデータ点が逆順に並んでいる場合。
スピアマンの順位相関係数が +0.7 以上であれば、強い正の相関があるとみなされ、-0.7 以下であれば強い負の相関があるとされます。一般的に、0.3 から 0.7 の範囲は中程度の相関、0.3 以下の範囲は弱い相関を示します。
4. スピアマンの順位相関係数の使用例
スピアマンの順位相関係数は、さまざまな分野で利用されており、特に以下のようなケースで有効です。
-
心理学や社会学の調査: アンケートの結果や評価尺度において、順序が重要なデータを扱う際に使用されます。
-
教育分野: 学生の試験結果や成績、学力に関連する調査データの分析に用いられます。
-
経済学やマーケティング: 商品の評価や消費者の購入行動の調査において、順位付けされたデータを使用して相関を分析します。
-
医療分野: 患者の治療効果と回復速度など、順序尺度に基づくデータを解析する際に役立ちます。
5. スピアマンの順位相関係数の長所と短所
長所:
-
順序データに対応: スピアマンの順位相関係数は、間隔データだけでなく、順序データにも適用可能です。これにより、データが必ずしも間隔尺度でなくても相関を調べることができます。
-
単調関係に焦点を当てる: 変数が単調に増加または減少している場合、その関係性を捉えることができるため、他の相関係数よりも柔軟です。
短所:
-
線形関係のみではない: スピアマンの順位相関係数は単調な関係を捉えますが、必ずしも線形関係を評価しているわけではないため、線形関係を前提にした解析には不向きな場合があります。
-
外れ値に影響される: 外れ値が存在する場合、順位に大きな影響を与える可能性があり、結果として相関係数が歪むことがあります。
6. まとめ
スピアマンの順位相関係数は、二つの変数間の単調な関係を評価する強力なツールであり、特に順序データに対して有効です。計算が比較的簡単であり、さまざまな分野で幅広く使用されています。しかし、線形関係を前提にした分析には不向きであり、外れ値の影響にも注意が必要です。そのため、データの特性や目的に応じて適切な相関分析手法を選ぶことが重要です。