스피어만 순위 상관관계를 사용할 때는 일반적으로 고정된 레벨과 함께 사용됩니다. 이 레벨을 넘으면 상관관계의 '강도'가 높음을 나타내는 신호로 해석되죠. 이번에는 고정된 레벨 대신 부동 레벨을 추가하여 높은 상관관계 비율을 측정하는 방법을 소개할게요.

이론:
스피어만이 1904년에 제안한 비모수적 순위 통계는 두 변수 간의 관계 강도를 측정하는 데 사용됩니다(Lehmann and D'Abrera 1998). 스피어만 순위 상관계수는 R-추정치를 제공하며, 데이터의 분포가 피어슨 상관계수를 사용하기에 부적합하거나 오해를 불러일으킬 때 사용할 수 있는 단조로운 연관성을 측정합니다.
스피어만 순위 상관계수는 다음과 같이 정의됩니다:

여기서 d는 해당 변수의 통계적 순위 차이를 나타내며, 이는 정확한 상관계수의 근사값입니다.
사용법:
컬러 변화는 신호로 활용할 수 있습니다.
PS: 스피어만 순위가 사용될 때 부동 레벨이 추정에 어떻게 기여하는지를 보여주는 '큰 그림' 예시입니다.
