윌콕슨 부호-순위 검정은 두 개의 짝을 이룬 표본(paired samples) 또는 반복 측정(repeated measures)된 데이터 간의 차이가 유의미한지 여부를 검정하는 비모수 통계 방법이다. 이는 데이터가 정규 분포를 따른다는 가정을 충족하지 못할 때 짝을 이룬 t-검정(paired t-test)의 대안으로 사용된다.
개요
윌콕슨 부호-순위 검정은 정규성 가정을 요구하지 않기 때문에 데이터의 분포 형태에 대한 엄격한 제한 없이 두 관련 표본의 중앙값(median) 차이를 평가하는 데 유용하다. 예를 들어, 특정 치료 전후의 환자 상태 변화, 동일 인물의 두 가지 다른 조건에서의 반응 비교 등 짝지어진 관측값이 있을 때 적용된다. 이 검정은 각 쌍의 차이값을 계산한 후, 그 차이값들의 절댓값을 순위(rank)로 매기고, 원래의 부호(sign)를 다시 부여하여 양의 순위 합과 음의 순위 합을 비교하는 방식으로 진행된다.
가정
이 검정을 사용하기 위한 주요 가정은 다음과 같다:
- 짝을 이룬 데이터: 각 관측치는 다른 관측치와 짝을 이루어야 한다. (예: 동일 인물의 치료 전후 데이터)
- 독립적인 쌍: 각 쌍 간의 관측치는 서로 독립적이어야 한다.
- 측정 수준: 데이터의 차이값은 최소한 등간척도(interval scale) 또는 비율척도(ratio scale)로 측정되어야 한다. 이는 차이값을 계산하고 순위를 매길 수 있어야 하기 때문이다.
- 차이값의 대칭 분포 (선택적): 일부 문헌에서는 차이값의 분포가 중앙값에 대해 대칭적이어야 한다고 가정하지만, 이는 엄격한 요구 사항은 아닐 수 있으며 특히 표본 크기가 충분히 클 때는 덜 중요하다고 간주되기도 한다.
장점
- 비모수성: 데이터가 정규 분포를 따르지 않아도 적용할 수 있어 활용도가 높다.
- 이상치에 강함: 순위 기반 검정이므로 극단적인 이상치(outliers)의 영향을 덜 받는다.
- 짝을 이룬 t-검정의 강력한 대안: 정규성 가정을 위반할 때 모수 검정보다 더 신뢰할 수 있는 결과를 제공한다.
단점
- 검정력 손실: 데이터가 실제로 정규 분포를 따를 경우, 짝을 이룬 t-검정보다 검정력(power)이 낮을 수 있다.
- 계산의 복잡성: 수작업으로 계산할 경우 짝을 이룬 t-검정보다 절차가 복잡할 수 있다.
관련 검정
- 짝을 이룬 t-검정(paired t-test): 정규성 가정을 만족할 때 윌콕슨 부호-순위 검정의 모수적 대안이다.
- 부호 검정(Sign test): 윌콕슨 부호-순위 검정보다 단순하며, 차이값의 부호만을 사용하여 방향성을 검정한다. 순위 정보를 사용하지 않아 검정력이 더 낮다.
- 맨-휘트니 U 검정(Mann-Whitney U test): 독립적인 두 표본의 중앙값 차이를 검정하는 비모수 방법이다. 윌콕슨 부호-순위 검정은 짝을 이룬 표본에 사용된다는 점에서 차이가 있다.
역사
이 검정은 1945년 미국의 통계학자 프랭크 윌콕슨(Frank Wilcoxon)에 의해 처음 제안되었다.