절사평균

절사평균(trimmed mean)은 통계학에서 관측값 중 일정 비율(또는 절대 개수)의 가장 큰 값과 가장 작은 값을 제외하고 남은 표본에 대해 산출한 평균값을 말한다. 일반적으로 극단값의 영향력을 감소시켜 중심경향을 보다 견고하게 추정하기 위해 사용된다.

정의

n개의 표본값 $x_{1},x_{2},\dots ,x_{n}$을 크기순으로 정렬한 뒤, 상위와 하위에서 각각 $k$개의 값을 삭제하고 남은 $n-2k$개의 값에 대해 산술평균을 계산한다. 이를 수식으로 나타내면

$$ \operatorname{TM}{\alpha}= \frac{1}{n-2k}\sum{i=k+1}^{n-k} x_{(i)}, $$

where $x_{(i)}$는 크기순 정렬된 i번째 관측값이며, $k = \lfloor \alpha n \rfloor$ (0 ≤ α < 0.5) 로 절사 비율 $\alpha$에 해당한다.

종류

  1. 대칭 절사평균

    • 상하 양쪽에서 동일한 비율(또는 개수)의 데이터를 삭제한다. 위 식이 해당한다.
  2. 비대칭 절사평균

    • 상위와 하위에서 서로 다른 비율(또는 개수)을 삭제한다. 예를 들어 상위 10 %만, 하위 5 %만 삭제하는 경우가 있다.

통계적 성질

  • 견고성(Robustness): 극단값(outlier)의 영향을 크게 감소시켜 표본 평균보다 높은 견고성을 가진다. 절사 비율이 클수록 견고성은 증가하지만, 효율성(표준 오차)은 감소할 수 있다.
  • 불편성(Unbiasedness): 정규분포와 같은 대칭분포에서는 적절한 절사 비율을 선택하면 절사평균이 모평균에 대한 불편 추정량이 된다.
  • 효율성: 정규분포에 대해 절사비율 20 %(즉, 상하 20 %씩 절사)일 때, 절사평균은 평균보다 약 1.1배 정도의 효율을 보인다.

활용 사례

  • 품질 관리: 제조 공정에서 측정값 중 이상치가 발생할 가능성이 있을 때, 절사평균을 이용해 평균성을 평가한다.
  • 경제·사회 지표: 가구소득·주택가격 등 비대칭적인 분포를 갖는 자료의 대표값을 제시할 때 사용된다.
  • 신호 처리·이미지 처리: 잡음이 포함된 데이터에서 평균 필터링보다 잡음에 덜 민감한 대안으로 채택된다.

관련 용어

  • 절사 중앙값(Trimmed median) – 절사 후 남은 값들의 중앙값.
  • 윈저라이즈드 평균(Winsorized mean) – 절사와 유사하지만, 삭제된 값들을 절사 경계값으로 대체한 후 평균을 구하는 방법.
  • 견고 통계(Robust statistics) – 절사평균을 포함한 극단값에 강인한 통계적 방법들의 총칭.

어원

‘절사(截削)’는 ‘잘라내다’, ‘삭제하다’는 뜻의 한자어이며, ‘평균(平均)’은 ‘average’를 의미한다. 따라서 ‘절사평균’은 ‘극단값을 잘라낸 후 구한 평균’이라는 의미를 갖는다.

참고문헌

  • Hampel, F. R., Ronchetti, E. M., Rousseeuw, P. J., & Stahel, W. A. (2011). Robust Statistics: The Approach and Its Implementation. Wiley.
  • 한국통계학회 (2009). 통계학 입문. 교보문고.

(본 항목은 2026년 현재 공개된 학술·교육 자료를 토대로 작성되었으며, 절사평균에 관한 기본적인 정의와 특성을 제공한다.)

둘러보기

더 찾아볼 만한 주제