중위수
중위수(Median)는 통계학에서 자료를 크기 순서대로 나열했을 때, 가장 중앙에 위치하는 값을 의미한다. 중앙값이라고도 불리며, 전체 데이터를 대표하는 값 중 하나로 사용된다. 평균과는 달리 극단적인 값에 영향을 덜 받기 때문에, 데이터의 분포가 비대칭적인 경우 자료의 중심 경향을 더 잘 나타낼 수 있다.
계산 방법
중위수를 구하는 방법은 데이터의 개수가 홀수인지 짝수인지에 따라 달라진다.
-
데이터 개수가 홀수인 경우: 자료를 크기 순으로 정렬한 후, 정확히 가운데 위치하는 값이 중위수가 된다. 예를 들어, 1, 3, 5, 7, 9의 중위수는 5이다.
-
데이터 개수가 짝수인 경우: 자료를 크기 순으로 정렬한 후, 가운데 위치하는 두 값의 평균이 중위수가 된다. 예를 들어, 1, 3, 5, 7의 중위수는 (3+5)/2 = 4이다.
활용
중위수는 소득 분배, 시험 성적 분석 등 다양한 분야에서 활용된다. 특히 소득 데이터와 같이 극단적으로 높은 값이나 낮은 값이 포함될 수 있는 경우, 평균보다는 중위수를 사용하여 소득 수준을 파악하는 것이 더 적절할 수 있다. 또한, 이상치의 영향을 적게 받기 때문에 데이터의 안정적인 대표값으로 사용될 수 있다.
장점 및 단점
-
장점:
- 극단값에 덜 민감하다.
- 이해하기 쉽고 계산하기 용이하다.
- 비대칭 분포 데이터에 유용하다.
-
단점:
- 모든 데이터를 고려하지 않는다.
- 통계적 추론에 사용하기 어려울 수 있다.
- 데이터의 변동성을 제대로 반영하지 못할 수 있다.