정의
표본 분포(標本分布, sampling distribution)란 특정 통계량(예: 표본 평균, 표본 비율 등)을 동일한 크기의 표본을 반복적으로 추출하여 계산할 때, 그 통계량이 따르는 확률분포를 의미한다. 이는 모집단의 특성을 추정하고 통계적 추론을 수행하는 데 핵심적인 역할을 한다.
개요
표본 분포는 통계학에서 모수 추정과 가설 검정의 기초가 되는 개념이다. 예를 들어, 모집단에서 크기가 n인 표본을 반복해서 추출하고 각각의 표본에 대해 평균을 계산하면, 이러한 표본 평균들의 분포가 바로 표본 평균의 표본 분포가 된다. 중심극한정리에 따르면, 모집단의 분포가 무엇이든 상관없이 표본 크기가 충분히 클 경우 표본 평균의 분포는 정규분포에 근사하게 된다.
어원/유래
‘표본’은 영어로 "sample"에 해당하며, 어떤 전체 집단(모집단)의 일부를 대표하여 추출한 집합을 의미한다. ‘분포’는 영어 "distribution"에 해당하며, 값들이 어떤 식으로 퍼져 있는지를 나타낸다. 따라서 ‘표본 분포’는 영어 “sampling distribution”의 번역어로 파악되며, 통계학 용어로서 20세기 초 통계 이론이 발전하면서 널리 사용되기 시작하였다. 정확한 용어의 최초 사용 시점 및 학자는 공개적으로 확인되지 않는다.
특징
- 표본 분포는 통계량의 확률분포이므로, 그 분포의 평균, 분산, 형태를 분석할 수 있다.
- 표본 평균의 표본 분포의 평균은 모집단의 평균과 동일하다(불편성).
- 표본 평균의 분산은 모분산을 표본 크기(n)으로 나눈 값, 즉 σ²/n이 된다.
- 표본 크기가 커질수록 표본 분포는 더 정밀해지고, 중심극한정리에 따라 정규분포에 접근한다.
- 표본 분포는 부트스트랩과 같은 재표집(re-sampling) 방법에서도 활용된다.
관련 항목
- 중심극한정리
- 모수 추정
- 가설 검정
- 표준오차
- 모집단
- 표본 평균
- 정규분포