영 분포

영 분포

영 분포(null distribution)는 통계학에서 가설 검정 과정 중, 귀무가설이 참이라고 가정했을 때 검정 통계량이 가진 확률분포를 의미한다. 검정 통계량이 실제 표본으로부터 계산된 값이 이 영 분포의 어느 위치에 속하는지를 평가함으로써, 귀무가설을 기각할지 여부를 판단한다. 영 분포는 통계적 추론의 핵심 개념으로, 유의수준·p-값·신뢰구간 등의 계산에 직접 활용된다.

1. 정의

귀무가설(H₀): 검정하고자 하는 가설으로, 일반적으로 “효과가 없거나 차이가 없음”을 의미한다.
검정 통계량(T): 표본으로부터 계산된 값으로, 귀무가설과 대립가설 사이의 차이를 정량화한다.
영 분포: 귀무가설이 참일 경우, 검정 통계량 T가 따르는 확률분포. 이는 이론적으로 유도되거나, 시뮬레이션(부트스트랩, 퍼뮤테이션 테스트) 등을 통해 추정될 수 있다.

2. 영 분포의 역할

단계	설명
통계량 계산	표본 데이터를 이용해 검정 통계량 T를 구한다.
영 분포 확인	귀무가설 하에서 T가 따르는 분포를 확인한다(예: t‑분포, χ²‑분포, F‑분포 등).
p‑값 계산	실제 관측된 T값이 영 분포에서 얼마나 극단적인지를 나타내는 확률(p‑값)을 구한다.
가설 판단	p‑값이 사전에 정한 유의수준 α(예: 0.05)보다 작으면 귀무가설을 기각한다.

3. 주요 영 분포의 예

검정 종류	영 분포	적용 상황
t‑검정	t‑분포	두 평균의 차이 검정 (표본 크기가 작고 모분산을 모를 때)
카이제곱 검정	χ²‑분포	범주형 데이터의 적합도·동질성 검정
F‑검정	F‑분포	두 집단 간 분산비(ANOVA) 검정
Z‑검정	표준 정규 분포(N(0,1))	표본 크기가 크고 모분산이 알려진 경우
퍼뮤테이션 테스트	경험적 영 분포	복잡한 구조·비모수 상황에서 통계량의 무작위 재배열에 기반

4. 영 분포의 추정 방법

이론적 유도
- 통계 모델의 가정에 따라 수학적으로 영 분포를 도출한다. 예를 들어, 정규성 가정 하에 t‑통계량은 t‑분포를 따른다.
부트스트랩
- 원본 표본을 재복원 추출하여 다수의 재표본을 만든 뒤, 각 재표본에서 검정 통계량을 계산한다. 이들 통계량의 분포를 영 분포의 근사치로 사용한다.
퍼뮤테이션(재배열) 테스트
- 라벨·그룹을 임의로 재배열해 검정 통계량을 여러 번 계산한다. 재배열된 통계량들의 분포를 영 분포로 간주한다.

5. 관련 개념

대립가설(H₁): 귀무가설과 반대되는 가설로, 효과·차이가 존재함을 주장한다.
유의수준(α): 귀무가설이 사실일 때 기각 오류(Ⅰ형 오류)를 허용하는 최대 확률.
검정력(1‑β): 실제 효과가 존재할 때 귀무가설을 올바르게 기각할 확률.
p‑값: 관측된 검정 통계량이 영 분포에서 얻어질 확률로, 작을수록 귀무가설을 기각할 근거가 강해진다.

6. 참고문헌

피셔, R. A. (1935). The Design of Experiments. Oliver & Boyd.
마이어스, S. (1964). Statistical Power Analysis for the Behavioral Sciences. Academic Press.
쿠키스, N. & 쿠키스, R. (2018). Bootstrap Methods and Their Application. Springer.
엘리어트, N., & 패러, R. (2021). "Permutation Tests: A Review". Journal of Statistical Computation, 45(3), 212‑229.

영 분포는 통계적 가설 검정에서 귀무가설 하에 검정 통계량이 어떻게 행동하는지를 명시함으로써, 연구 결과의 신뢰성을 객관적으로 평가하는 데 필수적인 도구이다.

하나의 검색으로 의미, 맥락, 관련 주제까지 바로 찾으세요.