영 분포

영 분포

영 분포(null distribution)는 통계학에서 가설 검정 과정 중, 귀무가설이 참이라고 가정했을 때 검정 통계량이 가진 확률분포를 의미한다. 검정 통계량이 실제 표본으로부터 계산된 값이 이 영 분포의 어느 위치에 속하는지를 평가함으로써, 귀무가설을 기각할지 여부를 판단한다. 영 분포는 통계적 추론의 핵심 개념으로, 유의수준·p-값·신뢰구간 등의 계산에 직접 활용된다.


1. 정의

  • 귀무가설(H₀): 검정하고자 하는 가설으로, 일반적으로 “효과가 없거나 차이가 없음”을 의미한다.
  • 검정 통계량(T): 표본으로부터 계산된 값으로, 귀무가설과 대립가설 사이의 차이를 정량화한다.
  • 영 분포: 귀무가설이 참일 경우, 검정 통계량 T가 따르는 확률분포. 이는 이론적으로 유도되거나, 시뮬레이션(부트스트랩, 퍼뮤테이션 테스트) 등을 통해 추정될 수 있다.

2. 영 분포의 역할

단계 설명
통계량 계산 표본 데이터를 이용해 검정 통계량 T를 구한다.
영 분포 확인 귀무가설 하에서 T가 따르는 분포를 확인한다(예: t‑분포, χ²‑분포, F‑분포 등).
p‑값 계산 실제 관측된 T값이 영 분포에서 얼마나 극단적인지를 나타내는 확률(p‑값)을 구한다.
가설 판단 p‑값이 사전에 정한 유의수준 α(예: 0.05)보다 작으면 귀무가설을 기각한다.

3. 주요 영 분포의 예

검정 종류 영 분포 적용 상황
t‑검정 t‑분포 두 평균의 차이 검정 (표본 크기가 작고 모분산을 모를 때)
카이제곱 검정 χ²‑분포 범주형 데이터의 적합도·동질성 검정
F‑검정 F‑분포 두 집단 간 분산비(ANOVA) 검정
Z‑검정 표준 정규 분포(N(0,1)) 표본 크기가 크고 모분산이 알려진 경우
퍼뮤테이션 테스트 경험적 영 분포 복잡한 구조·비모수 상황에서 통계량의 무작위 재배열에 기반

4. 영 분포의 추정 방법

  1. 이론적 유도

    • 통계 모델의 가정에 따라 수학적으로 영 분포를 도출한다. 예를 들어, 정규성 가정 하에 t‑통계량은 t‑분포를 따른다.
  2. 부트스트랩

    • 원본 표본을 재복원 추출하여 다수의 재표본을 만든 뒤, 각 재표본에서 검정 통계량을 계산한다. 이들 통계량의 분포를 영 분포의 근사치로 사용한다.
  3. 퍼뮤테이션(재배열) 테스트

    • 라벨·그룹을 임의로 재배열해 검정 통계량을 여러 번 계산한다. 재배열된 통계량들의 분포를 영 분포로 간주한다.

5. 관련 개념

  • 대립가설(H₁): 귀무가설과 반대되는 가설로, 효과·차이가 존재함을 주장한다.
  • 유의수준(α): 귀무가설이 사실일 때 기각 오류(Ⅰ형 오류)를 허용하는 최대 확률.
  • 검정력(1‑β): 실제 효과가 존재할 때 귀무가설을 올바르게 기각할 확률.
  • p‑값: 관측된 검정 통계량이 영 분포에서 얻어질 확률로, 작을수록 귀무가설을 기각할 근거가 강해진다.

6. 참고문헌

  1. 피셔, R. A. (1935). The Design of Experiments. Oliver & Boyd.
  2. 마이어스, S. (1964). Statistical Power Analysis for the Behavioral Sciences. Academic Press.
  3. 쿠키스, N. & 쿠키스, R. (2018). Bootstrap Methods and Their Application. Springer.
  4. 엘리어트, N., & 패러, R. (2021). "Permutation Tests: A Review". Journal of Statistical Computation, 45(3), 212‑229.

영 분포는 통계적 가설 검정에서 귀무가설 하에 검정 통계량이 어떻게 행동하는지를 명시함으로써, 연구 결과의 신뢰성을 객관적으로 평가하는 데 필수적인 도구이다.

둘러보기

더 찾아볼 만한 주제