중심 극한 정리
중심 극한 정리 (Central Limit Theorem, CLT)는 확률론과 통계학에서 매우 중요한 정리 중 하나로, 독립적인 확률 변수들의 합 또는 평균의 분포가 표본 크기가 충분히 클 때 정규 분포에 가까워진다는 것을 설명한다. 이는 모집단의 분포가 무엇이든, 심지어 분포가 존재하지 않더라도 성립하는 매우 강력한 결과이다.
정의:
정확하게는, 동일한 확률 분포를 가지고 서로 독립인 확률 변수 *X1, X2, ..., Xn*이 있을 때 (각각의 평균이 μ이고 표준 편차가 σ라고 가정), 이 변수들의 합
Sn = X1 + X2 + ... + Xn
또는 평균
X̄n = (X1 + X2 + ... + Xn) / n
은 n이 충분히 클 때 정규 분포에 가까워진다. 더 구체적으로, *Sn*의 분포는 평균이 nμ이고 표준 편차가 σ√n인 정규 분포에 근사하며, *X̄n*의 분포는 평균이 μ이고 표준 편차가 σ/√n인 정규 분포에 근사한다.
수학적으로 표현하면 다음과 같다.
√n(X̄n - μ) / σ → N(0, 1) (분포 수렴)
이는 n이 무한대로 갈 때, 표본 평균의 표준화된 값은 표준 정규 분포 *N(0, 1)*에 분포 수렴한다는 의미이다.
중요성:
중심 극한 정리는 통계적 추론의 기초를 제공한다. 예를 들어, 모집단의 분포를 알지 못하더라도 표본 평균을 사용하여 모집단 평균에 대한 신뢰 구간을 추정하거나 가설 검정을 수행할 수 있게 해준다. 이는 실제 데이터 분석에서 매우 유용하게 활용된다.
가정:
중심 극한 정리가 성립하기 위해서는 몇 가지 가정이 필요하다.
- 독립성: 확률 변수들은 서로 독립이어야 한다.
- 동일 분포: 확률 변수들은 동일한 확률 분포를 가져야 한다. (반드시 필요한 조건은 아니지만, 보통 이러한 가정 하에 설명된다.)
- 유한한 분산: 각 확률 변수의 분산은 유한해야 한다.
응용:
중심 극한 정리는 다양한 분야에서 응용된다.
- 통계적 추론: 모집단 평균에 대한 신뢰 구간 추정, 가설 검정
- 품질 관리: 제품의 품질 관리, 공정 관리
- 금융: 포트폴리오 관리, 위험 관리
- 자연 과학: 실험 데이터 분석, 모델링
주의 사항:
- "충분히 큰" 표본 크기는 상황에 따라 다르다. 일반적으로 n ≥ 30이면 중심 극한 정리가 어느 정도 성립한다고 간주하지만, 모집단의 분포에 따라 더 큰 표본 크기가 필요할 수도 있다.
- 중심 극한 정리는 표본 평균의 분포가 정확히 정규 분포라는 것을 의미하지 않는다. 단지 근사적으로 정규 분포에 가까워진다는 것을 의미한다.