기하 분포

정의
기하 분포(Geometric distribution)는 이산확률분포의 일종으로, 독립적인 베르누이 시행을 반복할 때 최초의 성공이 몇 번째 시도에서 발생하는지를 나타내는 확률분포이다. 이 분포는 성공 확률이 일정한 조건에서 첫 번째 성공이 발생할 때까지의 시행 횟수를 확률변수로 가정한다.

개요
기하 분포는 확률론과 통계학에서 널리 사용되는 분포 중 하나로, 특정 사건이 일어날 확률이 매번 동일하고 독립적인 상황에서 처음으로 사건이 발생하는 데 걸리는 시도 횟수의 분포를 모델링하는 데 쓰인다. 예를 들어, 동전을 던져 처음으로 앞면이 나올 때까지의 던진 횟수, 또는 고객 서비스에서 첫 번째 불만 전화가 올 때까지의 통화 수 등에 적용할 수 있다.

기하 분포는 두 가지 버전으로 정의될 수 있다:

  1. 첫 번째 성공까지의 시행 횟수를 나타내는 경우 (확률변수의 범위: 1, 2, 3, ...)
  2. 첫 번째 성공까지의 실패 횟수를 나타내는 경우 (확률변수의 범위: 0, 1, 2, ...)

일반적으로 첫 번째 정의가 더 흔히 사용된다.

어원/유래
"기하 분포"라는 명칭은 영어 "geometric distribution"의 직역이다. 여기서 "geometric"은 이 분포의 확률 질량 함수(probability mass function)가 기하급수(등비수열) 형태를 띤다는 점에서 유래하였다. 즉, 성공 확률을 $ p $라고 할 때, $ k $번째 시도에 처음으로 성공할 확률은 $ (1-p)^{k-1}p $로 표현되며, 이는 공비가 $ (1-p) $인 등비수열의 형태를 따른다.

특징

  • 매 시행은 독립적이며, 각 시행의 성공 확률 $ p $는 일정하다.
  • 무기억성(Memorylessness)을 가진다. 즉, $ P(X > m + n \mid X > m) = P(X > n) $가 성립한다. 이는 기하 분포가 이산형 확률분포 중 유일하게 무기억성을 가지는 성질로 알려져 있다.
  • 기대값은 $ \frac{1}{p} $, 분산은 $ \frac{1-p}{p^2} $로 계산된다.
  • 음이항분포(Negative binomial distribution)의 특수한 경우로 볼 수 있으며, 음이항분포에서 성공 횟수를 1로 설정하면 기하분포와 동일해진다.

관련 항목

  • 베르누이 분포
  • 음이항분포
  • 지수분포 (기하분포의 연속형 대응)
  • 무기억성
  • 확률 질량 함수
둘러보기

더 찾아볼 만한 주제