곰퍼츠 분포
곰퍼츠 분포(Gompertz distribution)는 통계학에서 수명 분포를 모델링하는 데 사용되는 연속 확률 분포입니다. 특히, 노화 과정이나 마케팅 분야에서의 고객 생애 가치(Customer Lifetime Value, CLTV) 예측 등에서 활용됩니다. 벤자민 곰퍼츠(Benjamin Gompertz)가 1825년에 인간 사망률을 설명하기 위해 처음 제시했습니다.
곰퍼츠 분포는 생존 분석(survival analysis)에서 특정 시간 이후에도 생존할 확률을 나타내는 생존 함수를 정의하는 데 사용됩니다. 이 분포의 핵심적인 특징은 시간이 지남에 따라 실패율(hazard rate)이 지수적으로 증가한다는 것입니다. 즉, 시간이 흐를수록 특정 시점에 실패할 확률이 점점 더 높아진다는 것을 의미합니다. 이는 노화에 따른 사망률 증가와 같은 현상을 설명하는 데 적합합니다.
곰퍼츠 분포는 두 개의 매개변수, 즉 '척도 매개변수(scale parameter)' η (eta)와 '형상 매개변수(shape parameter)' b를 가집니다. 척도 매개변수는 분포의 척도를 결정하며, 형상 매개변수는 실패율의 증가 속도를 제어합니다. 형상 매개변수가 클수록 실패율이 더 빠르게 증가합니다.
수학적으로 곰퍼츠 분포의 확률 밀도 함수(Probability Density Function, PDF)는 다음과 같이 표현됩니다.
f(x; η, b) = (b/η) * exp( -x/η + exp(-x/η))
여기서 x는 시간 변수를 나타내며, x > 0 입니다.
곰퍼츠 분포는 곰퍼츠-메이컴 분포(Gompertz-Makeham distribution)의 특별한 경우로 간주될 수 있습니다. 곰퍼츠-메이컴 분포는 곰퍼츠 분포에 상수 실패율을 추가하여 다양한 상황에 더 잘 적용될 수 있도록 확장된 형태입니다.
곰퍼츠 분포는 수명 예측 외에도, 종양 성장 모델링, 신용 위험 평가, 그리고 소셜 네트워크 확산 모델링 등 다양한 분야에서 응용되고 있습니다.