결합확률분포

결합확률분포 (Joint Probability Distribution)는 두 개 이상의 확률 변수가 동시에 특정 값을 가질 확률을 나타내는 분포입니다. 즉, 여러 확률 변수 간의 관계를 종합적으로 보여주는 확률 분포라 할 수 있습니다. 개별 확률 변수의 분포를 나타내는 주변 확률 분포와 달리, 결합확률분포는 변수들 간의 상호 의존성을 파악하는 데 유용합니다.

정의 및 특징

만약 X와 Y가 이산 확률 변수라면, 결합확률질량함수 (Joint Probability Mass Function, PMF)는 다음과 같이 정의됩니다.

  • P(X = x, Y = y): X가 x값을 가지고 Y가 y값을 가질 확률

연속 확률 변수의 경우, 결합확률밀도함수 (Joint Probability Density Function, PDF)를 사용하며, 다음과 같이 정의됩니다.

  • f(x, y): X와 Y가 각각 x와 y 근처의 값을 가질 확률 밀도

결합확률분포는 다음의 속성을 가집니다.

  • 모든 가능한 (x, y) 값에 대해 P(X = x, Y = y) 또는 *f(x, y)*는 0보다 크거나 같아야 합니다.
  • 이산형의 경우, 모든 가능한 (x, y) 값에 대한 확률의 합은 1입니다. 즉, ∑x ∑y P(X = x, Y = y) = 1
  • 연속형의 경우, 전 구간에 대한 이중 적분 값이 1입니다. 즉, ∬ f(x, y) dx dy = 1

활용

결합확률분포는 다음과 같은 상황에서 활용됩니다.

  • 조건부 확률 계산: 하나의 변수가 특정 값을 가질 때 다른 변수가 특정 값을 가질 확률을 계산하는 데 사용됩니다 (예: P(Y = y | X = x)).
  • 변수 간 독립성 판단: 두 변수가 독립인지 여부를 판단하는 데 사용됩니다. X와 Y가 독립이라면, *P(X = x, Y = y) = P(X = x) * P(Y = y)*가 성립합니다.
  • 기댓값 계산: 결합확률분포를 통해 여러 변수로 구성된 함수의 기댓값을 계산할 수 있습니다.
  • 베이즈 정리 적용: 베이즈 정리를 사용하여 사전 확률을 사후 확률로 업데이트할 때 결합확률분포가 활용됩니다.

예시

두 개의 주사위를 던지는 경우를 생각해 봅시다. X를 첫 번째 주사위의 결과, Y를 두 번째 주사위의 결과라고 할 때, (X, Y)의 결합확률분포는 각 조합 (예: X=1, Y=1; X=1, Y=2 등)에 대한 확률을 나타냅니다. 만약 두 주사위가 독립이라면, 각 조합의 확률은 1/36이 됩니다.

관련 개념

  • 주변 확률 분포 (Marginal Probability Distribution)
  • 조건부 확률 분포 (Conditional Probability Distribution)
  • 독립 (Independence)
  • 베이즈 정리 (Bayes' Theorem)
둘러보기

더 찾아볼 만한 주제