확률 변수(隨機變數, random variable)는 확률론 및 통계학에서 사용되는 개념으로, 실험 결과에 따라 값이 달라지는 함수이다. 보다 구체적으로는 확률 공간 $(\Omega, \mathcal{F}, P)$의 표본점 $\omega \in \Omega$를 실수값 혹은 보다 일반적인 측정 가능한 공간의 원소에 대응시키는 가측 함수 $X : \Omega \rightarrow \mathbb{R}$ (또는 $\mathbb{R}^n$, 이산 집합 등)로 정의된다.
정의
- 가측성: $X$가 확률 공간의 $\sigma$-대수 $\mathcal{F}$와 실수 집합의 Borel $\sigma$-대수 $\mathcal{B}(\mathbb{R})$ 사이에서 가측함수일 때, 즉 모든 Borel 집합 $B \subseteq \mathbb{R}$에 대하여 $X^{-1}(B) \in \mathcal{F}$가 성립한다면 $X$를 확률 변수라 한다.
- 분포: 확률 변수 $X$에 의해 유도된 확률 측도 $\mu_X(B) = P(X \in B) = P\bigl({\omega \in \Omega \mid X(\omega) \in B}\bigr)$는 $X$의 분포(distribution)라 불리며, 연속형 경우에는 확률 밀도 함수(pdf), 이산형 경우에는 확률 질량 함수(pmf)로 표현된다.
종류
- 이산 확률 변수
- 값이 가산적인(예: 정수) 집합에만 취하는 경우. 대표적인 예로 베르누이 변수, 이항 변수, 포아송 변수 등이 있다.
- 연속 확률 변수
- 값이 실수 구간과 같이 연속적인 집합에 걸쳐 존재하는 경우. 정규 분포, 지수 분포, 균등 분포 등이 해당한다.
주요 특성
- 기댓값(Expectation) $E[X] = \int_{\Omega} X(\omega), dP(\omega)$ (이산형은 합, 연속형은 적분)
- 분산(Variance) $\operatorname{Var}(X) = E[(X - E[X])^2]$
- 모멘트(Moment) $E[X^k]$ (k차 모멘트)
- 공분산(Covariance) $ \operatorname{Cov}(X,Y) = E[(X-E[X])(Y-E[Y])] $
활용 분야
- 통계학: 표본 통계량, 추정량, 검정통계량 등은 모두 확률 변수로 모델링된다.
- 신호 및 시스템: 잡음 모델링, 무선 통신 채널 특성 등에 확률 변수가 사용된다.
- 머신러닝·인공지능: 확률적 모델(예: 베이지안 네트워크, 확률적 그래픽 모델)의 기본 단위.
관련 개념
- 확률 과정: 시간이나 공간에 따라 변화하는 확률 변수들의 집합.
- 가측 함수: 확률 변수는 가측 함수의 특수 형태.
- 측도 이론: 확률 변수와 그 분포는 측도 이론의 틀 안에서 정의된다.
참고 문헌
- Feller, William. An Introduction to Probability Theory and Its Applications. Wiley, 1968.
- Casella, George; Berger, Roger L. Statistical Inference. Duxbury Press, 2002.
- 김성호, 김태환. 확률과 통계. 서울: 교학사, 2015.