마르코프 연쇄
마르코프 연쇄 (Markov chain)는 확률 과정의 일종으로, 미래 상태가 현재 상태에만 의존하고 과거 상태와는 독립적인 특성을 갖는 것을 말한다. 즉, "마르코프 성질"을 만족하는 이산 시간 확률 과정이다. 이러한 특성은 "기억 상실성" 또는 "무기억성"이라고도 불린다.
정의
마르코프 연쇄는 상태 공간 S와 전이 확률 행렬 P로 정의된다. 상태 공간 S는 시스템이 가질 수 있는 모든 가능한 상태들의 집합이며, 전이 확률 행렬 P는 상태 i에서 상태 j로 이동할 확률 Pij를 나타낸다. 전이 확률 Pij는 시간 t에 상태 i에 있을 때 시간 t+1에 상태 j에 있을 조건부 확률 P(Xt+1=j | Xt=i)로 표현된다.
특성
- 마르코프 성질 (Markov Property): 현재 상태가 주어졌을 때, 과거 상태는 미래 상태에 영향을 미치지 않는다. 즉, P(Xt+1 = j | X1 = x1, X2 = x2, ..., Xt = i) = P(Xt+1 = j | Xt = i)이다.
- 이산 시간: 시간 간격이 이산적이다. 각 상태는 특정 시점에만 존재한다.
- 상태 공간: 상태 공간은 유한할 수도 있고 무한할 수도 있다.
- 정상성 (Stationarity): 전이 확률이 시간에 따라 변하지 않는 경우, 해당 마르코프 연쇄는 정상성을 갖는다고 한다. 즉, P(Xt+1 = j | Xt = i)는 t에 무관하다.
활용 분야
마르코프 연쇄는 다양한 분야에서 활용된다.
- 통계 물리학: 기체 분자의 움직임 모델링
- 정보 이론: 데이터 압축 및 통신 시스템 설계
- 금융 공학: 주가 예측 및 위험 관리
- 생물 정보학: 유전자 서열 분석
- 검색 엔진: 페이지랭크 알고리즘
- 자연어 처리: 품사 태깅, 기계 번역
예시
간단한 예로 날씨 변화를 들 수 있다. 만약 "맑음", "흐림", "비" 세 가지 상태가 있고, 특정 날씨에서 다음 날씨로 변할 확률이 전이 확률 행렬로 주어진다면, 마르코프 연쇄를 사용하여 날씨 변화를 예측할 수 있다. 예를 들어 오늘 날씨가 맑음일 때, 내일 날씨가 흐릴 확률은 30%, 비가 올 확률은 10% 등으로 나타낼 수 있다.
관련 용어
- 전이 확률 행렬 (Transition Probability Matrix)
- 정상 분포 (Stationary Distribution)
- 흡수 상태 (Absorbing State)
- 에르고딕 성질 (Ergodicity)
- 은닉 마르코프 모델 (Hidden Markov Model)