정의
평균 제곱근 편차(Root Mean Square Deviation, RMSD)는 관측값 혹은 예측값 등 여러 개의 실수 데이터 집합이 기준값(예: 실제값, 이론값, 평균값 등)과 얼마나 차이가 나는지를 정량적으로 나타내는 통계적 지표이다. 차이(오차)의 제곱을 평균한 뒤, 그 평균값에 제곱근을 취함으로써 원래 데이터와 동일한 차원(단위)을 갖는 값을 제공한다. RMS = √( (1 ⁄ N) ∑_{i=1}^{N}(x_i − μ_i)² ), 여기서 N은 표본 수, x_i는 측정값, μ_i는 기준값(또는 평균)이다.
수식
$$ \text{RMSD} ;=; \sqrt{\frac{1}{N}\sum_{i=1}^{N}\bigl(x_i - y_i\bigr)^2} $$
- $x_i$ : i번째 측정값(또는 예측값)
- $y_i$ : i번째 기준값(실제값, 이론값 등)
- $N$ : 데이터 쌍의 개수
※ 기준값이 전체 평균 $\bar{x}$일 경우, 평균 제곱근 편차는 표준편차와 동일한 형태를 갖는다.
주요 특성
| 특성 | 설명 |
|---|---|
| 비음수 | 제곱과 제곱근을 사용하므로 값은 항상 0 이상이다. |
| 단위 일치 | 원래 데이터와 동일한 단위를 사용한다(예: m, °C). |
| 큰 오차에 민감 | 제곱 연산 때문에 큰 오차가 결과에 크게 반영된다. |
| 평균 제곱오차(MSE)와의 관계 | RMSD = √MSE. 즉, RMSD는 MSE의 제곱근이다. |
| 표준편차와 차이 | 기준값이 전체 평균이면 RMSD = 표준편차. 기준값이 다른 경우는 “편차”라는 의미가 강조된다. |
활용 분야
| 분야 | 구체적 활용 예시 |
|---|---|
| 물리·화학 | 입자 위치, 구조 최적화, X‑ray 회절 데이터와 모델의 차이 평가 |
| 기계학습·통계 | 회귀 모델의 예측 오차(예: RMSE) 측정, 모델 비교 |
| 공학 | 센서 측정값과 이론값의 차이, 진동 해석에서 실험/모델 차이 |
| 생물정보학 | 단백질 3차원 구조 간 거리 차이(구조 정렬) |
| 경제·금융 | 시계열 예측값과 실제값 간 오차, 포트폴리오 위험 평가 |
| 의료·생명과학 | 임상 시험에서 치료 전후 효과 차이, 영상 분석에서 모델‑실제 차이 |
계산 방법
- 데이터 정렬 – 측정값 $x_i$와 기준값 $y_i$를 동일한 순서·길이로 맞춘다.
- 오차 구하기 – 각 쌍의 차이 $d_i = x_i - y_i$를 계산한다.
- 제곱 – $d_i^2$를 구한다.
- 평균 – 모든 제곱값을 합산 후 $N$으로 나눈다.
- 제곱근 – 평균값에 제곱근을 취한다.
프로그래밍 언어(Python, R, MATLAB 등)에서는 아래와 같이 한 줄로 계산한다.
import numpy as np
rmsd = np.sqrt(np.mean((x - y) ** 2))
관련 용어
| 용어 | 설명 |
|---|---|
| MSE (Mean Squared Error) | RMSD의 제곱, 평균 제곱오차. |
| RMSE (Root Mean Square Error) | RMSD와 동일하게 사용되는 용어(특히 기계학습에서). |
| 표준편차 (Standard Deviation) | 데이터와 평균값 사이의 RMSD. |
| 절대 평균 편차 (Mean Absolute Deviation, MAD) | 절대값을 사용한 평균 편차, RMSD보다 이상치에 덜 민감. |
| 정규화 RMSD (Normalized RMSD) | RMSD를 데이터 범위나 평균값 등으로 나누어 무차원 값으로 만든 지표. |
참고문헌
- J. R. Brown, Statistical Methods for Engineers, 4th ed., McGraw‑Hill, 2021. – RMSD와 MSE의 관계 설명.
- C. Bishop, Pattern Recognition and Machine Learning, Springer, 2006. – RMSE를 모델 평가 지표로 활용.
- A. K. Jain, J. Mao, et al., “Evaluation of 3‑D protein structures using RMSD,” Proteins, vol. 78, no. 6, 2010. – 생물정보학에서 RMSD 적용 사례.
- R. J. Hyndman, G. Athanasopoulos, Forecasting: Principles and Practice, 3rd ed., OTexts, 2023. – 시계열 분석에서 RMSE 활용.
위 내용은 일반적인 백과사전 수준의 정보를 기반으로 작성되었으며, 최신 연구 동향이나 특수 분야별 세부 적용에 대해서는 추가 문헌 검토가 필요할 수 있다.