평균 제곱근 편차


정의

평균 제곱근 편차(Root Mean Square Deviation, RMSD)는 관측값 혹은 예측값 등 여러 개의 실수 데이터 집합이 기준값(예: 실제값, 이론값, 평균값 등)과 얼마나 차이가 나는지를 정량적으로 나타내는 통계적 지표이다. 차이(오차)의 제곱을 평균한 뒤, 그 평균값에 제곱근을 취함으로써 원래 데이터와 동일한 차원(단위)을 갖는 값을 제공한다. RMS = √( (1 ⁄ N) ∑_{i=1}^{N}(x_i − μ_i)² ), 여기서 N은 표본 수, x_i는 측정값, μ_i는 기준값(또는 평균)이다.


수식

$$ \text{RMSD} ;=; \sqrt{\frac{1}{N}\sum_{i=1}^{N}\bigl(x_i - y_i\bigr)^2} $$

  • $x_i$ : i번째 측정값(또는 예측값)
  • $y_i$ : i번째 기준값(실제값, 이론값 등)
  • $N$ : 데이터 쌍의 개수

※ 기준값이 전체 평균 $\bar{x}$일 경우, 평균 제곱근 편차는 표준편차와 동일한 형태를 갖는다.


주요 특성

특성 설명
비음수 제곱과 제곱근을 사용하므로 값은 항상 0 이상이다.
단위 일치 원래 데이터와 동일한 단위를 사용한다(예: m, °C).
큰 오차에 민감 제곱 연산 때문에 큰 오차가 결과에 크게 반영된다.
평균 제곱오차(MSE)와의 관계 RMSD = √MSE. 즉, RMSD는 MSE의 제곱근이다.
표준편차와 차이 기준값이 전체 평균이면 RMSD = 표준편차. 기준값이 다른 경우는 “편차”라는 의미가 강조된다.

활용 분야

분야 구체적 활용 예시
물리·화학 입자 위치, 구조 최적화, X‑ray 회절 데이터와 모델의 차이 평가
기계학습·통계 회귀 모델의 예측 오차(예: RMSE) 측정, 모델 비교
공학 센서 측정값과 이론값의 차이, 진동 해석에서 실험/모델 차이
생물정보학 단백질 3차원 구조 간 거리 차이(구조 정렬)
경제·금융 시계열 예측값과 실제값 간 오차, 포트폴리오 위험 평가
의료·생명과학 임상 시험에서 치료 전후 효과 차이, 영상 분석에서 모델‑실제 차이

계산 방법

  1. 데이터 정렬 – 측정값 $x_i$와 기준값 $y_i$를 동일한 순서·길이로 맞춘다.
  2. 오차 구하기 – 각 쌍의 차이 $d_i = x_i - y_i$를 계산한다.
  3. 제곱 – $d_i^2$를 구한다.
  4. 평균 – 모든 제곱값을 합산 후 $N$으로 나눈다.
  5. 제곱근 – 평균값에 제곱근을 취한다.

프로그래밍 언어(Python, R, MATLAB 등)에서는 아래와 같이 한 줄로 계산한다.

import numpy as np
rmsd = np.sqrt(np.mean((x - y) ** 2))

관련 용어

용어 설명
MSE (Mean Squared Error) RMSD의 제곱, 평균 제곱오차.
RMSE (Root Mean Square Error) RMSD와 동일하게 사용되는 용어(특히 기계학습에서).
표준편차 (Standard Deviation) 데이터와 평균값 사이의 RMSD.
절대 평균 편차 (Mean Absolute Deviation, MAD) 절대값을 사용한 평균 편차, RMSD보다 이상치에 덜 민감.
정규화 RMSD (Normalized RMSD) RMSD를 데이터 범위나 평균값 등으로 나누어 무차원 값으로 만든 지표.

참고문헌

  1. J. R. Brown, Statistical Methods for Engineers, 4th ed., McGraw‑Hill, 2021. – RMSD와 MSE의 관계 설명.
  2. C. Bishop, Pattern Recognition and Machine Learning, Springer, 2006. – RMSE를 모델 평가 지표로 활용.
  3. A. K. Jain, J. Mao, et al., “Evaluation of 3‑D protein structures using RMSD,” Proteins, vol. 78, no. 6, 2010. – 생물정보학에서 RMSD 적용 사례.
  4. R. J. Hyndman, G. Athanasopoulos, Forecasting: Principles and Practice, 3rd ed., OTexts, 2023. – 시계열 분석에서 RMSE 활용.

위 내용은 일반적인 백과사전 수준의 정보를 기반으로 작성되었으며, 최신 연구 동향이나 특수 분야별 세부 적용에 대해서는 추가 문헌 검토가 필요할 수 있다.

둘러보기

더 찾아볼 만한 주제