편향 (통계학)

정의
통계학에서 편향(bias)은 표본 통계량이나 추정량이 모수(parameter)와 기대값(expectation) 사이에 체계적으로 차이가 나는 현상을 의미한다. 즉, 무작위 오차가 아닌 일정한 방향으로 발생하는 오류를 말한다.

개요
편향은 자료 수집·측정·분석 과정에서 발생할 수 있으며, 연구 결과의 일반화 가능성을 저해한다. 대표적인 편향 사례로는 표본 편향(sample bias), 선택 편향(selection bias), 측정 편향(measurement bias), 모델 편향(model bias) 등이 있다. 편향이 존재하면 추정값이 일관되게 실제 모수보다 크거나 작게 되며, 통계적 추론의 신뢰도와 타당성이 손상된다. 따라서 통계 분석에서는 편향을 최소화하거나 교정하는 절차가 중요하다.

어원/유래
‘편향’은 한자어 ‘偏向’에서 온 것으로, ‘편(偏)’은 ‘한쪽으로 치우쳐 있음’이라는 뜻이고, ‘향(向)’은 ‘향하다, 가리키다’를 의미한다. 통계학에서 이 용어는 영어 ‘bias’를 번역한 것으로, 20세기 초부터 통계 이론 및 실험 설계 분야에서 널리 사용되었다.

특징

  1. 체계성 : 무작위 오차와 달리 편향은 특정 방향을 가지고 반복적으로 나타난다.
  2. 복구 가능성 : 설계 단계에서 무작위 표집, 블라인드 처리, 사전 검증 등을 통해 편향을 예방하거나, 사후에 가중치 조정, 회귀 보정 등으로 교정할 수 있다.
  3. 측정 지표 : 추정량의 기대값과 실제 모수와의 차이(E[θ̂]‑θ)로 정의되며, 편향이 0이면 불편(unbiased)한 추정량이라고 한다.
  4. 정확도와의 관계 : 편향이 존재하면 평균 제곱 오차(MSE)는 편향의 제곱과 분산의 합으로 표현되며( MSE = Bias² + Var ), 편향이 작아지면 전체 추정 정확도가 향상된다.

관련 항목

  • 표본 편향
  • 선택 편향
  • 측정 편향
  • 공정 편향 (algorithmic bias)
  • 불편 추정량
  • 평균 제곱 오차(MSE)
  • 무작위 표집(Random Sampling)
  • 실험 설계(Experimental Design)

※ 본 항목은 통계학 분야에서 일반적으로 인정받는 개념을 기반으로 작성되었으며, 구체적인 사례나 최신 연구 동향에 대한 상세 내용은 별도 전문 서적이나 논문을 참고하시기 바랍니다.

둘러보기

더 찾아볼 만한 주제