인과 추론

정의
인과 추론(因果 推論)은 관찰 데이터나 실험 데이터를 바탕으로 변수들 간의 인과 관계, 즉 한 변수의 변화가 다른 변수에 미치는 원인·결과를 추정하고 판단하는 방법론을 의미한다. 통계학, 경제학, 의학, 사회과학, 인공지능 등 다양한 학문 분야에서 원인과 결과를 명확히 규명하기 위해 활용된다.

개요
인과 추론은 단순히 변수 간의 상관관계를 분석하는 통계적 추론과 구별된다. 인과 관계를 밝히기 위해서는 ‘비인과적 설명’을 배제하고, 원인 변수의 조작·변경이 결과 변수에 미치는 효과를 객관적으로 평가해야 한다. 주요 접근 방식으로는 다음과 같다.

  • 무작위 대조 실험(Randomized Controlled Trial, RCT) – 실험 조건을 무작위로 배정함으로써 잠재적 혼동 변수를 통제한다.
  • 관찰 연구(Observational Study) 기반 방법 – 무작위 배정이 불가능한 경우, 통계적 기법으로 잠재적 교란을 보정한다. 주요 기법으로는 성향 점수 매칭(propensity score matching), 도구 변수(instrumental variable) 분석, 차분의 차분(Difference‑in‑Differences) 등이 있다.
  • 잠재 결과 프레임워크(Potential Outcomes Framework) – ‘처리 효과(treatment effect)’를 정의하고, 처리와 비처리 상황에서의 잠재적 결과를 비교한다.
  • 구조적 인과 모델(Structural Causal Model, SCM) – 방향성 그래프(Directed Acyclic Graph, DAG)를 이용해 변수 간 인과 구조를 시각화하고, ‘do‑연산(do‑calculus)’을 통해 조작 효과를 계산한다.

현대 인과 추론은 조던 피어슨(Judea Pearl), 도널드 루빈(Donald Rubin) 등 학자의 이론적 기여에 기반을 두며, 인공지능 분야에서는 인과 그래프와 베이지안 네트워크를 활용한 인과 추론이 활발히 연구되고 있다.

어원·유래
‘인과(因果)’는 한자어로 ‘원인·결과’를 뜻하며, ‘추론(推論)’은 ‘추정·추리’를 의미한다. 따라서 ‘인과 추론’은 문자 그대로 “원인과 결과를 추정하는 과정”이라는 뜻이다. 영어 표기인 causal inference를 번역하면서 형성된 용어이며, 20세기 후반부터 통계학·계량경제학 분야에서 본격적으로 사용되기 시작했다.

특징

구분 내용
핵심 전제 인과 효과를 정확히 추정하려면 교란 변수의 통제, 무작위 배정(가능한 경우), 혹은 적절한 구조적 가정이 필요하다.
주요 가정 1. 무관성(Exchangeability) – 처치와 비처치 군이 잠재적 교란 변수에 대해 동등함.
2. 일관성(Consistency) – 관측된 결과는 실제 처리 효과와 동일함.
3. 양립 불가능성(Positivity) – 모든 공변량 조합에 대해 처치와 비처치가 모두 관찰될 확률이 양수.
방법론적 다양성 회귀 분석, 베이지안 추정, 머신러닝(예: 인공신경망 기반 인과 추정), 구조 방정식 모델(SEM), 도-연산을 이용한 그래프 분석 등.
응용 분야 의료 연구(치료 효과 평가), 정책 분석(복지 정책의 영향), 마케팅(광고 효과), 기계 학습(인과적 강화 학습), 사회 과학 등.
제한점 가정 위반 시 편향된 추정이 발생할 수 있으며, 관측 데이터만으로는 완전한 인과 구조를 식별하기 어려운 경우가 많다. 정확한 인과 추론을 위해서는 도메인 지식과 통계적 검증이 병행되어야 한다.

관련 항목

  • 인과 관계
  • 구조적 인과 모델(Structural Causal Model, SCM)
  • 잠재 결과 프레임워크(Potential Outcomes Framework)
  • 무작위 대조 실험(Randomized Controlled Trial)
  • 성향 점수 매칭(Propensity Score Matching)
  • 도구 변수(Instrumental Variable)
  • 차분의 차분(Difference‑in‑Differences)
  • 베이지안 네트워크(Bayesian Network)
  • 인과 그래프(Causal Graph)
  • 도‑연산(do‑calculus)

※ 본 항목은 인과 추론에 관한 일반적인 학술·실무적 정의와 특성을 기반으로 작성되었으며, 구체적 방법론에 대한 자세한 내용은 각 전문 서적·논문을 참고한다.

둘러보기

더 찾아볼 만한 주제