정의
분자계통학은 DNA·RNA·단백질 서열과 같은 분자 수준의 생물학적 데이터를 이용하여 생물 종 또는 유전체 간의 진화적 계통관계를 추정하고 해석하는 학문 분야이다.
개요
분자계통학은 전통적인 형태학적 계통학이 제한적이었던 경우에 보완적인 정보를 제공함으로써 20세기 후반부터 생물학 및 의학 연구에 널리 활용되고 있다. 주요 연구 흐름은 다음과 같다.
- 표본 및 데이터 확보 – 유전자, 전체 유전체, 혹은 단백질 서열을 PCR, 차세대 시퀀싱(NGS) 등의 방법으로 확보한다.
- 서열 정렬 – 확보된 서열을 다중 서열 정렬(MSA) 알고리즘(예: Clustal, MUSCLE, MAFFT)으로 정렬한다.
- 진화 모델 선택 – 서열 변이를 설명하기 위한 확률 모델(예: Jukes‑Cantor, Kimura 2‑parameter, GTR 등)을 선택한다.
- 계통수 구축 – 거리법(UPGMA, Neighbor‑Joining), 최대우도법(Maximum Likelihood), 베이지안 추정법(Bayesian Inference) 등 다양한 통계적 방법으로 계통수를 추정한다.
- 검증 및 해석 – 부트스트랩, 베이지안 신뢰도 등으로 계통수의 신뢰성을 평가하고, 진화적 사건(분기, 융합, 유전자 획득·상실 등)을 해석한다.
이러한 과정은 종 분류, 종분화 시기 추정, 전염병 역학, 보전 생물학, 약물 표적 탐색 등 다양한 분야에 적용된다.
어원/유래
분자는 ‘분자(分子)’를, 계통은 ‘계통(系統)’을, 학은 ‘학문(學)’을 의미한다. 따라서 ‘분자계통학’은 ‘분자 수준에서 계통을 연구하는 학문’이라는 의미이며, 영어 용어 molecular phylogenetics를 한국어로 번역한 형태이다. 정확한 최초 사용 시점은 학술 문헌에 따라 차이가 있으나, 1990년대 초반부터 분자 데이터 기반 계통학 연구가 활발해지면서 일반화된 것으로 추정된다.
특징
- 데이터 기반: 형태적 특성보다 서열 데이터에 기반하므로 미세한 유전적 차이를 감지할 수 있다.
- 통계적 모델링: 서열 변이를 수학적 모델로 기술하여 객관적인 계통수 추정이 가능하다.
- 다양한 마커 사용: 미토콘드리아 DNA, 엽록체 DNA, 핵 DNA, 단백질 서열 등 여러 종류의 마커를 활용한다.
- 고해상도: 종 내·종 간 진화 관계를 높은 해상도로 파악할 수 있다.
- 다학제적 연계: 분자생물학, 생물정보학, 진화생물학 등과 긴밀히 연결되어 있다.
관련 항목
- 계통학
- 분자생물학
- 유전체학
- 진화생물학
- 계통수(Phylogenetic tree)
- DNA 시퀀싱
- 차세대 시퀀싱(NGS)
- 최대우도법(Maximum Likelihood)
- 베이즈 추정법(Bayesian Inference)
- 부트스트랩(Bootstrap)
※ 본 항목은 널리 알려진 학문 용어이며, 현재까지 확인된 주요 내용은 위와 같다.