정의
비디오 트래킹(Video tracking)은 연속적인 영상(비디오)에서 특정 물체나 영역의 위치를 시간에 따라 추적하는 기술 및 알고리즘을 의미한다. 컴퓨터 비전 분야에서 객체의 이동 경로를 파악하거나 행동을 분석하기 위해 사용된다.
개요
비디오 트래킹은 프레임별로 얻어진 영상 데이터를 바탕으로 목표 객체의 위치, 속도, 형태 변화를 지속적으로 추정한다. 주요 활용 분야로는 감시 시스템, 인간–컴퓨터 인터페이스, 자율 주행 차량, 스포츠 분석, 증강 현실 등이 있다. 전통적인 방법에서는 색상, 텍스처, 모양 등 저수준 특징을 이용한 추적이 주를 이루었으며, 최근에는 딥러닝 기반의 추적기가 높은 정확도와 견고성을 제공한다. 일반적인 트래킹 파이프라인은 목표 객체의 초기 위치 설정 → 특징 추출 → 상태 예측 → 매칭/업데이트 순으로 이루어진다.
어원/유래
‘비디오(video)’는 라틴어 video “보이다”에서 유래한 영단어이며, ‘트래킹(tracking)’은 ‘추적하다’라는 의미의 영어 동사 track에 명사형 어미 -ing가 붙은 형태이다. 두 단어가 결합된 ‘비디오 트래킹’은 영어 표현 video tracking을 한국어로 그대로 차용한 용어이다. 한국어에서는 주로 학술·기술 문헌과 산업 현장에서 영문 그대로 사용하거나 ‘영상 추적’이라는 번역어와 병행한다.
특징
- 실시간성: 실시간 응용을 위해 연산 효율성이 중요한 요소이며, GPU 가속 및 경량 모델이 활용된다.
- 다양한 추적 방식:
- 점 기반 트래킹(point tracking) – 특징점(예: 코너)을 추적.
- 커널 기반 트래킹(kernel tracking) – 전체 객체 영역을 하나의 커널로 모델링.
- 실루엣 기반 트래킹(silhouette tracking) – 객체 외곽선을 이용.
- 알고리즘: 칼만 필터, 파티클 필터, 옵티컬 플로우, 서포트 벡터 머신, 컨볼루션 신경망(CNN) 등 다양한 방법이 적용된다.
- 도전 과제: 조명 변화, 가림(occlusion), 급격한 움직임, 배경 복잡도 등으로 인한 추적 오류가 주요 연구 주제이다.
관련 항목
- 컴퓨터 비전
- 객체 검출(Object detection)
- 영상 분할(Image segmentation)
- 움직임 분석(Motion analysis)
- 딥러닝 기반 추적(Deep learning based tracking)
- 칼만 필터(Kalman filter)
- 파티클 필터(Particle filter)
- 옵티컬 플로우(Optical flow)
- 증강 현실(Augmented reality)