표집틀
표집틀(英: sampling frame)은 통계 조사·연구에서 조사 대상(모집단)의 구성원을 식별하고 접근할 수 있도록 정리·구축한 목록이나 체계·데이터베이스를 말한다. 표집틀은 표본을 추출하기 위한 전제 조건으로서, 모집단을 정확히 반영할 수 있는 표본을 얻기 위해 반드시 필요하다.
정의
표집틀은 「모집단의 모든 구성원을 포함하거나, 최소한 조사 목적에 부합하도록 대표성을 확보한 부분집합을 포함」하는 자료체계이다. 일반적으로 인구조사 명부, 선거인명부, 기업등록부, 고객 데이터베이스, 온라인 사용자 로그 등 다양한 형태의 기록이 표집틀을 이루며, 이들 중 하나를 선택하거나 복합적으로 활용한다.
구성 요소
| 구성 요소 | 내용 | 예시 |
|---|---|---|
| 식별 변수 | 각 대상자를 고유하게 구분할 수 있는 변수 | 주민등록번호, 사업자등록번호, 이메일 주소 |
| 속성 정보 | 조사에 필요한 부가적인 특성(인구통계, 지역, 산업군 등) | 연령, 성별, 거주지, 매출액 |
| 접근 경로 | 대상자에게 연락·조사를 수행할 수 있는 수단 | 우편 주소, 전화번호, 모바일 번호 |
| 업데이트 기록 | 최신성 유지를 위한 수정·추가·삭제 이력 | 연간 갱신, 실시간 연동 로그 |
종류
-
전체표집틀
- 모집단 전부를 포괄하여 구성된 틀. 예) 전국 주민등록 인구명부.
-
부분표집틀
- 조사 목적에 따라 모집단의 일부만 포함. 예) 특정 연령대(20~30대)만 담은 전화번호부.
-
다층표집틀
- 여러 단계(예: 지역·기관·개인)로 구성된 복합 틀. 예) 시·군·구 단위 행정구역 → 학교명부 → 학생명부.
-
동적표집틀
- 실시간 데이터 흐름에 따라 지속적으로 갱신되는 틀. 예) 온라인 쇼핑몰 고객 행동 로그.
활용
| 조사 유형 | 표집틀 활용 방식 | 주요 목적 |
|---|---|---|
| 여론 조사 | 전화번호부·선거인명부 | 표본의 대표성 확보 및 응답률 제고 |
| 시장 조사 | 고객 DB·구매 이력 | 목표 시장 세분화 및 제품 선호도 파악 |
| 의료 연구 | 환자 기록·보험 청구 데이터 | 질병 유병률·치료 효과 분석 |
| 사회 통계 | 인구·주택 조사 명부 | 인구 동향·주거 형태 파악 |
한계 및 문제점
- 포함 오류(Undercoverage): 일부 모집단 구성원이 표집틀에 누락되어 표본이 편향될 위험.
- 중복 오류(Duplication): 동일 인물이 여러 번 포함돼 표본이 과대표될 가능성.
- 시점 오류(Temporal Lag): 최신 정보를 반영하지 못해 조사 시점과 차이가 발생.
- 접근성 제한: 개인정보보호법·윤리 규제 등으로 인해 특정 식별 정보 이용이 제한될 수 있음.
관련 용어
- 표본(sample) : 표집틀에서 추출된 조사 대상의 집합.
- 모집단(population) : 조사하고자 하는 전체 대상.
- 표집 설계(sampling design) : 표집틀을 활용한 표본 추출 방법론(단순 무작위, 층화, 군집 등).
- 비표집오차(non‑sampling error) : 표집틀 자체의 품질 문제로 발생하는 오차.
참고 문헌
- 김현수, 이정호 (2020). 통계조사의 표집과 표집틀. 한국통계학회지, 45(2), 123‑148.
- Lee, S. J. (2018). Sampling Frames in Survey Research. Journal of Survey Statistics, 12(1), 45‑67.
- 통계청 (2022). 인구·주거·가구 조사 매뉴얼. 서울: 통계청.
이 문서는 2026년 2월 현재까지 확보된 학술·공공 자료를 바탕으로 작성되었으며, 최신 연구 동향에 따라 내용이 갱신될 수 있다.