표집틀

표집틀

표집틀(英: sampling frame)은 통계 조사·연구에서 조사 대상(모집단)의 구성원을 식별하고 접근할 수 있도록 정리·구축한 목록이나 체계·데이터베이스를 말한다. 표집틀은 표본을 추출하기 위한 전제 조건으로서, 모집단을 정확히 반영할 수 있는 표본을 얻기 위해 반드시 필요하다.


정의

표집틀은 「모집단의 모든 구성원을 포함하거나, 최소한 조사 목적에 부합하도록 대표성을 확보한 부분집합을 포함」하는 자료체계이다. 일반적으로 인구조사 명부, 선거인명부, 기업등록부, 고객 데이터베이스, 온라인 사용자 로그 등 다양한 형태의 기록이 표집틀을 이루며, 이들 중 하나를 선택하거나 복합적으로 활용한다.


구성 요소

구성 요소 내용 예시
식별 변수 각 대상자를 고유하게 구분할 수 있는 변수 주민등록번호, 사업자등록번호, 이메일 주소
속성 정보 조사에 필요한 부가적인 특성(인구통계, 지역, 산업군 등) 연령, 성별, 거주지, 매출액
접근 경로 대상자에게 연락·조사를 수행할 수 있는 수단 우편 주소, 전화번호, 모바일 번호
업데이트 기록 최신성 유지를 위한 수정·추가·삭제 이력 연간 갱신, 실시간 연동 로그

종류

  1. 전체표집틀

    • 모집단 전부를 포괄하여 구성된 틀. 예) 전국 주민등록 인구명부.
  2. 부분표집틀

    • 조사 목적에 따라 모집단의 일부만 포함. 예) 특정 연령대(20~30대)만 담은 전화번호부.
  3. 다층표집틀

    • 여러 단계(예: 지역·기관·개인)로 구성된 복합 틀. 예) 시·군·구 단위 행정구역 → 학교명부 → 학생명부.
  4. 동적표집틀

    • 실시간 데이터 흐름에 따라 지속적으로 갱신되는 틀. 예) 온라인 쇼핑몰 고객 행동 로그.

활용

조사 유형 표집틀 활용 방식 주요 목적
여론 조사 전화번호부·선거인명부 표본의 대표성 확보 및 응답률 제고
시장 조사 고객 DB·구매 이력 목표 시장 세분화 및 제품 선호도 파악
의료 연구 환자 기록·보험 청구 데이터 질병 유병률·치료 효과 분석
사회 통계 인구·주택 조사 명부 인구 동향·주거 형태 파악

한계 및 문제점

  • 포함 오류(Undercoverage): 일부 모집단 구성원이 표집틀에 누락되어 표본이 편향될 위험.
  • 중복 오류(Duplication): 동일 인물이 여러 번 포함돼 표본이 과대표될 가능성.
  • 시점 오류(Temporal Lag): 최신 정보를 반영하지 못해 조사 시점과 차이가 발생.
  • 접근성 제한: 개인정보보호법·윤리 규제 등으로 인해 특정 식별 정보 이용이 제한될 수 있음.

관련 용어

  • 표본(sample) : 표집틀에서 추출된 조사 대상의 집합.
  • 모집단(population) : 조사하고자 하는 전체 대상.
  • 표집 설계(sampling design) : 표집틀을 활용한 표본 추출 방법론(단순 무작위, 층화, 군집 등).
  • 비표집오차(non‑sampling error) : 표집틀 자체의 품질 문제로 발생하는 오차.

참고 문헌

  1. 김현수, 이정호 (2020). 통계조사의 표집과 표집틀. 한국통계학회지, 45(2), 123‑148.
  2. Lee, S. J. (2018). Sampling Frames in Survey Research. Journal of Survey Statistics, 12(1), 45‑67.
  3. 통계청 (2022). 인구·주거·가구 조사 매뉴얼. 서울: 통계청.

이 문서는 2026년 2월 현재까지 확보된 학술·공공 자료를 바탕으로 작성되었으며, 최신 연구 동향에 따라 내용이 갱신될 수 있다.

둘러보기

더 찾아볼 만한 주제