보존 메타데이터

보존 메타데이터는 디지털 자산을 장기간 안전하게 보관하고, 향후 이용 가능하도록 유지하기 위해 필요한 정보를 기록한 메타데이터이다. 일반 메타데이터가 주로 자원의 발견·식별·접근에 초점을 맞춘다면, 보존 메타데이터는 자원의 무결성, 보존 전략, 기술적·법적 환경 변화에 대한 대응 등 보존 과정 전체를 지원하는 정보를 제공한다.


1. 정의

보존 메타데이터는 디지털 콘텐츠의 보존( preservation ) 목적에 특화된 메타데이터 요소들의 집합으로, 디지털 자산이 시간의 흐름에 따라 손상되거나 접근 불가능해지는 위험을 최소화하고, 필요 시 복구·재생성할 수 있도록 설계된다. 국제표준인 OAIS (Open Archival Information System) 모델에서 “Information Package”의 일환으로 정의되며, 특히 Preservation Description Information (PDI) 를 구성한다.

2. 목적

  1. 무결성 보장 – 파일 해시값, 체크섬, 포맷 변환 기록 등을 통해 데이터가 변조되지 않았음을 확인한다.
  2. 재생성·복구 지원 – 원본 포맷, 변환 이력, 종속 라이브러리·소프트웨어 정보 등을 제공해 미래의 환경에서도 데이터를 재생할 수 있게 한다.
  3. 법적·저작권 관리 – 권리 정보, 접근 제한 조건, 보존 정책 등을 명시한다.
  4. 보존 정책·절차 문서화 – 보존 일정, 백업 주기, 하드웨어 교체 계획 등 운영상의 정보를 기록한다.
  5. 디지털 자산의 장기적 가용성 확보 – 기술적·환경적 변화에 대비해 지속적인 관리와 업데이트를 가능하게 한다.

3. 주요 요소(핵심 메타데이터 항목)

구분 설명 예시
식별 정보 (Identifier) 보존 대상 자산의 고유 식별자 DOI, ARK, UUID
형식 정보 (Format) 파일 포맷, 버전, MIME 타입 PDF/A‑2b, TIFF, JPEG2000
무결성 정보 (Fixity) 체크섬, 해시값, 검증 기록 SHA‑256, MD5
보존 정책 (Preservation Policy) 보존 목표, 기간, 액세스 제한 “10년 보존, 공개 접근”
기술 환경 (Environment) 필요 소프트웨어·하드웨어, 종속성 “Adobe Acrobat 9 이상 필요”
권리 및 라이선스 (Rights) 저작권, 사용 제한, 라이선스 “CC BY‑NC 4.0”
재생성 정보 (Provenance) 변환·마이그레이션 이력, 작업자 “2005→2008 포맷 변환 기록”
접근 로그 (Access Log) 이용·조회 기록 (선택적) “2023‑01‑15 접근 3회”
보존 상태 (Preservation Status) 현재 보존 단계·상태 “활성 보존”, “아카이브 단계”

4. 국제·국가 표준

표준명 발행기관 주요 내용
OAIS 모델 ISO/TC 46/SC 9 디지털 아카이브 구조와 보존 메타데이터(PDI) 정의
PREMIS Library of Congress 보존 메타데이터 핵심 요소(객체, 에이전트, 이벤트, 권리) 정의
METS Library of Congress 메타데이터와 디지털 객체를 포괄적으로 묶는 컨테이너 형식
Dublin Core (보존 확장) OASIS 기본 메타데이터에 보존 관련 요소 추가
ISO 16363 ISO 디지털 보존 인증 기준, 보존 메타데이터 관리 요구사항 포함
KISA 디지털 보존 가이드라인 한국인터넷진흥원 한국 내 공공·민간 기관용 보존 메타데이터 실무 가이드

5. 활용 사례

  1. 국립중앙도서관 디지털보존 – 한국어 고전 문헌을 PDF/A 형식으로 변환하고, PREMIS 기반 보존 메타데이터를 부착해 장기 보관.
  2. NASA 과학 데이터 아카이브 – 원시 이미지와 시뮬레이션 데이터를 METS와 PREMIS 메타데이터로 관리, 향후 재처리 가능성 확보.
  3. 기업 전자문서 보관 시스템 – 계약서·재무보고서 등을 ISO 16363 인증을 위한 보존 메타데이터와 함께 저장, 법적 증거력 유지.
  4. 학술 저널 출판사 – 논문 PDF를 PDF/A 변환 후, DOI와 보존 정책을 포함한 메타데이터를 기록해 장기 접근성을 보장.

6. 보존 메타데이터와 관련된 개념

  • 디지털 보존(Digital Preservation): 디지털 형식의 자료를 변질·소실 없이 장기적으로 보존하는 활동 전체.
  • 메타데이터(Metadata): 데이터에 대한 정보를 기술하는 데이터.
  • OAIS(Open Archival Information System): 디지털 아카이브 시스템의 국제 표준 모델.
  • FIXITY: 무결성 검증을 위한 체크섬·해시값 관리 방법.

7. 구현 시 고려사항

  1. 표준 준수 – 국제 표준(PREMIS, METS 등)을 기반으로 메타데이터 스키마를 설계한다.
  2. 자동화 – 파일 입수 시 자동으로 체크섬 생성·포맷 식별·메타데이터 삽입 프로세스를 구축한다.
  3. 버전 관리 – 메타데이터 자체도 변경 이력을 남겨 버전 관리가 가능하도록 설계한다.
  4. 보안 – 메타데이터에 포함된 권리·법적 정보는 접근 제어와 암호화를 적용한다.
  5. 인터페이스 – 다른 시스템(디지털 리포지터리, 보존 시스템, 검색 엔진)과 메타데이터 교환을 위한 API와 표준 포맷을 제공한다.

8. 참고문헌 및 추가 자료

  • Library of Congress, “PREMIS Data Dictionary for Preservation Metadata” (2022)
  • ISO/IEC 14721:2012 – “Space data and information transfer systems — Open Archival Information System (OAIS) Reference Model”
  • 한국인터넷진흥원, “디지털 보존 가이드라인” (2021)
  • R. L. Brown, “Digital Preservation: A Practical Guide for Librarians”, ALA, 2020

보존 메타데이터는 디지털 문화유산을 미래 세대에게 안전하게 전달하기 위한 핵심 인프라 중 하나이며, 적절한 설계·운영을 통해 데이터 손실 위험을 크게 낮출 수 있다.

둘러보기

더 찾아볼 만한 주제