정의
바이너리 이미지(Binary image)는 디지털 이미지의 한 형태로, 각 픽셀이 두 가지 값 중 하나만을 가질 수 있는 1비트 이미지이다. 일반적으로 0은 검은색(또는 배경), 1은 흰색(또는 전경)으로 표현되며, 색상의 깊이가 없는 흑백 형태를 의미한다.
특징
| 구분 | 내용 |
|---|---|
| 비트 깊이 | 1비트(2가지 색상) |
| 색상표현 | 검은색(0) / 흰색(1) 또는 반대로 정의 가능 |
| 데이터 용량 | 동일 해상도에서 컬러 이미지보다 현저히 작음 |
| 구조 | 2차원 배열 형태로 저장되며, 각 원소는 0 또는 1 |
| 압축 | 런-길이 인코딩(RLE), 비트맵 압축 등 간단한 방식으로 효율적 압축 가능 |
데이터 구조 및 저장 형식
- 메모리 구조 : 행 우선(row-major) 순서로 1비트가 연속적으로 저장된다. 보통 8비트(1바이트) 단위로 패딩(padding)되어 저장된다.
- 대표 파일 포맷
- PBM (Portable Bitmap) : Netpbm 포맷 중 가장 단순한 형태로, ASCII와 바이너리 두 종류가 있다.
- BMP (Bitmap) : 1비트 컬러 테이블을 사용한 BMP 파일.
- PNG : 1비트 컬러 깊이를 지원하며 무손실 압축을 제공한다.
- TIFF : 1비트 이미지용 압축 옵션(예: CCITT Group 4) 지원.
주요 활용 분야
- 문서 스캔 및 OCR 전처리
- 흑백 스캔본을 직접 저장하거나, 회색조 이미지를 이진화하여 문자 인식 효율 향상.
- 바코드·QR코드
- 고대비 패턴을 필요로 하는 바코드, QR코드 등은 기본적으로 바이너리 이미지 형태.
- 의료 영상
- 조직·세포 구분을 위한 이진 마스크, 병변 영역의 라벨링 등.
- 컴퓨터 비전·이미지 처리
- 형태학적 연산(침식, 팽창), 에지 검출, 영역 분할의 기초 단계.
- 임베디드 시스템·디지털 회로
- 메모리·대역폭 제한이 큰 환경에서 간단한 표시(예: 전자 종이, LCD 패널) 등에 사용.
이진화(Thresholding) 방법
- 전역 임계값 : 전체 이미지에 동일한 임계값 적용(예: Otsu 방법).
- 지역 임계값 : 이미지의 지역별 밝기 차이를 고려해 동적으로 임계값 결정(예: Sauvola, Niblack 알고리즘).
- 적응형 이진화 : 머신러닝/딥러닝 기반 모델을 이용해 복잡한 조명 조건에서도 정확히 전환.
장점
- 저용량 : 동일 해상도에서 컬러 이미지 대비 저장·전송 비용이 현저히 낮다.
- 연산 효율 : 비트 연산으로 빠른 처리 가능(비트 마스크, 논리 연산).
- 고대비 : 텍스트, 라인, 경계선 등 명확한 구분이 필요한 경우 가시성이 뛰어나다.
단점
- 표현 제한 : 색상과 그라데이션을 전혀 표현하지 못한다.
- 노이즈 민감성 : 작은 조명 변동이나 스캔 결함이 바로 잘못된 전경·배경 구분으로 이어질 수 있다.
- 세부 정보 손실 : 회색톤 정보가 모두 사라지므로 후처리에서 복원 어려움.
관련 용어
- 그레이스케일 이미지 : 8비트(256톤) 이상의 밝기 정보를 가진 이미지.
- 컬러 이미지 : 24비트(RGB) 이상으로 다채로운 색을 표현.
- 이진화 : 회색조·컬러 이미지를 바이너리 이미지로 변환하는 과정.
- 형태학적 연산 : 이진 이미지에 적용되는 침식·팽창·열림·닫힘 등의 구조적 변환.
표준화 및 역사
바이너리 이미지의 형식은 1970년대 초반부터 UNIX 시스템에서 사용된 PBM 포맷으로 시작되었다. 이후 BMP, TIFF, PNG와 같은 범용 이미지 포맷에 1비트 색 깊이가 포함되면서 표준화가 진행되었다. 특히 OCR 및 바코드 인식 기술의 상용화와 함께 바이너리 이미지 처리 알고리즘이 활발히 연구되었으며, 현재는 디지털 문서 보관, 저전력 디스플레이, 임베디드 비전 시스템 등에 널리 활용되고 있다.