📖 WIPIVERSE

🔍 현재 등록된 정보: 77,061건

바이트 순서 표식

바이트 순서 표식 (Byte Order Mark, BOM)은 텍스트 파일의 시작 부분에 위치하는 몇 바이트의 데이터로, 파일의 인코딩 방식, 특히 바이트 순서 (endianness)를 나타내는 데 사용됩니다. 주로 유니코드 인코딩 (UTF-8, UTF-16, UTF-32 등)으로 저장된 텍스트 파일에서 발견됩니다.

BOM은 다음과 같은 역할을 수행합니다.

  • 인코딩 식별: BOM이 존재하면 파일이 특정 유니코드 인코딩 방식으로 저장되었음을 명확히 알려줍니다. 예를 들어, UTF-16BE (Big-Endian) 파일은 FE FF로 시작하고, UTF-16LE (Little-Endian) 파일은 FF FE로 시작합니다.
  • 바이트 순서 결정: UTF-16 및 UTF-32과 같이 멀티바이트 문자를 사용하는 인코딩에서는 바이트 순서가 중요합니다. BOM은 파일이 Big-Endian인지 Little-Endian인지 명확히 지정하여, 파일이 올바르게 해석되도록 돕습니다.
  • 오류 감지: BOM은 파일이 예상대로 인코딩되지 않았을 때 오류를 감지하는 데 사용될 수 있습니다.

각 유니코드 인코딩별 BOM:

  • UTF-8: EF BB BF (선택 사항, 필수는 아님)
  • UTF-16BE: FE FF
  • UTF-16LE: FF FE
  • UTF-32BE: 00 00 FE FF
  • UTF-32LE: FF FE 00 00

UTF-8 BOM의 사용:

UTF-8은 바이트 순서가 중요하지 않으므로 (바이트 단위로 문자를 표현), UTF-8 BOM은 필수가 아닙니다. 그러나 BOM이 존재하면 파일이 UTF-8로 인코딩되었음을 명확히 나타낼 수 있습니다. 일부 편집기 및 운영체제는 UTF-8 BOM을 자동으로 추가하기도 합니다. 하지만, 특정 환경(특히 웹 환경)에서는 UTF-8 BOM이 문제를 일으킬 수 있으므로, 제거하는 것이 권장되기도 합니다.

주의 사항:

일부 시스템 또는 소프트웨어는 BOM을 제대로 처리하지 못할 수 있습니다. 특히 UTF-8 BOM이 없는 파일을 UTF-8로 간주하는 시스템에서 BOM이 존재하면 예기치 않은 문제가 발생할 수 있습니다. 따라서 파일을 저장할 때 BOM의 존재 여부를 신중하게 고려해야 합니다.