ASCII

정의
ASCII(아스키, American Standard Code for Information Interchange)는 컴퓨터와 통신 장비에서 영문 문자와 일부 기호·제어 코드를 7비트(0~127)로 표준화한 문자 인코딩 방식이다.

개요
1960년대 초 미국 표준 협회(ASA, 현재의 ANSI)에서 제정한 미국 국가 표준 X3.4에 기반한다. ASCII는 총 128개의 코드 포인트를 정의하며, 그 중 33개는 제어 문자(예: CR, LF, BEL 등)이고 나머지 95개는 인쇄 가능한 문자(숫자, 영문 대소문자, 기본 구두점 및 기호)이다. 7비트 구조이므로 초기 컴퓨터 시스템 및 텍스트 기반 통신 프로토콜에서 널리 사용되었으며, 이후 다양한 확장 문자 집합(예: ISO‑646, ISO‑8859 시리즈, Unicode)의 기반이 되었다.

어원·유래
American Standard Code for Information Interchange라는 명칭은 미국 표준 협회가 제정한 문자 코드임을 나타낸다. 1963년에 최초 초안이 발표되었으며, 1967년에 ASA X3.4‑1967 표준으로 공식 채택되었다. 이후 1977년에 ANSI X3.4‑1977, 1986년에 ANSI X3.4‑1986 등으로 개정되었지만, 기본 7비트 구조와 코드 배치는 크게 변하지 않았다.

특징

구분 내용
비트 길이 7비트(0~127)
총 코드 수 128개(제어 문자 33개, 인쇄 가능한 문자 95개)
주요 문자 구성 숫자(0‑9), 영문 대문자(A‑Z), 영문 소문자(a‑z), 기본 구두점 및 기호(예: ! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ {
제어 문자 차례대로 NUL, SOH, STX, ETX, …, CR, LF, ESC 등
호환성 8비트 문자 집합(예: ISO‑8859‑1) 및 Unicode(UTF‑8 등)와의 하위 호환성을 유지
사용 사례 초기 운영 체제(UNIX, MS-DOS 등)의 텍스트 파일, 인터넷 프로토콜(HTTP, SMTP 등)의 헤더, 프로그래밍 언어 소스 코드 등

관련 항목

  • ISO 646: ASCII를 기반으로 일부 국가별 문자 대체를 허용한 7비트 문자 표준.
  • Unicode: 전 세계 모든 문자·기호를 포괄하는 다중비트 인코딩 체계이며, ASCII 코드는 Unicode의 첫 128코드와 일치한다.
  • UTF‑8: 가변 길이 인코딩으로, ASCII와 호환되는 1바이트 형태를 포함한다.
  • ANSI 코드 페이지: ASCII를 기본으로 하여 8비트 확장 문자 집합을 구현한 Microsoft Windows 등의 코드 페이지.
  • EBCDIC: IBM 메인프레임에서 사용되는 8비트 문자 인코딩으로, ASCII와는 다른 배치를 가진다.
둘러보기

더 찾아볼 만한 주제