공부기록장

ASCII 코드, 유니코드 3분 정리 본문

▶ study/NCS 디지털, IT

ASCII 코드, 유니코드 3분 정리

친절한 3 2020. 12. 18. 00:24

ASCII 코드

- 미국 정보 교환 표준 코드로, 데이터 통신 및 마이크로 컴퓨터에서 주로 사용된다.

- 7비트로 구성되어 있으며, 128가지의 문자를 표현할 수 있다.

- 이 것은 영문 키보드로 입력할 수 있는 모든 기호들이 할당되어 있는 부호 체계이다.

- 7비트 중 왼쪽 3비트는 존 비트, 나머지 4비트는 디지트 비트로 구성된다.

- 1바이트를 구성하는 8비트 중, 7비트만 사용하는 이유는 나머지 1비트를 가지고 통신 에러 검출을 위함이다.


 

유니코드

- 유니코드는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하도록 설계된 표준 코드이다.

- 유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하기 위함이다.

- 유니코드는 UTF (unicode trasformatio format) 인코딩, 국제문자세트 인코딩으로 2가지 변환 방식이 있다.

- 여기서 말하는 UTF는 지금 껏 많이 보고 들었던 UTF-8의 그것이다.

 


UTF-8

- UTF-8은 유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나이다.

- UTF-8 인코딩은 유니코드 한 문자를 나타내기 위해 1바이트에서 4바이트까지를 사용한다.

- ASCII 인코딩은 UTF-8의 부분 집합이다. 일반적인 ASCII 문자열은 UTF-8과 하위 호환이 가능하다.

Comments