Skip to content

인코딩 #
Find similar titles

Structured data

Category
Etc

개요 #

문자, 숫자, 기호로 구성된 세트를 컴퓨터에서 처리할 수 있는 표준화된 형태의 문자로 변경하는 것을 문자 인코딩(character encoding) 또는 부호화라고 한다 반대로, 인코딩된 문자를 본래대로 되돌리는 것을 디코딩 (decoding) 또는 복호화한다고 한다.

인코딩에 사용하는 표준화된 문자코드는 여러가지가 있는데 ASCII 코드가 가장 대표적인 예 이다.

  • 문자코드: 문자를 표현하는 데이터 값
  • 문자셋: 하나의 언어권에서 사용하는 언어를 표현하기 위한 문자들의 집합
  • 인코딩: 문자셋과 문자코드의 맵핑, ASCII도 인코딩 방법의 하나

유니코드 #

각 나라언어별로 문자코드가 천차만별으로 만들어지자, 이를 통일하기 위해 1984년 ISO (국제표준기구)가 유일한 문자코드인 유니코드를 만들었다. 유니코드는 각 문자별 고유번호로 구성되어 있다.

파이썬에서의 인코딩 #

파이썬 2.x 에서의 기본인코딩은 ASCII이다. 한글은 ASCII에서 지원하지 않으므로 한글을 파이썬 코드에 사용할 경우 에러가 발생한다. 이 문제를 해결하기 위해서는 코드 상단 첫 줄에 #-*- coding: utf-8 -*- 을 넣어주면 된다. 이처럼 ASCII가 기본인코딩이라서 생기는 문제를 방지하기 위해 파이썬 3.x에서는 기본인코딩으로 유니코드를 지원한다.

출처 #

Incoming Links #

Related Data Sciences #

Suggested Pages #

0.0.1_20140628_0