본문 바로가기

emotional developer/detect-Web

HTTP charset parameter

The charset parameter

Documents transmitted with HTTP that are of type text, such as text/html, text/plain, etc., can send a charset parameter in the HTTP header to specify the character encoding of the document.

It is very important to always label Web documents explicitly. HTTP 1.1 says that the default charset is ISO-8859-1. But there are too many unlabeled documents in other encodings, so browsers use the reader's preferred encoding when there is no explicit charset parameter.

The line in the HTTP header typically looks like this:

Content-Type: text/html; charset=utf-8

In theory, any character encoding that has been registered with IANA can be used, but there is no browser that understands all of them. The more widely a character encoding is used, the better the chance that a browser will understand it. A Unicode encoding such as UTF-8 is a good choice for a number of reasons.

네트워크 통신시, 우리는 Content type 에 대한 정의를 클라이언트에게 전송 할수 있다.
보통 한국내에서는 charset=euc-kr 이란 캐릭터셋을 전송해 주곤 한다.
그렇다면. 만약 정의 되어 있지 않다면 어떻게 될것인가.??

친절하게도 W3.org 에서 찾을수 있었다.
일단 ISO 8859-1 로 전송을 한다. 하지만. 이건 명시적인 결과로 나타나지 않고 여러가지로 인코딩이 된다.
그래서. 주로 인코딩 옵션이 없을 경우는 사용자의 브라우저 인코딩을 더 따르게 된다.

그래서. 역시나 이러한 설정들 역시 명시적인 사용이 분명해야 한다.


-
http://www.w3.org/International/O-HTTP-charset
- http://en.wikipedia.org/wiki/ISO_8859-1

반응형

'emotional developer > detect-Web' 카테고리의 다른 글

Python Study.  (0) 2008.11.17
플릭커매쉬업!  (2) 2007.12.06
DOM Quick Reference  (0) 2007.11.18