'utf-8'에 해당되는 글 2건

  1. 2010.04.23 iconv() 함수 완전정복(?)
  2. 2010.03.02 URL encode (2)
iconv() 함수에서
변환결과로 나와야 하는 방법이 unicode일 경우에는 (일단 다른건 안해봤으니 -ㅁ-?)
(strlen(inbuf) + 2) * 2 가 된다.

size_t iconv(iconv_t cd,
                     char **inbuf, size_t *inbytesleft,
                     char **outbuf, size_t *outbytesleft);

예를 들어 UTF-8을 UNICODE로 변환시에는
UTF-8 문자열 특성상, stelen(utf8str) == 100 일 경우
유니코드(2바이트) 스트링은 최소 25에서 최대 100 까지 변환이 된다.

그리고 iconv 특성상 처음에 2바이트 BOM(Byte Order Mark)을 붙이므로
실질적으로 변환을 위해 필요로 하는 outbuf의 길이는
(strlen(inbuf) + 2) * 2 가 된다.

원래대로라면
(strlen(inbuf) + 1) * 2 + 2 이고
+1 은 '\0'
+2 는 Unicode BOM(0xFEFF in big endian)이다.

[링크 : http://mwultong.blogspot.com/2006/05/qna-unicode-bom-byte-order-mark.html]


덧 : UTF-8로 인코딩된 아랍어의 경우, 조합은 별도로 해주어야 한다.
iconv()가 UNICODE로 변환은 해주지만, 그렇다고 해서 조합까지 해주지는 않는다.
신고
Posted by 구차니

댓글을 달아 주세요

파이어폭스에서 URL에 한글이 들어간걸 복사하면은
%22 이런식으로 이상한(!) 문자가 복사된다.

이런 표기를
URL encoding + UTF-8 이라고 하는거 같은데
아무튼, 유튜브에서 내부적으로 인코딩된 녀석을 풀어주기에는
적절한 서비스인것으로 보인다.


[링크 : http://mimul.com/pebble/default/2009/08/21/1250862600000.html]
[링크 : http://www.mimul.com/examples/dencoder/] << 웹에서 인코딩/디코딩


[링크 : http://bdyne.net/?document_srl=11733] << 동시에 여러가지 보여줌

[링크 : http://kldp.org/node/76274]
신고
Posted by 구차니

댓글을 달아 주세요

  1. URL인코딩/디코딩은 메모장2에서도 기본으로 지원하는 기능입니다. 흐흐흐 (근데 아무도 안써ㅠㅠ)

    2010.03.06 19:07 신고 [ ADDR : EDIT/ DEL : REPLY ]