한글오토마타 관련 문서

모종의 음모/다국어 지원2010. 3. 4. 18:08

한글오토마타 관련 문서

유니코드에 있어 한글 오토마타는 쉬운편이다.
아무튼 초성/중성/종성 을 수식대로 입력을 하면 딱! 하고 코드값이 나오는 형식이다.
제한적이지만 어느정도 한글창제 원리에 맞추어 "조합형" 식으로 나열을 했기 때문이다.

한글 조합하기

한글글자 = 초성 * 21 * 28 + (중성 - 19) * 28 + (종성 - 40) + BASE_CODE(한글코드 테이블의 첫번째 문자코드)

예) 강 = ㄱ + ㅏ + ㅇ
         = 0 * 21 * 28 + (19 - 19) * 28 + (61 - 40) + 0xAC00 = 0xAC00(44032) + 21
         = 44053
         = 0xAC15

[링크 : http://codepedia.tistory.com/42]

한글 분해하기

Jong = UniValue % 28;
Jung = ( ( UniValue - Jong ) / 28 ) % 21;
Cho = parseInt (( ( UniValue - Jong ) / 28 ) / 21);

[링크 : http://zextor.tistory.com/2669852]

한글 갯수

초성은 19개
중성은 21개
종성은 28개

정렬 순서
첫소리	ㄱ ㄲ ㄴ ㄷ ㄸ ㄹ ㅁ ㅂ ㅃ ㅅ ㅆ ㅇ ㅈ ㅉ ㅊ ㅋ ㅌ ㅍ ㅎ
가운뎃소리	ㅏ ㅐ ㅑ ㅒ ㅓ ㅔ ㅕ ㅖ ㅗ ㅘ ㅙ ㅚ ㅛ ㅜ ㅝ ㅞ ㅟ ㅠ ㅡ ㅢ ㅣ
끝소리	( ) ㄱ ㄲ ㄳ ㄴ ㄵ ㄶ ㄷ ㄹ ㄺ ㄻ ㄼ ㄽ ㄾ ㄿ ㅀ ㅁ ㅂ ㅄ ㅅ ㅆ ㅇ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ

[링크 : http://kudak.egloos.com/740202]
[링크 : http://www.w3c.or.kr/i18n/hangul-i18n/ko-code.html]
[링크 : http://ko.wikipedia.org/wiki/한글]

초성

ㄱ

ㄲ

ㄴ

ㄷ

ㄸ

ㄹ

ㅁ

ㅂ

ㅃ

ㅅ

ㅆ

ㅇ

ㅈ

ㅉ

ㅊ

ㅋ

ㅌ

ㅍ

ㅎ

중성

ㅏ

ㅐ

ㅑ

ㅒ

ㅓ

ㅔ

ㅕ

ㅖ

ㅗ

ㅘ

ㅙ

ㅚ

ㅛ

ㅜ

ㅝ

ㅞ

ㅟ

ㅠ

ㅡ

ㅢ

ㅣ

종성

ㄱ

ㄲ

ㄳ

ㄴ

ㄵ

ㄶ

ㄷ

ㄹ

ㄺ

ㄻ

ㄼ

ㄽ

ㄾ

ㄿ

ㅀ

ㅁ

ㅂ

ㅄ

ㅅ

ㅆ

ㅇ

ㅈ

ㅊ

ㅋ

ㅌ

ㅍ

ㅎ

---
2014.03.26 추가

[링크 : http://blog.naver.com/netcrazy0/110066486580] 코드
[링크 : http://www.typographyseoul.com/181344]

'모종의 음모 > 다국어 지원' 카테고리의 다른 글

Hebrew code range (unicode) (0)	2010.04.30
태국어(Thai) / 히브리어(Hebrew) (0)	2010.04.23
Unicode BOM(Byte Order Mark) (0)	2010.03.04
국가코드 / 언어코드(country code/ langugae code) (0)	2010.02.11
cyriilic character 정리 (0)	2009.04.10

Posted by 구차니

구차니의 잡동사니 모음

한글오토마타 관련 문서

'모종의 음모 > 다국어 지원' 카테고리의 다른 글

카테고리

공지사항

태그목록

최근에 올라온 글

최근에 달린 댓글

티스토리툴바