유니코드에 있어 한글 오토마타는 쉬운편이다.
아무튼 초성/중성/종성 을 수식대로 입력을 하면 딱! 하고 코드값이 나오는 형식이다.
제한적이지만 어느정도 한글창제 원리에 맞추어 "조합형" 식으로 나열을 했기 때문이다.
한글 조합하기
한글 분해하기
한글 갯수
아무튼 초성/중성/종성 을 수식대로 입력을 하면 딱! 하고 코드값이 나오는 형식이다.
제한적이지만 어느정도 한글창제 원리에 맞추어 "조합형" 식으로 나열을 했기 때문이다.
한글 조합하기
| 한글글자 = 초성 * 21 * 28 + (중성 - 19) * 28 + (종성 - 40) + BASE_CODE(한글코드 테이블의 첫번째 문자코드) 예) 강 = ㄱ + ㅏ + ㅇ = 0 * 21 * 28 + (19 - 19) * 28 + (61 - 40) + 0xAC00 = 0xAC00(44032) + 21 = 44053 = 0xAC15 [링크 : http://codepedia.tistory.com/42] |
한글 분해하기
| Jong = UniValue % 28; Jung = ( ( UniValue - Jong ) / 28 ) % 21; Cho = parseInt (( ( UniValue - Jong ) / 28 ) / 21); [링크 : http://zextor.tistory.com/2669852 ![]() ![]() ] |
한글 갯수
| 초성은 19개 중성은 21개 종성은 28개
[링크 : http://kudak.egloos.com/740202] [링크 : http://www.w3c.or.kr/i18n/hangul-i18n/ko-code.html] [링크 : http://ko.wikipedia.org/wiki/한글] |
초성
ㄱ | ㄲ | ㄴ | ㄷ | ㄸ | ㄹ | ㅁ | ㅂ | ㅃ | ㅅ | ㅆ | ㅇ | ㅈ | ㅉ | ㅊ | ㅋ | ㅌ | ㅍ | ㅎ |
r | R | s | e | E | f | a | q | Q | t | T | d | w | W | c | z | x | v | g |
중성
ㅏ | ㅐ | ㅑ | ㅒ | ㅓ | ㅔ | ㅕ | ㅖ | ㅗ | ㅘ | ㅙ | ㅚ | ㅛ | ㅜ | ㅝ | ㅞ | ㅟ | ㅠ | ㅡ | ㅢ | ㅣ |
k | o | I | O | j | p | u | P | h | hk | ho | hl | y | n | nj | np | nl | b | m | ml | l |
종성
ㄱ | ㄲ | ㄳ | ㄴ | ㄵ | ㄶ | ㄷ | ㄹ | ㄺ | ㄻ | ㄼ | ㄽ | ㄾ | ㄿ | ㅀ | ㅁ | ㅂ | ㅄ | ㅅ | ㅆ | ㅇ | ㅈ | ㅊ | ㅋ | ㅌ | ㅍ | ㅎ |
r | R | rt | s | sw | sg | e | f | fr | fa | fq | ft | fx | fv | fg | a | q | qt | t | T | d | w | c | z | x | v | g |
'모종의 음모 > 다국어 지원' 카테고리의 다른 글
| Hebrew code range (unicode) (0) | 2010/04/30 |
|---|---|
| 태국어(Thai) / 히브리어(Hebrew) (0) | 2010/04/23 |
| 한글오토마타 관련 문서 (0) | 2010/03/04 |
| Unicode BOM(Byte Order Mark) (0) | 2010/03/04 |
| 국가코드 / 언어코드(country code/ langugae code) (0) | 2010/02/11 |
| cyriilic character 정리 (0) | 2009/04/10 |


]
댓글을 달아 주세요