
ハングルwiki(文字コード) フリー百科事典『ウィキペディア(Wikipedia)』より
■完成型と組合型
字母を組み合わせて作られる文字の理論上の組み合わせは11,172文字だが、実際に使用されるのはその半分以下である(1987年に韓国の国家標準となったコンピュータ用の文字セット(KS完成型、KS C 5601-1987)には日常の99%が表記できる範囲として2,350字しか含まれなかった)。なお、1994-1995年ごろまでは11,172文字全部を表現できる文字セット(組合型、johab)が圧倒的に多く使われていたが、Windows 95でKS完成型を拡張した文字セット(拡張完成型、UHC(Unified Hangul Code))を採用し、後のWindowsにも使用されたため、現在は組合型文字セットはほとんど使われていない。なお、Windows NT系ではUnicode 2.0(KS C 5700、現:KS X 1005-1)以降をサポートしている。
■Unicode
Unicodeにはハングルを符号化するための文字が数種類あり、標準的に使用されるものは、ハングル字母(U+1100-11FF)とハングル音節文字(U+AC00-D7A3)である。
ハングル字母はハングルを構成する字母で、これらを合成する事により15世紀から現代までのハングル音節文字を作成できる。U+1100-115Fは初声子音、U+1160-11A2は中声母音、U+11A8-11F9は終声子音が定義されている。
ハングル音節文字は、2つの字母からなる音節399文字、3つの字母からなる音節10,773文字の合計11,172文字で構成されている。
この他にハングル互換字母(U+3130-318F)があるが、KS完成型(KS C 5601-1987、現:KS X 1001:1998)との互換性のために存在する。
■ハングル大移動
Unicodeでは、Unicode 1.1以前とUnicode 2.0以降ではハングルを定義する領域が異なっており互換性がない。
Unicode 1.1まではU+3400-4DFFにハングルが定義されていたが、Unicode 2.0制定時に、新しくU+AC00-D7AFにハングルが定義され旧領域は破棄された。その際、韓国の要求によりKS C 5601-1992の組合型文字セットに基づく現代ハングル音節文字11,172文字が網羅されている。なおUnicode 2.0で破棄された領域は、Unicode 3.0制定時にCJK統合漢字拡張A集合としてU+3400-4DBFに定義されている。