表意文字描述字元
表意文字描述字元(英文:Ideographic Description Character,IDC)係萬國碼區段,收錄用來描述中日韓字元集嘅形意符號,屬萬國碼自第三點〇版對漢字嘅支援。
目前大部份編碼包含萬國碼,處理漢字編碼時大致先搜集漢字,幫每隻字編碼。但漢字數量龐大,字集往往唔完整;再加上漢字本身係開放組合,漢字用者好可能自造新字,無可能有字集可搜集晒全部漢字,所以用呢啲字元描述某「字」點用簡單啲嘅部件組合出來。
表
編輯表意文字描述字元 Ideographic Description Characters[1][2] 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+2FF乜 | ⿰ | ⿱ | ⿲ | ⿳ | ⿴ | ⿵ | ⿶ | ⿷ | ⿸ | ⿹ | ⿺ | ⿻ | ||||
註釋
|
另有收錄U+303E 〾 ideographic variation indicator表意文字指示符,以表示形似但唔一樣嘅字。
表意文字描述序列
編輯表意文字描述序列(英文:Ideographic Description Sequence,IDS)係萬國碼標準定義嘅漢字結構描述語法,描述序列由描述字元同兩粒或以上特定字元(主要係漢字)組合而成,表示漢字嘅抽象結構。
萬國碼定義唨12種組合字元:
編碼 | 字元 | 意義 | 例字 | 序列 | 例字 | 序列 |
---|---|---|---|---|---|---|
U+2FF0 | ⿰ | 兩部件由左至右組成 | 相 | ⿰木目 | 𠁢 | ⿰丨㇍ |
U+2FF1 | ⿱ | 兩部件由上至下組成 | 杏 | ⿱木口 | 𠚤 | ⿱𠂊丶 |
U+2FF2 | ⿲ | 三部件由左至右組成 | 衍 | ⿲彳氵亍 | 𠂗 | ⿲丿夕乚 |
U+2FF3 | ⿳ | 三部件由上至下組成 | 京 | ⿳亠口小 | 𠋑 | ⿳亼目口 |
U+2FF4 | ⿴ | 兩部件由外而內組成 | 回 | ⿴囗口 | 𠀬 | ⿴㐁人 |
U+2FF5 | ⿵ | 三面包圍,下面開口 | 凰 | ⿵几皇 | 𧓉 | ⿵齊虫 |
U+2FF6 | ⿶ | 三面包圍,上面開口 | 凶 | ⿶凵㐅 | 义 | ⿶乂丶 |
U+2FF7 | ⿷ | 三面包圍,右面開口 | 匠 | ⿷匚斤 | 𧆬 | ⿷虎九 |
U+2FF8 | ⿸ | 兩面包圍,兩部件由左上至右下組成 | 病 | ⿸疒丙 | 𤆯 | ⿸耂火 |
U+2FF9 | ⿹ | 兩面包圍,兩部件由右上至左下組成 | 戒 | ⿹戈廾 | 𢧌 | ⿹或壬 |
U+2FFA | ⿺ | 兩面包圍,兩部件由左下至右上組成 | 超 | ⿺走召 | 𥘶 | ⿺礼分 |
U+2FFB | ⿻ | 兩部件重疊 | 巫 | ⿻工从 | 𣏃 | ⿻木⿻コ一 |
U+2FFC | | 三面包圍,左面開口 | ||||
U+2FFD | | 兩面包圍,兩部件由右下至左上組成 | ||||
U+2FFE | | 水平翻轉 | ||||
U+2FFE | | 旋轉 |
IDS嘅運算方式係前綴表示法,運算子寫先,對應數量嘅運算元寫後。呢種方式唔使用括號等字元輔助就可無歧義表示運算順序。
萬國碼標準噉定義表意文字描述序列:
IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB IDS三元運算子 := U+2FF2 | U+2FF3
合規範IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0至U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。