國際表意文字核心

國際表意文字核心International Ideographs Core,簡稱IICore或者易擴)係目前漢字編碼嘅最細標準。佢總共收錄咗東亞地區大約一萬個常用字,包括東亞地區各個國家同埋地區嘅第一常用字平面。呢一萬字嘅組合如下:

  • 中國大陸(6944字)
  • 臺灣(6608字)
  • 香港(5139字)
  • 澳門(4960字)
  • 日本(4593字)
  • 南韓(4759字)
  • 北韓(4653字)
  • 其他被收入Unicode嘅字(7772字)

呢一萬個字所包含嘅,唔單單限於中日韓統一表意文字基本字面嘅漢字。當中有42個字位於擴展區A、62個字位於擴展區B

歷史

編輯

國際表意文字核心係中日韓統一表意文字嘅基本子集,由Unicode表意文字小組接納。首先係喺2003年11月17日至11月20日桂林召開嘅IRG第21會議入面提出,再喺2004年5月四川省成都市舉行嘅第22次會議通過。

易擴推出嘅目的,主要係畀啲硬件上唔能夠容納成個中日韓統一表意文字嘅方案。現時中日韓統一表意文字嘅基本字集部份,就已經有二萬幾字。不過,各個地區嘅常用字,哪怕係字數最多嘅臺灣,都淨係得一萬三千幾字。所以,要包含一個字數咁龐大嘅字集,會對硬件設計造成壓力。而家中、港兩地嘅繁簡通電話,都係用大陸嘅國家標準代碼標準字集,咁會令到繁體字使用者有時唔可以喺手機輸入一啲常用字(例如:「咩」、「睇」等),易擴嘅出現,正好可以解決呢個問題。

擴展區漢字

編輯

由於有啲流動裝置,因爲採用編碼或者字型格式問題,往往淨係支援基本區漢字,或者淨係支援到擴展區A,擴展區B開始嘅「四字節區域」就唔支持。結果,位於「四字節區域」嘅漢字往往成爲急用字。例如「𨋢」字對香港人嚟講極爲常用,但係佢喺擴展區B,唔少裝置仍然未支援,令到好多人都仲係難以使用呢個字。

喺擴展區A嘅核心漢字

編輯

共42字,包括:

  • 㓤 㕷 㖡 㖭 㖿 㗎 㗳 㗾 㥠 㧟 㧸 㧾 㨘 㩒 㩧 㬹 㭎 㷧 㷫 㹴 㻐 䁥 䁪 䂻 䃟 䄷 䓪 䘆 䜣 䟴 䢵 䢼 䣅 䣓 䧑 䨒 䪸 䱽 䲁 䲅 䲳 䴈

喺擴展區B嘅核心漢字

編輯

共62字,包括:

  • 𠜎 𠜱 𠝹 𠱓 𠱸 𠲖 𠳏 𠳕 𠴕 𠵼 𠵿 𠸎 𠸏 𠹷 𠺝 𠺢 𠻗 𠻹 𠻺 𠼭 𠼮 𠽌 𠾴 𠾼 𠿪 𡁜 𡁯 𡁵 𡁶 𡁻 𡃁 𡃉 𡇙 𢃇 𢞵 𢫕 𢭃 𢯊 𢱑 𢱕 𢳂 𢴈 𢵌 𢵧 𢺳 𣲷 𤓓 𤶸 𤷪 𥄫 𦉘 𦟌 𦧲 𦧺 𧨾 𨅝 𨈇 𨋢 𨳊 𨳍 𨳒 𩶘

出面網頁

編輯