本文へ

CyberLibrarian

図書館員のコンピュータ基礎講座

ユニコード(東アジア)

【2006-07-15更新】

ユニコードの字種の表です。
下表のリンク先のページに、十六進数の数値文字参照で記述した文字コード表を掲載しています。文字コード表中の各文字は、ユニコード・コンソーシアム外部へのリンクが提供しているUnihanデータベース外部へのリンクの該当文字へリンクしてあります。文字コード表中の文字は、環境によっては文字が正しく表示されない場合がありますが、各ページからリンクしているPDFでは正しく表示されます。

文字ブロック ユニコード範囲 説明
漢字
CJK統合漢字 CJK Unified Ideographs 4E00〜9FBF 字源的には同じだが字形の異なる中国語、日本語、韓国語の漢字に同じコードを与えて統合した漢字です。詳細は「文字コード」ページの「ユニコード」の項目を参照してください。
CJK統合漢字拡張A CJK Unified Ideographs Extension A 3400〜4DBF CJK統合漢字と比べて使用頻度の低い漢字で、CJK統合漢字に統合することができないものです。CJK統合漢字拡張Aには、その中でも重要度が高い漢字がBMP内に収められています。CJK統合漢字拡張Bには、重要度が低いものが収められており、日本のJIS X 2013:2000の第3水準と第4水準の文字も含まれています。
CJK統合漢字拡張B CJK Unified Ideographs Extension B 20000〜2A6DF
CJK互換漢字 CJK Compatibility Ideographs F900〜FAFF 一部を除き、本来はCJK統合漢字に統合すべき漢字で、同じ字源の漢字がCJK統合漢字に収録されていますが、既存の規格において別個の文字コードを与えられていたため、既存の規格とユニコードの間の双方向のデータ変換(ラウンド・トリップ(Round Trip))が可能になるように収録された漢字です。そのため、ラウンド・トリップの用途以外には使用できません。ただし、一部(FA0E、FA0F、FA11、FA13、FA14、FA1F、FA21、FA23、FA24、FA27、FA28、FA29)は、ユニコード・コンソーシアムのみが選出した漢字で、ラウンド・トリップ用の互換漢字ではなく、統合漢字として扱うべきものです。次のようなものが含まれます。
  1. 韓国の規格(KS C 5601-1987、現KS X 1001:1998)で異なる発音を持つ同じ漢字に別の符号を与ていたもの(F900〜FA0B)
  2. 台湾の規格(Big 5)で誤って重複して符号化されていた漢字(FA0C〜FA0D)
  3. 日本のWindowsパソコンにIBM拡張文字として収録されていた漢字(FA0E〜FA2D)
  4. JIS X 0213で包摂基準が変更されたことに伴って追加された漢字(FA30〜FA6A)
  5. 北朝鮮の規格(KPS 10721-2000)の一部の漢字(FA70〜FAD9)
  6. 台湾の規格(CNS 11643-1992)の一部の漢字および香港増補字符集(HKSCS)の6字(2F800〜2FA1D)
CJK互換漢字補助 CJK Compatibility Ideographs Supplement 2F800〜2FA1D
漢文用記号 Kanbun 3190〜319F 漢文を日本語で読む順序を示すために付す返り点です。
部首と字画
CJK部首補助 CJK Radicals Supplement 2E80〜2EFF 辞書の索引などで使う部首です。CJK補助部首には部首の派生形や簡体字用の部首が、康煕部首には部首用の文字が含まれています。これらの文字の多くは、同等のものがCJK統合漢字にも含まれていますが、ここに収められている文字は、部首であることを示す目的のみに使用できます。
康煕部首 CJK Radicals 2F00〜2FDF
CJK字画 CJK Strokes 31C0〜31EF 漢字を構成する点や線などの字画です。
漢字構成記述文字 Ideographic Description Characters 2FF0〜2FFF 漢字を組み合わせて別の漢字を表現するIDS(アイディーエス;Ideographic Description Sequence)という方法で用いる構成部分の配列方法を示す符号であるIDC(アイディーシー;Ideographic Description Characters)です。ユニコードで符号化されていない文字を表現するために用います。
例:記 = 「IDC言己」、号 = 「IDC口丂」
(「記」や「号」はユニコードに含まれているため、本来の使用方法ではない)
中国語特化
注音字母 Bopomofo 3100〜312F ボポモフォ(Bopomofo)や注音符号とも呼ばれる、中国語の漢字の発音を示す記号です。辞書の索引や日本語のルビのような方法で用いられます。中国大陸では現在はピンインが採用されていますが、台湾では現在でも使用されています。
注音字母拡張は、閩南方言および客家方言用の文字で、他の注音字母と共に用います。
注音字母拡張 Bopomofo Extended 31A0〜31BF
日本語・朝鮮語特化
半角・全角形 Halfwidth and Fullwidth Forms FF00〜FFEF ASCIIや記号の全角形、片仮名やハングル互換字母の半角形などです。他の互換用の文字と同様、相当する文字(全角・半角を反転させた文字)を使用する方が良いとされています。
日本語特化
平仮名 Hiragana 3040〜309F JISを基にした平仮名です。
片仮名 Katakana 30A0〜30FF JISを基にした片仮名です。
片仮名表音拡張 Katakana Phonetic Extensions 31F0〜31FF アイヌ語などの翻字に使用する小書き片仮名です。
朝鮮語特化
ハングル音節文字 Hangul Syllables AC00〜D7AF 現代ハングルの音節文字です。Johab(チョハブ;組み合わせの意味)と呼ばれる、字母を合成した形の文字です。
ハングル字母 Hangul Jamo 1100〜11FF ハングルを構成する字母で、これらを合成して現代から古代までのハングル音節文字を作成できます。1100〜115Fは初声子音、1160〜11A2は中声母音、11A8〜11F9は終声子音です。
ハングル互換字母 Hangul Compatibility Jamo 3130〜318F ハングル互換字母は、韓国の規格(KS C 5601、現KS X 1001)との互換性を保つためにのみ提供されています。
彝音節文字 Yi Syllables A000〜A48F 中国の小数民族である彝族(イゾク)が使用する彝語の文字で、ロロ文字とも呼ばれます。現代規範彝文で使用する文字と部首が収録されています。各文字には声調があります。SIL Internationalのサイトでフリーフォント外部へのリンクを入手できます。
彝文字部首 Yi Radicals A490〜A4CF
参照・参考文献
  • The Unicode standard, version 4.0 / the Unicode Consortium ; edited by Joan Aliprand ... [et al.]. Addison-Wesley, c2003 [b]
  • Unicode標準入門 / トニー・グラハム[ほか]著 ; 乾和志, 海老塚徹訳. 翔泳社, 2001.5 [b]
ページのトップへ
CyberLibrarian : tips on computer for librarians, 1998-