本文へ

CyberLibrarian

図書館員のコンピュータ基礎講座

文字参照

【2004-09-30更新】

概要

HTMLでは、キーボードから文字を直接入力するのではなく、文字参照(Character References)と呼ばれる仕組みを利用して文字を記述することができます。これによって、キーボードで直接入力できない文字や、マークアップ用の文字などの特殊な文字も記述することができます。文字参照によってこれらの特殊な文字を記述する方法は、文字の名前を使用する文字実体参照(Character Entity References)と、UCS(≒Unicode)*の文字コード番号を使用する数値文字参照(Numeric Character References)があります。
*正確にはUCSですが、Unicodeと実質的に同義なので、以後Unicodeと呼びます。

文字実体参照

文字実体参照は、文字の名前(実体名)によって記述します。例えば、引用符(")は「"」と記述します。実体名の大文字と小文字の違いは厳密に区別されますので注意が必要です。例えば、「Á」(Á)と「á」(á)は異なる文字実体を表します。

*文字実体参照のリスト

数値文字参照

文字実体参照が指定されていない文字も、Unicodeに含まれている文字は全て、Unicodeの文字番号を十進数または十六進数で指定することで記述できます。これを数値文字参照と呼びます。Webでは使用できなかった機種依存文字や半角片仮名も、Unicodeに含まれていれば記述できます。

  • 十進数では「&#文字コード番号;」のように、文字コード番号を「&#」と「;」で囲んで記述します。例えば、引用符(")は「"」と記述します。
  • 十六進数では「&#x文字コード番号;」のように、文字コード番号を「&#x」と「;」で囲んで記述します。例えば、引用符(")は「"」と記述します。
*数値文字参照のリスト

文字の表示

文字参照は、Shift-JISやUTF-8など、HTMLをどの文字コードで指定しても表示することができます。また、文字参照のコード番号はOSやフォントにも依存しません。しかし、文字実体参照や数値文字参照で記述した文字がブラウザで表示できるかどうかは、OSやフォント、ブラウザの種類とバージョンに依存しますので、文字を正しく表示できない場合があります。正しく表示できない文字は、豆腐と呼ばれる四角形(豆腐(文字化け))や疑問符(?)、空白( )、点(・)などで表示されます。表示されない文字を含め、Unicodeの文字コード表はNameslist Charts外部へのリンクで参照できます。Unicodeの表も参照してください。

ページのトップへ
次ページへ
CyberLibrarian : tips on computer for librarians, 1998-