|
図書館員のコンピュータ基礎講座
【2004-09-30更新】
HTMLでは、キーボードから文字を直接入力するのではなく、文字参照(Character References)と呼ばれる仕組みを利用して文字を記述することができます。これによって、キーボードで直接入力できない文字や、マークアップ用の文字などの特殊な文字も記述することができます。文字参照によってこれらの特殊な文字を記述する方法は、文字の名前を使用する文字実体参照(Character Entity References)と、UCS(≒ユニコード)*の文字コード番号を使用する数値文字参照(Numeric Character References)があります。
*正確にはUCSですが、ユニコードと実質的に同義なので、以後ユニコードと呼びます。
文字実体参照は、文字の名前(実体名)によって記述します。例えば、引用符(")は「"」と記述します。実体名の大文字と小文字の違いは厳密に区別されますので注意が必要です。例えば、「Á」(Á)と「á」(á)は異なる文字実体を表します。
文字実体参照のリスト
文字実体参照が指定されていない文字も、ユニコードに含まれている文字は全て、ユニコードの文字番号を十進数または十六進数で指定することで記述できます。これを数値文字参照と呼びます。Webでは使用できなかった機種依存文字や半角片仮名も、ユニコードに含まれていれば記述できます。
- 十進数では「&#文字コード番号;」のように、文字コード番号を「&#」と「;」で囲んで記述します。例えば、引用符(")は「"」と記述します。
- 十六進数では「&#x文字コード番号;」のように、文字コード番号を「&#x」と「;」で囲んで記述します。例えば、引用符(")は「"」と記述します。
数値文字参照のリスト
文字の表示
文字参照は、Shift-JISやUTF-8など、HTMLをどの文字コードで指定しても表示することができます。また、文字参照のコード番号はOSやフォントにも依存しません。しかし、文字実体参照や数値文字参照で記述した文字がブラウザで表示できるかどうかは、OSやフォント、ブラウザの種類とバージョンに依存しますので、文字を正しく表示できない場合があります。正しく表示できない文字は、豆腐と呼ばれる四角形( )や疑問符(?)、空白( )、点(・)などで表示されます。表示されない文字を含め、ユニコードの文字コード表はJavaScript Unicode Charts で参照できます。ユニコードの表も参照してください。
CyberLibrarian : tips on computer for librarians, 1998-
|