【注意】このドキュメントは、W3CのPronunciation Lexicon Specification (PLS) Version 1.0 W3C Recommendation 14 October 2008の和訳です。
このドキュメントの正式版はW3Cのサイト上にある英語版であり、このドキュメントには翻訳に起因する誤りがありえます。誤訳、誤植などのご指摘は、訳者までお願い致します。

First Update: 2012年4月18日

発音辞書仕様（PLS）バージョン1.0

W3C勧告 2008年10月14日

本バージョン:: http://www.w3.org/TR/2008/REC-pronunciation-lexicon-20081014/
最新バージョン:: http://www.w3.org/TR/pronunciation-lexicon/
旧バージョン:: http://www.w3.org/TR/2008/PR-pronunciation-lexicon-20080818/
編集者:: Paolo Baggia, Loquendo
著者:: Paul Bagshaw, France Telecom; Daniel C. Burnett, Voxeo; Jerry Carter, Nuance; Frank Scahill, BT (until 10 October 2001)

このドキュメントに対する正誤表を参照してください。いくつかの規範的な修正が含まれているかもしれません。

翻訳版も参照してください。

要約

このドキュメントは、自動音声認識および音声合成エンジンが用いる発音辞書を音声読み上げブラウザ・アプリケーションで指定するための構文を定義しています。

このドキュメントのステータス

この項は、このドキュメントの公開時のステータスについて記述しています。他のドキュメントがこのドキュメントに取って代わることがありえます。現行のW3Cの刊行物およびこの技術報告の最新の改訂版のリストは、http://www.w3.org/TR/のW3C技術報告インデックスにあります。

これは、「発音辞書仕様（PLS）バージョン1.0」の勧告です。音声読み上げブラウザ・アクティビティの一部である音声読み上げブラウザ・ワーキンググループによって作成されました。

コメントはwww-voice@w3.org（アーカイブ）で歓迎されます。W3Cメーリング・リストおよびアーカイブ利用ガイドラインを参照してください。

PLS 1.0の設計は広くレビューされており（コメントの処理を参照）、ワーキンググループの技術要件を満たしています。実装のリストは、関連するテスト・スイートとともにPLS 1.0実装報告に含まれています。ワーキンググループは、コメントに応じて2008年8月18日の勧告案に少しの編集上の変更を行いました。勧告案の変更については付録Dに記述しています。

2項発音文字では、発音文字を指定するためのalphabet属性の正当な値について記述しています。ワーキンググループは、「ipa」以外の発音文字を使用できるように、IANAに発音文字レジストリの作成を要請しています。レジストリの場所は、レジストリが利用可能になれば、http://www.w3.org/2001/10/synthesisで提供される予定です。PLS仕様の将来のバージョンでは、alphabet属性でこのレジストリの値を用いることが認められるかもしれません。

このドキュメントは、W3Cメンバー、ソフトウェア開発者、他のW3Cグループ、および他の利害関係者によりレビューされ、W3C勧告として管理者の協賛を得ました。これは確定済みドキュメントであり、参考資料として用いたり、別のドキュメントで引用することができます。勧告の作成におけるW3C の役割は、仕様に注意を引き付け、広範囲な開発を促進することです。これによってウェブの機能性および相互運用性が増強されます。

このドキュメントは、2004年2月5日のW3C特許方針の下で活動しているグループによって作成されました。W3Cは、このグループの成果物に関連するあらゆる特許の開示の公開リストを維持し、このページには特許の開示に関する指示も含まれています。不可欠な請求権（Essential Claim(s)）を含んでいると思われる特許に関して実際に知っている人は、W3C特許方針の6項に従って情報を開示しなければなりません。

このドキュメント本体の項は、特別の定めのない限り規範的です。このドキュメントの付録は、特別に明示されていない限り参考情報です。

1. 発音辞書仕様（PLS）入門
2. 発音文字
3. PLSドキュメント
- 3.1 ドキュメント形式
- 3.2 適合性
  - 3.2.1 適合発音辞書仕様ドキュメント
  - 3.2.2 他の名前空間を持つPLSの使用
  - 3.2.3 適合発音辞書仕様プロセッサ
4. 発音辞書マークアップ言語定義
- 4.1 <lexicon>要素
- 4.2 <meta>要素
- 4.3 <metadata>要素
- 4.4 <lexeme>要素
- 4.5 <grapheme>要素
- 4.6 <phoneme>要素
- 4.7 <alias>要素
- 4.8 <example>要素
- 4.9 ASRとTTSに対する複数の発音
  - 4.9.1 ASRに対する複数の発音
  - 4.9.2 TTSに対する複数の発音
  - 4.9.3 複数の発音の例
5. 例
- 5.1 シンプルなユースケース
- 5.2 複数の発音
- 5.3 複数の綴り法
- 5.4 同音異義語
- 5.5 同綴異義語
- 5.6 綴り法による発音（頭字語、略語など）
6. 参考文献
- 6.1 規範的な参考文献
- 6.2 参考情報の参考文献
7. 貢献者および謝辞
付録A. 発音辞書仕様用スキーマ（規範）
付録B. MIMEタイプとファイル拡張子（規範）
付録C. 字句コンテンツの検索における課題（参考情報）
付録D. 更新（参考情報）

1. 発音辞書仕様（PLS）入門

この項は参考情報です。

発音に関する正確な仕様は、音声アプリケーションの成功にとって非常に重要です。ほとんどの自動音声認識（ASR）エンジンやText-To-Speech（TTS）エンジンは、多くの単語や語句の発音情報を有する広範で品質の高い辞書を内部的に提供します。アプリケーションが使用する単語や語句の適用範囲を最大限に保証するためには、アプリケーション固有の発音が必要かもしれません。例えば、これは、姓や商号のような固有名詞に必要でありえます。

発音辞書仕様（PLS）は、ASRエンジンとTTSエンジンの両方に対し、相互運用可能な発音情報の仕様を実現することを目指しています。この言語は、国際的に利用できるように、発音情報に関する正確な仕様をサポートするとともに、開発者が容易に使用できることを目指しています。

この言語により、標準的な発音文字を用いて、または、必要に応じてベンダー独自の文字を用いて、単語や語句に対し1つ以上の発音を指定することが可能となります。発音は、音声認識文法仕様[SRGS]や音声合成マークアップ言語[SSML]のような、他のマークアップ言語から参照可能なPLSドキュメントへとまとめられます。

最も一般的な意味で、辞書は単なる単語や語句のリストであり、そのリスト内の項目に関連付けられた情報を含んでいる可能性もあります。このドキュメントは、「辞書」という用語を「発音辞書」という特定の意味でのみ使用します。この特定のドキュメントでは、「辞書」は、単語（または短い語句）、その記述表現、ASRエンジンやTTSエンジンによる使用に適した発音の間のマッピングを意味します。発音辞書は音声読み上げブラウザに役立つだけではありません。障害者に対するアクセシビリティやあらゆるユーザに対するより大きなユーザビリティをサポートするためのメカニズムとしても有効であることが判明しています。発音辞書は、マルチモーダル・インターフェースをサポートするスクリーン・リーダやユーザ・エージェントで有効に使われます。

1.1. TTSによるPLSの使用方法

TTSエンジンは、入力されたコンテンツ（SSMLのような、テキストかマークアップのどちらか）を音声に変換することを目的としています。この作業には、次のいくつかの処理ステップが含まれています。

テキストの正規化
単語の発音（字句強勢、発音表記）
文構造（イントネーション、リズム）
発音表記の文レベルの変更（同時調音）
韻律パラメータの計算
音響信号の生成

これらの処理レベルでSSML要素を用いて作業を行うことで、ユーザはSSMLでTTSの動作を制御し強化できます（詳細は[SSML]を参照）。

PLSは、SSMLの<lexicon>要素で参照されるドキュメントの標準形式となることを目指しています（[SSML]の3.1.4項を参照）。

下記はシンプルなSSMLドキュメントの例です。米語で読み上げられるイタリア映画のタイトルと監督名が含まれています。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">
    
    The title of the movie is: "La vita è bella" (Life is beautiful),
    which is directed by Roberto Benigni. 
</speak>

正確に発音してもらうために、イタリア語のタイトルと監督名の発音が、SSMLドキュメント内に記述されているかもしれません。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">
    
    The title of the movie is: 
    <phoneme alphabet="ipa" ph="ˈlɑ ˈviːɾə ˈʔeɪ ˈbɛlə">"La vita è bella"</phoneme>
    <!-- The IPA pronunciation is:
    "&#x02C8;l&#x0251; &#x02C8;vi&#x02D0;&#x027E;&#x0259;
     &#x02C8;&#x0294;e&#x026A; &#x02C8;b&#x025B;l&#x0259;" --> 
    (Life is beautiful),
    which is directed by 
    <phoneme alphabet="ipa" ph="ɹəˈbɛːɹɾoʊ bɛˈniːnji">Roberto Benigni.</phoneme>
    <!-- The IPA pronunciation is:
    "&#x0279;&#x0259;&#x02C8;b&#x025B;&#x02D0;&#x0279;&#x027E;o&#x028A;
     b&#x025B;&#x02C8;ni&#x02D0;nji" --> 
</speak>

PLSを用いると、すべての発音を外部PLSドキュメントとして分離し、SSMLの<lexicon>要素で参照できます（[SSML]の3.1.4項を参照）。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">

    <lexicon uri="http://www.example.com/movie_lexicon.pls"/>

    The title of the movie is: "La vita è bella" (Life is beautiful),
    which is directed by Roberto Benigni. 
</speak>

参照する辞書は、次のようなものでありえます。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>La vita &#x00E8;<!-- same as: è --> bella</grapheme>
    <phoneme>ˈlɑ ˈviːɾə ˈʔeɪ ˈbɛlə</phoneme>
    <!-- IPA string is:
     "&#x02C8;l&#x0251; &#x02C8;vi&#x02D0;&#x027E;&#x0259;
      &#x02C8;&#x0294;e&#x026A; &#x02C8;b&#x025B;l&#x0259;" --> 
  </lexeme>
  <lexeme>
    <grapheme>Roberto</grapheme>
    <phoneme>ɹəˈbɛːɹɾoʊ</phoneme>
    <!-- IPA string is:
     "&#x0279;&#x0259;&#x02C8;b&#x025B;&#x02D0;&#x0279;&#x027E;o&#x028A;" --> 
  </lexeme>
  <lexeme>
    <grapheme>Benigni</grapheme>
    <phoneme>bɛˈniːnji<!-- IPA string is:
     "b&#x025B;&#x02C8;ni&#x02D0;nji" --></phoneme>
  </lexeme>
</lexicon>

PLSエンジンは、外部PLSドキュメントを読み込み、SSMLドキュメントの処理中に、ユーザに気付かれることなく発音を適用するでしょう。アプリケーションに、複数の別々のPLSドキュメントを含み、アプリケーショ内の異なる場所で用いることができます。[SSML]の3.1.4項では、SSMLドキュメントで参照した複数の辞書ドキュメントの使用方法について記述しています。

参考情報の注記:

多くのプラットフォーム、ブラウザ、テキスト・エディタの組み合わせが、Unicodeのテキストを正確に切り貼りできない場合には、発音をIPA記号の数値文字参照（XML 1.0[XML10]またはXML 1.1[XML11]の文字参照および実体参照に関する4.1項を参照）で入力できます。しかし、常に数値文字参照よりもIPA記号のUTF-8表現を優先して使用すべきです。このドキュメントでは、IPA記号のUTF-8表現の表示に関する潜在的な問題を克服するために、数値文字参照を用いた発音の例もコメント内に表示しています。

1.2. ASRによるPLSの使用方法

ASRエンジンは、オーディオ信号を、認識された単語列または発言の意味を表す意味表現に変換します（意味解釈の標準的な定義に関しては、音声認識の意味的解釈（Semantic Interpretation for Speech Recognition）[SISR]を参照）。

ASR文法は、ASRが認識する可能性のある単語や語句を記述して、ASRのパフォーマンスを改善するために使用します。SRGSは、ASR文法の標準的な定義です（詳細は[SRGS]を参照）。

ASRプロセッサにPLSを用いれば、単語や語句に対して複数の発音が可能となり、さらに頭字語の展開や略語の展開のような限定的なテキストの正規化も行えます。

SRGS文法規則内の書記素にPLSエントリーを適用し、認識可能な音素に変換します。ASRとTTSの両方に用いるPLSドキュメントについては、下記の例と1.3項の例を参照してください。

PLSには、口述筆記システムや制約のないASRに対するものなどの、他の使用方法があるかもしれませんが、この仕様の範囲外でしょう。

下記は、「マサチューセッツ州ボストン」または「フロリダ州マイアミ」などの文の認識を可能とする非常にシンプルなSRGS文法です。

<?xml version="1.0" encoding="UTF-8"?>
<grammar version="1.0"
  xmlns="http://www.w3.org/2001/06/grammar"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
  xsi:schemaLocation="http://www.w3.org/2001/06/grammar 
    http://www.w3.org/TR/speech-grammar/grammar.xsd"
  xml:lang="en-US" root="city_state" mode="voice">

  <rule id="city" scope="public">
    <one-of> <item>Boston</item> 
             <item>Miami</item> 
             <item>Fargo</item> </one-of> 
  </rule>
  <rule id="state" scope="public">
    <one-of> <item>Florida</item>
             <item>North Dakota</item>
             <item>Massachusetts</item> </one-of>
  </rule> 
  
  <rule id="city_state" scope="public"> 
     <ruleref uri="#city"/> <ruleref uri="#state"/>
  </rule>
</grammar>

SRGS文法が発音辞書を参照している場合、その文法に基づいた多数の単語の発音によって、様々な読み上げ形式が提供できるようになります。下記は、同じ文法で外部PLSドキュメントを参照した場合です。

<?xml version="1.0" encoding="UTF-8"?>
<grammar version="1.0"
  xmlns="http://www.w3.org/2001/06/grammar"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
  xsi:schemaLocation="http://www.w3.org/2001/06/grammar 
    http://www.w3.org/TR/speech-grammar/grammar.xsd"
  xml:lang="en-US" root="city_state" mode="voice">
  
  <lexicon uri="http://www.example.com/city_lexicon.pls"/>

  <rule id="city" scope="public">
    <one-of> <item>Boston</item> 
             <item>Miami</item> 
             <item>Fargo</item> </one-of> 
  </rule>
  <rule id="state" scope="public">
    <one-of> <item>Florida</item>
             <item>North Dakota</item>
             <item>Massachusetts</item> </one-of>
  </rule> 
  
  <rule id="city_state" scope="public"> 
     <ruleref uri="#city"/> <ruleref uri="#state"/>
  </rule>
</grammar>

SRGS文法が複数のPLSドキュメントを参照するかもしれないことにも注意してください。

1.3. VoiceXMLアプリケーションによるPLSの使用方法

VoiceXML 2.0アプリケーション（[VXML]）には、TTS用のASRとSSMLのプロンプト用のSRGS文法が含まれています。SRGSとSSMLの両方にPLSを導入すると、VoiceXMLアプリケーションに直接影響が生じるでしょう。

VoiceXMLアプリケーションでも1.1項と1.2項で述べた利点を利用できます。アプリケーションは、相互作用の異なるポイントにおいて複数のコンテキストのPLSドキュメントを使用できますが、同じPLSドキュメントを、ASRを改善するためにSRGSで、また、TTSを改善するためにSSMLでと、両方に使用することも可能です。下記は、PLSドキュメントの例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>judgment</grapheme>
    <grapheme>judgement</grapheme>
    <phoneme>ˈdʒʌdʒ.mənt</phoneme>    <!-- IPA string is:
    "&#x02C8;d&#x0292;&#x028C;d&#x0292;&#x002E;m&#x0259;nt" --> 
  </lexeme>
  <lexeme>
    <grapheme>fiance</grapheme>
    <grapheme>fiance</grapheme>
    <phoneme>fiˈɒns.eɪ</phoneme>
    <!-- IPA string is:
    "fi&#x02C8;&#x0252;ns&#x002E;e&#x026A;" --> 
    <phoneme>ˌfiː.ɑːnˈseɪ</phoneme>
    <!-- IPA string is:
    "&#x02CC;fi&#x02D0;&#x002E;&#x0251;&#x02D0;n&#x02C8;se&#x026A;" --> 
  </lexeme>
</lexicon>

これは、次のSSMLドキュメントで示しているように、TTSを改善するために使用できます。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">

    <lexicon uri="http://www.example.com/lexicon_defined_above.xml"/>

    <p> In the judgement of my fiance, Las Vegas is the best place for a honeymoon.
              I replied that I preferred Venice and didn't think the Venetian casino was an
              acceptable compromise.<\p>
</speak>

一方で、次のようにSRGS文法のASRを改善するためにも使用できます。

<?xml version="1.0" encoding="UTF-8"?>
<grammar version="1.0"
    xmlns="http://www.w3.org/2001/06/grammar"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
    xsi:schemaLocation="http://www.w3.org/2001/06/grammar 
      http://www.w3.org/TR/speech-grammar/grammar.xsd"
    xml:lang="en-US" root="movies" mode="voice">
  
  <lexicon uri="http://www.example.com/lexicon_defined_above.xml"/>

  <rule id="movies" scope="public">
     <one-of>
             <item>Terminator 2: Judgment Day</item> 
             <item>My Big Fat Obnoxious Fiance</item> 
             <item>Pluto's Judgement Day</item>
     </one-of> 
  </rule>
</grammar>

1.4. PLSでサポートされないもの

現在の仕様では、要件ドキュメント[REQS]に記述されている主な機能を重点的に扱っています。最も複雑な機能については、この仕様の将来の改定に先送りされました。例えば、記述しなかった複雑な機能の一部には、発音に関連する形態素、構文、意味に関する情報（語幹、単語間の意味上のリンク、発音統計など）の紹介などがあります。これらの機能の多くは、1つ以上の発音辞書内の語彙素を参照するRDF[RDF-XMLSYNTAX]を用いて指定できます。

1.5. 用語

頭字語（Acronym）: Personal Computerに対してPCのような名前の頭文字、radio detection and rangingに対してradarのような一連の単語の頭文字や一部の文字の組み合わせ、または、World Wide Web consortiumに対してW3Cのようなバリエーションで形成される単語。
頭字語の展開（Acronym expansion）: 頭字語を、それが表す単語列に置き換える行為。頭字語の展開は通常、TTSエンジンが頭字語を読み上げるのに役立つように、また、ASRがそれらを認識するために実行されます。
ASR、自動音声認識、音声認識（ASR, Automatic Speech Recognition, Speech Recognition）: どの単語、語句または意味情報が存在していたかを判断するために、自動計算アルゴリズムを用いて発言を分析する処理。
書記素（Grapheme）: ある単語を別の単語と区別する、文字、表意文字や記号などの記述言語の最小単位の集合の1つで、綴り法の1つの要素を表現したもの。
同音異義語（Homophone）: 同じように発音されるが、意味、起源、そして綴りが異なることもある単語の集合の1つ。例えば、英語のnightとknight。colorとcolourは、同じ発音と意味を有する異なる綴りであるため、同音異義語ではなく、同じ単語の複数の綴り法とみなされることに注意してください。
同綴異義語（Homograph）: 「『運ぶ、支える』のbearと『熊』のbearや、『導く』のleadと『金属』のleadのように、発音が同じであろうとなかろうと、別の単語と記述形式が同じでありながら異なる意味、また、通常は異なる起源を持つ単語」。[DICT]フランス語の例では、fils（息子）とfils（糸）。
国際音標文字（IPA）（International Phonetic Alphabet）: 国際音標文字[IPA]は、人間の発声器官が生成できる多様な音（音声または音素）を個々に正確かつ一意に表すために言語学者が用いる音標文字です。すべての言語の発音表記に対する標準表記法を目指して作成されています。
語彙素（Lexeme）: 単語または語幹のような言語の原子単位。この仕様では、「語彙素」は、単語や語句の書記素と発音表現（例えば、IPA、SAMPA、ピンインなど）の集合を示します。
辞書（Lexicon）: 最も一般的な意味で、辞書は、単なる単語や語句のリストで、リスト内の項目と関連付けられた情報が含まれている可能性があります。このドキュメントでは、「辞書」という用語を「発音辞書」という特定の意味でのみ使用し、単語（または短い語句）、その記述表現、ASRエンジンやTTSエンジンによる使用に適したその発音の間のマッピングを意味します。しかし、「辞書」という言葉は、他の文脈では別のものを意味する場合があります。
綴り法（Orthography）: 言葉を書き表すための表記法。綴り法には、文字集合、空白、大文字・小文字の区別、アラビア語やペルシア語のような言語の発音区別符号、フランス語のような言語のアクセントが含まれます。
音素（Phoneme）: 単語を識別できる最小単位の音声の集合の1つです。例えば、英語には40以上の音素（19の母音と24の子音）があります。アメリカ英語では、/t/と/p/は、tinとpinという単語を区別できる音素です。
音標文字（Phonetic alphabet）: 英語、中国語やドイツ語のような話し言葉の音を表す記号の集合です。国際音標文字も参照してください。
発音辞書（Pronunciation lexicon）: 用語の発音辞書とは、単語（または短い語句）間のマッピング、その記述表現、ASRエンジンやTTSエンジンによる使用に適したその発音を意味します。
SAMPA: Speech Assessment Methods Phonetic Alphabet[SAMPA]は、国際音標文字が用いる拡張文字ではなく、ASCII文字のみを用いた音標文字。
音声認識の意味的解釈（Semantic Interpretation for Speech Recognition） [SISR]: 自然言語による発言の意味を表す意味結果（semantic result）を作成するためのプロセスを定義したW3C仕様。
音声認識文法仕様（Speech Recognition Grammar Specification） [SRGS]: ASRエンジンが認識できる文法（単語または語句）を記述するための言語を定義したW3C仕様。
音声合成マークアップ言語（Speech Synthesis Markup Language） [SSML]: TTSエンジンによるテキストの表現を規定するためのW3C XML言語。
TTS、Text-To-Speech、音声合成（TTS, Text-To-Speech, Speech Synthesis）: 音声合成技術を用いた、テキストから音声への変換。
URI: Uniform Resource Identifier: ウェブ環境におけるグローバルな識別子[WEB-ARCH]。XMLスキーマパート2:データ型[XML-SCHEMA-2]の3.2.17項で定義されているとおり、URIは、任意の正当なanyURIプリミティブであると定義されています。参考までに、[RFC3986]と[RFC2732]は、構造、フォーマットやURIの使用について理解するのに役立つかもしれません。IRI（[RFC3987]を参照）が上記のURIの定義の範囲内で認められていることに注意してください。

2. 発音文字

音素/音標文字は、発音を指定するために使用します。文字とは、この文脈では、1つ以上の人間の言語の音を表すための記号の集合を指します。PLS仕様では、発音文字は、alphabet属性で指定します（この属性の使用に関する詳細は、4.1項と4.6項を参照）。alphabet属性に有効な値は、「ipa」（次の段落を参照）と、「x-organization」または「x-organization-alphabet」という形式のベンダーが定義した文字列のみです。例えば、電子情報技術産業協会[JEITA]は、自身の音素文字[JEIDAALPHABET]に対し「x-jeita」「x-jeita-2000」のような文字の使用を促進したいと思うかもしれません。別の例は、「x-sampa」[X-SAMPA]（国際音標文字[IPA]の全文字領域をカバーするためのSAMPA音標文字[SAMPA]の拡張）でしょう。

適合PLSプロセッサは、alphabet属性の値として「ipa」をサポートしなければなりません（MUST）。これは、PLSプロセッサが国際音声学会[IPA]が開発したUnicodeによる音声文字の表現をサポートしなければならない（MUST）ことを意味します。この文字集合では、母音記号と子音記号の包括的な集合に加え、音節区切り記号、多数の発音区別符号、強勢記号、字句声調記号、イントネーション・マーカーなどをサポートしています。この文字については、正当な音声/音素の値は、[IPAHNDBK]の付録2で指定されている値の文字列です。IPA転写では、読みやすさのために空白（発音には影響しない）を記述できることに注意してください。IPAからUnicodeへのマッピングの参考情報の表は、[IPAUNICODE1]と[IPAUNICODE2]にあります。すべてのIPA文字がUnicodeで利用できるとは限らないことに注意してください。この文字をサポートしているプロセッサの場合、

プロセッサは、構文上正当な値をすべて受け入れなければならない（MUST）。
プロセッサは、現行の言語に当然属すると考えられるUnicodeのIPAコードをすべて扱うべきである（SHOULD）。

参考情報の注記:

IPA文字には、実装者が影響を受けるかもしれない特徴があることに注意してください。例えば、同等、撤回、廃止されたIPA記号などで、詳細は、[IPAHNDBK]の付録2を参照してください。

参考情報の注記:

言語の音素を表すためにIPA記号を用いる際に、音素の表示にどの異音記号を選択するかには、曖昧さがありえます。これが、同一の言語用に作成されている辞書の間に矛盾をもたらす可能性があることに注意してください。

参考情報の注記:

現在、盲目や弱視の人が、IPA記号が含まれている辞書を即座に読んだり情報の相互作用を行う方法はありません。実装者がそのような相互作用を可能にするツールを提供することが期待されます。

3. PLSドキュメント

3.1 ドキュメント形式

正当な発音辞書（PLS）仕様には、XML 1.0[XML10]またはXML 1.1[XML11]の2.8項にある正当なXMLプロローグがなければなりません（MUST）。XMLプロローグの次にルートの<lexicon>要素が来ます。この要素の詳細については、4.1項を参照してください。

<lexicon>要素は、PLS名前空間を指定しなければなりません（MUST）。これは、xmlns属性または接頭辞「xmlns」を持つ属性の宣言により達成できます。詳細については、XMLの名前空間の2項（XML 1.0[XML-NS10]の名前空間またはXML 1.1[XML-NS11]の名前空間）を参照してください。xmlns属性を単独で用いた場合、それが出現する要素と任意の子要素にデフォルトの名前空間が設定されることに注意してください。PLSの名前空間は、「http://www.w3.org/2005/01/pronunciation-lexicon」と定義されています。

XMLスキーマパート1:構造第2版[XML-SCHEMA-1]の2.6.3項のxsi:schemaLocation属性を用いて、<lexicon>要素でPLSスキーマ（付録Aを参照）の位置も示すことを推奨します（RECOMMENDED）。

下記は、正当なPLSヘッダの例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">

3.2 適合性

この項では、この仕様の適合規則を列挙しています。

特別に示していない限り、この仕様のすべての項は規範的です。この仕様の参考情報部分は、項の中の「参考情報」というラベルで識別できます。

PLS仕様では、個々の適合要件や検証可能なステートメントは、命令文のステートメントで識別できます。このドキュメントの「しなければならない（MUST）」「してはならない（MUST NOT）」「必須である／要求される（REQUIRED）」「することになる（SHALL）」「することはない（SHALL NOT）」「すべきである／する必要がある（SHOULD）」「すべきでない／する必要がない（SHOULD NOT）」「推奨される（RECOMMENDED）」「することができる／してもよい（MAY）」「選択できる／任意である（OPTIONAL）」というキーワードは、[RFC2119]で記述されているように解釈されるべきです。ただし、この仕様では、読みやすさのために、これらの用語をすべて大文字で表しているとは限りません。

3.2.1 適合発音辞書仕様ドキュメント

次の両方の条件を満たしている場合、ドキュメントは、適合発音辞書仕様ドキュメントです。

使用しているXMLのバージョン（XML 1.0[XML10]またはXML 1.1[XML11]のどちらか）に従った整形式であり、XML仕様の対応する名前空間（XML 1.0[XML-NS10]の名前空間またはXML 1.1[XML-NS11]の名前空間）に準拠している。
スキーマ（付録Aを参照）で表された制約を含み、3.1項で定められているXMLプロローグと<lexicon>ルート要素を有するこのドキュメント（発音辞書仕様）で記述している仕様に従っている。

この仕様やこれらの適合基準は、PLSドキュメントのいかなる側面に対してもサイズの制限を定めません。属性値の要素数、文字のデータ量、文字数に上限値はありません。

3.2.2 他の名前空間を持つPLSの使用

PLS名前空間は、XML勧告の名前空間に従った他のXML名前空間（XML 1.0[XML-NS10]の名前空間またはXML 1.1[XML-NS11]の名前空間）と共に使用することもできます（MAY）。W3Cによる取り組みにより、将来的には、複数の名前空間を含むドキュメントの適合性を指定する方法が出現するでしょう。

3.2.3 適合発音辞書仕様プロセッサ

適合発音辞書仕様プロセッサは、適合発音辞書仕様ドキュメントを解析し処理できなければなりません（MUST）。

適合発音辞書仕様プロセッサでは、XMLパーザは、XML 1.0[XML10]またはXML 1.1[XML11]のどちらかで定義されているすべてのXML構成子を解析し処理できなければならず（MUST）、対応するXML仕様の名前空間（XML 1.0[XML-NS10]の名前空間またはXML 1.1[XML-NS11]の名前空間）に準拠します。

適合発音辞書仕様プロセッサは、適合非検証プロセッサに関し、XML 1.0またはXML 1.1の要件に準拠しなければなりません（MUST）。

適合発音辞書仕様プロセッサは、このドキュメントで記述されているとおりに、正確に個々のマークアップ要素のセマンティクスを理解し適用しなければなりません（MUST）。

適合発音辞書仕様プロセッサは、自然（人間の）言語を扱うために、次の要件を満たさなければなりません（MUST）

適合発音辞書仕様プロセッサが、正当な自然（人間の）言語の宣言をすべてうまく解析することは必須です（REQUIRED）。
発音辞書仕様プロセッサがサポートを表明している自然（人間の）言語を表す値を持つxml:lang属性（<lexicon>要素の）を有する適合発音辞書仕様ドキュメントでは、プロセッサが適合プロセッサであるためには、その言語で遭遇したかのようにすべてのテキストをうまく解析し処理することが必須です（REQUIRED）。
適合発音辞書仕様プロセッサは、プロセッサがサポートしていない自然（人間の）言語を表す値を持つxml:lang属性（<lexicon>要素の）を有する適合発音辞書仕様ドキュメントを解析する場合、ホスティング環境に通知すべきです（SHOULD）。

適合発音辞書仕様プロセッサが、この仕様で宣言されていない要素や属性に遭遇したり、この仕様が禁止している場所でそのような要素や属性が発生した場合には、プロセッサは次を選択できます（MAY）。

非標準の要素および／または属性を無視する。
または、非標準の要素および／または属性を処理する。
または、これらの要素および／または属性が含まれているドキュメントを拒否する。

このドキュメントで明記している場合を除き、ASRとTTSに対する音響構造（モデル、波形など）としての発音表現の性能に関する適合要求はありません。

4. 発音辞書マークアップ言語定義

発音辞書のマークアップ言語は、次の要素と属性で構成されます。

要素	属性	説明
`<lexicon>`	`version` `xml:base` `xmlns` `xml:lang` `alphabet`	PLSのルート要素
`<meta>`	`name` `http-equiv` `content`	メタデータが含まれている要素
`<metadata>`		メタデータが含まれている要素
`<lexeme>`	`xml:id` `role`	1つの字句エントリー用コンテナ要素
`<grapheme>`		語彙素の綴り法に関する情報が含まれている。
`<phoneme>`	`prefer` `alphabet`	語彙素の発音情報が含まれている。
`<alias>`	`prefer`	頭字語の展開および綴り法の代替が含まれている。
`<example>`		語彙素の使用例が含まれている。

4.1 `<lexicon>`要素

発音辞書マークアップ言語のルート要素は、<lexicon>要素です。この要素は、PLS言語の他のすべての要素のコンテナです。<lexicon>要素には、0以上の<meta>要素が含まれていなければならず（MUST）、その次に任意の（OPTIONAL）<metadata>が続き、その次に0以上の<lexeme>要素が続きます。<lexeme>要素のないPLSドキュメントは、将来の字句エントリーの代替として有用かもしれないことに注意してください。

<lexicon>要素には、PLSドキュメントで用いられるデフォルトの発音文字を示すalphabet属性を指定しなければなりません（MUST）。alphabet属性の値については、2項で記述しています。<phoneme>要素を用いると、任意の語彙素でデフォルトの発音文字を上書きできます（MAY）。

version属性は、ドキュメントに用いる仕様のバージョンを示す必須の（REQUIRED）属性で、「1.0」という値でなければなりません（MUST）。

必須の（REQUIRED）xml:lang属性により、発音辞書に適した言語の識別が可能となります。IETFのBest Current Practice 47[BCP47]は、xml:lang属性の値に関する規範的な参照です。

xml:langが、PLSドキュメントの全体に対し、1つの一意の言語を指定することに注意してください。これは、多言語のSRGS[SRGS]やSSML[SSML]のドキュメントを作成する性能を制限するものではありません。そのようなドキュメントは、異なる言語で記述されている可能性のある複数の発音辞書を参照できます。

PLSの名前空間URIは、「"http://www.w3.org/2005/01/pronunciation-lexicon"」です。すべてのPLSマークアップは、XML 1.0[XML-NS10]の名前空間またはXML 1.1[XML-NS11]の名前空間のいずれかで記述された名前空間宣言を用いて、PLS名前空間に関連付けなければなりません（MUST）。これは、例えば、この仕様の例で示しているとおり、<lexicon>要素にxmlns属性を宣言すれば達成できます。

PLSドキュメントには、[XML-BASE]で定義されているxml:base属性を含むことができます（MAY）。HTML 4.01の仕様[HTML]にあるとおり、これが、ドキュメント内のすべての相対参照が基底とするURIであることに注意してください。

参考情報の注記:

このバージョンの仕様では、潜在的にメタデータの内容のみに相対URIを使用できることに注意してください。

例:

「トマト」という単語とその発音に関するシンプルなPLSドキュメント。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>tomato</grapheme>
    <phoneme>təmei̥ɾou̥</phoneme>
    <!-- IPA string is: "t&#x0259;mei&#x325;&#x027E;ou&#x325;" -->
  </lexeme>
</lexicon>

4.2 `<meta>`要素

<metadata>要素と<meta>要素は、ドキュメントに関する情報を置くことができるコンテナです。<metadata>要素は、メタデータ・スキーマを用いて、<meta>よりも汎用的でより強力なメタデータ情報の処理が可能になります。

<meta>要素は、宣言されたmetaプロパティーに文字列を関連付けるか、http-equiv contentを宣言します。name属性かhttp-equiv属性のいずれかが必須です（REQUIRED）。name属性とhttp-equiv属性の両方を提供するのはエラーです。content属性も必須です（REQUIRED）。「seeAlso」は、この仕様で定義されている唯一の<meta>プロパティーです。これは、コンテンツに関する付加的なメタデータ情報を提供する資源を指定するために用いられます。このプロパティーは、「RDF語彙記述言語1.0: RDFスキーマ」[RDF-SCHEMA]の5.4.1項の「seeAlso」プロパティーでモデル化されています。http-equiv属性は、HTTPでドキュメントを検索する場合に特に重要となります。推奨されるHTTPヘッダ情報の提供方法は、HTTPヘッダ・フィールドを用いるというものですが、SSMLドキュメントの作成者が、HTTPヘッダ・フィールドの設定により元サーバにあるドキュメントに関連付けることができないような場合には（例えば、キャッシュ制御情報）、http-equiv contentを使用できます（MAY）。HTTPサーバとキャッシュがPLSドキュメントの<meta>の内容を検査する必要はなく、したがって、それ以外の場合にHTTPサーバとキャッシュが送信するヘッダの値を無効することに注意してください。

<meta>要素は空要素です。

参考情報の注記:

この項は、HTML 4.01仕様[HTML]の<meta>記述に倣ってモデル化されています。名前/コンテンツのモデルは、メタデータを含めるという、より良い方法に置き換えられたという事実にもかかわらず（例えば、XHTML 2.0[XHTML2]の20.6項を参照）、また、XHTMLメディア・タイプ[XHTML-MTYPES]の3.3項では、http-equiv指示子が推奨されなくなったという事実にもかかわらず、ワーキンググループは、Speech Interface Framework（VoiceXML、SSML、SRGS、CCXML）の最初のバージョンにおける他の仕様との互換性のためにこれを保持することに決めました。フレームワークの将来のバージョンでは、より最新のメタデータ・スキームと整合性を持つことになるでしょう。

例:

下記は、どのようにPLSドキュメントに<meta>要素を記述すれば、付加的なメタデータ情報を提供する資源を指定できるかの例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
    <meta http-equiv="Cache-Control" content="no-cache"/>
    <meta name="seeAlso" content="http://example.com/my-pls-metadata.xml"/>
    <!--  If lexemes are to be added to this lexicon, they start below -->
</lexicon>

4.3 `<metadata>`要素

<metadata>要素は、メタデータのマークアップを用いてドキュメントに関する情報を置くことができるコンテナです。<metadata>要素の内容を処理するソフトウェアの挙動に関しては、この仕様では述べていません。したがって、この仕様を実装しているソフトウェアは、自由にその内容を無視できます。

<metadata>では、どのメタデータのマークアップでも使用できますが、RDF/XML構文[RDF-XMLSYNTAX]を、Dublin Core Metadata Initiative[DC]が定義している汎用的なメタデータ・プロパティー（例えば、Title（タイトル）、Creator（作成者）、Subject（主題）、Description（内容記述）、Rights（権利関係）など）と併せて使用することを推奨します（RECOMMENDED）。

例:

次の例は、タイトル、内容記述、日付などの一般的なドキュメント情報を記述する「ダブリン・コア・メタデータ要素セット、バージョン1.1」[DC-ES]を用いて、PLSドキュメントにメタデータを記述する方法の例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <metadata>
    <rdf:RDF
       xmlns:rdf = "http://www.w3.org/1999/02/22-rdf-syntax-ns#"
       xmlns:dc  = "http://purl.org/dc/elements/1.1/">

     <!-- Metadata about the PLS document -->
     <rdf:Description rdf:about=""
       dc:title="Pronunciation lexicon for W3C terms"
       dc:description="Common pronunciations for many W3C acronyms and abbreviations, i.e. I18N or WAI"
       dc:publisher="W3C"
       dc:date="2005-11-29"
       dc:rights="Copyright 2002 W3C"
       dc:format="application/pls+xml">
       <dc:creator>The W3C Voice Browser Working Group</dc:creator>
     </rdf:Description>
    </rdf:RDF>
  </metadata>
  <!--  If lexemes are to be added to this lexicon, they start below -->
</lexicon>

4.4 `<lexeme>`要素

<lexeme>要素は、字句エントリー用のコンテナで、複数の綴り法と複数の発音情報を含むことができます（MAY）。

<lexeme>要素には、1つ以上の<grapheme>要素、1つ以上の発音（<phoneme>要素または<alias>要素のどちらか、または両方の組み合わせによる）および0以上の<example>要素が含まれます。<lexeme>要素の子要素は、任意の順に出現可能です（MAY）が、その順序が複数の発音の処理に影響を及ぼしえることに注意してください（4.9項を参照）。

<lexeme>要素には、任意の（OPTIONAL）xml:id[XML-ID]属性があり、これによって、この要素を他のドキュメントから参照（例えば、フラグメント識別子やXPointer[XPOINTER]によって）可能となります。例えば、開発者は、メタデータ（品詞または単語の関係の部分など）を語彙素に関連付けるために外部のRDFステートメント[RDF-CONC]を使用できます。

<lexeme>要素は、その値として、XML（使用されているXMLのバージョンにより1.0[XML-NS10]または1.1[XML-NS11]）の名前空間の4項で定義されている1つ以上の空白で区切られたQNamesをとる任意の（OPTIONAL）role属性を持ちます。

role属性は、綴り法に最も適した発音の選択に役立つ追加情報を記述します。主な用途は、綴りは同じだけれども発音方法が異なる単語を区別することです（同綴異義語を参照。また、5.5項も参照）。role属性の属性コンテンツ内のQNameは、記述されている<lexeme>要素の範囲内の名前空間宣言を用いて展開名に展開されます。したがって、各QNameにより、指定された名前空間内の特定の項目への参照が可能となります。下記の2番目の例では、role属性内の「claws:VVI」というQNameは、「http://www.example.com/claws7tags」という名前空間の「VVI」という項目に展開されます。この仕組みによって、品詞の定義済みタクソノミーが指定された名前空間URIでドキュメント化されているとの想定に基づいて、そのタクソノミーを参照できるようになります。

例:

語彙素が2つあるイタリア語の発音辞書。そのうちの1つは、英語と同じ意味と発音を持つ単語として技術的な議論においてしばしば使用される「file」という外来語です。これは、「queue（列）」を意味する「fila」の複数形である「ファイル」という同綴異義の名詞とは違います。「file」に対するこのユーザ固有の発音が、任意のシステム定義の発音より優先されることに注意してください。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="it">
  <lexeme>
    <grapheme>file</grapheme>
    <phoneme>faɪl</phoneme>
    <!-- This is the pronunciation
      of the loan word "file" in Italian.
      IPA string is: "fa&#x026A;l" -->
  </lexeme>
  <lexeme>
    <grapheme>EU</grapheme>
    <alias>Unione Europea
      <!-- This is a substitution of the European
      Union acronym in Italian language.  --></alias>
  </lexeme>
</lexicon>

下記は、「read」という単語の発音辞書の例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0"       xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      xmlns:claws="http://www.example.com/claws7tags" alphabet="ipa"
      xml:lang="en">
  <lexeme role="claws:VVI claws:VV0 claws:NN1">
    <!-- verb infinitive, verb present tense, singular noun -->
    <grapheme>read</grapheme>
    <phoneme>ri&#x02D0;d<!-- same as riːd --></phoneme>
  </lexeme>
  <lexeme role="claws:VVN claws:VVD">
    <!-- verb past participle, verb past tense -->
    <grapheme>read</grapheme>
    <phoneme>red</phoneme>
  </lexeme>
</lexicon>

role属性が修飾付きの値（この例では、UCREL CLAWS7タグ集合の品詞）に基づいて、「read」という単語の不定詞形・現在形の動詞および単数名詞の発音と、過去形・過去分詞形の発音と区別することに注意してください。

下記は、上記の辞書を参照しており、さらに、role属性を用いてダイアログ内の「read」という単語の適切な発音を選択する方法を示す拡張要素を含んでいるドキュメントの例です。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
      xmlns="http://www.w3.org/2001/10/synthesis" 
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
        http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
      xmlns:myssml="http://www.example.com/ssml_extensions"
      xmlns:claws="http://www.example.com/claws7tags"
      xml:lang="en">
  <lexicon uri="http://www.example.com/lexicon.pls"
      type="application/pls+xml"/>
  <voice gender="female" age="3">
      Can you <myssml:token role="claws:VVI">read</myssml:token> this book
      to me?
  </voice>
  <voice gender="male" age="43">
      I've already <myssml:token role="claws:VVN">read</myssml:token> it
      three times!
  </voice>
</speak>

また、下記は、SSML 1.1[SSML-11]を用いた、中国語の例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0"
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      xmlns:claws="http://www.example.com/claws7tags"
      alphabet="x-myorganization-pinyin"
      xml:lang="zh-CN">
  <lexeme role="claws:VV0">
    <!-- base form of lexical verb -->
    <grapheme>处</grapheme>
    <phoneme>chu3</phoneme>
    <!-- pinyin string is: "chǔ" in 处罚 处置 -->
  </lexeme>
  <lexeme role="claws:NN">
    <!-- common noun, neutral for number -->
    <grapheme>处</grapheme>
    <phoneme>chu4</phoneme>
    <!-- pinyin string is: "chù" in 处所 妙处 -->
  </lexeme>
</lexicon>

下記は、上記の辞書を参照しており、さらに、role属性を用いてダイアログ内の「处」という中国語の単語の適切な発音を選択する方法を示すドキュメントの例です。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.1"
      xmlns="http://www.w3.org/2001/10/synthesis"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
        http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
      xmlns:claws="http://www.example.com/claws7tags"
      xml:lang="zh-CN">
  <lexicon uri="http://www.example.com/lexicon.pls"
      type="application/pls+xml"
      xml:id="mylex"/>
  <lookup ref="mylex">
    他这个人很不好相<w role="claws:VV0">处</w>。
    此<w role="claws:NN">处</w>不准照相。
  </lookup>
</speak>

参考情報の注記:

SRGS 1.0[SRGS]とSSML 1.0[SSML]の仕様は、現時点では、role属性に基づく選択メカニズムをサポートしていません。これらの仕様の将来のバージョンでは、role属性に基づく適切な発音の選択が可能になると予想されます。

4.5 `<grapheme>`要素

<lexeme>には、少なくとも1つの<grapheme>要素が含まれています。<grapheme>要素には、<lexeme>の綴り法を記述したテキストが含まれています。

<grapheme>要素には、「character」という子の情報項目が含まれていなければなりません（MUST）。<grapheme>要素には、任意の名前空間の「element」という子の情報項目、つまり、PLSまたは外部の名前空間が含まれていてはなりません（MUST NOT）。

より複雑な状況では、同じ単語や語句に別のテキスト表現があることもありえ、これは、様々な理由で発生する可能性があります。例えば、次のようなケースがあります。

地域的な綴りの違い（例えば、「colour」と「color」）
自由な綴りのバリエーション（例えば、「judgment」と「judgement」）
選択型表記体系。例えば、日本語は、単語や語句の綴り法の表現に、表意文字（漢字）、音素表記法（片仮名または平仮名）の組み合わせを用いており、そのような組み合わせには、例えば「行なう」と「行う」のなどの漢字の送り仮名におけるようないくつかのバリエーションがありえる。
綴りの改正。例えば、ドイツ語では、以前は「ß」を用いていた単語の一部が、現在は「ss」で記述される。

上記のバリエーションへの対応として発音情報を複製する必要性を排除するために、<lexeme>要素に複数の<grapheme>要素を記述して、基底の綴り法やあらゆるバリエーションを定義することができます（MAY）。<lexeme>内で付与されているすべての発音が、<lexeme>内のあらゆる<grapheme>に適用されることに注意してください。

例:

1つの書記素と1つの発音の例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>Sepulveda</grapheme>
    <phoneme>səˈpʌlvɪdə</phoneme>
    <!-- IPA string is: "s&#x0259;&#x02C8;p&#x028C;lv&#x026A;d&#x0259;" -->
  </lexeme>
</lexicon>

もう1つは、1つの字句エントリーに複数の記述形式がある例で、最初の綴り法では「ローマ字」の綴り法にラテン文字を用い、2番目では「漢字」の綴り法を用い、3番目では「平仮名」の綴り法を用いています。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="jp">
  <lexeme>
    <grapheme>nihongo<!-- "Romaji" --></grapheme>
    <grapheme>日本語<!-- "Kanji" --></grapheme>
    <grapheme>にほんご<!-- "Hiragana" --></grapheme>
    <phoneme>ɲihoŋo
      <!-- IPA string is: "&#x0272;iho&#x014B;o" --></phoneme>
  </lexeme>
</lexicon>

4.6 `<phoneme>`要素

<lexeme>には、1つ以上の<phoneme>要素を含むことができます（MAY）。<phoneme>要素には、<lexeme>の発音方法を記述したテキストが含まれます。

<phoneme>要素には「character」という子の情報項目が含まれていなければなりません（MUST）。<phoneme>要素には、任意の名前空間の「element」という子の情報項目、つまり、PLSまたは外部の名前空間が含まれていてはなりません（MUST NOT）。

<phoneme>要素は、alphabet属性を持つことができ（MAY）、それは、この<phoneme>要素のみに用いられる発音文字を示します。デフォルトの発音文字については、4.1項を参照してください。alphabet属性用の正当な値は、2項で記述しています。

preferは、任意の（OPTIONAL）属性で、値が「true」の場合には、音声合成エンジンが使用しなければならない（MUST）発音を示します。複数の発音に「true」という値を持つpreferがある場合にどのような挙動が求められるかに関しては、4.9項を参照してください。可能な値は、「true」か「false」です。デフォルト値は「false」です。

preferのメカニズムは、<phoneme>と<alias>の両方の要素を範囲としています。4.9項は、ASRとTTSに対してPLSで複数の発音を指定する方法を記述しており、4.9.3項で多くの例を挙げています。

例:

字句エントリーに対する複数の発音

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>huge</grapheme>
    <phoneme prefer="true">hjuːdʒ</phoneme>
    <!-- IPA string is: "hju&#x02D0;d&#x0292;" -->
    <phoneme>juːdʒ</phoneme>
    <!-- IPA string is: "ju&#x02D0;d&#x0292;" -->
  </lexeme>
</lexicon>

複数の記述形式と複数の発音

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>theater</grapheme>
    <grapheme>theatre</grapheme>
    <phoneme prefer="true">ˈθɪətər</phoneme>
    <!-- IPA string is: "&#x02C8;&#x03B8;&#x026A;&#x0259;t&#x0259;r" -->
    <phoneme>ˈθiːjətər</phoneme>
    <!-- IPA string is: "&#x02C8;&#x03B8;i&#x02D0;j&#x0259;t&#x0259;r" -->
  </lexeme>
</lexicon>

発音文字を独自のものに変更する<phoneme>の例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>color</grapheme>
    <phoneme>ˈkʌlər</phoneme>
    <!-- IPA string is: "&#x02C8;k&#x028C;l&#x0259;r" -->
  </lexeme>
  <lexeme>
    <grapheme>XYZ</grapheme>
    <phoneme alphabet="x-example-alphabet">XYZ</phoneme>
    <!-- The above pronunciation is given in a proprietary alphabet 
      called: "x-example-alphabet" -->
  </lexeme>
</lexicon>

4.7 `<alias>`要素

<lexeme>要素には、必要に応じて頭字語や略語の発音を他の綴り法や他の代替方法で示すために用いる1つ以上の<alias>要素を含むことができます（MAY）。下記および4.9.3項の例を参照してください。

<alias>要素には、「character」という子の情報項目が含まれていなければなりません（MUST）。<alias>要素には、任意の名前空間の「element」の子の情報項目、つまり、PLSまたは外部の名前空間が含まれていてはなりません（MUST NOT）。

<lexeme>要素には、<alias>要素と<phoneme>要素の両方が存在しえます（MAY）。著者が発音を明確に制御したい場合には、<alias>要素ではなく<phoneme>要素を使用できます。

<alias>要素には、<phoneme>要素のprefer属性に似た任意の（OPTIONAL）prefer属性があります。prefer属性の規範的記述に関しては、4.6項を参照してください。

<alias>要素コンテンツの発音は、PLSドキュメント内の構成書記素の<phoneme>要素で記述されている発音を用い、構成書記素の<alias>要素上のPLSドキュメントへのアクセスを再帰的に呼び出すことなく、プロセッサが生成しなければなりません（MUST）。プロセッサは、辞書の外部にある書記素の発音を決定するのと同じプロセスで残りの<alias>要素コンテンツの発音を決定すべきです（SHOULD）。

例:

<alias>要素を用いた頭字語の展開

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>W3C</grapheme>
    <alias>World Wide Web Consortium</alias>
  </lexeme>
</lexicon>

次の例は、<alias>要素と<phoneme>要素の組み合わせを示しています。提示している頭字語「GNU」には、2つの発音しかありません。<alias>の再帰が許されていないため、<alias>要素で表現されている「Unix」の発音が<alias>要素コンテンツの「GNU」の発音の一部として用いられないことに注意してください。プロセッサは、<phoneme>要素で記述されている「GNU」と「Unix」の発音を用いて「GNU is Not Unix」の発音を生成します。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>GNU</grapheme>
    <alias><!-- be careful about recursion here -->GNU is Not Unix</alias>
    <phoneme>gəˈnuː</phoneme>
    <!-- IPA string is: "g&#x0259;&#x02C8;nu&#x02D0;" -->
  </lexeme>
  <lexeme>
    <grapheme>Unix</grapheme>
    <grapheme>UNIX</grapheme>
    <alias>a multiplexed information and computing service</alias>
    <phoneme>ˈjuːnɪks</phoneme>
    <!-- IPA string is: "&#x02C8;ju&#x02D0;n&#x026A;ks" -->
  </lexeme>
</lexicon>

4.8 `<example>`要素

<example>要素には、この語彙素の存在について説明した例文が含まれています。exampleは明示的にマーク付けされるため、発音辞書ドキュメントの回帰試験や生成に自動ツールを使用できます。

<example>要素には、「character」の子の情報項目が含まれていなければなりません（MUST）。<example>要素には、任意の名前空間の「element」子の情報項目、つまり、PLSまたは外部の名前空間が含まれていてはなりません（ MUST NOT）。

1つの<lexeme>要素に対し、0、1または多数の <example>要素を付与できます（MAY）。

例:

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>led</phoneme>
    <example>My feet were as heavy as lead.<!-- possible comment --></example>
  </lexeme>
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
    <example>The guide once again took the lead.</example>
  </lexeme>
</lexicon>

4.9 ASRとTTSに対する複数の発音

この項では、ASRとTTSに対してPLSドキュメントで指定されている複数の発音の処理について記述しています。

4.9.1 ASRに対する複数の発音

ある<lexeme>に対し複数の発音が指定されている（<phoneme>要素または<alias>要素のどちらか、または両方の組み合わせによって）場合、ASRプロセッサは、それぞれを<grapheme>に対する有効な発音と見なさなければなりません（MUST）。4.9.3項の例2とそれ以下の例を参照してください。

複数の<lexeme>に同じ<grapheme>が含まれている場合、すべての関連する発音（role属性を用いた関連する発音の選択に関しては、4.4項の議論を参照）は、ドキュメント順に集められるでしょう。そして、ASRプロセッサは、それらすべてが<grapheme>に対して有効な発音であると見なさなければなりません（MUST）。4.9.3項の例7と例8を参照してください。

4.9.2 TTSに対する複数の発音

ある<lexeme>に複数の発音が指定されている（<phoneme>要素または<alias>要素のどちらか、または両方の組み合わせによって）場合、TTSプロセッサには、「true」という値を持つprefer属性があるドキュメント順において最初の発音を使用しなければなりません（MUST）。「true」という値を持つpreferがある発音がない場合、TTSプロセッサが発音の選択方法を有するようにドキュメント化されていなければ（その場合には、プロセッサは、発音のうちのどれか1つを使用しなければならない（MUST））、TTSプロセッサは、ドキュメント順において最初の発音を使用しなければなりません（MUST）。4.9.3項の例2とそれ以下の例を参照してください。

複数の<lexeme>に同じ<grapheme>が含まれている場合、すべての関連する発音（role属性を用いた関連する発音の選択に関しては、4.4項の議論を参照）は、ドキュメント順に集められるでしょう。そして、TTSプロセッサは、「true」という値を持つprefer属性があるドキュメント順において最初の発音を使用しなければなりません（MUST）。関連する発音に「true」という値を持つpreferがない場合、TTSプロセッサが発音の選択方法を有するようにドキュメント化されていなければ（その場合には、プロセッサは、関連する発音のうちのどれか1つを使用しなければならない（MUST））、TTSプロセッサはドキュメント順において最初の発音を使用しなければなりません（MUST）。4.9.3項の例7と例8を参照してください。

TTSプロセッサには、複数の発音から自動的に選択可能な、言語に依存した内部メカニズムがあるかもしれないことに注意してください。4.9.3項の例9を参照してください。

4.9.3 複数の発音の例

この項は参考情報です。

次の例は、複数の発音に関する最も一般的な例について説明することを目的としています。ASRとTTSの両方の挙動について記述しています。

例1:

次の例では、発音は1つのみです。ASRとTTSの両方のプロセッサがこれを使用するでしょう。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>bead</grapheme>
    <phoneme>biːd</phoneme>
    <!-- IPA string is: "bi&#x02D0;d" -->
  </lexeme>
</lexicon>

例2:

次の例には、2つの発音があります。ASRプロセッサは両方の発音を認識し、TTSプロセッサは1つのみを使用するでしょう。発音に「true」という値を持つpreferがないため、プロセッサに別の対応策が記述されていなければ、プロセッサは最初の発音を使用するでしょう（ドキュメント順において最初の発音であるため）。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>read</grapheme>
    <phoneme>red</phoneme>
    <phoneme>riːd</phoneme>
    <!-- IPA string is: "ri&#x02D0;d" -->
  </lexeme>
</lexicon>

例3:

次の例には、2つの発音があります。ASRプロセッサは両方の発音を認識し、TTSプロセッサは2番目の発音のみを使用するでしょう（「true」という値を持つpreferがあるため）。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>led</phoneme>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
</lexicon>

例4:

次の例では、「read」には2つの発音があります。最初の発音は、その直下で定義されている「red」の別名という形で指定されています。ASRプロセッサは両方の発音を認識し、TTSプロセッサは1つのみを使用するでしょう。発音に「true」という値を持つpreferがないため、プロセッサに別の対応策が記述されていなければ、プロセッサは、最初の発音を使用するでしょう（ドキュメント順において最初の発音であるため）。この例では、別名は辞書の終わりのほうにある語彙素を指していますが、一般的に、この順序は適切ではありません。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>read</grapheme>
    <alias>red</alias>
    <phoneme>riːd</phoneme>
    <!-- IPA string is: "ri&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>red</grapheme>
    <phoneme>red</phoneme>
  </lexeme>
</lexicon>

例5:

次の例では、「lead」には2つの発音があります。両方に「true」という値を持つpreferがあります。ASRプロセッサは両方の発音を認識し、TTSプロセッサは最初の発音のみを使用するでしょう（「true」という値を持つpreferがあるドキュメント順において最初の発音であるため）。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <alias prefer="true">led</alias>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>led</grapheme>
    <phoneme>led</phoneme>
  </lexeme>
</lexicon>

例6:

次の例では、「lead」には2つの発音があります。ASRプロセッサは両方の発音を認識し、TTSプロセッサは2番目の発音のみを使用するでしょう（「true」という値を持つpreferがあるため）。「led」という「lead」の別名エントリーが別名の発音の優先設定を継承しないことに注意してください。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <alias>led</alias>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>led</grapheme>
    <phoneme prefer="true">led</phoneme>
  </lexeme>
</lexicon>

例7:

次の例では、「lead」には2つの異なるエントリーが辞書内にあります。ASRプロセッサはここで示している両方の発音を認識し、TTSプロセッサは1つのみを認識するでしょう。発音に「true」という値を持つpreferがないため、プロセッサに別の対応策が記述されていなければ、プロセッサは「led」という発音を使用するでしょう（ドキュメント順において最初の発音であるため）。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>led</phoneme>
  </lexeme>
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
</lexicon>

例8:

次の例では、同じ辞書ドキュメント内の2つの異なる語彙素エントリーのそれぞれに2つの発音があります。ASRプロセッサはここで示している両方の発音を認識し、TTSプロセッサは「liːd」という発音のみを認識するでしょう（「true」という値を持つpreferがあるドキュメント順において最初の発音であるため）。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <alias>led</alias>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme prefer="true">led</phoneme>
    <phoneme>liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
</lexicon>

例9:

次のフランス語の例では、「1」には3つの発音があります。最後の2つの発音は、その直下で定義されている「une」の別名という形で指定されています。ASRプロセッサはここで示している3つの発音をすべて認識し、プロセッサに別段の記述がない場合には、TTSプロセッサは「un」という発音のみを認識するでしょう。TTSプロセッサが、複数の発音のどちらかを自動的に選択できるように記述されている場合には、「un」か「une」という別名のどちらかを（文法上の文脈により）選択するでしょう。「une」という別名を選択すれば、「yn」という発音が使用されるでしょう（「true」という値を持つpreferがあるため）。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0"
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="fr">
  <lexeme>
    <grapheme>1</grapheme>
    <alias>un</alias>
    <alias>une</alias>
  </lexeme>
  <lexeme>
    <grapheme>une</grapheme>
    <phoneme prefer="true">yn</phoneme>
    <phoneme>ynə</phoneme>
    <!-- IPA string is: "yn&#x0259;" -->
  </lexeme>
</lexicon>

5. 例

この項は参考情報です。

5.1 シンプルなケース

発音辞書言語を用いると、最もシンプルな形で綴り法（テキスト表現）を発音（音声/音素表現）に関連付けることができます。通常、発音辞書ドキュメントには、複数のエントリーが含まれています。したがって、例えば、「Newton」や「Scahill」のような固有名詞の発音を指定するためのマークアップは次のようになるでしょう。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-GB">
  <lexeme>
    <grapheme>Newton</grapheme>
    <phoneme>ˈnjuːtən</phoneme>
    <!-- IPA string is: "&#x02C8;nju&#x02D0;t&#x0259;n" -->
  </lexeme>
  <lexeme>
    <grapheme>Scahill</grapheme>
    <phoneme>ˈskɑhɪl</phoneme>
    <!-- IPA string is: "&#x02C8;sk&#x0251;h&#x026A;l" -->
  </lexeme>
</lexicon>

この例では、<lexicon>というルート要素は、「Newton」、「Scahill」という単語に対して2つの語彙素が含まれています。それぞれの<lexeme>は、綴り法と発音表現のエントリーから成る合成要素です。2つの<lexeme>要素には、それぞれ、綴り法のテキストが含まれている1つの<grapheme>要素と発音が含まれている1つの<phoneme>要素が存在しています。この場合、<lexicon>要素のalphabet属性の値が「ipa」であるため、すべての発音に国際音標文字[IPA]が用いられています。

5.2 同じ綴り法に対する複数の発音

ASRシステムでは、一般的に、同じ単語や語句の複数の発音を頼りに、言語の発音のバリエーションに対応します。発音辞書言語では、複数の発音は、同じ<lexeme>要素内の複数の<phoneme>（または<alias>）要素で表されます。

次の例では、「Newton」という単語には、2つの発音があります。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-GB">
  <lexeme>
    <grapheme>Newton</grapheme>
    <phoneme>ˈnjuːtən</phoneme>
    <!-- IPA string is: "&#x02C8;nju&#x02D0;t&#x0259;n" -->
    <phoneme>ˈnuːtən</phoneme>
    <!-- IPA string is: "&#x02C8;nu&#x02D0;t&#x0259;n" -->
  </lexeme>
</lexicon>

利用可能な複数の発音から1つのみを選択する必要がある場合には（例えば、発音辞書が音声合成システムで用いられている場合など）、優先する発音を示すために<phoneme>要素のprefer属性を使用できます。

5.3 複数の綴り法

同じ単語や語句に対して複数の別のテキスト表現が存在している場合もあります。これは、様々な理由で発生する可能性があります。詳細は、4.5項を参照してください。これらは同じ意味を持つ表現（同音異義語の反対に）であるため、複数の書記素が含まれる1つの<lexeme>要素を用いて表現することを推奨します。

ここで、複数の綴り法に関するシンプルな例として、英語の単語の別の綴りと、日本語の単語の複数の記述の2つを紹介します。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <!-- English entry showing how alternative spellings are handled -->
  <lexeme>
    <grapheme>colour</grapheme>
    <grapheme>color</grapheme>
    <phoneme>ˈkʌlər</phoneme>
    <!-- IPA string is: "&#x02C8;k&#x028C;l&#x0259;r" -->
  </lexeme>
</lexicon>

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="jp">
  <!-- Japanese entry showing how multiple writing systems are handled
          romaji, kanji and hiragana orthographies -->
  <lexeme>
    <grapheme>nihongo</grapheme>
    <grapheme>日本語</grapheme>
    <grapheme>にほんご</grapheme>
    <phoneme>ɲihoŋo</phoneme>
    <!-- IPA string is: "&#x0272;iho&#x014B;o" -->
  </lexeme>
</lexicon>

発音は、完全に同じではなく、部分的に一致している場合がありえます。例えば、「Smyth」および「Smith」という英語の名前には1つの共通する発音がありますが、「Smyth」には、自身にのみ適合する発音があります。したがって、複数の<lexeme>要素を用いて、これを表現する必要があります。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>Smyth</grapheme>
    <grapheme>Smith</grapheme>
    <phoneme>smɪθ/phoneme>
    <!-- IPA string is: "sm&#x026A;&#x03B8;" -->
  </lexeme>
  <lexeme>
    <grapheme>Smyth</grapheme>
    <phoneme>smaɪð</phoneme>
    <!-- IPA string is: "sma&#x026A;&#x00F0;" -->
  </lexeme>
</lexicon>

5.4 同音異義語

ほとんどの言語には、「seed」と「cede」のような、同じ発音だけれども異なる意味を持つ（また、恐らく綴りが異なる）単語である同音異義語があります。これらは、異なる語彙素で表現することを推奨します。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>cede</grapheme>
    <phoneme>siːd</phoneme>
    <!-- IPA string is: "si&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>seed</grapheme>
    <phoneme>siːd</phoneme>
    <!-- IPA string is: "si&#x02D0;d" -->  </lexeme>
</lexicon>

5.5 同綴異義語

ほとんどの言語には、同綴異義語と呼ばれる、意味は異なるけれども同じ綴りの（また、発音が異なる場合もある）単語があります。例えば、英語のbass（魚の）という単語とbass（音楽の）という単語は、綴りは同じですが意味と発音は異なります。これらの単語は、異なる値のrole属性で区別される別々の<lexeme>要素を用いて表すことを推奨しますが、発音辞書の作成者が2つの単語を区別したくなければ、シンプルに、同じ<lexeme>要素内の別の発音として表現できます（4.4項を参照）。後者の場合には、TTSプロセッサは、1番目と2番目の転写をいつ適用すべきか区別できないでしょう。

この例では、「bass」という同綴異義語の発音を示しています。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>bass</grapheme>
    <phoneme>bæs</phoneme>
    <!-- IPA string is: b&#x00E6;s -->
    <phoneme>beɪs</phoneme>
    <!-- IPA string is: be&#x026A;s -->
  </lexeme>
</lexicon>

英語には、作成者の設定次第で、同綴異義語か別の発音かのどちらとしても扱える名詞―動詞のペアの例が多く存在していることに注意してください。下記は「refuse」の名詞/動詞と「address」の名詞/動詞の2つの例です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      xmlns:mypos="http://www.example.com/my_pos_namespace"
      alphabet="ipa" xml:lang="en-US">
  <lexeme role="mypos:verb">
    <grapheme>refuse</grapheme>
    <phoneme>rɪˈfjuːz</phoneme>
    <!-- IPA string is: "r&#x026A;&#x02C8;fju&#x02D0;z" -->
  </lexeme>
  <lexeme role="mypos:noun">
    <grapheme>refuse</grapheme>
    <phoneme>ˈrefjuːs</phoneme>
    <!-- IPA string is: "&#x02C8;refju&#x02D0;s" -->
  </lexeme>
</lexicon>

5.6 綴り法による発音（頭字語、略語など）

一部の単語や語句の発音は、別の綴り法として速やかかつ便利に表現できます。開発者が言語に関する知識を持っている必要はありませんが、その代りとして、既に利用可能と思われる発音を利用します。別の綴り法を用いて発音を表現するためには、<alias>要素を使用できます。

この機能は、頭字語の展開を扱うために非常に有用かもしれません。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <!-- 
        Acronym expansion
  -->
  <lexeme>
    <grapheme>W3C</grapheme>
    <alias>World Wide Web Consortium</alias>
  </lexeme>
  <!-- 
        number representation
  -->
  <lexeme>
    <grapheme>101</grapheme>
    <alias>one hundred and one</alias>
  </lexeme>
  <!-- 
        crude pronunciation mechanism
  -->
  <lexeme>
    <grapheme>Thailand</grapheme>
    <alias>tie land</alias>
  </lexeme>
  <!-- 
        crude pronunciation mechanism and acronym expansion
  -->
  <lexeme>
    <grapheme>BBC 1</grapheme>
    <alias>be be sea one</alias>
  </lexeme>
</lexicon>

6. 参考文献

6.1 規範的な参考文献

[BCP47]: Tags for the Identification of Languages, A. Phillips and M. Davis, Editors. IETF, September 2006. This RFC is available at http://www.rfc-editor.org/rfc/bcp/bcp47.txt.
[IPAHNDBK]: Handbook of the International Phonetic Association, International Phonetic Association, Editors. Cambridge University Press, July 1999. Information on the Handbook is available at http://www.arts.gla.ac.uk/IPA/handbook.html.
[RFC2119]: Key words for use in RFCs to Indicate Requirement Levels, S. Bradner, Editor. IETF, March 1997. This RFC is available at http://www.ietf.org/rfc/rfc2119.txt.
[RFC3986]: Uniform Resource Identifier (URI): Generic Syntax, T. Berners-Lee et al., Editors. IETF, January 2005. This RFC is available at http://www.ietf.org/rfc/rfc3986.txt.
[RFC3987]: Internationalized Resource Identifiers (IRIs), M. Duerst and M. Suignard, Editors. IETF, January 2005. This RFC is available at http://www.ietf.org/rfc/rfc3987.txt.
[RFC4267]: The W3C Speech Interface Framework Media Types: application/voicexml+xml, application/ssml+xml, application/srgs, application/srgs+xml, application/ccxml+xml, and application/pls+xml, Max Froumentin, Editor. IETF, November 2005. This RFC is available at http://www.ietf.org/rfc/rfc4267.txt.
[SRGS]: Speech Recognition Grammar Specification Version 1.0, Andrew Hunt and Scott McGlashan, Editors. World Wide Web Consortium, 16 March 2004. This version of the SRGS 1.0 Recommendation is http://www.w3.org/TR/2004/REC-speech-grammar-20040316/. The latest version is available at http://www.w3.org/TR/speech-grammar/.
[SSML]: Speech Synthesis Markup Language (SSML) Version 1.0, Daniel C. Burnett, et al., Editors. World Wide Web Consortium, 7 September 2004. This version of the SSML 1.0 Recommendation is http://www.w3.org/TR/2004/REC-speech-synthesis-20040907/. The latest version is available at http://www.w3.org/TR/speech-synthesis/.
[XML10]: Extensible Markup Language (XML) 1.0 (Fourth Edition), T. Bray et al. World Wide Web Consortium, 16 August 2006, edited in place 29 September 2006. This version of the XML 1.0 Recommendation is http://www.w3.org/TR/2006/REC-xml-20060816/. The latest version is available at http://www.w3.org/TR/REC-xml/.
[XML11]: Extensible Markup Language (XML) 1.1 (Second Edition), T. Bray et al. World Wide Web Consortium, 16 August 2006, edited in place 29 September 2006. This version of the XML 1.1 Recommendation is http://www.w3.org/TR/2006/REC-xml11-20060816/. The latest version is available at http://www.w3.org/TR/xml11/.
[XML-BASE]: XML Base, J. Marsh, editor. World Wide Web Consortium, 27 June 2001. This version of the XML Base Recommendation is http://www.w3.org/TR/2001/REC-xmlbase-20010627/. The latest version is available at http://www.w3.org/TR/xmlbase/.
[XML-ID]: xml:id Version 1.0, J. Marsh, D. Veillard, N. Walsh. World Wide Web Consortium, 9 September 2005. This version of the xml:id Recommendation is http://www.w3.org/TR/2005/REC-xml-id-20050909/. The latest version is available at http://www.w3.org/TR/xml-id/.
[XML-NS10]: Namespaces in XML 1.0 (Second Edition), T. Bray et al., Editors. World Wide Web Consortium, 16 August 2006. This version of the XML Namespaces Recommendation is http://www.w3.org/TR/2006/REC-xml-names-20060816/. The latest version is available at http://www.w3.org/TR/xml-names/.
[XML-NS11]: Namespaces in XML 1.1, T. Bray et al., Editors. World Wide Web Consortium, 4 February 2004. This version of the XML Namespaces Recommendation is http://www.w3.org/TR/2004/REC-xml-names11-20040204/. The latest version is available at http://www.w3.org/TR/xml-names11/.
[XML-SCHEMA-1]: XML Schema Part 1: Structures Second Edition, H. S. Thompson, et al., Editors. World Wide Web Consortium, 28 October 2004. This version of the XML Schema Part 1 Recommendation is http://www.w3.org/TR/2004/REC-xmlschema-1-20041028/. The latest version is available at http://www.w3.org/TR/xmlschema-1/.
[XML-SCHEMA-2]: XML Schema Part 2: Datatypes Second Edition, Paul V. Biron and Ashok Malhotra, Editors. World Wide Web Consortium, 28 October 2004. This version of the XML Schema Part 2 Recommendation is http://www.w3.org/TR/2004/REC-xmlschema-2-20041028/. The latest version is available at http://www.w3.org/TR/xmlschema-2/.

6.2 参考情報の参考文献

[DC]: Dublin Core Metadata Initiative.
See http://dublincore.org/.
[DC-ES]: Dublin Core Metadata Element Set, Version 1.1: Reference Description.
See http://dublincore.org/documents/dces/.
[DICT]: Dictionary.com Unabridged (v 1.0.1), Dictionary.com. Based on the Random House Unabridged Dictionary, c Random House, Inc. 2006. Entries in the dictionary are available at http://dictionary.reference.com.
[HTML]: HTML 4.01 Specification, Dave Raggett, et al., Editors. World Wide Web Consortium, 24 December 1999. This version of the HTML 4.01 Recommendation is http://www.w3.org/TR/1999/REC-html401-19991224/. The latest version of HTML is available at http://www.w3.org/TR/html/.
[IPA]: International Phonetic Association.
See http://www.arts.gla.ac.uk/IPA/ipa.html for the organization's website.
[IPAUNICODE1]: The International Phonetic Alphabet, J. Esling. This table of IPA characters in Unicode is available at http://web.uvic.ca/ling/resources/ipa/charts/unicode_ipa-chart.htm.
[IPAUNICODE2]: The International Phonetic Alphabet in Unicode, J. Wells. This table of Unicode values for IPA characters is available at http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm.
[JEIDAALPHABET]: JEIDA-62-2000 Phoneme Alphabet. JEITA. An abstract of this document (in Japanese) is available at http://it.jeita.or.jp/document/publica/standard/summary/JEIDA-62-2000.pdf.
[JEITA]: Japan Electronics and Information Technology Industries Association.
See http://www.jeita.or.jp/.
[RDF-CONC]: Resource Description Framework (RDF): Concepts and Abstract Syntax, G. Klyne and J.J. Carroll, Editors. World Wide Web Consortium, 10 February 2004. This version of the RDF Concepts and Abstract Syntax is http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/. The latest version is available at http://www.w3.org/TR/rdf-concepts/.
[RDF-SCHEMA]: RDF Vocabulary Description Language 1.0: RDF Schema, D. Brickley and R. Guha, Editors. World Wide Web Consortium, 10 February 2004. This version of the RDF Schema Recommendation is http://www.w3.org/TR/2004/REC-rdf-schema-20040210/. The latest version of RDF Schema is available at http://www.w3.org/TR/rdf-schema/.
[RDF-XMLSYNTAX]: RDF/XML Syntax Specification, D. Beckett, Editor. World Wide Web Consortium, 10 February 2004. This version of the RDF/XML Syntax Recommendation is http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/. The latest version of the RDF XML Syntax is available at http://www.w3.org/TR/rdf-syntax-grammar/.
[REQS]: Pronunciation Lexicon Specification (PLS) Version 1.0 Requirements, P. Baggia and F. Scahill, Editors. World Wide Web Consortium, 29 October 2004. This document is a work in progress. This version of the Pronunciation Lexicon Requirements is http://www.w3.org/TR/2004/WD-lexicon-reqs-20041029/. The latest version of the Pronunciation Lexicon Requirements is available at http://www.w3.org/TR/lexicon-reqs/.
[RFC2732]: Format for Literal IPv6 Addresses in URL's, R. Hinden, et al., Editors. IETF, December 1999. This RFC is available at http://www.ietf.org/rfc/rfc2732.txt.
[SAMPA]: SAMPA computer readable phonetic alphabet, J.C. Wells.
See http://www.phon.ucl.ac.uk/home/sampa/home.htm for information on it.
[SISR]: Semantic Interpretation for Speech Recognition (SISR) Version 1.0, Luc van Tichelen and Dave Burke, Editors. World Wide Web Consortium, 5 April 2007. This version of the SISR 1.0 Recommendation is http://www.w3.org/TR/2007/REC-semantic-interpretation-20070405/. The latest version is available at http://www.w3.org/TR/semantic-interpretation/.
[SSML-11]: Speech Synthesis Markup Language (SSML) Version 1.1, Daniel C. Burnett and 双志伟 (Zhi Wei Shuang), Editors. World Wide Web Consortium, 20 June 2008. This version of the SSML 1.1 Working Draft is http://www.w3.org/TR/2008/WD-speech-synthesis11-20080620/. The latest version is available at http://www.w3.org/TR/speech-synthesis11/.
[VXML]: Voice Extensible Markup Language (VoiceXML) Version 2.0, Scott McGlashan et al., Editors. World Wide Web Consortium, 16 March 2004. This version of the VoiceXML 2.0 Recommendation is http://www.w3.org/TR/2004/REC-voicexml20-20040316/. The latest version is available at http://www.w3.org/TR/voicexml20/.
[XHTML2]: XHTML 2.0, J. Axelsson et al., Editors. World Wide Web Consortium, 22 July 2004. This version of the XML XHTML 2.0 Working Draft is http://www.w3.org/TR/2004/WD-xhtml2-20040722/. The latest version is available at http://www.w3.org/TR/xhtml2/.
[XHTML-MTYPES]: XHTML Media Types, Ishikawa Masayasu, Editor. World Wide Web Consortium, 1 August 2002. This version of the W3C Note is http://www.w3.org/TR/xhtml-media-types/xhtml-media-types.html. The latest version is available at http://www.w3.org/TR/xhtml-media-types/.
[XPOINTER]: XPointer Framework, P. Grosso, E. Maler, J. Marsh, N. Walsh. World Wide Web Consortium, 25 March 2003. This version of the XPointer Framework Recommendation is http://www.w3.org/TR/2003/REC-xptr-framework-20030325/. The latest version is available at http://www.w3.org/TR/xptr-framework/.
[X-SAMPA]: Computer-coding the IPA: a proposed extension of SAMPA, J.C. Wells, University College London, 28 April 1995. This version is available at http://www.phon.ucl.ac.uk/home/sampa/ipasam-x.pdf.
[WEB-ARCH]: Architecture of the World Wide Web, Volume One, I. Jacobs, N. Walsh, World Wide Web Consortium, 15 December 2004. This version of the Architecture of World Wide Web Recommendation is http://www.w3.org/TR/webarch/.

7. 貢献者および謝辞

この仕様をより良いものにするために、アイデア、コメント、フィードバックおよび実装経験を提供してくださった貢献者は次の方々です（アルファベット順に記述）。

Jeff Adams, Nuance

Kazuyuki Ashimura, W3C

Patrizio Bergallo, Loquendo

Ellen Eide, IBM

Max Froumentin, W3C

Richard Ishida, W3C

严峻 (Yan Jun), iFLYTEK

Matt Oshry, Microsoft

Dave Pawson, RNIB

Luc Van Tichelen, Nuance

編集者は、有用なコメントに対し、WAIとWAI/PF、I18NとMMIのW3Cグループに感謝を表します。

この仕様は、次の方々の協力によって作成されました（アルファベット順に記述）。

Debbie Dahl, Conversational Technologies

Ken Davies, HeyAnita

Kurt Fuqua, Vail Systems

Will Gardella, SAP

Makoto Hirota, Canon

Jim Larson, Intervoice

Dave Raggett, W3C/Volantis

Matt Womer, W3C

付録A - 発音辞書仕様用スキーマ

この項は規範的です。

PLSドキュメントを検証するために使用できるスキーマが2つあります。
スキーマの最新バージョンは、以下にあります。

XMLスキーマ:
"http://www.w3.org/TR/pronunciation-lexicon/pls.xsd"
RELAX NGスキーマ:
"http://www.w3.org/TR/pronunciation-lexicon/pls.rng"

安定性のために、日付が付与されている下記のURIを用いることを推奨します（RECOMMENDED）。

XMLスキーマ:
"http://www.w3.org/TR/2008/PR-pronunciation-lexicon-20081014/pls.xsd"
RELAX NGスキーマ:
"http://www.w3.org/TR/2008/PR-pronunciation-lexicon-20081014/pls.rng"

付録B - MIMEタイプとファイル拡張子

この項は規範的です。

発音辞書仕様に関連するメディア・タイプは「application/pls+xm」で、ファイル名の拡張子は[RFC4267]で定義されている「.pls」です。

付録C - 字句コンテンツの検索における課題

この項は参考情報です。

PLSドキュメントを用いる読み上げアプリケーションには、適切な字句の内容を検索できるメカニズムが必要です。最もシンプルなケースでは、アプリケーションは正確に入力データと一致する内容を持つ<grapheme>要素を得るためにPLSドキュメントを検索し、対応する語彙素をすべて検索するでしょう。しかし、一般に、字句の内容の検索はそれほど簡単ではありません。完全一致が何で構成されるか、また、矛盾する複数の一致が当てはまる可能性がある場合にはどの語彙素を検索すべきかを定義する必要があります。

ここで、適切な字句の内容を検索する方法の例を紹介します。

テキストは、PLSドキュメントが扱う記述言語にとって意味を持ちえる綴り法の最も小さな単位にトークン化できます。デフォルトでは、アルファベットによる記述言語の場合、アルファベットの連続する要素を、すべて1つのトークンにグループ化でき、他のすべての文字（句読点、ハイフン、アポストロフィーのような）を個別のトークンと見なすことができます。表語文字法の表記体系を用いて言語を扱うアプリケーションは、各表語文字を個別のトークンと見なすかもしれません。極度に膠着的な言語には、より複雑なデフォルトのトークン化手続きが必要です。
読み上げアプリケーションは、テキストを明示的なトークンに分割するためのメカニズムを提供するかもしれません。このようなメカニズムは、デフォルトのトークン化の制限を克服するために使用できます。例えば、「don't」は、「n't」という内容を持つ<grapheme>要素と一致させるために、「do」と「n't」に明示的にトークン化できます。
トークンは、通常の文字の読み上げ方向で処理すべきです。したがって、英語では左から右へ、アラビア語やヘブライ語などの言語では右から左へ処理します。
連続するトークンの最も長い列と完全に一致するコンテンツを持つ<grapheme>要素を有する語彙素の検索を優先すべきです。したがって、「they'll」と入力された場合、「they」という語彙素よりも「they'll」という語彙素が優先されるべきです。
字句の検索は、文字ではなく、トークンのバイアスで実行すべきです。したがって、「do」という語彙素は、「done」の先頭の部分と一致すべきではありません。
Unicodeの文字が等しい場合に限り、一致が起こります。したがって、一致は、大文字・小文字の違いと発音区別符号を区別したものでなければなりません。「Lima」は「lima」と一致すべきではなく、「cure」は「curé」と一致すべきではなく、「vitæ」は「vitae」と一致すべきではありません。アプリケーションは、（「æ」のような）合字を、対応する文字列（「ae」）に展開し、さらに一致を緩めるために対照表を使用することにするかもしれません。
複数の連続する空白文字は、ユニークな1つの空白文字にすべきです。したがって、「New York」は「New York」と一致すべきです。

ここで概説したアプローチは、主に英語における必要事項を念頭に置いて作成されており、他の言語の特定の要件に合わせて修正すべきです。

PLSドキュメントを用いるアプリケーションは、字句の内容を検索する際に採用するアプローチを記述することを推奨します。

例:

次のPLSドキュメントを用いるアプリケーションは、

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>New York</grapheme>
    <alias>NY</alias>
  </lexeme>
  <lexeme>
    <grapheme>York   City</grapheme>
    <alias>YC</alias>
  </lexeme>
</lexicon>

上記のアプローチを用いる場合、「New York City」を「New YC」ではなく「NY City」として処理すべきです。

付録D - 更新

この項は参考情報です。

このドキュメントにおける更新

<lexicon>要素にリンク先が不明な「uri」属性があったため、3番目の例を修正した（4.4）。
IPAの参考文献を更新した（6.2）。
すべてのPLS要素において非PLS属性を認めるため、スキーマのファイル（pls.xsdとpls.rng）を更新した（付録A）。

勧告案（2008年8月18日）における変更:

URIの定義を更新した（1.5）。
IPA転写における空白の使用法を明確化した（2）。
xml:base属性の定義を明確化した（4.1）。
ドイツ語に対する代替のテキスト表現を更新した（4.5）。
小さな編集上の変更を適用した。

勧告候補（2007年12月12日）における変更:

IRIとXML 1.1のサポートを追加した。
適合性の項を拡張した（3）。
alias要素に対する再帰言語について明確化した（4.7）。
prefer属性の定義を明確化した（4.6、4.7、4.9）。
スキーマを更新し、安定性のための日付が付与されたURIを追加した（付録A）。
QNamesに関する注記を追加した（4.4）。
IPAに関する参考情報の注記を追加した（2）。
著者/貢献者/謝辞を更新した（7）。
以前の草案以後の変更を記載するために付録を追加した（付録D）。
規範的/参考情報の属性をレビューした。
中国語の例を追加した（4.4）。
例を更新した（SchemaLocationを追加し、IPAコードを修正するなど）。
明確化を追加し、スペルミスを修正した。

2番目の最終草案（2006年10月26日）における変更:

同綴異義語の明確化に役立つrole属性をlexeme要素に新たに追加した（4.4）。
字句の内容を検索する際の課題に関する参考情報の付録を追加した（付録C）。
grapheme要素のorthography属性を削除した（4.4）。
alias要素の再帰を削除した（4.7）。
RFC2119がカバーしている規範的な言葉にスタイルを適用した。
スキーマを更新した（付録A）。
例を修正した。
リクエストのあった明確化を追加した。

最初の最終草案（2006年1月31日）における変更:

IPA音標文字のサポートを必須とした（2）。
複数の発音に関する新しい項を追加した（4.9）。
「prefer」属性の用法を明確化した（4.6、4.7、4.9）。
用語を追加した（1.5）。
XMLスキーマを修正し、Relax NGスキーマを追加した（付録A）。

発音辞書仕様（PLS）バージョン1.0

W3C勧告 2008年10月14日

要約

このドキュメントのステータス

目次

1. 発音辞書仕様（PLS）入門

1.1. TTSによるPLSの使用方法

参考情報の注記:

1.2. ASRによるPLSの使用方法

1.3. VoiceXMLアプリケーションによるPLSの使用方法

1.4. PLSでサポートされないもの

1.5. 用語

2. 発音文字

参考情報の注記:

参考情報の注記:

参考情報の注記:

3. PLSドキュメント

3.1 ドキュメント形式

3.2 適合性

3.2.1 適合発音辞書仕様ドキュメント

3.2.2 他の名前空間を持つPLSの使用

3.2.3 適合発音辞書仕様プロセッサ

4. 発音辞書マークアップ言語定義

4.1 <lexicon>要素

参考情報の注記:

例:

4.2 <meta>要素

参考情報の注記:

例:

4.3 <metadata>要素

例:

4.4 <lexeme>要素

例:

参考情報の注記:

4.5 <grapheme>要素

例:

4.6 <phoneme>要素

例:

4.7 <alias>要素

例:

4.8 <example>要素

例:

4.9 ASRとTTSに対する複数の発音

4.9.1 ASRに対する複数の発音

4.9.2 TTSに対する複数の発音

4.9.3 複数の発音の例

例1:

例2:

例3:

例4:

例5:

例6:

例7:

例8:

例9:

5. 例

5.1 シンプルなケース

5.2 同じ綴り法に対する複数の発音

5.3 複数の綴り法

5.4 同音異義語

5.5 同綴異義語

5.6 綴り法による発音（頭字語、略語など）

6. 参考文献

6.1 規範的な参考文献

6.2 参考情報の参考文献

7. 貢献者および謝辞

付録A - 発音辞書仕様用スキーマ

付録B - MIMEタイプとファイル拡張子

付録C - 字句コンテンツの検索における課題

例:

付録D - 更新

このドキュメントにおける更新

勧告案（2008年8月18日）における変更:

勧告候補（2007年12月12日）における変更:

2番目の最終草案（2006年10月26日）における変更:

最初の最終草案（2006年1月31日）における変更:

4.1 `<lexicon>`要素

4.2 `<meta>`要素

4.3 `<metadata>`要素

4.4 `<lexeme>`要素

4.5 `<grapheme>`要素

4.6 `<phoneme>`要素

4.7 `<alias>`要素

4.8 `<example>`要素