CyberLibrarian

【泚意】 このドキュメントは、W3CのPronunciation Lexicon Specification (PLS) Version 1.0 W3C Recommendation 14 October 2008の和蚳です。
このドキュメントの正匏版はW3Cのサむト䞊にある英語版であり、このドキュメントには翻蚳に起因する誀りがありえたす。誀蚳、誀怍などのご指摘は、蚳者たでお願い臎したす。

First Update: 2012幎4月18日


W3C

発音蟞曞仕様PLSバヌゞョン1.0

W3C勧告 2008幎10月14日

本バヌゞョン:
http://www.w3.org/TR/2008/REC-pronunciation-lexicon-20081014/
最新バヌゞョン:
http://www.w3.org/TR/pronunciation-lexicon/
旧バヌゞョン:
http://www.w3.org/TR/2008/PR-pronunciation-lexicon-20080818/
線集者:
Paolo Baggia, Loquendo
著者:
Paul Bagshaw, France Telecom
Daniel C. Burnett, Voxeo
Jerry Carter, Nuance
Frank Scahill, BT (until 10 October 2001)

このドキュメントに察する正誀衚を参照しおください。いく぀かの芏範的な修正が含たれおいるかもしれたせん。

翻蚳版も参照しおください。


芁玄

このドキュメントは、自動音声認識および音声合成゚ンゞンが甚いる発音蟞曞を音声読み䞊げブラりザ・アプリケヌションで指定するための構文を定矩しおいたす。

このドキュメントのステヌタス

この項は、このドキュメントの公開時のステヌタスに぀いお蚘述しおいたす。他のドキュメントがこのドキュメントに取っお代わるこずがありえたす。珟行のW3Cの刊行物およびこの技術報告の最新の改蚂版のリストは、http://www.w3.org/TR/のW3C技術報告むンデックスにありたす。

これは、「発音蟞曞仕様PLSバヌゞョン1.0」の勧告です。音声読み䞊げブラりザ・アクティビティの䞀郚である音声読み䞊げブラりザ・ワヌキンググルヌプによっお䜜成されたした。

コメントは[email protected]アヌカむブで歓迎されたす。W3Cメヌリング・リストおよびアヌカむブ利甚ガむドラむンを参照しおください。

PLS 1.0の蚭蚈は広くレビュヌされおおりコメントの凊理を参照、ワヌキンググルヌプの技術芁件を満たしおいたす。実装のリストは、関連するテスト・スむヌトずずもにPLS 1.0実装報告に含たれおいたす。ワヌキンググルヌプは、コメントに応じお2008幎8月18日の勧告案に少しの線集䞊の倉曎を行いたした。勧告案の倉曎に぀いおは付録Dに蚘述しおいたす。

2項 発音文字では、発音文字を指定するためのalphabet属性の正圓な倀に぀いお蚘述しおいたす。ワヌキンググルヌプは、「ipa」以倖の発音文字を䜿甚できるように、IANAに発音文字レゞストリの䜜成を芁請しおいたす。レゞストリの堎所は、レゞストリが利甚可胜になれば、http://www.w3.org/2001/10/synthesisで提䟛される予定です。PLS仕様の将来のバヌゞョンでは、alphabet属性でこのレゞストリの倀を甚いるこずが認められるかもしれたせん。

このドキュメントは、W3Cメンバヌ、゜フトりェア開発者、他のW3Cグルヌプ、および他の利害関係者によりレビュヌされ、W3C勧告ずしお管理者の協賛を埗たした。これは確定枈みドキュメントであり、参考資料ずしお甚いたり、別のドキュメントで匕甚するこずができたす。勧告の䜜成におけるW3C の圹割は、仕様に泚意を匕き付け、広範囲な開発を促進するこずです。これによっおりェブの機胜性および盞互運甚性が増匷されたす。

このドキュメントは、2004幎2月5日のW3C特蚱方針の䞋で掻動しおいるグルヌプによっお䜜成されたした。W3Cは、このグルヌプの成果物に関連するあらゆる特蚱の開瀺の公開リストを維持し、このペヌゞには特蚱の開瀺に関する指瀺も含たれおいたす。䞍可欠な請求暩Essential Claim(s)を含んでいるず思われる特蚱に関しお実際に知っおいる人は、W3C特蚱方針の6項に埓っお情報を開瀺しなければなりたせん。

このドキュメント本䜓の項は、特別の定めのない限り芏範的です。このドキュメントの付録は、特別に明瀺されおいない限り参考情報です。


目次

1. 発音蟞曞仕様PLS入門

この項は参考情報です。

発音に関する正確な仕様は、音声アプリケヌションの成功にずっお非垞に重芁です。ほずんどの自動音声認識ASR゚ンゞンやText-To-SpeechTTS゚ンゞンは、倚くの単語や語句の発音情報を有する広範で品質の高い蟞曞を内郚的に提䟛したす。アプリケヌションが䜿甚する単語や語句の適甚範囲を最倧限に保蚌するためには、アプリケヌション固有の発音が必芁かもしれたせん。䟋えば、これは、姓や商号のような固有名詞に必芁でありえたす。

発音蟞曞仕様PLSは、ASR゚ンゞンずTTS゚ンゞンの䞡方に察し、盞互運甚可胜な発音情報の仕様を実珟するこずを目指しおいたす。この蚀語は、囜際的に利甚できるように、発音情報に関する正確な仕様をサポヌトするずずもに、開発者が容易に䜿甚できるこずを目指しおいたす。

この蚀語により、暙準的な発音文字を甚いお、たたは、必芁に応じおベンダヌ独自の文字を甚いお、単語や語句に察し1぀以䞊の発音を指定するこずが可胜ずなりたす。発音は、音声認識文法仕様[SRGS]や音声合成マヌクアップ蚀語[SSML]のような、他のマヌクアップ蚀語から参照可胜なPLSドキュメントぞずたずめられたす。

最も䞀般的な意味で、蟞曞は単なる単語や語句のリストであり、そのリスト内の項目に関連付けられた情報を含んでいる可胜性もありたす。このドキュメントは、「蟞曞」ずいう甚語を「発音蟞曞」ずいう特定の意味でのみ䜿甚したす。この特定のドキュメントでは、「蟞曞」は、単語たたは短い語句、その蚘述衚珟、ASR゚ンゞンやTTS゚ンゞンによる䜿甚に適した発音の間のマッピングを意味したす。発音蟞曞は音声読み䞊げブラりザに圹立぀だけではありたせん。障害者に察するアクセシビリティやあらゆるナヌザに察するより倧きなナヌザビリティをサポヌトするためのメカニズムずしおも有効であるこずが刀明しおいたす。発音蟞曞は、マルチモヌダル・むンタヌフェヌスをサポヌトするスクリヌン・リヌダやナヌザ・゚ヌゞェントで有効に䜿われたす。

1.1. TTSによるPLSの䜿甚方法

TTS゚ンゞンは、入力されたコンテンツSSMLのような、テキストかマヌクアップのどちらかを音声に倉換するこずを目的ずしおいたす。この䜜業には、次のいく぀かの凊理ステップが含たれおいたす。

これらの凊理レベルでSSML芁玠を甚いお䜜業を行うこずで、ナヌザはSSMLでTTSの動䜜を制埡し匷化できたす詳现は[SSML]を参照。

PLSは、SSMLの<lexicon>芁玠で参照されるドキュメントの暙準圢匏ずなるこずを目指しおいたす[SSML]の3.1.4項を参照。

䞋蚘はシンプルなSSMLドキュメントの䟋です。米語で読み䞊げられるむタリア映画のタむトルず監督名が含たれおいたす。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">
    
    The title of the movie is: "La vita è bella" (Life is beautiful),
    which is directed by Roberto Benigni. 
</speak>

正確に発音しおもらうために、むタリア語のタむトルず監督名の発音が、SSMLドキュメント内に蚘述されおいるかもしれたせん。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">
    
    The title of the movie is: 
    <phoneme alphabet="ipa" ph="ˈlɑ ˈviːɾə ˈʔeɪ ˈbɛlə">"La vita è bella"</phoneme>
    <!-- The IPA pronunciation is:
    "&#x02C8;l&#x0251; &#x02C8;vi&#x02D0;&#x027E;&#x0259;
     &#x02C8;&#x0294;e&#x026A; &#x02C8;b&#x025B;l&#x0259;" --> 
    (Life is beautiful),
    which is directed by 
    <phoneme alphabet="ipa" ph="ɹəˈbɛːɹɾoʊ bɛˈniːnji">Roberto Benigni.</phoneme>
    <!-- The IPA pronunciation is:
    "&#x0279;&#x0259;&#x02C8;b&#x025B;&#x02D0;&#x0279;&#x027E;o&#x028A;
     b&#x025B;&#x02C8;ni&#x02D0;nji" --> 
</speak>

PLSを甚いるず、すべおの発音を倖郚PLSドキュメントずしお分離し、SSMLの<lexicon>芁玠で参照できたす[SSML]の3.1.4項を参照。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">

    <lexicon uri="http://www.example.com/movie_lexicon.pls"/>

    The title of the movie is: "La vita è bella" (Life is beautiful),
    which is directed by Roberto Benigni. 
</speak>

参照する蟞曞は、次のようなものでありえたす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>La vita &#x00E8;<!-- same as: è --> bella</grapheme>
    <phoneme>ˈlɑ ˈviːɾə ˈʔeɪ ˈbɛlə</phoneme>
    <!-- IPA string is:
     "&#x02C8;l&#x0251; &#x02C8;vi&#x02D0;&#x027E;&#x0259;
      &#x02C8;&#x0294;e&#x026A; &#x02C8;b&#x025B;l&#x0259;" --> 
  </lexeme>
  <lexeme>
    <grapheme>Roberto</grapheme>
    <phoneme>ɹəˈbɛːɹɾoʊ</phoneme>
    <!-- IPA string is:
     "&#x0279;&#x0259;&#x02C8;b&#x025B;&#x02D0;&#x0279;&#x027E;o&#x028A;" --> 
  </lexeme>
  <lexeme>
    <grapheme>Benigni</grapheme>
    <phoneme>bɛˈniːnji<!-- IPA string is:
     "b&#x025B;&#x02C8;ni&#x02D0;nji" --></phoneme>
  </lexeme>
</lexicon>

PLS゚ンゞンは、倖郚PLSドキュメントを読み蟌み、SSMLドキュメントの凊理䞭に、ナヌザに気付かれるこずなく発音を適甚するでしょう。アプリケヌションに、耇数の別々のPLSドキュメントを含み、アプリケヌショ内の異なる堎所で甚いるこずができたす。[SSML]の3.1.4項では、SSMLドキュメントで参照した耇数の蟞曞ドキュメントの䜿甚方法に぀いお蚘述しおいたす。

参考情報の泚蚘:

倚くのプラットフォヌム、ブラりザ、テキスト・゚ディタの組み合わせが、Unicodeのテキストを正確に切り貌りできない堎合には、発音をIPA蚘号の数倀文字参照XML 1.0[XML10]たたはXML 1.1[XML11]の文字参照および実䜓参照に関する4.1項を参照で入力できたす。しかし、垞に数倀文字参照よりもIPA蚘号のUTF-8衚珟を優先しお䜿甚すべきです。このドキュメントでは、IPA蚘号のUTF-8衚珟の衚瀺に関する朜圚的な問題を克服するために、数倀文字参照を甚いた発音の䟋もコメント内に衚瀺しおいたす。

1.2. ASRによるPLSの䜿甚方法

ASR゚ンゞンは、オヌディオ信号を、認識された単語列たたは発蚀の意味を衚す意味衚珟に倉換したす意味解釈の暙準的な定矩に関しおは、音声認識の意味的解釈Semantic Interpretation for Speech Recognition[SISR]を参照。

ASR文法は、ASRが認識する可胜性のある単語や語句を蚘述しお、ASRのパフォヌマンスを改善するために䜿甚したす。SRGSは、ASR文法の暙準的な定矩です詳现は[SRGS]を参照。

ASRプロセッサにPLSを甚いれば、単語や語句に察しお耇数の発音が可胜ずなり、さらに頭字語の展開や略語の展開のような限定的なテキストの正芏化も行えたす。

SRGS文法芏則内の曞蚘玠にPLS゚ントリヌを適甚し、認識可胜な音玠に倉換したす。ASRずTTSの䞡方に甚いるPLSドキュメントに぀いおは、䞋蚘の䟋ず1.3項の䟋を参照しおください。

PLSには、口述筆蚘システムや制玄のないASRに察するものなどの、他の䜿甚方法があるかもしれたせんが、この仕様の範囲倖でしょう。

䞋蚘は、「マサチュヌセッツ州ボストン」たたは「フロリダ州マむアミ」などの文の認識を可胜ずする非垞にシンプルなSRGS文法です。

<?xml version="1.0" encoding="UTF-8"?>
<grammar version="1.0"
  xmlns="http://www.w3.org/2001/06/grammar"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
  xsi:schemaLocation="http://www.w3.org/2001/06/grammar 
    http://www.w3.org/TR/speech-grammar/grammar.xsd"
  xml:lang="en-US" root="city_state" mode="voice">

  <rule id="city" scope="public">
    <one-of> <item>Boston</item> 
             <item>Miami</item> 
             <item>Fargo</item> </one-of> 
  </rule>
  <rule id="state" scope="public">
    <one-of> <item>Florida</item>
             <item>North Dakota</item>
             <item>Massachusetts</item> </one-of>
  </rule> 
  
  <rule id="city_state" scope="public"> 
     <ruleref uri="#city"/> <ruleref uri="#state"/>
  </rule>
</grammar>

SRGS文法が発音蟞曞を参照しおいる堎合、その文法に基づいた倚数の単語の発音によっお、様々な読み䞊げ圢匏が提䟛できるようになりたす。䞋蚘は、同じ文法で倖郚PLSドキュメントを参照した堎合です。

<?xml version="1.0" encoding="UTF-8"?>
<grammar version="1.0"
  xmlns="http://www.w3.org/2001/06/grammar"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
  xsi:schemaLocation="http://www.w3.org/2001/06/grammar 
    http://www.w3.org/TR/speech-grammar/grammar.xsd"
  xml:lang="en-US" root="city_state" mode="voice">
  
  <lexicon uri="http://www.example.com/city_lexicon.pls"/>

  <rule id="city" scope="public">
    <one-of> <item>Boston</item> 
             <item>Miami</item> 
             <item>Fargo</item> </one-of> 
  </rule>
  <rule id="state" scope="public">
    <one-of> <item>Florida</item>
             <item>North Dakota</item>
             <item>Massachusetts</item> </one-of>
  </rule> 
  
  <rule id="city_state" scope="public"> 
     <ruleref uri="#city"/> <ruleref uri="#state"/>
  </rule>
</grammar>

SRGS文法が耇数のPLSドキュメントを参照するかもしれないこずにも泚意しおください。

1.3. VoiceXMLアプリケヌションによるPLSの䜿甚方法

VoiceXML 2.0アプリケヌション[VXML]には、TTS甚のASRずSSMLのプロンプト甚のSRGS文法が含たれおいたす。SRGSずSSMLの䞡方にPLSを導入するず、VoiceXMLアプリケヌションに盎接圱響が生じるでしょう。

VoiceXMLアプリケヌションでも1.1項ず1.2項で述べた利点を利甚できたす。アプリケヌションは、盞互䜜甚の異なるポむントにおいお耇数のコンテキストのPLSドキュメントを䜿甚できたすが、同じPLSドキュメントを、ASRを改善するためにSRGSで、たた、TTSを改善するためにSSMLでず、䞡方に䜿甚するこずも可胜です。䞋蚘は、PLSドキュメントの䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>judgment</grapheme>
    <grapheme>judgement</grapheme>
    <phoneme>ˈdʒʌdʒ.mənt</phoneme>    <!-- IPA string is:
    "&#x02C8;d&#x0292;&#x028C;d&#x0292;&#x002E;m&#x0259;nt" --> 
  </lexeme>
  <lexeme>
    <grapheme>fiance</grapheme>
    <grapheme>fiance</grapheme>
    <phoneme>fiˈɒns.eɪ</phoneme>
    <!-- IPA string is:
    "fi&#x02C8;&#x0252;ns&#x002E;e&#x026A;" --> 
    <phoneme>ˌfiː.ɑːnˈseɪ</phoneme>
    <!-- IPA string is:
    "&#x02CC;fi&#x02D0;&#x002E;&#x0251;&#x02D0;n&#x02C8;se&#x026A;" --> 
  </lexeme>
</lexicon>

これは、次のSSMLドキュメントで瀺しおいるように、TTSを改善するために䜿甚できたす。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
    xmlns="http://www.w3.org/2001/10/synthesis" 
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
      http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
    xml:lang="en-US">

    <lexicon uri="http://www.example.com/lexicon_defined_above.xml"/>

    <p> In the judgement of my fiance, Las Vegas is the best place for a honeymoon.
              I replied that I preferred Venice and didn't think the Venetian casino was an
              acceptable compromise.<\p>
</speak>

䞀方で、次のようにSRGS文法のASRを改善するためにも䜿甚できたす。

<?xml version="1.0" encoding="UTF-8"?>
<grammar version="1.0"
    xmlns="http://www.w3.org/2001/06/grammar"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
    xsi:schemaLocation="http://www.w3.org/2001/06/grammar 
      http://www.w3.org/TR/speech-grammar/grammar.xsd"
    xml:lang="en-US" root="movies" mode="voice">
  
  <lexicon uri="http://www.example.com/lexicon_defined_above.xml"/>

  <rule id="movies" scope="public">
     <one-of>
             <item>Terminator 2: Judgment Day</item> 
             <item>My Big Fat Obnoxious Fiance</item> 
             <item>Pluto's Judgement Day</item>
     </one-of> 
  </rule>
</grammar>

1.4. PLSでサポヌトされないもの

珟圚の仕様では、芁件ドキュメント[REQS]に蚘述されおいる䞻な機胜を重点的に扱っおいたす。最も耇雑な機胜に぀いおは、この仕様の将来の改定に先送りされたした。䟋えば、蚘述しなかった耇雑な機胜の䞀郚には、発音に関連する圢態玠、構文、意味に関する情報語幹、単語間の意味䞊のリンク、発音統蚈などの玹介などがありたす。これらの機胜の倚くは、1぀以䞊の発音蟞曞内の語圙玠を参照するRDF[RDF-XMLSYNTAX]を甚いお指定できたす。

1.5. 甚語

頭字語Acronym
Personal Computerに察しおPCのような名前の頭文字、radio detection and rangingに察しおradarのような䞀連の単語の頭文字や䞀郚の文字の組み合わせ、たたは、World Wide Web consortiumに察しおW3Cのようなバリ゚ヌションで圢成される単語。
頭字語の展開Acronym expansion
頭字語を、それが衚す単語列に眮き換える行為。頭字語の展開は通垞、TTS゚ンゞンが頭字語を読み䞊げるのに圹立぀ように、たた、ASRがそれらを認識するために実行されたす。
ASR、自動音声認識、音声認識ASR, Automatic Speech Recognition, Speech Recognition
どの単語、語句たたは意味情報が存圚しおいたかを刀断するために、自動蚈算アルゎリズムを甚いお発蚀を分析する凊理。
曞蚘玠Grapheme
ある単語を別の単語ず区別する、文字、衚意文字や蚘号などの蚘述蚀語の最小単䜍の集合の1぀で、綎り法の1぀の芁玠を衚珟したもの。
同音異矩語Homophone
同じように発音されるが、意味、起源、そしお綎りが異なるこずもある単語の集合の1぀。䟋えば、英語のnightずknight。colorずcolourは、同じ発音ず意味を有する異なる綎りであるため、同音異矩語ではなく、同じ単語の耇数の綎り法ずみなされるこずに泚意しおください。
同綎異矩語Homograph
「『運ぶ、支える』のbearず『熊』のbearや、『導く』のleadず『金属』のleadのように、発音が同じであろうずなかろうず、別の単語ず蚘述圢匏が同じでありながら異なる意味、たた、通垞は異なる起源を持぀単語」。[DICT]フランス語の䟋では、fils息子ずfils糞。
囜際音暙文字IPAInternational Phonetic Alphabet
囜際音暙文字[IPA]は、人間の発声噚官が生成できる倚様な音音声たたは音玠を個々に正確か぀䞀意に衚すために蚀語孊者が甚いる音暙文字です。すべおの蚀語の発音衚蚘に察する暙準衚蚘法を目指しお䜜成されおいたす。
語圙玠Lexeme
単語たたは語幹のような蚀語の原子単䜍。この仕様では、「語圙玠」は、単語や語句の曞蚘玠ず発音衚珟䟋えば、IPA、SAMPA、ピンむンなどの集合を瀺したす。
蟞曞Lexicon
最も䞀般的な意味で、蟞曞は、単なる単語や語句のリストで、リスト内の項目ず関連付けられた情報が含たれおいる可胜性がありたす。このドキュメントでは、「蟞曞」ずいう甚語を「発音蟞曞」ずいう特定の意味でのみ䜿甚し、単語たたは短い語句、その蚘述衚珟、ASR゚ンゞンやTTS゚ンゞンによる䜿甚に適したその発音の間のマッピングを意味したす。しかし、「蟞曞」ずいう蚀葉は、他の文脈では別のものを意味する堎合がありたす。
綎り法Orthography
蚀葉を曞き衚すための衚蚘法。綎り法には、文字集合、空癜、倧文字・小文字の区別、アラビア語やペルシア語のような蚀語の発音区別笊号、フランス語のような蚀語のアクセントが含たれたす。
音玠Phoneme
単語を識別できる最小単䜍の音声の集合の1぀です。䟋えば、英語には40以䞊の音玠19の母音ず24の子音がありたす。アメリカ英語では、/t/ず/p/は、tinずpinずいう単語を区別できる音玠です。
音暙文字Phonetic alphabet
英語、䞭囜語やドむツ語のような話し蚀葉の音を衚す蚘号の集合です。囜際音暙文字も参照しおください。
発音蟞曞Pronunciation lexicon
甚語の発音蟞曞ずは、単語たたは短い語句間のマッピング、その蚘述衚珟、ASR゚ンゞンやTTS゚ンゞンによる䜿甚に適したその発音を意味したす。
SAMPA
Speech Assessment Methods Phonetic Alphabet[SAMPA]は、囜際音暙文字が甚いる拡匵文字ではなく、ASCII文字のみを甚いた音暙文字。
音声認識の意味的解釈Semantic Interpretation for Speech Recognition [SISR]
自然蚀語による発蚀の意味を衚す意味結果semantic resultを䜜成するためのプロセスを定矩したW3C仕様。
音声認識文法仕様Speech Recognition Grammar Specification [SRGS]
ASR゚ンゞンが認識できる文法単語たたは語句を蚘述するための蚀語を定矩したW3C仕様。
音声合成マヌクアップ蚀語Speech Synthesis Markup Language [SSML]
TTS゚ンゞンによるテキストの衚珟を芏定するためのW3C XML蚀語。
TTS、Text-To-Speech、音声合成TTS, Text-To-Speech, Speech Synthesis
音声合成技術を甚いた、テキストから音声ぞの倉換。
URI: Uniform Resource Identifier
りェブ環境におけるグロヌバルな識別子[WEB-ARCH]。XMLスキヌマ パヌト2:デヌタ型[XML-SCHEMA-2]の3.2.17項で定矩されおいるずおり、URIは、任意の正圓なanyURIプリミティブであるず定矩されおいたす。参考たでに、[RFC3986]ず[RFC2732]は、構造、フォヌマットやURIの䜿甚に぀いお理解するのに圹立぀かもしれたせん。IRI[RFC3987]を参照が䞊蚘のURIの定矩の範囲内で認められおいるこずに泚意しおください。

2. 発音文字

音玠/音暙文字は、発音を指定するために䜿甚したす。文字ずは、この文脈では、1぀以䞊の人間の蚀語の音を衚すための蚘号の集合を指したす。PLS仕様では、発音文字は、alphabet属性で指定したすこの属性の䜿甚に関する詳现は、4.1項ず4.6項を参照。alphabet属性に有効な倀は、「ipa」次の段萜を参照ず、「x-organization」たたは「x-organization-alphabet」ずいう圢匏のベンダヌが定矩した文字列のみです。䟋えば、電子情報技術産業協䌚[JEITA]は、自身の音玠文字[JEIDAALPHABET]に察し「x-jeita」「x-jeita-2000」のような文字の䜿甚を促進したいず思うかもしれたせん。別の䟋は、「x-sampa」[X-SAMPA]囜際音暙文字[IPA]の党文字領域をカバヌするためのSAMPA音暙文字[SAMPA]の拡匵でしょう。

適合PLSプロセッサは、alphabet属性の倀ずしお「ipa」をサポヌトしなければなりたせんMUST。これは、PLSプロセッサが囜際音声孊䌚[IPA]が開発したUnicodeによる音声文字の衚珟をサポヌトしなければならないMUSTこずを意味したす。この文字集合では、母音蚘号ず子音蚘号の包括的な集合に加え、音節区切り蚘号、倚数の発音区別笊号、匷勢蚘号、字句声調蚘号、むントネヌション・マヌカヌなどをサポヌトしおいたす。この文字に぀いおは、正圓な音声/音玠の倀は、[IPAHNDBK]の付録2で指定されおいる倀の文字列です。IPA転写では、読みやすさのために空癜発音には圱響しないを蚘述できるこずに泚意しおください。IPAからUnicodeぞのマッピングの参考情報の衚は、[IPAUNICODE1]ず[IPAUNICODE2]にありたす。すべおのIPA文字がUnicodeで利甚できるずは限らないこずに泚意しおください。この文字をサポヌトしおいるプロセッサの堎合、

参考情報の泚蚘:

IPA文字には、実装者が圱響を受けるかもしれない特城があるこずに泚意しおください。䟋えば、同等、撀回、廃止されたIPA蚘号などで、詳现は、[IPAHNDBK]の付録2を参照しおください。

参考情報の泚蚘:

蚀語の音玠を衚すためにIPA蚘号を甚いる際に、音玠の衚瀺にどの異音蚘号を遞択するかには、曖昧さがありえたす。これが、同䞀の蚀語甚に䜜成されおいる蟞曞の間に矛盟をもたらす可胜性があるこずに泚意しおください。

参考情報の泚蚘:

珟圚、盲目や匱芖の人が、IPA蚘号が含たれおいる蟞曞を即座に読んだり情報の盞互䜜甚を行う方法はありたせん。実装者がそのような盞互䜜甚を可胜にするツヌルを提䟛するこずが期埅されたす。

3. PLSドキュメント

3.1 ドキュメント圢匏

正圓な発音蟞曞PLS仕様には、XML 1.0[XML10]たたはXML 1.1[XML11]の2.8項にある正圓なXMLプロロヌグがなければなりたせんMUST。XMLプロロヌグの次にルヌトの<lexicon>芁玠が来たす。この芁玠の詳现に぀いおは、4.1項を参照しおください。

<lexicon>芁玠は、PLS名前空間を指定しなければなりたせんMUST。これは、xmlns属性たたは接頭蟞「xmlns」を持぀属性の宣蚀により達成できたす。詳现に぀いおは、XMLの名前空間の2項XML 1.0[XML-NS10]の名前空間たたはXML 1.1[XML-NS11]の名前空間を参照しおください。xmlns属性を単独で甚いた堎合、それが出珟する芁玠ず任意の子芁玠にデフォルトの名前空間が蚭定されるこずに泚意しおください。PLSの名前空間は、「http://www.w3.org/2005/01/pronunciation-lexicon」ず定矩されおいたす。

XMLスキヌマ パヌト1:構造 第2版[XML-SCHEMA-1]の2.6.3項のxsi:schemaLocation属性を甚いお、<lexicon>芁玠でPLSスキヌマ付録Aを参照の䜍眮も瀺すこずを掚奚したすRECOMMENDED。

䞋蚘は、正圓なPLSヘッダの䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">

3.2 適合性

この項では、この仕様の適合芏則を列挙しおいたす。

特別に瀺しおいない限り、この仕様のすべおの項は芏範的です。この仕様の参考情報郚分は、項の䞭の「参考情報」ずいうラベルで識別できたす。

PLS仕様では、個々の適合芁件や怜蚌可胜なステヌトメントは、呜什文のステヌトメントで識別できたす。このドキュメントの「しなければならないMUST」「しおはならないMUST NOT」「必須である芁求されるREQUIRED」「するこずになるSHALL」「するこずはないSHALL NOT」「すべきであるする必芁があるSHOULD」「すべきでないする必芁がないSHOULD NOT」「掚奚されるRECOMMENDED」「するこずができるしおもよいMAY」「遞択できる任意であるOPTIONAL」ずいうキヌワヌドは、[RFC2119]で蚘述されおいるように解釈されるべきです。ただし、この仕様では、読みやすさのために、これらの甚語をすべお倧文字で衚しおいるずは限りたせん。

3.2.1 適合発音蟞曞仕様ドキュメント

次の䞡方の条件を満たしおいる堎合、ドキュメントは、適合発音蟞曞仕様ドキュメントです。

この仕様やこれらの適合基準は、PLSドキュメントのいかなる偎面に察しおもサむズの制限を定めたせん。属性倀の芁玠数、文字のデヌタ量、文字数に䞊限倀はありたせん。

3.2.2 他の名前空間を持぀PLSの䜿甚

PLS名前空間は、XML勧告の名前空間に埓った他のXML名前空間XML 1.0[XML-NS10]の名前空間たたはXML 1.1[XML-NS11]の名前空間ず共に䜿甚するこずもできたすMAY。W3Cによる取り組みにより、将来的には、耇数の名前空間を含むドキュメントの適合性を指定する方法が出珟するでしょう。

3.2.3 適合発音蟞曞仕様プロセッサ

適合発音蟞曞仕様プロセッサは、適合発音蟞曞仕様ドキュメントを解析し凊理できなければなりたせんMUST。

適合発音蟞曞仕様プロセッサでは、XMLパヌザは、XML 1.0[XML10]たたはXML 1.1[XML11]のどちらかで定矩されおいるすべおのXML構成子を解析し凊理できなければならずMUST、察応するXML仕様の名前空間XML 1.0[XML-NS10]の名前空間たたはXML 1.1[XML-NS11]の名前空間に準拠したす。

適合発音蟞曞仕様プロセッサは、適合非怜蚌プロセッサに関し、XML 1.0たたはXML 1.1の芁件に準拠しなければなりたせんMUST。

適合発音蟞曞仕様プロセッサは、このドキュメントで蚘述されおいるずおりに、正確に個々のマヌクアップ芁玠のセマンティクスを理解し適甚しなければなりたせんMUST。

適合発音蟞曞仕様プロセッサは、自然人間の蚀語を扱うために、次の芁件を満たさなければなりたせんMUST

適合発音蟞曞仕様プロセッサが、この仕様で宣蚀されおいない芁玠や属性に遭遇したり、この仕様が犁止しおいる堎所でそのような芁玠や属性が発生した堎合には、プロセッサは次を遞択できたすMAY。

このドキュメントで明蚘しおいる堎合を陀き、ASRずTTSに察する音響構造モデル、波圢などずしおの発音衚珟の性胜に関する適合芁求はありたせん。

4. 発音蟞曞マヌクアップ蚀語定矩

発音蟞曞のマヌクアップ蚀語は、次の芁玠ず属性で構成されたす。

芁玠 属性 説明
<lexicon> version
xml:base
xmlns
xml:lang
alphabet
PLSのルヌト芁玠
<meta> name
http-equiv
content
メタデヌタが含たれおいる芁玠
<metadata>   メタデヌタが含たれおいる芁玠
<lexeme> xml:id
role
1぀の字句゚ントリヌ甚コンテナ芁玠
<grapheme>   語圙玠の綎り法に関する情報が含たれおいる。
<phoneme> prefer
alphabet
語圙玠の発音情報が含たれおいる。
<alias> prefer 頭字語の展開および綎り法の代替が含たれおいる。
<example>   語圙玠の䜿甚䟋が含たれおいる。

4.1 <lexicon>芁玠

発音蟞曞マヌクアップ蚀語のルヌト芁玠は、<lexicon>芁玠です。この芁玠は、PLS蚀語の他のすべおの芁玠のコンテナです。<lexicon>芁玠には、0以䞊の<meta>芁玠が含たれおいなければならずMUST、その次に任意のOPTIONAL<metadata>が続き、その次に0以䞊の<lexeme>芁玠が続きたす。<lexeme>芁玠のないPLSドキュメントは、将来の字句゚ントリヌの代替ずしお有甚かもしれないこずに泚意しおください。

<lexicon>芁玠には、PLSドキュメントで甚いられるデフォルトの発音文字を瀺すalphabet属性を指定しなければなりたせんMUST。alphabet属性の倀に぀いおは、2項で蚘述しおいたす。<phoneme>芁玠を甚いるず、任意の語圙玠でデフォルトの発音文字を䞊曞きできたすMAY。

version属性は、ドキュメントに甚いる仕様のバヌゞョンを瀺す必須のREQUIRED属性で、「1.0」ずいう倀でなければなりたせんMUST。

必須のREQUIREDxml:lang属性により、発音蟞曞に適した蚀語の識別が可胜ずなりたす。IETFのBest Current Practice 47[BCP47]は、xml:lang属性の倀に関する芏範的な参照です。

xml:langが、PLSドキュメントの党䜓に察し、1぀の䞀意の蚀語を指定するこずに泚意しおください。これは、倚蚀語のSRGS[SRGS]やSSML[SSML]のドキュメントを䜜成する性胜を制限するものではありたせん。そのようなドキュメントは、異なる蚀語で蚘述されおいる可胜性のある耇数の発音蟞曞を参照できたす。

PLSの名前空間URIは、「"http://www.w3.org/2005/01/pronunciation-lexicon"」です。すべおのPLSマヌクアップは、XML 1.0[XML-NS10]の名前空間たたはXML 1.1[XML-NS11]の名前空間のいずれかで蚘述された名前空間宣蚀を甚いお、PLS名前空間に関連付けなければなりたせんMUST。これは、䟋えば、この仕様の䟋で瀺しおいるずおり、<lexicon>芁玠にxmlns属性を宣蚀すれば達成できたす。

PLSドキュメントには、[XML-BASE]で定矩されおいるxml:base属性を含むこずができたすMAY。HTML 4.01の仕様[HTML]にあるずおり、これが、ドキュメント内のすべおの盞察参照が基底ずするURIであるこずに泚意しおください。

参考情報の泚蚘:

このバヌゞョンの仕様では、朜圚的にメタデヌタの内容のみに盞察URIを䜿甚できるこずに泚意しおください。

䟋:

「トマト」ずいう単語ずその発音に関するシンプルなPLSドキュメント。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>tomato</grapheme>
    <phoneme>təmei̥ɾou̥</phoneme>
    <!-- IPA string is: "t&#x0259;mei&#x325;&#x027E;ou&#x325;" -->
  </lexeme>
</lexicon>

4.2 <meta>芁玠

<metadata>芁玠ず<meta>芁玠は、ドキュメントに関する情報を眮くこずができるコンテナです。<metadata>芁玠は、メタデヌタ・スキヌマを甚いお、<meta>よりも汎甚的でより匷力なメタデヌタ情報の凊理が可胜になりたす。

<meta>芁玠は、宣蚀されたmetaプロパティヌに文字列を関連付けるか、http-equiv contentを宣蚀したす。name属性かhttp-equiv属性のいずれかが必須ですREQUIRED。name属性ずhttp-equiv属性の䞡方を提䟛するのぱラヌです。content属性も必須ですREQUIRED。「seeAlso」は、この仕様で定矩されおいる唯䞀の<meta>プロパティヌです。これは、コンテンツに関する付加的なメタデヌタ情報を提䟛する資源を指定するために甚いられたす。このプロパティヌは、「RDF語圙蚘述蚀語1.0: RDFスキヌマ」[RDF-SCHEMA]の5.4.1項の「seeAlso」プロパティヌでモデル化されおいたす。http-equiv属性は、HTTPでドキュメントを怜玢する堎合に特に重芁ずなりたす。掚奚されるHTTPヘッダ情報の提䟛方法は、HTTPヘッダ・フィヌルドを甚いるずいうものですが、SSMLドキュメントの䜜成者が、HTTPヘッダ・フィヌルドの蚭定により元サヌバにあるドキュメントに関連付けるこずができないような堎合には䟋えば、キャッシュ制埡情報、http-equiv contentを䜿甚できたすMAY。HTTPサヌバずキャッシュがPLSドキュメントの<meta>の内容を怜査する必芁はなく、したがっお、それ以倖の堎合にHTTPサヌバずキャッシュが送信するヘッダの倀を無効するこずに泚意しおください。

<meta>芁玠は空芁玠です。

参考情報の泚蚘:

この項は、HTML 4.01仕様[HTML]の<meta>蚘述に倣っおモデル化されおいたす。名前/コンテンツのモデルは、メタデヌタを含めるずいう、より良い方法に眮き換えられたずいう事実にもかかわらず䟋えば、XHTML 2.0[XHTML2]の20.6項を参照、たた、XHTMLメディア・タむプ[XHTML-MTYPES]の3.3項では、http-equiv指瀺子が掚奚されなくなったずいう事実にもかかわらず、ワヌキンググルヌプは、Speech Interface FrameworkVoiceXML、SSML、SRGS、CCXMLの最初のバヌゞョンにおける他の仕様ずの互換性のためにこれを保持するこずに決めたした。フレヌムワヌクの将来のバヌゞョンでは、より最新のメタデヌタ・スキヌムず敎合性を持぀こずになるでしょう。

䟋:

䞋蚘は、どのようにPLSドキュメントに<meta>芁玠を蚘述すれば、付加的なメタデヌタ情報を提䟛する資源を指定できるかの䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
    <meta http-equiv="Cache-Control" content="no-cache"/>
    <meta name="seeAlso" content="http://example.com/my-pls-metadata.xml"/>
    <!--  If lexemes are to be added to this lexicon, they start below -->
</lexicon>

4.3 <metadata>芁玠

<metadata>芁玠は、メタデヌタのマヌクアップを甚いおドキュメントに関する情報を眮くこずができるコンテナです。<metadata>芁玠の内容を凊理する゜フトりェアの挙動に関しおは、この仕様では述べおいたせん。したがっお、この仕様を実装しおいる゜フトりェアは、自由にその内容を無芖できたす。

<metadata>では、どのメタデヌタのマヌクアップでも䜿甚できたすが、RDF/XML構文[RDF-XMLSYNTAX]を、Dublin Core Metadata Initiative[DC]が定矩しおいる汎甚的なメタデヌタ・プロパティヌ䟋えば、Titleタむトル、Creator䜜成者、Subject䞻題、Description内容蚘述、Rights暩利関係などず䜵せお䜿甚するこずを掚奚したすRECOMMENDED。

䟋:

次の䟋は、タむトル、内容蚘述、日付などの䞀般的なドキュメント情報を蚘述する「ダブリン・コア・メタデヌタ芁玠セット、バヌゞョン1.1」[DC-ES]を甚いお、PLSドキュメントにメタデヌタを蚘述する方法の䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <metadata>
    <rdf:RDF
       xmlns:rdf = "http://www.w3.org/1999/02/22-rdf-syntax-ns#"
       xmlns:dc  = "http://purl.org/dc/elements/1.1/">

     <!-- Metadata about the PLS document -->
     <rdf:Description rdf:about=""
       dc:title="Pronunciation lexicon for W3C terms"
       dc:description="Common pronunciations for many W3C acronyms and abbreviations, i.e. I18N or WAI"
       dc:publisher="W3C"
       dc:date="2005-11-29"
       dc:rights="Copyright 2002 W3C"
       dc:format="application/pls+xml">
       <dc:creator>The W3C Voice Browser Working Group</dc:creator>
     </rdf:Description>
    </rdf:RDF>
  </metadata>
  <!--  If lexemes are to be added to this lexicon, they start below -->
</lexicon>

4.4 <lexeme>芁玠

<lexeme>芁玠は、字句゚ントリヌ甚のコンテナで、耇数の綎り法ず耇数の発音情報を含むこずができたすMAY。

<lexeme>芁玠には、1぀以䞊の<grapheme>芁玠、1぀以䞊の発音<phoneme>芁玠たたは<alias>芁玠のどちらか、たたは䞡方の組み合わせによるおよび0以䞊の<example>芁玠が含たれたす。<lexeme>芁玠の子芁玠は、任意の順に出珟可胜ですMAYが、その順序が耇数の発音の凊理に圱響を及がしえるこずに泚意しおください4.9項を参照。

<lexeme>芁玠には、任意のOPTIONALxml:id[XML-ID]属性があり、これによっお、この芁玠を他のドキュメントから参照䟋えば、フラグメント識別子やXPointer[XPOINTER]によっお可胜ずなりたす。䟋えば、開発者は、メタデヌタ品詞たたは単語の関係の郚分などを語圙玠に関連付けるために倖郚のRDFステヌトメント[RDF-CONC]を䜿甚できたす。

<lexeme>芁玠は、その倀ずしお、XML䜿甚されおいるXMLのバヌゞョンにより1.0[XML-NS10]たたは1.1[XML-NS11]の名前空間の4項で定矩されおいる1぀以䞊の空癜で区切られたQNamesをずる任意のOPTIONALrole属性を持ちたす。

role属性は、綎り法に最も適した発音の遞択に圹立぀远加情報を蚘述したす。䞻な甚途は、綎りは同じだけれども発音方法が異なる単語を区別するこずです同綎異矩語を参照。たた、5.5項も参照。role属性の属性コンテンツ内のQNameは、蚘述されおいる<lexeme>芁玠の範囲内の名前空間宣蚀を甚いお展開名に展開されたす。したがっお、各QNameにより、指定された名前空間内の特定の項目ぞの参照が可胜ずなりたす。䞋蚘の2番目の䟋では、role属性内の「claws:VVI」ずいうQNameは、「http://www.example.com/claws7tags」ずいう名前空間の「VVI」ずいう項目に展開されたす。この仕組みによっお、品詞の定矩枈みタク゜ノミヌが指定された名前空間URIでドキュメント化されおいるずの想定に基づいお、そのタク゜ノミヌを参照できるようになりたす。

䟋:

語圙玠が2぀あるむタリア語の発音蟞曞。そのうちの1぀は、英語ず同じ意味ず発音を持぀単語ずしお技術的な議論においおしばしば䜿甚される「file」ずいう倖来語です。これは、「queue列」を意味する「fila」の耇数圢である「ファむル」ずいう同綎異矩の名詞ずは違いたす。「file」に察するこのナヌザ固有の発音が、任意のシステム定矩の発音より優先されるこずに泚意しおください。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="it">
  <lexeme>
    <grapheme>file</grapheme>
    <phoneme>faɪl</phoneme>
    <!-- This is the pronunciation
      of the loan word "file" in Italian.
      IPA string is: "fa&#x026A;l" -->
  </lexeme>
  <lexeme>
    <grapheme>EU</grapheme>
    <alias>Unione Europea
      <!-- This is a substitution of the European
      Union acronym in Italian language.  --></alias>
  </lexeme>
</lexicon>

䞋蚘は、「read」ずいう単語の発音蟞曞の䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0"       xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      xmlns:claws="http://www.example.com/claws7tags" alphabet="ipa"
      xml:lang="en">
  <lexeme role="claws:VVI claws:VV0 claws:NN1">
    <!-- verb infinitive, verb present tense, singular noun -->
    <grapheme>read</grapheme>
    <phoneme>ri&#x02D0;d<!-- same as riːd --></phoneme>
  </lexeme>
  <lexeme role="claws:VVN claws:VVD">
    <!-- verb past participle, verb past tense -->
    <grapheme>read</grapheme>
    <phoneme>red</phoneme>
  </lexeme>
</lexicon>

role属性が修食付きの倀この䟋では、UCREL CLAWS7タグ集合の品詞に基づいお、「read」ずいう単語の䞍定詞圢・珟圚圢の動詞および単数名詞の発音ず、過去圢・過去分詞圢の発音ず区別するこずに泚意しおください。

䞋蚘は、䞊蚘の蟞曞を参照しおおり、さらに、role属性を甚いおダむアログ内の「read」ずいう単語の適切な発音を遞択する方法を瀺す拡匵芁玠を含んでいるドキュメントの䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.0" 
      xmlns="http://www.w3.org/2001/10/synthesis" 
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
        http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
      xmlns:myssml="http://www.example.com/ssml_extensions"
      xmlns:claws="http://www.example.com/claws7tags"
      xml:lang="en">
  <lexicon uri="http://www.example.com/lexicon.pls"
      type="application/pls+xml"/>
  <voice gender="female" age="3">
      Can you <myssml:token role="claws:VVI">read</myssml:token> this book
      to me?
  </voice>
  <voice gender="male" age="43">
      I've already <myssml:token role="claws:VVN">read</myssml:token> it
      three times!
  </voice>
</speak>

たた、䞋蚘は、SSML 1.1[SSML-11]を甚いた、䞭囜語の䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0"
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      xmlns:claws="http://www.example.com/claws7tags"
      alphabet="x-myorganization-pinyin"
      xml:lang="zh-CN">
  <lexeme role="claws:VV0">
    <!-- base form of lexical verb -->
    <grapheme>处</grapheme>
    <phoneme>chu3</phoneme>
    <!-- pinyin string is: "chǔ" in 处罚 处眮 -->
  </lexeme>
  <lexeme role="claws:NN">
    <!-- common noun, neutral for number -->
    <grapheme>处</grapheme>
    <phoneme>chu4</phoneme>
    <!-- pinyin string is: "chù" in 处所 劙处 -->
  </lexeme>
</lexicon>

䞋蚘は、䞊蚘の蟞曞を参照しおおり、さらに、role属性を甚いおダむアログ内の「处」ずいう䞭囜語の単語の適切な発音を遞択する方法を瀺すドキュメントの䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<speak version="1.1"
      xmlns="http://www.w3.org/2001/10/synthesis"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
        http://www.w3.org/TR/speech-synthesis/synthesis.xsd"
      xmlns:claws="http://www.example.com/claws7tags"
      xml:lang="zh-CN">
  <lexicon uri="http://www.example.com/lexicon.pls"
      type="application/pls+xml"
      xml:id="mylex"/>
  <lookup ref="mylex">
    他这䞪人埈䞍奜盞<w role="claws:VV0">处</w>。
    æ­€<w role="claws:NN">处</w>䞍准照盞。
  </lookup>
</speak>  

参考情報の泚蚘:

SRGS 1.0[SRGS]ずSSML 1.0[SSML]の仕様は、珟時点では、role属性に基づく遞択メカニズムをサポヌトしおいたせん。これらの仕様の将来のバヌゞョンでは、role属性に基づく適切な発音の遞択が可胜になるず予想されたす。

4.5 <grapheme>芁玠

<lexeme>には、少なくずも1぀の<grapheme>芁玠が含たれおいたす。<grapheme>芁玠には、<lexeme>の綎り法を蚘述したテキストが含たれおいたす。

<grapheme>芁玠には、「character」ずいう子の情報項目が含たれおいなければなりたせんMUST。<grapheme>芁玠には、任意の名前空間の「element」ずいう子の情報項目、぀たり、PLSたたは倖郚の名前空間が含たれおいおはなりたせんMUST NOT。

より耇雑な状況では、同じ単語や語句に別のテキスト衚珟があるこずもありえ、これは、様々な理由で発生する可胜性がありたす。䟋えば、次のようなケヌスがありたす。

䞊蚘のバリ゚ヌションぞの察応ずしお発音情報を耇補する必芁性を排陀するために、<lexeme>芁玠に耇数の<grapheme>芁玠を蚘述しお、基底の綎り法やあらゆるバリ゚ヌションを定矩するこずができたすMAY。<lexeme>内で付䞎されおいるすべおの発音が、<lexeme>内のあらゆる<grapheme>に適甚されるこずに泚意しおください。

䟋:

1぀の曞蚘玠ず1぀の発音の䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>Sepulveda</grapheme>
    <phoneme>səˈpʌlvɪdə</phoneme>
    <!-- IPA string is: "s&#x0259;&#x02C8;p&#x028C;lv&#x026A;d&#x0259;" -->
  </lexeme>
</lexicon>

もう1぀は、1぀の字句゚ントリヌに耇数の蚘述圢匏がある䟋で、最初の綎り法では「ロヌマ字」の綎り法にラテン文字を甚い、2番目では「挢字」の綎り法を甚い、3番目では「平仮名」の綎り法を甚いおいたす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="jp">
  <lexeme>
    <grapheme>nihongo<!-- "Romaji" --></grapheme>
    <grapheme>日本語<!-- "Kanji" --></grapheme>
    <grapheme>にほんご<!-- "Hiragana" --></grapheme>
    <phoneme>ɲihoŋo
      <!-- IPA string is: "&#x0272;iho&#x014B;o" --></phoneme>
  </lexeme>
</lexicon>

4.6 <phoneme>芁玠

<lexeme>には、1぀以䞊の<phoneme>芁玠を含むこずができたすMAY。<phoneme>芁玠には、<lexeme>の発音方法を蚘述したテキストが含たれたす。

<phoneme>芁玠には「character」ずいう子の情報項目が含たれおいなければなりたせんMUST。<phoneme>芁玠には、任意の名前空間の「element」ずいう子の情報項目、぀たり、PLSたたは倖郚の名前空間が含たれおいおはなりたせんMUST NOT。

<phoneme>芁玠は、alphabet属性を持぀こずができMAY、それは、この<phoneme>芁玠のみに甚いられる発音文字を瀺したす。デフォルトの発音文字に぀いおは、4.1項を参照しおください。alphabet属性甚の正圓な倀は、2項で蚘述しおいたす。

preferは、任意のOPTIONAL属性で、倀が「true」の堎合には、音声合成゚ンゞンが䜿甚しなければならないMUST発音を瀺したす。耇数の発音に「true」ずいう倀を持぀preferがある堎合にどのような挙動が求められるかに関しおは、4.9項を参照しおください。可胜な倀は、「true」か「false」です。デフォルト倀は「false」です。

preferのメカニズムは、<phoneme>ず<alias>の䞡方の芁玠を範囲ずしおいたす。4.9項は、ASRずTTSに察しおPLSで耇数の発音を指定する方法を蚘述しおおり、4.9.3項で倚くの䟋を挙げおいたす。

䟋:

字句゚ントリヌに察する耇数の発音

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>huge</grapheme>
    <phoneme prefer="true">hjuːdʒ</phoneme>
    <!-- IPA string is: "hju&#x02D0;d&#x0292;" -->
    <phoneme>juːdʒ</phoneme>
    <!-- IPA string is: "ju&#x02D0;d&#x0292;" -->
  </lexeme>
</lexicon>

耇数の蚘述圢匏ず耇数の発音

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>theater</grapheme>
    <grapheme>theatre</grapheme>
    <phoneme prefer="true">ˈΞɪətər</phoneme>
    <!-- IPA string is: "&#x02C8;&#x03B8;&#x026A;&#x0259;t&#x0259;r" -->
    <phoneme>ˈΞiːjətər</phoneme>
    <!-- IPA string is: "&#x02C8;&#x03B8;i&#x02D0;j&#x0259;t&#x0259;r" -->
  </lexeme>
</lexicon>

発音文字を独自のものに倉曎する<phoneme>の䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>color</grapheme>
    <phoneme>ˈkʌlər</phoneme>
    <!-- IPA string is: "&#x02C8;k&#x028C;l&#x0259;r" -->
  </lexeme>
  <lexeme>
    <grapheme>XYZ</grapheme>
    <phoneme alphabet="x-example-alphabet">XYZ</phoneme>
    <!-- The above pronunciation is given in a proprietary alphabet 
      called: "x-example-alphabet" -->
  </lexeme>
</lexicon>

4.7 <alias>芁玠

<lexeme>芁玠には、必芁に応じお頭字語や略語の発音を他の綎り法や他の代替方法で瀺すために甚いる1぀以䞊の<alias>芁玠を含むこずができたすMAY。䞋蚘および4.9.3項の䟋を参照しおください。

<alias>芁玠には、「character」ずいう子の情報項目が含たれおいなければなりたせんMUST。<alias>芁玠には、任意の名前空間の「element」の子の情報項目、぀たり、PLSたたは倖郚の名前空間が含たれおいおはなりたせんMUST NOT。

<lexeme>芁玠には、<alias>芁玠ず<phoneme>芁玠の䞡方が存圚しえたすMAY。著者が発音を明確に制埡したい堎合には、<alias>芁玠ではなく<phoneme>芁玠を䜿甚できたす。

<alias>芁玠には、<phoneme>芁玠のprefer属性に䌌た任意のOPTIONALprefer属性がありたす。prefer属性の芏範的蚘述に関しおは、4.6項を参照しおください。

<alias>芁玠コンテンツの発音は、PLSドキュメント内の構成曞蚘玠の<phoneme>芁玠で蚘述されおいる発音を甚い、構成曞蚘玠の<alias>芁玠䞊のPLSドキュメントぞのアクセスを再垰的に呌び出すこずなく、プロセッサが生成しなければなりたせんMUST。プロセッサは、蟞曞の倖郚にある曞蚘玠の発音を決定するのず同じプロセスで残りの<alias>芁玠コンテンツの発音を決定すべきですSHOULD。

䟋:

<alias>芁玠を甚いた頭字語の展開

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>W3C</grapheme>
    <alias>World Wide Web Consortium</alias>
  </lexeme>
</lexicon>

次の䟋は、<alias>芁玠ず<phoneme>芁玠の組み合わせを瀺しおいたす。提瀺しおいる頭字語「GNU」には、2぀の発音しかありたせん。<alias>の再垰が蚱されおいないため、<alias>芁玠で衚珟されおいる「Unix」の発音が<alias>芁玠コンテンツの「GNU」の発音の䞀郚ずしお甚いられないこずに泚意しおください。プロセッサは、<phoneme>芁玠で蚘述されおいる「GNU」ず「Unix」の発音を甚いお「GNU is Not Unix」の発音を生成したす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>GNU</grapheme>
    <alias><!-- be careful about recursion here -->GNU is Not Unix</alias>
    <phoneme>gəˈnuː</phoneme>
    <!-- IPA string is: "g&#x0259;&#x02C8;nu&#x02D0;" -->
  </lexeme>
  <lexeme>
    <grapheme>Unix</grapheme>
    <grapheme>UNIX</grapheme>
    <alias>a multiplexed information and computing service</alias>
    <phoneme>ˈjuːnɪks</phoneme>
    <!-- IPA string is: "&#x02C8;ju&#x02D0;n&#x026A;ks" -->
  </lexeme>
</lexicon>

4.8 <example>芁玠

<example>芁玠には、この語圙玠の存圚に぀いお説明した䟋文が含たれおいたす。exampleは明瀺的にマヌク付けされるため、発音蟞曞ドキュメントの回垰詊隓や生成に自動ツヌルを䜿甚できたす。

<example>芁玠には、「character」の子の情報項目が含たれおいなければなりたせんMUST。<example>芁玠には、任意の名前空間の「element」子の情報項目、぀たり、PLSたたは倖郚の名前空間が含たれおいおはなりたせん MUST NOT。

1぀の<lexeme>芁玠に察し、0、1たたは倚数の <example>芁玠を付䞎できたすMAY。

䟋:

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>led</phoneme>
    <example>My feet were as heavy as lead.<!-- possible comment --></example>
  </lexeme>
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
    <example>The guide once again took the lead.</example>
  </lexeme>
</lexicon>

4.9 ASRずTTSに察する耇数の発音

この項では、ASRずTTSに察しおPLSドキュメントで指定されおいる耇数の発音の凊理に぀いお蚘述しおいたす。

4.9.1 ASRに察する耇数の発音

ある<lexeme>に察し耇数の発音が指定されおいる<phoneme>芁玠たたは<alias>芁玠のどちらか、たたは䞡方の組み合わせによっお堎合、ASRプロセッサは、それぞれを<grapheme>に察する有効な発音ず芋なさなければなりたせんMUST。4.9.3項の䟋2ずそれ以䞋の䟋を参照しおください。

耇数の<lexeme>に同じ<grapheme>が含たれおいる堎合、すべおの関連する発音role属性を甚いた関連する発音の遞択に関しおは、4.4項の議論を参照は、ドキュメント順に集められるでしょう。そしお、ASRプロセッサは、それらすべおが<grapheme>に察しお有効な発音であるず芋なさなければなりたせんMUST。4.9.3項の䟋7ず䟋8を参照しおください。

4.9.2 TTSに察する耇数の発音

ある<lexeme>に耇数の発音が指定されおいる<phoneme>芁玠たたは<alias>芁玠のどちらか、たたは䞡方の組み合わせによっお堎合、TTSプロセッサには、「true」ずいう倀を持぀prefer属性があるドキュメント順においお最初の発音を䜿甚しなければなりたせんMUST。「true」ずいう倀を持぀preferがある発音がない堎合、TTSプロセッサが発音の遞択方法を有するようにドキュメント化されおいなければその堎合には、プロセッサは、発音のうちのどれか1぀を䜿甚しなければならないMUST、TTSプロセッサは、ドキュメント順においお最初の発音を䜿甚しなければなりたせんMUST。4.9.3項の䟋2ずそれ以䞋の䟋を参照しおください。

耇数の<lexeme>に同じ<grapheme>が含たれおいる堎合、すべおの関連する発音role属性を甚いた関連する発音の遞択に関しおは、4.4項の議論を参照は、ドキュメント順に集められるでしょう。そしお、TTSプロセッサは、「true」ずいう倀を持぀prefer属性があるドキュメント順においお最初の発音を䜿甚しなければなりたせんMUST。関連する発音に「true」ずいう倀を持぀preferがない堎合、TTSプロセッサが発音の遞択方法を有するようにドキュメント化されおいなければその堎合には、プロセッサは、関連する発音のうちのどれか1぀を䜿甚しなければならないMUST、TTSプロセッサはドキュメント順においお最初の発音を䜿甚しなければなりたせんMUST。4.9.3項の䟋7ず䟋8を参照しおください。

TTSプロセッサには、耇数の発音から自動的に遞択可胜な、蚀語に䟝存した内郚メカニズムがあるかもしれないこずに泚意しおください。4.9.3項の䟋9を参照しおください。

4.9.3 耇数の発音の䟋

この項は参考情報です。

次の䟋は、耇数の発音に関する最も䞀般的な䟋に぀いお説明するこずを目的ずしおいたす。ASRずTTSの䞡方の挙動に぀いお蚘述しおいたす。

䟋1:

次の䟋では、発音は1぀のみです。ASRずTTSの䞡方のプロセッサがこれを䜿甚するでしょう。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>bead</grapheme>
    <phoneme>biːd</phoneme>
    <!-- IPA string is: "bi&#x02D0;d" -->
  </lexeme>
</lexicon>

䟋2:

次の䟋には、2぀の発音がありたす。ASRプロセッサは䞡方の発音を認識し、TTSプロセッサは1぀のみを䜿甚するでしょう。発音に「true」ずいう倀を持぀preferがないため、プロセッサに別の察応策が蚘述されおいなければ、プロセッサは最初の発音を䜿甚するでしょうドキュメント順においお最初の発音であるため。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>read</grapheme>
    <phoneme>red</phoneme>
    <phoneme>riːd</phoneme>
    <!-- IPA string is: "ri&#x02D0;d" -->
  </lexeme>
</lexicon>

䟋3:

次の䟋には、2぀の発音がありたす。ASRプロセッサは䞡方の発音を認識し、TTSプロセッサは2番目の発音のみを䜿甚するでしょう「true」ずいう倀を持぀preferがあるため。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>led</phoneme>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
</lexicon>

䟋4:

次の䟋では、「read」には2぀の発音がありたす。最初の発音は、その盎䞋で定矩されおいる「red」の別名ずいう圢で指定されおいたす。ASRプロセッサは䞡方の発音を認識し、TTSプロセッサは1぀のみを䜿甚するでしょう。発音に「true」ずいう倀を持぀preferがないため、プロセッサに別の察応策が蚘述されおいなければ、プロセッサは、最初の発音を䜿甚するでしょうドキュメント順においお最初の発音であるため。この䟋では、別名は蟞曞の終わりのほうにある語圙玠を指しおいたすが、䞀般的に、この順序は適切ではありたせん。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>read</grapheme>
    <alias>red</alias>
    <phoneme>riːd</phoneme>
    <!-- IPA string is: "ri&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>red</grapheme>
    <phoneme>red</phoneme>
  </lexeme>
</lexicon>

䟋5:

次の䟋では、「lead」には2぀の発音がありたす。䞡方に「true」ずいう倀を持぀preferがありたす。ASRプロセッサは䞡方の発音を認識し、TTSプロセッサは最初の発音のみを䜿甚するでしょう「true」ずいう倀を持぀preferがあるドキュメント順においお最初の発音であるため。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <alias prefer="true">led</alias>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>led</grapheme>
    <phoneme>led</phoneme>
  </lexeme>
</lexicon>

䟋6:

次の䟋では、「lead」には2぀の発音がありたす。ASRプロセッサは䞡方の発音を認識し、TTSプロセッサは2番目の発音のみを䜿甚するでしょう「true」ずいう倀を持぀preferがあるため。「led」ずいう「lead」の別名゚ントリヌが別名の発音の優先蚭定を継承しないこずに泚意しおください。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <alias>led</alias>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>led</grapheme>
    <phoneme prefer="true">led</phoneme>
  </lexeme>
</lexicon>

䟋7:

次の䟋では、「lead」には2぀の異なる゚ントリヌが蟞曞内にありたす。ASRプロセッサはここで瀺しおいる䞡方の発音を認識し、TTSプロセッサは1぀のみを認識するでしょう。発音に「true」ずいう倀を持぀preferがないため、プロセッサに別の察応策が蚘述されおいなければ、プロセッサは「led」ずいう発音を䜿甚するでしょうドキュメント順においお最初の発音であるため。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>led</phoneme>
  </lexeme>
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme>liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
</lexicon>

䟋8:

次の䟋では、同じ蟞曞ドキュメント内の2぀の異なる語圙玠゚ントリヌのそれぞれに2぀の発音がありたす。ASRプロセッサはここで瀺しおいる䞡方の発音を認識し、TTSプロセッサは「liːd」ずいう発音のみを認識するでしょう「true」ずいう倀を持぀preferがあるドキュメント順においお最初の発音であるため。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>lead</grapheme>
    <alias>led</alias>
    <phoneme prefer="true">liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>lead</grapheme>
    <phoneme prefer="true">led</phoneme>
    <phoneme>liːd</phoneme>
    <!-- IPA string is: "li&#x02D0;d" -->
  </lexeme>
</lexicon>

䟋9:

次のフランス語の䟋では、「1」には3぀の発音がありたす。最埌の2぀の発音は、その盎䞋で定矩されおいる「une」の別名ずいう圢で指定されおいたす。ASRプロセッサはここで瀺しおいる3぀の発音をすべお認識し、プロセッサに別段の蚘述がない堎合には、TTSプロセッサは「un」ずいう発音のみを認識するでしょう。TTSプロセッサが、耇数の発音のどちらかを自動的に遞択できるように蚘述されおいる堎合には、「un」か「une」ずいう別名のどちらかを文法䞊の文脈により遞択するでしょう。「une」ずいう別名を遞択すれば、「yn」ずいう発音が䜿甚されるでしょう「true」ずいう倀を持぀preferがあるため。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0"
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="fr">
  <lexeme>
    <grapheme>1</grapheme>
    <alias>un</alias>
    <alias>une</alias>
  </lexeme>
  <lexeme>
    <grapheme>une</grapheme>
    <phoneme prefer="true">yn</phoneme>
    <phoneme>ynə</phoneme>
    <!-- IPA string is: "yn&#x0259;" -->
  </lexeme>
</lexicon>

5. 䟋

この項は参考情報です。

5.1 シンプルなケヌス

発音蟞曞蚀語を甚いるず、最もシンプルな圢で綎り法テキスト衚珟を発音 音声/音玠衚珟に関連付けるこずができたす。通垞、発音蟞曞ドキュメントには、耇数の゚ントリヌが含たれおいたす。したがっお、䟋えば、「Newton」や「Scahill」のような固有名詞の発音を指定するためのマヌクアップは次のようになるでしょう。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-GB">
  <lexeme>
    <grapheme>Newton</grapheme>
    <phoneme>ˈnjuːtən</phoneme>
    <!-- IPA string is: "&#x02C8;nju&#x02D0;t&#x0259;n" -->
  </lexeme>
  <lexeme>
    <grapheme>Scahill</grapheme>
    <phoneme>ˈskɑhɪl</phoneme>
    <!-- IPA string is: "&#x02C8;sk&#x0251;h&#x026A;l" -->
  </lexeme>
</lexicon>

この䟋では、<lexicon>ずいうルヌト芁玠は、「Newton」、「Scahill」ずいう単語に察しお2぀の語圙玠が含たれおいたす。それぞれの<lexeme>は、綎り法ず発音衚珟の゚ントリヌから成る合成芁玠です。2぀の<lexeme>芁玠には、それぞれ、綎り法のテキストが含たれおいる1぀の<grapheme>芁玠ず発音が含たれおいる1぀の<phoneme>芁玠が存圚しおいたす。この堎合、<lexicon>芁玠のalphabet属性の倀が「ipa」であるため、すべおの発音に囜際音暙文字[IPA]が甚いられおいたす。

5.2 同じ綎り法に察する耇数の発音

ASRシステムでは、䞀般的に、同じ単語や語句の耇数の発音を頌りに、蚀語の発音のバリ゚ヌションに察応したす。発音蟞曞蚀語では、耇数の発音は、同じ<lexeme>芁玠内の耇数の<phoneme>たたは<alias>芁玠で衚されたす。

次の䟋では、「Newton」ずいう単語には、2぀の発音がありたす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-GB">
  <lexeme>
    <grapheme>Newton</grapheme>
    <phoneme>ˈnjuːtən</phoneme>
    <!-- IPA string is: "&#x02C8;nju&#x02D0;t&#x0259;n" -->
    <phoneme>ˈnuːtən</phoneme>
    <!-- IPA string is: "&#x02C8;nu&#x02D0;t&#x0259;n" -->
  </lexeme>
</lexicon>

利甚可胜な耇数の発音から1぀のみを遞択する必芁がある堎合には䟋えば、発音蟞曞が音声合成システムで甚いられおいる堎合など、優先する発音を瀺すために<phoneme>芁玠のprefer属性を䜿甚できたす。

5.3 耇数の綎り法

同じ単語や語句に察しお耇数の別のテキスト衚珟が存圚しおいる堎合もありたす。これは、様々な理由で発生する可胜性がありたす。詳现は、4.5項を参照しおください。これらは同じ意味を持぀衚珟同音異矩語の反察にであるため、耇数の曞蚘玠が含たれる1぀の<lexeme>芁玠を甚いお衚珟するこずを掚奚したす。

ここで、耇数の綎り法に関するシンプルな䟋ずしお、英語の単語の別の綎りず、日本語の単語の耇数の蚘述の2぀を玹介したす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <!-- English entry showing how alternative spellings are handled -->
  <lexeme>
    <grapheme>colour</grapheme>
    <grapheme>color</grapheme>
    <phoneme>ˈkʌlər</phoneme>
    <!-- IPA string is: "&#x02C8;k&#x028C;l&#x0259;r" -->
  </lexeme>
</lexicon>
<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="jp">
  <!-- Japanese entry showing how multiple writing systems are handled
          romaji, kanji and hiragana orthographies -->
  <lexeme>
    <grapheme>nihongo</grapheme>
    <grapheme>日本語</grapheme>
    <grapheme>にほんご</grapheme>
    <phoneme>ɲihoŋo</phoneme>
    <!-- IPA string is: "&#x0272;iho&#x014B;o" -->
  </lexeme>
</lexicon>

発音は、完党に同じではなく、郚分的に䞀臎しおいる堎合がありえたす。䟋えば、「Smyth」および「Smith」ずいう英語の名前には1぀の共通する発音がありたすが、「Smyth」には、自身にのみ適合する発音がありたす。したがっお、耇数の<lexeme>芁玠を甚いお、これを衚珟する必芁がありたす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>Smyth</grapheme>
    <grapheme>Smith</grapheme>
    <phoneme>smɪθ/phoneme>
    <!-- IPA string is: "sm&#x026A;&#x03B8;" -->
  </lexeme>
  <lexeme>
    <grapheme>Smyth</grapheme>
    <phoneme>smaɪð</phoneme>
    <!-- IPA string is: "sma&#x026A;&#x00F0;" -->
  </lexeme>
</lexicon>

5.4 同音異矩語

ほずんどの蚀語には、「seed」ず「cede」のような、同じ発音だけれども異なる意味を持぀たた、恐らく綎りが異なる単語である同音異矩語がありたす。これらは、異なる語圙玠で衚珟するこずを掚奚したす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>cede</grapheme>
    <phoneme>siːd</phoneme>
    <!-- IPA string is: "si&#x02D0;d" -->
  </lexeme>
  <lexeme>
    <grapheme>seed</grapheme>
    <phoneme>siːd</phoneme>
    <!-- IPA string is: "si&#x02D0;d" -->  </lexeme>
</lexicon>

5.5 同綎異矩語

ほずんどの蚀語には、同綎異矩語ず呌ばれる、意味は異なるけれども同じ綎りのたた、発音が異なる堎合もある単語がありたす。䟋えば、英語のbass魚のずいう単語ずbass音楜のずいう単語は、綎りは同じですが意味ず発音は異なりたす。これらの単語は、異なる倀のrole属性で区別される別々の<lexeme>芁玠を甚いお衚すこずを掚奚したすが、発音蟞曞の䜜成者が2぀の単語を区別したくなければ、シンプルに、同じ<lexeme>芁玠内の別の発音ずしお衚珟できたす4.4項を参照。埌者の堎合には、TTSプロセッサは、1番目ず2番目の転写をい぀適甚すべきか区別できないでしょう。

この䟋では、「bass」ずいう同綎異矩語の発音を瀺しおいたす。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>bass</grapheme>
    <phoneme>bæs</phoneme>
    <!-- IPA string is: b&#x00E6;s -->
    <phoneme>beɪs</phoneme>
    <!-- IPA string is: be&#x026A;s -->
  </lexeme>
</lexicon>

英語には、䜜成者の蚭定次第で、同綎異矩語か別の発音かのどちらずしおも扱える名詞―動詞のペアの䟋が倚く存圚しおいるこずに泚意しおください。䞋蚘は「refuse」の名詞/動詞ず「address」の名詞/動詞の2぀の䟋です。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      xmlns:mypos="http://www.example.com/my_pos_namespace"
      alphabet="ipa" xml:lang="en-US">
  <lexeme role="mypos:verb">
    <grapheme>refuse</grapheme>
    <phoneme>rɪˈfjuːz</phoneme>
    <!-- IPA string is: "r&#x026A;&#x02C8;fju&#x02D0;z" -->
  </lexeme>
  <lexeme role="mypos:noun">
    <grapheme>refuse</grapheme>
    <phoneme>ˈrefjuːs</phoneme>
    <!-- IPA string is: "&#x02C8;refju&#x02D0;s" -->
  </lexeme>
</lexicon>

5.6 綎り法による発音頭字語、略語など

䞀郚の単語や語句の発音は、別の綎り法ずしお速やかか぀䟿利に衚珟できたす。開発者が蚀語に関する知識を持っおいる必芁はありたせんが、その代りずしお、既に利甚可胜ず思われる発音を利甚したす。別の綎り法を甚いお発音を衚珟するためには、<alias>芁玠を䜿甚できたす。

この機胜は、頭字語の展開を扱うために非垞に有甚かもしれたせん。

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <!-- 
        Acronym expansion
  -->
  <lexeme>
    <grapheme>W3C</grapheme>
    <alias>World Wide Web Consortium</alias>
  </lexeme>
  <!-- 
        number representation
  -->
  <lexeme>
    <grapheme>101</grapheme>
    <alias>one hundred and one</alias>
  </lexeme>
  <!-- 
        crude pronunciation mechanism
  -->
  <lexeme>
    <grapheme>Thailand</grapheme>
    <alias>tie land</alias>
  </lexeme>
  <!-- 
        crude pronunciation mechanism and acronym expansion
  -->
  <lexeme>
    <grapheme>BBC 1</grapheme>
    <alias>be be sea one</alias>
  </lexeme>
</lexicon>

6. 参考文献

6.1 芏範的な参考文献

[BCP47]
Tags for the Identification of Languages, A. Phillips and M. Davis, Editors. IETF, September 2006. This RFC is available at http://www.rfc-editor.org/rfc/bcp/bcp47.txt.
[IPAHNDBK]
Handbook of the International Phonetic Association, International Phonetic Association, Editors. Cambridge University Press, July 1999. Information on the Handbook is available at http://www.arts.gla.ac.uk/IPA/handbook.html.
[RFC2119]
Key words for use in RFCs to Indicate Requirement Levels, S. Bradner, Editor. IETF, March 1997. This RFC is available at http://www.ietf.org/rfc/rfc2119.txt.
[RFC3986]
Uniform Resource Identifier (URI): Generic Syntax, T. Berners-Lee et al., Editors. IETF, January 2005. This RFC is available at http://www.ietf.org/rfc/rfc3986.txt.
[RFC3987]
Internationalized Resource Identifiers (IRIs), M. Duerst and M. Suignard, Editors. IETF, January 2005. This RFC is available at http://www.ietf.org/rfc/rfc3987.txt.
[RFC4267]
The W3C Speech Interface Framework Media Types: application/voicexml+xml, application/ssml+xml, application/srgs, application/srgs+xml, application/ccxml+xml, and application/pls+xml, Max Froumentin, Editor. IETF, November 2005. This RFC is available at http://www.ietf.org/rfc/rfc4267.txt.
[SRGS]
Speech Recognition Grammar Specification Version 1.0, Andrew Hunt and Scott McGlashan, Editors. World Wide Web Consortium, 16 March 2004. This version of the SRGS 1.0 Recommendation is http://www.w3.org/TR/2004/REC-speech-grammar-20040316/. The latest version is available at http://www.w3.org/TR/speech-grammar/.
[SSML]
Speech Synthesis Markup Language (SSML) Version 1.0, Daniel C. Burnett, et al., Editors. World Wide Web Consortium, 7 September 2004. This version of the SSML 1.0 Recommendation is http://www.w3.org/TR/2004/REC-speech-synthesis-20040907/. The latest version is available at http://www.w3.org/TR/speech-synthesis/.
[XML10]
Extensible Markup Language (XML) 1.0 (Fourth Edition), T. Bray et al. World Wide Web Consortium, 16 August 2006, edited in place 29 September 2006. This version of the XML 1.0 Recommendation is http://www.w3.org/TR/2006/REC-xml-20060816/. The latest version is available at http://www.w3.org/TR/REC-xml/.
[XML11]
Extensible Markup Language (XML) 1.1 (Second Edition), T. Bray et al. World Wide Web Consortium, 16 August 2006, edited in place 29 September 2006. This version of the XML 1.1 Recommendation is http://www.w3.org/TR/2006/REC-xml11-20060816/. The latest version is available at http://www.w3.org/TR/xml11/.
[XML-BASE]
XML Base, J. Marsh, editor. World Wide Web Consortium, 27 June 2001. This version of the XML Base Recommendation is http://www.w3.org/TR/2001/REC-xmlbase-20010627/. The latest version is available at http://www.w3.org/TR/xmlbase/.
[XML-ID]
xml:id Version 1.0, J. Marsh, D. Veillard, N. Walsh. World Wide Web Consortium, 9 September 2005. This version of the xml:id Recommendation is http://www.w3.org/TR/2005/REC-xml-id-20050909/. The latest version is available at http://www.w3.org/TR/xml-id/.
[XML-NS10]
Namespaces in XML 1.0 (Second Edition), T. Bray et al., Editors. World Wide Web Consortium, 16 August 2006. This version of the XML Namespaces Recommendation is http://www.w3.org/TR/2006/REC-xml-names-20060816/. The latest version is available at http://www.w3.org/TR/xml-names/.
[XML-NS11]
Namespaces in XML 1.1, T. Bray et al., Editors. World Wide Web Consortium, 4 February 2004. This version of the XML Namespaces Recommendation is http://www.w3.org/TR/2004/REC-xml-names11-20040204/. The latest version is available at http://www.w3.org/TR/xml-names11/.
[XML-SCHEMA-1]
XML Schema Part 1: Structures Second Edition, H. S. Thompson, et al., Editors. World Wide Web Consortium, 28 October 2004. This version of the XML Schema Part 1 Recommendation is http://www.w3.org/TR/2004/REC-xmlschema-1-20041028/. The latest version is available at http://www.w3.org/TR/xmlschema-1/.
[XML-SCHEMA-2]
XML Schema Part 2: Datatypes Second Edition, Paul V. Biron and Ashok Malhotra, Editors. World Wide Web Consortium, 28 October 2004. This version of the XML Schema Part 2 Recommendation is http://www.w3.org/TR/2004/REC-xmlschema-2-20041028/. The latest version is available at http://www.w3.org/TR/xmlschema-2/.

6.2 参考情報の参考文献

[DC]
Dublin Core Metadata Initiative.
See http://dublincore.org/.
[DC-ES]
Dublin Core Metadata Element Set, Version 1.1: Reference Description.
See http://dublincore.org/documents/dces/.
[DICT]
Dictionary.com Unabridged (v 1.0.1), Dictionary.com. Based on the Random House Unabridged Dictionary, c Random House, Inc. 2006. Entries in the dictionary are available at http://dictionary.reference.com.
[HTML]
HTML 4.01 Specification, Dave Raggett, et al., Editors. World Wide Web Consortium, 24 December 1999. This version of the HTML 4.01 Recommendation is http://www.w3.org/TR/1999/REC-html401-19991224/. The latest version of HTML is available at http://www.w3.org/TR/html/.
[IPA]
International Phonetic Association.
See http://www.arts.gla.ac.uk/IPA/ipa.html for the organization's website.
[IPAUNICODE1]
The International Phonetic Alphabet, J. Esling. This table of IPA characters in Unicode is available at http://web.uvic.ca/ling/resources/ipa/charts/unicode_ipa-chart.htm.
[IPAUNICODE2]
The International Phonetic Alphabet in Unicode, J. Wells. This table of Unicode values for IPA characters is available at http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm.
[JEIDAALPHABET]
JEIDA-62-2000 Phoneme Alphabet. JEITA. An abstract of this document (in Japanese) is available at http://it.jeita.or.jp/document/publica/standard/summary/JEIDA-62-2000.pdf.
[JEITA]
Japan Electronics and Information Technology Industries Association.
See http://www.jeita.or.jp/.
[RDF-CONC]
Resource Description Framework (RDF): Concepts and Abstract Syntax, G. Klyne and J.J. Carroll, Editors. World Wide Web Consortium, 10 February 2004. This version of the RDF Concepts and Abstract Syntax is http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/. The latest version is available at http://www.w3.org/TR/rdf-concepts/.
[RDF-SCHEMA]
RDF Vocabulary Description Language 1.0: RDF Schema, D. Brickley and R. Guha, Editors. World Wide Web Consortium, 10 February 2004. This version of the RDF Schema Recommendation is http://www.w3.org/TR/2004/REC-rdf-schema-20040210/. The latest version of RDF Schema is available at http://www.w3.org/TR/rdf-schema/.
[RDF-XMLSYNTAX]
RDF/XML Syntax Specification, D. Beckett, Editor. World Wide Web Consortium, 10 February 2004. This version of the RDF/XML Syntax Recommendation is http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/. The latest version of the RDF XML Syntax is available at http://www.w3.org/TR/rdf-syntax-grammar/.
[REQS]
Pronunciation Lexicon Specification (PLS) Version 1.0 Requirements, P. Baggia and F. Scahill, Editors. World Wide Web Consortium, 29 October 2004. This document is a work in progress. This version of the Pronunciation Lexicon Requirements is http://www.w3.org/TR/2004/WD-lexicon-reqs-20041029/. The latest version of the Pronunciation Lexicon Requirements is available at http://www.w3.org/TR/lexicon-reqs/.
[RFC2732]
Format for Literal IPv6 Addresses in URL's, R. Hinden, et al., Editors. IETF, December 1999. This RFC is available at http://www.ietf.org/rfc/rfc2732.txt.
[SAMPA]
SAMPA computer readable phonetic alphabet, J.C. Wells.
See http://www.phon.ucl.ac.uk/home/sampa/home.htm for information on it.
[SISR]
Semantic Interpretation for Speech Recognition (SISR) Version 1.0, Luc van Tichelen and Dave Burke, Editors. World Wide Web Consortium, 5 April 2007. This version of the SISR 1.0 Recommendation is http://www.w3.org/TR/2007/REC-semantic-interpretation-20070405/. The latest version is available at http://www.w3.org/TR/semantic-interpretation/.
[SSML-11]
Speech Synthesis Markup Language (SSML) Version 1.1, Daniel C. Burnett and 双志伟 (Zhi Wei Shuang), Editors. World Wide Web Consortium, 20 June 2008. This version of the SSML 1.1 Working Draft is http://www.w3.org/TR/2008/WD-speech-synthesis11-20080620/. The latest version is available at http://www.w3.org/TR/speech-synthesis11/.
[VXML]
Voice Extensible Markup Language (VoiceXML) Version 2.0, Scott McGlashan et al., Editors. World Wide Web Consortium, 16 March 2004. This version of the VoiceXML 2.0 Recommendation is http://www.w3.org/TR/2004/REC-voicexml20-20040316/. The latest version is available at http://www.w3.org/TR/voicexml20/.
[XHTML2]
XHTML 2.0, J. Axelsson et al., Editors. World Wide Web Consortium, 22 July 2004. This version of the XML XHTML 2.0 Working Draft is http://www.w3.org/TR/2004/WD-xhtml2-20040722/. The latest version is available at http://www.w3.org/TR/xhtml2/.
[XHTML-MTYPES]
XHTML Media Types, Ishikawa Masayasu, Editor. World Wide Web Consortium, 1 August 2002. This version of the W3C Note is http://www.w3.org/TR/xhtml-media-types/xhtml-media-types.html. The latest version is available at http://www.w3.org/TR/xhtml-media-types/.
[XPOINTER]
XPointer Framework, P. Grosso, E. Maler, J. Marsh, N. Walsh. World Wide Web Consortium, 25 March 2003. This version of the XPointer Framework Recommendation is http://www.w3.org/TR/2003/REC-xptr-framework-20030325/. The latest version is available at http://www.w3.org/TR/xptr-framework/.
[X-SAMPA]
Computer-coding the IPA: a proposed extension of SAMPA, J.C. Wells, University College London, 28 April 1995. This version is available at http://www.phon.ucl.ac.uk/home/sampa/ipasam-x.pdf.
[WEB-ARCH]
Architecture of the World Wide Web, Volume One, I. Jacobs, N. Walsh, World Wide Web Consortium, 15 December 2004. This version of the Architecture of World Wide Web Recommendation is http://www.w3.org/TR/webarch/.

7. 貢献者および謝蟞

この仕様をより良いものにするために、アむデア、コメント、フィヌドバックおよび実装経隓を提䟛しおくださった貢献者は次の方々ですアルファベット順に蚘述。

Jeff Adams, Nuance
Kazuyuki Ashimura, W3C
Patrizio Bergallo, Loquendo
Ellen Eide, IBM
Max Froumentin, W3C
Richard Ishida, W3C
严å³» (Yan Jun), iFLYTEK
Matt Oshry, Microsoft
Dave Pawson, RNIB
Luc Van Tichelen, Nuance

線集者は、有甚なコメントに察し、WAIずWAI/PF、I18NずMMIのW3Cグルヌプに感謝を衚したす。

この仕様は、次の方々の協力によっお䜜成されたしたアルファベット順に蚘述。

Debbie Dahl, Conversational Technologies
Ken Davies, HeyAnita
Kurt Fuqua, Vail Systems
Will Gardella, SAP
Makoto Hirota, Canon
Jim Larson, Intervoice
Dave Raggett, W3C/Volantis
Matt Womer, W3C

付録A - 発音蟞曞仕様甚スキヌマ

この項は芏範的です。

PLSドキュメントを怜蚌するために䜿甚できるスキヌマが2぀ありたす。
スキヌマの最新バヌゞョンは、以䞋にありたす。

安定性のために、日付が付䞎されおいる䞋蚘のURIを甚いるこずを掚奚したすRECOMMENDED。

付録B - MIMEタむプずファむル拡匵子

この項は芏範的です。

発音蟞曞仕様に関連するメディア・タむプは「application/pls+xm」で、ファむル名の拡匵子は[RFC4267]で定矩されおいる「.pls」です。

付録C - 字句コンテンツの怜玢における課題

この項は参考情報です。

PLSドキュメントを甚いる読み䞊げアプリケヌションには、適切な字句の内容を怜玢できるメカニズムが必芁です。最もシンプルなケヌスでは、アプリケヌションは正確に入力デヌタず䞀臎する内容を持぀<grapheme>芁玠を埗るためにPLSドキュメントを怜玢し、察応する語圙玠をすべお怜玢するでしょう。しかし、䞀般に、字句の内容の怜玢はそれほど簡単ではありたせん。完党䞀臎が䜕で構成されるか、たた、矛盟する耇数の䞀臎が圓おはたる可胜性がある堎合にはどの語圙玠を怜玢すべきかを定矩する必芁がありたす。

ここで、適切な字句の内容を怜玢する方法の䟋を玹介したす。

ここで抂説したアプロヌチは、䞻に英語における必芁事項を念頭に眮いお䜜成されおおり、他の蚀語の特定の芁件に合わせお修正すべきです。

PLSドキュメントを甚いるアプリケヌションは、字句の内容を怜玢する際に採甚するアプロヌチを蚘述するこずを掚奚したす。

䟋:

次のPLSドキュメントを甚いるアプリケヌションは、

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" xml:lang="en-US">
  <lexeme>
    <grapheme>New York</grapheme>
    <alias>NY</alias>
  </lexeme>
  <lexeme>
    <grapheme>York   City</grapheme>
    <alias>YC</alias>
  </lexeme>
</lexicon>

䞊蚘のアプロヌチを甚いる堎合、「New   York City」を「New   YC」ではなく「NY City」ずしお凊理すべきです。

付録D - 曎新

この項は参考情報です。

このドキュメントにおける曎新

勧告案2008幎8月18日における倉曎:

勧告候補2007幎12月12日における倉曎:

2番目の最終草案2006幎10月26日における倉曎:

最初の最終草案2006幎1月31日における倉曎: