パソコンが

 

 

 

しゃべる

 

 

 

201479

 

国分芳宏著

 

kokubu@gengokk.co.jp

 


 

目 次

 

 1 声による情報伝達の特徴

 

2.何に使うか

2.1 カーナビや警報装置

2.2 視覚障害者の入出力装置に

2.3 音声による読み合わせ校正

2.4 子供や外国人への伝言

2.5 教育に

2.6 電話と組み合わせて

 

3.音の波形

 3.1 母音の波形 「ア」と「イ」は何が違うか

     スペクトルフォルマント

 3.2 子音の波形 「カ」と「サ」は何が違うか

 3.3 ニッポン」の波形

 

4.仮名文字と発音

4.1 仮名文字と発音との違い

     行・段モーラ)、

4.2 母音半母音拗音

4.3 子音調音部位鼻音破裂音摩擦音破擦音はじき音有声音無声音特殊音素発音の行間の交差口蓋化

4.4 異音音素の相互干渉無声化口濁音鼻濁音連濁長音撥音母音促音流音擬音語和語

 

5.アクセントとイントネーション

5.1 アクセント

     アクセント核アクセント型平板形中高形頭高形尾高形アクセント核の移動

     活用形による移動助数詞の読みとアクセント

5.2 イントネーション

    プロミネンス顔文字

 

6.テキストを読みあげるには

固有名詞表記の揺れアルファベットの読みあげ数字の読みあげ話し言葉と書き言葉とのズレ

 

 7.今後の展開

 

エピソード

  「イェ」の仮名

  イェ、スィ、ティ、トゥ

  「アカサタナ」の順序

  関西方言と無声化

  ハンドバック

  ビデオの早送り

  接尾辞の「人」

  共通語と関西方言

  顔文字

 

付録 点字

 

索引


 

はじめに

 音声は人が情報を伝える最も基本的な手段です。目はまぶたで閉じられますが、耳は閉じられません。眠っている人にも音声で危険を伝えられます。人は生まれてしばらくは話し言葉だけで意志を伝えます。文字によって情報を伝えられるようになるのは学校に入ってからです。現在でも世界には文字をまったく持たない民族がいて、音声だけで問題なく生活しています。

 本書は音声についてその原理、技術、応用法について述べたものです。漢字仮名交じり文から音声の情報に変換することについても述べましたが、同じ問題があるので点字についても触れました。

 近年パソコンで音声が伝えられるようになりました。そこでの課題について述べます。

 

謝辞

 本書を執筆するにあたって音声についてご指導をいただき、またデータを用意していただきました東京外国語大学の益子幸江先生およびNHK放送技術研究所の音響技術研究部の皆様に心からに感謝いたします。

 

 

1 声による情報伝達の特徴

 音声は大勢の人に同時にかつ強制的に情報を伝えることができるという大きな特徴を持っています。人間の自己防衛のためもあって、聴覚のほうが視覚よりも速く脳に伝わるそうです。視覚情報は目に入ったあと脳内での処理の時間が入るので、0.1秒程度の遅れがあるそうです。緊張感など細かいニュアンスをつけて伝えることができます。自動車の運転など他の作業をいている人にも、子供にも伝えることができます。

 

 その反面、声では書き物ほどには緻密な情報は送れません。学校で授業を聞いていたときを思い出してみると分かるのですが授業の内容が理解できるうちは目は教師の方に向いていても、難しいところにきて分かりにくくなると目は教科書の方に向いてしまっていました。

 音声は長い情報を伝えるのもあまり得意ではありません。書き物だと斜め読みができますが、音声では順を追って聞いていかなければなりません。またどんなに早くしゃべっても1秒間に平仮名で8文字程度、普通は5文字程度しかしゃべれません。たとえば、このページ全部を読み上げるとすると3分ぐらいかかってしまうでしょう。

 

 ここで音声による情報伝達の長所と短所を整理してみましょう。

[長所]

・暗いところや寝ている人にも伝えることができる。

・他の作業をしていて目が離せない人にも強制的に伝えることができる。

・大勢の人に一度に伝えることができる。

・感情やニュアンスをつけて伝えることができる。

・子供や外国人など字が読めない人にも伝えることができる。

[短所]

・長文や詳細な情報を伝えるには時間がかかりすぎて、しかも不正確。

 (文字情報は斜め読みができる)

・記録が残らない。

・聞きなおしにくい。

 (文字情報は読み返しが簡単)

・騒音の多いところでは使えない。

 

聞く人の知識記憶の影響

 日本人には「ワンワン」と聞こえる犬の鳴き声もイギリス人、フランス人、アメリカ人とその話す言葉によって異なります。

 

 関東育ちの筆者が名古屋の名鉄のホームで電車を待っていたときのことです。駅のスピーカーから「まもなく1番線にシンジュク行きの電車がまいります」という声が聞こえてきました。名古屋にも「新宿」という地名があるのかと思っていると、到着した電車の行先表示板には「新岐阜」と書いてありました。どうも人は自分の記憶した言葉や音に当てはめて聞いているようです。


2.何に使うか

 ワープロで入力したテキストを読みあげる音声合成装置が実用化しました。これまでの録音した音をそのまましゃべらせる方式では一部でも変更があったときに全ての音を録音し直す必要がありました。音を保存するためのデータ量は1000分の1になります。どのような場所で使うかを考えてみましょう。

 

2.1 カーナビや警報装置

 カーナビゲーションシステムでは運転者がディスプレーを見るわけにはいかないので音声で教えています。詳細な数値などを運転者に伝えるときに音声合成装置を使います。運転に限らず光学装置をのぞきながら操作をする場合や、視覚で検査をしている場合のように目が他の目的で使われている人に指示をしたり、警報を発したりするのに有効な方法です。

警報装置

 音声は大勢の人に同時に強制的にメッセージを伝えることができます。この性質を利用して、警報システムに応用が考えられます。これまでもブザーやアラーム音が警報に使われています。ブザーなどでは異常があったことしか伝えられません。音声合成を使えば障害の起きた場所やその内容までをもっと具体的に伝えられます。例えば製造ラインである部分のパーツが切れそうで補給する必要があるという警報を伝える場合を考えてみます。ブザーなどによる警報装置では全ての人に伝わってしまいます。悪くすると全ての人が作業を中断して障害の内容を調べることになります。音声合成を使えば具体的にどこの場所のパーツが切れたかを伝えられます。その場所の担当者だけが、パーツを持って障害の場所へ行って補給すれば済みます、ほかの人は作業を中断されません。

 

 また、状況によって警報の内容を簡単に変えることができます。例えばホテルの火災警報総理に用いると、出火場所やその日の風向きなどを考慮して一番安全な避難経路を伝えることができます。

 

オフィスで

 パソコンを使っている人にパソコンから音声で情報を伝える場合について考えてみましょう。文字の情報は斜め読みができますが、音声は逐次的にしか送れません。ファイル一覧を音声で読み上げるのは時間がかかりよい方法ではありません。音声は「そろそろディスクがいっぱいになります」などというユーザーに判断をまかせる予防的なメッセージを伝えるのに向いています。ユーザーは作業が終了しそうなら警告を聞き流してそのまま作業を続けます。終わらせてからディスクの整理をします。一方まだ作業がたくさん残っているのなら、いったん作業を中断し、ディスクを整理してから残った作業をします。

 いつもパソコンの前に無言で座ったきりで、とかく雰囲気が暗くなりやすいパソコンルームが声が出ることで少しは明るくなるかもしれません。

 

2.2 視覚障害者の入出力装置に

 もう30年ぐらい前から視覚障害者のかたが原稿起こしに実際に使い始めました。漢字ごとに固有の読み方を決めておきます。キーボードを打った文字を固有の読み方で読みあげる装置を用意します。会議などの議事進行を録音したテープから議事録を作る仕事し使っていました。片方の耳に議事を録音した音声を聞きながら、もう片方の耳にキーボードを打った文字を読みあげて入力しました。6点の点字をキーボード上のFDSのキーとJKLのキーに割り当ててあります。指の位置を動かす必要がないので速い速さで入力できます。熟練した人は我々では理解できないような速さの音で入力していました。

 視覚障害者は点字で情報を得ていますが、点字ではB5版の紙1枚に裏表印刷しても、仮名で数えて千文字程度しか印刷できません。点字印刷物は凸凹があって紙が厚くなるので、我々が使っているポケットサイズの辞書でも本棚を何段も占有してしまいます。これをCD-ROMファイルにしておいて必要なときに読みあげるようにすれば1枚ですみます。

 この装置を使って視覚障害者と聴覚障害者が会話をしたという話を聞いたことがあります。視覚障害者から、聴覚障害者へ話を伝えるには視覚障害者が音声付きのパソコンで入力します。音声付きのパソコンは打った文字を画面にも表示するので、聴覚障害者はその画面を見て理解します。聴覚障害者は、発話はできるので視覚障害者へは普通の声で話をします。このようにして双方向の情報の伝達ができ、会話が成り立ちました。

 

声帯障害者に

 声帯に障害があって発話できない人が音声合成装置を発声代替装置として使っている例がありました。よく使う文章は前もって用意しておいて、その文にカーソルを合わせてしゃべらせます。それ以外の文章をしゃべらせたいときは、少し手間がかかりますがその場で入力してしゃべらせるのだそうです。

 規則音声合成装置を最初に作った人は、アメリカのMIT(マサチューセッツ工科大学)にいたデニス・クラットという声帯に障害のある教授です。学生の質問に規則音声合成装置を使って答えていたそうです。

 

2.3 音声による読み合わせ校正

 パソコンに読ませて校正ができます。パソコンに読ませて聞いてみると自分が書いた文章が客観的に聞けて、説明不足や、論理的な飛躍に気が付くことがあります。無機的な数字の読み合わせには有効な手立てとなるでしょう。漢字OCRで読み取ったデータは工業の「工」と片仮名の「エ」のように字形の似かよった文字の読み違えをときどき見受けます。このような文字の読み違えは人間に校正させても読み違えが防ぎにくいでしょう。しかし、音声で聞いてみると読み違いがはっきり分かります。

 

2.4 子供や外国人への伝言

 最近町でよく外人を見かけます。ある職場では70パーセントを外人が占めているそうです。話し言葉は分かるけれど文字を読めないという外国人が相当います。特に漢字が読める外国人はそれほど多くないでしょう。こういった人たちへの伝言も音声合成装置によってスムーズにできます。

 

2.5 教育に

 哲学のように考え方を教えたりする教育にはパソコンはあまり役にたたないでしょう。このような教育にはむしろ書籍の方がむいています。しかし決まった操作を覚えさせるための訓練には音声合成装置がついたパソコンが威力を発揮します。例えばソロバンや掛け算の九九を覚えるというような繰り返しの多い訓練には有効でしょう。

 日本語を勉強している外国人が大勢います。日本語を教えている外国人の教師に合成装置で作った音を実際に聞いてもらったら、「教育用に十分に使える」と言っていました。ちなみに日本語を教えている日本人の教師に聞いてもらいましたがこちらの答えは「使い物にならない」とのことです。

 日本語の英語教育は発音や聞き取りの教育が遅れているといわれています。外国での日本語教育も同じようなものだそうで、日本に来て始めて聞き取りや発音の訓練を受けたという話も聞きました。外国で日本人のいないところでの日本語教育には、ある程度の効果が期待できるのではないでしょうか。特にアクセントの教育にはどんな本より効果的でしょう。

 

2.6 電話と組み合わせて

 電話は音声だけの世界で、音声合成装置が効果的に利用できる分野です。

 スマホの画面と組み合わせて時々刻々変わる情報を電話で聞くというサービスが考えられます。耳で聞きながらの「ながら歩き」はスマホを見ながらのながら歩きに比べて危険が少ないでしょう。

3.音の波形

 音の波形を調べながら人は声をどのようにして理解しているのかを調べてみましょう。

 

3.1 母音の波形「ア」と「イ」は何が違うか

 人間の声には「音の高さ」のほかに「ア」「イ」「ウ」などの「音の違い」の2つの要素があります。

まず母音「ア」と「イ」の波形を比べてみましょう。

「ア」の波形

 

「イ」の波形

 

発声している口を前から見ると「イ」の音のときは口を横に広げます。その結果口の上下方向に狭くなり、左右方向に広くなります。上下方向に共振した結果の早い(細かい)波と、左右方向に共振した結果の遅い(長い)波とが交ざっています。

「ア」の方は「口」大きく開けて左右と上下の差があまりないので中程度の長さの波が重なっています。

この違いは音のスペクトル(周波数成分に分けてその成分ごとの強さ)を比較してみればよく分かります。横軸が周波数で、縦軸が強さです。少し分かりにくいのですが黒い線の一番低いピークが基本周波数です。スペクトルの包絡線(赤い曲線)があります。この包絡線は人の口の中の形によって決まるものです。ピークのところをフォルマントと言います。フォルマントは低い方から第1フォルマント、第2フォルマントと呼びます。

 

                                   

  「ア」のスペクトル           「イ」のスペクトル

 

「ア」のスペクトルでは第1フォルマントと第2フォルマントの間隔が狭く、「イ」のスペクトルでは間隔が広いことが分かります。

 人はこの第1フォルマントと第2フォルマントが1キロヘルツのあたりにあることで男声の「ア」であることを認識しています。音の高さを高くするために録音の再生速度を上げると、音は高くなるのですが、フォルマントの周波数が変わってしまいます。子供の声のようになってしまいます。声の速さが2倍以上になると、もはや何を言っているのか分からなくなります。イントネーションやアクセントの変化で声の高さを変えるには、フォルマントの高さ、言い換えるとスペクトル図の包絡線を変えずに基本周波数を変える必要があります。


 

下の写真はバイオリンの音のスペクトルで音の高さが高くなると一様に小さくなっていきます。フォルマントのようなものはありません。再生する速さを変えるとそのまま高さが変わります。

 

 

 

 今度は「アイウエオ」と順に発音した音を縦軸を周波数に、横軸を時間にして見みてみます。音の強さ(スペクトル図で縦軸)を色で示します。青、黄色、赤の順で強さが強いことを示しています。このグラフを「サンドスペクトログラム」と言います。ここでも「ア」の音は1000Hzのあたりに第1フォルマントと第2フォルマントとが接近しています。「イ」の音は第1フォルマントと第2フォルマントとが離れています。

 

       ア      イ     ウ      エ      オ

 

このグラフは人の口腔や鼻腔の形を反映するので「声紋」とも呼ばれ個人識別にも使われます。


 

次に「アイウエオ」の音の第1フォルマントを横軸に、第2フォルマントを縦軸にして両対数軸の平面にマッピングして見ます。きれいな5角形になります。

 上の図は男性の声で下の図は女性の声です。

 

(NHK アナウンス実践トレーニングNHK出版編より)

 

 

 母音の数(カコミ)

 日本語の母音の数は5種類ですが、英語は11種類あるそうです。英語の音の第1、第2フォルマントで決まる点も、「アイウエオ」の5つの点で示す円の上にあるそうです。

 


3.2 子音の波形 カ」と「サ」は何が違うか

 次に子音について調べます。ここでも波形を見ますが、母音の波形のところで見たものより、時間軸を縮めて表示してあります。

 

          カ              サ

 

典型的な子音の例として「カ」と「サ」の波形を比べてみます。「カ」の音は喉の奥での息の破裂のあと「ア」の音になります。一方「サ」の音は舌と上あごの間からしばらく息が漏れる音が続いた後「ア」の音になります。

 

           カ               ガ

今度は「カ」と「ガ」とを比べてみます。両方とも喉の奥で息が破裂しますが、「カ」は破裂した後しばらく音がなくなります。しかし「ガ」のときはすぐに音がでます。ここで「カ」と「ガ」とが区別されているのでしょう。

3.3 「ニッポン」の波形

         N I   P    P O N 

 「ニッポン」と言った音の波形です。「ニ」を発声した後、「P」の音のために、急いで唇を閉じて「P」の音の準備をしています。破裂する前に音のない時間があるのが分かります。

 

         N I   P   P O N 

「ニッポン」と言った音のサンドスペクトログラムです。「O」から「N」に滑らかに移行しています。

 


4.仮名文字と発音

 仮名文字はもともと、日本語の発音を表すための文字だったのでしょうが、長い間に仮名文字と実際の発音(音素)との間にずれが生じています。

 

 仮名表記と発音との違い

  助詞 「は」 → ワ

  助詞 「へ」 → エ

  助詞 「を」 → オ(方言によっては「ウォ」と発音します。)

 

お段、う段の後の「う」 → 長音

  例  「こうし」格子  → コーシ

  例外 「こうし」子牛  → コウシ 

 

い段、え段の後の「い」  → 長音

  例  「ていたい」停滞  → テータイ

  例外 「ていたい」手痛い → テイタイ

 注意 「なげいた」嘆いた → ナゲイタ

  活用語尾は長音になりません。

 

行・段

 習慣で、カ行(同種類の子音)、イ段(同種類の母音)などという言い方がありますが、ここでもこれに従うことにします。「表1参照 音声的な特徴に注目して整理した音の種類」を参照してください。

 

 発音上に単位で、拍または、モーラといいます。日本語は拍がしっかりした言語です。キャ、キュ、キョなどの拗音は仮名小文字とまとめて1拍に数えます。ただし、促音(つまる音の ッ)は1つの拍として数えます。

 

音の種類

 五十音表の文字にあたるものです。五十音は濁音、拗音を1種類にして数えたものです。実際の音の種は約210種類あります。これは、濁音、拗音を別の音として扱うためです。

日本語の音の種類を説明します。実際の音は前後の音の影響で微妙に変わります。

 

 

 

4.2 母音

 日本語に母音は、次の5種類があります。次の半母音を含めて13種類あります。音を説明するためにローマ字を併記します。

ア行(母音)

A

I

U

E

O

 

 半母音

 イから始まる半母音(ヤ行)と、ウから始まる半母音(ワ行)とがそれぞれ4種類あります。○を書いたところの音はありません。子音のあとに半母音がついたものを拗音とよびます。

ヤ行、ワ行(半母音)

イェ

YA

 

YU

YE

YO

ウィ

ウェ

ウォ

WA

WI

 

WE

WO

 

 ワ行の「ヰ(ウィ)、ヱ(ウェ)、ヲ(ウォ)」の音はもともと一つの音として認められていたのでしょうが、一時期日本語の発音からなくなっていました。そのためこれらの文字も廃字になっています。「を」は助詞として残っていますが発音は「オ」になっています。方言によってはいまだに「ウォ」と発音されています。音自体は近年外来語の影響で一部復権しました。表記はまだウイ、ウエと書いてあります。

  例  ハイウェー  ハイウエー   

     ウェブ    ウエブ     

 最近Webの発音はウェブで落ち着いたようで新聞でもこの表記を用いています。

 

エピソード

「イェ」の仮名

ワ行の「ワ、ヰ、ヱ、ヲ」、ヤ行の「ヤ、ユ、ヨ」には仮名文字があったのに、エ段の拗音「イェ」になぜ仮名がなかったのか不思議です。カタカナ語の辞書を引くときに「イェ」の項目は「ユ」の後ろと思って探してしまいの順序が考えているのと異なるため戸惑うことがあります。


 

テキスト ボックス:  表1 音声的な特徴に注目して整理した音の種類
    ア段 イ段 ウ段 エ段 オ段 ヤ段 口蓋化ユ段 イェ段ヨ段 ワ段 ウィ段ウェ段ウォ段
ア行  ア  イ  ウ  エ  オ  ヤ     ユ  イェ ヨ  ワ  ウィ ウェ ウォ 母音・半母音
カ行  カ  キ  ク  ケ  コ  キャ    キュ キェ キョ クヮ クィ クェ クォ 喉の奥の破裂で出る無声音
ガ行  ガ  ギ  グ  ゲ  ゴ  ギャ    ギュ ギェ ギョ グヮ グィ グェ グォ 喉の奥の破裂で出る有声音
サ行  サ  スィ ス  セ  ソ  シャ シ  シュ シェ ショ スヮ スィ スェ スォ  歯茎と舌との間で出す無声摩擦音
ザ行  ザ  ズィ ズ  ゼ  ゾ  ジャ ジ  ジュ ジェ ジョ ズヮ ズィ ズェ ズォ  歯茎と舌との間で出す有声摩擦音
タ行  タ  ティ トゥ テ  ト  テャ    テュ テェ テョ             歯茎の内側と舌で出す無声摩擦音
ダ行  ダ  ディ ドゥ デ  ド  デャ    デュ デェ デョ             歯茎の内側と舌で出す無声摩擦音
ツァ行 ツァ ツィ ツ  ツェ ツォ チャ チ  チュ チェ チョ             口蓋と舌で出す無声破擦音
ナ行  ナ  ニ  ヌ  ネ  ノ  ニャ    ニュ ニェ ニョ ヌヮ ヌィ ヌェ ヌォ 歯を閉じて出す有声鼻音
ハ行  ハ  ヒ     ヘ  ホ  ヒャ    ヒュ ヒェ ヒョ             声門の摩擦で出す無声摩擦音
バ行  バ  ビ  ブ  ベ  ボ  ビャ    ビュ ビェ ビョ ブヮ ブィ ブェ ブォ 両唇で出す有声破裂音
パ行  パ  ピ  プ  ペ  ポ  ピャ    ピュ ピェ ピョ プヮ プィ プェ プォ 両唇で出す無声破裂音
マ行  マ  ミ  ム  メ  モ  ミャ    ミュ ミェ ミョ ムヮ ムィ ムェ ムォ 唇を閉じて出す有声鼻音
ラ行  ラ  リ  ル  レ  ロ  リャ    リュ リェ リョ ルヮ ルィ ルェ ルォ 歯茎をはじく音
ファ行 ファ フィ フ  フェ フォ フャ    フュ    フョ             両唇の無声破擦音 
ヴァ行 ヴァ ヴィ ヴ  ヴェ ヴォ ヴャ    ヴュ    ヴョ             上唇と歯で出す有声破裂音。
長音  ー
促音  ッ
撥音  ン

 


タ行、ダ行、ツァ行、ファ行、ヴァ行のワ段、ウィ段、ウェ段、ウォ段の音はあるのかも知れませんが書かれたものはあまり目にしません。

 

4.3 子音

 本書では14行(ヴァ行を含めると15行)の音を子認めています。

 各行に、直音5種類、拗音8種類の計13種類の音があります。

 例えばカ行の場合は

直音

KA

KI

KU

KE

KO

 

キャ

キュ

キェ

キョ

拗音

KYA

 

KYU

KYE

KWO

 

クァ

クィ

クェ

クォ

拗音

KWA

KWI

 

KWE

KWO

 

 

子音の特徴

 表1の各行の子音の特徴を調音(音の出し方)で分類しましました。語頭にあるときと、語中にあるときとで異なるものがあります。

 

調音部位

 子音の調音のために口腔内で空気の流れを妨げる部位のことを言います。その位置によって子音が違います。

 

鼻音

 呼気が同時に鼻腔へも抜け、鼻腔の共振を伴う音です。

 

破裂音

 口腔内の調音部位で閉鎖を作って気流が逃げないようにしたあと、一気に開放したときの音です。

 

摩擦音

 口腔内の調音部位で狭い隙間を作って空気の流れを遮り、小さな隙間から空気を出したときの摩擦の音です。

 

破擦音

 口腔内の調音部位で閉鎖を作って気流が逃げないようにしたあと、一気に開放したあと空気を出したときの音です。

 

はじき音

 舌で上顎部の調音部位を軽くはじくときの音です。

 

無声音

 子音を発声する瞬間に声帯の振動を伴わない音です。

有声音

 子音を発声する瞬間に声帯の振動を伴う音です。

特殊音素

 次の4つの音を特殊音素と呼ぶことにします。音の長さがやや短いことやアクセント核が来ないなどの特徴があります。

  撥音(ン)

  促音(ッ)

  長音(ー)

  語頭以外の(イ) 二重母音になります。

 

表2 子音の各行の特徴を整理して表にまとめました。

 

調音部位

歯茎音

軟口蓋音

声門音

鼻音

有声音

マ行

ナ行

ガ行 注1

 

破裂音

 

無声音

有声音

パ行

バ行

タ行

ダ行

カ行

ガ行 注2

 

摩擦音

 

無声音

有声音

ファ行

ヴァ行

サ行

ザ行 注3

 

ハ行

破擦音

 

無声音

有声音

 

ツァ行

ザ行 注4

 

 

はじき音

有声音

 

ラ行

 

 

  注1 鼻濁音の音

  注2 口濁音の音

  注3 語中の音とき

  注4 語頭の音とき

 

発音の行間の交差

 表1は、実際の発音の特徴によって分類した日本語の音の表です。

 ヘボン式ローマ字表記は外国人が日本人の発声を客観的に聞いていたためか、音声的な特徴に忠実に表現してあります。音声的な特徴に注目して整理するにはローマ字で書いた方がすっきりします。ここで書いたローマ字はヘボン式のローマ字とは少しずれています。

 

口蓋化

 特に摩擦音のイ段は舌が上あごに近づいて調音部位が変わるため、表1の上の位置がいわゆる五十音表とは異なります。

 

サ行

スィ

SA

SI

SU

SE

SO

シャ

シュ

シェ

ショ

SYA

SHI

SYU

SYE

SWO

スヮ

スィ

スェ

スォ

SWA

SWI

 

SWE

SWO

 

 もともとサ行の音は舌先と上あごの間の摩擦音SIですが、シの音で舌の中央が上あごに近づくため調音部位の移動(口蓋化)が起こって、SHIの音に変わります。

 

ザ行(有声摩擦音)

ズィ

ZA

ZI

ZU

ZE

ZO

ジャ

ジュ

ジェ

ジョ

ZYA

ZHI

ZYU

ZYE

ZYO

ズヮ

ズィ

ズェ

ズォ

ZWA

ZWI

 

ZWE

ZWO

 ジの音とヂの音はシの音と同じような調音部位の異動が起こります。

 ザ行の音は語頭または特殊音素(撥音、促音、長音)の直後では、有声破擦音ですがそれ以外では有声摩擦音になります。

 

ダ行(有声破裂音)

ディ

ドゥ

DA

DI

DU

DE

DO

デャ

デュ

デェ

デョ

DYA

 

DYU

DYE

DYO

 元来ジとズの音は有声摩擦音で、ヂとヅの音は有声破擦音です。現在はダ行のヂヅの音とザ行のジズの音は、両方ともジズと書いて音の上でも区別していません。むしろ語頭のときと撥音の後ろのときは有声破擦音で、語中のときは有声摩擦音になります。方言によってはジ-ヂ、ズ-ヅの音を別の音として意識して元来の音で発音し、カナ書きをするときも区別しています。

 

タ行とツァ行:

ティ

トゥ

TA

TI

TU

TE

TO

テャ

テュ

テェ

テョ

TYA

 

TYU

TYE

TYO

ツァ

ツィ

ツェ

ツォ

TSA

TSI

TSU

TSE

TSO

チャ

チュ

チェ

チョ

CHA

CHI

CHU

CHE

CHO

 ここでもツの音とチの音とはと同じような調音部位の異動が起こります。

 ツの音は破擦音のTSの音になります。

 チの音は調音部位がさらに後方に下がってCHの音になります。

 

ハ行とファ行

HA

HI

 

HE

HO

ファ

フィ

フェ

フォ

FA

FI

FU

FE

FO

 ハ行の音は声門で出す摩擦音ですが、フの音だけは唇で発音します。

 

 ヴァ行 表記上は見かけますが、実際の発音はバ行と変わりません。

 

 

 エピソード

 イェ、スィ、ティ、トゥ

イェ、スィ、ティ、トゥの4つの音は音に忠実なヘボン式ローマ字で書くと簡単なのですがカタカナでは書き方が複雑です。この4つの音に新たな仮名文字を定義して普及させてはいかがでしょうか。

 

 エピソード

「アカサタナ」の順序

 子音の「アカサタナハマヤラワ」は何の順序か考えたことがありますか。これは音声を発声する点(調音部位)が口の奥から前に移動する位置の順なのです。「カ」は喉の奥で発声します。「サ」は上あごと舌の先で発声します。「タ」は歯茎と舌で発声します。「ナ」も歯茎と舌で発声します。「ハ」はもともとは「パ」の発音でした。両方の唇で発声します。「マ」も両方の唇で発声します。「ラ」は半母音の一種だったのだそうです。「ア」「ヤ」「ワ」は母音・半母音です。

 

 

4.4 異音

 1つの音を発音したときに口の中は次の音の準備をしています。そのための実際に発音される音は前後の音の影響で変わります。仮名で書くと同じ文字の音が、実際の発音では前後の音との音素の相互干渉により変化することを異音といいます。

 

ガ行(口濁音鼻濁音

 原則的には語頭にあるときと擬音語のときは口濁音に、それ以外の時は鼻濁音になります。ただし、語頭にあってももともとガ行の音であったものは鼻濁音になりません。

 日本(ニッポン)+銀行(ギンコー)→東京銀行(ニッポンギンコー)

             ↑もともとガ行音       ↑鼻濁音にならない。

 方言によっては鼻濁音のない地方もあります。

 

長音(ー)

   直前の母音をのばす音で、直前の母音により5種類の音があります。

 

撥音(ん)

 撥音を発声しているときは口の中は次の音の準備をしているため直後の音の影響を受けます。

直後の音によってm、n、などさまざまに変わります。

     辛抱  シンボー mの音

    感謝  カンシャ nの音

 ちなみにお隣の韓国では、別の文字を当てています。

 

   南ア ナンア

   真意 シンイ

   冠羽 カンウ

   繁栄 ハンエイ

   反応 ハンノウ

 これらの撥音はすべて違う音になります。

 

母音

 語頭の時は、軽い破裂が入ります。半母音には破裂が入りません。

 直後が撥音のときは別の音になります。次の例ではイの音が異なります。

   子音   シイン

   真因  シンイン

 

促音(ッ)

 直後の子音によって音が異なります。

 破裂音の前   破裂する前の無音状態が前に伸びて、音がありません。

  一般   イッパン    音がありません。

 摩擦音の前   後ろの音の摩擦音が前に伸びます。

  一寸   イッスン    摩擦音だけになります。

 和語では擬音語以外では有声音の前には来ません。

 

無声化

  ある条件のとき子音だけが発音されて、母音の音が消えてしまう現象です。

  これが進んだ形で子音まで消えてしまって、促音だけになる例もあります。

   例  三角形 サンカクケイ → サンカッケイ

 

無声化する条件

 無声化は次の条件のときに起こります。

  条件1:無声音である。

  条件2:イ段、またはウ段の音である。

  条件3:アクセント核でない。

  条件4:直後が無声音か最後である。

 

無声化した音が連続した例

  例 福助足袋  フクスケタビ

  青で書いた部分が無声化しました。

 

3拍語で2拍目に核があるときに先頭の音素が条件2を満たさなくても無声化します。

  例 コロ

 

エピソード

  関西方言と無声化

 関西方言には無声化はありません。関西出身の人は、アクセントは関東方言でしゃべれてもなかなか無声化の発音ができないようです。

 

また人の口は連続的に動くので音も連続的に変化します。どこまでを異音と考えるか、また早口でしゃべったときなどの音のくずれなどもありますが、顕著なものについて述べました。

 

撥音(ん)

 「ダ行」の音の前の「の」が撥音に発音されることがあります。

   の→ん

  私のです → 私んです

 

促音(っ)

  和語では、擬音語をのぞいて直後が無声音のときだけしかありませんでした。

 

擬音語

 状況や音をまねた用語です。

  例 がたがた、どしん、がらがら

 

 ヨーロッパ系の言語からの外来語も擬音語です。

 和語では擬音語をのぞいて促音の後に有声音が来ることはありません。このため日本人が外来語を発音するときによく発音を間違えます。

 例

  ×キューピット → ○キューピッド(cupid)

  ×ビックデータ → ○ビッグデータ(big data)

  ×ベットタウン → ○ベッドタウン(bed town)

 あまり例は多くないのですが、促音の後にハ行、ラ行の音が来る例があります。

  例 コッヘル (ドイツ語)

    アッラー (アラビヤ語)

 

エピソード

ハンドバック

 街中の店の看板には「ハンドバック」(hand bag)とかいてあるものを良く見ます。インターネットで調べても、「ハンドバック」のほうが、「ハンドバッグ」より3倍くらい多く使われています。商品名、会社名などでは、促音の後ろの濁音を最初から無声音にしてしまっているところがあります。

  ビックカメラ

  ブルドックソース(製品にはBull・Dogと書いてあります。)

 

無声化した音は促音化し、さらに脱落することがあります。

       無声化 →  促音化 → 脱落

  例 時計 ときけい→  とっけい→ とけい

    一品  いちひん→  いっぴん      (後ろを半濁音化)

 

無声子音の前に促音が挿入される例もあります。(地方性があります。)

  例 始めから →  始めっから

    ばかり  →  ばっかり

 

長音(ー)

 表記上は平仮名語にはなくカタカナ語にだけあります。

 平仮名語では母音で表現しますが、友達同士のメールでは最後の長音が脱落している例がときどき見受けられます。

  例 おはよ、ありがと、でしょ

 

流音(ラ行の音)

 ラ行の音は条件によっては撥音に置き換えられます。

   分からない → 分かない

   分かるのは → 分かのは

 

母音の変化

 くずれた会話体では母音の「アイ」が「エ」に変わります。

   飲みたい → 飲みてえ

   やばい  → やべー

 

連濁

 ある程度の規則はありますが、地域による違いもありあまり規則が適用できません。

      研究所  ケンキュウジョ

      発電所  ハツデンショ

   登記所 トウキショ


 

5.アクセントとイントネーション

自然にしゃべるには 

 ここではより自然に発話させるために音の種類の他に、考慮しておかなければならない点について述べます。

いま「家が良い」(イエガヨイ)と口に出して言ってみてください。最初の「イ」の音と最後の「イ」の音では高さが違うことに気がつくでしょう。ひとつひとつの音を録音しておいて、そのままつないでしゃべらせると、音の高さの変わらない昔のSF映画に出てくるロボットのようなしゃべり方になってしまいます。歌の声では一つの音符の音を発声しているあいだは声の高さが変わりませんが、話す声は時々刻々変わります。

 

音の高さを変える

 機械に人間と同じようにしゃべらせるには、文中の位置やアクセントによって音の高さを変えて発声させなければなりません。3.1で説明したように、フォルマントの高さを変えずに音の高さだけを変える必要があります。

 

連続的に変える

 人間がしゃべるときには、質量を持った舌や唇が動きながら声を出しているので、ある瞬間にひとつの声を出していて、次の瞬間には別の声を出しているというわけにはいきません。ひとつの声を出しながら口の中は先回りして次の声を出すための準備をして、連続的に次の声に移行します。そのため後ろの声の影響を受けて実際の発音は別の声に変化することがあります。この問題は4.仮名文字と発音の異音のところで説明しました。

 

エピソード

ビデオの早送り

 最近のビデオ装置の早送りで声の質や高さを変えずに速く再生するものがあります。これは音の波形を間引いて速く再生しています。変えられるのはせいぜい2倍速程度までのようです。

 

5.1アクセント

 話し言葉ではアクセントが用語の意味を区別するために重要な役割を果たしています。日本語のアクセントは音の高さの違いです。ちなみに英語などは強さの違いです。共通語では高い音と低い音の2段階があります。「ハ」と「シ」という2文字でできている言葉には「箸」、「端」、「橋」の3つが思い浮かびます。「箸」は「ハ」を高く「シ」を低く発音します。「端」と「橋」は両方とも「ハ」を低く「シ」を高く発音しますがそれぞれの言葉のあとに助詞をつけてみると差が出てきます。「橋が」のときは「ガ」を低く、「端が」のときは「ガ」を高く発音します。

高い音を、低い音をで示すことにします。

             アクセント核の位置

   橋が  尾高  2 「シ」の音が高い。

   箸が シガ 頭高  1 「ハ」の音が高い。

   端が シガ 平板  0 「シ」と「ガ」の音が高い。

 

アクセント核

 高い音から低い音に移る直前の音をアクセント核といいます。(滝の位置といういい方もあります。)上の例では「橋が」のときは「シ」の位置、「箸が」のときは「ハ」の位置です。「端が」のときは高い音から低い音に移ることはないのでアクセント核はありません。また一般に1つの単語には1つの核しかありませんので、アクセント核の位置を数値で表すことができます。例の行末に書いた数字がその値です。「端が」の場合は落ちる位置がないので0にします。原理的には(拍数+1)種類のアクセント型がありえます。

 

アクセント型

 大きく分けて平板型(アクセント核のないもの)と、中高型(アクセントの核のあるもの。起伏型ともいう)があります。中高型をさらに分けることがあります。

 頭高型 中高型のうち、先頭の拍に核があるものをいいます。

 尾高型 中高型のうち、最後の拍に核があるものをいいます。

     言い換えると直後の付属語が低くなります。

     付属語が付かない場合、2段階での音の高さを見ると平板型と

     変わりませんが、音の高さは異なります。

 

共通語では1拍目と2泊目では高さが必ず違います。

 

助詞などの付属語は直前の語のアクセントの型によって音が高いか、低いかが決まります。

 例 端が ハシガ   直前が平板

   橋が ハガ   直前が尾高

 

アクセント核の移動

 複合語を作ったときにアクセント核は移動します。

  言語  ンゴ

  工学  ーガク

             → 言語工学 ンゴコーガク

 

 後ろの用語が平板のときでも全て頭高になるわけではありません。

  漢字プリンター  ンジプリンター

 

 複合語の意味がそうであったようにアクセントも後ろに来る用語が全体のアクセントを支配します。次の「書」で終わる用語は全て書き物の意味でアクセントも平板です。

  請求書  ーキューショ

  案内書  ンナイショ

  説明書  ツメーショ

 

 しかし「秘書」の場合は例外で、意味は「人」でアクセントも変わります。

  秘書   ショ

 

 青がきれい、青い空などのように、品詞によって、アクセントが変化します。

  

  

 

 後ろに続く助詞の影響でアクセントが移動します。

 例 晴れる

  晴れる ル  終止形

  晴れて レテ  連用形に「て」が付いた場合

 連用中止めは、連用形の「て」が省略されたもので、アクセントの前の音に対する影響だけが残っています。

 

 例「今日は晴」

  キョーワハ  体言止め

  キョーワ  連用中止め

(連用中止めのときは多くの場合は例えば「明日は雨でしょう」のような文が続きます。)

 

 大和言葉のアクセントの特徴

 擬音語を除く大和言葉では、特殊音素アクセント核はありません。

 

 アクセントによって意味が異なる例

  女らしい  ンナラシイ    接尾辞

        ンナイ    助動詞

  本会議   ンカイギ (正式な会議)

        イギ (今参加している会議)

 日本語には「本」という接頭辞が2種類あります。

 

 同じ漢字でも、前に来る言葉によって、読み方が変わります。

  推薦人    スイセンニン

  日本人    ニホンジ

  アメリカ人  アメリカジン

 

エピソード

 接尾辞の「人」

 接尾辞の「人」をニンと読むときは、現在その動作を担当している人のときで、ジンと読むのはその人の持って生まれた性質を指すときです。

 ジの音が高いのは日本人のほか朝鮮人と台湾人だけです。これは旧植民地を含めた地域の人たちだけです。

 

 

 

 用言のアクセントの活用形による移動

 身近な例で「青い」(中高型)、「赤い」(平板型)という形容詞は

  青かろう  オカロー     赤かろう  カカロ

  青からず  オカズ     赤からず  カカラズ

  青かった  オカッタ     赤かった  カッタ

  青く    オク       赤く    カク

  青い    イ       赤い    カイ

  青ければ  オケレバ     赤ければ  カケレバ

 

 文節先頭の用語の影響が付属語の最後まで及びます。

  遊ぶ              ソブ       (平板型)

  遊ばさせられたい        ソバサセラレタイ

  選ぶ              ブ       (中高型)

  選ばさせられたい        ラバサセラレタ

 

 

助数詞の読み方とアクセント

 直前の数詞との組み合わせで非常に複雑な変化をします。この変化は数詞の読み方にも影響を与えます。まず数を数える場合を例に説明します。数詞、助数詞の発音、アクセントの変化は複雑でここでは省略します。日本語アクセント辞典 日本放送協会などを参照してください。

 文法的な側面は

  数詞と組み合わせて数量詞を作ります。       10

  数量詞は助詞を伴わずに連用修飾格になります。   10人来た

 

助数詞の読み方とアクセントの変化

  1本    ッポン

  2本    ホン

  3本    ンボン

  4本    ンホン

  5本    ホン

  6本    ッポン

  7本    ホン

  8本    ッポン、ホン

  9本    ーホン

  10本   ッポン   

  100本  ヒャッポン

 

 複数桁の時はさらに複雑です。

  25本     ジュー/ゴホン

  55本     ジューゴホン

 

 例えば6という数字の読み方は助数詞によって次のような変化をします。

  6台  ロク

  6階  ロッ

  6つ  ムッ

  6日  ムイ

 

 4以下の数のときだけ特別の読み方をする助数詞があります。

  1箱  ヒハコ

  2箱  フハコ

  3箱  ハコ

  4箱  ハコ

  5箱  ハコ(5以上は通常の助数詞と同じ)

 

助数詞の読み方の違い

  十、百、千、万などの数字の桁も助数詞です。

  この桁を現す助数詞には2つのレベルがあります。

  十、百、千   のレベル:その桁の数値が1の時は省略します。

  万、億、兆、京 のレベル:その桁の数値が1でも省略できません。

 

さらに小数点も助数詞です。

  22     ジュー

  22.2    ジューーテン

  22.22    ジューーテンニーニ

 

エピソード

共通語と関西方言

 アクセントの規則は共通語と関西方言ではかなり違います。アクセントは話し言葉の基本的な性質のようで、関西育ちの人が東京に相当長い間住んでいても、なかなか共通語のアクセントになりません。もし筆者が関西育ちだったら本書は書けなかったでしょう。逆に、筆者に関西方言の本を書けと言われたとしても全く自信はありません。

 アクセント規則については参考資料が少なく、本書に書いたアクセントの移動規則は筆者らが見つけたものです。相談をしていて気付いたことですがアクセントは記録が残らないためか、世代的な変化もあります。10歳、歳が違うと細かい部分ですが違いが出ていました。


 

5.2イントネーション

 アクセントは一音一音の音の高さの変化ですが、イントネーション(抑揚)は息遣いによる高さの大きな動きです。仮名で書けば同じ文字列でも質問するとき、命令するとき、依頼するときでは声の高さの動きが違います。例えば質問のときは、最後に音の高さが上がります。声で説明すれば分かるのですが書物では説明しにくい特徴です。また書かれた文章中からも検出しにくい特徴です。

 

アクセントとイントネーションの重なり

 「白い花が咲いています」という文を読み上げた場合のイントネーションとアクセントの各成分の音の高さの変化です。最終的に発声する声の高さはこの2つの成分を加えた音の高さになります。

  図1 イントネーションによる高さ

  図2 アクセントによる高さ

  図3 実際に発声される音の高さ。2つの成分を積み重ねた高さでしゃべります。


イントネーションの種類

 同じ音素の列でも会話ではイントネーションの違いによってまったく違ったニュアンスになります。この違いは文字による記述ではうまく書けませんので状況を考えて推測してください。

例えば「どいた」という会話でも韻律の違いによっていくつも考えられます。話すときの感情によっても変わるので実際にはこれ以上はるかに多くのイントネーションの形があります。

  状況説明    故障車がやっとどいた。

  命令      邪魔だからどいた。

  質問      どいた?

  依頼      どいて

英語にはイントネーションを記述するための文字がありますが日本語にはあまりなじんでいません。

  疑問を現す(?)  机ですか? 

  驚きを現す(!)  机か!  

 

一度文字になった情報は会話に比べると細かい感情は捨てられてしまっています。

 話し言葉は話題の流れ、声の調子、イントネーションを総合して相手に感情を含めて伝えています。文字で書くと同じ文もイントネーションを変えると質問の言い方になったり、命令の言い方になったりします。文字言葉ではこのイントネーションが捨てられています。見方によっては話し言葉と書き言葉とは別の言語だとも言えそうです。

 

エピソード

顔文字

 いろいろな感情をつけた話し方を伝えるために、いま若いい人たちの間のメールでは顔文字が使われています。これは文のイントネーションを表す素晴らしい方法です。これからコンピューターの解析プログラムではこの顔文字を解釈して話す文のイントネーションを制御したらどうかと考えます。

 

もう一つ、最近の若い人の間では、平板のまま終わらせて疑問(確認)を現しているのをよく耳にします。

  強くない ツヨクナイ

 

 

 

プロミネンス

 プロミネンスとは、話し言葉の発音の一部分を強調することです。これも文字による記述では書けません。

  「お酒さえ飲まなければ」   例えばこの強調した「さえ」の部分


 

 

6.テキストを読みあげるには

 

仮名漢字変換のプログラムでは同音異義語の多さが変換の難しさの原因になりましたが、漢字仮名交じり文を読みに変換するときにも難しい問題があります。

 

 「その後」という表記は「ソノゴ」「ソノウシロ」「ソノアト」「ソノノチ」と、「その」が文脈上何を指しているかでどの読み方が許されるかが決まります。

 アクセントについても「今日は」という表記は通常の文を読むときは「ンニチワ」になりますが、挨拶の場合は「コンニチワ」になります。

 これらの問題を日本語解析で解決しようとすると、大変な困難を伴います。どうしても仮名漢字変化の同音異義語選択と同じようにユーザーに正しい読み方を選択してもらう必要があります。その際に仮名漢字変換と同じように単語同士の区切り位置の修正をしてもらう必要があります。指定された修正を学習することも必要です。

 「一番列車が」 イチバン/レッシャガ

 「一番列車が」 イチバンレッシャガ

 「東京都議会選挙」

    トーキョート ギカイセンキョ  トーキョー トギカイセンキョ

      誤り              正しい

 

よく使われる用語にも複数の読みがあります

    行った    イッタ        オコナッタ

  開く    アク     ヒラク

 

表記の揺れ

日本語では同じ内容を表すのにいくつかの表記法が許されています。テキストを読み上げるときにどんな表記でも受け付けられるようにする必要があります。

 送り仮名が一様ではありません。これらは表記が異なっていても、当然同じ発音、同じアクセントになります。

  打ち合わせる

  打合わせる

  打合せる

  打ち合せる

  打ちあわせる

 

カタカナ語の最後の長音が省略されます。

 カタカナ語で最後の長音を省略しますが、発音は長音を付けて読みます。

  表記 コンピュータ

  発音 コンピューター

 

固有名詞

 固有名詞は正確に読むことを要求されます。同じ漢字で書かれる名詞に異なった読み方があり、間違って読むことが許されません。確認して読ませる必要があります。

  日本   にほん   (日本棋院)

       にっぽん  (日本銀行)

  国分   こくぶ   (人名)

       こくぶん

       くにわけ

  本町   ほんちょう (函館市)

       ほんまち  (大阪市)

       もとまち  (福島市)

 人名は当人に確認する必要があります。

 地名は話題になっている町が、何県なのかまで調べる必要があります。

 

 同音異義語の区別をするために、意味の違いをアクセントで区別している例もあります。

 渋谷   ブヤ    地名

      ブヤ    人名

 

 

誤った表記

 「うけたまわる」は正しい表記は「承る」であるが「承わる」と書かれることがあります。これは間違った表記ですが違和感なく読めてしまいます。このような誤った表記を含めてよく使われる表記を全て辞書に登録してあります。

 誤りで拗音の小文字が移動することがあります。

  シミュレーション → シュミレーション

    正しい       誤り

 

辞書に登録されていない用語を読むには

 以上のような処理をしても、固有名詞や専門用語など辞書に登録されていない用語は必ずあります。このような未登録語は文字の種類によって次のように読みを与えます。

 

 漢字 漢字辞書を引いて前後とも平仮名の場合は訓で読みます。複数の漢字が連続している場合は音で読みます。語頭や語尾に来たときにだけ許される読み方もあります。

 「圧」 語頭 アッ そのほか アツ

厳密には直後の漢字の読み方が無声音のときです。

 

 「日」 語末 ビ  そのほか ヒ

 

 片仮名 外来語としてみなして文字数を調べてその文字数のときに一番多いアクセントの形にしています。

 

アルファベットの読みあげ

 アルファベット文字列の読み方には3種類があります。それぞれ通例で決まっている読み方に従って読みあげます。

  FBI  エフビーアイ      イニシャリズム(スペルをそのまま読む)

  NATO ナトー         アクロニム(ローマ字読み)

  Book ブック         英語読み(日本語的な発音になります)

 イニシャリズム以外は辞書に登録しておく必要があります。アクロニムにするべき用語を英字から機械的に変換したプログラムがあります。そのプログラムではアクセントも機械的にあたえる必要があります。

 

数字の読みあげ

数詞の読み方の変化

 同じ数値を書くのにいろいろな記述法がありますが同じ読み方をする必要があります。

  203

  二百三

  二○三

 

 数字も棒読みする場合と、数値で読む場合があります。ここでも通例に従った読み方になります。

 電話番号は普通棒読みします。

  (482)0109      ヨンハチニのレーイチレーキュウ

  B787           ボーイングナナハチナナ

  F15            エフジューゴ

  西暦2014         セイレキニセンジューヨン

 

話し言葉と書き言葉のズレ

日本語にも話し言葉と書き言葉とにズレがあります。音声で聞かせるには文章を書き換えた方がよい場合もあります、例えば「訪仏」などという言葉は文字で読めば意味が分かりますが声に出しては読まない言葉です。文字で書けば「彷彿」という用語とは違うということが分かるのですが、音声では取り違えられるのを防ぐために「フランスへ行く」という言葉に置き換える必要があります。こういった置き換えなければならない言葉は目で文字を追っていてもなかなか気が付きません。実際にしゃべらせてみて気が付いて修正するのが普通です。

 テレビでは話している言葉の中に音だけでは分かりにくい単語が出てくると画面の下に字幕が出て文字で説明しています。

 

解析の誤り

 漢字で表記が同じで読み方が異なる言葉を読み違える例は仮名漢字変換で同音異義語を取り違える場合に比べると数が少なく、あまり問題になりません。英字や数字をどの読み方で読むかは読みあげる原稿の英数字の多いか少ないかに依存しました。むしろ平仮名の多い部分のほうが仮名漢字変換と同じように解析を失敗して、音自体は読めるのですが、間違ったアクセントで読みあげる結果になりました。

 


 

7.今後の展開

 駅の音声による案内は録音した音を再生する装置です。しゃべる内容が一部変わると声の質が他と異なってしまうので一部分だけを置き換えるわけにはいきません。全ての音を再入力する必要があります。規則音声合成装置ではそのような問題はありません。また最近滑らかにしゃべらせる技術も発達してきました。人工知能の出力装置として、またヒューマノイドロボットの必須の構成機器として、また福祉や医療の場で目が他のことに占有されている人に詳細な情報を伝えるために活用されるでしょう。

 イントネーションで述べた書き言葉を正確に発音記号に置き換えるだけではなく、話者の情緒も表現する必要があります。現在アニメでは画像は人工的な絵が使われていますが、音声はいまだに肉声を録音して使っています。これは現在の音声合成装置が情緒まで表現できないことが最大の理由です。音声の情緒に関するアノンテーションの指定規則を決めて、そのための言語解析、音声合成技術の開発をしなければなりません。


付録 点字

 ルビを振るときや点字に変換するときにも漢字仮名交じりデータを読み取る作業が必要になります。視覚障害者が使う点字についてもふれておきます。点字のシステムは視覚障害者の方が音声で読み上げるのをきいて、それなら点字もできるだろうと言われて始めたものです。

 我々の使っている仮名表記は一部発音とずれているところがあります。点字は基本的に仮名ですが、仮名表記とは少し異なっていてより音声に忠実です。空白で区切って文節分かち書きをします。

 

仮名と点字の違いについて述べます。

1.助詞の「は」「へ」は仮名文字と異なり発音どおり「わ」「え」になります。

2.「お段」「う段」の後ろの「う」も発音どおり長音になります。

  「次のとおり」のときの「お」は発音上では長音だと思うのですが長音にはなり

  ません。

3.「い段」「え段」の後ろの「い」は長音にはなりません。

4.「お」と「を」とは音声では区別しませんが、点字では区別します。

5.「じ」「ぢ」、「ず」「づ」は音声では区別しませんが、点字では区別します。

6.拗音は仮名と点字では2文字を使いますが音声では1音です。

7.点字では英数字はそのまま点字にします。

8.点字では句読点はそのまま点字にしますが、音声では音になりません。

9.助数詞は音声と同じように半濁音化、濁音化をします。

 

表3 仮名、点字、音声を比較するために表にしました。

漢字表記

仮名表記

点字表記

発音

空港へ

くうこうへ

くーこーえ

くーこーえ

平成は

へいせいは

へいせいわ

へーせーわ

学校を

がっこうを

がっこーを

が_こーお

 

ぢづ

ぢづ

じず

拗音

キャ 2

2

1

A1

エイいち

A1

えーいち

句読点

 

 

 音声ではなるべく滑らかに読ませるために「こと」「とき」のような形式名詞は付属語として発音上前の文節に連続して読ませますが、点字では目の不自由な人が読みやすいように形式名詞も独立した文節として先頭に文節の区切りの空白をいれます。

 点字は6点でできています。左上半分が母音で右下半分が子音です。濁音・半濁音・拗音は前に1枡付け加えます。赤い点は母音を示す点で、黒い点は子音を示す点です。

 

母音

あ      い     う     え     お

● ○   ● ○   ● ●   ● ●   ○ ●

○ ○   ● ○   ○ ○    ○   ● ○

○ ○   ○ ○   ○ ○   ○ ○   ○ ○

子音

か     さ     た     な     は     ま     ら

● ○   ● ○   ● ○   ● ○   ● ○   ● ○   ● ○

○ ○   ○ ●   ○ ●   ○ ○   ○ ○   ○ ●   ○ ●

○ ●   ○ ●   ● ○   ● ○   ● ●   ● ●   ○ ○

や     ゆ     よ     わ     ゐ     ゑ     を

○ ●   ○ ●   ○ ●   ○ ○   ○ ○   ○ ○   ○ ○

○ ○   ○ ○   ○ ●   ○ ○   ● ○   ● ●   ○ ●

● ○   ● ●   ● ○   ● ○   ● ○   ● ○   ● ○

 

濁音・半濁音・拗音は前に1枡付け加える

濁音     半濁音     拗音

○ ○    ○ ○     ○ ●

○ ●    ○ ○     ○ ○

○ ○    ○ ●     ○ ○

 

撥音 ん    促音 ッ     長音 ―    読点 、     句点  。

○ ○     ○ ○      ○ ○     ○ ○      ○ ○

○ ●     ● ○      ● ●     ○ ●      ● ●

● ●     ○ ○      ○ ○     ○ ●      ○ ●

 

英字開始      数字開始

○ ○       ○ ● 

○ ●       ○ ● 

○ ●       ● ● 

点字の例をだします。

エレベーターのドアの開閉ボタンのところに下記のような点字があります。これには「アケ」「シメ」と書いてあります。今度エレベーターに乗ったら見てください。

 

 ア   ケ         シ   メ

● ○ ● ●       ● ○ ● ●

 ○  ○        ●  ●

○ ○ ○ ●       ○ ● ● ●

 

もう一つ、缶ビールの上に書いてあるのは「オサケ」という点字です。視覚障害者の子供がジュースなどと間違えて飲むことがないように書いてあります。

 

 オ   サ   ケ

○ ● ● ○ ● ●

● ○  ●  ○

○ ○ ○ ● ○ ●


 

索引

 

アクセント

アクセント核

アクセント型

アクセント核の移動

頭高

アルファベットの読みあげ

異音

イントネーション

尾高形

音素の相互干渉

 

顔文字

活用形による移動

仮名文字と発音との違い

擬音語

口蓋化

口濁音

固有名詞

 

スペクトル

子音

数字の読みあげ

助数詞の読みとアクセント

促音

 

長音

調音部位

テキストを読みあげるには

点字

特殊音素

 

中高形

 

破擦音

はじき音

発音

撥音

発音の行間の交差

破裂音

半母音

話し言葉と書き言葉とのズレ

鼻濁音

鼻音

表記の揺れ

フォルマント

プロミネンス

平板形

母音

 

摩擦音

無声化

無声音

モーラ

 

有声音

拗音

 

流音

連濁

 

和語


 

参考文献

  日本語アクセント辞典 日本放送出版協会

  音声と音声教育 文化庁

  教師用日本語ハンドブック 発音 国際交流基金

  パソコンがしゃべる! 工学社 国分芳宏

  日本語の音声教育&韻律教育支援 OJAD (Online Japanese Accent Dictionary)

         http://www.gavo.t.u-tokyo.ac.jp/ojad/