Chapter Fourty-four

第44話



前回の説明で連続ウェーブレット解析の概念はうまく伝えられただろうか? 今回は連続ウェーブレット解析の定番(?)となっているガボールウェーブレットを使って少し遊んでみよう。

ガボールウェーブレットは複素関数で
F(x,a,b) = (1/(16*√(π)))*exp(-((x-b)/a)^2/64)*exp(i*(x-b)/a)
と書かれる。

実部と虚部を分けて書くと
F(x,a,b) =(1/(16*√(π)))*{exp(-((x-b)/a)^2/64)*Cos((x-b)/a) + i*exp(-((x-b)/a)^2/64)*Sin((x-b)/a)}
となる。この関数の実部が前回使ったウェーブレットとなっている。

複素数を使うことにより、位相で結果が正負に振動するのを除くことができる。下の計算例は前回と同じ関数をガボールウェーブレットで解析したものだ。この方がずっと見やすい。

ダイアグラムは前回のダイアグラムにサインの項が追加になって、数値積分の後で複素数にしてから極座標に変換している。

実際にこれを使って、中年男性と女子高生の声を比較してみよう。"サークル"と発音したときの"サー"に相当する部分を切り出して比較することにした。約22kHzで録音したので0.05秒ぐらいの一瞬のデータとなる。

中年男性には普通のカタカナ発音で話してもらった。

女子高生には英語風に発音してもらった。

声の高さが違うことと、下のグラフでつながっている緑の帯が上のグラフではちぎれているのが顕著な違いと見れるかもしれない。つながった緑の帯は巻き舌の効果なのかもしれないと考えると、なかなか面白い。

計算時間は計っていないが、ゆっくりコーヒーを飲んでいるとやっと終わるぐらいの時間がかかった( PowerMac7500/100 + G3/233)。アクセントやイントネーションにも興味があったので、本当は単語全体にたいして解析したかったのだが、丸一日計算させても終わりそうもなかったのでごく短時間だけ切り取って計算せざるをえなかったのだ。マルクス的に表現すると、"計算速度は解析の質を規定する"と言い切っても間違いがないような状況である。

このような計算速度という問題意識をもって、次回はいよいよ離散ウェーブレット解析に入っていってみよう。前回積み残した短時間フーリエ変換とウェーブレット変換の違いについては、離散ウェーブレット解析が行き詰まったときの話題として残しておこう。なにしろどの本を読んでみても急に高度な数学になってしまって適当な入り口はないか考えているところだ。足を踏みださなければ先には進まないのだが、、、

See you!


Nigel Yamaguchi

戻る