研究テーマ ->音声認識/合成 ->音声認識->周波数スペクトル->周波数スペクトルについて
  音声認識/合成に関する情報を提供します。  
 
周波数スペクトルとは?
周波数スペクトルとは、音声を周波数によって分解して表示したものを指しています。
難しく言うと、周波数とは、1秒間に繰り返している波の回数を表しており、周波数の単位はヘルツ(Hz)です。
分かりやすく言うと、周波数は、「音の高さ」を表しています。1つの音声は、高い音や低い音など、色々な高さの音が交じり合ってできています。なので、スペクトルは、 その音声が、どのような高さの音で構成されているかの成分を表しています。
音色と周波数の関係
人間は、色々な音を聴いたとき、瞬時に音色を聞き分けることができます。 鳴っている音がピアノなのか、ギターなのか、その音色がするに分かるわけです。例えば、人間の耳は、同じ高さのピアノの音とトランペットの音を簡単に区別することができます。
このような判別が可能であることには、音色が、周波数成分や時間的な変化を含む、実に様々な要素で成り立っていることが背景にあります。分かりやすく言うなら、ピアノにはピアノ の特質、トランペットにはトランペットの特質があるので、人間の耳は、その違いを判断していることになります。
コンピュータを利用して
周波数分析を行うことによって、それぞれの音色の違いを 、数値的に比較することができます。
音を分解する
音を波として考える場合、基本となる形、もっとも単純な形は、サイン波(正弦波)と呼ばれるものです。純音とも呼ばれ 、サイン曲線で示される音は、音の周波数成分が1つしかないことになります。例えば、音叉の音は純音です 。また、口笛の音も純音に近い音です。
しかし、実際に自然界にある様々な音は、多くの周波数成分を含んでいます。それらの音の波形を表示すると、サイン曲線とはならず、細かく複雑な波形になります。しかし、どんなに複雑な音であったとしても、幾つかの正弦波 に分解することができます。逆に言えば、どんな音の波形も、正弦波の組み合わせでできているということになります。なので、私たちが普段 、耳にする音は、純音が組み合わさった複合音ということになります。
上の図がサイン波です。
ピンク色の曲線もサイン波ですが、青い波のちょうど2倍の周波数になっており、倍音と呼ばれます。

黄色の曲線は、青色とピンク色の2つの曲線の音を合成したときのものです。 つまり青とピンクの2つの音を組み合わせると、黄色い線の音になります。2つ組み合わせただけでも、曲線は、ちょっと複雑な形になっていることが分かると思います。