研究テーマ ->音声認識と音声合成 ->音声認識->フォルマン トの分析->フォルマントについて
  音声認識/合成に関する情報を提供します。  
 
フォルマントとは?

上の図は、自分で録音した母音「う」の音声波形です 。このような形式で波形を表示する場合、横軸は時間、縦軸は音の大きさになっていますから、時間的な音量の変化を知ることはできますが、音の高さがどのように変化したかは、知ることができません。

上の図は、母音「う」を発音したファイルの全体をソフトウェア(ここではAudacityを使用)で、周波数解析したものです。 このような形で周波数成分(スペクトル)を表示する場合、ファイル全体としての周波数の構成は分かりますが、時間的にどのように 周波数の構成が変化したかは知ることができません。
 
上の図は、時間の流れにそって周波数成分を表示できるソフト(ここではGoldWaveを使用)で、「あ」(左上の図)や「い」 (右上の図)の発声をしたときの周波数が、時間的にどのように変化していったかを示したものです。
音声の波形を周波数分析すると、幾つかの周波数で強さのピークが見られますが、そのピークをフォルマントと呼んでいます。また、人の声 だけでなく、楽器の音などが固有に持っている周波数スペクトルのこともフォルマントとと呼びます。(楽器の場合は、周波数よりも、倍音という言葉が使われ ることが多いです。)発声する人や楽器が違えば、フォルマントが異なります。なので、フォルマントの違いが、その人の声やその楽器を特徴づけるものになっていると言えます。
上の図でも、各周波数のピークが時間的に移動していることが分かります。「あいうえお」など発声する音が同じであれば、似たフォルマントのパターンが観察されます。