研究テーマ ->音声認識と音声合成 ->音声認識->エンベロー プの分析->エンベロープについて
  音声認識や音声合成に関する情報を提供します。  
 
エンベロープとは?
下の図は、人間の声を録音し、その波形を表示したものです。図から、音声の波形は、音が鳴りはじめてから消えてゆくまでに変化していることが分かります。下のような形式で、波形を表示した場合、時間の経過とともに音量がどのように変化していったかが把握できます。こ のような音量の時間的な変化のことを エンベロープと呼びます。
エンベロープは、人の声だけでなく、楽器の音にもあります。例えば、楽器の音量は鳴り始めは大きいですが、時間の経過とともに小さくなります。この音量変化がエンベロープということになります。

音量以外の時間的な変化もエンベロープと呼びます。 つまり、周波数の時間的な変化も、エンベロープと呼びます。音量のエンベロープ、周波数のエンベロープなどと呼んで、区別することができます。音声認識で重要となるのは、音量のエンベロープです。
楽器の音を分析の対象にする場合、音量に関連したエンベロープのパラメーターには、 アタック、ディケイ、サスティン、リリースなどがあります。
パラメーター 意味
Attack Time(アタックタイム) 音の立ち上り時間です。音量が最高レベルに到達するまでの時間を示します。
Decay Time(ディケイタイム) 音の初期段階での減衰時間です。最高レベルから保持レベルに到達するまでの時間を示します。
Sustain Level(サステインレベル) 保持される音の大きさを示します。タイミング(横軸)ではなく、音量(縦軸)の量を示していることに注意してください。
Release Time(リリースタイム) 音の最終段階での減衰時間です。