音声認識とは? |
音声認識は、マイクを通して取り込んだ人の声を解析し、何を喋っているのかを、コンピュータで自動的に認識すること
です。今や、カーナビやゲームでも普及してきているので、身近な技術になっています。
具体的には、コンピュータに取り込まれた声の波形を分析し、何をしゃべっているかを判断する技術のことです。その技術は複雑で
、実際に理解するには、難解な専門書籍を読破する必要があるかと思いますが、ここでは、
「なんちゃって」的な手法で、手っ取り早く概要をつかむために、大雑把に説明しています。
荒っぽい方法ですが、実際にマイクに向かって母音を発音し、コンピュータにその声を取り込み、声の波形を調べて
みました。波形分析の際に使用される、フォルマント、エンベロープ、周波数スペクトルといった音声認識の技術についても説明を加えています。 |
|
|