基于动态时间规整(DTW)的孤立字语音识别
生活随笔
收集整理的這篇文章主要介紹了
基于动态时间规整(DTW)的孤立字语音识别
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
模板匹配法語音識別系統
用戶將詞匯表中每個詞依次說一遍,并且將其特征矢量時序作為模板存入模板庫,在識別階段,將輸入語音的特征矢量時間序列依次與模板庫中每個模板進行相識度比較,將相識度最高者作為識別的結果輸出。
特征
使用MFCC系數以及一階和二階差分作為特征參數。MFCC是將人耳的聽覺特征與語音參數相結合的一種特征參數。MFCC的計算可以參考3.4節。
動態時間規整(DTW)
在識別階段的模式匹配中,不能簡單地將輸入模板與詞庫中模板相比較實現識別,因為語音信號具有相當大的隨機性,這些差異不僅好酷哦音強的大小,頻譜的偏移,還有發音持續時間不可能是完全相同的,而詞庫中模板不可能睡著模板輸入持續時間的變換而進行伸縮,所以時間規整是不可少的。DTW是吧時間規整和距離測度計算結合起來的非線性規整技術,是模板匹配的方法。
假設某一參考模板的特征矢量為: a 1 , . . . a m , . .
總結
以上是生活随笔為你收集整理的基于动态时间规整(DTW)的孤立字语音识别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 终于有人把红蓝对抗讲明白了
- 下一篇: ecshop图片自动本地化插件,ECSH