小波变换学习~语音端点检测
生活随笔
收集整理的這篇文章主要介紹了
小波变换学习~语音端点检测
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
參考:
- 現(xiàn)代語音信號處理,p97
- Precise detection of speech endpoints dynamically: A wavlet convolution based approach, 2018
1. 小波變換,是一種時頻分析方法,具有多分辨率的特點,在時頻兩域都具有表征信號局部特征的能力,是一種窗口大小固定不變但其形狀可改變,時間窗和頻率窗都可以改變的時頻局部化分析方法。即在低頻部分具有較高的頻率分辨率和較低的時間分辨率;在高頻部分具有較高的時間分辨率和較低的頻率分辨率。
wavlet transform:就是把某一基本小波或母小波函數(shù)做位移b后,再在不同尺度a下與待分析信號f(t)做內(nèi)積。
- covolution卷積是小波變換的基石。
- 多分辨率:L(R)中的f描述為具有一系列近似函數(shù)的逼近極限,其中每一個近似函數(shù)都是f在不同分辨率子空間上的投影
2. 傅里葉采用三角級數(shù)進行分解與重構(gòu),較好地描述了信號的頻率特性,但對奇異信號重構(gòu)效果較差。
----連續(xù)小波變換(CWT):目的在于從信號中抽取信息
----離散小波變換(DWT):工程實現(xiàn)。目的在于重構(gòu)信號
----
3. 小波分解是語音端點檢測的關(guān)鍵。
sparse representation,稀疏表示是尋找信號中相關(guān)信息和模式的有效方法。通過使用fourier或小波基在振蕩波形上分解信號來實現(xiàn)。
小波變換=小波系數(shù)
- input:離散語音信號x(t)
- output:在離散信號上卷積獲得不同尺度的系數(shù)值coefficients(序列),length(x(t))=length(wavlet)
- low scale低尺度因子對應(yīng)著高頻;用于識別語音序列存在的位置
- high scale高尺度因子對應(yīng)著低頻;用于延伸語音序列開始和結(jié)尾的清音、濁音部分
一系列尺度因子根據(jù)頻率范圍(frequency)被選擇300hz~3000hz
在不同尺度因子scales下的小波系數(shù)序列coefficient
?
總結(jié)
以上是生活随笔為你收集整理的小波变换学习~语音端点检测的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python---webRTC~vad静
- 下一篇: ubuntu~vim操作