变速与变调原理
自然語音的產生可以簡化為圖2-1模型,激勵源出來的聲門波信號與聲道模型進行卷積,最后通過嘴唇輻射模型產生語音。其中,激勵源決定說話人的基頻的大小,即音調的高低。聲道模型反映“潤色”的頻譜信息,具體的講,共振峰決定了語義信息,諧波分布決定了音色,單位時間的音節數決定了語速。
?
圖2-1 語音產生模型
下面將根據語音產生模型來闡述變速變調的基本原理。
變速變調的改變可以包括變速不變調和變調不變速兩個部分。
語音變速不變調是指保持音調和語義保持不變,語速變快或變慢[28]。該過程表現為語譜圖在時間軸上如手風琴般壓縮或者擴展。那也就是說,基頻值幾乎不變,對應于音調不變;整個時間過程被壓縮或者擴展,聲門周期的數目減小或者增加,即聲道運動速率發生改變,語速也隨之變化。對應于語音產生模型,激勵和系統經歷與原始發音情況幾乎相同的狀態,但持續時間相比原來或長或短[29]。
嚴格地講,基頻和音調是兩個不同的概念,基頻是指聲帶振動的頻率,音調是指人類對基頻的主觀感知,但是兩者變化基本一致,即基頻越高,音調越高,基頻越低,音調越低,音調是由基頻決定的[30]。因此,語音變調不變速就是指改變說話人基頻的大小[44],同時保持語速和語義不變,即保持短時頻譜包絡(共振峰的位置和帶寬)和時間過程基本不變[31]。對應于語音產生模型,變調改變了激勵源;聲道模型的共振峰參數幾乎不變,保證了語義和語速不變。
綜上所述,變速改變聲道運動速率,力求保持激勵源不變;變調改變激勵源,力求保持聲道的共振峰信息不變。但是聲源和聲道不是相互獨立的,在改變聲源時,必然也會非線性的影響聲道,同樣地,改變聲道時也會或多或少的影響聲源,兩者之間相互影響,相互作用。
總結
- 上一篇: js关于数组的操作(合并数组、添加数组、
- 下一篇: 极客技术专题【009期】:web技术开发