日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文:麦克风阵列增强

發布時間:2023/12/8 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文:麦克风阵列增强 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

《Phase-Based Dual-Microphone Robust Speech Enhancement》

論文下載鏈接: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.9.9360&rep=rep1&type=pdf

前言

這篇論文提到的算法,適用場景以及設備擺放情況如下:

正文

基于相位差的雙麥語音增強算法,概算法的本質是維納濾波,基于相位差計算出維納增益的上界閾值,接著采用上界閾值公式來定義該增益函數,并加入調整系數,對兩路分別進行維納增益幅值調整,將調整后的兩路信號采用DAS算法進行相加,最后通過IFFT還原到時域上,完成語音增強。

? 算法定義了相位差表達式,由維納濾波入手,將維納增益函數用相位差來表示,并提供了推導的細節。

細節

雙麥信號定義為
x1(t)=s(t)+n1(t)(1)x_1(t)=s(t)+n_1(t) \tag{1} x1?(t)=s(t)+n1?(t)(1)
x2(t)=s(t?τ)+n2(t)(2)x_2(t)=s(t-\tau)+n_2(t) \tag{2} x2?(t)=s(t?τ)+n2?(t)(2)
其中,n1(t)、n2(t)n_1(t)、n_2(t)n1?(t)n2?(t)是獨立的服從高斯分布的噪聲信號
這里假設了噪聲在雙通道上具有穩定的幅值,信號在k時刻的w頻點的傅里葉變換X1,k(w)X_{1,k}(w)X1,k?(w),下面給出其極坐標的形式:
X1,k(w)=∣Sk(w)∣ei∠Sk(w)+∣Nk(w)∣ei∠N1,k(w)(3)X_{1,k}(w)=|S_k(w)|e^{i\angle S_k(w)}+|N_k(w)|e^{i\angle N_{1,k}(w)} \tag{3} X1,k?(w)=Sk?(w)eiSk?(w)+Nk?(w)eiN1,k?(w)(3)
X2,k(w)=∣Sk(w)∣ei∠Sk(w)?iwτ+∣Nk(w)∣ei∠N2,k(w)(4)X_{2,k}(w)=|S_k(w)|e^{i\angle S_k(w)-iw\tau}+|N_k(w)|e^{i\angle N_{2,k}(w)} \tag{4} X2,k?(w)=Sk?(w)eiSk?(w)?iwτ+Nk?(w)eiN2,k?(w)(4)
? 相位誤差表示為
θτ,k(w)=∠X1,k(w)?∠X2,k(w)?wτ(5)\theta_{\tau, k}(w)=\angle X_{1,k}(w)-\angle X_{2, k}(w)-w\tau \tag{5} θτ,k?(w)=X1,k?(w)?X2,k?(w)?wτ(5)

? 幅值調整公式(維納濾波):
ηk(w)=Rk(w)1+Rk(w)(6)\eta_k(w)=\frac{R_k(w)}{1+R_k(w)}\tag{6} ηk?(w)=1+Rk?(w)Rk?(w)?(6)
? 利用信噪比公式:
Rk(w)=∣Sk(w)∣2∣Nk(w)∣2(7)R_k(w)=\frac{|S_k(w)|^2}{|N_k(w)|^2} \tag{7} Rk?(w)=Nk?(w)2Sk?(w)2?(7)
? 聯合(3)、(4)、(6)得出:
∠X1,k(w)=∠(Rk(w)ei∠Sk(w)+ei∠N1,k(w))(8)\angle X_{1,k}(w)=\angle (\sqrt{R_k(w)}e^{i\angle S_k(w)}+e^{i\angle N_{1,k}(w)}) \tag{8} X1,k?(w)=(Rk?(w)?eiSk?(w)+eiN1,k?(w))(8)
∠X2,k(w)=∠(Rk(w)ei∠Sk(w)?iwτ+ei∠N2,k(w))(9)\angle X_{2,k}(w)=\angle(\sqrt{R_k(w)}e^{i\angle S_k(w)-iw\tau}+e^{i\angle N_{2,k}(w)}) \tag{9} X2,k?(w)=(Rk?(w)?eiSk?(w)?iwτ+eiN2,k?(w))(9)
? 代入(5)可以得到:
θk(w)=∠(Rk(w)+eiy1)?∠(Rk(w)+eiy2)(10)\theta_k(w)=\angle (\sqrt{R_k(w)}+e^{iy_1})-\angle(\sqrt{R_k(w)}+e^{iy_2}) \tag{10} θk?(w)=(Rk?(w)?+eiy1?)?(Rk?(w)?+eiy2?)(10)
? 其中,y1=∠N1,k(w)?∠Sk(w)y_1=\angle N_{1,k}(w)-\angle S_k(w)y1?=N1,k?(w)?Sk?(w)y2=∠N2,k(w)+wτ?∠Sk(w)y_2=\angle N_{2,k}(w)+w\tau-\angle S_k(w)y2?=N2,k?(w)+wτ?Sk?(w)

? 先驗信噪比的取值范圍(詳見附A):

Rk(w)≤1sin2(θk(w)2)R_k(w)\leq \frac{1}{sin^2(\frac{\theta_k(w)}{2})} Rk?(w)sin2(2θk?(w)?)1?
? 進而得到,維納增益函數的上限:
ηk?(w)≤11+sin2(θτ,k(w)2)(11)\eta_k^*(w)\leq \frac{1}{1+sin^2(\frac{\theta_{\tau,k}(w)}{2})}\tag{11} ηk??(w)1+sin2(2θτ,k?(w)?)1?(11)
? 在該論文中,維納增益函數采用下述表達式:
ηk(w)=11+γθτ,k2(w)(12)\eta_k(w)=\frac{1}{1+\gamma \theta_{\tau,k}^2(w)}\tag{12} ηk?(w)=1+γθτ,k2?(w)1?(12)

ηk(w)=11+γθτ,k2(w)\eta_k(w)=\frac{1}{1+\gamma \theta^2_{\tau, k}(w)} ηk?(w)=1+γθτ,k2?(w)1?

? 其中,γ\gammaγ是一個固定的常數,用于控制消噪的激進程度(實際上是對相位差的敏感度),對該參數的取值進行對照實驗。

上圖中,維納增益函數隨著相位差的絕對值,減小而增大,在0處達到最大值1。系數γ\gammaγ越大,維納增益越小,表示的是該算法的消噪強度越大。
? 從上面這張圖也可以知道,經過延時校準后,語音信號的相位差應當逼近0,所以此時維納增益應該接近1,即保持原幅值,兩路噪聲信號則不會等于0,維納增益隨著相位差的增大而減少。

延時校準

延時和相位的關系
Δ?=2πfSNτ\Delta\phi=\frac{2\pi f S}{N}\tau Δ?=N2πfS?τ
SSS是采樣頻率,NNN是FFT分析幀長,τ\tauτ是信號的時間差。

A、信噪比上界推導

? 假設在給定的時頻區間中,噪聲在兩個通道中具有穩定的幅值,我們定義信號在k時刻的w頻點上的表達式為:
X1,k(w)=∣Sk(w)∣ei∠Sk(w)+∣Nk(w)∣ei∠N1,k(w)(A-1)X_{1,k}(w)=|S_k(w)|e^{i\angle S_k(w)}+|N_k(w)|e^{i\angle N_{1,k}(w)}\tag{A-1} X1,k?(w)=Sk?(w)eiSk?(w)+Nk?(w)eiN1,k?(w)(A-1)
X2,k(w)=∣Sk(w)∣e∠Sk(w)?iwτ+∣Nk(w)∣ei∠N2,k(w)(A-2)X_{2,k}(w)=|S_k(w)|e^{\angle S_k(w)-iw\tau}+|N_k(w)|e^{i\angle N_{2,k}(w)}\tag{A-2} X2,k?(w)=Sk?(w)eSk?(w)?iwτ+Nk?(w)eiN2,k?(w)(A-2)
對應的相位誤差為:
θk(w)=∠X1,k(w)?∠X2,k(w)?wτ(A-3)\theta_k(w)=\angle X_{1,k}(w)-\angle X_{2,k}(w)-w\tau\tag{A-3} θk?(w)=X1,k?(w)?X2,k?(w)?wτ(A-3)
又,先驗信噪比Rk(w)=∣Sk(w)∣2/∣Nk(w)∣2R_k(w)=|S_k(w)|^2/|N_k(w)|^2Rk?(w)=Sk?(w)2/Nk?(w)2,聯合(A-1)、(A-2)有:
∠X1,k(w)=∠(Rk(w)?ei∠Sk(w)+e∠N1,k(w))(A-4)\angle X_{1,k}(w)=\angle(\sqrt{R_k(w)}\cdot e^{i\angle S_k(w)}+e^{\angle N_{1,k}(w)})\tag{A-4} X1,k?(w)=(Rk?(w)??eiSk?(w)+eN1,k?(w))(A-4)
∠X2,k(w)=∠(Rk(w)?ei∠Sk(w)?wτ+e∠N2,k(w)))(A-5)\angle X_{2,k}(w)=\angle(\sqrt{R_k(w)}\cdot e^{i\angle S_k(w)-w\tau}+e^{\angle N_{2,k}(w)})\tag{A-5}) X2,k?(w)=(Rk?(w)??eiSk?(w)?wτ+eN2,k?(w)))(A-5)
代入(A-3)中,得到:
θk(w)=∠(Rk(w)+eiy1)?∠(Rk(w)+eiy2)(A-6)\theta_k(w)=\angle(\sqrt{R_k(w)}+e^{iy_1})-\angle(\sqrt{R_k(w)}+e^{iy_2})\tag{A-6} θk?(w)=(Rk?(w)?+eiy1?)?(Rk?(w)?+eiy2?)(A-6)
其中,y1=∠N1,k(w)?∠Sk(w)y_1=\angle N_{1,k}(w)-\angle S_k(w)y1?=N1,k?(w)?Sk?(w)y1=∠N2,k(w)+wτ?∠Sk(w)y_1=\angle N_{2,k}(w)+w\tau-\angle S_k(w)y1?=N2,k?(w)+wτ?Sk?(w),通常來講,很難知道y1y_1y1?y2y_2y2?的值,因為需要知道語音、噪聲的具體相位值。設θ=∠X1,k(w)\theta=\angle X_{1,k}(w)θ=X1,k?(w),即有:
θ=∠(Rk(w)+eiy1)=∠(Rk(w)+cosy1+jsiny1)(A-7)\begin{aligned} \theta &= \angle(\sqrt{R_k(w)}+e^{iy_1})\\ &=\angle(\sqrt{R_k(w)}+cosy_1+jsiny_1) \end{aligned} \tag{A-7} θ?=(Rk?(w)?+eiy1?)=(Rk?(w)?+cosy1?+jsiny1?)?(A-7)
等式兩邊分別求tantantan函數:
sinθcosθ=siny1Rk(w)+cosy1(A-8)\frac{sin\theta}{cos\theta}=\frac{siny_1}{\sqrt{R_k(w)}+cosy_1}\tag{A-8} cosθsinθ?=Rk?(w)?+cosy1?siny1??(A-8)
展開得:
sinθ?Rk(w)+cosy1?sinθ=siny1?cosθ?sinθ?Rk(w)=siny1?cosθ?cosy1?sinθ?sinθ?Rk(w)=sin(y1?θ)≤1?sinθ≤1Rk(w)(A-9)\begin{aligned}sin\theta\cdot \sqrt{R_k(w)}+cosy_1 \cdot sin\theta&=siny_1 \cdot cos\theta \\ &\Downarrow \\ sin\theta \cdot \sqrt{R_k(w)}&=siny_1\cdot cos\theta-cosy_1\cdot sin\theta \\ &\Downarrow \\ sin\theta \cdot \sqrt{R_k(w)}&=sin(y_1-\theta)\leq1 \\ &\Downarrow \\ sin\theta &\leq \frac{1}{\sqrt{R_k(w)}} \\ \end{aligned}\tag{A-9} sinθ?Rk?(w)?+cosy1??sinθsinθ?Rk?(w)?sinθ?Rk?(w)?sinθ?=siny1??cosθ?=siny1??cosθ?cosy1??sinθ?=sin(y1??θ)1?Rk?(w)?1??(A-9)
又因為,cosθ=m(Rk(w)+cosy1)≥0cos\theta= m(\sqrt{R_k(w)}+cosy_1)\geq 0cosθ=m(Rk?(w)?+cosy1?)0(m為非負實數),所以?π2≤θ≤π2-\frac{\pi}{2}\leq\theta \leq \frac{\pi}{2}?2π?θ2π?,此時sinθsin\thetasinθ單調遞增,所以:
θ≤arcsin(1Rk(w))(A-10)\theta \leq arcsin(\frac{1}{\sqrt{R_k(w)}})\tag{A-10} θarcsin(Rk?(w)?1?)(A-10)

∣∠(Rk(w)+eiy1)∣≤arcsin(1Rk(w))(A-11)|\angle(\sqrt{R_k(w)}+e^{iy_1})|\leq arcsin(\frac{1}{\sqrt{R_k(w)}})\tag{A-11} (Rk?(w)?+eiy1?)arcsin(Rk?(w)?1?)(A-11)
由(A-6)、(A-11)得:
∣θk(w)+∠(Rk(w)+eiy2)∣≤arcsin(1Rk(w))(A-12)|\theta_k(w)+\angle(\sqrt{R_k(w)}+e^{iy_2})|\leq arcsin(\frac{1}{\sqrt{R_k(w)}})\tag{A-12} θk?(w)+(Rk?(w)?+eiy2?)arcsin(Rk?(w)?1?)(A-12)
由(A-11),同理可得:
∣∠(Rk(w)+eiy2)∣≤arcsin(1Rk(w))(A-13)|\angle(\sqrt{R_k(w)}+e^{iy_2})|\leq arcsin(\frac{1}{\sqrt{R_k(w)}})\tag{A-13} (Rk?(w)?+eiy2?)arcsin(Rk?(w)?1?)(A-13)
由(A-12)、(A-13)可得
∣θk(w)2∣≤arcsin(1Rk(w))(A-14)|\frac{\theta_k(w)}{2}|\leq arcsin(\frac{1}{\sqrt{R_k(w)}})\tag{A-14} 2θk?(w)?arcsin(Rk?(w)?1?)(A-14)
整理得:
Rk(w)≤1sin2(θk(w)2)(A-15)R_k(w)\leq \frac{1}{sin^2(\frac{\theta_k(w)}{2})}\tag{A-15} Rk?(w)sin2(2θk?(w)?)1?(A-15)

總結

以上是生活随笔為你收集整理的论文:麦克风阵列增强的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。