本發(fā)明涉及人機(jī)語(yǔ)音識(shí)別領(lǐng)域,尤指一種降低語(yǔ)音失真的自適應(yīng)波束形成方法
背景技術(shù):
基于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)技術(shù)已經(jīng)廣泛應(yīng)用于通信、人機(jī)交互、語(yǔ)音識(shí)別系統(tǒng)等中,其中廣義旁瓣消除(GSC,Generailized Sidelobe Canceller)方法應(yīng)用最廣,這種方法易于實(shí)現(xiàn)且性能很好。其中GSC分成上下兩個(gè)通路,上通路是固定波束模塊(FBF,F(xiàn)ixed Beamformer)用于估計(jì)目標(biāo)語(yǔ)音的參考信號(hào),下通路是阻塞矩陣模塊(BM,Adaptive Blocking Matrix)和自適應(yīng)消除模塊(MC,Multiple input Canceller),用于消除固定波束中的殘留的噪聲,其中阻塞矩陣模塊用于消除目標(biāo)語(yǔ)音信號(hào)而得到噪聲信號(hào)。但是出消除噪聲的處理過(guò)程不可避免地會(huì)對(duì)目標(biāo)語(yǔ)音造成失真,所以,失真和降噪是一對(duì)不可調(diào)和的矛盾體,只能通過(guò)技術(shù)手段在穩(wěn)定降噪的情況下,減小失真。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺陷,提出一種降低語(yǔ)音失真的自適應(yīng)波束形成方法,所述方法包括如下步驟:
錄制環(huán)境聲音形成輸入信號(hào);利用固定波束形成器通過(guò)波束形成從所述輸入信號(hào)中獲取含噪語(yǔ)音信號(hào);利用阻塞矩陣模塊對(duì)所述輸入信號(hào)進(jìn)行濾波以形成相干噪聲信號(hào);利用自適應(yīng)消除模塊從所述含噪語(yǔ)音信號(hào)中消除所述相干噪聲信號(hào)形成輸出信號(hào)并予以輸出;從所述輸出信號(hào)中獲取殘余噪聲信號(hào),并將所獲取的殘余噪聲信號(hào)反饋至所述自適應(yīng)消除模塊以更新所述自適應(yīng)消除模塊的濾波系數(shù),從而實(shí)現(xiàn)在輸出信號(hào)中使殘余噪聲信號(hào)變小的自適應(yīng)濾波。
本發(fā)明的有益效果為:通過(guò)獲取輸出信號(hào)中的殘余噪聲,并將其反饋至自適應(yīng)消除模塊以更新自適應(yīng)消除模塊中的濾波系數(shù),從而將輸出信號(hào)中殘余噪聲信號(hào)變小,而保持目標(biāo)信號(hào)不變,在達(dá)到降噪目的的同時(shí)也保證了目標(biāo)信號(hào)的失真更小。
本發(fā)明的進(jìn)一步改進(jìn)為:還包括:從所述含噪語(yǔ)音信號(hào)中獲取噪聲信號(hào),包括:
(1)含噪語(yǔ)音信號(hào)的雙態(tài)假設(shè):
H0:X=N
H1:X=S+N (式一)
H0狀態(tài)表示只存在噪聲,N表示噪聲信號(hào),H1狀態(tài)表示含噪語(yǔ)音的狀態(tài),S為含噪語(yǔ)音信號(hào)中的目標(biāo)信號(hào);
(2)假定含噪語(yǔ)音信號(hào)中語(yǔ)音存在的先驗(yàn)概率:
P(H1)=0.5
P(H0)=1-P(H1) (式二)
(3)求解含噪語(yǔ)音信號(hào)的后驗(yàn)信噪比:
式三中,M是麥克風(fēng)數(shù)目w是固定波束形成權(quán)重(可用延遲求和或者最小旁瓣類的方法求出權(quán)重),xi是第i個(gè)麥克風(fēng)輸入信號(hào),F(xiàn)BF是固定波束形成器輸出的含噪語(yǔ)音信號(hào),|FBF|2表示波束形成器中含噪語(yǔ)音信號(hào)的功率,表示FBF中的噪聲信號(hào)估計(jì)值的功率的估計(jì)值;
(4)利用判決引導(dǎo)方法求解含噪語(yǔ)音信號(hào)的先驗(yàn)信噪比ε
式四中,η為平滑系數(shù),較佳取值為0.85,γold為含噪語(yǔ)音信號(hào)的上一幀的后驗(yàn)信噪比,GH1old表示語(yǔ)音信號(hào)上一幀的H1狀態(tài)時(shí)的語(yǔ)音譜增益;
(5)求解含噪語(yǔ)音信號(hào)中語(yǔ)音存在似然度GLR
其中
(6)求解含噪語(yǔ)音信號(hào)中語(yǔ)音存在的條件先驗(yàn)概率P(H1|FBF)
(7)計(jì)算含噪語(yǔ)音信號(hào)中當(dāng)前幀的H1狀態(tài)語(yǔ)音譜增益GH1
(8)計(jì)算含噪語(yǔ)音信號(hào)中當(dāng)前幀的噪聲信號(hào)的估計(jì)值
其中為動(dòng)態(tài)時(shí)域一階平滑系數(shù),其中,α取值0.85,E(N|FBF)是當(dāng)前幀中FBF條件下中噪聲信號(hào)的期望估計(jì)值,其計(jì)算如下:其中,P(H0|FBF)是語(yǔ)音不存在的條件概率,計(jì)算方法如下:
P(H0|FBF)=1-P(H1|FBF)
(9)計(jì)算FBF中的語(yǔ)音增益
其中,表示H1狀態(tài)下的語(yǔ)音增益,表示H0狀態(tài)下的語(yǔ)音增益,在這里Gmin=0.01(-20dB),其中Gmin是H0狀態(tài)時(shí)的下限約束,取值計(jì)算公式為10*lg0.01=-20dB;
(10)估計(jì)含噪語(yǔ)音信號(hào)中的噪聲信號(hào)
NFBF=FBF*(1-Gain) (式十)
其中,NFBF為FBF中的噪聲信號(hào)的估計(jì)值。
本發(fā)明的進(jìn)一步改進(jìn)為:從所述目標(biāo)信號(hào)中獲取殘余噪聲信號(hào),包括:利用從所述含噪語(yǔ)音信號(hào)中估計(jì)出的噪聲信號(hào)估計(jì)值和所述阻塞矩陣模塊形成的相干噪聲信號(hào)計(jì)算出所述殘余噪聲信號(hào):
R=NFBF-wHZ (式十一)
其中,R為殘余噪聲信號(hào),w為自適應(yīng)消除模塊中自適應(yīng)算法的權(quán)重,H是共軛轉(zhuǎn)置操作,Z為阻塞矩陣模塊輸出的相干噪聲信號(hào),NFBF表示FBF中的噪聲信號(hào)的估計(jì)值。
本發(fā)明的進(jìn)一步改進(jìn)為:式十一由以下方程推導(dǎo)出,
自適應(yīng)消除模塊的輸出Y中包含了目標(biāo)信號(hào)T和殘余噪聲信號(hào)R:
Y=T+R (方程一)
而固定波束形成器中輸出的含噪語(yǔ)音信號(hào)包含了目標(biāo)信號(hào)T和噪聲信號(hào)NFBF:
FBF=T+NFBF (方程二)
而自適應(yīng)消除模塊的輸出Y是由固定波束形成器和阻塞矩陣模塊輸出的相干噪聲信號(hào)Z在自適應(yīng)消除模塊中做自適應(yīng)譜減而得到:
Y=FBF-wHZ (方程三)
由上述方程一至方程三推導(dǎo)得出式十一。
本發(fā)明的進(jìn)一步改進(jìn)為:更新所述消除模塊的濾波系數(shù)包括:利用歸一化最小均方計(jì)算濾波系數(shù):
式十二中,其中w是自適應(yīng)消除模塊中自適應(yīng)算法的權(quán)重,μ是步長(zhǎng),Z是阻塞矩陣模塊的輸出的相干噪聲信號(hào),R是殘余噪聲信號(hào),k是幀的索引。
附圖說(shuō)明
圖1為降低語(yǔ)音失真的自適應(yīng)波束形成方法的示意圖。
具體實(shí)施方式
下面結(jié)合附圖,對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。語(yǔ)音增強(qiáng)技術(shù)已經(jīng)廣泛應(yīng)用于通信、人機(jī)交互、語(yǔ)音識(shí)別系統(tǒng)等中,該技術(shù)通過(guò)將輸入的含噪信號(hào)中的噪聲信號(hào)最小化以提高語(yǔ)音通信的質(zhì)量,而在降噪的過(guò)程中,不可避免地造成了目標(biāo)信號(hào)的失真。本發(fā)明通過(guò)獲取輸出信號(hào)中的殘余噪聲,并將其反饋至自適應(yīng)消除模塊以更新自適應(yīng)消除模塊中的濾波系數(shù),從而將輸出信號(hào)中的殘余噪聲信號(hào)變小,而保持目標(biāo)信號(hào)不變,在達(dá)到降噪目的的同時(shí)也保證了目標(biāo)信號(hào)的失真更小。下面,結(jié)合附圖對(duì)本發(fā)明降低語(yǔ)音失真的自適應(yīng)波束形成方法進(jìn)行說(shuō)明。
如圖1所示,本發(fā)明公開了一種降低語(yǔ)音失真的自適應(yīng)波束形成方法,該方法首先錄制環(huán)境中的聲音并經(jīng)過(guò)處理形成聲音的輸入信號(hào);然后將該輸入信號(hào)輸入到固定波束形成器1(FBF,F(xiàn)ixed Beamformer)內(nèi),固定波束形成器通過(guò)波束形成從輸入信號(hào)中獲取含噪語(yǔ)音信號(hào);接著利用阻塞矩陣模塊2(BM,Blocking Matrix)對(duì)輸入信號(hào)進(jìn)行濾波以形成相干噪聲信號(hào);利用自適應(yīng)消除模塊3(MC,Multiple input Canceller)從含噪語(yǔ)音信號(hào)中消除相干噪聲信號(hào),并形成輸出信號(hào)輸出,最后在輸出信號(hào)內(nèi)提取殘余噪聲信號(hào),并將殘余噪聲信號(hào)反饋至自適應(yīng)消除模塊3以更新自適應(yīng)消除模塊的濾波系數(shù),從而實(shí)現(xiàn)在輸出信號(hào)中的殘余噪聲信號(hào)變小的自適應(yīng)濾波。即實(shí)現(xiàn)了利用當(dāng)前的輸出信號(hào)中的殘余噪聲信號(hào)更新自適應(yīng)消除模塊的下一幀濾波系數(shù),以使得下一幀的輸出信號(hào)中的殘余噪聲信號(hào)變小,從而保證輸出信號(hào)中的目標(biāo)信號(hào)不變,使得該目標(biāo)信號(hào)的失真大幅減小。
具體地,使用麥克風(fēng)錄制環(huán)境中的聲音,并進(jìn)行數(shù)字化處理形成輸入信號(hào),該麥克風(fēng)可采用麥克風(fēng)陣列。固定波束形成器與麥克風(fēng)通信連接,接收麥克風(fēng)輸入的輸入信號(hào)通過(guò)波束形成獲取包括噪聲信號(hào)和目標(biāo)信號(hào)的含噪語(yǔ)音信號(hào);阻塞矩陣模塊2與麥克風(fēng)通信連接,接收麥克風(fēng)輸入的輸入信號(hào),并將目標(biāo)信號(hào)從輸入信號(hào)中濾除以形成相干噪聲信號(hào);自適應(yīng)消除模塊3與固定波束形成器1和阻塞矩陣模塊2通信連接,接收固定波束形成器1形成的含噪語(yǔ)音信號(hào)以及阻塞矩陣模塊中過(guò)濾形成的相干噪聲信號(hào),并將相干噪聲信號(hào)從含噪語(yǔ)音信號(hào)中濾除形成輸出信號(hào)并輸出,而該輸出信號(hào)中仍存在殘余噪聲信號(hào),通過(guò)一系列算法計(jì)算出輸出信號(hào)中的殘余噪聲信號(hào),然后將殘余噪聲信號(hào)反饋至自適應(yīng)消除模塊3,自適應(yīng)消除模塊在進(jìn)行下一幀自適應(yīng)濾波時(shí),根據(jù)接收到的殘余噪聲信號(hào)更新自適應(yīng)消除模塊的濾波系數(shù),從而將輸出信號(hào)中的殘余噪聲信號(hào)進(jìn)一步消除,使得輸出信號(hào)中的殘余信號(hào)越來(lái)越小,而保持目標(biāo)信號(hào)不變,從而在進(jìn)一步減小噪聲信號(hào)的同時(shí)達(dá)到減小失真的目的。
進(jìn)一步地,殘余噪聲信號(hào)是通過(guò)固定波束形成器中的噪聲信號(hào)與阻塞矩陣模塊中形成的相干噪聲信號(hào)對(duì)比得到的,所以計(jì)算殘余噪聲信號(hào)之前首先計(jì)算出固定波束形成器1中的噪聲信號(hào),計(jì)算方法如下:
(1)含噪語(yǔ)音信號(hào)的雙態(tài)假設(shè):
H0:X=N
H1:X=S+N (式一)
H0狀態(tài)表示只存在噪聲,N表示噪聲信號(hào),H1狀態(tài)表示含噪語(yǔ)音的狀態(tài),S為含噪語(yǔ)音信號(hào)中的目標(biāo)信號(hào);
(2)假定含噪語(yǔ)音信號(hào)中語(yǔ)音存在的先驗(yàn)概率:
P(H1)=0.5
P(H0)=1-P(H1) (式二)
(3)求解含噪語(yǔ)音信號(hào)的后驗(yàn)信噪比:
式三中,M是麥克風(fēng)數(shù)目w是固定波束形成器中波束形成權(quán)重(可用延遲求和或者最小旁瓣類的方法求出權(quán)重),xi是第i個(gè)麥克風(fēng)輸入信號(hào),F(xiàn)BF是固定波束形成器輸出的含噪語(yǔ)音信號(hào),|FBF|2表示波束形成器中含噪語(yǔ)音信號(hào)的功率,表示噪聲信號(hào)的功率的估計(jì)值;
(4)利用判決引導(dǎo)方法求解含噪語(yǔ)音信號(hào)的先驗(yàn)信噪比ε
式四中,η為平滑系數(shù),較佳取值為0.85,γold為含噪語(yǔ)音信號(hào)的上一幀的后驗(yàn)信噪比,GH1old表示語(yǔ)音信號(hào)上一幀的H1狀態(tài)時(shí)的語(yǔ)音譜增益;
(5)求解含噪語(yǔ)音信號(hào)中語(yǔ)音存在似然度GLR
其中
(6)求解含噪語(yǔ)音信號(hào)中語(yǔ)音存在的條件先驗(yàn)概率P(H1|FBF)
(7)計(jì)算含噪語(yǔ)音信號(hào)中當(dāng)前幀的H1狀態(tài)語(yǔ)音譜增益GH1
(8)計(jì)算含噪語(yǔ)音信號(hào)中當(dāng)前幀的噪聲信號(hào)估計(jì)值
其中為動(dòng)態(tài)時(shí)域一階平滑系數(shù),其中,α取值0.85,E(N|FBF)是當(dāng)前幀中FBF條件下中噪聲期望估計(jì)值,其計(jì)算如下:其中,
P(H0|FBF)是語(yǔ)音不存在的條件概率,計(jì)算方法如下:
P(H0|FBF)=1-P(H1|FBF)
(9)計(jì)算FBF中的語(yǔ)音增益
其中,表示H1狀態(tài)下的語(yǔ)音增益,表示H0狀態(tài)下的語(yǔ)音增益,但是防止H0狀態(tài)語(yǔ)音衰減過(guò)多,通常將GH0改為Gmin,在這里Gmin=0.01(-20dB),其中Gmin是H0狀態(tài)即語(yǔ)音不存在時(shí)的下限約束,這里設(shè)置下限為-20dB,取值計(jì)算公式為10*lg0.01=-20dB;
(10)估計(jì)含噪語(yǔ)音信號(hào)中的噪聲信號(hào)
NFBF=FBF*(1-Gain) (式十)
其中,NFBF為FBF中的噪聲信號(hào)的估計(jì)值。
進(jìn)一步地,當(dāng)計(jì)算出固定波束形成器輸出的含噪語(yǔ)音信號(hào)中的噪聲信號(hào),由于自適應(yīng)消除模塊的輸出Y中包含了目標(biāo)信號(hào)T和殘余噪聲信號(hào)R,即,Y=T+R;而波束形成器中包含了目標(biāo)信號(hào)T和噪聲信號(hào)N,即FBF=T+N,而輸出Y是由FBF和阻塞矩陣模塊的輸出Z在自適應(yīng)消除模塊中做自適應(yīng)譜減而得到Y(jié)=FBF-wHZ。
由上述三個(gè)方程式進(jìn)行推導(dǎo)計(jì)算,即:
Y=T+R (方程一)
FBF=T+NFBF (方程二)
Y=FBF-wHZ (方程三)
通過(guò)如下的推導(dǎo)過(guò)程得到式十一:
R=Y(jié)-T=(FBF-wHZ)-T=(FBF-wHZ)-(FBF-NFBF)=NFBF-wHZ
所以,推導(dǎo)出殘余噪聲信號(hào)的計(jì)算公式:
R=NFBF-wHZ (式十一)
根據(jù)式十一計(jì)算得出參與噪聲信號(hào)。在計(jì)算出噪聲殘余信號(hào)后,將殘余噪聲信號(hào)反饋到自適應(yīng)消除模塊,自適應(yīng)消除模塊在進(jìn)行下一幀自適應(yīng)濾波時(shí),根據(jù)接收到的殘余噪聲信號(hào)更新自適應(yīng)消除模塊的濾波系數(shù),從而將含噪語(yǔ)音信號(hào)中的殘余噪聲信號(hào)進(jìn)一步消除,使得輸出信號(hào)中的殘余信號(hào)越來(lái)越小,而保持目標(biāo)信號(hào)不變,從而在進(jìn)一步減小噪聲信號(hào)的同時(shí)達(dá)到減小失真的目的。
式十二中,其中w是MC中自適應(yīng)算法的權(quán)重,μ是步長(zhǎng),Z是阻塞矩陣模塊的輸出的相干噪聲信號(hào),R是殘余噪聲信號(hào),k是幀的索引。
值得注意的是,在式十中計(jì)算出固定波束形成器中的噪聲信號(hào)后,現(xiàn)有技術(shù)中有做法直接利用該噪聲信號(hào)計(jì)算得到目標(biāo)信號(hào)并輸出,而本發(fā)明是利用該噪聲信號(hào)計(jì)算輸出信號(hào)中的殘余噪聲信號(hào),其相比于上述做法得到的輸出信號(hào)效果更加穩(wěn)定,且目標(biāo)信號(hào)的失真更小。理由是在利用噪聲信號(hào)直接計(jì)算目標(biāo)信號(hào)并輸出時(shí),該噪聲信號(hào)的值為估計(jì)值,存在一定的不穩(wěn)定性,從而導(dǎo)致利用噪聲信號(hào)直接輸出的目標(biāo)信號(hào)也存在不穩(wěn)定的情形。而本發(fā)明將殘余噪聲信號(hào)通過(guò)自適應(yīng)濾波后不斷減小,能夠使得目標(biāo)信號(hào)的質(zhì)量不斷提高。
本發(fā)明通過(guò)獲取輸出的目標(biāo)信號(hào)中的殘余噪聲,并將其反饋至自適應(yīng)消除模塊以更新自適應(yīng)消除模塊中的濾波系數(shù),從而將輸出信號(hào)中殘余噪聲信號(hào)變小,而保持目標(biāo)信號(hào)不變,在達(dá)到降噪目的的同時(shí)也保證了目標(biāo)信號(hào)的失真更小。
以上結(jié)合附圖及實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域中普通技術(shù)人員可根據(jù)上述說(shuō)明對(duì)本發(fā)明做出種種變化例。因而,實(shí)施例中的某些細(xì)節(jié)不應(yīng)構(gòu)成對(duì)本發(fā)明的限定,本發(fā)明將以所附權(quán)利要求書界定的范圍作為本發(fā)明的保護(hù)范圍。