一種實(shí)時(shí)語(yǔ)音去噪的方法和設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明提供了一種實(shí)時(shí)語(yǔ)音去噪的方法,該方法包括:根據(jù)語(yǔ)音接收裝置所接收的語(yǔ)音輸入生成頻域帶噪語(yǔ)音信號(hào);根據(jù)所述頻域帶噪語(yǔ)音信號(hào)計(jì)算對(duì)數(shù)譜后驗(yàn)信噪比,所述對(duì)數(shù)譜后驗(yàn)信噪比為當(dāng)前幀頻域帶噪語(yǔ)音信號(hào)的功率譜的對(duì)數(shù)值與前一幀噪聲功率估計(jì)值的對(duì)數(shù)值之間的比值;基于加權(quán)噪聲估計(jì)算法根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比得到噪聲功率譜估計(jì)值;根據(jù)所述噪聲功率譜估計(jì)值生成維納濾波的增益函數(shù),根據(jù)該增益函數(shù)對(duì)所述頻域帶噪語(yǔ)音信號(hào)進(jìn)行濾波,以生成頻域去噪語(yǔ)音信號(hào);根據(jù)所述頻域去噪語(yǔ)音信號(hào)生成時(shí)域去噪語(yǔ)音信號(hào),該時(shí)域去噪語(yǔ)音信號(hào)由所述語(yǔ)音接收裝置進(jìn)一步處理。相應(yīng)地,本發(fā)明還提供了一種實(shí)時(shí)語(yǔ)音去噪的設(shè)備。
【專(zhuān)利說(shuō)明】
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語(yǔ)音數(shù)字處理領(lǐng)域,尤其涉及一種實(shí)時(shí)語(yǔ)音去噪的方法和設(shè)備。 一種實(shí)時(shí)語(yǔ)音去噪的方法和設(shè)備
【背景技術(shù)】
[0002] 在噪聲抑制方面,維納濾波算法一直是最重要的、也是效果最好的估計(jì)算法,被廣 泛應(yīng)用于圖像、視頻、語(yǔ)音處理等各種領(lǐng)域中。其中,在語(yǔ)音去噪方面,目前存在很多基于維 納濾波的語(yǔ)音去噪方法。但是,這些方法通常不能很好地應(yīng)用于處理能力有限的語(yǔ)音接收 裝置,例如智能移動(dòng)終端。以智能移動(dòng)終端為例,這種方法應(yīng)用上的局限性體現(xiàn)在:第一、現(xiàn) 有語(yǔ)音去噪方法追蹤噪聲的速度不夠快,方法實(shí)現(xiàn)的復(fù)雜度比較高,因此不符合智能移動(dòng) 終端的實(shí)時(shí)運(yùn)算需求;第二、在對(duì)實(shí)時(shí)噪聲進(jìn)行估計(jì)的時(shí)候,現(xiàn)有的做法通常是將帶噪語(yǔ)音 信號(hào)的起始幀作為初始噪聲,如此一來(lái),會(huì)導(dǎo)致在語(yǔ)音開(kāi)始后的一段時(shí)間內(nèi)無(wú)法準(zhǔn)確跟蹤 噪聲,進(jìn)而導(dǎo)致在這段時(shí)間內(nèi)的處理后的聲音會(huì)發(fā)生失真。雖然這段時(shí)間通常都比較短,但 是使用該智能移動(dòng)終端的用戶還是會(huì)非常明顯地感覺(jué)到聲音的失真,因此對(duì)用戶的使用體 驗(yàn)造成一定的影響。此外,目前基于維納濾波的語(yǔ)音去噪方法在對(duì)弱語(yǔ)音和噪聲進(jìn)行區(qū)分 方面還不夠完善,因此容易導(dǎo)致弱語(yǔ)音的失真。
[0003] 因此,希望提出一種可以解決上述問(wèn)題的基于維納濾波的實(shí)時(shí)語(yǔ)音去噪的方法和 設(shè)備。
【發(fā)明內(nèi)容】
[0004] 為了克服現(xiàn)有技術(shù)中的上述缺陷,本發(fā)明提供了一種實(shí)時(shí)語(yǔ)音去噪的方法,該方 法包括:
[0005] 根據(jù)語(yǔ)音接收裝置所接收的語(yǔ)音輸入生成頻域帶噪語(yǔ)音信號(hào);
[0006] 根據(jù)所述頻域帶噪語(yǔ)音信號(hào)計(jì)算對(duì)數(shù)譜后驗(yàn)信噪比,所述對(duì)數(shù)譜后驗(yàn)信噪比為 當(dāng)前幀頻域帶噪語(yǔ)音信號(hào)的功率譜的對(duì)數(shù)值與前一幀噪聲功率估計(jì)值的對(duì)數(shù)值之間的比 值;
[0007] 基于加權(quán)噪聲估計(jì)算法根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比得到噪聲功率譜估計(jì)值;
[0008] 根據(jù)所述噪聲功率譜估計(jì)值生成維納濾波的增益函數(shù),根據(jù)該增益函數(shù)對(duì)所述頻 域帶噪語(yǔ)音信號(hào)進(jìn)行濾波,以生成頻域去噪語(yǔ)音信號(hào);
[0009] 根據(jù)所述頻域去噪語(yǔ)音信號(hào)生成時(shí)域去噪語(yǔ)音信號(hào),該時(shí)域去噪語(yǔ)音信號(hào)由所述 語(yǔ)音接收裝置進(jìn)一步處理。
[0010] 根據(jù)本發(fā)明的一個(gè)方面,該方法中所述對(duì)數(shù)值是以e為底的自然對(duì)數(shù)值。
[0011] 根據(jù)本發(fā)明的一個(gè)方面,該方法中所述計(jì)算所述對(duì)數(shù)譜后驗(yàn)信噪比包括:采用高 斯白噪聲的功率值作為所述頻域帶噪語(yǔ)音信號(hào)的初始噪聲功率估計(jì)值。
[0012] 根據(jù)本發(fā)明的另一個(gè)方面,該方法中所述基于加權(quán)噪聲估計(jì)算法根據(jù)所述對(duì)數(shù)譜 后驗(yàn)信噪比得到噪聲功率譜估計(jì)值包括:計(jì)算加權(quán)因子;設(shè)定標(biāo)記值,該標(biāo)記值用于區(qū)分 強(qiáng)語(yǔ)音幀和弱語(yǔ)音幀,并根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比、所述加權(quán)因子以及所述標(biāo)記值得到 所述噪聲功率譜估計(jì)值。
[0013] 根據(jù)本發(fā)明的又一個(gè)方面,該方法中設(shè)定標(biāo)記值,并根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比、 所述加權(quán)因子以及所述標(biāo)記值得到噪聲功率譜估計(jì)值包括:若當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信 噪比的數(shù)值大于第一閾值,則判斷當(dāng)前幀信號(hào)為強(qiáng)語(yǔ)音,此時(shí)設(shè)定所述標(biāo)記值,且保持噪聲 功率譜估計(jì)值恒定;若當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值小于等于第一閾值且設(shè)定有 所述標(biāo)記值時(shí),則判斷當(dāng)前幀信號(hào)為跟隨在強(qiáng)語(yǔ)音之后的弱語(yǔ)音,此時(shí)令該標(biāo)記值逐步遞 減至預(yù)定值并根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比和所述加權(quán)因子更新所述噪聲功率譜估計(jì)值;若 當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值小于等于第一閾值且沒(méi)有設(shè)定所述標(biāo)記值時(shí),此時(shí) 根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比和所述加權(quán)因子更新所述噪聲功率譜估計(jì)值。
[0014] 根據(jù)本發(fā)明的又一個(gè)方面,該方法中所述標(biāo)記值的定義為:
[0015]
【權(quán)利要求】
1. 一種實(shí)時(shí)語(yǔ)音去噪的方法,該方法包括: 根據(jù)語(yǔ)音接收裝置所接收的語(yǔ)音輸入生成頻域帶噪語(yǔ)音信號(hào); 根據(jù)所述頻域帶噪語(yǔ)音信號(hào)計(jì)算對(duì)數(shù)譜后驗(yàn)信噪比,所述對(duì)數(shù)譜后驗(yàn)信噪比為當(dāng)前幀 頻域帶噪語(yǔ)音信號(hào)的功率譜的對(duì)數(shù)值與前一幀噪聲功率估計(jì)值的對(duì)數(shù)值之間的比值; 基于加權(quán)噪聲估計(jì)算法根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比得到噪聲功率譜估計(jì)值; 根據(jù)所述噪聲功率譜估計(jì)值生成維納濾波的增益函數(shù),根據(jù)該增益函數(shù)對(duì)所述頻域帶 噪語(yǔ)音信號(hào)進(jìn)行濾波,以生成頻域去噪語(yǔ)音信號(hào); 根據(jù)所述頻域去噪語(yǔ)音信號(hào)生成時(shí)域去噪語(yǔ)音信號(hào),該時(shí)域去噪語(yǔ)音信號(hào)由所述語(yǔ)音 接收裝置進(jìn)一步處理。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述對(duì)數(shù)值是以e為底的自然對(duì)數(shù)值。
3. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述計(jì)算所述對(duì)數(shù)譜后驗(yàn)信噪比包括: 采用高斯白噪聲的功率值作為所述頻域帶噪語(yǔ)音信號(hào)的初始噪聲功率估計(jì)值。
4. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述基于加權(quán)噪聲估計(jì)算法根據(jù)所述對(duì)數(shù)譜 后驗(yàn)信噪比得到噪聲功率譜估計(jì)值包括: 計(jì)算加權(quán)因子; 設(shè)定標(biāo)記值,該標(biāo)記值用于區(qū)分強(qiáng)語(yǔ)音幀和弱語(yǔ)音幀,并根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比、 所述加權(quán)因子以及所述標(biāo)記值得到所述噪聲功率譜估計(jì)值。
5. 根據(jù)權(quán)利要求4所述的方法,其中,設(shè)定標(biāo)記值,并根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比、所 述加權(quán)因子以及所述標(biāo)記值得到噪聲功率譜估計(jì)值包括: 若當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值大于第一閾值,則判斷當(dāng)前幀信號(hào)為強(qiáng)語(yǔ) 音,此時(shí)設(shè)定所述標(biāo)記值,且保持噪聲功率譜估計(jì)值恒定; 若當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值小于等于第一閾值且設(shè)定有所述標(biāo)記值時(shí), 則判斷當(dāng)前幀信號(hào)為跟隨在強(qiáng)語(yǔ)音之后的弱語(yǔ)音,此時(shí)令該標(biāo)記值逐步遞減至預(yù)定值并根 據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比和所述加權(quán)因子更新所述噪聲功率譜估計(jì)值; 若當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值小于等于第一閾值且沒(méi)有設(shè)定所述標(biāo)記值 時(shí),此時(shí)根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比和所述加權(quán)因子更新所述噪聲功率譜估計(jì)值。
6. 根據(jù)權(quán)利要求5所述的方法,其中: 所述標(biāo)記值的定義為:
所述標(biāo)記值遞減的步長(zhǎng)的定義為:
〇
7. 根據(jù)權(quán)利要求1或2所述的方法,其中,根據(jù)所述頻域去噪語(yǔ)音信號(hào)生成時(shí)域去噪語(yǔ) 音信號(hào)包括: 所述頻域去噪語(yǔ)音信號(hào)由順序相接的多組數(shù)據(jù)構(gòu)成,依次對(duì)每一組數(shù)據(jù)進(jìn)行處理,其 中: 若待處理的一組數(shù)據(jù)為所述頻域去噪語(yǔ)音信號(hào)的第一組數(shù)據(jù),則緩存所述第一組數(shù)據(jù) 的最后一幀數(shù)據(jù),以及將一幀零數(shù)據(jù)補(bǔ)充在所述第一組數(shù)據(jù)之前,利用疊接相加法對(duì)補(bǔ)充 了所述一幀零數(shù)據(jù)后的所述第一組數(shù)據(jù)進(jìn)行處理,并緩存處理后的所述第一組數(shù)據(jù)的最后 一幀數(shù)據(jù)的疊接結(jié)果、以及緩存所述第一組數(shù)據(jù)的最后一幀數(shù)據(jù)中未完全疊接的數(shù)據(jù)的位 置信息; 若待處理的一組數(shù)據(jù)為所述頻域去噪語(yǔ)音信號(hào)的第N組數(shù)據(jù),其中N大于等于2,則緩 存所述第N組數(shù)據(jù)的最后一幀數(shù)據(jù),以及將第N-1組數(shù)據(jù)的最后一幀數(shù)據(jù)補(bǔ)充在所述第N 組數(shù)據(jù)之前,基于所述第N-1組數(shù)據(jù)的最后一幀數(shù)據(jù)中未完全疊接的數(shù)據(jù)的位置信息,利 用疊接相加法對(duì)補(bǔ)充了所述第N-1組數(shù)據(jù)的最后一幀數(shù)據(jù)的所述第N組數(shù)據(jù)進(jìn)行處理,將 處理后的疊接結(jié)果與所述第N-1組數(shù)據(jù)的最后一幀數(shù)據(jù)的疊接結(jié)果進(jìn)行疊加,并緩存處理 后的所述第N組數(shù)據(jù)的最后一幀數(shù)據(jù)的疊接結(jié)果、以及緩存所述第N組數(shù)據(jù)的最后一幀數(shù) 據(jù)中未完全疊接的數(shù)據(jù)的位置信息。
8. 根據(jù)權(quán)利要求1或2所述的方法,根據(jù)所述頻域去噪語(yǔ)音信號(hào)生成時(shí)域去噪語(yǔ)音信 號(hào)之后還包括: 對(duì)所述時(shí)域去噪語(yǔ)音信號(hào)進(jìn)行帶通矯正。
9. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述語(yǔ)音接收裝置對(duì)所述時(shí)域去噪語(yǔ)音信號(hào) 的進(jìn)一步處理包括發(fā)送、播放和/或儲(chǔ)存。
10. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述語(yǔ)音接收裝置為智能移動(dòng)終端。
11. 一種實(shí)時(shí)語(yǔ)音去噪的設(shè)備,該設(shè)備包括: 時(shí)頻轉(zhuǎn)換模塊,用于根據(jù)語(yǔ)音接收裝置所接收的語(yǔ)音輸入生成頻域帶噪語(yǔ)音信號(hào); 信噪比計(jì)算模塊,用于根據(jù)所述頻域帶噪語(yǔ)音信號(hào)計(jì)算對(duì)數(shù)譜后驗(yàn)信噪比,所述對(duì)數(shù) 譜后驗(yàn)信噪比為當(dāng)前幀頻域帶噪語(yǔ)音信號(hào)的功率譜的對(duì)數(shù)值與前一幀噪聲功率估計(jì)值的 對(duì)數(shù)值之間的比值; 估計(jì)模塊,用于基于加權(quán)噪聲估計(jì)算法根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比得到噪聲功率譜估 計(jì)值; 維納濾波模塊,用于根據(jù)所述噪聲功率譜估計(jì)值生成維納濾波的增益函數(shù),根據(jù)該增 益函數(shù)對(duì)所述頻域帶噪語(yǔ)音信號(hào)進(jìn)行濾波,以生成頻域去噪語(yǔ)音信號(hào); 頻時(shí)轉(zhuǎn)換模塊,用于根據(jù)所述頻域去噪語(yǔ)音信號(hào)生成時(shí)域去噪語(yǔ)音信號(hào)。
12. 根據(jù)權(quán)利要求11所述的設(shè)備,其中,所述對(duì)數(shù)值是以e為底的對(duì)數(shù)值。
13. 根據(jù)權(quán)利要求11或12所述的設(shè)備,其中: 該設(shè)備還包括噪聲發(fā)生模塊,用于生成高斯白噪聲; 所述信噪比計(jì)算模塊計(jì)算所述對(duì)數(shù)譜后驗(yàn)信噪比時(shí)采用所述高斯白噪聲的功率值作 為所述頻域帶噪語(yǔ)音信號(hào)的初始噪聲功率估計(jì)值。
14. 根據(jù)權(quán)利要求11或12所述的設(shè)備,其中,所述估計(jì)模塊包括: 加權(quán)因子計(jì)算單元,用于計(jì)算加權(quán)因子; 噪聲功率譜估計(jì)單元,用于設(shè)定標(biāo)記值,該標(biāo)記值用于區(qū)分強(qiáng)語(yǔ)音幀和弱語(yǔ)音幀,并根 據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比、所述加權(quán)因子以及所述標(biāo)記值得到所述噪聲功率譜估計(jì)值。
15. 根據(jù)權(quán)利要求14所述的設(shè)備,其中,所述估計(jì)模塊還包括: 判斷單元,用于當(dāng)當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值大于第一閾值,判斷當(dāng)前幀 信號(hào)為強(qiáng)語(yǔ)音,觸發(fā)所述噪聲功率譜估計(jì)單元設(shè)定所述標(biāo)記值,且保持噪聲功率譜估計(jì)值 恒定; 以及用于當(dāng)當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值小于等于第一閾值且設(shè)定有所述 標(biāo)記值時(shí),判斷當(dāng)前幀信號(hào)為跟隨在強(qiáng)語(yǔ)音之后的弱語(yǔ)音,觸發(fā)所述噪聲功率譜估計(jì)單元 令該標(biāo)記值逐步遞減至預(yù)定值并根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比和所述加權(quán)因子更新所述噪 聲功率譜估計(jì)值; 以及用于當(dāng)當(dāng)前幀信號(hào)的對(duì)數(shù)譜后驗(yàn)信噪比的數(shù)值小于等于第一閾值且沒(méi)有設(shè)定所 述標(biāo)記值時(shí),根據(jù)所述對(duì)數(shù)譜后驗(yàn)信噪比和所述加權(quán)因子更新所述噪聲功率譜估計(jì)值。
16. 根據(jù)權(quán)利要求15所述的設(shè)備,其中: 所述標(biāo)記值的定義為:
所述標(biāo)記值遞減的步長(zhǎng)的定義為:
17. 根據(jù)權(quán)利要求11或12所述的設(shè)備,其中: 所述頻域去噪語(yǔ)音信號(hào)由順序相接的多組數(shù)據(jù)構(gòu)成,依次對(duì)每一組數(shù)據(jù)進(jìn)行處理,其 中: 若待處理的一組數(shù)據(jù)為所述頻域去噪語(yǔ)音信號(hào)的第一組數(shù)據(jù),所述頻時(shí)轉(zhuǎn)換模塊則緩 存所述第一組數(shù)據(jù)的最后一幀數(shù)據(jù),以及將一幀零數(shù)據(jù)補(bǔ)充在所述第一組數(shù)據(jù)之前,利用 疊接相加法對(duì)補(bǔ)充了所述一幀零數(shù)據(jù)后的所述第一組數(shù)據(jù)進(jìn)行處理,并緩存處理后的所述 第一組數(shù)據(jù)的最后一幀數(shù)據(jù)的疊接結(jié)果、以及緩存所述第一組數(shù)據(jù)的最后一幀數(shù)據(jù)中未完 全疊接的數(shù)據(jù)的位置信息; 若待處理的一組數(shù)據(jù)為所述頻域去噪語(yǔ)音信號(hào)的第N組數(shù)據(jù),其中N大于等于2,所述 頻時(shí)轉(zhuǎn)換模塊則緩存所述第N組數(shù)據(jù)的最后一幀數(shù)據(jù),以及將第N-1組數(shù)據(jù)的最后一幀數(shù) 據(jù)補(bǔ)充在所述第N組數(shù)據(jù)之前,基于所述第N-1組數(shù)據(jù)的最后一幀數(shù)據(jù)中未完全疊接的數(shù) 據(jù)的位置信息,利用疊接相加法對(duì)補(bǔ)充了所述第N-1組數(shù)據(jù)的最后一幀數(shù)據(jù)的所述第N組 數(shù)據(jù)進(jìn)行處理,將處理后的疊接結(jié)果與所述第N-1組數(shù)據(jù)的最后一幀數(shù)據(jù)的接結(jié)果進(jìn)行疊 力口,并緩存處理后的所述第N組數(shù)據(jù)的最后一幀數(shù)據(jù)的疊接結(jié)果、以及緩存所述第N組數(shù)據(jù) 的最后一幀數(shù)據(jù)中未完全疊接的數(shù)據(jù)的位置信息。
18. 根據(jù)權(quán)利要求11或12所述的設(shè)備,該設(shè)備還包括: 帶通濾波模塊,用于對(duì)所述時(shí)域去噪語(yǔ)音信號(hào)進(jìn)行帶通矯正。
19. 根據(jù)權(quán)利要求11或12所述的設(shè)備,該設(shè)備還包括: 處理模塊,用于所述語(yǔ)音接收裝置進(jìn)一步處理所述時(shí)域去噪語(yǔ)音信號(hào),其中,所述進(jìn)一 步處理包括發(fā)送、播放和/或儲(chǔ)存。
20. 根據(jù)權(quán)利要求11或12所述的設(shè)備,其中,所述語(yǔ)音接收裝置為智能移動(dòng)終端。
【文檔編號(hào)】G10L21/0232GK104103278SQ201310112271
【公開(kāi)日】2014年10月15日 申請(qǐng)日期:2013年4月2日 優(yōu)先權(quán)日:2013年4月2日
【發(fā)明者】朱寶 申請(qǐng)人:北京千橡網(wǎng)景科技發(fā)展有限公司