一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)及方法

文檔序號(hào)：2826374閱讀：325來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)及方法
【專利摘要】本發(fā)明公開了一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)及方法，系統(tǒng)包括無線定位發(fā)射模塊、無線定位接收模塊、麥克風(fēng)陣列語音接收模塊、語音增強(qiáng)模塊、遠(yuǎn)端語音播放模塊和通信模塊，其中無線定位發(fā)射模塊與無線定位接收模塊采用無線的方式連接，無線定位接收模塊和麥克風(fēng)陣列語音接收模塊分別與語音增強(qiáng)模塊連接，語音增強(qiáng)模塊與通信模塊連接，遠(yuǎn)端語音播放模塊與通信模塊連接。通話方法首先采用無線定位技術(shù)來對(duì)目標(biāo)聲源進(jìn)行定位，再對(duì)目標(biāo)說話人的語音采用麥克風(fēng)陣列進(jìn)行語音增強(qiáng)處理及通信。本發(fā)明具有定位快速準(zhǔn)確、增強(qiáng)效果好、魯棒性高等優(yōu)點(diǎn)，能有效提高現(xiàn)有通話系統(tǒng)的語音質(zhì)量。
【專利說明】一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音信號(hào)處理領(lǐng)域，特別是一種基于無線定位的麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)及方法。
【背景技術(shù)】
[0002]如何有效地提高噪聲環(huán)境下語音的通信質(zhì)量是語音處理中的一個(gè)難題。在實(shí)際應(yīng)用環(huán)境中，麥克風(fēng)在拾取語音信號(hào)時(shí)，會(huì)受到背景噪音、混響、其他說話人話音等信號(hào)的干擾。這些干擾和噪聲會(huì)顯著降低拾取語音信號(hào)的質(zhì)量和可懂度，從而導(dǎo)致語音通信系統(tǒng)性能的退化。因此，在許多通話應(yīng)用中都需要進(jìn)行有效的語音增強(qiáng)處理，以抑制噪聲、改善語音質(zhì)量、提高語音清晰度、可懂度和舒適度。
[0003]目前語音增強(qiáng)方法主要包括兩類，一類是基于單麥克風(fēng)的語音增強(qiáng)方法，包括譜減法、維納濾波、MMSE、卡爾曼濾波、小波變換等，這類方法利用單麥克風(fēng)接收語音信號(hào)，通過時(shí)域、頻域、小波變換域等濾波和處理來抑制噪聲，但由于只利用了一維的語音信號(hào)，因此其降噪效果具有較大的局限。另一類是基于麥克風(fēng)陣列的語音增強(qiáng)方法，這類方法將陣列信號(hào)處理技術(shù)應(yīng)用到語音增強(qiáng)中，利用多個(gè)麥克風(fēng)接收到的語音信號(hào)里包含的空間相位信息對(duì)輸入語音進(jìn)行空間濾波，形成具有指向性的空間波束對(duì)指定方向上的語音信號(hào)進(jìn)行增強(qiáng)，同時(shí)抑制其他方向上的干擾，具有靈活的波束控制、較高的空間分辨率、較高的信號(hào)增益與較強(qiáng)的抗干擾能力等優(yōu)點(diǎn)，可提供比單麥克風(fēng)語音增強(qiáng)方法更好的噪聲抑制效果，在實(shí)際中得到越來越廣泛的使用。
[0004]通常情況下，使用麥克風(fēng)陣列進(jìn)行波束形成之前需要確定波束的指向，即信號(hào)的來波方向，現(xiàn)有的來波方向估計(jì)主要依賴陣列中的各個(gè)麥克風(fēng)接收到的語音信號(hào)來進(jìn)行，這種方法在一些聲學(xué)環(huán)境較為復(fù)雜的通話應(yīng)用中，特別是在多音源并發(fā)、音源快速移動(dòng)、噪音干擾大等場(chǎng)景時(shí)，例如可視通話手機(jī)、車載免提電話、多媒體教室、視頻會(huì)議、智能電視等，存在著以下不足:
[0005](I)現(xiàn)有的麥克風(fēng)陣列語音增強(qiáng)方法大多是假設(shè)單一音源，當(dāng)多音源并發(fā)時(shí)，容易引起來波方向角估計(jì)誤判，令語音增強(qiáng)性能顯著下降；
[0006](2)現(xiàn)有的麥克風(fēng)陣列語音增強(qiáng)方法對(duì)來波方向估計(jì)通常需要采用迭代的方法，實(shí)時(shí)調(diào)整速度有限，當(dāng)期望音源快速移動(dòng)時(shí)，來波方向估計(jì)可能會(huì)滯后或模糊，導(dǎo)致波束形成效果下降；
[0007](3)當(dāng)采用近場(chǎng)波束形成對(duì)語音信號(hào)進(jìn)行幅度補(bǔ)償時(shí)，現(xiàn)有技術(shù)較難獲知音源與陣元間的準(zhǔn)確距離，因而影響近場(chǎng)波束的效果和語音增強(qiáng)性能。
[0008]隨著無線定位技術(shù)的發(fā)展，近年來出現(xiàn)了多種無線定位新技術(shù)，使得近距離三維高精度無線定位成為可能。例如，目前的超寬帶(Ultra Wide Band, UWB)無線定位技術(shù)能提供最高達(dá)10_6米的定位精度。與基于音頻的定位相比，超寬帶無線定位具有精度高、不受聲學(xué)噪聲影響、速度快等優(yōu)點(diǎn)，為解決目前語音通話系統(tǒng)中麥克風(fēng)陣列語音增強(qiáng)的來波方向估計(jì)的不足提供良好的技術(shù)基礎(chǔ)。
【發(fā)明內(nèi)容】

[0009]針對(duì)現(xiàn)有麥克風(fēng)陣列語音增強(qiáng)中來波方向估計(jì)技術(shù)在實(shí)際通話系統(tǒng)中應(yīng)用時(shí)存在的局限，本發(fā)明提供了一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)及方法，首先采用無線定位技術(shù)來對(duì)目標(biāo)聲源進(jìn)行定位，再對(duì)目標(biāo)說話人的語音采用麥克風(fēng)陣列進(jìn)行語音增強(qiáng)處理及通信，具有定位快速準(zhǔn)確、增強(qiáng)效果好、魯棒性高等優(yōu)點(diǎn)，能有效提高現(xiàn)有通話系統(tǒng)的語音質(zhì)量。本發(fā)明還提供了實(shí)現(xiàn)上述無線定位麥克風(fēng)陣列語音增強(qiáng)通話方法的通話系統(tǒng)，該系統(tǒng)使用方便、抗干擾性能強(qiáng)。本發(fā)明可以廣泛應(yīng)用于可視通話手機(jī)、車載免提電話、多媒體教室、視頻會(huì)議、智能電視等多種場(chǎng)合。
[0010]本發(fā)明提供的基于無線定位的麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)，由無線定位發(fā)射模塊、無線定位接收模塊、麥克風(fēng)陣列語音接收模塊、語音增強(qiáng)模塊、遠(yuǎn)端語音播放模塊、通信模塊共同構(gòu)成，其中無線定位發(fā)射模塊與無線定位接收模塊采用無線的方式連接，無線定位接收模塊和麥克風(fēng)陣列語音接收模塊分別與語音增強(qiáng)模塊連接，語音增強(qiáng)模塊與通信模塊連接，遠(yuǎn)端語音播放模塊與通信模塊連接。無線定位發(fā)射模塊的安裝位置與說話人口的位置具有固定的坐標(biāo)關(guān)系，用于發(fā)射無線定位信號(hào)；無線定位接收模塊用于接收無線定位發(fā)射模塊的定位信號(hào)，完成對(duì)無線定位發(fā)射模塊的坐標(biāo)定位；麥克風(fēng)陣列語音接收模塊中各陣元的位置與無線定位接收模塊的位置具有固定的坐標(biāo)關(guān)系，用于完成多路語音信號(hào)的接收；語音增強(qiáng)模塊完成無線坐標(biāo)和聲學(xué)坐標(biāo)的轉(zhuǎn)換，并采用波束形成技術(shù)來完成目標(biāo)說話人語音的增強(qiáng)；遠(yuǎn)端語音播放模塊用于播放遠(yuǎn)端通話方的語音；通信模塊將語音增強(qiáng)模塊輸出的語音編碼調(diào)制后發(fā)送給遠(yuǎn)端通話方，接收遠(yuǎn)端通話方的語音數(shù)據(jù)并送至遠(yuǎn)端語音播放模塊進(jìn)行播放。
[0011]上述遠(yuǎn)端語音播放模塊，由遠(yuǎn)端語音無線發(fā)送模塊、遠(yuǎn)端語音無線接收模塊、音頻放大播放模塊構(gòu)成，其中遠(yuǎn)端語音無線發(fā)送模塊、遠(yuǎn)端語音無線接收模塊采用無線的方式連接，遠(yuǎn)端語音無線接收模塊與音頻放大播放模塊連接。遠(yuǎn)端語音無線發(fā)送模塊完成遠(yuǎn)端語音的無線發(fā)送；遠(yuǎn)端語音無線接收模塊完成遠(yuǎn)端語音的無線接收；音頻放大播放模塊完成遠(yuǎn)端語音的放大和播放。
[0012]上述遠(yuǎn)端語音無線發(fā)送模塊、遠(yuǎn)端語音無線接收模塊，采用超寬帶無線傳輸技術(shù)進(jìn)行無線數(shù)據(jù)的傳輸。
[0013]上述無線定位發(fā)射模塊、無線定位接收模塊，采用超寬帶無線定位技術(shù)來完成無線定位。
[0014]上述遠(yuǎn)端語音無線接收模塊、音頻放大播放模塊、無線定位發(fā)射模塊，集成為無線耳機(jī)端，上述無線定位接收模塊、麥克風(fēng)陣列語音接收模塊、語音增強(qiáng)模塊、通信模塊、遠(yuǎn)端語音無線發(fā)送模塊集成為主機(jī)端。
[0015]本發(fā)明提供的基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話方法，其步驟包括:
[0016]步驟1:確定無線定位發(fā)射模塊與目標(biāo)說話人口之間的相對(duì)坐標(biāo)，確定麥克風(fēng)陣列語音接收模塊中各陣元與無線定位接收模塊的相對(duì)坐標(biāo)；
[0017]步驟2:初始化無線定位發(fā)射模塊、無線定位接收模塊、語音增強(qiáng)模塊；
[0018]步驟3:無線定位發(fā)射模塊發(fā)射無線定位信號(hào)，無線定位接收模塊接收到定位信號(hào)后對(duì)無線定位發(fā)射模塊進(jìn)行定位，確定無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)；根據(jù)無線定位發(fā)射模塊與目標(biāo)說話人口之間的相對(duì)坐標(biāo)、無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)、以及麥克風(fēng)陣列語音接收模塊中各陣元與無線定位接收模塊的相對(duì)坐標(biāo)，計(jì)算目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的相對(duì)坐標(biāo)；
[0019]步驟4:根據(jù)目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的相對(duì)坐標(biāo)調(diào)整語音增強(qiáng)模塊中波束形成器的時(shí)延補(bǔ)償權(quán)值，使其增強(qiáng)目標(biāo)說話人口方向的聲音，得到語音增強(qiáng)后的信號(hào)；
[0020]步驟5:步驟4得到的增強(qiáng)后語音通過通信模塊發(fā)送給遠(yuǎn)端通話方，并通過通信模塊接收遠(yuǎn)端通話方的語音數(shù)據(jù)，并送至遠(yuǎn)端語音播放模塊進(jìn)行播放。
[0021]上述步驟2中，無線定位發(fā)射模塊、無線定位接收模塊、語音增強(qiáng)模塊的初始化，具體包括以下步驟:
[0022]步驟2.1:無線定位接收模塊中的接收天線完成時(shí)間同步，無線定位發(fā)射模塊進(jìn)入準(zhǔn)備發(fā)射定位信號(hào)狀態(tài)；
[0023]步驟2.2:語音增強(qiáng)模塊中的波束形成器權(quán)值矩陣置零，所述權(quán)值矩陣包括時(shí)延補(bǔ)償矩陣、固定波束形成權(quán)值矩陣、阻塞權(quán)值矩陣和自適應(yīng)波束形成權(quán)值矩陣；[0024]上述步驟3中，無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)采用以下步驟進(jìn)行確定:
[0025]步驟3.1:無線定位發(fā)射模塊周期性發(fā)射定位脈沖序列，其中，脈沖序列帶有該無線定位發(fā)射模塊的設(shè)備號(hào)和脈沖序列的發(fā)射時(shí)間戳；
[0026]步驟3.2:無線定位接收模塊的接收天線接收定位脈沖序列，并計(jì)算定位脈沖序列到達(dá)不同UWB定位芯片的傳播時(shí)延TOA ；
[0027]步驟3.3:無線定位接收模塊根據(jù)各UWB定位芯片的傳播時(shí)延Τ0Α,計(jì)算無線定位發(fā)射模塊到各UWB定位芯片的距離；
[0028]步驟3.4:無線定位接收模塊根據(jù)步驟3.3所得距離的方程組計(jì)算無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)；
[0029]上述步驟4中，語音增強(qiáng)模塊波束形成器的時(shí)延補(bǔ)償權(quán)值矩陣，采用以下方式計(jì)算:
[0030]步驟4.1a:根據(jù)目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的相對(duì)坐標(biāo)計(jì)算目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的空間距離；
[0031]步驟4.2a:目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的空間距離除以聲音速度，得到目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的傳播時(shí)間；
[0032]步驟4.3a:根據(jù)傳播時(shí)間計(jì)算時(shí)延補(bǔ)償權(quán)值矩陣，使得麥克風(fēng)陣列語音接收模塊中各陣元接收的目標(biāo)說話人語音經(jīng)過時(shí)延補(bǔ)償權(quán)值矩陣后同步。
[0033]上述步驟4中，語音增強(qiáng)模塊波束形成器的自適應(yīng)濾波器系數(shù)，采用以下方式計(jì)算:
[0034]步驟4.1b:假定目標(biāo)說話人的語音共有Q個(gè)信源存在，將第q個(gè)信號(hào)(其中q=l，2，…，Q)的陣列輸出與該信號(hào)在時(shí)刻k的期望形式之間的代價(jià)函數(shù)表示為自適應(yīng)濾波器系數(shù)矩陣的函數(shù)；
[0035]步驟4.2b:計(jì)算代價(jià)函數(shù)對(duì)于自適應(yīng)濾波器系數(shù)矩陣的梯度函數(shù)；
[0036]步驟4.3b:采用梯度下降法調(diào)整自適應(yīng)濾波器系數(shù)矩陣，并計(jì)算相應(yīng)的代價(jià)函數(shù)值。
[0037]步驟4.4b:采用新的自適應(yīng)濾波器系數(shù)矩陣對(duì)輸入語音信號(hào)進(jìn)行語音增強(qiáng)，并計(jì)算語音增強(qiáng)后陣列輸出信號(hào)與該信號(hào)期望形式之間的代價(jià)函數(shù)值，如果當(dāng)前代價(jià)函數(shù)值與前一次迭代的代價(jià)函數(shù)值變化量小于給定值，或迭代次數(shù)超出預(yù)設(shè)次數(shù)，則輸出自適應(yīng)濾波器系數(shù)矩陣并結(jié)束，否則轉(zhuǎn)步驟4.3b。
[0038]上述步驟4中，語音增強(qiáng)模塊波束形成器的自適應(yīng)濾波器系數(shù)矩陣，還可以采用以下方式計(jì)算:
[0039]步驟4.1c:將波束形成器輸出信號(hào)的平均功率表示為自適應(yīng)濾波器系數(shù)矩陣的函數(shù)；
[0040]步驟4.2c:在滿足約束條件/a ( Θ d) = I條件下，將平均功率函數(shù)對(duì)自適應(yīng)濾波器系數(shù)矩陣中的每個(gè)元素求偏導(dǎo)，并令偏導(dǎo)等于O ;
[0041]步驟4.3c:將得到的方程組成方程組并求解，得到當(dāng)前最優(yōu)的自適應(yīng)濾波器系數(shù)矩陣。
[0042]與現(xiàn)有技術(shù)相比，本發(fā)明的有益之處在于:
[0043](I)準(zhǔn)確快速對(duì)準(zhǔn)說話人，語音增強(qiáng)性能好。本發(fā)明采用無線定位技術(shù)對(duì)音源進(jìn)行定位，與傳統(tǒng)的音頻定位方法相比定位更精確，有效提高了語言增強(qiáng)的降噪性能；同時(shí)不需要復(fù)雜的迭代運(yùn)算，提高了系統(tǒng)對(duì)移動(dòng)音源的實(shí)時(shí)跟蹤速度和準(zhǔn)確度；
[0044](2)適用于各種應(yīng)用場(chǎng)景，魯棒性好。由于無線定位不受聲學(xué)環(huán)境噪聲的影響，因此語音增強(qiáng)系統(tǒng)可以實(shí)時(shí)精確地鎖定目標(biāo)說話人，即使當(dāng)通話系統(tǒng)處于多人同時(shí)說話而形成多音源并發(fā)場(chǎng)景或噪音干擾大的環(huán)境時(shí)，波束形成語言增強(qiáng)系統(tǒng)仍可對(duì)準(zhǔn)期望音源，獲得好的語音增強(qiáng)效果；
[0045](3)使用方便。本發(fā)明可以方便地集成到現(xiàn)有的各種通話系統(tǒng)中，例如，可以將遠(yuǎn)端語音無線接收模塊、音頻放大播放模塊、無線定位發(fā)射模塊集成為無線耳機(jī)端，無線定位接收模塊、麥克風(fēng)陣列語音接收模塊、語音增強(qiáng)模塊、通信模塊、遠(yuǎn)端語音無線發(fā)送模塊集成為主機(jī)端，使用起來非常方便。
【專利附圖】

【附圖說明】
[0046]圖1為本發(fā)明提供的基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)結(jié)構(gòu)框圖；
[0047]圖2為本發(fā)明實(shí)施例1硬件結(jié)構(gòu)框圖；
[0048]圖3為本發(fā)明實(shí)施例1中采用無線超寬帶技術(shù)進(jìn)行定位的流程圖；
[0049]圖4為本發(fā)明實(shí)施例1中系統(tǒng)進(jìn)行語音增強(qiáng)的流程圖；
[0050]圖5為本發(fā)明實(shí)施例2主機(jī)端、無線耳機(jī)端系統(tǒng)結(jié)構(gòu)框圖；
[0051]圖6為本發(fā)明實(shí)施例2主機(jī)端、無線耳機(jī)端硬件結(jié)構(gòu)框圖；
【具體實(shí)施方式】
[0052]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明的具體實(shí)施作進(jìn)一步說明，但本發(fā)明的實(shí)施和保護(hù)范圍不限于此。
[0053]本發(fā)明的硬件結(jié)構(gòu)如圖1所示，由通信模塊101、語音增強(qiáng)模塊102、無線定位接收模塊103、麥克風(fēng)陣列語音接收模塊104、無線定位發(fā)射模塊105、遠(yuǎn)端語音播放模塊106共同構(gòu)成，其中無線定位發(fā)射模塊105與無線定位接收模塊103采用無線的方式連接，無線定位接收模塊103和麥克風(fēng)陣列語音接收模塊104分別與語音增強(qiáng)模塊102連接，語音增強(qiáng)模塊102與通信模塊101連接，遠(yuǎn)端語音播放模塊106與通信模塊101連接。無線定位發(fā)射模塊105的安裝位置與說話人口的位置具有固定的坐標(biāo)關(guān)系，用于發(fā)射無線定位信號(hào)；無線定位接收模塊103用于接收無線定位發(fā)射模塊105的定位信號(hào)，完成對(duì)無線定位發(fā)射模塊的坐標(biāo)定位；麥克風(fēng)陣列語音接收模塊104中各陣元的位置與無線定位接收模塊的位置具有固定的坐標(biāo)關(guān)系，用于完成多路語音信號(hào)的接收；語音增強(qiáng)模塊102完成無線坐標(biāo)和聲學(xué)坐標(biāo)的轉(zhuǎn)換，并采用波束形成技術(shù)來完成目標(biāo)說話人語音的增強(qiáng)；遠(yuǎn)端語音播放模塊106用于播放遠(yuǎn)端通話方的語音；通信模塊101將語音增強(qiáng)模塊輸出的語音編碼調(diào)制后發(fā)送給遠(yuǎn)端通話方，接收遠(yuǎn)端通話方的語音數(shù)據(jù)并送至遠(yuǎn)端語音播放模塊進(jìn)行播放。
[0054]本發(fā)明的第一個(gè)實(shí)施例中，其硬件結(jié)構(gòu)如圖2所示，由通信模塊201、嵌入式處理器202、UWB定位芯片a203、UWB定位芯片b204、UWB定位芯片c205、UWB定位芯片d206、UWB發(fā)射芯片207、多路模/數(shù)轉(zhuǎn)換芯片208、麥克風(fēng)陣列209、遠(yuǎn)端語音無線發(fā)送模塊210共同構(gòu)成，其中UWB發(fā)射芯片207用以實(shí)現(xiàn)無線定位發(fā)射模塊105，完成周期性發(fā)射無線定位信號(hào)，可以選用DecaWave公司的ScenSor芯片來實(shí)現(xiàn)；UWB定位芯片a203、UWB定位芯片b204、UffB定位芯片c205、UWB定位芯片d206用以實(shí)現(xiàn)無線定位接收模塊103，完成接收無線定位信號(hào)，確定無線定位發(fā)射芯片207的坐標(biāo),可以選用DecaWave公司的ScenSor芯片來實(shí)現(xiàn)；麥克風(fēng)陣列209和多路模/數(shù)轉(zhuǎn)換芯片208鏈接，用以實(shí)現(xiàn)麥克風(fēng)陣列語音接收模塊104，完成多路語音信號(hào)的接收。麥克風(fēng)陣列209的功能是將聲信號(hào)轉(zhuǎn)換為電信號(hào)，可根據(jù)應(yīng)用的需要選取現(xiàn)有的多種麥克風(fēng)來實(shí)現(xiàn)麥克風(fēng)陣列；多路模/數(shù)轉(zhuǎn)換芯片208的功能是將麥克風(fēng)陣列209輸出的模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)，可根據(jù)需要的音頻質(zhì)量要求選用不同精度和采樣率的多路模/數(shù)轉(zhuǎn)換芯片來實(shí)現(xiàn)；嵌入式處理器202用以實(shí)現(xiàn)語音增強(qiáng)模塊102，主要完成以下功能:1、控制UWB定位芯片a203、UffB定位芯片b204、UffB定位芯片c205、UffB定位芯片d206接收UWB發(fā)射芯片207的無線定位信號(hào)，并完成對(duì)UWB發(fā)射芯片207的坐標(biāo)定位；2、控制多路模/數(shù)轉(zhuǎn)換芯片208的工作，并完成接收信號(hào)的語音增強(qiáng)；3、控制通信模塊201，將語音增強(qiáng)后輸出語音編碼調(diào)制后發(fā)送給遠(yuǎn)端通話方。嵌入式處理器202可以采用MCU, DSP等來實(shí)現(xiàn)。
[0055]本發(fā)明實(shí)施例1中，采用以下步驟實(shí)現(xiàn)無線定位發(fā)射模塊定位并進(jìn)行語音信號(hào)的增強(qiáng):
[0056]步驟1:確定無線定位發(fā)射模塊與目標(biāo)說話人口之間的相對(duì)坐標(biāo)，例如，將無線定位發(fā)射模塊佩戴在目標(biāo)說話人右耳時(shí)，坐標(biāo)關(guān)系相對(duì)關(guān)系如下:設(shè)人正前方為Y坐標(biāo)軸正方向，建立右手直角坐標(biāo)系，設(shè)無線定位發(fā)射模塊的坐標(biāo)為(Xo，10, Z0)，則目標(biāo)說話人口的坐標(biāo)為U0-7，y0+7, z0-5),單位為厘米。確定麥克風(fēng)陣列語音接收模塊中各陣元與無線定位接收模塊的相對(duì)坐標(biāo)，以垂直正向目標(biāo)說話人放置的情況為例，以系統(tǒng)裝置的中心為坐標(biāo)原點(diǎn)，設(shè)人正前方為Y坐標(biāo)軸正方向，建立右手直角坐標(biāo)系，則無線定位接收模塊的四個(gè)UffB定位芯片的相對(duì)坐標(biāo)為UWB定位芯片a (15，O, 10)、UffB定位芯片b (-15，O, 10)、UffB定位芯片c (-15，0，-10)、UWB定位芯片d (15，0，-10)，單位為厘米。設(shè)麥克風(fēng)陣列陣元數(shù)為4個(gè)，相對(duì)坐標(biāo)為麥克風(fēng)陣元I (-6，0，-12)、麥克風(fēng)陣元2 (-2，0，-12)、麥克風(fēng)陣元3(2，O, -12)、麥克風(fēng)陣元4 (6，O, -12)，單位為厘米。[0057]步驟2:初始化無線定位發(fā)射模塊、無線定位接收模塊、語音增強(qiáng)模塊，其中包括定位天線的安裝，考慮到本系統(tǒng)定位采用的是三維TOA定位算法，需4個(gè)定位芯片進(jìn)行定位；UWB定位芯片受到嵌入式處理器控制，嵌入式處理器能夠接收到各個(gè)UWB定位芯片發(fā)送過來的信號(hào)傳播時(shí)延TOA ;在嵌入式處理器上進(jìn)行軟件的安裝，確定待無線定位發(fā)射模塊的定位周期、各UWB定位芯片的時(shí)鐘偏移、語音信號(hào)傳播速度C等，并無線發(fā)送給無線定位發(fā)射模塊，完成初始化設(shè)置。
[0058]步驟3:無線定位發(fā)射模塊發(fā)射無線定位信號(hào)，無線定位接收模塊接收到定位信號(hào)后對(duì)無線定位發(fā)射模塊進(jìn)行定位，確定無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)；無線定位發(fā)射模塊進(jìn)行周期性定位，根據(jù)預(yù)先的設(shè)置進(jìn)行周期性發(fā)射帶有時(shí)間戳的脈沖信號(hào)，每個(gè)脈沖完成一次測(cè)距。當(dāng)各UWB定位芯片接收到脈沖信號(hào)時(shí)，將接收到的脈沖信號(hào)與導(dǎo)頻序列進(jìn)行互相關(guān)，其相關(guān)器輸出的信號(hào)幅度會(huì)隨著接收信號(hào)與導(dǎo)頻序列的相似性而改變，相似程度越高，相關(guān)器輸出越大，相關(guān)器的峰值對(duì)應(yīng)的時(shí)移即本次信號(hào)的傳播時(shí)延TOA。
[0059]各UWB定位芯片將測(cè)量得到的信號(hào)傳播時(shí)延TOA嵌入式處理器，由嵌入式處理器計(jì)算各UWB定位芯片到無線定位發(fā)射模塊的測(cè)距結(jié)果。將每一個(gè)UWB定位芯片求得的時(shí)延TOA減去因?yàn)榘l(fā)送和接收所造成的時(shí)鐘偏移再乘以信號(hào)傳播速度，即為該UWB定位芯片到無線定位發(fā)射模塊的測(cè)距結(jié)果。根據(jù)各UWB定位芯片的測(cè)距結(jié)果，可得如下方程組:
【權(quán)利要求】
1.一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)，其特征在于包括無線定位發(fā)射模塊、無線定位接收模塊、麥克風(fēng)陣列語音接收模塊、語音增強(qiáng)模塊、遠(yuǎn)端語音播放模塊和通信模塊，其中無線定位發(fā)射模塊與無線定位接收模塊采用無線的方式連接，無線定位接收模塊和麥克風(fēng)陣列語音接收模塊分別與語音增強(qiáng)模塊連接，語音增強(qiáng)模塊與通信模塊連接，遠(yuǎn)端語音播放模塊與通信模塊連接。
2.根據(jù)權(quán)利要求1所述的一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)，其特征在于，無線定位發(fā)射模塊的安裝位置與說話人口的位置具有固定的坐標(biāo)關(guān)系，用于發(fā)射無線定位信號(hào)；無線定位接收模塊用于接收無線定位發(fā)射模塊的定位信號(hào)，完成對(duì)無線定位發(fā)射模塊的坐標(biāo)定位；麥克風(fēng)陣列語音接收模塊中各陣元的位置與無線定位接收模塊的位置具有固定的坐標(biāo)關(guān)系，用于完成多路語音信號(hào)的接收；語音增強(qiáng)模塊完成無線坐標(biāo)和聲學(xué)坐標(biāo)的轉(zhuǎn)換，并采用波束形成技術(shù)來完成目標(biāo)說話人語音的增強(qiáng)；遠(yuǎn)端語音播放模塊用于播放遠(yuǎn)端通話方的語音；通信模塊將語音增強(qiáng)模塊輸出的語音編碼調(diào)制后發(fā)送給遠(yuǎn)端通話方，接收遠(yuǎn)端通話方的語音數(shù)據(jù)并送至遠(yuǎn)端語音播放模塊進(jìn)行播放。
3.根據(jù)權(quán)利要求1所述的一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)，其特征在于，所述遠(yuǎn)端語音播放模塊包括遠(yuǎn)端語音無線發(fā)送模塊、遠(yuǎn)端語音無線接收模塊、音頻放大播放模塊，其中遠(yuǎn)端語音無線發(fā)送模塊、遠(yuǎn)端語音無線接收模塊采用無線的方式連接，遠(yuǎn)端語音無線接收模塊與音頻放大播放模塊連接；遠(yuǎn)端語音無線發(fā)送模塊完成遠(yuǎn)端語音的無線發(fā)送；遠(yuǎn)端語音無線接收模塊完成遠(yuǎn)端語音的無線接收；音頻放大播放模塊完成遠(yuǎn)端語音的放大和播放。
4.根據(jù)權(quán)利要求1所述的一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)，其特征在于，所述遠(yuǎn)端語音無線發(fā)送模塊和遠(yuǎn)端語音無線接收模塊采用超寬帶無線傳輸技術(shù)進(jìn)行無線數(shù)據(jù)的傳輸；所述無線定位發(fā)射模塊和無線定位接收模塊采用超寬帶無線定位技術(shù)來完成無線定位。
5.根據(jù)權(quán)利要求3所述的一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)，其特征在于，所述遠(yuǎn)端語音無線接收模塊、音頻放大播放模塊和無線定位發(fā)射模塊集成為無線耳機(jī)端，所述無線定位接收模塊、麥克風(fēng)陣列語音接收模塊、語音增強(qiáng)模塊、通信模塊和遠(yuǎn)端語音無線發(fā)送模塊集成為主機(jī)端。
6.用于權(quán)利要求f5任一項(xiàng)述的一種基于無線定位麥克風(fēng)陣列語音增強(qiáng)的通話系統(tǒng)的通話方法，其特征在于包括如下步驟: 步驟1:確定無線定位發(fā)射模塊與目標(biāo)說話人口之間的相對(duì)坐標(biāo)，確定麥克風(fēng)陣列語音接收模塊中各陣元與無線定位接收模塊的相對(duì)坐標(biāo)；步驟2:初始化無線定位發(fā)射模塊、無線定位接收模塊、語音增強(qiáng)模塊；步驟3:無線定位發(fā)射模塊發(fā)射無線定位信號(hào)，無線定位接收模塊接收到定位信號(hào)后對(duì)無線定位發(fā)射模塊進(jìn)行定位，確定無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)；根據(jù)無線定位發(fā)射模塊與目標(biāo)說話人口之間的相對(duì)坐標(biāo)、無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)、以及麥克風(fēng)陣列語音接收模塊中各陣元與無線定位接收模塊的相對(duì)坐標(biāo)，獲得目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的相對(duì)坐標(biāo)；步驟4:根據(jù)目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的相對(duì)坐標(biāo)調(diào)整語音增強(qiáng)模塊中波束形成器的時(shí)延補(bǔ)償權(quán)值，使其增強(qiáng)目標(biāo)說話人口方向的聲音，得到語音增強(qiáng)后的信號(hào)；步驟5:步驟4得到的增強(qiáng)后語音通過通信模塊發(fā)送給遠(yuǎn)端通話方，并通過通信模塊接收遠(yuǎn)端通話方的語音數(shù)據(jù)，并送至遠(yuǎn)端語音播放模塊進(jìn)行播放。
7.根據(jù)權(quán)利要求6所述的通話方法，其特征在于所述步驟2中，無線定位發(fā)射模塊、無線定位接收模塊、語音增強(qiáng)模塊的初始化具體包括以下步驟: 步驟2.1:無線定位接收模塊中的接收天線完成時(shí)間同步，無線定位發(fā)射模塊進(jìn)入準(zhǔn)備發(fā)射定位信號(hào)狀態(tài)；步驟2.2:語音增強(qiáng)模塊中的波束形成器權(quán)值矩陣置零，所述權(quán)值矩陣包括時(shí)延補(bǔ)償矩陣、固定波束形成權(quán)值矩陣、阻塞權(quán)值矩陣和自適應(yīng)波束形成權(quán)值矩陣。
8.根據(jù)權(quán)利要求6所述的通話方法，其特征在于步驟3中，無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)采用以下步驟進(jìn)行確定: 步驟3.1:無線定位發(fā)射模塊周期性發(fā)射定位脈沖序列，其中，脈沖序列帶有該無線定位發(fā)射模塊的設(shè)備號(hào)和脈沖序列的發(fā)射時(shí)間戳；步驟3.2:無線定位接收模塊的接收天線接收定位脈沖序列，并計(jì)算定位脈沖序列到達(dá)無線定位接收模塊中不同UWB定位芯片的傳播時(shí)延TOA ；步驟3.3:無線定位接收模塊根據(jù)各UWB定位芯片的傳播時(shí)延Τ0Α，獲得無線定位發(fā)射模塊到各UWB定位芯片的距離；步驟3.4:無線定位接收模塊根據(jù)步驟3.3所得距離的方程組計(jì)算無線定位發(fā)射模塊與無線定位接收模塊的相對(duì)坐標(biāo)。
9.根據(jù)權(quán)利要求6所述的通話方法，其特征在于步驟4中，語音增強(qiáng)模塊波束形成器的時(shí)延補(bǔ)償權(quán)值矩陣，采用以下方式計(jì)算: 步驟4.1a:根據(jù)目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的相對(duì)坐標(biāo)計(jì)算目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的空間距離；步驟4.2a:目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的空間距離除以聲音速度，得到目標(biāo)說話人口到麥克風(fēng)陣列語音接收模塊中各陣元的傳播時(shí)間；步驟4.3a:根據(jù)傳播時(shí)間計(jì)算時(shí)延補(bǔ)償權(quán)值矩陣，使得麥克風(fēng)陣列語音接收模塊中各陣元接收的目標(biāo)說話人語音經(jīng)過時(shí)延補(bǔ)償權(quán)值矩陣后同步；所述語音增強(qiáng)模塊的波束形成器的自適應(yīng)濾波器系數(shù)，采用以下方式計(jì)算: 步驟4.1b:目標(biāo)說話人的語音共有Q個(gè)信源存在，將第q個(gè)信號(hào)的陣列輸出與該信號(hào)在時(shí)刻k的期望形式之間的代價(jià)函數(shù)表示為自適應(yīng)濾波器系數(shù)矩陣的函數(shù)；其中q=l，2，…，Q ；步驟4.2b:計(jì)算代價(jià)函數(shù)對(duì)于自適應(yīng)濾波器系數(shù)矩陣的梯度函數(shù)；步驟4.3b:采用梯度下降法調(diào)整自適應(yīng)濾波器系數(shù)矩陣，并計(jì)算相應(yīng)的代價(jià)函數(shù)值；步驟4.4b:采用調(diào)整后的自適應(yīng)濾波器系數(shù)矩陣對(duì)輸入語音信號(hào)進(jìn)行語音增強(qiáng)，并計(jì)算語音增強(qiáng)后陣列輸出信號(hào)與該信號(hào)期望形式之間的代價(jià)函數(shù)值，如果當(dāng)前代價(jià)函數(shù)值與前一次迭代的代價(jià)函數(shù)值變化量小于給定值，或迭代次數(shù)超出預(yù)設(shè)次數(shù)，則輸出自適應(yīng)濾波器系數(shù)矩陣并結(jié)束，否則轉(zhuǎn)步驟4.3b。
10.根據(jù)權(quán)利要求6所述的通話方法，其特征在于步驟4中，語音增強(qiáng)模塊波束形成器的自適應(yīng)濾波器系數(shù)矩陣，還采用以下方式計(jì)算:步驟4.1c:將波束形成器輸出信號(hào)的平均功率表示為自適應(yīng)濾波器系數(shù)矩陣的函數(shù)；步驟4.2c:在滿足約束條件條件下，將平均功率函數(shù)對(duì)自適應(yīng)濾波器系數(shù)矩陣中的每個(gè)元素求偏導(dǎo)，并令偏導(dǎo)等于O ; 步驟4.3c:將得到的方程組成方程組并求解，得到當(dāng)前最優(yōu)的自適應(yīng)濾波器系數(shù)矩陣。
【文檔編號(hào)】G10L21/0216GK103544959SQ201310513373
【公開日】2014年1月29日申請(qǐng)日期:2013年10月25日優(yōu)先權(quán)日:2013年10月25日
【發(fā)明者】張軍, 陳典鋮, 馮義志, 寧更新, 季飛, 余華, 陳芳炯, 韋崗申請(qǐng)人:華南理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張軍;陳典鋮;馮義志;寧更新;季飛;余華;陳芳炯;韋崗
技術(shù)所有人：華南理工大學(xué)
我是此專利的發(fā)明人

上一篇：一種輕質(zhì)低頻寬帶薄膜超材料隔聲裝置制造方法
下一篇：一種語音控制方法、裝置和設(shè)備的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

麥克風(fēng)陣列語音增強(qiáng)相關(guān)技術(shù)

麥克風(fēng)陣列語音芯片相關(guān)技術(shù)

麥克風(fēng)陣列聲源定位相關(guān)技術(shù)

麥克風(fēng)陣列定位相關(guān)技術(shù)

qq語音麥克風(fēng)自動(dòng)增強(qiáng)相關(guān)技術(shù)

qq語音麥克風(fēng)增強(qiáng)相關(guān)技術(shù)

麥克風(fēng)陣列相關(guān)技術(shù)