網(wǎng)絡(luò)電話中的靜音檢測方法

文檔序號：7577769閱讀：735來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：網(wǎng)絡(luò)電話中的靜音檢測方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種網(wǎng)絡(luò)電話中的靜音檢測方法。
所說靜音檢測方法是指在網(wǎng)絡(luò)電話中通過靜音檢測模組內(nèi)的各檢測部分，正確的分離語音和背景噪聲，以濾除冗余音頻數(shù)據(jù)，從而能在有限的網(wǎng)絡(luò)頻寬內(nèi)得到最佳的通話效果，此外，當檢測到未傳送語音數(shù)據(jù)時，即會傳送靜音框架(frame)數(shù)據(jù)，該靜音框架(frame)數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬，同時，接收方一接收到靜音框架(frame)數(shù)據(jù)時，也會回放背景噪聲，而能保持說話的同步，其次，在半雙工的說聽模式中設(shè)有一轉(zhuǎn)換模組，當接收到網(wǎng)絡(luò)上的語音數(shù)據(jù)時，會自動轉(zhuǎn)換成接聽模式，而當本地檢測到語音時則自動轉(zhuǎn)換成說話模式，并設(shè)有按鍵，方便用戶隨時都能說話。
一般網(wǎng)絡(luò)電話屬于即時通訊系統(tǒng)，但是受到網(wǎng)絡(luò)帶寬的限制，必須在不破壞語音音質(zhì)的前提下盡量減少數(shù)據(jù)傳輸，另外，如果用戶使用了半雙工的聲霸卡，就不能同時說話和接聽，而只能通過轉(zhuǎn)換說/聽模式間接實現(xiàn)交談，鑒于以上兩大問題，人們開始借鑒語音辯識領(lǐng)域中的靜音技術(shù)，以此來濾除冗余語音數(shù)據(jù)，并且實現(xiàn)半雙工說/聽模式的自動轉(zhuǎn)換。
但是，靜音技術(shù)只是作為一種輔助手段，仍有以下缺點1.簡單采用短時平均能量檢測有無靜音，對環(huán)境的適應(yīng)能力差；2.單純?yōu)V除靜音數(shù)據(jù)而不作任何處理，可能造成交談的不同步性；3.半雙工自動轉(zhuǎn)換說/聽模式，忽視了交談?wù)叩闹鲃有浴?br> 因此，為改進上述慣用技術(shù)中的缺點，本發(fā)明提供一種網(wǎng)絡(luò)電話中的靜音檢測方法。
本發(fā)明的目的，在于提供一種網(wǎng)絡(luò)電話中的靜音檢測方法，主要是在網(wǎng)絡(luò)電話上通過靜音檢測模組內(nèi)的各檢測部分，正確分離語音和背景噪聲，以濾除冗余音頻數(shù)據(jù)。
為實現(xiàn)所述目的，本發(fā)明提供一種網(wǎng)絡(luò)電話中的靜音檢測方法，該方法通過靜音檢測模組進行，該靜音檢測模組內(nèi)的各檢測部分包括有語音檢測、靜音檢測及噪聲檢測等，所述靜音檢測方法的步驟如下，首先，當收集到當前一框架(frame)的音頻數(shù)據(jù)時，通過求其振幅值和而得到短時平均能量，一旦短時平均能量超過語音能量的臨界值時，即代表檢測到語音，其次，再將當前一框架(frame)的短時平均能量通過低通濾波器，得到這一框架(frame)的長時平均能量并進行檢測，當連續(xù)數(shù)框架(frame)的長時平均能量均低于靜音能量的臨界值時，即檢測到靜音，嗣后，再收集當前一框架(frame)的音頻數(shù)據(jù)，計算相鄰數(shù)據(jù)其正、負符號的變換次數(shù)，(即過零率)，一旦過零率超過臨界值時，即判定檢測到噪音，因此通過該三種檢測分離出語音和背景噪聲，從而能在有限的網(wǎng)絡(luò)頻寬內(nèi)得到最佳通話效果。
本發(fā)明所提供的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，當傳送方的靜音檢測系統(tǒng)檢測到傳送方未傳送語音數(shù)據(jù)時，會同時傳送一靜音框架(frame)數(shù)據(jù)，該靜音框架(frame)數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬，同時，當接收方接收到靜音框架(frame)數(shù)據(jù)時，接收方也會傳送當?shù)氐谋尘霸肼曋羵魉头剑虼?，雙方不會因網(wǎng)絡(luò)傳送的延遲性，而有談話不同步的感覺。
本發(fā)明所提供的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，在半雙工的說聽模式中有一轉(zhuǎn)換模組，當接收到網(wǎng)絡(luò)上的語音數(shù)據(jù)時，會自動轉(zhuǎn)換成接聽模式，而當本地檢測到語音時則自動轉(zhuǎn)換成說話模式，并設(shè)有功能鍵，方便用戶隨時都能說話。
為能更進一步的認識與了解本發(fā)明的目的、形狀構(gòu)造裝置特征及其功效，再舉實施例結(jié)合附圖，詳細說明如下

圖1是本發(fā)明的硬件結(jié)構(gòu)示意圖。
圖2是本發(fā)明的全雙工靜音技術(shù)的硬件結(jié)構(gòu)方塊圖。
圖3是本發(fā)明的半雙工靜音技術(shù)的硬件結(jié)構(gòu)方塊圖。
圖4是本發(fā)明的全雙工錄音端靜音模組的硬件結(jié)構(gòu)圖。
圖5是本發(fā)明的全雙工錄音數(shù)據(jù)處理流程圖。
圖6是本發(fā)明的半雙工錄音端靜音模組的硬件結(jié)構(gòu)圖。
圖7是本發(fā)明的半雙工錄音數(shù)據(jù)處理流程圖。
圖8是本發(fā)明的語音檢測流程圖。
圖9是本發(fā)明的靜音檢測流程圖。
圖10是本發(fā)明的噪音檢測流程圖。
圖11是本發(fā)明全雙工放音端靜音模組的硬件結(jié)構(gòu)圖。
圖12是本發(fā)明全雙工放音數(shù)據(jù)處理流程圖。
圖13是本發(fā)明半雙工放音端靜音模組的硬件結(jié)構(gòu)圖。
圖14是本發(fā)明半雙工放音數(shù)據(jù)處理流程圖。
圖15A-15B是本發(fā)明錄音端總流程圖。
圖16是本發(fā)明放音端總流程圖。
參照圖1所示，本發(fā)明是一種“網(wǎng)絡(luò)電話中的靜音檢測方法”，其包括有一個人電腦11、聲霸卡12、麥克風13、揚聲器14、數(shù)據(jù)機或網(wǎng)絡(luò)卡15等，其中，麥克風13是將所錄制的聲音信號轉(zhuǎn)化成電信號并輸入至聲霸卡12中，揚聲器14再將聲霸卡12所輸出的電信號轉(zhuǎn)換成聲音信號放送出去，參照圖2、圖3所示，一般電話通話模式包括有全雙工模式(如圖2所示)及半雙工模式(如圖3所示)，所謂全雙工模式是指通話雙方可同時進行說聽，至于半雙工模式是指在網(wǎng)絡(luò)電話系統(tǒng)中，聲霸卡處于半雙工的工作方式，在當前時刻，只能進行其中一錄音或放音狀態(tài)，而不能同時進行錄音或放音，而本發(fā)明的靜音檢測技術(shù)適用于全雙工模式與半雙工模式。
參照圖2、圖3所示，其是網(wǎng)絡(luò)電話在全雙工模式或半雙工模式進行傳送及接收語音的工作方塊圖，該全雙工模式與半雙工模式在傳送語音時，都是先經(jīng)由麥克風13將所錄制到的語音分別傳輸至混音器21、模/數(shù)轉(zhuǎn)換22、錄音應(yīng)用程序介面(錄音API)23、錄音端靜音模組24、數(shù)據(jù)機或網(wǎng)絡(luò)卡15再通過網(wǎng)絡(luò)將語音傳輸至接收方；而全雙工模式與半雙工模式在接收語音時，都是先通過網(wǎng)絡(luò)接收語音數(shù)據(jù)，再將該語音數(shù)據(jù)經(jīng)由數(shù)據(jù)機或網(wǎng)絡(luò)卡15、放音端靜音模組25、接收應(yīng)用程序介面(接收API)26、數(shù)/模轉(zhuǎn)換27、混音器21，再由揚聲器14播送出去；其中，本發(fā)明的靜音檢測技術(shù)是應(yīng)用在錄音端靜音模組24及放音端靜音模組25中，至于，在半雙工模式中，其靜音檢測技術(shù)中尚包括有一轉(zhuǎn)換模組28，以實現(xiàn)說/聽模式的自動和強制轉(zhuǎn)換。
參照圖4、圖5所示，是全雙工錄音端靜音模組24的硬件結(jié)構(gòu)圖及流程圖，首先，先檢測錄音應(yīng)用程序介面23所抽樣的音頻數(shù)據(jù)，若檢測為語音數(shù)據(jù)，則啟動編碼器31，將語音數(shù)據(jù)編碼，并按壓數(shù)據(jù)選擇開關(guān)32將編碼數(shù)據(jù)傳送給數(shù)據(jù)機或網(wǎng)絡(luò)卡15，反之，若檢測不是語音數(shù)據(jù)時，即關(guān)閉編碼器31，并按壓數(shù)據(jù)選擇開關(guān)32將靜音框架(frame)33數(shù)據(jù)傳送至數(shù)據(jù)機或網(wǎng)絡(luò)卡15。
參照圖6、圖7所示，是半雙工錄音端靜音模組24的硬件結(jié)構(gòu)圖及流程圖，首先，先檢測錄音應(yīng)用程序介面23所抽樣的音頻數(shù)據(jù)，若檢測為語音數(shù)據(jù)，則啟動編碼器31，將語音數(shù)據(jù)編碼，并傳送給數(shù)據(jù)機或網(wǎng)絡(luò)卡15，反之，若檢測不是語音數(shù)據(jù)時，即關(guān)閉編碼器31，并將檢測結(jié)果輸入至轉(zhuǎn)換模組28以啟動說/聽模式的轉(zhuǎn)換。
在上述的全雙工與半雙工的錄音端靜音模組24中，其具有一靜音檢測模組34，而本發(fā)明即藉由該靜音檢測模組34從背景噪聲中找出語音的開始和終止，而靜音檢測模組包含有語音檢測、靜音檢測及噪音檢測等；參照圖8所示，該語音檢測是作為檢測語音的起始部分(句子或段落的開頭)，它是采用短時平均能量檢測，首先收集當前一框架(frame)的音頻數(shù)據(jù)N，將該音頻數(shù)據(jù)N求其振幅值和并通過短時濾波，而得到這一框架(frame)的短時平均能量Se′，一旦短時平均能量Se′超過語音能量Se的臨界值時，即表示檢測到語音，而從這一框架(frame)開始的音頻數(shù)據(jù)N皆被視為語音數(shù)據(jù)，直至檢測到靜音為止。
該語音檢測按如下公式進行首先，計算當前框架(frame)的語音能量SeN-1Se＝∑|Xin(i)| N為每框架(frame)語音數(shù)i＝0其次，計算當前框架(frame)的過零率SzN-1Sz＝∑|sgn[Xin(i)]-sgn[Xin(i-1)]|/2NI＝0其中sgn[Xin(i)]＝1，Xin(i)＞＝0sgn[Xin(I)]＝-1，Xin(I)＜0然后，上述語音能量經(jīng)過短時濾波器后，得到短時平均能量Se，Se＝0.5Se′+0.5Se因此，當(Se′＞Et)且(Szmin＜Sz＜Szmax)時，表示當前有語音信號，并將當前狀態(tài)設(shè)置為說話狀態(tài)，且程序進入靜音檢測；其中，Et為語音能量臨界值，而Szmin與Szmax分別為過零率下限和上限。
參照圖9所示，本發(fā)明中，該靜音檢測是作為檢測交談間隙的靜音(句子或段落之間的間隔)，由于靜音的能量小且持續(xù)時間長，因此采用長時平均能量檢測，它是將當前一框架(frame)的短時平均能量Se′通過低通濾波器，而得到這一框架(frame)的長時平均能量Se′并進行檢測，只有當連續(xù)數(shù)框架(frame)的長時平均能量Ss′均低于靜音能量臨界Est時，才表示檢測到靜音，因此，從這一框架(frame)起的音頻數(shù)據(jù)N均被視為背景噪聲，直至檢測到語音為止，至于連續(xù)檢測框架(frame)數(shù)則由正常通話的停頓時間計算得到。
該靜音檢測按如下公式進行首先，計算當前框架(frame)的語音能量SeN-1Se＝∑|Xin(i)| N為每框架(frame)語音數(shù)i＝0其次，上述語音能量經(jīng)過長時濾波器后，得到長時平均能量Ss′Ss′＝0.9Ss′+0.1Ss然后，當(Ss＜Est)則CONUT++(表示技術(shù)器累進加1)；當(Ss＞Est)則CONUT＝0即表示檢測靜音，其中Est為靜音能量臨界值，因此，當CONUT＝M時，即將目前狀態(tài)設(shè)置為接聽狀態(tài)，而M是靜音需達到的框架(frame)數(shù)。
至于，上述的語音能量臨界值及靜音能量臨界值是由下述的公式求出，首先，當用戶不說話及靜音時，先測得麥克風輸入能量的平均值Ens，當用戶說話朗讀一段句子時，測得麥克風輸入能量的平均值Ent，故語音能量臨界值Et＝Ens+0.5(Ent-Ens)靜音能量臨界值Est＝Ens+0.2(Ent-Ens)現(xiàn)舉一實施例，若每一音頻數(shù)據(jù)N＝320時，則經(jīng)過理論分析和實驗結(jié)果，即可求出語音能量臨界值Et＝250000，靜音能量臨界值Est＝100000，而過零率的臨界值，其下限Szmin＝6，上限Szmax＝36。
請參照圖10所示，本發(fā)明中，在噪音檢測中引入了過零率檢測，它是先收集當前一框架(frame)的音頻數(shù)據(jù)，計算相鄰數(shù)據(jù)其正、負符號的變換次數(shù)(即過零率)，當過零率高于臨界值時，即判定檢測到噪音，這一框架(frame)音頻數(shù)據(jù)同樣被現(xiàn)視為背景噪聲，現(xiàn)舉一例子說明如何計算相鄰數(shù)據(jù)其正、負符號變換次數(shù)，例如該語音數(shù)據(jù)為20，50，100，40，10，-30，-50，-10，10，60，90，50由于，其整個數(shù)據(jù)的正、負符號的變換只有二次，所以其過零率為“2”，而過零率臨界值是由統(tǒng)計特性得到。
因此，經(jīng)過上述該三種檢測分離出語音和背景噪聲，就能在有限的網(wǎng)絡(luò)頻寬內(nèi)得到最佳的通話效果。
參照圖15A-15B所示，是錄音端總流程圖，它綜合了錄音端全雙工靜音模組、半雙工靜音模組和靜音檢測模組。首先使用語音檢測方法確定語音的起始部分，然后使用靜音檢測方法確定語音的終止部分，最后使用噪音檢測方法濾除語音中夾雜的噪音，這樣就得到了“純”語音數(shù)據(jù)。在全雙工模式下，將語音數(shù)據(jù)進行編碼通過網(wǎng)絡(luò)傳送，另外傳送靜音框架數(shù)據(jù)協(xié)調(diào)交談的同步性。在半雙工模式下，將語音數(shù)據(jù)進行編碼通過網(wǎng)絡(luò)傳送，同時以有無語音數(shù)據(jù)為標志進行說/聽模式的轉(zhuǎn)換。
本發(fā)明中，在上述的全雙工錄音端靜音模組24中，當檢測到傳送方未傳送語音數(shù)據(jù)時，則同時傳送一靜音框架(frame)33數(shù)據(jù)，該靜音框架(frame)33數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬，因此當接收方收到靜音框架(frame)33數(shù)據(jù)時，即代表傳送方未傳送語音數(shù)據(jù)，接收方即可傳送當?shù)氐谋尘霸肼曋羵魉头剑铍p方不會因網(wǎng)絡(luò)傳送的延遲性，而有談話不同步的感覺；因此，參照圖11、12所示，是全雙工放音端靜音模組25的硬件結(jié)構(gòu)圖及流程圖，首先，該網(wǎng)絡(luò)臨測模組35是負責監(jiān)測數(shù)據(jù)機或網(wǎng)絡(luò)卡15接收的數(shù)據(jù)，當監(jiān)測到是為編碼數(shù)據(jù)，亦即語音數(shù)據(jù)時，即起動解碼器36，并按壓數(shù)據(jù)選擇開關(guān)32，將解碼后的語音數(shù)據(jù)傳送至接收應(yīng)用程序介面26；反之，若未監(jiān)測到編碼數(shù)據(jù)，即傳送方未傳送語音數(shù)據(jù)，則關(guān)閉解碼器36，并按壓數(shù)據(jù)選擇開關(guān)32，將背景噪聲37傳送至接收應(yīng)用程序介面26中。
參照圖13、14所示，是半雙工放音端靜音模組25的硬件結(jié)構(gòu)圖及流程圖，首先，該網(wǎng)絡(luò)監(jiān)測模組35是負責監(jiān)測數(shù)據(jù)機或網(wǎng)絡(luò)卡15接收的數(shù)據(jù)，當監(jiān)測到編碼數(shù)據(jù)時，即語音數(shù)據(jù)時，則啟動解碼器36，并將解碼后的語音數(shù)據(jù)傳送至接收應(yīng)用程序介面26；反之，若未監(jiān)測到編碼數(shù)據(jù)，即未傳送語音數(shù)據(jù)，則關(guān)閉解碼器36，將檢測結(jié)果輸入至轉(zhuǎn)換模組28，以觸發(fā)聽/說模式的轉(zhuǎn)換。
參照圖16所示，是放音端總流程圖，它綜合了放音端全雙工靜音模組、和半雙工靜音模組。靜音模組時刻監(jiān)測是否接收到語音編碼數(shù)據(jù)，在全雙工模式下，將語音編碼數(shù)據(jù)解碼后通過聲霸卡回放，另外回放背景噪聲協(xié)調(diào)交談的同步性；在半雙工模式下，將語音編碼數(shù)據(jù)解碼后通過聲霸卡回放，同時以有無語音編碼數(shù)據(jù)為標志進行聽/說模式的轉(zhuǎn)換。
本發(fā)明中，上述轉(zhuǎn)換模組28工作在半雙工模式下，主要是自動或強制轉(zhuǎn)換說/聽模式，當轉(zhuǎn)換模組28啟動時，若在錄音端靜音模組24時，靜音檢測模組34檢測到語音數(shù)據(jù)時，即刻保持說話模式，反之，則自動轉(zhuǎn)換成接聽模式；而若在放音端靜音模組25時，當網(wǎng)絡(luò)監(jiān)測模組35監(jiān)測到語音數(shù)據(jù)時，即刻保持接聽模式，反之，則自動轉(zhuǎn)換成說話模式，此外，在接聽模式下，若用戶按壓一功能鍵29時，轉(zhuǎn)換模組28立即強制轉(zhuǎn)換成說話模式。
綜上所述，綜合多種檢測可正確分離語音和背景噪聲，以減少數(shù)據(jù)傳輸，同時，對靜音數(shù)據(jù)作特殊處理，以協(xié)調(diào)交談的同步性，此外，令半雙工說/聽模式能轉(zhuǎn)換自如，以方便用戶隨時都能說話，所以，本發(fā)明實為一理想的靜音檢測技術(shù)。
以上所述，僅為本發(fā)明的一些可行實施例，但并非用以限定本發(fā)明的保護范圍，凡依據(jù)權(quán)利要求書所述的內(nèi)容、特征以及其精神而進行其他變化的等效實施，都應(yīng)包含在本發(fā)明的保護范圍內(nèi)。
權(quán)利要求
1.一種網(wǎng)絡(luò)電話中的靜音檢測方法，用于在網(wǎng)絡(luò)電話的全雙工與半雙工通話模式中通過各靜音檢測，正確分離語音和背景噪聲，以濾除冗余音頻數(shù)據(jù)，所述檢測方法按如下步驟執(zhí)行(1)檢測語音的起始部分，當收集到當前一框架(frame)的音頻數(shù)據(jù)時，通過求其振幅值和而得到短時平均能量，一旦短時平均能量超過語音能量臨界值時，即代表檢測到語音；(2)檢測交談間隙的靜音，將當前一框架(frame)所計算出的短時平均能量通過低通濾波器，得到這一框架(frame)的長時平均能量并進行檢測，當連續(xù)數(shù)框架(frame)的長時平均能量均低于靜音能量臨界值時，即檢測到靜音；(3)檢測交談間隙的噪音，收集當前一框架(frame)的音頻數(shù)據(jù)，計算相鄰數(shù)據(jù)其正、負符號的變換次數(shù)(即過零率)，一旦過零率超過臨界值時，即判定檢測到噪音。
2.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該網(wǎng)絡(luò)電話在傳送語音時，先經(jīng)由麥克風將所錄制到的語音分別傳輸至混音器、模/數(shù)轉(zhuǎn)換、錄音應(yīng)用程序介面(錄音API)、錄音端靜音模組、數(shù)據(jù)機或網(wǎng)絡(luò)卡再通過網(wǎng)絡(luò)將語音傳輸至接收方。
3.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該網(wǎng)絡(luò)電話在接收語音時，先通過網(wǎng)絡(luò)接收語音數(shù)據(jù)，再將該語音數(shù)據(jù)經(jīng)由數(shù)據(jù)機或網(wǎng)絡(luò)卡、放音端靜音模組、接收應(yīng)用程序介面(接收API)、數(shù)/模轉(zhuǎn)換、混音器，再由揚聲器播送出去。
4.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該語音檢測是采用短時平均能量檢測，首先收集當前一框架(frame)的音頻數(shù)據(jù)N，將該音頻數(shù)據(jù)N求其振幅值和并通過短時濾波，而得到這一框架(frame)的短時平均能量Se′，一旦短時平均能量Se′超過語音能量臨界值Et時，即表示檢測到語音，而從這一框架(frame)開始的音頻數(shù)據(jù)N都被視為語音數(shù)據(jù)，直至檢測到靜音為止。
5.如權(quán)利要求4所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該語音能量臨界值是由下述的公式求出，首先，當用戶不說話及靜音時，先測得麥克風輸入能量的平均值Ens，當用戶說話朗讀一段句子時，測得麥克風輸入能量的平均值Ent，從而得到語音能量臨界值為Et＝Ens+0.5(Ent＝Ens)。
6.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該靜音檢測是采用長時平均能量檢測，首先，收集當前一框架(frame)的音頻數(shù)據(jù)N，將該音頻數(shù)據(jù)N求其振幅值和而得到這一框架(frame)的短時平均能量Se′，此時，將短時平均能量Se′通過低通濾波器，而得到這一框架(frame)的長時平均能量Ss′并進行檢測，只有當連續(xù)數(shù)框架(frame)的長時平均能量Ss′均低于靜音能量臨界值Est時，才表示檢測到靜音，因此，從這一框架(frame)起的音頻數(shù)據(jù)N均被視為背景噪聲，直至檢測到語音為止。
7.如權(quán)利要求6所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該靜音能量臨界值是由下述的公式求出，首先，當用戶不說話及靜音時，先測得麥克風輸入能量的平均值Ens，當用戶說話朗讀一段句子時，測得麥克風輸入能量的平均值Ent，從而獲得靜音能量臨界值Est＝Ens+0.2(Ent-Ens)。
8.如權(quán)利要求2所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，在該全雙工錄音端靜音模組中，當檢測到傳送方未傳送語音數(shù)據(jù)時，同時傳送一靜音框架(frame)數(shù)據(jù)，該靜音框架(frame)數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬，所以當接收方接收到靜音框架(frame)數(shù)據(jù)時，即代表傳送方未傳送語音數(shù)據(jù)，接收方即可傳送當?shù)氐谋尘霸肼曋羵魉头剑铍p方不會因網(wǎng)絡(luò)傳送的延遲性，而有談話不同步的感覺。
9.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該網(wǎng)絡(luò)電話在半雙工模式中，它具有一轉(zhuǎn)換模組，令半雙工說/聽模式能轉(zhuǎn)換自如，以方便用戶隨時都能說話。
10.如權(quán)利要求9所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，當轉(zhuǎn)換模組啟動時，若在錄音端靜音模組時，靜音檢測模組一檢測到語音數(shù)據(jù)時，即保持說話模式，反之，則自動轉(zhuǎn)換成接聽模式，而若在放音端靜音模組時，當網(wǎng)絡(luò)監(jiān)測模組監(jiān)測到語音數(shù)據(jù)時，即保持接聽模式，反之，則自動轉(zhuǎn)換成說話模式。
11.如權(quán)利要求10所述的網(wǎng)絡(luò)電話中的靜音檢測方法，其中，該轉(zhuǎn)換模組并設(shè)有一功能鍵，當在接聽模式下，若用戶按壓功能鍵時，轉(zhuǎn)換模組即強制轉(zhuǎn)換成說話模式。
全文摘要
一種網(wǎng)絡(luò)電話中的靜音檢測方法,其步驟如下:當收集到當前框架的音頻數(shù)據(jù)時,求其振幅值和得到短時平均能量,短時平均能量超過語音能量臨界值時,代表檢測到語音,再將當前框架的短時平均能量通過低通濾波器,得到這一框架的長時平均能量并進行檢測,當連續(xù)數(shù)框架的長時平均能量均低于靜音能量的臨界值時,即檢測到靜音,然后,再收集當前一框架的音頻數(shù)據(jù),計算相鄰數(shù)據(jù)正、負符號的變換次數(shù),一旦過零率超過臨界值時,即判定檢測噪音。
文檔編號H04M1/19GK1245376SQ9811836
公開日2000年2月23日申請日期1998年8月17日優(yōu)先權(quán)日1998年8月17日
發(fā)明者張景嵩, 謝綱, 薛克忠, 溫周斌申請人:英業(yè)達股份有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張景嵩;謝綱;薛克忠;溫周斌
技術(shù)所有人：英業(yè)達股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

食品中甲醛的檢測方法相關(guān)技術(shù)

食品中鋁的檢測方法相關(guān)技術(shù)

食品中銅的檢測方法相關(guān)技術(shù)

食品中鉛的檢測方法相關(guān)技術(shù)

透析液中鋁的檢測方法相關(guān)技術(shù)

水中的叔丁醇檢測方法相關(guān)技術(shù)

水中余氯檢測方法相關(guān)技術(shù)

水中微生物檢測方法相關(guān)技術(shù)