專利名稱:網(wǎng)絡(luò)電話中的靜音檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種網(wǎng)絡(luò)電話中的靜音檢測方法。
所說靜音檢測方法是指在網(wǎng)絡(luò)電話中通過靜音檢測模組內(nèi)的各檢測部分,正確的分離語音和背景噪聲,以濾除冗余音頻數(shù)據(jù),從而能在有限的網(wǎng)絡(luò)頻寬內(nèi)得到最佳的通話效果,此外,當檢測到未傳送語音數(shù)據(jù)時,即會傳送靜音框架(frame)數(shù)據(jù),該靜音框架(frame)數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬,同時,接收方一接收到靜音框架(frame)數(shù)據(jù)時,也會回放背景噪聲,而能保持說話的同步,其次,在半雙工的說聽模式中設(shè)有一轉(zhuǎn)換模組,當接收到網(wǎng)絡(luò)上的語音數(shù)據(jù)時,會自動轉(zhuǎn)換成接聽模式,而當本地檢測到語音時則自動轉(zhuǎn)換成說話模式,并設(shè)有按鍵,方便用戶隨時都能說話。
一般網(wǎng)絡(luò)電話屬于即時通訊系統(tǒng),但是受到網(wǎng)絡(luò)帶寬的限制,必須在不破壞語音音質(zhì)的前提下盡量減少數(shù)據(jù)傳輸,另外,如果用戶使用了半雙工的聲霸卡,就不能同時說話和接聽,而只能通過轉(zhuǎn)換說/聽模式間接實現(xiàn)交談,鑒于以上兩大問題,人們開始借鑒語音辯識領(lǐng)域中的靜音技術(shù),以此來濾除冗余語音數(shù)據(jù),并且實現(xiàn)半雙工說/聽模式的自動轉(zhuǎn)換。
但是,靜音技術(shù)只是作為一種輔助手段,仍有以下缺點1.簡單采用短時平均能量檢測有無靜音,對環(huán)境的適應(yīng)能力差;2.單純?yōu)V除靜音數(shù)據(jù)而不作任何處理,可能造成交談的不同步性;3.半雙工自動轉(zhuǎn)換說/聽模式,忽視了交談?wù)叩闹鲃有浴?br>
因此,為改進上述慣用技術(shù)中的缺點,本發(fā)明提供一種網(wǎng)絡(luò)電話中的靜音檢測方法。
本發(fā)明的目的,在于提供一種網(wǎng)絡(luò)電話中的靜音檢測方法,主要是在網(wǎng)絡(luò)電話上通過靜音檢測模組內(nèi)的各檢測部分,正確分離語音和背景噪聲,以濾除冗余音頻數(shù)據(jù)。
為實現(xiàn)所述目的,本發(fā)明提供一種網(wǎng)絡(luò)電話中的靜音檢測方法,該方法通過靜音檢測模組進行,該靜音檢測模組內(nèi)的各檢測部分包括有語音檢測、靜音檢測及噪聲檢測等,所述靜音檢測方法的步驟如下,首先,當收集到當前一框架(frame)的音頻數(shù)據(jù)時,通過求其振幅值和而得到短時平均能量,一旦短時平均能量超過語音能量的臨界值時,即代表檢測到語音,其次,再將當前一框架(frame)的短時平均能量通過低通濾波器,得到這一框架(frame)的長時平均能量并進行檢測,當連續(xù)數(shù)框架(frame)的長時平均能量均低于靜音能量的臨界值時,即檢測到靜音,嗣后,再收集當前一框架(frame)的音頻數(shù)據(jù),計算相鄰數(shù)據(jù)其正、負符號的變換次數(shù),(即過零率),一旦過零率超過臨界值時,即判定檢測到噪音,因此通過該三種檢測分離出語音和背景噪聲,從而能在有限的網(wǎng)絡(luò)頻寬內(nèi)得到最佳通話效果。
本發(fā)明所提供的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,當傳送方的靜音檢測系統(tǒng)檢測到傳送方未傳送語音數(shù)據(jù)時,會同時傳送一靜音框架(frame)數(shù)據(jù),該靜音框架(frame)數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬,同時,當接收方接收到靜音框架(frame)數(shù)據(jù)時,接收方也會傳送當?shù)氐谋尘霸肼曋羵魉头剑虼?,雙方不會因網(wǎng)絡(luò)傳送的延遲性,而有談話不同步的感覺。
本發(fā)明所提供的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,在半雙工的說聽模式中有一轉(zhuǎn)換模組,當接收到網(wǎng)絡(luò)上的語音數(shù)據(jù)時,會自動轉(zhuǎn)換成接聽模式,而當本地檢測到語音時則自動轉(zhuǎn)換成說話模式,并設(shè)有功能鍵,方便用戶隨時都能說話。
為能更進一步的認識與了解本發(fā)明的目的、形狀構(gòu)造裝置特征及其功效,再舉實施例結(jié)合附圖,詳細說明如下
圖1是本發(fā)明的硬件結(jié)構(gòu)示意圖。
圖2是本發(fā)明的全雙工靜音技術(shù)的硬件結(jié)構(gòu)方塊圖。
圖3是本發(fā)明的半雙工靜音技術(shù)的硬件結(jié)構(gòu)方塊圖。
圖4是本發(fā)明的全雙工錄音端靜音模組的硬件結(jié)構(gòu)圖。
圖5是本發(fā)明的全雙工錄音數(shù)據(jù)處理流程圖。
圖6是本發(fā)明的半雙工錄音端靜音模組的硬件結(jié)構(gòu)圖。
圖7是本發(fā)明的半雙工錄音數(shù)據(jù)處理流程圖。
圖8是本發(fā)明的語音檢測流程圖。
圖9是本發(fā)明的靜音檢測流程圖。
圖10是本發(fā)明的噪音檢測流程圖。
圖11是本發(fā)明全雙工放音端靜音模組的硬件結(jié)構(gòu)圖。
圖12是本發(fā)明全雙工放音數(shù)據(jù)處理流程圖。
圖13是本發(fā)明半雙工放音端靜音模組的硬件結(jié)構(gòu)圖。
圖14是本發(fā)明半雙工放音數(shù)據(jù)處理流程圖。
圖15A-15B是本發(fā)明錄音端總流程圖。
圖16是本發(fā)明放音端總流程圖。
參照圖1所示,本發(fā)明是一種“網(wǎng)絡(luò)電話中的靜音檢測方法”,其包括有一個人電腦11、聲霸卡12、麥克風13、揚聲器14、數(shù)據(jù)機或網(wǎng)絡(luò)卡15等,其中,麥克風13是將所錄制的聲音信號轉(zhuǎn)化成電信號并輸入至聲霸卡12中,揚聲器14再將聲霸卡12所輸出的電信號轉(zhuǎn)換成聲音信號放送出去,參照圖2、圖3所示,一般電話通話模式包括有全雙工模式(如圖2所示)及半雙工模式(如圖3所示),所謂全雙工模式是指通話雙方可同時進行說聽,至于半雙工模式是指在網(wǎng)絡(luò)電話系統(tǒng)中,聲霸卡處于半雙工的工作方式,在當前時刻,只能進行其中一錄音或放音狀態(tài),而不能同時進行錄音或放音,而本發(fā)明的靜音檢測技術(shù)適用于全雙工模式與半雙工模式。
參照圖2、圖3所示,其是網(wǎng)絡(luò)電話在全雙工模式或半雙工模式進行傳送及接收語音的工作方塊圖,該全雙工模式與半雙工模式在傳送語音時,都是先經(jīng)由麥克風13將所錄制到的語音分別傳輸至混音器21、模/數(shù)轉(zhuǎn)換22、錄音應(yīng)用程序介面(錄音API)23、錄音端靜音模組24、數(shù)據(jù)機或網(wǎng)絡(luò)卡15再通過網(wǎng)絡(luò)將語音傳輸至接收方;而全雙工模式與半雙工模式在接收語音時,都是先通過網(wǎng)絡(luò)接收語音數(shù)據(jù),再將該語音數(shù)據(jù)經(jīng)由數(shù)據(jù)機或網(wǎng)絡(luò)卡15、放音端靜音模組25、接收應(yīng)用程序介面(接收API)26、數(shù)/模轉(zhuǎn)換27、混音器21,再由揚聲器14播送出去;其中,本發(fā)明的靜音檢測技術(shù)是應(yīng)用在錄音端靜音模組24及放音端靜音模組25中,至于,在半雙工模式中,其靜音檢測技術(shù)中尚包括有一轉(zhuǎn)換模組28,以實現(xiàn)說/聽模式的自動和強制轉(zhuǎn)換。
參照圖4、圖5所示,是全雙工錄音端靜音模組24的硬件結(jié)構(gòu)圖及流程圖,首先,先檢測錄音應(yīng)用程序介面23所抽樣的音頻數(shù)據(jù),若檢測為語音數(shù)據(jù),則啟動編碼器31,將語音數(shù)據(jù)編碼,并按壓數(shù)據(jù)選擇開關(guān)32將編碼數(shù)據(jù)傳送給數(shù)據(jù)機或網(wǎng)絡(luò)卡15,反之,若檢測不是語音數(shù)據(jù)時,即關(guān)閉編碼器31,并按壓數(shù)據(jù)選擇開關(guān)32將靜音框架(frame)33數(shù)據(jù)傳送至數(shù)據(jù)機或網(wǎng)絡(luò)卡15。
參照圖6、圖7所示,是半雙工錄音端靜音模組24的硬件結(jié)構(gòu)圖及流程圖,首先,先檢測錄音應(yīng)用程序介面23所抽樣的音頻數(shù)據(jù),若檢測為語音數(shù)據(jù),則啟動編碼器31,將語音數(shù)據(jù)編碼,并傳送給數(shù)據(jù)機或網(wǎng)絡(luò)卡15,反之,若檢測不是語音數(shù)據(jù)時,即關(guān)閉編碼器31,并將檢測結(jié)果輸入至轉(zhuǎn)換模組28以啟動說/聽模式的轉(zhuǎn)換。
在上述的全雙工與半雙工的錄音端靜音模組24中,其具有一靜音檢測模組34,而本發(fā)明即藉由該靜音檢測模組34從背景噪聲中找出語音的開始和終止,而靜音檢測模組包含有語音檢測、靜音檢測及噪音檢測等;參照圖8所示,該語音檢測是作為檢測語音的起始部分(句子或段落的開頭),它是采用短時平均能量檢測,首先收集當前一框架(frame)的音頻數(shù)據(jù)N,將該音頻數(shù)據(jù)N求其振幅值和并通過短時濾波,而得到這一框架(frame)的短時平均能量Se′,一旦短時平均能量Se′超過語音能量Se的臨界值時,即表示檢測到語音,而從這一框架(frame)開始的音頻數(shù)據(jù)N皆被視為語音數(shù)據(jù),直至檢測到靜音為止。
該語音檢測按如下公式進行首先,計算當前框架(frame)的語音能量SeN-1Se=∑|Xin(i)| N為每框架(frame)語音數(shù)i=0其次,計算當前框架(frame)的過零率SzN-1Sz=∑|sgn[Xin(i)]-sgn[Xin(i-1)]|/2NI=0其中sgn[Xin(i)]=1,Xin(i)>=0sgn[Xin(I)]=-1,Xin(I)<0然后,上述語音能量經(jīng)過短時濾波器后,得到短時平均能量Se,Se=0.5Se′+0.5Se因此,當(Se′>Et)且(Szmin<Sz<Szmax)時,表示當前有語音信號,并將當前狀態(tài)設(shè)置為說話狀態(tài),且程序進入靜音檢測;其中,Et為語音能量臨界值,而Szmin與Szmax分別為過零率下限和上限。
參照圖9所示,本發(fā)明中,該靜音檢測是作為檢測交談間隙的靜音(句子或段落之間的間隔),由于靜音的能量小且持續(xù)時間長,因此采用長時平均能量檢測,它是將當前一框架(frame)的短時平均能量Se′通過低通濾波器,而得到這一框架(frame)的長時平均能量Se′并進行檢測,只有當連續(xù)數(shù)框架(frame)的長時平均能量Ss′均低于靜音能量臨界Est時,才表示檢測到靜音,因此,從這一框架(frame)起的音頻數(shù)據(jù)N均被視為背景噪聲,直至檢測到語音為止,至于連續(xù)檢測框架(frame)數(shù)則由正常通話的停頓時間計算得到。
該靜音檢測按如下公式進行首先,計算當前框架(frame)的語音能量SeN-1Se=∑|Xin(i)| N為每框架(frame)語音數(shù)i=0其次,上述語音能量經(jīng)過長時濾波器后,得到長時平均能量Ss′Ss′=0.9Ss′+0.1Ss然后,當(Ss<Est)則CONUT++(表示技術(shù)器累進加1);當(Ss>Est)則CONUT=0即表示檢測靜音,其中Est為靜音能量臨界值,因此,當CONUT=M時,即將目前狀態(tài)設(shè)置為接聽狀態(tài),而M是靜音需達到的框架(frame)數(shù)。
至于,上述的語音能量臨界值及靜音能量臨界值是由下述的公式求出,首先,當用戶不說話及靜音時,先測得麥克風輸入能量的平均值Ens,當用戶說話朗讀一段句子時,測得麥克風輸入能量的平均值Ent,故語音能量臨界值Et=Ens+0.5(Ent-Ens)靜音能量臨界值Est=Ens+0.2(Ent-Ens)現(xiàn)舉一實施例,若每一音頻數(shù)據(jù)N=320時,則經(jīng)過理論分析和實驗結(jié)果,即可求出語音能量臨界值Et=250000,靜音能量臨界值Est=100000,而過零率的臨界值,其下限Szmin=6,上限Szmax=36。
請參照圖10所示,本發(fā)明中,在噪音檢測中引入了過零率檢測,它是先收集當前一框架(frame)的音頻數(shù)據(jù),計算相鄰數(shù)據(jù)其正、負符號的變換次數(shù)(即過零率),當過零率高于臨界值時,即判定檢測到噪音,這一框架(frame)音頻數(shù)據(jù)同樣被現(xiàn)視為背景噪聲,現(xiàn)舉一例子說明如何計算相鄰數(shù)據(jù)其正、負符號變換次數(shù),例如該語音數(shù)據(jù)為20,50,100,40,10,-30,-50,-10,10,60,90,50由于,其整個數(shù)據(jù)的正、負符號的變換只有二次,所以其過零率為“2”,而過零率臨界值是由統(tǒng)計特性得到。
因此,經(jīng)過上述該三種檢測分離出語音和背景噪聲,就能在有限的網(wǎng)絡(luò)頻寬內(nèi)得到最佳的通話效果。
參照圖15A-15B所示,是錄音端總流程圖,它綜合了錄音端全雙工靜音模組、半雙工靜音模組和靜音檢測模組。首先使用語音檢測方法確定語音的起始部分,然后使用靜音檢測方法確定語音的終止部分,最后使用噪音檢測方法濾除語音中夾雜的噪音,這樣就得到了“純”語音數(shù)據(jù)。在全雙工模式下,將語音數(shù)據(jù)進行編碼通過網(wǎng)絡(luò)傳送,另外傳送靜音框架數(shù)據(jù)協(xié)調(diào)交談的同步性。在半雙工模式下,將語音數(shù)據(jù)進行編碼通過網(wǎng)絡(luò)傳送,同時以有無語音數(shù)據(jù)為標志進行說/聽模式的轉(zhuǎn)換。
本發(fā)明中,在上述的全雙工錄音端靜音模組24中,當檢測到傳送方未傳送語音數(shù)據(jù)時,則同時傳送一靜音框架(frame)33數(shù)據(jù),該靜音框架(frame)33數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬,因此當接收方收到靜音框架(frame)33數(shù)據(jù)時,即代表傳送方未傳送語音數(shù)據(jù),接收方即可傳送當?shù)氐谋尘霸肼曋羵魉头剑铍p方不會因網(wǎng)絡(luò)傳送的延遲性,而有談話不同步的感覺;因此,參照圖11、12所示,是全雙工放音端靜音模組25的硬件結(jié)構(gòu)圖及流程圖,首先,該網(wǎng)絡(luò)臨測模組35是負責監(jiān)測數(shù)據(jù)機或網(wǎng)絡(luò)卡15接收的數(shù)據(jù),當監(jiān)測到是為編碼數(shù)據(jù),亦即語音數(shù)據(jù)時,即起動解碼器36,并按壓數(shù)據(jù)選擇開關(guān)32,將解碼后的語音數(shù)據(jù)傳送至接收應(yīng)用程序介面26;反之,若未監(jiān)測到編碼數(shù)據(jù),即傳送方未傳送語音數(shù)據(jù),則關(guān)閉解碼器36,并按壓數(shù)據(jù)選擇開關(guān)32,將背景噪聲37傳送至接收應(yīng)用程序介面26中。
參照圖13、14所示,是半雙工放音端靜音模組25的硬件結(jié)構(gòu)圖及流程圖,首先,該網(wǎng)絡(luò)監(jiān)測模組35是負責監(jiān)測數(shù)據(jù)機或網(wǎng)絡(luò)卡15接收的數(shù)據(jù),當監(jiān)測到編碼數(shù)據(jù)時,即語音數(shù)據(jù)時,則啟動解碼器36,并將解碼后的語音數(shù)據(jù)傳送至接收應(yīng)用程序介面26;反之,若未監(jiān)測到編碼數(shù)據(jù),即未傳送語音數(shù)據(jù),則關(guān)閉解碼器36,將檢測結(jié)果輸入至轉(zhuǎn)換模組28,以觸發(fā)聽/說模式的轉(zhuǎn)換。
參照圖16所示,是放音端總流程圖,它綜合了放音端全雙工靜音模組、和半雙工靜音模組。靜音模組時刻監(jiān)測是否接收到語音編碼數(shù)據(jù),在全雙工模式下,將語音編碼數(shù)據(jù)解碼后通過聲霸卡回放,另外回放背景噪聲協(xié)調(diào)交談的同步性;在半雙工模式下,將語音編碼數(shù)據(jù)解碼后通過聲霸卡回放,同時以有無語音編碼數(shù)據(jù)為標志進行聽/說模式的轉(zhuǎn)換。
本發(fā)明中,上述轉(zhuǎn)換模組28工作在半雙工模式下,主要是自動或強制轉(zhuǎn)換說/聽模式,當轉(zhuǎn)換模組28啟動時,若在錄音端靜音模組24時,靜音檢測模組34檢測到語音數(shù)據(jù)時,即刻保持說話模式,反之,則自動轉(zhuǎn)換成接聽模式;而若在放音端靜音模組25時,當網(wǎng)絡(luò)監(jiān)測模組35監(jiān)測到語音數(shù)據(jù)時,即刻保持接聽模式,反之,則自動轉(zhuǎn)換成說話模式,此外,在接聽模式下,若用戶按壓一功能鍵29時,轉(zhuǎn)換模組28立即強制轉(zhuǎn)換成說話模式。
綜上所述,綜合多種檢測可正確分離語音和背景噪聲,以減少數(shù)據(jù)傳輸,同時,對靜音數(shù)據(jù)作特殊處理,以協(xié)調(diào)交談的同步性,此外,令半雙工說/聽模式能轉(zhuǎn)換自如,以方便用戶隨時都能說話,所以,本發(fā)明實為一理想的靜音檢測技術(shù)。
以上所述,僅為本發(fā)明的一些可行實施例,但并非用以限定本發(fā)明的保護范圍,凡依據(jù)權(quán)利要求書所述的內(nèi)容、特征以及其精神而進行其他變化的等效實施,都應(yīng)包含在本發(fā)明的保護范圍內(nèi)。
權(quán)利要求
1.一種網(wǎng)絡(luò)電話中的靜音檢測方法,用于在網(wǎng)絡(luò)電話的全雙工與半雙工通話模式中通過各靜音檢測,正確分離語音和背景噪聲,以濾除冗余音頻數(shù)據(jù),所述檢測方法按如下步驟執(zhí)行(1)檢測語音的起始部分,當收集到當前一框架(frame)的音頻數(shù)據(jù)時,通過求其振幅值和而得到短時平均能量,一旦短時平均能量超過語音能量臨界值時,即代表檢測到語音;(2)檢測交談間隙的靜音,將當前一框架(frame)所計算出的短時平均能量通過低通濾波器,得到這一框架(frame)的長時平均能量并進行檢測,當連續(xù)數(shù)框架(frame)的長時平均能量均低于靜音能量臨界值時,即檢測到靜音;(3)檢測交談間隙的噪音,收集當前一框架(frame)的音頻數(shù)據(jù),計算相鄰數(shù)據(jù)其正、負符號的變換次數(shù)(即過零率),一旦過零率超過臨界值時,即判定檢測到噪音。
2.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該網(wǎng)絡(luò)電話在傳送語音時,先經(jīng)由麥克風將所錄制到的語音分別傳輸至混音器、模/數(shù)轉(zhuǎn)換、錄音應(yīng)用程序介面(錄音API)、錄音端靜音模組、數(shù)據(jù)機或網(wǎng)絡(luò)卡再通過網(wǎng)絡(luò)將語音傳輸至接收方。
3.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該網(wǎng)絡(luò)電話在接收語音時,先通過網(wǎng)絡(luò)接收語音數(shù)據(jù),再將該語音數(shù)據(jù)經(jīng)由數(shù)據(jù)機或網(wǎng)絡(luò)卡、放音端靜音模組、接收應(yīng)用程序介面(接收API)、數(shù)/模轉(zhuǎn)換、混音器,再由揚聲器播送出去。
4.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該語音檢測是采用短時平均能量檢測,首先收集當前一框架(frame)的音頻數(shù)據(jù)N,將該音頻數(shù)據(jù)N求其振幅值和并通過短時濾波,而得到這一框架(frame)的短時平均能量Se′,一旦短時平均能量Se′超過語音能量臨界值Et時,即表示檢測到語音,而從這一框架(frame)開始的音頻數(shù)據(jù)N都被視為語音數(shù)據(jù),直至檢測到靜音為止。
5.如權(quán)利要求4所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該語音能量臨界值是由下述的公式求出,首先,當用戶不說話及靜音時,先測得麥克風輸入能量的平均值Ens,當用戶說話朗讀一段句子時,測得麥克風輸入能量的平均值Ent,從而得到語音能量臨界值為Et=Ens+0.5(Ent=Ens)。
6.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該靜音檢測是采用長時平均能量檢測,首先,收集當前一框架(frame)的音頻數(shù)據(jù)N,將該音頻數(shù)據(jù)N求其振幅值和而得到這一框架(frame)的短時平均能量Se′,此時,將短時平均能量Se′通過低通濾波器,而得到這一框架(frame)的長時平均能量Ss′并進行檢測,只有當連續(xù)數(shù)框架(frame)的長時平均能量Ss′均低于靜音能量臨界值Est時,才表示檢測到靜音,因此,從這一框架(frame)起的音頻數(shù)據(jù)N均被視為背景噪聲,直至檢測到語音為止。
7.如權(quán)利要求6所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該靜音能量臨界值是由下述的公式求出,首先,當用戶不說話及靜音時,先測得麥克風輸入能量的平均值Ens,當用戶說話朗讀一段句子時,測得麥克風輸入能量的平均值Ent,從而獲得靜音能量臨界值Est=Ens+0.2(Ent-Ens)。
8.如權(quán)利要求2所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,在該全雙工錄音端靜音模組中,當檢測到傳送方未傳送語音數(shù)據(jù)時,同時傳送一靜音框架(frame)數(shù)據(jù),該靜音框架(frame)數(shù)據(jù)能較語音數(shù)據(jù)節(jié)省傳輸頻寬,所以當接收方接收到靜音框架(frame)數(shù)據(jù)時,即代表傳送方未傳送語音數(shù)據(jù),接收方即可傳送當?shù)氐谋尘霸肼曋羵魉头剑铍p方不會因網(wǎng)絡(luò)傳送的延遲性,而有談話不同步的感覺。
9.如權(quán)利要求1所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該網(wǎng)絡(luò)電話在半雙工模式中,它具有一轉(zhuǎn)換模組,令半雙工說/聽模式能轉(zhuǎn)換自如,以方便用戶隨時都能說話。
10.如權(quán)利要求9所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,當轉(zhuǎn)換模組啟動時,若在錄音端靜音模組時,靜音檢測模組一檢測到語音數(shù)據(jù)時,即保持說話模式,反之,則自動轉(zhuǎn)換成接聽模式,而若在放音端靜音模組時,當網(wǎng)絡(luò)監(jiān)測模組監(jiān)測到語音數(shù)據(jù)時,即保持接聽模式,反之,則自動轉(zhuǎn)換成說話模式。
11.如權(quán)利要求10所述的網(wǎng)絡(luò)電話中的靜音檢測方法,其中,該轉(zhuǎn)換模組并設(shè)有一功能鍵,當在接聽模式下,若用戶按壓功能鍵時,轉(zhuǎn)換模組即強制轉(zhuǎn)換成說話模式。
全文摘要
一種網(wǎng)絡(luò)電話中的靜音檢測方法,其步驟如下:當收集到當前框架的音頻數(shù)據(jù)時,求其振幅值和得到短時平均能量,短時平均能量超過語音能量臨界值時,代表檢測到語音,再將當前框架的短時平均能量通過低通濾波器,得到這一框架的長時平均能量并進行檢測,當連續(xù)數(shù)框架的長時平均能量均低于靜音能量的臨界值時,即檢測到靜音,然后,再收集當前一框架的音頻數(shù)據(jù),計算相鄰數(shù)據(jù)正、負符號的變換次數(shù),一旦過零率超過臨界值時,即判定檢測噪音。
文檔編號H04M1/19GK1245376SQ9811836
公開日2000年2月23日 申請日期1998年8月17日 優(yōu)先權(quán)日1998年8月17日
發(fā)明者張景嵩, 謝綱, 薛克忠, 溫周斌 申請人:英業(yè)達股份有限公司