專利名稱:一種音頻文件音質(zhì)識別方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻文件質(zhì)量檢測的技術(shù)領(lǐng)域,尤其涉及一種音頻文件音質(zhì)識別方法,以及一種音頻文件音質(zhì)識別系統(tǒng)。
背景技術(shù):
音質(zhì)識別技術(shù)擁有著廣闊的應用領(lǐng)域和前景,目前主要的應用有音頻文件質(zhì)量檢測與鑒定,音頻壓縮、格式轉(zhuǎn)換技術(shù)對音頻質(zhì)量損耗的檢測與鑒定,錄音系統(tǒng)中硬件設(shè)備、 軟件環(huán)境的故障檢測,音像制品的盜版識別,以及各種樂器、電子擬聲設(shè)備、播放設(shè)備的質(zhì)量評測。其中,音頻文件質(zhì)量檢測與鑒定是目前音質(zhì)識別技術(shù)中最成熟的領(lǐng)域。音頻文件質(zhì)量檢測對于語音聲紋聲控技術(shù)、語音撥號、對多聲源環(huán)境中的某一音源監(jiān)聽、語音搜索、語音命令起到至關(guān)重要的作用。有音頻文件質(zhì)量檢測與鑒定,音頻壓縮、格式轉(zhuǎn)換技術(shù)對音頻質(zhì)量損耗的檢測與鑒定,錄音系統(tǒng)中硬件設(shè)備、軟件環(huán)境的故障檢測,音像制品的盜版識別,以及各種樂器、電子擬聲設(shè)備、播放設(shè)備的質(zhì)量評測有重要作用。頻譜分析儀依信號處理方式的不同,一般有兩種類型;即時頻譜分析儀 (Real-Time Spectrum Analyzer)與掃描調(diào)諧步頁譜分析儀(Sweep-Tuned Spectrum Analyzer)。即時頻率分析儀的功能為在同一瞬間顯示頻域的信號振幅,其工作原理是針對不同的頻率信號而有相對應的濾波器與檢知器(Detector),再經(jīng)由同步的多工掃描器將信號傳送到CRT或液晶等顯示儀器上進行顯示,其優(yōu)點是能顯示周期性雜散波(Periodic Random Waves)的瞬間反應,其缺點是價昂且性能受限于頻寬范圍,濾波器的數(shù)目與最大的多工交換時間(Switching Time)。最常用的頻譜分析儀是掃描調(diào)諧頻譜分析儀,基本結(jié)構(gòu)類似超外差式接收器,工作原理是輸入信號經(jīng)衰減器直接外加到混波器,可調(diào)變的本地振蕩器經(jīng)與CRT同步的掃描產(chǎn)生器產(chǎn)生隨時間作線性變化的振蕩頻率,經(jīng)混波器與輸入信號混波降頻后的中頻信號 (IF)再放大,濾波與檢波傳送到CRT的垂直方向板,因此在CRT的縱軸顯示信號振幅與頻率的對應關(guān)系。影響信號反應的重要部份為濾波器頻寬,濾波器之特性為高斯濾波器,影響的功能就是量測時常見到的解析頻寬RBW,代表兩個不同頻率的信號,能夠被清楚的分辨出來的最低頻寬差異,兩個不同頻率的信號頻寬如低于頻譜分析儀的RBW,此時該兩信號將重疊,難以分辨,較低的RBW固然有助于不同頻率信號的分辨與量測,低的RBW將濾除較高頻率的信號成份,導致信號顯示時產(chǎn)生失真,失真值與設(shè)定的RBW密切相關(guān),較高的RBW固然有助于寬頻帶信號的偵測,將增加雜訊底層值(Noise Floor),降低量測靈敏度,對于偵測低強度的信號易產(chǎn)生阻礙,因此適當?shù)腞BW寬度是正確使用頻譜分析儀重要的概念。音質(zhì)識別技術(shù)在很長一段時間內(nèi)采用的是向前-向后雙向檢測方式,這種技術(shù)手段有兩個非常明顯的缺陷1.計算量的浪費由于計算方法落后,導致計算時間過長,對硬件資源和能源的消耗較大。
2.計算路徑不能明確判定因為識別技術(shù)采用向前-向后的雙線計算方式,導致計算路徑單一,對于某些音域識別的準確性有影響。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于提供一種能夠快速準確地判斷音頻文件質(zhì)量的音頻文件音質(zhì)識別方法。一種音頻文件音質(zhì)識別方法,包括將音頻文件以預定的時間間隔平均劃分為多個音頻片段;將各個所述音頻片段轉(zhuǎn)換到頻域;根據(jù)各個所述音頻片段的頻域?qū)哪芰恐?,計算所述音頻文件的平均截斷頻率;比較所述音頻文件的平均截斷頻率與基準截斷頻率;當所述音頻文件的平均截斷頻率大于所述基準截斷頻率時,將所述音頻文件劃分為高音質(zhì)音頻文件,否則,將所述音頻文件劃分為低音質(zhì)音頻文件。本發(fā)明要解決的技術(shù)問題還在于提供一種能夠快速準確地判斷音頻文件質(zhì)量的音頻文件音質(zhì)識別系統(tǒng)。一種音頻文件音質(zhì)識別系統(tǒng),包括音頻分段模塊、轉(zhuǎn)換模塊、截斷頻率計算模塊、 比較模塊、分類模塊。所述音頻分段模塊用于將音頻文件以預定的時間間隔平均劃分為多個音頻片段;所述轉(zhuǎn)換模塊用于將各個所述音頻片段轉(zhuǎn)換到頻域;所述截斷頻率計算模塊用于根據(jù)各個所述音頻片段的頻域?qū)哪芰恐?,計算所述音頻文件的平均截斷頻率;所述比較模塊用于比較所述音頻文件的平均截斷頻率與基準截斷頻率;所述分類模塊用于在所述音頻文件的平均截斷頻率大于所述基準截斷頻率時,將所述音頻文件劃分為高音質(zhì)音頻文件;在所述音頻文件的平均截斷頻率不大于所述基準截斷頻率時,否則,將所述音頻文件劃分為低音質(zhì)音頻文件。與現(xiàn)有技術(shù)相比較,本發(fā)明的音頻文件音質(zhì)識別方法及其系統(tǒng),通過所述將音頻文件劃分為多個音頻片段,將每個音頻片段轉(zhuǎn)換到頻域,通過每個音頻片段的頻域?qū)哪芰恐涤嬎闼鲆纛l文件的平均截斷頻率。所述平均截斷頻率反映了音頻在高頻的丟失或壓縮程度,平均截斷頻率越高,說明音頻在高音部分的丟失或壓縮程度不高,因此是高音質(zhì),否則為低音質(zhì)。建立基準截斷頻率對計算獲得音頻文件的平均截斷頻率比較,就可以根據(jù)比較結(jié)果快速準確地判斷所述音頻文件的音質(zhì)高低。本發(fā)明的音頻文件音質(zhì)識別方法及其系統(tǒng)的運算簡單,除了對數(shù)據(jù)實施傅里葉變換轉(zhuǎn)換到頻域之外,其余的都是簡單的比較和求平均值;適用性高,只要是基于PCM的音頻數(shù)據(jù)都可以采用本算法做鑒別,而目前數(shù)字音樂的基本上都是基于PCM的;本發(fā)明對于低碼率源轉(zhuǎn)高碼率的音頻有很好的辨識效果。
圖1是本發(fā)明音頻文件音質(zhì)識別方法的流程示意圖;圖2是本發(fā)明音頻文件音質(zhì)識別系統(tǒng)的結(jié)構(gòu)示意圖;圖3是本發(fā)明音頻文件音質(zhì)識別系統(tǒng)的截斷頻率計算模塊一種優(yōu)選實施方式的結(jié)構(gòu)示意圖;圖4是本發(fā)明音頻文件音質(zhì)識別系統(tǒng)的判決模塊一種優(yōu)選實施方式的結(jié)構(gòu)示意圖5是本發(fā)明音頻文件音質(zhì)識別系統(tǒng)的比較模塊一種優(yōu)選實施方式的結(jié)構(gòu)示意圖。
具體實施例方式請參閱圖1,圖1是本發(fā)明音頻文件音質(zhì)識別方法的流程示意圖。所述音頻文件音質(zhì)識別方法包括Si,將音頻文件以預定的時間間隔平均劃分為多個音頻片段,并將各個所述音頻片段轉(zhuǎn)換到頻域;在本步驟中,將待識別音質(zhì)的音頻文件等份劃分為多個音頻片段,以便對每個音頻文件進行轉(zhuǎn)換??筛鶕?jù)識別精度的要求來對所述音頻文件進行劃分,在精度要求較高時以較短的時間間隔將音頻文件劃分為較多的音頻片段;在精度要求較低時以較長的時間間隔劃分。在本實施方式中,通過分別對各個所述音頻片段進行傅里葉變換,將各個所述音頻片段轉(zhuǎn)換到頻域。S2,根據(jù)各個所述音頻片段的頻域?qū)哪芰恐担嬎闼鲆纛l文件的平均截斷
頻率;將各個所述音頻片段轉(zhuǎn)換到頻域后,每一所述音頻片段都對應全頻域,分別獲取所述音頻片段的頻域中的各個頻段對應的能量值,可計算出所述音頻文件的平均截斷頻率。優(yōu)選地,在計算所述音頻文件的平均截斷頻率時,逐次選取所述音頻文件中若干個連續(xù)的音頻片段;分別根據(jù)所述若干個連續(xù)的音頻片段的各個頻段的能量值,判決所述若干個連續(xù)的音頻片段的截斷頻率;然后在獲得所有的音頻片段對應的截斷頻率后,計算所述平均截斷頻率。例如可逐次選取所述音頻文件中連續(xù)的20個音頻片段,對所述20個音頻片段進行截斷頻率的計算,然后再獲取下一連續(xù)的20個音頻片段,再次計算截斷頻率, 直到所述音頻文件的所有音頻片段都被獲取并進行截斷頻率計算為止。獲得多個截斷頻率值,對所述多個截斷頻率值求平均值,即獲得所述音頻文件的平均截斷頻率。進一步地,在選取所述音頻文件中若干個連續(xù)的音頻片段進行截斷頻率計算之前,可先對所述音頻文件的內(nèi)容進行初步的篩選,由于歌曲在開始和結(jié)尾處通常頻率分布不夠完整和穩(wěn)定,所以可以排除前后部分時間段的內(nèi)容。即可以排除所述音頻文件前后N 個音頻片段之后,在其他各個音頻片段中逐次選取若干個連續(xù)的音頻片段進行所述截斷頻率的計算,其中,N為正整數(shù)。在本步驟中判決所述若干個連續(xù)的音頻片段的截斷頻率時,可采取以下方法分別獲取各個所述音頻片段所包含的各個頻段的能量值;比較所述若干個連續(xù)的音頻片段所包含的相同頻段的能量值,獲取各個頻段的最大能量值;按照頻率從高到低的順序,依次將相鄰的兩個頻段對應的最大能量值相減,在相減的差值首次大于基準能量差值時,獲取作為減數(shù)的最大能量值所對應的頻段作為所述若干個連續(xù)的音頻片段的截斷頻率。上述基準能量差值優(yōu)選設(shè)置為3分貝。亦即,按照頻率從高到低的順序,當相鄰的兩個頻段對應的最大能量值相減的差值首次大于3分貝時,作為減數(shù)的最大能量值所對應的頻段為所述截斷頻率。
因為業(yè)內(nèi)對于音頻文件通常是在高頻部分壓縮的最多,所以上述截斷頻率的判決方法中首先按高頻到低頻的順序來對各個相鄰頻段的最大能量值相減,這樣就可以最快地獲得高頻部分的截斷頻率,通過高頻部分的截斷頻率即可表征整個音頻片段或音頻文件的整體截斷頻率,又可以簡化計算,提高運算速度。S3,比較所述音頻文件的平均截斷頻率與基準截斷頻率;在本步驟中,所述基準截斷頻率可以根據(jù)經(jīng)驗或者音質(zhì)要求預先設(shè)定。作為一種優(yōu)選實施方式,可預先建立保存一個標準的碼率-基準截斷頻率對照表;然后根據(jù)所述音頻文件的碼率,查詢所述碼率-基準截斷頻率對照表,獲取與所述音頻文件的碼率對應的基準截斷頻率;將計算獲得的所述音頻文件的平均截斷頻率與查詢獲得的所述基準截斷頻率比較。如果所述音頻文件的平均截斷頻率大于所述基準截斷頻率,則認為所述音頻文件的平均截斷頻率較高,為高音質(zhì)音頻文件,否則為低音質(zhì)音頻文件。所述碼率-基準截斷頻率對照表的建立可以先根據(jù)對大量的音質(zhì)確定的音頻文件進行分析建立,分別統(tǒng)計多個不同音質(zhì)的音頻文件的碼率和平均截斷頻率,然后建立所述碼率-基準截斷頻率對照表,再可根據(jù)實際需要和音質(zhì)要求設(shè)定每種音質(zhì)標準的基準截斷頻率。建立所述碼率-基準截斷頻率對照表的參考歌曲可從用戶的歌庫中的所有歌曲中選取,對所述歌庫中的所有歌曲實施截斷頻率計算,由于絕大部分歌曲是正常歌曲,所以我們能夠建立所述碼率-基準截斷頻率對照表。所述碼率-基準截斷頻率對照表中的基準截斷頻率值即成為判定歌曲音質(zhì)的標準。低于標準值越多,判別為低音質(zhì)的置信度越高。S4,當所述音頻文件的平均截斷頻率大于所述基準截斷頻率時,將所述音頻文件劃分為高音質(zhì)音頻文件,否則,將所述音頻文件劃分為低音質(zhì)音頻文件。通過查詢上述碼率-基準截斷頻率對照表獲得的判斷結(jié)果,如果某一首歌曲的平均截斷頻率低于所述碼率-基準截斷頻率對照表中同一碼率對應的平均截斷頻率,則認為該歌曲是“偽高碼率歌曲”,即高碼率但是音質(zhì)不高。與現(xiàn)有技術(shù)相比較,本發(fā)明的音頻文件音質(zhì)識別方法,以截斷頻率為依據(jù)判斷音樂的音質(zhì),使用頻率段極值以及頻率能量差作為計算截斷頻率的依據(jù)。計算簡單,除了對數(shù)據(jù)實施傅里葉變換,其余的都是簡單的比較和求平均值。適用性高,只要是基于PCM的音頻數(shù)據(jù)都可以采用本算法做鑒別,而目前數(shù)字音樂的基本上都是基于PCM的。對于低碼率源轉(zhuǎn)高碼率的音頻有很好的辨識效果。請參閱圖2,圖2是本發(fā)明音頻文件音質(zhì)識別系統(tǒng)的結(jié)構(gòu)示意圖。所述音頻文件音質(zhì)識別系統(tǒng),包括音頻轉(zhuǎn)換模塊11、截斷頻率計算模塊12、比較模塊13和分類模塊14。所述音頻轉(zhuǎn)換模塊11用于將音頻文件以預定的時間間隔平均劃分為多個音頻片段,并將各個所述音頻片段轉(zhuǎn)換到頻域;所述截斷頻率計算模塊12用于根據(jù)各個所述音頻片段的頻域?qū)哪芰恐?,計算所述音頻文件的平均截斷頻率;所述比較模塊13用于比較所述音頻文件的平均截斷頻率與基準截斷頻率;所述分類模塊14用于在所述音頻文件的平均截斷頻率大于所述基準截斷頻率時,將所述音頻文件劃分為高音質(zhì)音頻文件;在所述音頻文件的平均截斷頻率不大于所述基準截斷頻率時,否則,將所述音頻文件劃分為低音質(zhì)音頻文件。所述音頻轉(zhuǎn)換模塊11將待識別音質(zhì)的音頻文件等份劃分為多個音頻片段,以便對每個音頻文件進行轉(zhuǎn)換。所述音頻轉(zhuǎn)換模塊11可根據(jù)識別精度的要求來對所述音頻文件進行劃分,在精度要求較高時以較短的時間間隔將音頻文件劃分為較多的音頻片段;在精度要求較低時以較長的時間間隔劃分。在本實施方式中,所述音頻轉(zhuǎn)換模塊11通過分別對各個所述音頻片段進行傅里葉變換,將各個所述音頻片段轉(zhuǎn)換到頻域。所述音頻轉(zhuǎn)換模塊11將各個所述音頻片段轉(zhuǎn)換到頻域后,每一所述音頻片段都對應全頻域,所述截斷頻率計算模塊12分別獲取所述音頻片段的頻域中的各個頻段對應的能量值,可計算出所述音頻文件的平均截斷頻率。優(yōu)選地,所述截斷頻率計算模塊12包括音頻截取模塊121、判決模塊122和均值計算模塊123。如圖3所示。所述音頻截取模塊121用于逐次選取所述音頻文件中若干個連續(xù)的音頻片段;所述判決模塊122用于分別根據(jù)所述若干個連續(xù)的音頻片段的各個頻段的能量值,判決所述若干個連續(xù)的音頻片段的截斷頻率;所述均值計算模塊123用于獲得所有的音頻片段對應的截斷頻率后,計算所述平均截斷頻率。例如可逐次選取所述音頻文件中連續(xù)的20個音頻片段,對所述20個音頻片段進行截斷頻率的計算,然后再獲取下一連續(xù)的20個音頻片段,再次計算截斷頻率,直到所述音頻文件的所有音頻片段都被獲取并進行截斷頻率計算為止。獲得多個截斷頻率值, 對所述多個截斷頻率值求平均值,即獲得所述音頻文件的平均截斷頻率。進一步地,所述音頻截取模塊121在選取所述音頻文件中若干個連續(xù)的音頻片段進行截斷頻率計算之前,可先對所述音頻文件的內(nèi)容進行初步的篩選。由于歌曲在開始和結(jié)尾處通常頻率分布不夠完整和穩(wěn)定,所以所述音頻截取模塊121可以排除前后部分時間段的內(nèi)容,即可以排除所述音頻文件前后N個音頻片段之后,在其他各個音頻片段中逐次選取若干個連續(xù)的音頻片段進行所述截斷頻率的計算,其中,N為正整數(shù)。在本實施方式中,所述判決模塊122包括能量值判決子模塊21、最大值判斷子模塊22和截斷頻率判決模塊23。如圖4所示。所述能量值判決子模塊21用于獲取各個所述音頻片段所包含的各個頻段的能量值;所述最大值判斷子模塊22用于比較所述若干個連續(xù)的音頻片段所包含的相同頻段的能量值,獲取各個頻段的最大能量值;所述截斷頻率判決模塊23用于按照頻率從高到低的順序,依次將相鄰的兩個頻段對應的最大能量值相減,在相減的差值首次大于基準能量差值時,獲取作為減數(shù)的最大能量值所對應的頻段作為所述若干個連續(xù)的音頻片段的截斷頻率。上述基準能量差值優(yōu)選設(shè)置為3分貝。亦即,按照頻率從高到低的順序,當相鄰的兩個頻段對應的最大能量值相減的差值首次大于3分貝時,作為減數(shù)的最大能量值所對應的頻段為所述截斷頻率。因為業(yè)內(nèi)對于音頻文件通常是在高頻部分壓縮的最多,所以上述截斷頻率的判決方法中首先按高頻到低頻的順序來對各個相鄰頻段的最大能量值相減,這樣就可以最快地獲得高頻部分的截斷頻率,通過高頻部分的截斷頻率即可表征整個音頻片段或音頻文件的整體截斷頻率,又可以簡化計算,提高運算速度。
所述比較模塊13用于將計算獲取的待識別音質(zhì)的音頻文件的平均截斷頻率和所述基準截斷頻率比較,所述基準截斷頻率可以根據(jù)經(jīng)驗或者音質(zhì)要求預先設(shè)定。作為一種優(yōu)選實施方式,可預先建立保存一個標準的碼率-基準截斷頻率對照表,所述比較模塊13包括儲存子模塊131、查詢子模塊132和數(shù)據(jù)比較子模塊133。如圖 5所示。所述儲存子模塊131用于預先保存碼率-基準截斷頻率對照表;所述查詢子模塊132用于根據(jù)所述音頻文件的碼率,查詢所述碼率-基準截斷頻率對照表,獲取與所述音頻文件的碼率對應的基準截斷頻率;所述數(shù)據(jù)比較子模塊133用于將計算獲得的所述音頻文件的平均截斷頻率與查詢獲得的所述基準截斷頻率比較。如果所述音頻文件的平均截斷頻率大于所述基準截斷頻率,則認為所述音頻文件的平均截斷頻率較高,為高音質(zhì)音頻文件,否則為低音質(zhì)音頻文件。所述碼率-基準截斷頻率對照表的建立可以先根據(jù)對大量的音質(zhì)確定的音頻文件進行分析建立,分別統(tǒng)計多個不同音質(zhì)的音頻文件的碼率和平均截斷頻率,然后建立所述碼率-基準截斷頻率對照表,再可根據(jù)實際需要和音質(zhì)要求設(shè)定每種音質(zhì)標準的基準截斷頻率。建立所述碼率-基準截斷頻率對照表的參考歌曲可從用戶的歌庫中的所有歌曲中選取,對所述歌庫中的所有歌曲實施截斷頻率計算,由于絕大部分歌曲是正常歌曲,所以我們能夠建立所述碼率-基準截斷頻率對照表。所述碼率-基準截斷頻率對照表中的基準截斷頻率值即成為判定歌曲音質(zhì)的標準。低于標準值越多,判別為低音質(zhì)的置信度越高。所述分類模塊14根據(jù)所述比較模塊13的比較結(jié)果對所述音頻文件進行分類,當所述音頻文件的平均截斷頻率大于所述基準截斷頻率時,將所述音頻文件劃分為高音質(zhì)音頻文件,否則,將所述音頻文件劃分為低音質(zhì)音頻文件。所述比較模塊13通過查詢上述碼率-基準截斷頻率對照表獲得的判斷結(jié)果,如果某一首歌曲的平均截斷頻率低于所述碼率-基準截斷頻率對照表中同一碼率對應的平均截斷頻率,則認為該歌曲是“偽高碼率歌曲”,即高碼率但是音質(zhì)不高,由所述分類模塊14 對所述音頻文件進行正確的分類。與現(xiàn)有技術(shù)相比較,本發(fā)明的音頻文件音質(zhì)識別系統(tǒng)中,以截斷頻率為依據(jù)判斷音樂的音質(zhì),使用頻率段極值以及頻率能量差作為計算截斷頻率的依據(jù)。計算簡單,除了對數(shù)據(jù)實施傅里葉變換,其余的都是簡單的比較和求平均值。適用性高,只要是基于PCM的音頻數(shù)據(jù)都可以采用本算法做鑒別,而目前數(shù)字音樂的基本上都是基于PCM的。對于低碼率源轉(zhuǎn)高碼率的音頻有很好的辨識效果。以上所述的本發(fā)明實施方式,并不構(gòu)成對本發(fā)明保護范圍的限定。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進等,均應包含在本發(fā)明的權(quán)利要求保護范圍之內(nèi)。
權(quán)利要求
1.一種音頻文件音質(zhì)識別方法,其特征在于,包括以下步驟將音頻文件以預定的時間間隔平均劃分為多個音頻片段,將各個所述音頻片段轉(zhuǎn)換到頻域;根據(jù)各個所述音頻片段的頻域?qū)哪芰恐担嬎闼鲆纛l文件的平均截斷頻率;比較所述音頻文件的平均截斷頻率與基準截斷頻率;當所述音頻文件的平均截斷頻率大于所述基準截斷頻率時,將所述音頻文件劃分為高音質(zhì)音頻文件,否則,將所述音頻文件劃分為低音質(zhì)音頻文件。
2.如權(quán)利要求1所述的音頻文件音質(zhì)識別方法,其特征在于,根據(jù)各個所述音頻片段的頻域?qū)哪芰恐?,計算所述音頻文件的平均截斷頻率的步驟包括逐次選取所述音頻文件中若干個連續(xù)的音頻片段;分別根據(jù)所述若干個連續(xù)的音頻片段的各個頻段的能量值,判決所述若干個連續(xù)的音頻片段的截斷頻率;獲取所有的音頻片段對應的截斷頻率后,計算所述平均截斷頻率。
3.如權(quán)利要求2所述的音頻文件音質(zhì)識別方法,其特征在于,判決所述若干個連續(xù)的音頻片段的截斷頻率的步驟包括獲取各個所述音頻片段所包含的各個頻段的能量值;比較所述若干個連續(xù)的音頻片段所包含的相同頻段的能量值,獲取各個頻段的最大能量值;按照頻率從高到低的順序,依次將相鄰的兩個頻段對應的最大能量值相減,在相減的差值首次大于基準能量差值時,獲取作為減數(shù)的最大能量值所對應的頻段作為所述若干個連續(xù)的音頻片段的截斷頻率。
4.如權(quán)利要求2所述的音頻文件音質(zhì)識別方法,其特征在于,在選取所述音頻文件中若干個連續(xù)的音頻片段之前,進一步包括以下步驟排除所述音頻文件前后N個音頻片段之后,在其他各個音頻片段中逐次選取若干個連續(xù)的音頻片段進行所述截斷頻率的計算,其中,N為正整數(shù)。
5.如權(quán)利要求1所述的音頻文件音質(zhì)識別方法,其特征在于通過對各個所述音頻片段進行傅里葉變換,將各個所述音頻片段轉(zhuǎn)換到頻域。
6.如權(quán)利要求1至5中任意一項所述的音頻文件音質(zhì)識別方法,其特征在于,比較所述音頻文件的平均截斷頻率與基準截斷頻率的步驟包括預先保存碼率-基準截斷頻率對照表;根據(jù)所述音頻文件的碼率,查詢所述碼率-基準截斷頻率對照表,獲取與所述音頻文件的碼率對應的基準截斷頻率;將計算獲得的所述音頻文件的平均截斷頻率與查詢獲得的所述基準截斷頻率比較。
7.一種音頻文件音質(zhì)識別系統(tǒng),其特征在于,包括音頻轉(zhuǎn)換模塊,用于將音頻文件以預定的時間間隔平均劃分為多個音頻片段,并將各個所述音頻片段轉(zhuǎn)換到頻域;截斷頻率計算模塊,用于根據(jù)各個所述音頻片段的頻域?qū)哪芰恐担嬎闼鲆纛l文件的平均截斷頻率;比較模塊,用于比較所述音頻文件的平均截斷頻率與基準截斷頻率;分類模塊,用于在所述音頻文件的平均截斷頻率大于所述基準截斷頻率時,將所述音頻文件劃分為高音質(zhì)音頻文件;在所述音頻文件的平均截斷頻率不大于所述基準截斷頻率時,否則,將所述音頻文件劃分為低音質(zhì)音頻文件。
8.如權(quán)利要求7所述的音頻文件音質(zhì)識別系統(tǒng),其特征在于,所述截斷頻率計算模塊包括音頻截取模塊,用于逐次選取所述音頻文件中若干個連續(xù)的音頻片段; 判決模塊,用于分別根據(jù)所述若干個連續(xù)的音頻片段的各個頻段的能量值,判決所述若干個連續(xù)的音頻片段的截斷頻率;均值計算模塊,用于獲得所有的音頻片段對應的截斷頻率后,計算所述平均截斷頻率。
9.如權(quán)利要求8所述的音頻文件音質(zhì)識別系統(tǒng),其特征在于,所述判決模塊包括 能量值判決子模塊,用于獲取各個所述音頻片段所包含的各個頻段的能量值; 最大值判斷子模塊,用于比較所述若干個連續(xù)的音頻片段所包含的相同頻段的能量值,獲取各個頻段的最大能量值;截斷頻率判決模塊,用于按照頻率從高到低的順序,依次將相鄰的兩個頻段對應的最大能量值相減,在相減的差值首次大于基準能量差值時,獲取作為減數(shù)的最大能量值所對應的頻段作為所述若干個連續(xù)的音頻片段的截斷頻率。
10.如權(quán)利要求7至9中任一項所述的音頻文件音質(zhì)識別系統(tǒng),其特征在于,所述比較模塊包括儲存子模塊,用于預先保存碼率-基準截斷頻率對照表;查詢子模塊,用于根據(jù)所述音頻文件的碼率,查詢所述碼率-基準截斷頻率對照表,獲取與所述音頻文件的碼率對應的基準截斷頻率;數(shù)據(jù)比較子模塊,用于將計算獲得的所述音頻文件的平均截斷頻率與查詢獲得的所述基準截斷頻率比較。
全文摘要
本發(fā)明提供一種音頻文件音質(zhì)識別方法及其系統(tǒng),通過所述將音頻文件劃分為多個音頻片段,將每個音頻片段轉(zhuǎn)換到頻域,通過每個音頻片段的頻域?qū)哪芰恐涤嬎闼鲆纛l文件的平均截斷頻率。所述平均截斷頻率反映了音頻在高頻的丟失或壓縮程度,平均截斷頻率越高,說明音頻在高音部分的丟失或壓縮程度不高,因此是高音質(zhì),否則為低音質(zhì)。建立基準截斷頻率對計算獲得音頻文件的平均截斷頻率比較,就可以根據(jù)比較結(jié)果快速準確地判斷所述音頻文件的音質(zhì)高低。運算簡單,除了對數(shù)據(jù)實施傅里葉變換轉(zhuǎn)換到頻域之外,其余的都是簡單的比較和求平均值;適用性高,并對于低碼率源轉(zhuǎn)高碼率的音頻有很好的辨識效果。
文檔編號G10L19/02GK102568470SQ20121000691
公開日2012年7月11日 申請日期2012年1月11日 優(yōu)先權(quán)日2012年1月11日
發(fā)明者謝振宇, 譚健文 申請人:廣州酷狗計算機科技有限公司