專(zhuān)利名稱(chēng):語(yǔ)音識(shí)別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,特別涉及一種語(yǔ)音識(shí)別方法及系統(tǒng)。
背景技術(shù):
實(shí)現(xiàn)人機(jī)之間人性化、智能化的有效交互,構(gòu)建高效自然的人機(jī)交流環(huán)境,已經(jīng)成為當(dāng)前信息技術(shù)應(yīng)用和發(fā)展的迫切需求。近年來(lái),隨著語(yǔ)音識(shí)別技術(shù)的飛速發(fā)展,語(yǔ)音輸入、語(yǔ)音搜索等各種在線語(yǔ)音識(shí)別應(yīng)用受到了越來(lái)越多的關(guān)注。預(yù)先基于海量數(shù)據(jù)訓(xùn)練的系統(tǒng)能滿(mǎn)足常用語(yǔ)音輸入撰寫(xiě)的需要,特別當(dāng)語(yǔ)音輸入內(nèi)容符合原語(yǔ)言模型概率分布時(shí)識(shí)別準(zhǔn)確率往往較高。然而在實(shí)際應(yīng)用中,移動(dòng)互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)快速發(fā)展不斷產(chǎn)生著新的熱點(diǎn)話題及相應(yīng)的熱點(diǎn)詞匯,不同用戶(hù)也存在不同個(gè)性化詞匯的識(shí)別需求,如聯(lián)絡(luò)人名等, 這些熱點(diǎn)詞匯或個(gè)性化詞匯由于時(shí)效性和特異性在原始采集的語(yǔ)料中往往出現(xiàn)頻度較低, 因而原語(yǔ)言模型對(duì)該類(lèi)詞匯往往覆蓋不足,進(jìn)而導(dǎo)致相應(yīng)識(shí)別系統(tǒng)不能準(zhǔn)確識(shí)別該類(lèi)熱
ο為此,在現(xiàn)有技術(shù)中往往采用系統(tǒng)參數(shù)重估的方法,在將新收集的熱詞語(yǔ)料加入原語(yǔ)料庫(kù)后,重新訓(xùn)練新的語(yǔ)言模型以提高對(duì)新增熱詞的識(shí)別準(zhǔn)確率。然而,在實(shí)際應(yīng)用中,熱詞更新頻度往往較高,系統(tǒng)無(wú)法及時(shí)收集足夠語(yǔ)料參與系統(tǒng)參數(shù)重估,進(jìn)而影響對(duì)熱詞的識(shí)別效果。另一方面,語(yǔ)言模型的重新訓(xùn)練以及識(shí)別系統(tǒng)資源(如基于WFST(Weighted Finite-State Transducers,加權(quán)有限狀態(tài)轉(zhuǎn)換器)的解碼識(shí)別網(wǎng)絡(luò))的構(gòu)建往往費(fèi)時(shí)較多,代價(jià)較大,無(wú)法實(shí)現(xiàn)對(duì)熱詞識(shí)別的快速響應(yīng)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種語(yǔ)音識(shí)別方法及系統(tǒng),以解決現(xiàn)有技術(shù)無(wú)法快速、準(zhǔn)確識(shí)別熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯的技術(shù)問(wèn)題。為此,本發(fā)明實(shí)施例提供如下技術(shù)方案一種語(yǔ)音識(shí)別方法,包括構(gòu)建解碼識(shí)別網(wǎng)絡(luò);對(duì)接收的語(yǔ)音信號(hào),根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)幀進(jìn)行解碼,并在解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率;在完成對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到最優(yōu)路徑及對(duì)應(yīng)的單詞序列。一種語(yǔ)音識(shí)別系統(tǒng),包括網(wǎng)絡(luò)構(gòu)建單元,用于構(gòu)建解碼識(shí)別網(wǎng)絡(luò);解碼單元,用于對(duì)接收的語(yǔ)音信號(hào),根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)幀進(jìn)行解碼;
激勵(lì)單元,用于在所述解碼單元的解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率;最優(yōu)節(jié)點(diǎn)確定單元,用于在所述解碼單元完成對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);回溯單元,用于從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到最優(yōu)路徑及對(duì)應(yīng)的單詞序列。本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法及系統(tǒng),采用基于熱詞匹配對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率,實(shí)現(xiàn)了對(duì)熱詞識(shí)別的有效激勵(lì),提高了熱詞的識(shí)別效果。無(wú)需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識(shí)別熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯,為系統(tǒng)支持用戶(hù)定制的個(gè)性化詞庫(kù)或個(gè)性化語(yǔ)言模型提供了一種可行的解決方案,用戶(hù)通過(guò)簡(jiǎn)單的更新系統(tǒng)支持的熱詞詞條即可實(shí)現(xiàn)對(duì)個(gè)性化詞匯的識(shí)別支持。
為了更清楚地說(shuō)明本發(fā)明實(shí)施的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖I是本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法的流程圖2是本發(fā)明實(shí)施例中一種基于WFST的解碼識(shí)別網(wǎng)絡(luò)的示意圖3是本發(fā)明實(shí)施例中樹(shù)形結(jié)構(gòu)的熱詞詞典的示意圖4是本發(fā)明實(shí)施例中根據(jù)熱詞集合對(duì)解碼得到的歷史路徑進(jìn)行激勵(lì)的一種流圖5是本發(fā)明實(shí)施例中根據(jù)熱詞詞典對(duì)解碼得到的歷史路徑進(jìn)行激勵(lì)的一種流
程程圖;圖6是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的一種實(shí)現(xiàn)流程圖;圖7是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的另一種實(shí)現(xiàn)流程圖8是本發(fā)明實(shí)施例中熱詞詞典的一種具體示意圖9是本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖10是本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng)的一種具體應(yīng)用結(jié)構(gòu)示意圖11是本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng)的另一種具體應(yīng)用結(jié)構(gòu)示意圖; 圖12是本發(fā)明實(shí)施例中激勵(lì)子單元的一種結(jié)構(gòu)示意圖13是本發(fā)明實(shí)施例中激勵(lì)子單元的另一種結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
為了使本發(fā)明實(shí)施例的方案更容易理解,并且更好地體現(xiàn)與現(xiàn)有語(yǔ)音識(shí)別方案的區(qū)別,下面首先對(duì)現(xiàn)有技術(shù)中基本的語(yǔ)音識(shí)別方法做簡(jiǎn)單說(shuō)明。在現(xiàn)有技術(shù)中,通常是將語(yǔ)言模型的語(yǔ)義網(wǎng)絡(luò)通過(guò)聲學(xué)模型及字典等擴(kuò)展成基于模型狀態(tài)層的搜索網(wǎng)絡(luò),即構(gòu)建解碼識(shí)別網(wǎng)絡(luò),然后在對(duì)輸入語(yǔ)音信號(hào)解碼時(shí),通過(guò)計(jì)算輸入的每一幀語(yǔ)音信號(hào)相對(duì)于當(dāng)前有效擴(kuò)展路徑上的每個(gè)聲學(xué)模型及語(yǔ)言模型的累積歷史路徑概率獲取新的有效擴(kuò)展路徑。隨后在搜索完最后一幀語(yǔ)音信號(hào)時(shí),通過(guò)從具有最大累積歷史路徑概率的最優(yōu)節(jié)點(diǎn)執(zhí)行狀態(tài)回溯得到解碼最優(yōu)路徑,得到對(duì)應(yīng)的單詞序列。本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法及系統(tǒng),針對(duì)現(xiàn)有技術(shù)采用系統(tǒng)參數(shù)重估的方式提高對(duì)新增熱詞的識(shí)別準(zhǔn)確率,無(wú)法快速、準(zhǔn)確識(shí)別熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯的技術(shù)問(wèn)題,對(duì)當(dāng)前歷史路徑基于熱詞進(jìn)行激勵(lì),從而提高熱詞所在路徑的累積歷史路徑概率,提高了熱詞的識(shí)別效果。無(wú)需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識(shí)別熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯。如圖I所示,是本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法的流程圖,包括以下步驟步驟101,構(gòu)建解碼識(shí)別網(wǎng)絡(luò)。在本發(fā)明實(shí)施例中,所述解碼識(shí)別網(wǎng)絡(luò)可以由系統(tǒng)在線構(gòu)建,也可以通過(guò)離線方式構(gòu)建,在系統(tǒng)啟動(dòng)時(shí)直接載入,以減少系統(tǒng)運(yùn)算量及所需內(nèi)存,進(jìn)一步提高解碼效率。步驟102,對(duì)接收的語(yǔ)音信號(hào),根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)幀進(jìn)行解碼,并在解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率。利用所述解碼識(shí)別網(wǎng)絡(luò)對(duì)用戶(hù)輸入的語(yǔ)音信號(hào)進(jìn)行解碼的過(guò)程是一個(gè)在該解碼識(shí)別網(wǎng)絡(luò)中搜索最優(yōu)路徑,實(shí)現(xiàn)語(yǔ)音到文本的轉(zhuǎn)換的過(guò)程。具體地,可以首先對(duì)接收的連續(xù)語(yǔ)音信號(hào)采樣為一系列離散能量值存入數(shù)據(jù)緩存區(qū)。當(dāng)然,為了進(jìn)一步提高系統(tǒng)的魯棒性,還可以先對(duì)接收到的連續(xù)語(yǔ)音信號(hào)進(jìn)行降噪處理。首先通過(guò)對(duì)語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)過(guò)零率分析,將連續(xù)的語(yǔ)音信號(hào)分割成獨(dú)立的語(yǔ)音片斷和非語(yǔ)音片斷,然后對(duì)分割得到的語(yǔ)音片斷進(jìn)行語(yǔ)音增強(qiáng)處理,在進(jìn)行語(yǔ)音增強(qiáng)處理時(shí),可以通過(guò)維納濾波等方法,將語(yǔ)音信號(hào)中的環(huán)境噪聲進(jìn)一步消除,以提高后續(xù)系統(tǒng)對(duì)該信號(hào)的處理能力??紤]到降噪處理后的語(yǔ)音信號(hào)中依然會(huì)存在大量語(yǔ)音識(shí)別無(wú)關(guān)的冗余信息,直接對(duì)其識(shí)別可能會(huì)使運(yùn)算量和識(shí)別準(zhǔn)確率降低,為此,可以從降噪處理后的語(yǔ)音能量信號(hào)中提取識(shí)別有效語(yǔ)音特征,并存入特征緩存區(qū)內(nèi)。具體地,可以提取語(yǔ)音的MFCC(Mel Frequency Cepstrum Coefficient,Mel頻率倒譜系數(shù))特征,對(duì)窗長(zhǎng)25ms巾貞移IOms的每幀語(yǔ)音數(shù)據(jù)做短時(shí)分析得到MFCC參數(shù)及其一階、二階差分,共計(jì)39維。也就是說(shuō),將每幀語(yǔ)音信號(hào)量化為一 39維的特征序列。然后,根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)進(jìn)行解碼,獲取最優(yōu)路徑,從而完成解碼識(shí)別過(guò)程。在現(xiàn)有技術(shù)中,最優(yōu)路徑的搜索過(guò)程如下按照從左到右的時(shí)間順序,計(jì)算每幀語(yǔ)音信號(hào)幀到達(dá)解碼識(shí)別網(wǎng)絡(luò)中每個(gè)活躍節(jié)點(diǎn)的累積歷史路徑概率。具體地,對(duì)于需要考察的每幀語(yǔ)音信號(hào)幀,可以首先計(jì)算當(dāng)前解碼識(shí)別網(wǎng)絡(luò)中所有活躍節(jié)點(diǎn)相對(duì)于該語(yǔ)音信號(hào)幀的歷史路徑和累積歷史路徑概率。
7
比如,對(duì)于當(dāng)前的一幀語(yǔ)音信號(hào),對(duì)應(yīng)的語(yǔ)音特征序列為IO1, O2, , 0t},其中t 時(shí)刻的語(yǔ)音特征ot轉(zhuǎn)入活躍節(jié)點(diǎn)j的路徑概率,即從活躍節(jié)點(diǎn)i到該節(jié)點(diǎn)j的所有可
能歷史路徑的概率最大值計(jì)算如下
%⑴ ( \ )其中,i表示解碼識(shí)別網(wǎng)絡(luò)中所有與活躍節(jié)點(diǎn)j相連的活躍節(jié)點(diǎn);灼(〖-1)表示 (t-Ι)時(shí)刻特征CV1落在活躍節(jié)點(diǎn)i上的歷史路徑概率;au表示從節(jié)點(diǎn)i到節(jié)點(diǎn)j的轉(zhuǎn)移概率,而h (ot)表示第t時(shí)刻特征Ot相應(yīng)于節(jié)點(diǎn)j的似然概率?;钴S節(jié)點(diǎn)j的累積歷史路徑概率為所有和活躍節(jié)點(diǎn)j相連的節(jié)點(diǎn)路徑中具有最大累積路徑概率的路徑得分。也就是說(shuō),在計(jì)算活躍節(jié)點(diǎn)j的累積路徑概率的同時(shí),也獲知了活躍節(jié)點(diǎn)j的前一節(jié)點(diǎn),進(jìn)而獲知活躍節(jié)點(diǎn)j的歷史路徑。然后,獲取下一幀語(yǔ)音信號(hào)幀,并從滿(mǎn)足系統(tǒng)預(yù)設(shè)條件的歷史路徑向后擴(kuò)展解碼。 當(dāng)對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,其中具有最大累積歷史路徑概率的活躍節(jié)點(diǎn)即為最優(yōu)節(jié)點(diǎn),從該最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到的歷史路徑即為最優(yōu)路徑,該最優(yōu)路徑上的單詞序列即為解碼結(jié)果。由于基于海量數(shù)據(jù)訓(xùn)練的語(yǔ)言模型能夠很好地體現(xiàn)原語(yǔ)料庫(kù)的詞匯分布,因而對(duì)大部分常規(guī)詞匯具有較好的識(shí)別效果。而熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯由于具有個(gè)性化的特點(diǎn),在原有語(yǔ)言模型中概率較小,因而其對(duì)應(yīng)的解碼路徑得分往往偏低,導(dǎo)致不能正確識(shí)別。為此,在本發(fā)明實(shí)施中,基于熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),保持熱詞在搜索路徑擴(kuò)展中的存活時(shí)間,從而使解碼識(shí)別網(wǎng)絡(luò)中可能和熱詞匹配的路徑得到優(yōu)化,提高熱詞匹配的成功率,熱詞識(shí)別正確性也可得到相應(yīng)提高。具體地,對(duì)解碼識(shí)別網(wǎng)絡(luò)中可能和熱詞匹配的路徑可以采用不同的激勵(lì)方式,對(duì)此將在后面詳細(xì)說(shuō)明。步驟103,在完成對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn)。步驟104,從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到最優(yōu)路徑及對(duì)應(yīng)的單詞序列。從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到的歷史路徑即為最優(yōu)路徑。由此可見(jiàn),本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法,采用基于熱詞匹配的歷史路徑激勵(lì)處理, 使熱詞所在路徑的累積歷史路徑概率得到優(yōu)化,提高了熱詞的識(shí)別效果。利用本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法,無(wú)需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識(shí)別熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯,為系統(tǒng)支持用戶(hù)定制的個(gè)性化詞庫(kù)或個(gè)性化語(yǔ)言模型提供了一種可行的解決方案,用戶(hù)通過(guò)簡(jiǎn)單的更新系統(tǒng)支持的熱詞詞庫(kù)即可實(shí)現(xiàn)對(duì)個(gè)性化詞匯的識(shí)別支持。前面提到,在本發(fā)明實(shí)施例中,所述解碼識(shí)別網(wǎng)絡(luò)可以由系統(tǒng)在線構(gòu)建,也可以通過(guò)離線方式構(gòu)建,在系統(tǒng)啟動(dòng)時(shí)直接載入,以減少系統(tǒng)運(yùn)算量及所需內(nèi)存,進(jìn)一步提高解碼效率。具體地,所述解碼識(shí)別網(wǎng)絡(luò)的構(gòu)建可以利用預(yù)設(shè)的聲學(xué)模型和語(yǔ)言模型等構(gòu)建。其中,所述聲學(xué)模型主要用于模擬字符音特點(diǎn),具體可以采用語(yǔ)音識(shí)別領(lǐng)域常用的基于轉(zhuǎn)移概率和傳輸概率的HMM(Hidden Markov Model,隱馬爾可夫)模型??紤]到在大詞匯量連續(xù)語(yǔ)音識(shí)別中,詞匯量的數(shù)量過(guò)于龐大,若是對(duì)每個(gè)字符都構(gòu)建一個(gè)HMM模型,則模型數(shù)量太多,不利于數(shù)據(jù)存儲(chǔ)及計(jì)算。因此,在實(shí)際應(yīng)用中,可以?xún)H對(duì)基本的發(fā)音單元,如音節(jié)或音素單元構(gòu)建HMM模型。顯然聲學(xué)模型還可以采用其他技術(shù)手段,比如神經(jīng)網(wǎng)絡(luò)等, 對(duì)此本發(fā)明實(shí)施例不做限定。其中,所述語(yǔ)言模型是為了更有效地表征語(yǔ)法及語(yǔ)義等知識(shí),以彌補(bǔ)聲學(xué)模型的不足,提高識(shí)別率。具體可以采用語(yǔ)音識(shí)別領(lǐng)域常用統(tǒng)計(jì)語(yǔ)言模型,利用統(tǒng)計(jì)概率的方式描述詞和詞之間的關(guān)系,即假設(shè)某個(gè)詞Wk出現(xiàn)的概率僅和其前η-i個(gè)詞相關(guān),記為 p(wk|W1k-1) = p(wk|Wkk;^1)。顯然語(yǔ)言模型也可以采用其他技術(shù)手段,比如字詞對(duì)等,對(duì)此本發(fā)明實(shí)施例不做限定。所述解碼識(shí)別網(wǎng)絡(luò)的構(gòu)建可以采用現(xiàn)有技術(shù)中的一些構(gòu)建方法,利用聲學(xué)模型將所述語(yǔ)言模型擴(kuò)展成模型層的搜索網(wǎng)絡(luò)。圖2示出了一種基于WFST的解碼識(shí)別網(wǎng)絡(luò)的示意圖。當(dāng)然,還可以采用其他方式的解碼識(shí)別網(wǎng)絡(luò),如基于歷史詞樹(shù)拷貝的動(dòng)態(tài)解碼識(shí)別網(wǎng)絡(luò)等。在本發(fā)明實(shí)施例中,允許用戶(hù)隨時(shí)自定義熱詞,以擴(kuò)大系統(tǒng)的識(shí)別范圍,適應(yīng)詞匯不斷變化的需求。具體地,當(dāng)用戶(hù)輸入新的熱詞后,可以將所述熱詞保存到熱詞集合。也就是說(shuō),所述熱詞集合可以是一個(gè)動(dòng)態(tài)更新的熱詞詞條庫(kù)。另外,在更新所述熱詞詞庫(kù)時(shí),還可以采用分詞算法,通過(guò)使用系統(tǒng)預(yù)置的現(xiàn)有詞典對(duì)用戶(hù)新增自定義的熱詞的文本進(jìn)行分詞,使每個(gè)熱詞詞條都表述為一個(gè)由系統(tǒng)現(xiàn)有基本字詞單元組成的序列,并將得到的分詞結(jié)果保存到熱詞詞典,該分詞結(jié)果可以由圖3所示的樹(shù)形結(jié)構(gòu)管理,每一個(gè)分支對(duì)應(yīng)一個(gè)熱詞詞條,具體如下熱詞A:Wordil Wordi2 Wordi3 ;熱詞B :Wordi I Wordi4 ;熱詞C Wordi5 ;...;熱詞N ffordi j. . . Wordik0該熱詞詞典可以是一個(gè)動(dòng)態(tài)更新的熱詞分詞庫(kù)?;谏鲜鰺嵩~集合或熱詞詞典,對(duì)解碼識(shí)別網(wǎng)絡(luò)中可能和熱詞匹配的路徑可以采用不同的激勵(lì)方式,對(duì)此下面詳細(xì)說(shuō)明。I.根據(jù)熱詞集合對(duì)解碼得到的歷史路徑進(jìn)行優(yōu)化如圖4所示,是本發(fā)明實(shí)施例中根據(jù)熱詞集合對(duì)解碼得到的歷史路徑進(jìn)行激勵(lì)的一種流程圖。在該流程中,在活躍節(jié)點(diǎn)的歷史路徑對(duì)應(yīng)的單詞序列可以構(gòu)成一個(gè)熱詞詞條時(shí)給予適當(dāng)?shù)牡梅旨?lì),以提高該歷史路徑的優(yōu)先級(jí)。該流程具體包括以下步驟步驟401,獲取對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率。步驟402,根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞; 如果是,則執(zhí)行步驟403 ;否則,執(zhí)行步驟404。步驟403,提高所述歷史路徑的累積歷史路徑概率。
比如,可以采取固定激勵(lì)加分的方法來(lái)提高熱詞所在路徑的優(yōu)先級(jí),以使熱詞所在路徑更容易保留。固定激勵(lì)加分的具體數(shù)值可以根據(jù)需要預(yù)先設(shè)定,一般來(lái)說(shuō),激勵(lì)加分越高,則熱詞匹配度越高,熱詞識(shí)別正確性也相應(yīng)提高。在平衡熱詞識(shí)別率和其它非熱詞識(shí)別率的基礎(chǔ)上可以設(shè)置固定激勵(lì)加分的參考值為300,當(dāng)然,也可以是其它數(shù)值,對(duì)此本發(fā)明實(shí)施例不做限定。步驟404,保持所述歷史路徑的累積歷史路徑概率。需要說(shuō)明的是,步驟402至步驟404,需要對(duì)步驟401獲取的每一條歷史路徑逐一執(zhí)行,即對(duì)步驟401獲取的所有活躍節(jié)點(diǎn)的歷史路徑中不包含熱詞的歷史路徑保持其路徑概率,而對(duì)包含熱詞的歷史路徑概率進(jìn)行激勵(lì)。需要說(shuō)明的是,在實(shí)際應(yīng)用中,在進(jìn)行下一幀語(yǔ)音信號(hào)幀解碼之前,還可以對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行優(yōu)化,刪除部分不可能的路徑以提高后續(xù)搜索效率。具體地,可以采用基于概率裁減門(mén)限的方法,首先統(tǒng)計(jì)當(dāng)前活躍節(jié)點(diǎn)累積歷史路徑概率的最高值,然后分別計(jì)算各活躍節(jié)點(diǎn)的累積歷史路徑概率與該最高值的差值,將其中差值大于預(yù)先設(shè)置的裁剪門(mén)限的活躍節(jié)點(diǎn)設(shè)為非活躍節(jié)點(diǎn),并從后續(xù)搜索路徑中剪除,中止從該節(jié)點(diǎn)開(kāi)始的后續(xù)搜索。在本發(fā)明實(shí)施例中,上述過(guò)程需要在對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑按照?qǐng)D4所示流程激勵(lì)之后,根據(jù)當(dāng)前所有活躍節(jié)點(diǎn)(包括激勵(lì)后的活躍節(jié)點(diǎn)和未激勵(lì)的活躍節(jié)點(diǎn))的累積歷史路徑概率確定新的活躍節(jié)點(diǎn),實(shí)現(xiàn)后續(xù)路徑的擴(kuò)展。在圖4所示流程中,通過(guò)固定激勵(lì)加分的方法來(lái)提高熱詞所在路徑的優(yōu)先級(jí),實(shí)現(xiàn)對(duì)熱詞所在路徑的優(yōu)化。在實(shí)際應(yīng)用中,由于熱詞往往由兩個(gè)或多個(gè)分詞構(gòu)成,上述在熱詞詞條實(shí)現(xiàn)完整匹配時(shí)給予激勵(lì)的方式可能會(huì)由于熱詞詞條所在路徑過(guò)早被裁減而達(dá)不到激勵(lì)的目的,影響熱詞識(shí)別的準(zhǔn)確率。為此,在本發(fā)明實(shí)施例中,還可以采用基于預(yù)測(cè)路徑的激勵(lì)方法,通過(guò)逐步給予激勵(lì)的方式不斷提高熱詞所在路徑的優(yōu)先級(jí)。2.根據(jù)熱詞詞典對(duì)解碼得到的歷史路徑進(jìn)行優(yōu)化如圖5所示,是本發(fā)明實(shí)施例中根據(jù)熱詞詞典對(duì)解碼得到的歷史路徑進(jìn)行激勵(lì)的一種流程圖,包括以下步驟步驟501,獲取對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率。步驟502,判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;如果是,則執(zhí)行步驟 503 ;否則,執(zhí)行步驟504。步驟503,根據(jù)所述新詞相對(duì)于所述歷史路徑上對(duì)應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率。步驟504,保持所述歷史路徑的累積歷史路徑概率。需要說(shuō)明的是,對(duì)于每一幀語(yǔ)音信號(hào)幀的所有活躍節(jié)點(diǎn)的歷史路徑,都需要進(jìn)行上述步驟502至步驟504的過(guò)程。而且,在進(jìn)行下一幀語(yǔ)音信號(hào)幀解碼之前,還可以對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行優(yōu)化,刪除部分不可能的路徑以提高后續(xù)搜索效率。具體地,可以采用基于概率裁減門(mén)限的方法,首先統(tǒng)計(jì)當(dāng)前活躍節(jié)點(diǎn)累積歷史路徑概率的最高值,然后分別計(jì)算各活躍節(jié)點(diǎn)的累積歷史路徑概率與該最高值的差值,將其中差值大于預(yù)先設(shè)置的裁剪門(mén)限的活躍節(jié)點(diǎn)設(shè)為非活躍節(jié)點(diǎn),并從后續(xù)搜索路徑中剪除,中止從該節(jié)點(diǎn)開(kāi)始的后續(xù)搜索。不同于上述在熱詞完全匹配時(shí)才對(duì)歷史路徑激勵(lì),步驟503在解碼過(guò)程中熱詞部分匹配時(shí)即對(duì)歷史路徑實(shí)行激勵(lì),即根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率,通過(guò)提前提高路徑累計(jì)概率,可以更好地確保熱詞所在路徑的存活概率。上述步驟503的可以采用多種不同的方法實(shí)現(xiàn),比如如圖6所示,是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的一種實(shí)現(xiàn)流程圖,包括以下步驟步驟601,判斷新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;如果是, 則執(zhí)行步驟605 ;否則,執(zhí)行步驟602。步驟602,判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則執(zhí)行步驟 603 ;否則,執(zhí)行步驟604。步驟603,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分。步驟604,保持所述歷史路徑的累積歷史路徑概率。步驟605,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分。如圖7所示,是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的另一種實(shí)現(xiàn)流程圖,包括以下步驟步驟701,判斷新詞所在歷史路徑上所述新詞之前的單詞序列是否為所述熱詞詞典中的一個(gè)完整熱詞;如果是,則執(zhí)行步驟705 ;否則,執(zhí)行步驟702。步驟702,判斷所述新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;如果是,則執(zhí)行步驟703 ;否則,執(zhí)行步驟704。步驟703,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分。步驟704,撤銷(xiāo)之前對(duì)所述歷史路徑的累積歷史路徑概率的加分。步驟705,判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則執(zhí)行步驟 706 ;否則,執(zhí)行步驟707。步驟706,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分。步驟707,保持所述歷史路徑的累積歷史路徑概率。利用圖7所示流程,可以進(jìn)一步避免錯(cuò)誤地對(duì)非熱詞所在歷史路徑的激勵(lì)。另外在實(shí)際應(yīng)用中,如果對(duì)每一個(gè)活躍節(jié)點(diǎn)對(duì)應(yīng)的歷史路徑僅保留一條熱詞分詞歷史記錄,則在解碼中可能無(wú)法保證所有包含熱詞的路徑都能被發(fā)現(xiàn)。例如,熱詞A的詞序列為WordlWord2Word3,而熱詞B的詞序列為Word2Word4,當(dāng)輸入詞序列為 Wordlfford2fford4時(shí),在對(duì)“Word2”解碼時(shí)會(huì)優(yōu)先匹配到熱詞A的Word2分詞,而忽略了熱詞B的Word2分詞,使得詞序列WordlWord2Word4最終并沒(méi)有匹配到Word2Word4的熱詞B 上。對(duì)此,在本發(fā)明實(shí)施例中,還可以采用對(duì)單個(gè)活躍節(jié)點(diǎn)的歷史路徑保留多個(gè)熱詞分詞匹配歷史的方法來(lái)提高熱詞匹配的合理性。即在對(duì)“Word2”解碼時(shí),不僅保留“WordlWord2” 的熱詞A的部分匹配歷史,同時(shí)保留“Word2”的熱詞B的部分匹配歷史,并對(duì)同一歷史路徑相應(yīng)保存多個(gè)激勵(lì)附加值。隨后在后續(xù)解碼中當(dāng)確定某項(xiàng)熱詞分詞匹配結(jié)果不可能繼續(xù)擴(kuò)展時(shí),再撤銷(xiāo)之前對(duì)所述歷史路徑的由于熱詞分詞產(chǎn)生的累積歷史路徑概率的加分。在實(shí)際應(yīng)用中,可以根據(jù)解碼所得單詞和熱詞分詞的匹配度對(duì)路徑概率進(jìn)行激勵(lì)。比如,可以在解碼獲取新詞時(shí)獲取系統(tǒng)預(yù)置的熱詞分詞權(quán)重,并對(duì)路徑進(jìn)行激勵(lì)。特別的,還可以通過(guò)設(shè)置熱詞分詞詞典的熱詞分詞首尾字符的權(quán)重,而將其他分詞權(quán)重簡(jiǎn)單設(shè)置為O以簡(jiǎn)化激勵(lì)過(guò)程。比如,假設(shè)當(dāng)前的熱詞詞典如圖8所示,由“中國(guó),中華,人民,人們” 構(gòu)成。解碼識(shí)別時(shí),若解碼得到的某個(gè)活躍節(jié)點(diǎn)的歷史路徑上出現(xiàn)“中”或者“人”時(shí),即和熱詞詞典的首字符匹配時(shí),對(duì)所述歷史路徑給予與對(duì)應(yīng)熱詞分詞“中”或“人”相應(yīng)的分值激勵(lì),即對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述首字符對(duì)應(yīng)的加分。隨后,當(dāng)熱詞分詞所在路徑進(jìn)行后續(xù)擴(kuò)展時(shí),若后續(xù)擴(kuò)展路徑上出現(xiàn)“國(guó),華”或“民,們”,構(gòu)成“中國(guó)”,“中華”,“人民”,“人們”的熱詞或部分熱詞時(shí),則繼續(xù)對(duì)該路徑給予與“國(guó)”,“華”,“民”,“們”相應(yīng)的分值激勵(lì)。否則當(dāng)所述熱詞分詞所在路徑擴(kuò)展為其他非熱詞字詞時(shí),對(duì)所在路徑不給予激勵(lì),或者刪除前面增加的激勵(lì)??梢?jiàn),該實(shí)施例的語(yǔ)音識(shí)別方法,采用基于預(yù)測(cè)路徑的激勵(lì)方法,通過(guò)逐步給予激勵(lì)的方式不斷提高熱詞所在路徑的優(yōu)先級(jí),實(shí)現(xiàn)對(duì)熱詞所在路徑的優(yōu)化,提高了熱詞的識(shí)別效果。相應(yīng)地,本發(fā)明實(shí)施例還提供一種語(yǔ)音識(shí)別系統(tǒng),如圖9所示,是該系統(tǒng)的一種結(jié)構(gòu)示意圖。在該實(shí)施例中,所述系統(tǒng)包括網(wǎng)絡(luò)構(gòu)建單元901,用于構(gòu)建解碼識(shí)別網(wǎng)絡(luò);解碼單元902,用于對(duì)接收的語(yǔ)音信號(hào),根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)幀進(jìn)行解碼;激勵(lì)單元903,用于在所述解碼單元902的解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率;最優(yōu)節(jié)點(diǎn)確定單元904,用于在所述解碼單元902完成對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);回溯單元905,用于從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到最優(yōu)路徑及對(duì)應(yīng)的單詞序列。在本發(fā)明實(shí)施例中,網(wǎng)絡(luò)構(gòu)建單元901具體可以通過(guò)在線方式構(gòu)建所述解碼識(shí)別網(wǎng)絡(luò),也可以通過(guò)離線方式構(gòu)建所述解碼識(shí)別網(wǎng)絡(luò),在系統(tǒng)啟動(dòng)時(shí)直接載入已構(gòu)建的解碼識(shí)別網(wǎng)絡(luò),可以減少系統(tǒng)運(yùn)算量及所需內(nèi)存,進(jìn)一步提高解碼效率。網(wǎng)絡(luò)構(gòu)建單元901具體可以利用預(yù)設(shè)的聲學(xué)模型和語(yǔ)言模型等構(gòu)建,在此不再詳細(xì)描述。在本發(fā)明實(shí)施例中,解碼單元902利用所述解碼識(shí)別網(wǎng)絡(luò)對(duì)用戶(hù)輸入的語(yǔ)音信號(hào)進(jìn)行解碼的過(guò)程是一個(gè)計(jì)算每幀語(yǔ)音信號(hào)幀到達(dá)解碼識(shí)別網(wǎng)絡(luò)中每個(gè)活躍節(jié)點(diǎn)的累積歷史路徑概率的過(guò)程,當(dāng)解碼單元902對(duì)每一幀語(yǔ)音信號(hào)幀解碼后,可以得到當(dāng)前所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率,激勵(lì)單元903可以采用多種不同方式根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),提高熱詞所在路徑的累積歷史路徑概率,具體將在后面詳細(xì)說(shuō)明。需要說(shuō)明的是,在實(shí)際應(yīng)用中,在解碼單元902進(jìn)行下一幀語(yǔ)音信號(hào)幀解碼之前, 還可以對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行優(yōu)化,刪除部分不可能的路徑以提高后續(xù)搜索效率。具體地,可以采用基于概率裁減門(mén)限的方法,首先統(tǒng)計(jì)當(dāng)前活躍節(jié)點(diǎn)累積歷史路徑概率的最高值,然后分別計(jì)算各活躍節(jié)點(diǎn)的累積歷史路徑概率與該最高值的差值,將其中差值大于
12預(yù)先設(shè)置的裁剪門(mén)限的活躍節(jié)點(diǎn)設(shè)為非活躍節(jié)點(diǎn),并從后續(xù)搜索路徑中剪除,中止從該節(jié)點(diǎn)開(kāi)始的后續(xù)搜索。由此可見(jiàn),本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng),采用基于熱詞匹配的歷史路徑激勵(lì)處理, 使熱詞所在路徑的累積歷史路徑概率得到優(yōu)化,提高了熱詞的識(shí)別效果。利用本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng),無(wú)需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識(shí)別熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯,為系統(tǒng)支持用戶(hù)定制的個(gè)性化詞庫(kù)或個(gè)性化語(yǔ)言模型提供了一種可行的解決方案,用戶(hù)通過(guò)簡(jiǎn)單的更新系統(tǒng)支持的熱詞詞庫(kù)即可實(shí)現(xiàn)對(duì)個(gè)性化詞匯的識(shí)別支持。在本發(fā)明實(shí)施例中,允許用戶(hù)隨時(shí)自定義熱詞,以擴(kuò)大系統(tǒng)的識(shí)別范圍,適應(yīng)詞匯不斷變化的需求。如圖10所示,是本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng)的一種具體應(yīng)用結(jié)構(gòu)示意圖。在該實(shí)施例中,所述系統(tǒng)還包括熱詞集合更新單元911,用于獲取用戶(hù)輸入的熱詞,并將所述熱詞保存到熱詞集合。該熱詞集合可以是一個(gè)動(dòng)態(tài)更新的熱詞詞條庫(kù)。相應(yīng)地,激勵(lì)單元913在解碼過(guò)程中根據(jù)所述熱詞集合對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)。在該實(shí)施例中,激勵(lì)單元913具體包括獲取子單元9131,判斷子單元9132和激勵(lì)子單元9133。其中獲取子單元9131,用于獲取解碼單元702對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;判斷子單元9132,用于根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞;激勵(lì)子單元9133,用于在所述判斷子單元9132判斷所述歷史路徑上鄰近單詞構(gòu)成一條熱詞后,提高所述歷史路徑的累積歷史路徑概率;在所述判斷子單元9132判斷所述歷史路徑上鄰近單詞不能構(gòu)成一條熱詞后,保持所述歷史路徑的累積歷史路徑概率。在進(jìn)行激勵(lì)時(shí),可以采取固定激勵(lì)加分的方法來(lái)提高熱詞所在路徑的優(yōu)先級(jí),以使熱詞所在路徑更容易保留。固定激勵(lì)加分的具體數(shù)值可以根據(jù)需要預(yù)先設(shè)定,一般來(lái)說(shuō),激勵(lì)加分越高,則熱詞匹配度越高,熱詞識(shí)別正確性也相應(yīng)提高。該實(shí)施例的語(yǔ)音識(shí)別系統(tǒng),在活躍節(jié)點(diǎn)的歷史路徑對(duì)應(yīng)的單詞序列可以構(gòu)成一個(gè)熱詞詞條時(shí)給予適當(dāng)?shù)牡梅旨?lì),實(shí)現(xiàn)對(duì)熱詞所在路徑的優(yōu)化,提高了熱詞的識(shí)別效果。在實(shí)際應(yīng)用中,由于熱詞往往由兩個(gè)或多個(gè)分詞構(gòu)成,上述在熱詞詞條實(shí)現(xiàn)完整匹配時(shí)給予激勵(lì)的方式可能會(huì)由于熱詞詞條所在路徑過(guò)早被裁減而達(dá)不到激勵(lì)的目的,影響熱詞識(shí)別的準(zhǔn)確率。為此,在本發(fā)明語(yǔ)音識(shí)別系統(tǒng)的另一實(shí)施例中,激勵(lì)單元還可以采用基于預(yù)測(cè)路徑的激勵(lì)方法,通過(guò)逐步給予激勵(lì)的方式不斷提高熱詞所在路徑的優(yōu)先級(jí)。如圖11所示,是本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng)的另一種具體應(yīng)用結(jié)構(gòu)示意圖。在該實(shí)施例中,所述系統(tǒng)還包括熱詞獲取單元921和切分單元922,其中,熱詞獲取單元921用于獲取用戶(hù)輸入的熱詞;切分單元922用于對(duì)所述熱詞獲取單元獲取的熱詞進(jìn)行文本分詞,并將得到的分詞保存到熱詞詞典。相應(yīng)地,激勵(lì)單元923在解碼過(guò)程中根據(jù)所述熱詞詞典對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)。在該實(shí)施例中,激勵(lì)單元923具體包括獲取子單元9231,新詞判斷子單元9232和激勵(lì)子單元9233。其中獲取子單元9231,用于獲取對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;新詞判斷子單元9232,用于判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;激勵(lì)子單元9233,用于在所述新詞判斷子單元9232判斷所述活躍節(jié)點(diǎn)的歷史路徑中出現(xiàn)新詞后,根據(jù)所述新詞相對(duì)于所述歷史路徑上對(duì)應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率;否則保持所述歷史路徑的累積歷史路徑概率。在該實(shí)施例中,不同于上述圖10中的激勵(lì)子單元9133在熱詞完全匹配時(shí)才對(duì)歷史路徑激勵(lì),激勵(lì)子單元9233在解碼過(guò)程中熱詞部分匹配時(shí)即對(duì)歷史路徑實(shí)行激勵(lì),即根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率,通過(guò)提前提高路徑累計(jì)概率, 可以更好地確保熱詞所在路徑的存活概率。所述激勵(lì)子單元9233可以有多種實(shí)現(xiàn)方式,下面舉例詳細(xì)進(jìn)行說(shuō)明。如圖12所示,是本發(fā)明實(shí)施例中激勵(lì)子單元的一種具體結(jié)構(gòu)示意圖。在該實(shí)施例中,所述激勵(lì)子單元包括第一判斷子單元121,用于判斷所述新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;第一處理子單元122,用于在所述第一判斷子單元121判斷所述新詞是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分;第二判斷子單元123,用于在所述第一判斷子單元121判斷所述新詞不是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞后,判斷所述新詞是否為所述熱詞詞典中的起始分詞;第二處理子單元124,用于在所述第二判斷子單元123判斷所述新詞是所述熱詞詞典中的起始分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率。如圖13所示,是本發(fā)明實(shí)施例中激勵(lì)子單元的另一種具體結(jié)構(gòu)示意圖。在該實(shí)施例中,所述激勵(lì)子單元包括熱詞判斷子單元131,用于判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是否是所述熱詞詞典中的一個(gè)完整熱詞;第三判斷子單元132,用于在所述熱詞判斷子單元131判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是所述熱詞詞典中的一個(gè)完整熱詞時(shí),判斷所述新詞是否是所述熱詞詞典中的起始分詞;第三處理子單元133,用于在所述第三判斷子單元132判斷所述新詞是所述熱詞詞典中的起始分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率;第四判斷子單元134,用于在所述熱詞判斷子單元131判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列不是所述熱詞詞典中的一個(gè)完整熱詞時(shí),判斷所述新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;
第四處理子單元135,用于在所述第四判斷子單元134判斷所述新詞是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分;否則撤銷(xiāo)之前對(duì)所述歷史路徑的累積歷史路徑概率的加分。當(dāng)然,在實(shí)際應(yīng)用中,所述激勵(lì)子單元還可以有其它實(shí)現(xiàn)方式,對(duì)此本發(fā)明實(shí)施例不做限定。比如,可以對(duì)單個(gè)活躍節(jié)點(diǎn)的歷史路徑保留多個(gè)熱詞分詞匹配歷史,在后續(xù)解碼中當(dāng)確定某項(xiàng)熱詞分詞匹配結(jié)果不可能繼續(xù)擴(kuò)展時(shí),再撤銷(xiāo)之前對(duì)所述歷史路徑的由于熱詞分詞產(chǎn)生的累積歷史路徑概率的加分,以此來(lái)進(jìn)一步提高熱詞匹配的合理性。該實(shí)施例的語(yǔ)音識(shí)別系統(tǒng),采用基于預(yù)測(cè)路徑的激勵(lì)方法,通過(guò)逐步給予激勵(lì)的方式不斷提高熱詞所在路徑的優(yōu)先級(jí),實(shí)現(xiàn)對(duì)熱詞所在路徑的優(yōu)化,提高了熱詞的識(shí)別效果O本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元及模塊可以是或者也可以不是物理上分開(kāi)的。另外,還可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元和模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。以上公開(kāi)的僅為本發(fā)明的優(yōu)選實(shí)施方式,但本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的沒(méi)有創(chuàng)造性的變化,以及在不脫離本發(fā)明原理前提下所作的若干改進(jìn)和潤(rùn)飾,都應(yīng)落在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種語(yǔ)音識(shí)別方法,其特征在于,包括構(gòu)建解碼識(shí)別網(wǎng)絡(luò);對(duì)接收的語(yǔ)音信號(hào),根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)幀進(jìn)行解碼,并在解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率;在完成對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)占.從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到最優(yōu)路徑及對(duì)應(yīng)的單詞序列。
2.如權(quán)利要求I所述的方法,其特征在于,所述方法還包括獲取用戶(hù)輸入的熱詞,并將所述熱詞保存到熱詞集合;所述在解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)包括在解碼過(guò)程中根據(jù)所述熱詞集合對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)。
3.如權(quán)利要求2所述的方法,其特征在于,所述在解碼過(guò)程中根據(jù)所述熱詞集合對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)包括獲取對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率; 根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞;如果是,則提高所述歷史路徑的累積歷史路徑概率;如果否,則保持所述歷史路徑的累積歷史路徑概率。
4.如權(quán)利要求I所述的方法,其特征在于,所述方法還包括獲取用戶(hù)輸入的熱詞,對(duì)所述熱詞進(jìn)行文本分詞,并將得到的分詞保存到熱詞詞典;所述在解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)包括在解碼過(guò)程中根據(jù)所述熱詞詞典對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)。
5.如權(quán)利要求4所述的方法,其特征在于,所述在解碼過(guò)程中根據(jù)所述熱詞詞典對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)包括獲取對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率; 判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;如果是,則根據(jù)所述新詞相對(duì)于所述歷史路徑上對(duì)應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率;如果否,則保持所述歷史路徑的累積歷史路徑概率。
6.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述新詞相對(duì)于所述歷史路徑上對(duì)應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率包括判斷所述新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;如果是,則對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分; 如果否,則判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分。 如果否,則保持所述歷史路徑的累積歷史路徑概率。
7.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述新詞相對(duì)于所述歷史路徑上對(duì)應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率包括如果所述新詞所在歷史路徑上所述新詞之前的單詞序列是所述熱詞詞典中的一個(gè)完整熱詞,則判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分; 如果否,則保持所述歷史路徑的累積歷史路徑概率;如果所述新詞所在歷史路徑上所述新詞之前的單詞序列不是所述熱詞詞典中的一個(gè)完整熱詞,則判斷所述新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;如果是,則對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分; 如果否,則撤銷(xiāo)之前對(duì)所述歷史路徑的累積歷史路徑概率的加分。
8.一種語(yǔ)音識(shí)別系統(tǒng),其特征在于,包括網(wǎng)絡(luò)構(gòu)建單元,用于構(gòu)建解碼識(shí)別網(wǎng)絡(luò);解碼單元,用于對(duì)接收的語(yǔ)音信號(hào),根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)幀進(jìn)行解碼;激勵(lì)單元,用于在所述解碼單元的解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率;最優(yōu)節(jié)點(diǎn)確定單元,用于在所述解碼單元完成對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);回溯單元,用于從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到最優(yōu)路徑及對(duì)應(yīng)的單詞序列。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括熱詞集合更新單元,用于獲取用戶(hù)輸入的熱詞,并將所述熱詞保存到熱詞集合;所述激勵(lì)單元在所述解碼單元解碼過(guò)程中根據(jù)所述熱詞集合對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述激勵(lì)單元包括獲取子單元,用于獲取對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;判斷子單元,用于根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞;激勵(lì)子單元,用于在所述判斷子單元判斷所述歷史路徑上鄰近單詞構(gòu)成一條熱詞后, 提高所述歷史路徑的累積歷史路徑概率;在所述判斷子單元判斷所述歷史路徑上鄰近單詞不能構(gòu)成一條熱詞后,保持所述歷史路徑的累積歷史路徑概率。
11.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括熱詞獲取單元,用于獲取用戶(hù)輸入的熱詞;切分單元,用于對(duì)所述熱詞獲取單元獲取的熱詞進(jìn)行文本分詞,并將得到的分詞保存到熱詞詞典;所述激勵(lì)單元在所述解碼單元解碼過(guò)程中根據(jù)所述熱詞詞典對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì)。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述激勵(lì)單元包括獲取子單元,用于獲取對(duì)當(dāng)前語(yǔ)音信號(hào)幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;新詞判斷子單元,用于判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;激勵(lì)子單元,用于在所述新詞判斷子單元判斷所述活躍節(jié)點(diǎn)的歷史路徑中出現(xiàn)新詞后,根據(jù)所述新詞相對(duì)于所述歷史路徑上對(duì)應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率;否則保持所述歷史路徑的累積歷史路徑概率。
13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述激勵(lì)子單元包括第一判斷子單元,用于判斷所述新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;第一處理子單元,用于在所述第一判斷子單元判斷所述新詞是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分;第二判斷子單元,用于在所述第一判斷子單元判斷所述新詞不是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞后,判斷所述新詞是否為所述熱詞詞典中的起始分詞;第二處理子單元,用于在所述第二判斷子單元判斷所述新詞是所述熱詞詞典中的起始分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率。
14.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述激勵(lì)子單元包括熱詞判斷子單元,用于判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是否是所述熱詞詞典中的一個(gè)完整熱詞;第三判斷子單元,用于在所述熱詞判斷子單元判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是所述熱詞詞典中的一個(gè)完整熱詞時(shí),判斷所述新詞是否是所述熱詞詞典中的起始分詞;第三處理子單元,用于在所述第三判斷子單元判斷所述新詞是所述熱詞詞典中的起始分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對(duì)應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率;第四判斷子單元,用于在所述熱詞判斷子單元判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列不是所述熱詞詞典中的一個(gè)完整熱詞時(shí),判斷所述新詞是否是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞;第四處理子單元,用于在所述第四判斷子單元判斷所述新詞是所述歷史路徑上對(duì)應(yīng)的熱詞分詞的后續(xù)分詞后,對(duì)所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對(duì)應(yīng)的加分;否則撤銷(xiāo)之前對(duì)所述歷史路徑的累積歷史路徑概率的加分。
全文摘要
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,公開(kāi)了一種語(yǔ)音識(shí)別方法及系統(tǒng)。該方法包括構(gòu)建解碼識(shí)別網(wǎng)絡(luò);對(duì)接收的語(yǔ)音信號(hào),根據(jù)所述解碼識(shí)別網(wǎng)絡(luò)對(duì)其中每幀語(yǔ)音信號(hào)幀進(jìn)行解碼,并在解碼過(guò)程中根據(jù)熱詞對(duì)活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵(lì),以提高熱詞所在路徑的累積歷史路徑概率;在完成對(duì)最后一幀語(yǔ)音信號(hào)幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);從所述最優(yōu)節(jié)點(diǎn)通過(guò)解碼狀態(tài)回溯得到最優(yōu)路徑及對(duì)應(yīng)的單詞序列。利用本發(fā)明,無(wú)需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識(shí)別熱點(diǎn)詞匯及用戶(hù)個(gè)性化詞匯,提高熱詞的識(shí)別效果。
文檔編號(hào)G10L15/28GK102592595SQ20121007341
公開(kāi)日2012年7月18日 申請(qǐng)日期2012年3月19日 優(yōu)先權(quán)日2012年3月19日
發(fā)明者何婷婷, 劉慶峰, 潘青華, 王智國(guó), 胡國(guó)平, 胡郁, 鹿曉亮 申請(qǐng)人:安徽科大訊飛信息科技股份有限公司