專利名稱:語音控制方法及裝置、語音響應(yīng)方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及智能電視語音識(shí)別控制技術(shù)領(lǐng)域,尤其涉及一種語音控制方法、裝置及電視機(jī)。
背景技術(shù):
現(xiàn)有技術(shù)的TV (Television,電視機(jī))平臺(tái)上只有個(gè)別應(yīng)用程序可以使用語音控制功能,而且語音控制必須在某些特定場(chǎng)景下才可以起作用,比如必須進(jìn)入某個(gè)應(yīng)用界面,語音輸入才會(huì)有作用?,F(xiàn)有技術(shù)的語音控制所能完成的事情過于簡(jiǎn)單、單一,且只能完成出廠時(shí)預(yù)先設(shè)定好的個(gè)別操作,比如只能簡(jiǎn)單地切換頻道、打開網(wǎng)址、天氣預(yù)報(bào)等,用戶不能添加新的語音控制功能,也不能刪除用戶自身認(rèn)為不必要的語音控制功能;如果出廠時(shí)軟 件事先沒有建立語音標(biāo)示和相應(yīng)操作的對(duì)應(yīng)關(guān)系,則無法實(shí)現(xiàn)語音控制;用戶的口語千差萬別,現(xiàn)有技術(shù)方案往往因?yàn)楣潭ǖ恼Z音識(shí)別模式造成無法識(shí)別口音重的語音。目前TV系統(tǒng)的功能應(yīng)用比較多,如果TV系統(tǒng)中只有個(gè)別應(yīng)用才可以使用語音控制,那么語音控制功能將受到很大的限制,使TV系統(tǒng)的相關(guān)功能不能得到充分的利用,造成資源的浪費(fèi)。
發(fā)明內(nèi)容
本發(fā)明的主要目的是提供一種語音控制方法、裝置及電視機(jī),旨在建立用戶自定義的語音識(shí)別控制功能,使電視擁有學(xué)習(xí)的功能。本發(fā)明公開了一種語音控制方法,包括以下步驟錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù);錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音;設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián),供用戶自定義電子設(shè)備的語音操作控制指令。優(yōu)選地,所述錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)的步驟具體包括將所述控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取所述語音特征數(shù)據(jù);接收根據(jù)所述語音特征數(shù)據(jù)轉(zhuǎn)換得到可讀的語音字符;顯示所述語音字符,在用戶確認(rèn)所述語音字符無誤時(shí)記錄所述語音字符或者源特征數(shù)據(jù)。優(yōu)選地,所述錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音的步驟具體包括當(dāng)判斷為錄制所述操作指令時(shí),顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引;當(dāng)判斷為錄制所述應(yīng)答語音時(shí),錄制語音應(yīng)答模式的同時(shí)獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。優(yōu)選地,所述設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián)的步驟具體包括根據(jù)錄制的所述操作指令,建立所述應(yīng)用程序索引、所述遙控鍵值與所述語音字符的對(duì)應(yīng)關(guān)系并存儲(chǔ)至數(shù)據(jù)庫(kù)中;或者根據(jù)錄制的所述應(yīng)答語音,建立所述語音字符或者特征數(shù)據(jù)與所述應(yīng)答語音的對(duì)應(yīng)關(guān)系,并存儲(chǔ)至數(shù)據(jù)庫(kù)中。優(yōu)選地,所述數(shù)據(jù)庫(kù)包括操作指令應(yīng)答語音庫(kù),所述操作指令應(yīng)答語音庫(kù)包括多個(gè)語音文件,所述語音文件關(guān)聯(lián)對(duì)應(yīng)的所述語音操作控制指令及應(yīng)用程序索引。
本發(fā)明還公開一種語音控制裝置,包括第一錄制模塊,用于錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù);第二錄制模塊,用于錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音;關(guān)聯(lián)設(shè)置模塊,用于設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián),供用戶自定義電子設(shè)備的語音操作控制指令。優(yōu)選地,所述第一錄制模塊具體包括特征數(shù)據(jù)提取單元,用于將所述控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取所述語音特征數(shù)據(jù);語音字符獲取單元,用于接收根據(jù)所述語音特征數(shù)據(jù)轉(zhuǎn)換得到可讀的語音字符;記錄單元,用于顯示所述語音字符,在用戶確認(rèn)所述語音字符無誤時(shí)記錄所述語音字符或者源特征數(shù)據(jù)。優(yōu)選地,所述第二錄制模塊具體包括操作指令錄制單元,用于在判斷為錄制所述操作指令時(shí),顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引;應(yīng)答語音錄制單元,用于在判斷為錄制所述應(yīng)答語音時(shí),錄制語音應(yīng)答模式的同時(shí)獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。優(yōu)選地,所述關(guān)聯(lián)設(shè)置模塊具體包括操作指令設(shè)置單元,用于根據(jù)錄制的所述操作指令,建立所述應(yīng)用程序索引、所述遙控鍵值與所述語音字符的對(duì)應(yīng)關(guān)系并存儲(chǔ)至數(shù)據(jù)庫(kù)中;應(yīng)答語音設(shè)置單元,用于根據(jù)錄制的所述應(yīng)答語音,建立所述語音字符或者特征數(shù)據(jù)與所述應(yīng)答語音的對(duì)應(yīng)關(guān)系,并存儲(chǔ)至數(shù)據(jù)庫(kù)中。優(yōu)選地,所述數(shù)據(jù)庫(kù)包括操作指令應(yīng)答語音庫(kù),所述操作指令應(yīng)答語音庫(kù)包括多個(gè)語音文件,所述語音文件關(guān)聯(lián)對(duì)應(yīng)的所述語音操作控制指令及應(yīng)用程序索引。本發(fā)明還公開一種語音響應(yīng)方法,所述響應(yīng)方法包括對(duì)所述的語音控制方法中的控制語音進(jìn)行響應(yīng)的方法,所述響應(yīng)方法包括以下步驟獲取用戶輸入的控制語音,并提取控制語音特征數(shù)據(jù);
檢索語音字符數(shù)據(jù)庫(kù),判斷在所述數(shù)據(jù)庫(kù)中是否能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式;若是,則根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答;若否,則切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入所述語音指令。優(yōu)選地,所述根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答的步驟具體包括判斷所述應(yīng)答方式所對(duì)應(yīng)的操作類型;在所述應(yīng)答方式為操作應(yīng)答時(shí),執(zhí)行所述操作應(yīng)答指定的應(yīng)用程序和/或?qū)?yīng)的控制指令;
在所述應(yīng)答方式為語音應(yīng)答時(shí),播放對(duì)應(yīng)的語音文件。本發(fā)明還公開一種語音響應(yīng)裝置,所述響應(yīng)裝置包括對(duì)所述的語音控制裝置進(jìn)行控制,所述響應(yīng)裝置包括控制語音獲取模塊,用于獲取用戶輸入的控制語音,并提取控制語音特征數(shù)據(jù);應(yīng)答方式獲取模塊,用于檢索語音字符數(shù)據(jù)庫(kù),判斷在所述數(shù)據(jù)庫(kù)中是否能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式;第一應(yīng)答模塊,用于在所述數(shù)據(jù)庫(kù)中能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式時(shí),根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答;第二應(yīng)答模塊,用于在所述數(shù)據(jù)庫(kù)中不能找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式時(shí),切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入所述語音指令。優(yōu)選地,所述第一應(yīng)答模塊具體包括應(yīng)答類型獲取單元,用于判斷所述應(yīng)答方式所對(duì)應(yīng)的操作類型;操作應(yīng)答單元,用于在所述應(yīng)答方式為操作應(yīng)答時(shí),執(zhí)行所述操作應(yīng)答指定的應(yīng)用程序和/或?qū)?yīng)的控制指令;語音應(yīng)答單元,用于在所述應(yīng)答方式為語音應(yīng)答時(shí),播放對(duì)應(yīng)的語音文件。本發(fā)明通過錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)、錄制該控制語音的操作指令或應(yīng)答語音、設(shè)置語音特征數(shù)據(jù)與操作指令或應(yīng)答語音的關(guān)聯(lián)并對(duì)該控制語音進(jìn)行響應(yīng)的方法,具有用戶可自定義語音識(shí)別控制并能和電視進(jìn)行交流的有益效果,使電視擁有學(xué)習(xí)的功能,提高了電視性能,提升了用戶體驗(yàn)。
圖I是本發(fā)明語音控制方法一實(shí)施例流程示意圖;圖2是圖I中語音識(shí)別一實(shí)施例結(jié)構(gòu)框圖;圖3是圖I中錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)一實(shí)施例流程示意圖;圖4是圖I中錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音一實(shí)施例流程示意圖;圖5是本發(fā)明語音控制裝置一實(shí)施例結(jié)構(gòu)示意圖;圖6是圖5中關(guān)聯(lián)設(shè)置模塊一實(shí)施例結(jié)構(gòu)示意圖;圖7是圖5中第一錄制模塊一實(shí)施例結(jié)構(gòu)示意圖;圖8是圖5中第二錄制模塊一實(shí)施例結(jié)構(gòu)示意圖9是本發(fā)明語首響應(yīng)方法一實(shí)施例流程不意圖;圖10是圖9中根據(jù)應(yīng)答方式進(jìn)行應(yīng)答一實(shí)施例流程意圖;圖11是本發(fā)明語音響應(yīng)裝置一實(shí)施例結(jié)構(gòu)示意圖;圖12是圖11中第一應(yīng)答模塊一實(shí)施例結(jié)構(gòu)不意圖。本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。
具體實(shí)施例方式以下結(jié)合說明書附圖及具體實(shí)施例進(jìn)一步說明本發(fā)明的技術(shù)方案。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
參照?qǐng)D1,圖I是本發(fā)明語音控制方法一實(shí)施例流程示意圖;如圖I所示,本發(fā)明語音控制方法包括以下步驟步驟S01、錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù);在一優(yōu)選的實(shí)施例中,在TV主程序中設(shè)置有語音控制開關(guān),默認(rèn)情況下語音控制不起作用,在TV主程序打開該語音控制功能后TV才啟動(dòng)語音控制,語音功能啟動(dòng)后進(jìn)入對(duì)話工作模式。在對(duì)話模式下,錄制用戶通過麥克風(fēng)、語音遙控器或手機(jī)等語音輸入設(shè)備輸入的控制語音,同時(shí)提取并記錄該控制語音對(duì)應(yīng)的語音特征數(shù)據(jù)。在一優(yōu)選的實(shí)施例中,TV將用戶輸入的控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取語音特征數(shù)據(jù);參照?qǐng)D2,圖2是圖I中語音識(shí)別一實(shí)施例結(jié)構(gòu)框圖;如圖2所示,TV將用戶輸入的語音進(jìn)行錄制后上傳至云端語音識(shí)別服務(wù)器,該云端語音識(shí)別服務(wù)器對(duì)語音進(jìn)行識(shí)別后轉(zhuǎn)換為能夠被TV識(shí)別的語音字符,TV將該語音字符通過OSD (On Screen Display,屏幕菜單式顯示)或者其他顯示方式顯示出來供用戶核對(duì)確認(rèn),用戶核對(duì)無誤后,TV記錄該語音字符或者源特征數(shù)據(jù);本實(shí)施例中,所述特征數(shù)據(jù)包括所述語音字符。步驟S02、錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音;提取并記錄用戶輸入的控制語音所對(duì)應(yīng)的語音特征數(shù)據(jù)后,TV還需錄制該控制語音所對(duì)應(yīng)的操作指令或應(yīng)答語音;具體地,在一優(yōu)選的實(shí)施例中,電視機(jī)首先判斷用戶選擇的語音控制類型;若用戶選擇的控制類型為“說話”時(shí),電視機(jī)存儲(chǔ)用戶輸入的語音,建立該語音的語音路徑與相應(yīng)語音字符之間的對(duì)應(yīng)關(guān)系并存儲(chǔ)至所述數(shù)據(jù)庫(kù)。若用戶選擇的控制類型為“辦事”時(shí),電視機(jī)顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引;并在應(yīng)用程序索引、遙控鍵值與語音字符之間建立對(duì)應(yīng)關(guān)系并存儲(chǔ)至所述數(shù)據(jù)庫(kù)。步驟S03、設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián),供用戶自定義電子設(shè)備的語音操作控制指令。為了實(shí)現(xiàn)用戶自定義電子設(shè)備的語音操作控制指令,設(shè)置語音特征數(shù)據(jù)與操作指令的關(guān)聯(lián)具體為根據(jù)錄制的操作指令,建立應(yīng)用程序索引、遙控鍵值與語音字符的對(duì)應(yīng)關(guān)系并存儲(chǔ)至數(shù)據(jù)庫(kù)中;設(shè)置語音特征數(shù)據(jù)與應(yīng)答語音的關(guān)聯(lián)具體為根據(jù)錄制的應(yīng)答語音,建立語音字符或者特征數(shù)據(jù)與應(yīng)答語音的對(duì)應(yīng)關(guān)系,并存儲(chǔ)至數(shù)據(jù)庫(kù)中。在一優(yōu)選的實(shí)施例中,數(shù)據(jù)庫(kù)存儲(chǔ)并檢索云端返回的語音字符,相比存儲(chǔ)檢索語音音頻文件更加簡(jiǎn)單、準(zhǔn)確。當(dāng)然,所述數(shù)據(jù)庫(kù)存儲(chǔ)在云端服務(wù)器,數(shù)據(jù)量小,因此本地硬件的開銷也小,可更準(zhǔn)確檢索音頻文件或者語音字符,這里不作限制。
下面以具體的實(shí)施例來描述本發(fā)明語音控制方法的具體實(shí)施過程。比如要實(shí)現(xiàn)“打開U盤播放電影”的語音控制。用戶首先進(jìn)入學(xué)習(xí)模式,學(xué)習(xí)所接收的指令。電視會(huì)提示用戶輸入語音指令,用戶通過麥克風(fēng)將“打開U盤播放電影”的語音輸入給電視,電視通過云端處理轉(zhuǎn)換為文字字符,并以O(shè)SD提示的方式反饋給用戶“您輸入的是否為‘打開U盤播放電影’?”。用戶選擇“是”,然后就進(jìn)入學(xué)習(xí)的第二步,OSD進(jìn)一步提示“學(xué)習(xí)說話還是辦事? ”用戶選擇“辦事”,則有OSD繼續(xù)提示用戶,“請(qǐng)選擇您要打開的應(yīng)用”。然后用戶選擇“USB應(yīng)用”,當(dāng)程序 進(jìn)入U(xiǎn)SB應(yīng)用后,接下來的所有遙控器按鍵將會(huì)被一一記錄,則用戶就可以模擬進(jìn)入U(xiǎn)SB應(yīng)用后,如何用遙控器一步步選擇所要播放的影片并實(shí)現(xiàn)播放。用戶就完成自己想要功能的設(shè)置后,選擇退出學(xué)習(xí)模式的按鍵。根據(jù)提示保存學(xué)習(xí)的內(nèi)容,如“打開U盤播放電影”的文字字符和USB應(yīng)用程序的索引以及上/下/左/右等一系列遙控按鍵的鍵值。此外,通過上述方法還可以“教”電視去說話,比如用戶進(jìn)入學(xué)習(xí)模式后錄入一段自己的語音,并將錄入的語音與語音字符關(guān)聯(lián)地存儲(chǔ)在數(shù)據(jù)庫(kù)中,則電視便可以“鸚鵡學(xué)舌”般的說話,也可以智能應(yīng)答了。本實(shí)施例通過錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)、錄制該控制語音的操作指令或應(yīng)答語音、設(shè)置語音特征數(shù)據(jù)與操作指令或應(yīng)答語音的關(guān)聯(lián)并對(duì)該控制語音進(jìn)行響應(yīng)的方法,具有用戶可自定義語音識(shí)別控制并能和電視進(jìn)行交流的有益效果,使電視擁有學(xué)習(xí)的功能,提高了電視性能,提升了用戶體驗(yàn)。參照?qǐng)D3,圖3是圖I中錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)一實(shí)施例流程示意圖;本實(shí)施例僅對(duì)步驟SOl作進(jìn)一步描述,本發(fā)明語音控制方法所涉及的其他步驟請(qǐng)參照相關(guān)實(shí)施例的具體描述,在此不再贅述。如圖3所示,本發(fā)明語音控制方法中,步驟SOI、錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)的步驟具體包括步驟S11、將所述控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取所述語音特征數(shù)據(jù);步驟S12、接收根據(jù)所述語音特征數(shù)據(jù)轉(zhuǎn)換得到可顯示的文字字符,即語音字符;步驟S13、顯示所述語音字符,在用戶確認(rèn)所述語音字符無誤時(shí)記錄所述語音字符或者源特征數(shù)據(jù)。TV將用戶輸入的控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取語音特征數(shù)據(jù);TV將用戶輸入的語音進(jìn)行錄制后上傳至云端語音識(shí)別服務(wù)器,該云端語音識(shí)別服務(wù)器對(duì)語音進(jìn)行識(shí)別后轉(zhuǎn)換為能夠被TV識(shí)別的語音字符,TV將該語音字符通過OSD或者通過其他顯示方式顯示出來供用戶核對(duì)確認(rèn),用戶核對(duì)無誤后,TV記錄該語音字符或者源特征數(shù)據(jù);本實(shí)施例中,所述特征數(shù)據(jù)包括所述語音字符。上述具體實(shí)施過程請(qǐng)參照?qǐng)D2所述實(shí)施例的具體描述,在此不再贅述。本實(shí)施例通過錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)的方法,具有更準(zhǔn)確的用戶可自定義語音識(shí)別控制的有益效果。參照?qǐng)D4,圖4是圖I中錄制用戶對(duì)應(yīng)控制語音的操作指令或應(yīng)答語音一實(shí)施例流程示意圖;本實(shí)施例僅對(duì)步驟S02作進(jìn)一步描述,本發(fā)明語音控制方法所涉及的其他步驟請(qǐng)參照相關(guān)實(shí)施例的具體描述,在此不再贅述。如圖4所示,本發(fā)明語音控制方法中,步驟S02、錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音的步驟具體包括
步驟S21、判斷所錄制是操作指令還是應(yīng)答語音;若是操作指令,則執(zhí)行步驟S22 ;若是應(yīng)答語音,則執(zhí)行步驟S23 ;步驟S22、顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引;在判斷為錄制操作指令時(shí),TV顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引。具體地,在一優(yōu)選的實(shí)施例中,當(dāng)TV判斷用戶選擇“辦事”即錄制操作指令時(shí),則有OSD繼續(xù)提示用戶,“請(qǐng)選擇您要打開的應(yīng)用”。然后用戶選擇“USB應(yīng)用”,當(dāng)程序進(jìn)入U(xiǎn)SB應(yīng)用后,接下來的所有遙控器按鍵將會(huì)被一一記錄,則用戶就可以模擬進(jìn)入U(xiǎn)SB應(yīng)用后,如何用遙控器一步步選擇所要播放的影片并實(shí)現(xiàn)播放。用戶就完成自己想要功能的設(shè)置后,選擇退出學(xué)習(xí)模式的按鍵。根據(jù)提示保存學(xué)習(xí)的內(nèi)容,如“打開U盤播放電影”的文字字符和USB應(yīng)用程序的索引以及上/下/左/右等一系列遙控按鍵的鍵值。
步驟S23、錄制語音應(yīng)答模式的同時(shí)獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。在判斷為錄制應(yīng)答語音時(shí),TV將錄制語音應(yīng)答模式的同時(shí),獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。具體地,在一優(yōu)選的實(shí)施例中,在用戶進(jìn)入學(xué)習(xí)模式后錄入一段自己的語音時(shí),TV將用戶錄入的語音與語音字符關(guān)聯(lián)地存儲(chǔ)在數(shù)據(jù)庫(kù)中,則TV便可以“鸚鵡學(xué)舌”般的說話了。當(dāng)然所述的應(yīng)答語音只要與控制語音有邏輯關(guān)系,即可實(shí)現(xiàn)智能應(yīng)答。例如,控制語音為“遙控器放哪里”,應(yīng)答語音可以是“在電視柜下抽屜里”。這樣當(dāng)其他家庭成員向電視問“遙控器放哪里”的時(shí)候,智能電視能智能應(yīng)答“在電視柜下抽屜里”。本實(shí)施例通過錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音的方法,具有用戶能和電視進(jìn)行交流的有益效果,使電視更具智能化和人性化。參照?qǐng)D5,圖5是本發(fā)明語音控制裝置一實(shí)施例結(jié)構(gòu)示意圖;如圖5所示,本發(fā)明語音控制裝置具體包括第一錄制模塊01,用于錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù);在一優(yōu)選的實(shí)施例中,在TV主程序中設(shè)置有語音控制開關(guān),默認(rèn)情況下語音控制不起作用,在TV主程序打開該語音控制功能后TV才啟動(dòng)語音控制,語音功能啟動(dòng)后進(jìn)入對(duì)話工作模式。在對(duì)話模式下,第一錄制模塊01錄制用戶通過麥克風(fēng)、語音遙控器或手機(jī)等語音輸入設(shè)備輸入的控制語音,同時(shí)提取并記錄該控制語音對(duì)應(yīng)的語音特征數(shù)據(jù)。在一優(yōu)選的實(shí)施例中,第一錄制模塊01將用戶輸入的控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取語音特征數(shù)據(jù);具體地,第一錄制模塊01將用戶輸入的語音進(jìn)行錄制后上傳至云端語音識(shí)別服務(wù)器,該云端語音識(shí)別服務(wù)器對(duì)語音進(jìn)行識(shí)別后轉(zhuǎn)換為能夠被TV識(shí)別的語音字符,第一錄制模塊01將該語音字符通過OSD或者其他顯示方式顯示出來供用戶核對(duì)確認(rèn),用戶核對(duì)無誤后,第一錄制模塊01記錄該語音字符或者源特征數(shù)據(jù);本實(shí)施例中,所述特征數(shù)據(jù)包括所述語音字符。上述實(shí)施過程請(qǐng)參照?qǐng)D2所述實(shí)施例的具體描述,在此不再贅述。第二錄制模塊02,用于錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音;第一錄制模塊01提取并記錄用戶輸入的控制語音所對(duì)應(yīng)的語音特征數(shù)據(jù)后,第二錄制模塊02還需錄制該控制語音所對(duì)應(yīng)的操作指令或應(yīng)答語音;具體地,在一優(yōu)選的實(shí)施例中,第二錄制模塊02首先判斷用戶選擇的語音控制類型;若用戶選擇的控制類型為“說話”時(shí),第二錄制模塊02存儲(chǔ)用戶輸入的語音,建立該語音的語音路徑與相應(yīng)語音字符之間的對(duì)應(yīng)關(guān)系并存儲(chǔ)至所述數(shù)據(jù)庫(kù)。若用戶選擇的控制類型為“辦事”時(shí),第二錄制模塊02顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引;并在應(yīng)用程序索引、遙控鍵值與語音字符之間建立對(duì)應(yīng)關(guān)系并存儲(chǔ)至所述數(shù)據(jù)庫(kù)。關(guān)聯(lián)設(shè)置模塊03,用于設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián),供用戶自定義電子設(shè)備的語音操作控制指令。為了實(shí)現(xiàn)用戶自定義電子設(shè)備的語音操作控制指令,需要關(guān)聯(lián)設(shè)置模塊03設(shè)置語音特征數(shù)據(jù)與操作指令或應(yīng)答語音的關(guān)聯(lián)。參照?qǐng)D6,圖6是圖5中關(guān)聯(lián)設(shè)置模塊一實(shí)施例結(jié)構(gòu)示意圖;如圖6所示,關(guān)聯(lián)設(shè)置模塊03具體包括操作指令設(shè)置單元031,用于根據(jù)錄制的所述操作指令,建立所述應(yīng)用程序索引、 所述遙控鍵值與所述語音字符的對(duì)應(yīng)關(guān)系并存儲(chǔ)至數(shù)據(jù)庫(kù)中;應(yīng)答語音設(shè)置單元032,用于根據(jù)錄制的所述應(yīng)答語音,建立所述語音字符或者特征數(shù)據(jù)與所述應(yīng)答語音的對(duì)應(yīng)關(guān)系,并存儲(chǔ)至數(shù)據(jù)庫(kù)中。關(guān)聯(lián)設(shè)置模塊03設(shè)置語音特征數(shù)據(jù)與操作指令的關(guān)聯(lián)具體為若設(shè)置所述語音特征數(shù)據(jù)與操作指令的關(guān)聯(lián),則操作指令設(shè)置單元031根據(jù)錄制的操作指令,建立應(yīng)用程序索引、遙控鍵值與語音字符的對(duì)應(yīng)關(guān)系并存儲(chǔ)至數(shù)據(jù)庫(kù)中;若設(shè)置語音特征數(shù)據(jù)與應(yīng)答語音的關(guān)聯(lián),則應(yīng)答語音設(shè)置單元032根據(jù)錄制的應(yīng)答語音,建立語音字符或者特征數(shù)據(jù)與應(yīng)答語音的對(duì)應(yīng)關(guān)系,并存儲(chǔ)至數(shù)據(jù)庫(kù)中。在一優(yōu)選的實(shí)施例中,數(shù)據(jù)庫(kù)存儲(chǔ)并檢索云端返回的語音字符,相比存儲(chǔ)檢索語音音頻文件更加簡(jiǎn)單、準(zhǔn)確。當(dāng)然,所述數(shù)據(jù)庫(kù)存儲(chǔ)在云端服務(wù)器,數(shù)據(jù)量小,因此本地硬件的開銷也小,可更準(zhǔn)確檢索音頻文件或者語音字符,這里不作限制。下面以具體的實(shí)施例來描述本發(fā)明語音控制裝置進(jìn)行語音控制的具體實(shí)施過程。比如要實(shí)現(xiàn)“打開U盤播放電影”的語音控制。用戶首先進(jìn)入學(xué)習(xí)模式,學(xué)習(xí)所接收的指令。電視會(huì)提示用戶輸入語音指令,用戶通過麥克風(fēng)將“打開U盤播放電影”的語音輸入給電視,電視的語音控制裝置通過云端處理轉(zhuǎn)換為文字字符,并以O(shè)SD提示的方式反饋給用戶“您輸入的是否為‘打開U盤播放電影’?”。用戶選擇“是”,然后就進(jìn)入學(xué)習(xí)的第二步,OSD進(jìn)一步提示“學(xué)習(xí)說話還是辦事? ”用戶選擇“辦事”,則有OSD繼續(xù)提示用戶,“請(qǐng)選擇您要打開的應(yīng)用”。然后用戶選擇“USB應(yīng)用”,當(dāng)程序進(jìn)入U(xiǎn)SB應(yīng)用后,接下來的所有遙控器按鍵將會(huì)被一一記錄,則用戶就可以模擬進(jìn)入U(xiǎn)SB應(yīng)用后,如何用遙控器一步步選擇所要播放的影片并實(shí)現(xiàn)播放。用戶就完成自己想要功能的設(shè)置后,選擇退出學(xué)習(xí)模式的按鍵。根據(jù)語音控制裝置提示保存學(xué)習(xí)的內(nèi)容,如“打開U盤播放電影”的文字字符和USB應(yīng)用程序的索引以及上/下/左/右等一系列遙控按鍵的鍵值。此外,語音控制裝置通過上述方法還可以“教”電視去說話,比如用戶進(jìn)入學(xué)習(xí)模式后錄入一段自己的語音,并將錄入的語音與語音字符關(guān)聯(lián)地存儲(chǔ)在數(shù)據(jù)庫(kù)中,則電視便可以“鸚鵡學(xué)舌”,智能應(yīng)答般的說話了。本實(shí)施例通過錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)、錄制該控制語音的操作指令或應(yīng)答語音、設(shè)置語音特征數(shù)據(jù)與操作指令或應(yīng)答語音的關(guān)聯(lián)并對(duì)該控制語音進(jìn)行響應(yīng),具有用戶可自定義語音識(shí)別控制并能和電視進(jìn)行交流的有益效果,使電視擁有學(xué)習(xí)的功能,提高了電視性能,提升了用戶體驗(yàn)。參照?qǐng)D7,圖7是圖5中第一錄制模塊一實(shí)施例結(jié)構(gòu)示意圖;本實(shí)施例僅對(duì)第一錄制模塊01作進(jìn)一步描述,本發(fā)明語音控制裝置所涉及的其他模塊請(qǐng)參照相關(guān)實(shí)施例的具體描述,在此不再贅述。如圖7所示,本發(fā)明語音控制裝置中,第一錄制模塊01 具體包括特征數(shù)據(jù)提取單元011,用于將所述控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取所述語音特征數(shù)據(jù);語音字符獲取單元012,用于接收根據(jù)所述語音特征數(shù)據(jù)轉(zhuǎn)換得到可顯示的文字字符,以下簡(jiǎn)稱語音字符;記錄單元013,用于顯示所述語音字符,在用戶確認(rèn)所述語音字符無誤時(shí)記錄所述語音字符或者源特征數(shù)據(jù)。TV的特征數(shù)據(jù)提取單元011將用戶輸入的控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取語音特征數(shù)據(jù);特征數(shù)據(jù)提取單元011將用戶輸入的語音進(jìn)行錄制后上傳至云端語音識(shí)別服務(wù)器,該云端語音識(shí)別服務(wù)器對(duì)語音進(jìn)行識(shí)別后轉(zhuǎn)換為能夠被TV識(shí)別的語音字符,語音字符獲取單元012獲取該語音字符,記錄單元013將該語音字符通過OSD或者通過其他顯示方式顯示出來供用戶核對(duì)確認(rèn),用戶核對(duì)無誤后,記錄單元013記錄該語音字符或者源特征數(shù)據(jù);本實(shí)施例中,所述特征數(shù)據(jù)包括所述語音字符。上述具體實(shí)施過程請(qǐng)參照?qǐng)D2所述實(shí)施例的具體描述,在此不再贅述。本實(shí)施例通過錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù),具有用戶可自定義語音識(shí)別控制的有益效果。參照?qǐng)D8,圖8是圖5中第二錄制模塊一實(shí)施例結(jié)構(gòu)示意圖;本實(shí)施例僅對(duì)第二錄制模塊02作進(jìn)一步描述,本發(fā)明語音控制裝置所涉及的其他模塊請(qǐng)參照相關(guān)實(shí)施例的具體描述,在此不再贅述。如圖8所示,本發(fā)明語音控制裝置中,第二錄制模塊02具體包括操作指令錄制單元021,用于在判斷為錄制所述操作指令時(shí),顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引;在判斷為錄制操作指令時(shí),操作指令錄制單元021顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引。具體地,在一優(yōu)選的實(shí)施例中,當(dāng)TV判斷用戶選擇“辦事”即錄制操作指令時(shí),則有OSD繼續(xù)提示用戶,“請(qǐng)選擇您要打開的應(yīng)用”。然后用戶選擇“USB應(yīng)用”,當(dāng)程序進(jìn)入U(xiǎn)SB應(yīng)用后,接下來的所有遙控器按鍵將會(huì)被一一記錄,則用戶就可以模擬進(jìn)入U(xiǎn)SB應(yīng)用后,如何用遙控器一步步選擇所要播放的影片并實(shí)現(xiàn)播放。用戶就完成自己想要功能的設(shè)置后,選擇退出學(xué)習(xí)模式的按鍵。根據(jù)操作指令錄制單元021提示保存學(xué)習(xí)的內(nèi)容,如“打開U盤播放電影”的文字字符和USB應(yīng)用程序的索引以及上/下/左/右等一系列遙控按鍵的鍵值。應(yīng)答語音錄制單元022,用于在判斷為錄制所述應(yīng)答語音時(shí),錄制語音應(yīng)答模式的同時(shí)獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。
在判斷為錄制應(yīng)答語音時(shí),應(yīng)答語音錄制單元022將錄制語音應(yīng)答模式的同時(shí),獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。具體地,在一優(yōu)選的實(shí)施例中,在用戶進(jìn)入學(xué)習(xí)模式后錄入一段自己的語音時(shí),應(yīng)答語音錄制單元022將用戶錄入的語音與語音字符關(guān)聯(lián)地存儲(chǔ)在數(shù)據(jù)庫(kù)中,則TV便可以“鸚鵡學(xué)舌”般的說話了。當(dāng)然所述的應(yīng)答語音只要與控制語音有邏輯關(guān)系,即可實(shí)現(xiàn)智能應(yīng)答。例如,控制語音為“遙控器放哪里”,應(yīng)答語音可以是“在電視柜下抽屜里”。這樣當(dāng)其他家庭成員向電視問“遙控器放哪里”的時(shí)候,智能電視能智能應(yīng)答“在電視柜下抽屜里”。本實(shí)施例通過錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音,具有用戶能和電視進(jìn)行交流的有益效果,使電視更具智能化和人性化。參照?qǐng)D9,圖9是本發(fā)明語音響應(yīng)方法一實(shí)施例流程示意圖;本發(fā)明語音響應(yīng)方法包括對(duì)上述語音控制方法中的控制語音進(jìn)行響應(yīng)的方法,如圖9所示,本發(fā)明語音響應(yīng)方法包括以下步驟步驟S101、獲取用戶輸入的控制語音,并提取控制語音特征數(shù)據(jù); 在對(duì)話模式下,用戶通過麥克風(fēng)、語音遙控器或手機(jī)等語音輸入設(shè)備輸入語音信息,TV獲取用戶輸入的控制語音,并提取該控制語音所對(duì)應(yīng)的控制語音特征數(shù)據(jù);具體地,在一優(yōu)選的實(shí)施例中,用戶輸入的語音信息通過云端服務(wù)器的語音識(shí)別系統(tǒng)識(shí)別后,將該語音文件轉(zhuǎn)換為語音字符,所述語音字符包括文字字符等一切能夠被TV識(shí)別的字符;所述控制語音特征數(shù)據(jù)包括所述語音字符。上述具體實(shí)施過程請(qǐng)參照?qǐng)D2所述實(shí)施例的具體描述,在此不再贅述。步驟S102、檢索語音字符數(shù)據(jù)庫(kù),判斷在所述數(shù)據(jù)庫(kù)中是否能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式;若是,則執(zhí)行步驟S103 ;若否,則執(zhí)行步驟S104 ;步驟S103、根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答;步驟S104、切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入所述語音指令。根據(jù)語音字符建立的索引,檢索語音字符數(shù)據(jù)庫(kù),在數(shù)據(jù)庫(kù)中尋找對(duì)應(yīng)的應(yīng)答方式。如果能夠在數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式,則根據(jù)該應(yīng)答方式進(jìn)行應(yīng)答。如果是操作,那么就進(jìn)入其所指定的應(yīng)用程序完成相關(guān)操作;如果是語音應(yīng)答,則播放對(duì)應(yīng)的語音文件。如果沒有在數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式,則在OSD上提示用戶重試或者進(jìn)入學(xué)習(xí)模式。具體地,電視默認(rèn)的工作模式是對(duì)話模式,在對(duì)話模式下,通過麥克風(fēng)對(duì)電視講“打開U盤播放電影”,電視機(jī)會(huì)自動(dòng)將輸入的語音通過云端語音識(shí)別為相應(yīng)文字字符,然后到本地?cái)?shù)據(jù)庫(kù)中搜索“打開U盤播放電影”的字符,如果找到相關(guān)記錄,則執(zhí)行與之相匹配的操作如啟動(dòng)USB (Universal Serial Bus,通用串行總線)應(yīng)用程序并發(fā)送一系列鍵值消息給電視,這樣就可以實(shí)現(xiàn)用戶所要的功能了。如果數(shù)據(jù)庫(kù)中沒有找到相關(guān)字符,則說明沒有建立此語言控制功能或語音識(shí)別有誤,則提示用戶重新輸入或進(jìn)入學(xué)習(xí)模式。本發(fā)明語音控制方法可以遍歷所有的應(yīng)用程序,以及用遙控器模擬進(jìn)入應(yīng)用程序內(nèi)部的操作,因此用戶還可以模擬出更多的操作比如編輯節(jié)目、預(yù)約節(jié)目、音量加減、更換頻道、定時(shí)關(guān)機(jī)、查看某城市的天氣預(yù)報(bào)、登陸某網(wǎng)站等。用戶按照上述方法對(duì)TV進(jìn)行相應(yīng)設(shè)置,即可“教會(huì)”電視去做了。
本實(shí)施例通過啟動(dòng)語音功能進(jìn)入對(duì)話工作模式,在用戶確認(rèn)無誤后記錄由輸入的語音指令轉(zhuǎn)換后得到的語音字符,在語音字符數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式時(shí),根據(jù)該應(yīng)答方式進(jìn)行應(yīng)答,在沒有找到時(shí),切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入該語音指令的方法,具有用戶可以自定義語音識(shí)別控制并可以和電視進(jìn)行交流的有益效果,使電視擁有學(xué)習(xí)的功能,提高了電視性能,提升了用戶體驗(yàn)。參照?qǐng)D10,圖10是圖9中根據(jù)應(yīng)答方式進(jìn)行應(yīng)答一實(shí)施例流程不意圖;本實(shí)施例僅對(duì)步驟S103作具體描述,本發(fā)明語音響應(yīng)方法所涉及的其他步驟,請(qǐng)參照相關(guān)實(shí)施例的具體描述,在此不再贅述。如圖10所示,本發(fā)明語音響應(yīng)方法中,步驟S103、根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答具體包括步驟S31、判斷所述應(yīng)答方式所對(duì)應(yīng)的操作類型;在所述應(yīng)答方式為操作應(yīng)答時(shí),執(zhí)行步驟S32 ;在所述應(yīng)答方式為語音應(yīng)答時(shí),執(zhí)行步驟S33 ;
步驟S32、執(zhí)行所述操作應(yīng)答指定的應(yīng)用程序和/或?qū)?yīng)的控制命令;步驟S33、播放對(duì)應(yīng)的語音文件。如果能夠在數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式,則根據(jù)該應(yīng)答方式進(jìn)行應(yīng)答。如果是操作即“辦事”,那么就進(jìn)入其所指定的應(yīng)用程序完成相關(guān)操作;如果是語音應(yīng)答即“說話”,則播放對(duì)應(yīng)的語音文件。具體地,比如,若該操作應(yīng)答為“打開U盤播放電影”,則電視機(jī)就執(zhí)行該應(yīng)答指定的應(yīng)用程序,即電視機(jī)自動(dòng)打開U盤,并播放電影;若是語音應(yīng)答,則電視機(jī)根據(jù)該語音字符關(guān)聯(lián)的語音路徑播放相應(yīng)的語音,如播放用戶事先錄入的語音“你真的很棒”。本實(shí)施例通過判斷應(yīng)答方式所對(duì)應(yīng)的操作類型是操作還是語音、并根據(jù)應(yīng)答方式進(jìn)行對(duì)應(yīng)的應(yīng)答的方法,具有將電視機(jī)智能化的有益效果。參照?qǐng)D11,圖11是本發(fā)明語音響應(yīng)裝置一實(shí)施例結(jié)構(gòu)示意圖;本實(shí)施例所述的語音響應(yīng)裝置包括對(duì)上述語音控制裝置進(jìn)行控制,如圖11所示,本發(fā)明語音響應(yīng)裝置包括控制語音獲取模塊10,用于獲取用戶輸入的控制語音,并提取控制語音特征數(shù)據(jù);在對(duì)話模式下,用戶通過麥克風(fēng)、語音遙控器或手機(jī)等語音輸入設(shè)備輸入語音信息,TV的控制語音獲取模塊10獲取用戶輸入的控制語音,并提取該控制語音所對(duì)應(yīng)的控制語音特征數(shù)據(jù);具體地,在一優(yōu)選的實(shí)施例中,用戶輸入的語音信息通過云端服務(wù)器的語音識(shí)別系統(tǒng)識(shí)別后,將該語音文件轉(zhuǎn)換為語音字符,所述語音字符包括文字字符等一切能夠被TV識(shí)別的字符;所述控制語音特征數(shù)據(jù)包括所述語音字符。上述具體實(shí)施過程請(qǐng)參照?qǐng)D2所述實(shí)施例的具體描述,在此不再贅述。應(yīng)答方式獲取模塊20,用于檢索語音字符數(shù)據(jù)庫(kù),判斷在所述數(shù)據(jù)庫(kù)中是否能夠找到所述語音特征數(shù)據(jù)所對(duì)應(yīng)的應(yīng)答方式;第一應(yīng)答模塊30,用于在所述數(shù)據(jù)庫(kù)中能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式時(shí),根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答;第二應(yīng)答模塊40,用于在所述數(shù)據(jù)庫(kù)中不能找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式時(shí),切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入所述語音指令。根據(jù)語音字符建立的索引,應(yīng)答方式獲取模塊20檢索語音字符數(shù)據(jù)庫(kù),在數(shù)據(jù)庫(kù)中尋找對(duì)應(yīng)的應(yīng)答方式。應(yīng)答方式獲取模塊20如果能夠在數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式,則第一應(yīng)答模塊30根據(jù)該應(yīng)答方式進(jìn)行應(yīng)答。如果是操作,那么第一應(yīng)答模塊30就進(jìn)入其所指定的應(yīng)用程序完成相關(guān)操作;如果是語音應(yīng)答,則第一應(yīng)答模塊30播放對(duì)應(yīng)的語音文件。如果應(yīng)答方式獲取模塊20沒有在數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式,則在OSD上提示用戶重試或者由第二應(yīng)答模塊40切換進(jìn)入學(xué)習(xí)模式。具體地,電視默認(rèn)的工作模式是對(duì)話模式,在對(duì)話模式下,通過麥克風(fēng)對(duì)電視講“打開U盤播放電影”,電視機(jī)會(huì)自動(dòng)將輸入的語音通過云端語音識(shí)別為相應(yīng)語音字符,控制語音獲取模塊10記錄該語音字符,然后由應(yīng)答方式獲取模塊20到本地?cái)?shù)據(jù)庫(kù)中搜索“打開U盤播放電影”的字符,如果應(yīng)答方式獲取模塊20找到相關(guān)記錄,則第一應(yīng)答模塊30執(zhí)行與之相匹配的操作如啟動(dòng)USB應(yīng)用程序并發(fā)送一系列鍵值消息給電視,這樣就可以實(shí)現(xiàn)用戶所要的功能了。如果應(yīng)答方式獲取模塊20在數(shù)據(jù)庫(kù)中沒有找到相關(guān)字符,則說明沒有建立此語言控制功能或語音識(shí)別有誤,則提示用戶重新輸入或由第二應(yīng)答模塊40切換進(jìn)入學(xué)習(xí)模式。
本發(fā)明語音控制裝置通過上述語音控制方法可以遍歷所有的應(yīng)用程序,以及用遙控器模擬進(jìn)入應(yīng)用程序內(nèi)部的操作,因此用戶還可以模擬出更多的操作比如編輯節(jié)目、預(yù)約節(jié)目、音量加減、更換頻道、定時(shí)關(guān)機(jī)、查看某城市的天氣預(yù)報(bào)、登陸某網(wǎng)站等。用戶按照上述方法對(duì)TV進(jìn)行相應(yīng)設(shè)置,即可“教會(huì)”電視去做了。本實(shí)施例通過啟動(dòng)語音功能進(jìn)入對(duì)話工作模式,在用戶確認(rèn)無誤后記錄由輸入的語音指令轉(zhuǎn)換后得到的語音字符,在語音字符數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式時(shí),根據(jù)該應(yīng)答方式進(jìn)行應(yīng)答,在沒有找到時(shí),切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入該語音指令,具有用戶可以自定義語音識(shí)別控制并可以和電視進(jìn)行交流的有益效果,使電視擁有學(xué)習(xí)的功能,提高了電視性能,提升了用戶體驗(yàn)。參照?qǐng)D12,圖12是圖11中對(duì)話工作模塊一實(shí)施例結(jié)構(gòu)示意圖;本實(shí)施例僅將第一應(yīng)答模塊30作進(jìn)一步描述,本發(fā)明語音控制裝置所涉及的其他模塊請(qǐng)參照相關(guān)實(shí)施例的具體描述,在此不再贅述。如圖12所示,本發(fā)明語音控制裝置中,第一應(yīng)答模塊30具體包括應(yīng)答類型獲取單元301,用于判斷所述應(yīng)答方式所對(duì)應(yīng)的操作類型;操作應(yīng)答單元302,用于在所述應(yīng)答方式為操作應(yīng)答時(shí),執(zhí)行所述操作應(yīng)答指定的應(yīng)用程序和/或?qū)?yīng)的控制指令;語音應(yīng)答單元303,用于在所述應(yīng)答方式為語音應(yīng)答時(shí),播放對(duì)應(yīng)的語音文件。如果應(yīng)答方式獲取模塊20能夠在數(shù)據(jù)庫(kù)中找到該語音字符的應(yīng)答方式,則應(yīng)答類型獲取單元301判斷該應(yīng)答方式所對(duì)應(yīng)的操作類型并根據(jù)該應(yīng)答方式進(jìn)行應(yīng)答。如果應(yīng)答類型獲取單元301判斷該應(yīng)答方式為操作應(yīng)答即“辦事”,那么操作應(yīng)答單元302就進(jìn)入其所指定的應(yīng)用程序完成相關(guān)操作;如果應(yīng)答類型獲取單元301判斷該應(yīng)答方式為語音應(yīng)答即“說話”,則語音應(yīng)答單元303播放對(duì)應(yīng)的語音文件。具體地,比如,若應(yīng)答類型獲取單元301判斷該操作應(yīng)答為“打開U盤播放電影”,則電視機(jī)的操作應(yīng)答單元302就執(zhí)行該應(yīng)答指定的應(yīng)用程序,即電視機(jī)自動(dòng)打開U盤,并播放電影;若應(yīng)答類型獲取單元301判斷該操作應(yīng)答為語音應(yīng)答,則電視機(jī)的語音應(yīng)答單元303根據(jù)該語音字符關(guān)聯(lián)的語音路徑播放相應(yīng)的語音,如播放用戶事先錄入的語音“你真的很棒”。
本實(shí)施例通過判斷應(yīng)答方式所對(duì)應(yīng)的操作類型是操作還是語音、并根據(jù)應(yīng)答方式進(jìn)行對(duì)應(yīng)的應(yīng)答,具有將電視機(jī)智能化的有益效果。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制其專利范圍,凡是利用本發(fā)明 說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種語音控制方法,其特征在于,包括以下步驟 錄制用戶輸入的控制語音,提取并記錄所述控制語音的語音特征數(shù)據(jù); 錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音; 設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián),供用戶自定義電子設(shè)備的語音操作控制指令。
2.如權(quán)利要求I所述的方法,其特征在于,所述錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)的步驟具體包括 將所述控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取所述語音特征數(shù)據(jù); 接收根據(jù)所述語音特征數(shù)據(jù)轉(zhuǎn)換得到可讀的語音字符; 顯示所述語音字符,在用戶確認(rèn)所述語音字符無誤時(shí)記錄所述語音字符或者源特征數(shù)據(jù)。
3.如權(quán)利要求I所述的方法,其特征在于,所述錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音的步驟具體包括 當(dāng)判斷為錄制所述操作指令時(shí), 顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引; 當(dāng)判斷為錄制所述應(yīng)答語音時(shí), 錄制語音應(yīng)答模式的同時(shí)獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。
4.如權(quán)利要求I或3所述的方法,其特征在于,所述設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián)的步驟具體包括 根據(jù)錄制的所述操作指令,建立所述應(yīng)用程序索引、所述遙控鍵值與所述語音字符的對(duì)應(yīng)關(guān)系并存儲(chǔ)至數(shù)據(jù)庫(kù)中; 或者 根據(jù)錄制的所述應(yīng)答語音,建立所述語音字符或者特征數(shù)據(jù)與所述應(yīng)答語音的對(duì)應(yīng)關(guān)系,并存儲(chǔ)至數(shù)據(jù)庫(kù)中。
5.如權(quán)利要求4所述的方法,其特征在于,所述數(shù)據(jù)庫(kù)包括操作指令應(yīng)答語音庫(kù),所述操作指令應(yīng)答語音庫(kù)包括多個(gè)語音文件,所述語音文件關(guān)聯(lián)對(duì)應(yīng)的所述語音操作控制指令及應(yīng)用程序索引。
6.一種語音控制裝置,其特征在于,包括 第一錄制模塊,用于錄制用戶輸入的控制語音,提取并記錄所述控制語音的語音特征數(shù)據(jù); 第二錄制模塊,用于錄制用戶對(duì)應(yīng)所述控制語音的操作指令或應(yīng)答語音; 關(guān)聯(lián)設(shè)置模塊,用于設(shè)置所述語音特征數(shù)據(jù)與所述操作指令或應(yīng)答語音的關(guān)聯(lián),供用戶自定義電子設(shè)備的語音操作控制指令。
7.如權(quán)利要求6所述的裝置,其特征在于,所述第一錄制模塊具體包括 特征數(shù)據(jù)提取單元,用于將所述控制語音上傳至云端服務(wù)器進(jìn)行識(shí)別,提取所述語音特征數(shù)據(jù); 語音字符獲取單元,用于接收根據(jù)所述語音特征數(shù)據(jù)轉(zhuǎn)換得到可讀的語音字符; 記錄單元,用于顯示所述語音字符,在用戶確認(rèn)所述語音字符無誤時(shí)記錄所述語音字符或者源特征數(shù)據(jù)。
8.如權(quán)利要求6所述的裝置,其特征在于,所述第二錄制模塊具體包括 操作指令錄制單元,用于在判斷 為錄制所述操作指令時(shí), 顯示應(yīng)用程序列表,根據(jù)用戶選擇的應(yīng)用程序,跟蹤并記錄遙控按鍵操作全過程所對(duì)應(yīng)的遙控鍵值及應(yīng)用程序索引; 應(yīng)答語音錄制單元,用于在判斷為錄制所述應(yīng)答語音時(shí), 錄制語音應(yīng)答模式的同時(shí)獲取用戶輸入的應(yīng)答語音數(shù)據(jù),并生成應(yīng)答語音數(shù)據(jù)文件。
9.如權(quán)利要求6或8所述的裝置,其特征在于,所述關(guān)聯(lián)設(shè)置模塊具體包括 操作指令設(shè)置單元,用于根據(jù)錄制的所述操作指令,建立所述應(yīng)用程序索引、所述遙控鍵值與所述語音字符的對(duì)應(yīng)關(guān)系并存儲(chǔ)至數(shù)據(jù)庫(kù)中; 應(yīng)答語音設(shè)置單元,用于根據(jù)錄制的所述應(yīng)答語音,建立所述語音字符或者特征數(shù)據(jù)與所述應(yīng)答語音的對(duì)應(yīng)關(guān)系,并存儲(chǔ)至數(shù)據(jù)庫(kù)中。
10.如權(quán)利要求9所述的裝置,其特征在于,所述數(shù)據(jù)庫(kù)包括操作指令應(yīng)答語音庫(kù),所述操作指令應(yīng)答語音庫(kù)包括多個(gè)語音文件,所述語音文件關(guān)聯(lián)對(duì)應(yīng)的所述語音操作控制指令及應(yīng)用程序索引。
11.一種語音響應(yīng)方法,所述響應(yīng)方法包括對(duì)如權(quán)利要求I所述的語音控制方法中的控制語音進(jìn)行響應(yīng)的方法,其特征在于,所述響應(yīng)方法包括以下步驟 獲取用戶輸入的控制語音,并提取控制語音特征數(shù)據(jù); 檢索語音字符數(shù)據(jù)庫(kù),判斷在所述數(shù)據(jù)庫(kù)中是否能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式; 若是,則根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答; 若否,則切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入所述語音指令。
12.如權(quán)利要求11所述的響應(yīng)方法,其特征在于,所述根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答的步驟具體包括 判斷所述應(yīng)答方式所對(duì)應(yīng)的操作類型; 在所述應(yīng)答方式為操作應(yīng)答時(shí),執(zhí)行所述操作應(yīng)答指定的應(yīng)用程序和/或?qū)?yīng)的控制指令; 在所述應(yīng)答方式為語音應(yīng)答時(shí),播放對(duì)應(yīng)的語音文件。
13.一種語音響應(yīng)裝置,所述響應(yīng)裝置包括對(duì)如權(quán)利要求6所述的語音控制裝置進(jìn)行控制,其特征在于,所述響應(yīng)裝置包括 控制語音獲取模塊,用于獲取用戶輸入的控制語音,并提取控制語音特征數(shù)據(jù); 應(yīng)答方式獲取模塊,用于檢索語音字符數(shù)據(jù)庫(kù),判斷在所述數(shù)據(jù)庫(kù)中是否能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式; 第一應(yīng)答模塊,用于在所述數(shù)據(jù)庫(kù)中能夠找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式時(shí),根據(jù)所述應(yīng)答方式進(jìn)行應(yīng)答; 第二應(yīng)答模塊,用于在所述數(shù)據(jù)庫(kù)中不能找到所述語音特征數(shù)據(jù)對(duì)應(yīng)的應(yīng)答方式時(shí),切換至學(xué)習(xí)工作模式進(jìn)行相應(yīng)操作或提示用戶重新輸入所述語音指令。
14.如權(quán)利要求13所述的裝置,其特征在于,所述第一應(yīng)答模塊具體包括 應(yīng)答類型獲取單元,用于判斷所述應(yīng)答方式所對(duì)應(yīng)的操作類型;操作應(yīng)答單元,用于在所述應(yīng)答方式為操作應(yīng)答時(shí),執(zhí)行所述操作應(yīng)答指定的應(yīng)用程序和/或?qū)?yīng)的控制指令; 語音應(yīng)答單元,用于在所述應(yīng)答方式為語音應(yīng)答時(shí),播放對(duì)應(yīng)的語音文件。
全文摘要
本發(fā)明公開一種語音控制方法,包括錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù);錄制用戶對(duì)應(yīng)控制語音的操作指令或應(yīng)答語音;設(shè)置語音特征數(shù)據(jù)與操作指令或應(yīng)答語音的關(guān)聯(lián),供用戶自定義電子設(shè)備的語音操作控制指令。本發(fā)明還公開一種語音控制裝置及對(duì)控制語音進(jìn)行響應(yīng)的語音響應(yīng)方法及裝置。本發(fā)明通過錄制用戶輸入的控制語音,提取并記錄控制語音的語音特征數(shù)據(jù)、錄制該控制語音的操作指令或應(yīng)答語音、設(shè)置語音特征數(shù)據(jù)與操作指令或應(yīng)答語音的關(guān)聯(lián)并對(duì)該控制語音進(jìn)行響應(yīng)的方法,具有用戶可自定義語音識(shí)別控制并能和電視進(jìn)行交流的有益效果,使電視擁有學(xué)習(xí)的功能,提高了電視性能,提升了用戶體驗(yàn)。
文檔編號(hào)G10L15/02GK102842306SQ201210319278
公開日2012年12月26日 申請(qǐng)日期2012年8月31日 優(yōu)先權(quán)日2012年8月31日
發(fā)明者郭俊旺 申請(qǐng)人:深圳Tcl新技術(shù)有限公司