專利名稱:基于單詞級(jí)別的備選生成的語音識(shí)別系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于單詞級(jí)別的備選生成的語音識(shí)別系統(tǒng)及方法。
背景技術(shù):
若要通過語音識(shí)別來聽寫,且當(dāng)語音識(shí)別之后所輸出的備選文章較多時(shí),用戶難以通過觀看從差別微小的η個(gè)文章中選擇所需的文章。即,對(duì)于諸如移動(dòng)終端的用戶的終端來說,因該終端的大小的限制,難以同時(shí)顯示很多文章,并且對(duì)于用戶來說,當(dāng)查看η個(gè)文章時(shí),難以瞬間就判斷哪個(gè)文章才是恰當(dāng)?shù)奈恼隆?br>
發(fā)明內(nèi)容
本發(fā)明提出一種語音識(shí)別系統(tǒng)及方法,可更有效地提供通過語音識(shí)別的聽寫。
本發(fā)明提供一種語音識(shí)別系統(tǒng)及語音識(shí)別方法,該語音識(shí)別系統(tǒng)及語音識(shí)別方法向用戶顯示基于語音識(shí)別結(jié)果的文字串而提供給用戶,其中,將存在備選單詞的單詞與文字串中的其他單詞區(qū)分而顯示,并根據(jù)用戶對(duì)存在備選單詞的單詞的選擇,將該單詞變更為備選單詞而顯示出來,從而用戶通過一次選擇就能夠?qū)γ總€(gè)單詞修改語音識(shí)別結(jié)果。本發(fā)明提供一種語音識(shí)別系統(tǒng)及語音識(shí)別方法,該語音識(shí)別系統(tǒng)及語音識(shí)別方法在可對(duì)應(yīng)匹配于聲音信號(hào)的、具有不同概率的所有可能的單詞串中,選擇概率最高的單詞串,并在基于包含于被選擇的單詞串中的單詞開始被識(shí)別時(shí)刻及完成識(shí)別時(shí)刻的時(shí)間范圍內(nèi),針對(duì)聲音信號(hào)進(jìn)行識(shí)別而得出的不同的單詞中,將利用針對(duì)不同的單詞分別計(jì)算的可靠度來選擇的至少一個(gè)單詞設(shè)定為備選單詞,從而可提供更加準(zhǔn)確的針對(duì)每個(gè)單詞的結(jié)果O本發(fā)明提供一種語音識(shí)別系統(tǒng)及語音識(shí)別方法,該語音識(shí)別系統(tǒng)及語音識(shí)別方法提供可以同時(shí)刪除所顯示的全部單詞串的用戶界面,從而當(dāng)所顯示的單詞串為完全不相關(guān)的結(jié)果時(shí),使用戶可以直接輸入文章或者重新進(jìn)行語音識(shí)別過程。本發(fā)明提供一種語音識(shí)別系統(tǒng)及語音識(shí)別方法,該語音識(shí)別系統(tǒng)及語音識(shí)別方法針對(duì)作為通過語音識(shí)別制作的文章的單詞串,將表示相關(guān)單詞串是通過語音識(shí)別制作的簽名與單詞串同時(shí)顯示或者傳送,以使確認(rèn)所顯示的單詞串的用戶或者通過SMS、郵件等接收這種單詞串的用戶可以確認(rèn)相關(guān)單詞串是通過語音識(shí)別制作的。本發(fā)明提供的語音識(shí)別系統(tǒng),其特征在于包含語音識(shí)別結(jié)果確認(rèn)部,作為語音識(shí)別結(jié)果,當(dāng)提供單詞串以及針對(duì)包含于單詞串的至少一個(gè)單詞的備選單詞時(shí),確認(rèn)單詞串及備選單詞;以及單詞串顯示部,通過顯示裝置顯示單詞串,且將存在備選單詞的至少一個(gè)單詞與單詞串的其余單詞區(qū)別顯示,其中,當(dāng)用戶選擇區(qū)別顯示的單詞時(shí),單詞串顯示部將區(qū)別顯示的單詞變更為備選單詞進(jìn)行顯示。根據(jù)本發(fā)明的一方面,語音識(shí)別系統(tǒng)還可包含用戶界面部,以提供用于刪除顯示的全部的單詞串的用戶界面,并且,當(dāng)發(fā)生通過用戶界面的用戶的輸入時(shí),單詞串顯示部可刪除顯示的全部的單詞串。
根據(jù)本發(fā)明的另一方面,當(dāng)單詞串被顯示裝置顯示時(shí),或者單詞串被傳送到其他機(jī)器時(shí),可將表示單詞串是通過語音識(shí)別提供的簽名和單詞串同時(shí)顯示或傳送。根據(jù)本發(fā)明的另一方面,語音識(shí)別系統(tǒng)還可包含聲音信號(hào)傳送部,將通過輸入裝置輸入的聲音信號(hào)傳送至語音識(shí)別服務(wù)器;以及語音識(shí)別結(jié)果接收部,通過語音識(shí)別服務(wù)器接收對(duì)應(yīng)于聲音信號(hào)的語音識(shí)別結(jié)果。根據(jù)本發(fā)明的又一方面,語音識(shí)別系統(tǒng)還可包含語音識(shí)別結(jié)果生成部,用于生成對(duì)應(yīng)于通過輸入裝置輸入的聲音信號(hào)的語音識(shí)別結(jié)果。根據(jù)本發(fā)明的又一方面,單詞串可以被選擇為,在語音識(shí)別服務(wù)器中可對(duì)應(yīng)匹配于聲首 目號(hào)的、具有不同的概率的所有可能的單詞串中的概率最聞的單詞串。根據(jù)本發(fā)明又一方面,備選單詞可以被選擇為,在語音識(shí)別服務(wù)器中,在基于至少 一個(gè)單詞的開始識(shí)別的時(shí)刻及完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),根據(jù)聲音信號(hào)識(shí)別出的不同的單詞中的至少一個(gè)單詞。此時(shí),不同單詞中的至少一個(gè)單詞可基于針對(duì)不同單詞中的每個(gè)單詞所計(jì)算的可靠度進(jìn)行選擇。并且,時(shí)間范圍可通過開始識(shí)別的時(shí)刻和完成識(shí)別的時(shí)刻,以及賦予完成識(shí)別的時(shí)刻的已選定的允許時(shí)間值來確定。本發(fā)明提供的語音識(shí)別系統(tǒng),其特征在于包含語音識(shí)別結(jié)果生成部,確定對(duì)應(yīng)于聲音信號(hào)的單詞串及針對(duì)包含于單詞串中的至少一個(gè)單詞的備選單詞,生成為語音識(shí)別結(jié)果;以及語音識(shí)別結(jié)果提供部,向用戶終端提供語音識(shí)別結(jié)果,其中,在終端的顯示裝置中顯示單詞串,并且,將存在備選單詞的至少一個(gè)單詞和單詞串中的其余單詞區(qū)別顯示,且當(dāng)用戶在終端中選擇被區(qū)別顯示的單詞時(shí),被區(qū)別顯示的單詞變更為備選單詞而顯示。本發(fā)明提供的語音識(shí)別方法,其特征在于包含如下步驟作為語音識(shí)別結(jié)果,提供單詞串以及針對(duì)包含于單詞串的至少一個(gè)單詞的備選單詞時(shí),確認(rèn)單詞串及備選單詞;以及通過顯示裝置顯示單詞串,且將存在備選單詞的至少一個(gè)單詞和單詞串中的其余單詞區(qū)別顯示,其中,在顯示步驟中,當(dāng)用戶選擇被區(qū)別顯示的單詞時(shí),將被區(qū)別顯示的單詞變更為備選單詞進(jìn)行顯示。本發(fā)明提供的語音識(shí)別方法,其特征在于包含如下步驟確定對(duì)應(yīng)于聲音信號(hào)的單詞串及針對(duì)包含于單詞串中的至少一個(gè)單詞的備選單詞,生成為語音識(shí)別結(jié)果;以及向用戶終端提供所述語音識(shí)別結(jié)果,其中,在終端的顯示裝置中顯示單詞串,并且,將存在備選單詞的至少一個(gè)單詞和單詞串中的其余單詞區(qū)別顯示,且當(dāng)用戶在終端中選擇被區(qū)別顯示的單詞時(shí),將被區(qū)別顯示的單詞變更為備選單詞進(jìn)行顯示。本發(fā)明向用戶顯示并提供根據(jù)語音識(shí)別結(jié)果的文字串時(shí),將存在備選單詞的單詞和文字串中的其余單詞區(qū)別顯示,并根據(jù)針對(duì)存在備選單詞的單詞的用戶的選擇,將相關(guān)單詞變更為備選單詞進(jìn)行顯示,從而通過僅一次的選擇,就能夠使用戶對(duì)于每個(gè)單詞修改語音識(shí)別結(jié)果。本發(fā)明在可對(duì)應(yīng)匹配于聲音信號(hào)的、具有不同概率的所有可能的單詞串中選擇具有最高概率的單詞串,并在基于包含于被選擇的單詞串中的單詞的開始識(shí)別的時(shí)刻及完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),針對(duì)聲音信號(hào)進(jìn)行識(shí)別而得出的不同的單詞中,將利用針對(duì)不同單詞中的每個(gè)單詞所計(jì)算的可靠度來選擇的至少一個(gè)單詞設(shè)定為候選單詞,,從而可提供更加準(zhǔn)確的針對(duì)每個(gè)單詞的結(jié)果。本發(fā)明提供可以一次性刪除所顯示的全部單詞串的用戶界面,從而當(dāng)所顯示的單詞串為完全不相關(guān)的結(jié)果時(shí),用戶可以直接輸入文章或者重新進(jìn)行語音識(shí)別過程。本發(fā)明針對(duì)通過語音識(shí)別制作的文章的單詞串,將表示相關(guān)單詞串是通過語音識(shí)別制作的簽名和單詞串同時(shí)顯示或者傳送,以使確認(rèn)所顯示的單詞串的用戶或者通過SMS、郵件等接收這種單詞串的用戶可以確認(rèn)相關(guān)單詞串是通過語音識(shí)別制作的。
圖I是示出本發(fā)明的一實(shí)施例的用戶終端及語音識(shí)別服務(wù)器的圖。圖2是示出本發(fā)明的一實(shí)施例的在用戶終端的顯示屏上顯示有單詞串的情況的
一例。 圖3是示出本發(fā)明的一實(shí)施例的在用戶終端的顯示屏上根據(jù)用戶的選擇使顯示的單詞變更為備選單詞來顯示的情況的一例。圖4是示出本發(fā)明的一實(shí)施例的利用用戶界面來刪除所顯示的全部單詞串的情況的一例的圖。圖5是示出本發(fā)明的一實(shí)施例的在用戶終端上提供簽名的情況的一例。圖6是示出本發(fā)明的一實(shí)施例的針對(duì)聲音信號(hào)搜索出的單詞的圖。圖7是本發(fā)明的一實(shí)施例的用于說明語音識(shí)別系統(tǒng)的內(nèi)部構(gòu)成的框圖。圖8是示出本發(fā)明的一實(shí)施例的語音識(shí)別方法的流程圖。圖9是本發(fā)明的另一實(shí)施例的用于說明語音識(shí)別系統(tǒng)的內(nèi)部構(gòu)成的框圖。圖10是示出本發(fā)明的另一實(shí)施例的語音識(shí)別方法的流程圖。圖11是本發(fā)明的又一實(shí)施例的用于說明語音識(shí)別系統(tǒng)的內(nèi)部構(gòu)成的框圖。圖12是示出本發(fā)明的又一實(shí)施例的語音識(shí)別方法的流程圖。圖13是本發(fā)明的又一實(shí)施例的顯示由用戶選擇的單詞的備選單詞的畫面的一例。符號(hào)說明110為用戶終端,120為語音識(shí)別服務(wù)器。
具體實(shí)施例方式以下,參照附圖來詳細(xì)說明本發(fā)明的實(shí)施例。圖I是示出本發(fā)明的一實(shí)施例的用戶終端及語音識(shí)別服務(wù)器的圖。圖I示出用戶終端110和語音識(shí)別服務(wù)器120。用戶終端110可通過輸入裝置接收聲音信號(hào),并將其傳送到語音識(shí)別服務(wù)器120。此時(shí),語音識(shí)別服務(wù)器120可生成與所接收的聲音信號(hào)對(duì)應(yīng)的語音識(shí)別結(jié)果,從而傳送至用戶終端110。用戶終端110可確認(rèn)通過語音識(shí)別服務(wù)器120接收的語音識(shí)別結(jié)果所包含的單詞串和針對(duì)包含于單詞串中的至少一個(gè)單詞的備選單詞,并通過顯示裝置顯示已確認(rèn)的單詞串,但是可將存在備選單詞的至少一個(gè)單詞顯示為能夠和單詞串中的其余單詞區(qū)分。圖2是示出本發(fā)明的一實(shí)施例的在用戶終端的顯示屏上顯示有單詞串的情況的一例的圖。圖2中所示的顯示屏200可對(duì)應(yīng)于通過圖I說明的用戶終端110的顯示屏中的一部分。在此,顯示屏200中顯示有包含如“清推薦一下安卓手機(jī)”的語音識(shí)別結(jié)果的單詞串。此時(shí),可將包含于單詞串的單詞中存在備選單詞的單詞與包含于單詞串的其余單詞區(qū)別顯示。即,圖2中示出存在備選單詞的單詞“安卓”、“一下”及“清”標(biāo)示上下劃線而顯示的情況,以區(qū)別于不存在備選單詞的單詞“手機(jī)”以及“推薦”。再次參考圖1,當(dāng)區(qū)別顯示的單詞被用戶選擇時(shí),用戶終端110可將區(qū)別顯示的單詞變更為備選單詞而顯示。在此,單詞被用戶選擇可意味著相關(guān)單詞是通過用戶終端110所提供的用戶界面而被選擇的。例如,用戶可在觸摸板中觸摸相關(guān)單詞所顯示的位置,以使相關(guān)單詞被用戶所選擇。圖3是示出本發(fā)明的一實(shí)施例的在用戶終端的顯示屏上根據(jù)用戶的選擇使顯示的單詞變更為備選單詞來顯示的情況的一例。圖3 所示的顯示屏310、320、330可分別對(duì)應(yīng)于通過圖I說明的用戶終端110的顯示屏中的一部分。首先,顯示屏310中顯示有包含如“清推薦一下安卓手機(jī)”的最初語音識(shí)別結(jié)果的單詞串。此時(shí),當(dāng)用戶選擇單詞“清”時(shí),如顯示屏320所示,單詞“清”可變更顯示為“請(qǐng)”。在這種情況下,已變更顯示的單詞“請(qǐng)”被標(biāo)上下劃線而顯示,以區(qū)別與不存在備選單詞的其余單詞。圖3中為了區(qū)別單詞使用了下劃線,但是下劃線僅僅是一個(gè)示例,可以使用諸如互不相同的字體大小、字體顏色或者字體類型等能夠區(qū)別單詞的所有方法中的至少一個(gè)方法。如顯示屏330所示,當(dāng)用戶再次選擇單詞“請(qǐng)”時(shí),單詞“請(qǐng)”可變更顯示為其次的其他備選單詞“青”。如顯示屏310所示,當(dāng)不存在其他備選單詞“青”時(shí),可再次變更顯示為包含在原單詞串中的單詞“清”。據(jù)此,本實(shí)施例中,作為提供包含于單詞串中的單詞的備選單詞的列表的替代方案,可根據(jù)用戶的選擇依次變更語音識(shí)別的備選單詞,并且這些備選單詞可基于語音識(shí)別的可靠度來排列,以可靠度逐漸降低的順序顯示。此時(shí),大多數(shù)情況下,通過一兩次變更即可顯示用戶所要表達(dá)的單詞的概率較高,與提供備選單詞的列表的方案相比,可向用戶有效地提供基于語音識(shí)別的聽寫(dictation)。在此,依據(jù)語音識(shí)別來計(jì)算單詞的可靠度的方法已眾所周知,可以使用這些已經(jīng)公開的各種方法中的一個(gè)方法來計(jì)算單詞的可靠度。并且,圖3中可通過用戶界面的“編輯”按鍵,向用戶提供可以直接編緝相關(guān)單詞的功能。再次參照?qǐng)D1,用戶終端110可以提供用于刪除顯示的全部的單詞串的用戶界面。即,可以提供一次性刪除所顯示的全部的單詞串的用戶界面,從而當(dāng)顯示的單詞串內(nèi)容為完全不相關(guān)的結(jié)果時(shí),可使用戶直接輸入文章或者重新進(jìn)行語音識(shí)別過程。圖4是示出本發(fā)明的一實(shí)施例的利用用戶界面來刪除所顯示的全部單詞串的情況的一例。圖4中所示的顯示屏410和420可對(duì)應(yīng)于通過圖I來說明的用戶終端110的顯不屏中的一部分。顯示屏410示出顯示有包含語音識(shí)別結(jié)果的單詞串的情況。此時(shí),當(dāng)用戶通過用戶終端Iio提供的用戶界面(“刪除”411)產(chǎn)生事件時(shí),可以刪除如顯示屏420所顯示的全部的單詞串。即,當(dāng)顯示有如“好奇心解決的損失30分到達(dá)”的與用戶要所表達(dá)的文章(單詞串)完全不同的文章時(shí),與其編輯這些文章,用戶可能更希望自己直接輸入文章或者重新進(jìn)行語音識(shí)別過程。
此時(shí),根據(jù)本實(shí)施例的用戶終端110向用戶提供諸如“刪除”411的用戶界面,并且當(dāng)用戶產(chǎn)生觸摸“刪除”411等事件時(shí),可以刪除所顯示的全部的文章。再次參照?qǐng)D1,用戶終端110可將針對(duì)語音識(shí)別的簽名包含于通過語音識(shí)別來制作的文章(單詞串)中。此時(shí),針對(duì)語音識(shí)別的簽名可表示相關(guān)文章是通過語音識(shí)別而制作的。例如,當(dāng)用戶利用SMS或者郵件等將通過語音識(shí)別而制作的文章提供給其他用戶的時(shí)候,即使相關(guān)文章存在打字錯(cuò)誤或者差錯(cuò),其他用戶也可以直接確認(rèn)出該文章是通過語音識(shí)別而制作的。圖5是示出本發(fā)明的一實(shí)施例的在用戶終端上提供簽名的情況的一例。圖5中所示的顯示屏510可對(duì)應(yīng)于通過圖I說明的用戶終端110的顯示屏中的一部分。此時(shí),顯示屏510顯示“打算用安卓手機(jī)看電影。By Speech”,不僅顯示“打算用安卓手機(jī)看電影?!钡膯卧~串,同時(shí)還顯示簽名“By Speech”。即,通過這種簽名,用戶可容易掌握相關(guān)單詞串是通過語音識(shí)別來制作的文章的。 再次回到圖1,如上所述,語音識(shí)別服務(wù)器120能夠確定與通過用戶終端110接收的聲音信號(hào)對(duì)應(yīng)的單詞串以及備選單詞,并將其作為語音識(shí)別結(jié)果而提供給用戶終端110。此時(shí),語音識(shí)別服務(wù)器120可搜索能夠?qū)?yīng)匹配于聲音信號(hào)的盡可能全部的單詞串,并在具有不同概率的全部的單詞串中選擇概率最高的單詞串選擇為將要包含在語音識(shí)別結(jié)果中的單詞串。并且,語音識(shí)別服務(wù)器120可在基于至少一個(gè)單詞的開始識(shí)別的時(shí)刻以及完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),從根據(jù)聲音信號(hào)來識(shí)別的不同的單詞中,可選擇至少一個(gè)單詞作為將要包含于語音識(shí)別結(jié)果的備選單詞。此時(shí),在不同的單詞中,可基于針對(duì)每個(gè)不同的單詞計(jì)算的可靠度來選擇至少一個(gè)單詞,時(shí)間范圍可通過開始識(shí)別的時(shí)刻以及完成識(shí)別的時(shí)刻,還有賦予完成識(shí)別的時(shí)刻的已選定的允許時(shí)間值來確定。圖6是示出本發(fā)明的一實(shí)施例的搜索針對(duì)聲音信號(hào)的單詞的圖。圖6中箭頭610可表示時(shí)間的推移,方框的長(zhǎng)度可表示相關(guān)單詞被識(shí)別的時(shí)間范圍。此時(shí),在互不相同的時(shí)間范圍內(nèi)被識(shí)別的相同的單詞,即,圖6中“草莓”⑴和“草莓”(2),還有“汁”⑴和“汁”(2)的開始識(shí)別時(shí)刻雖然相同,但是結(jié)束識(shí)別的時(shí)間不同,此情況為,語音識(shí)別器依據(jù)概率在相關(guān)時(shí)間段中搜索出概率最高的單詞時(shí)偶然出現(xiàn)相同單詞的情況。首先,假設(shè)用戶的發(fā)音內(nèi)容為“草莓之”。即,當(dāng)用戶發(fā)出“草莓之”的音,使得圖I的用戶終端110通過輸入裝置接收包含“草莓之”的聲音信號(hào),并將其傳送到語音識(shí)別服務(wù)器120時(shí),語音識(shí)別服務(wù)器120能夠通過分析聲音信號(hào)來確認(rèn)所有可能的單詞串,從而選擇概率最高的單詞串。此時(shí),圖6中示出作為概率最高的單詞串選擇了組合單詞“草莓”(I)和單詞“汁”(2)的“草莓汁”的情況。在這種情況下,語音識(shí)別服務(wù)器120可以確定分別針對(duì)包含在具有最高概率的單詞串中的單詞“草莓”(I)和“汁”(2)的備選單詞。即,分別針對(duì)“草莓”(I)和“汁”(2)的包含在相關(guān)時(shí)間范圍內(nèi)的不同的單詞,可計(jì)算各單詞的可靠性,并以可靠性為順序提取η個(gè)單詞作為備選單詞。在此,相關(guān)時(shí)間分為可通過開始識(shí)別時(shí)刻和完成識(shí)別時(shí)刻以及賦予完成識(shí)別時(shí)刻的已選定的允許時(shí)間值來確定。例如,為了取得針對(duì)單詞“汁”(2)的備選單詞,語音識(shí)別服務(wù)器120可針對(duì)單詞“汁”(2),確認(rèn)包含在確定的時(shí)間范圍內(nèi)的不同的單詞。此時(shí),包含于時(shí)間范圍內(nèi)的不同單詞可以包括如下單詞,即包含對(duì)“汁”(2)開始識(shí)別的時(shí)刻至在對(duì)單詞“汁”(2)完成識(shí)別的時(shí)刻上賦予已選定的允許時(shí)間值的時(shí)刻為止的時(shí)間范圍內(nèi)且開始時(shí)間相同的單詞。在這種情況下,可由語音識(shí)別服務(wù)器120確定允許時(shí)間值(例如30ms)。此時(shí),當(dāng)開始時(shí)刻相同,但是完成時(shí)間相比對(duì)“汁”⑵的識(shí)別完成的時(shí)間短已選定的允許時(shí)間值以上,且在相關(guān)時(shí)間范圍內(nèi)識(shí)別出另一單詞時(shí),也可以組合識(shí)別出的各單詞,以確定為一個(gè)備選單詞。S卩,上述例子中,可以給出以下例子單詞“汁”⑴及單詞“兒”被組合為一個(gè)單詞“汁兒”,從而被選擇為”汁”(2)的備選單詞,或者“汁”(I)及單詞“耳”被組合為一個(gè)單詞“汁耳”,從而被選擇為“汁”(2)的備選單詞。并且,單詞“之”及“值”還有“至”可被選擇為“汁”⑵的備選單詞。即,圖6中示出,組合單詞“汁”⑴和單詞“爾”的“汁爾”因超過時(shí)間范圍的關(guān)系,而未被選擇為備選單詞的一例。當(dāng)減少允許時(shí)間值而進(jìn)一步縮短時(shí)間范圍時(shí),也將進(jìn)一步縮短備選單詞的選擇范圍。
此時(shí),若被選擇的備選單詞的可靠度順序依次為“之”、“汁耳”、“至”、“值”以及“汁
兒”,則被選擇的備選單詞按照可靠度的順序包含于語音識(shí)別結(jié)果之中。S卩,參照?qǐng)DI及圖6,用戶終端110通過顯示裝置可以顯示“草莓汁”。在這種情況下,當(dāng)然也可以區(qū)別顯示存在備選單詞的單詞和不存在備選單詞的單詞。此時(shí),當(dāng)單詞“汁”被用戶所選擇時(shí),單詞“汁”可變更顯示為被確定為第一個(gè)順序的單詞“之”。并且,當(dāng)被變更的單詞“之”再次被用戶所選擇時(shí),單詞“之”可變更顯示為被確定為第二個(gè)順序的單詞“汁耳”。當(dāng)沒有更多可變更的備選單詞時(shí),可向用戶再次顯示最初被顯示的單詞或者可提供用戶直接編輯相關(guān)單詞的功能。據(jù)此,用戶不是在整體備選單詞的目錄中搜索所需的單詞,而是可通過選擇來確認(rèn)下一個(gè)備選單詞。如上所述,當(dāng)基于可靠度來選備選單詞時(shí),通常情況下,通過一到兩次的選擇即可顯示用戶所要表達(dá)的單詞,因此,用戶在單詞串中可簡(jiǎn)單、快速地編輯所要表達(dá)的特定單詞,而無需瀏覽全部的備選單詞。圖7是示出本發(fā)明的一實(shí)施例的用于說明語音識(shí)別系統(tǒng)的內(nèi)部構(gòu)成的框圖。如圖7所示,該語音識(shí)別系統(tǒng)700可包含語音識(shí)別結(jié)果確認(rèn)部730及單詞串顯示部740,根據(jù)需要,可選擇性的包含聲音信號(hào)傳送部710以及語音識(shí)別結(jié)果接收部720。當(dāng)語音識(shí)別系統(tǒng)700包含聲音信號(hào)傳送部710及語音識(shí)別結(jié)果接收部720時(shí),語音識(shí)別系統(tǒng)700可對(duì)應(yīng)于通過圖I說明的用戶終端110。聲音信號(hào)傳送部710將通過輸入裝置輸入的聲音信號(hào)傳送至語音識(shí)別服務(wù)器。例如,根據(jù)用戶的發(fā)聲的聲音信號(hào)可通過諸如麥克風(fēng)的輸入裝置輸入到語音識(shí)別系統(tǒng)700,而聲音信號(hào)傳送部710可將這些聲音信號(hào)傳送至語音識(shí)別服務(wù)器。在此,語音識(shí)別服務(wù)器可對(duì)應(yīng)于通過圖I說明的語音識(shí)別服務(wù)器120。語音識(shí)別結(jié)果接收部720通過語音識(shí)別服務(wù)器接收對(duì)應(yīng)于聲音信號(hào)的語音識(shí)別結(jié)果。在此,語音識(shí)別服務(wù)器中,可對(duì)應(yīng)匹配于聲音信號(hào)的具有各種概率的、所有可能的單詞串中概率最高的單詞串可被選擇為單詞串。并且,在所述語音識(shí)別服務(wù)器中,基于從所述至少一個(gè)單詞的開始識(shí)別的時(shí)刻到完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),根據(jù)所述聲音信號(hào)來識(shí)別的不同的單詞中,可選擇至少一個(gè)單詞來作為備選單詞。此時(shí),不同的單詞中的至少一個(gè)單詞可依據(jù)針對(duì)不同的單詞中的每個(gè)單詞所計(jì)算的可靠度來進(jìn)行選擇,時(shí)間范圍可根據(jù)開始識(shí)別時(shí)刻和完成識(shí)別時(shí)刻以及在完成識(shí)別的時(shí)刻賦予的已選定的允許時(shí)間值來確定。
當(dāng)作為語音識(shí)別結(jié)果,提供有單詞串及針對(duì)包含于單詞串中的至少一個(gè)單詞的備選單詞時(shí),語音識(shí)別結(jié)果確認(rèn)部730確認(rèn)單詞串及備選單詞。即,當(dāng)通過從語音識(shí)別服務(wù)器接收語音識(shí)別結(jié)果等過程,向語音識(shí)別系統(tǒng)700提供語音識(shí)別結(jié)果時(shí),語音識(shí)別系統(tǒng)700可通過語音識(shí)別結(jié)果確認(rèn)部730從這種被提供的語音識(shí)別結(jié)果中確認(rèn)單詞串和備選單詞。單詞串顯示部740通過顯示裝置顯示單詞串,但是將存在備選單詞的至少一個(gè)單詞和單詞串中的其余單詞區(qū)別而顯示。此時(shí),當(dāng)區(qū)別顯示的單詞被用戶所選時(shí),單詞串顯示部740將區(qū)別顯示的單詞變更為備選單詞并顯示。當(dāng)存在另一備選單詞,且變更的備選單詞再次被用戶所選時(shí),變更后的備選單詞可再次變更為另一備選單詞。并且,語音識(shí)別系統(tǒng)700還可包含用戶界面部(未圖示),以提供用于刪除所顯示的全部單詞串的用戶界面。并且,當(dāng)產(chǎn)生通過用戶界面的用戶的輸入時(shí),單詞串顯示部740可刪除所顯示的全部單詞串。而且,當(dāng)通過顯示裝置顯示單詞串,或者單詞串被傳送至其他設(shè)備時(shí),用于表示單詞串是通過語音識(shí)別提供的簽名可與單詞串一同顯示或者傳送。
圖8是示出本發(fā)明的一實(shí)施例的語音識(shí)別方法的流程圖。根據(jù)本實(shí)施例的語音識(shí)別方法可由通過圖7說明的語音識(shí)別系統(tǒng)700來執(zhí)行。圖8中說明通過語音識(shí)別系統(tǒng)700執(zhí)行各步驟的過程,從而說明根據(jù)本發(fā)明的語音識(shí)別方法。此時(shí),也可根據(jù)需要,由語音識(shí)別系統(tǒng)700選擇性地執(zhí)行步驟810及步驟820。在步驟810中,語音識(shí)別系統(tǒng)700將通過輸入裝置輸入的聲音信號(hào)傳送至語音識(shí)別服務(wù)器。例如,根據(jù)用戶的發(fā)聲的聲音信號(hào)可通過諸如麥克風(fēng)的輸入裝置來輸入到語音識(shí)別系統(tǒng)700,而語音識(shí)別系統(tǒng)700可將該聲音信號(hào)傳送至語音識(shí)別服務(wù)器。在此,語音識(shí)別服務(wù)器可對(duì)應(yīng)于通過圖I說明的語音識(shí)別服務(wù)器120。在步驟820中,語音識(shí)別系統(tǒng)700通過語音識(shí)別服務(wù)器接收對(duì)應(yīng)于聲音信號(hào)的語音識(shí)別結(jié)果。在此,語音識(shí)別服務(wù)器中,可對(duì)應(yīng)匹配于聲音信號(hào)的具有各種概率的、所有可能的單詞串中概率最高的單詞串可被選擇為單詞串。并且,在所述語音識(shí)別服務(wù)器中,基于從所述至少一個(gè)單詞的開始識(shí)別的時(shí)刻到完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),根據(jù)所述聲音信號(hào)來識(shí)別的不同的單詞中,可選擇至少一個(gè)單詞來作為備選單詞。此時(shí),不同的單詞中的至少一個(gè)單詞可依據(jù)針對(duì)不同的單詞中的每個(gè)單詞所計(jì)算的可靠度來進(jìn)行選擇,時(shí)間范圍可根據(jù)開始識(shí)別時(shí)刻和完成識(shí)別時(shí)刻以及在完成識(shí)別的時(shí)刻賦予的已選定的允許時(shí)間值來確定。在步驟830,當(dāng)作為語音識(shí)別結(jié)果,提供有單詞串及針對(duì)包含于單詞串中的至少一個(gè)單詞的備選單詞時(shí),語音識(shí)別系統(tǒng)700確認(rèn)單詞串及備選單詞。即,當(dāng)通過從語音識(shí)別服務(wù)器接收語音識(shí)別結(jié)果等過程,向語音識(shí)別系統(tǒng)700提供語音識(shí)別結(jié)果時(shí),語音識(shí)別系統(tǒng)700可從這種被提供的語音識(shí)別結(jié)果中確認(rèn)單詞串和備選單詞。在步驟840,語音識(shí)別系統(tǒng)700通過顯示裝置顯示單詞串,但是將存在備選單詞的至少一個(gè)單詞和單詞串中的其余單詞區(qū)別而顯示。此時(shí),當(dāng)區(qū)別顯示的單詞被用戶所選時(shí),單詞串顯示部740將區(qū)別顯示的單詞變更為備選單詞并顯示。當(dāng)存在另一備選單詞,且變更的備選單詞再次被用戶所選時(shí),變更后的備選單詞可再次變更為另一備選單詞。并且,語音識(shí)別系統(tǒng)700還可包含用戶界面部(未圖示),以提供用于刪除所顯示的全部單詞串的用戶界面。并且,當(dāng)產(chǎn)生通過用戶界面的用戶的輸入時(shí),單詞串顯示部740可刪除所顯示的全部單詞串。而且,當(dāng)通過顯示裝置顯示單詞串,或者單詞串被傳送至其他設(shè)備時(shí),用于表示單詞串是通過語音識(shí)別提供的簽名可與單詞串一同顯示或者傳送。圖9是示出本發(fā)明的另一實(shí)施例的用于說明語音識(shí)別系統(tǒng)的內(nèi)部構(gòu)成的框圖。如圖9所示,根據(jù)本實(shí)施例的語音識(shí)別系統(tǒng)900可包含語音識(shí)別結(jié)果生成部920及語音識(shí)別結(jié)果提供部930,根據(jù)需要,可選擇性的包含聲音信號(hào)接收部910。當(dāng)語音識(shí)別系統(tǒng)900包含聲音信號(hào)接收部910時(shí),語音識(shí)別系統(tǒng)900可對(duì)應(yīng)于通過圖I說明的語音識(shí)別服務(wù)器120。聲音信號(hào)接收部910通過終端接收由終端的輸入裝置所輸入的聲音信號(hào)。在此,終端作為用戶終端,可對(duì)應(yīng)于通過圖I說明的用戶終端110。即,當(dāng)用戶發(fā)出的聲音信號(hào)通過用戶終端110的輸入裝置輸入時(shí),用戶終端110可將輸入的聲音信號(hào)傳送到語音識(shí)別系統(tǒng)900,而語音識(shí)別系統(tǒng)900可接收被傳送的聲音信號(hào)。語音識(shí)別結(jié)果生成部920可確定對(duì)應(yīng)于聲音信號(hào)的單詞串以及針對(duì)包含于單詞 串中的至少一個(gè)單詞的備選單詞,以生成語音識(shí)別結(jié)果。在此,語音識(shí)別結(jié)果生成部920可將對(duì)應(yīng)匹配于聲音信號(hào)的具有各種概率的、所有可能的單詞串中概率最高的單詞串選擇為將要包含于語音識(shí)別結(jié)果的單詞串。并且,所述語音識(shí)別結(jié)果生成部920基于從所述至少一個(gè)單詞的開始識(shí)別的時(shí)刻到完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),從根據(jù)所述聲音信號(hào)來識(shí)別的不同的單詞中,可選擇至少一個(gè)單詞來作為將要包含于語音識(shí)別結(jié)果的備選單詞。此時(shí),不同的單詞中的至少一個(gè)單詞可依據(jù)針對(duì)不同的單詞中的每個(gè)單詞所計(jì)算的可靠度來進(jìn)行選擇,時(shí)間范圍可根據(jù)開始識(shí)別時(shí)刻和完成識(shí)別時(shí)刻以及在完成識(shí)別的時(shí)刻賦予的已選定的允許時(shí)間值來確定。語音識(shí)別結(jié)果提供部930向用戶終端提供語音識(shí)別結(jié)果。此時(shí),通過終端的顯示裝置顯示被提供的包含在語音識(shí)別結(jié)果中的單詞串,且將存在備選單詞的至少一個(gè)單詞和單詞串中的其余單詞區(qū)別而顯示。并且,當(dāng)區(qū)別顯示的單詞在終端被用戶所選時(shí),區(qū)別顯示的單詞變更為備選單詞并顯示。在該終端上還可提供用于刪除所顯示的全部單詞串的用戶界面,此時(shí),當(dāng)用戶通過用戶界面輸入時(shí),可刪除所顯示的全部單詞串。而且,當(dāng)通過顯示裝置顯示單詞串,或者通過終端將單詞串傳送至其他設(shè)備時(shí),用于表示單詞串是通過語音識(shí)別提供的簽名可與單詞串一同顯示或者傳送。圖10是示出本發(fā)明的另一實(shí)施例中的語音識(shí)別方法的流程圖。根據(jù)本實(shí)施例的語音識(shí)別方法可由通過圖9說明的語音識(shí)別系統(tǒng)900來執(zhí)行。圖10中說明通過語音識(shí)別系統(tǒng)900執(zhí)行各步驟的過程,從而說明根據(jù)本發(fā)明的語音識(shí)別方法。此時(shí),也可根據(jù)需要,由語音識(shí)別系統(tǒng)900選擇性地執(zhí)行步驟1010。在步驟1010,語音識(shí)別系統(tǒng)900通過終端接收由終端的輸入裝置所輸入的聲音信號(hào)。在此,終端作為用戶終端,可對(duì)應(yīng)于通過圖I說明的用戶終端110。即,當(dāng)用戶發(fā)出的聲音信號(hào)通過用戶終端110的輸入裝置輸入時(shí),用戶終端110可將輸入的聲音信號(hào)傳送到語音識(shí)別系統(tǒng)900,而語音識(shí)別系統(tǒng)900可接收被傳送的聲音信號(hào)。在步驟1020,語音識(shí)別系統(tǒng)900可確定對(duì)應(yīng)于聲音信號(hào)的單詞串以及針對(duì)包含于單詞串中的至少一個(gè)單詞的備選單詞,從而生成為語音識(shí)別結(jié)果。在此,語音識(shí)別系統(tǒng)900可將對(duì)應(yīng)匹配于聲音信號(hào)的具有各種概率的、所有可能的單詞串中概率最高的單詞串選擇為將要包含于語音識(shí)別結(jié)果的單詞串。并且,所述語音識(shí)別系統(tǒng)900基于從所述至少一個(gè)單詞的開始識(shí)別的時(shí)刻到完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),從根據(jù)所述聲音信號(hào)來識(shí)別的不同的單詞中,可選擇至少一個(gè)單詞來作為將要包含于語音識(shí)別結(jié)果的備選單詞。此時(shí),不同的單詞中的至少一個(gè)單詞可依據(jù)針對(duì)不同的單詞中的每個(gè)單詞所計(jì)算的可靠度來進(jìn)行選擇,時(shí)間范圍可根據(jù)開始識(shí)別時(shí)刻和完成識(shí)別時(shí)刻以及在完成識(shí)別的時(shí)刻賦予的已選定的允許時(shí)間值來確定。在步驟1030中,語音識(shí)別系統(tǒng)900向用戶終端提供語音識(shí)別結(jié)果。此時(shí),通過終端的顯示裝置顯示被提供的包含在語音識(shí)別結(jié)果中的單詞串,且將存在備選單詞的至少一個(gè)單詞和單詞串中的其余單詞區(qū)別而顯示。并且,當(dāng)區(qū)別顯示的單詞在終端被用戶所選時(shí),區(qū)別顯示的單詞變更為備選單詞而顯示。在該終端上還可提供用于刪除所顯示的全部單詞串的用戶界面,此時(shí),當(dāng)用戶通過用戶界面輸入時(shí),可刪除所顯示的全部單詞串。 而且,當(dāng)通過顯示裝置顯示單詞串,或者將單詞串通過終端傳送至其他設(shè)備時(shí),用于表示單詞串是通過語音識(shí)別提供的簽名可與單詞串一同顯示或者傳送。圖11是示出本發(fā)明的又一實(shí)施例的用于說明語音識(shí)別系統(tǒng)的內(nèi)部構(gòu)成的框圖。根據(jù)本實(shí)施例的語音識(shí)別系統(tǒng)1100與圖I說明的用戶終端110及語音識(shí)別服務(wù)器120之間的區(qū)別在于,在一個(gè)系統(tǒng)中執(zhí)行語音識(shí)別結(jié)果的生成和顯示。如圖11所示,這種語音識(shí)別系統(tǒng)1100包含語音識(shí)別結(jié)果確認(rèn)部1120及單詞串顯示部1130,根據(jù)需要,可選擇性的包含語音識(shí)別結(jié)果生成部1110。此時(shí),當(dāng)不包含語音識(shí)別結(jié)果生成部1110時(shí),相當(dāng)于圖7的語音識(shí)別系統(tǒng)700不包含聲音信號(hào)傳送部710及語音識(shí)別結(jié)果接收部720,并且語音識(shí)別結(jié)果確認(rèn)部1120及單詞串顯示部1130可與語音識(shí)別結(jié)果確認(rèn)部730及單詞串顯示部740進(jìn)行相同的操作,因此省略對(duì)語音識(shí)別結(jié)果確認(rèn)部1120及單詞串顯示部1130的重復(fù)的說明。語音識(shí)別結(jié)果生成部1110生成語音識(shí)別結(jié)果,該語音識(shí)別結(jié)果對(duì)應(yīng)于通過輸入裝置輸入的聲音信號(hào)。在此,因?qū)τ谏烧Z音識(shí)別結(jié)果的方法已進(jìn)行了詳細(xì)的說明,因此省略重復(fù)的說明。圖12是示出本發(fā)明的又一實(shí)施例的語音識(shí)別方法的流程圖。根據(jù)本實(shí)施例的語音識(shí)別方法可通過由圖I說明的語音識(shí)別系統(tǒng)1100來執(zhí)行。此時(shí),可根據(jù)需要,由語音識(shí)別系統(tǒng)1100來執(zhí)行步驟1210。此時(shí),當(dāng)不執(zhí)行步驟1210時(shí),相當(dāng)于圖8的語音識(shí)別系統(tǒng)700不執(zhí)行步驟810及步驟820,并且步驟1220及步驟1230與步驟830及步驟840相同,因此省略對(duì)步驟1220及步驟1230的重復(fù)的說明。在步驟1210,語音識(shí)別系統(tǒng)1100生成語音識(shí)別結(jié)果,該語音識(shí)別結(jié)果對(duì)應(yīng)于通過輸入裝置來輸入的聲音信號(hào)。在此,因?qū)τ谏烧Z音識(shí)別結(jié)果的方法已進(jìn)行了詳細(xì)的說明,因此省略其重復(fù)的說明。在圖7至圖12中省略的內(nèi)容可參考對(duì)圖I至圖6的說明。在根據(jù)本發(fā)明又一實(shí)施例的語音識(shí)別系統(tǒng)及語音識(shí)別方法中,還能夠以列表的形式向用戶提供備選單詞。例如,可對(duì)應(yīng)于通過圖I說明的用戶終端110的語音識(shí)別系統(tǒng)將通過輸入裝置輸入的聲音信號(hào)傳送至語音識(shí)別服務(wù)器,并且可通過語音識(shí)別服務(wù)器接收對(duì)應(yīng)于聲音信號(hào)的語音識(shí)別結(jié)果。此時(shí),當(dāng)提供有單詞串及包含于單詞串的至少一個(gè)單詞的備選單詞以作為語音識(shí)別結(jié)果時(shí),語音識(shí)別系統(tǒng)確認(rèn)單詞串及備選單詞,從而通過顯示裝置顯示單詞串,且能夠?qū)⒋嬖趥溥x單詞的至少一個(gè)單詞與單詞串中的其余單詞區(qū)別而顯示。此時(shí),當(dāng)用戶選擇區(qū)別顯示的單詞時(shí),語音識(shí)別系統(tǒng)可用列表形式顯示針對(duì)區(qū)別顯示的單詞的備選單詞。作為一例,圖7的單詞串顯示部740在區(qū)別顯示的單詞被用戶所選時(shí),可顯示包含被區(qū)別顯示的單詞的備選單詞中的至少一個(gè)備選單詞的列表。在這種情況下,單詞串顯示部740將區(qū)別顯示的單詞變更顯示為由用戶在所顯示的列表中選擇的備選單詞。該方案也可同樣適用于其他實(shí)施例。圖13是示出本發(fā)明的又一實(shí)施例的顯示由用戶選 擇的單詞的備選單詞的屏幕的一例。在此,顯示屏1300顯示由用戶所選的單詞“清”1310和單詞“清”的備選單詞(1320至1350)。用戶可從所提示的備選單詞(1320至1350)中選擇用于代替單詞“清” 1310的備選單詞。例如,在圖13的一例中,用戶可以選擇備選單詞“請(qǐng)” 1320,則語音識(shí)別系統(tǒng)將單詞“清” 1310變更為“請(qǐng)” 1320而進(jìn)行顯示。至此,當(dāng)用戶選擇區(qū)別顯示的單詞時(shí),語音識(shí)別系統(tǒng)以列表形式顯示針對(duì)區(qū)別顯示的單詞的備選單詞,并以用戶在顯示的備選單詞中所選的備選單詞更換最初區(qū)別顯示的單詞中的、由用戶所選的單詞并顯示出來。根據(jù)本發(fā)明的實(shí)施例,向用戶顯示并提供根據(jù)語音識(shí)別結(jié)果的單詞串的同時(shí),將存在備選單詞的單詞和單詞串中的其余單詞區(qū)別而顯示,并根據(jù)針對(duì)存在備選單詞的單詞的用戶的選擇,使相關(guān)單詞變更為備選單詞而顯示出來,從而用戶可通過一次的選擇,就能夠?qū)γ總€(gè)單詞修改語音識(shí)別結(jié)果。并且,在可對(duì)應(yīng)匹配于聲音信號(hào)的、具有不同概率的所有可能的單詞串中選擇具有最聞概率的單詞串,并在基于包含在被選擇的單詞串中的單詞的開始識(shí)別的時(shí)刻及完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),針對(duì)聲音信號(hào)識(shí)別成不同單詞的單詞中,利用針對(duì)不同的單詞中的每個(gè)單詞所計(jì)算的可靠度來選擇至少一個(gè)單詞并設(shè)定成備選單詞,從而可提供更加準(zhǔn)確的針對(duì)每個(gè)單詞的結(jié)果。而且,可提供一次性刪除顯示的全部單詞串的用戶界面,從而當(dāng)顯示的單詞串為完全沒有相關(guān)的結(jié)果時(shí),可使用戶直接輸入文章或者重新進(jìn)行語音識(shí)別過程,并且針對(duì)通過語音識(shí)別制作的文章的單詞串,將表示相關(guān)單詞串是通過語音識(shí)別制作的簽名和單詞串一同顯示或傳送,從而可使確認(rèn)所顯示的單詞串的用戶或者以SMS、郵件等接收該單詞串的用戶可以確認(rèn)相關(guān)單詞串是通過語音識(shí)別制作的。如上所述,本發(fā)明雖然以有限的實(shí)施例和附圖進(jìn)行說明,但是本發(fā)明不限于上述實(shí)施例,本發(fā)明所屬領(lǐng)域的具有通常知識(shí)的技術(shù)人員可能夠通過這些記載進(jìn)行多種修改以及變形。因此,本發(fā)明的范圍不限于所說明的實(shí)施例,應(yīng)當(dāng)以權(quán)利要求范圍和與該權(quán)利要求范圍等同的范圍來限定。
權(quán)利要求
1.一種語音識(shí)別系統(tǒng),其特征在于包含 語音識(shí)別結(jié)果確認(rèn)部,作為語音識(shí)別結(jié)果,當(dāng)提供單詞串以及針對(duì)包含于所述單詞串的至少一個(gè)單詞的備選單詞時(shí),確認(rèn)所述單詞串及所述備選單詞;以及 單詞串顯示部,通過顯示裝置顯示所述單詞串,且將存在所述備選單詞的至少一個(gè)單詞與所述單詞串的其余單詞區(qū)別而進(jìn)行顯示, 其中,當(dāng)用戶選擇被區(qū)別顯示的單詞時(shí),所述單詞串顯示部將區(qū)別顯示的單詞變更為所述備選單詞并進(jìn)行顯示。
2.根據(jù)權(quán)利要求I所述的語音識(shí)別系統(tǒng),其特征在于,還包含用戶界面部,以提供用于刪除所述顯示的全部單詞串的用戶界面, 其中,當(dāng)產(chǎn)生通過所述用戶界面的用戶的輸入時(shí),所述單詞串顯示部刪除所述顯示的全部單詞串。
3.根據(jù)權(quán)利要求I所述的語音識(shí)別系統(tǒng),其特征在于,當(dāng)通過所述顯示裝置顯示所述單詞串,或者所述單詞串被傳送到其他設(shè)備時(shí),將用于表示所述單詞串是通過語音識(shí)別提供的簽名與所述單詞串一同顯示或發(fā)送。
4.根據(jù)權(quán)利要求I所述的語音識(shí)別系統(tǒng),其特征在于,還包含 聲音信號(hào)傳送部,將通過輸入裝置輸入的聲音信號(hào)傳送至語音識(shí)別服務(wù)器;以及 語音識(shí)別結(jié)果接收部,通過所述語音識(shí)別服務(wù)器接收對(duì)應(yīng)于所述聲音信號(hào)的所述語音識(shí)別結(jié)果。
5.根據(jù)權(quán)利要求I所述的語音識(shí)別系統(tǒng),其特征在于,還包含語音識(shí)別結(jié)果生成部,用于生成對(duì)應(yīng)于通過輸入裝置輸入的聲音信號(hào)的所述語音識(shí)別結(jié)果。
6.根據(jù)權(quán)利要求I所述的語音識(shí)別系統(tǒng),其特征在于,所述單詞串被選擇為,在語音識(shí)別服務(wù)器中,能夠?qū)?yīng)匹配于所述聲音信號(hào)的、具有不同的概率的所有可能的單詞串中具有最聞概率的單詞串。
7.根據(jù)權(quán)利要求I所述的語音識(shí)別系統(tǒng),其特征在于,所述備選單詞被選擇為,在語音識(shí)別服務(wù)器中,在基于所述至少一個(gè)單詞的開始識(shí)別的時(shí)刻及完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),從根據(jù)所述聲音信號(hào)識(shí)別的不同的單詞中的至少一個(gè)單詞。
8.根據(jù)權(quán)利要求7所述的語音識(shí)別系統(tǒng),其特征在于,所述不同的單詞中的至少一個(gè)單詞基于針對(duì)所述不同的單詞中的每個(gè)單詞所計(jì)算的可靠度而被選擇。
9.根據(jù)權(quán)利要求7所述的語音識(shí)別系統(tǒng),其特征在于,所述時(shí)間范圍通過所述開始識(shí)別的時(shí)刻和完成識(shí)別的時(shí)刻以及賦予至所述完成識(shí)別的時(shí)刻的已選定的允許時(shí)間值來確定。
10.一種語音識(shí)別系統(tǒng),其特征在于包含 語音識(shí)別結(jié)果生成部,確定對(duì)應(yīng)于聲音信號(hào)的單詞串及針對(duì)包含于所述單詞串中的至少一個(gè)單詞的備選單詞,用以生成語音識(shí)別結(jié)果;以及 語音識(shí)別結(jié)果提供部,向用戶終端提供所述語音識(shí)別結(jié)果, 其中,在所述終端的顯示裝置中顯示所述單詞串, 并且,將存在所述備選單詞的至少一個(gè)單詞與所述單詞串中的其余單詞區(qū)別而顯示, 且當(dāng)所述用戶在所述終端中選擇區(qū)別顯示的單詞時(shí),使區(qū)別顯示的單詞變更為所述備選單詞并進(jìn)行顯示。
11.根據(jù)權(quán)利要求10所述的語音識(shí)別系統(tǒng),其特征在于,提供用于刪除顯示在所述終端的全部單詞串的用戶界面, 且當(dāng)產(chǎn)生通過所述用戶界面的用戶的輸入時(shí),刪除顯示的全部的單詞串。
12.根據(jù)權(quán)利要求10所述的語音識(shí)別系統(tǒng),其特征在于,當(dāng)通過所述顯示裝置顯示所述單詞串,或者所述單詞串從所述終端傳送到其他設(shè)備時(shí),用于表示所述單詞串是通過語音識(shí)別而提供的簽名與所述單詞串一同顯示或傳送。
13.根據(jù)權(quán)利要求10所述的語音識(shí)別系統(tǒng),其特征在于,還包含聲音信號(hào)接收部,以用于通過所述終端接收由所述終端的輸入裝置輸入的聲音信號(hào)。
14.根據(jù)權(quán)利要求10所述的語音識(shí)別系統(tǒng),其特征在于,所述語音識(shí)別結(jié)果生成部在能夠?qū)?yīng)匹配于所述聲音信號(hào)的、具有不同概率的所有可能的單詞串中選擇具有最高概率的單詞串作為將包含于所述語音識(shí)別結(jié)果中的單詞串。
15.根據(jù)權(quán)利要求10所述的語音識(shí)別系統(tǒng),其特征在于,所述語音識(shí)別結(jié)果生成部在基于所述至少一個(gè)單詞的開始識(shí)別的時(shí)刻及完成識(shí)別的時(shí)刻的時(shí)間范圍內(nèi),從根據(jù)所述聲音信號(hào)識(shí)別的不同的單詞中選擇至少一個(gè)單詞作為將包含于所述語音識(shí)別結(jié)果中的備選單詞。
16.根據(jù)權(quán)利要求15所述的語音識(shí)別系統(tǒng),其特征在于,所述不同的單詞中的至少一個(gè)單詞基于針對(duì)所述不同的單詞中的每個(gè)單詞所計(jì)算的可靠度而被選擇。
17.根據(jù)權(quán)利要求15所述的語音識(shí)別系統(tǒng),其特征在于,所述時(shí)間范圍通過所述開始識(shí)別的時(shí)刻和完成識(shí)別的時(shí)刻以及賦予至所述完成識(shí)別的時(shí)刻的已選定的允許時(shí)間值來確定。
18.一種語音識(shí)別系統(tǒng),其特征在于包含 語音識(shí)別結(jié)果確認(rèn)部,作為語音識(shí)別結(jié)果,當(dāng)提供單詞串以及針對(duì)包含于所述單詞串的至少一個(gè)單詞的備選單詞時(shí),確認(rèn)所述單詞串及所述備選單詞;以及 單詞串顯示部,通過顯示裝置顯示所述單詞串,且將存在所述備選單詞的至少一個(gè)單詞與所述單詞串中的其余單詞區(qū)別而顯示, 其中,所述單詞串顯示部在用戶選擇被區(qū)別顯示的單詞時(shí),顯示包含被區(qū)別顯示的單詞的備選單詞中的至少一個(gè)備選單詞的列表。
19.一種語音識(shí)別系統(tǒng),其特征在于包含 語音識(shí)別結(jié)果生成部,確定對(duì)應(yīng)于聲音信號(hào)的單詞串及針對(duì)包含于所述單詞串中的至少一個(gè)單詞的備選單詞,用以生成語音識(shí)別結(jié)果;以及 語音識(shí)別結(jié)果提供部,向用戶終端提供所述語音識(shí)別結(jié)果, 其中,在所述終端的顯示裝置中顯示所述單詞串, 并且,將存在所述備選單詞的至少一個(gè)單詞與所述單詞串中的其余單詞區(qū)別而顯示, 且當(dāng)所述用戶在所述終端中選擇被區(qū)別顯示的單詞時(shí),顯示包含被區(qū)別顯示的單詞的備選單詞中的至少一個(gè)單詞的列表。
20.一種語音識(shí)別方法,其特征在于包含如下步驟 作為語音識(shí)別結(jié)果,當(dāng)提供單詞串以及針對(duì)包含于所述單詞串的至少一個(gè)單詞的備選單詞時(shí),確認(rèn)所述單詞串及所述備選單詞;以及 通過顯示裝置顯示所述單詞串,且將存在所述備選單詞的至少一個(gè)單詞與所述單詞串中的其余單詞區(qū)別而顯示, 其中,在通過顯示裝置顯示所述單詞串的步驟中,當(dāng)用戶選擇被區(qū)別顯示的單詞時(shí),使被區(qū)別顯示的單詞變更為所述備選單詞而顯示。
21.一種語音識(shí)別方法,其特征在于包含如下步驟 確定對(duì)應(yīng)于聲音信號(hào)的單詞串及針對(duì)包含于所述單詞串中的至少一個(gè)單詞的備選單詞,用以生成語音識(shí)別結(jié)果;以及 向用戶終端提供所述語音識(shí)別結(jié)果, 其中,在所述終端的顯示裝置中顯示所述單詞串, 并且,將存在所述備選單詞的至少一個(gè)單詞與所述單詞串中的其余單詞區(qū)別而顯示,且當(dāng)所述用戶在所述終端中選擇被區(qū)別顯示的單詞時(shí),使被區(qū)別顯示的單詞變更為所述備選單詞而進(jìn)行顯示。
22.—種語音識(shí)別方法,其特征在于包含如下步驟 作為語音識(shí)別結(jié)果,當(dāng)提供單詞串以及針對(duì)包含于所述單詞串的至少一個(gè)單詞的備選單詞時(shí),確認(rèn)所述單詞串及所述備選單詞;以及 通過顯示裝置顯示所述單詞串,且將存在所述備選單詞的至少一個(gè)單詞與所述單詞串中的其余單詞區(qū)別而顯示, 其中,在通過顯示裝置顯示所述單詞串的步驟中,當(dāng)用戶選擇被區(qū)別顯示的單詞時(shí),顯示包含被區(qū)別顯示的單詞的備選單詞中的至少一個(gè)備選單詞的列表。
23.一種語音識(shí)別方法,其特征在于包含如下步驟 確定對(duì)應(yīng)于聲音信號(hào)的單詞串及針對(duì)包含于所述單詞串中的至少一個(gè)單詞的備選單詞,用以生成語音識(shí)別結(jié)果;以及 向用戶終端提供所述語音識(shí)別結(jié)果, 其中,在所述終端的顯示裝置中顯示所述單詞串, 并且,將存在所述備選單詞的至少一個(gè)單詞與所述單詞串中的其余單詞區(qū)別而顯示, 當(dāng)所述用戶在所述終端中選擇被區(qū)別顯示的單詞時(shí),顯示包含被區(qū)別顯示的單詞的備選單詞中的至少一個(gè)單詞的列表。
全文摘要
本發(fā)明公開一種基于生成單詞級(jí)別的備選的語音識(shí)別系統(tǒng)及方法。語音識(shí)別系統(tǒng)的特征在于包含語音識(shí)別結(jié)果確認(rèn)部,作為語音識(shí)別結(jié)果,當(dāng)提供單詞串以及針對(duì)包含于單詞串的至少一個(gè)單詞的備選單詞時(shí),確認(rèn)單詞串及備選單詞;以及單詞串顯示部,通過顯示裝置顯示單詞串,且將存在備選單詞的至少一個(gè)單詞與單詞串中的其余單詞區(qū)別而顯示。其中,當(dāng)用戶選擇被區(qū)別顯示的單詞時(shí),單詞串顯示部使被區(qū)別顯示的單詞變更為備選單詞而進(jìn)行顯示。
文檔編號(hào)G10L15/26GK102779511SQ20121006375
公開日2012年11月14日 申請(qǐng)日期2012年3月12日 優(yōu)先權(quán)日2011年5月12日
發(fā)明者具東昱, 李相浩, 鄭大成, 金勛 申請(qǐng)人:Nhn株式會(huì)社