專利名稱:語(yǔ)音處理裝置、方法和程序的制作方法
技術(shù)領(lǐng)域:
本公開涉及語(yǔ)音處理裝置、語(yǔ)音處理方法和程序,特別涉及其中在對(duì)語(yǔ)音信號(hào)的音高(voice pitch)進(jìn)行變換的情況下可以抑制輸出語(yǔ)音的伸縮變化的語(yǔ)音處理裝置、語(yǔ)音處理方法和程序。
背景技術(shù):
對(duì)語(yǔ)音或樂曲的語(yǔ)音信號(hào)中的音高進(jìn)行變換的技術(shù)已被用于卡拉OK中的音調(diào)(key)控制、用于樂器訓(xùn)練的基準(zhǔn)音樂的音調(diào)改變,或者相關(guān)技術(shù)中的類似情況。當(dāng)一個(gè)充當(dāng)基準(zhǔn)的語(yǔ)音信號(hào)被準(zhǔn)備時(shí),期望的音調(diào)可被獲得,并且這還引起存儲(chǔ)器的節(jié)省,因此這種音高變換處理是有用的技術(shù)。例如,作為對(duì)語(yǔ)音信號(hào)的音高進(jìn)行變換的方法,其中通過采樣速率變換器來改變語(yǔ)音波形的周期的方法可被例示。在該方法中,語(yǔ)音信號(hào)可被變換為具有期望音高的語(yǔ)音信號(hào),但是變換前后的語(yǔ)音信號(hào)的樣本數(shù)目發(fā)生變化。因此,一般而言,如在音高變換處理裝置中期望的,為了獲得與輸入數(shù)據(jù)的樣本數(shù)目相同的輸出數(shù)據(jù)的樣本數(shù)目,通過諸如PICOLA(指針間隔受控重疊和添加)之類的時(shí)間伸縮處理來執(zhí)行對(duì)輸出數(shù)據(jù)的樣本數(shù)目的調(diào)節(jié)(例如,參考“Morita,Itakura voice expansion and contraction on a time axis using PICOLA(Pointer IntervalControlled Overlap and Add), and an evaluation thereof,日本聲學(xué)協(xié)會(huì)論文集,1986年 10 月,第 149-150 頁(yè)”)。
發(fā)明內(nèi)容
然而,在這種技術(shù)中,在語(yǔ)音信號(hào)經(jīng)受音高變換的情況下,發(fā)生輸出語(yǔ)音的伸縮變化,因而難以獲得高質(zhì)量的語(yǔ)音。例如,在音高將被變換的語(yǔ)音信號(hào)經(jīng)受諸如PICOLA之類的時(shí)間伸縮處理的情況下,語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度可被調(diào)節(jié)為大體期望的長(zhǎng)度,但是因?yàn)樵撎幚硎且砸舾唛L(zhǎng)度或者幀長(zhǎng)度作為單位來執(zhí)行的,因此由于處理單位而被施加限制。因此,語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度可能不被精確地變換為所期望的時(shí)間長(zhǎng)度,并且在通過音高變換獲得的語(yǔ)音中可能發(fā)生伸縮變化。此外,在由采樣速率變換器等執(zhí)行音高變換的情況下,在對(duì)語(yǔ)音信號(hào)的時(shí)間伸縮處理中,利用音高變換中的語(yǔ)音的時(shí)間伸縮比的倒數(shù)來執(zhí)行對(duì)時(shí)間長(zhǎng)度的調(diào)節(jié),但是時(shí)間伸縮比的倒數(shù)不一定變?yōu)橛欣頂?shù)。這樣,在時(shí)間伸縮比的倒數(shù)不變?yōu)橛欣頂?shù)的情況下,在用于時(shí)間伸縮處理的時(shí)間伸縮比中可能發(fā)生誤差,使得語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度可能不被準(zhǔn)確地變換為期望的時(shí)間長(zhǎng)度。希望在對(duì)語(yǔ)音信號(hào)的音高進(jìn)行變換的情況下抑制輸出語(yǔ)音的伸縮變化。根據(jù)本公開的一個(gè)實(shí)施例,提供了一種語(yǔ)音處理裝置,包括對(duì)輸入語(yǔ)音信號(hào)執(zhí)行音高變換處理并且對(duì)所述輸入語(yǔ)音信號(hào)的音高進(jìn)行變換的音高變換單元;檢測(cè)所預(yù)期的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差的誤差檢測(cè)單元;以及以通過所述誤差的數(shù)量校正所述輸出語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的方式來控制對(duì)所述時(shí)間長(zhǎng)度的調(diào)節(jié)的時(shí)間長(zhǎng)度控制單元。所述誤差檢測(cè)單元可以基于所述輸入語(yǔ)音信號(hào)的樣本數(shù)目、所輸出的所述輸出語(yǔ)音信號(hào)的樣本數(shù)目以及所述輸入語(yǔ)音信號(hào)的未經(jīng)處理的樣本的數(shù)目來檢測(cè)所述誤差。所述語(yǔ)音處理裝置還可以包括時(shí)間伸縮處理單元,該時(shí)間伸縮處理單元對(duì)所述輸入語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且調(diào)節(jié)所述輸入語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度。所述語(yǔ)音處理裝置還可以包括精簡(jiǎn)和插入單元,該精簡(jiǎn)和插入單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制對(duì)被執(zhí)行了所述音高變換處理的輸入語(yǔ)音信號(hào)執(zhí)行樣本精簡(jiǎn)或者樣本插入,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度。所述語(yǔ)音處理裝置還可以包括變換單元,該變換單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制對(duì)被執(zhí)行了所述音高變換處理的輸入語(yǔ)音信號(hào)執(zhí)行采樣速率變換,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度。所述語(yǔ)音處理裝置還可以包括重疊處理單元,該重疊處理單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制對(duì)被執(zhí)行了所述音高變換處理的輸入語(yǔ)音信號(hào)執(zhí)行重疊處理,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度,所述重疊處理利用了具有由所述誤差決定的長(zhǎng)度的窗口。所述語(yǔ)音處理裝置還可以包括時(shí)間伸縮處理單元,該時(shí)間伸縮處理單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制以由所述誤差決定的時(shí)間伸縮比對(duì)所述輸入語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度。根據(jù)本公開的另一實(shí)施例,提供了一種語(yǔ)音處理方法或程序,包括對(duì)輸入語(yǔ)音信號(hào)執(zhí)行音高變換處理并且對(duì)所述輸入語(yǔ)音信號(hào)的音高進(jìn)行變換;檢測(cè)所預(yù)期的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差;以及以通過所述誤差的數(shù)量校正所述輸出語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的方式來控制對(duì)所述時(shí)間長(zhǎng)度的調(diào)節(jié)。根據(jù)本公開的實(shí)施例,音高變換處理被對(duì)輸入語(yǔ)音信號(hào)執(zhí)行并且輸入語(yǔ)音信號(hào)的音高被變換;所預(yù)期的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差被檢測(cè);并且對(duì)時(shí)間長(zhǎng)度的調(diào)節(jié)被以通過所述誤差的數(shù)量校正所述輸出語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的方式來控制。根據(jù)本公開的實(shí)施例,在對(duì)語(yǔ)音信號(hào)的音高進(jìn)行變換的情況下,輸出語(yǔ)音的伸縮變化可被抑制。
圖I是圖示出根據(jù)第一實(shí)施例的音高變換裝置的配置示例的示圖;圖2是圖示出音高變換處理的流程圖;圖3是圖示出音高變換裝置的另一配置示例的示圖;圖4是圖示出音高變換處理的流程圖;圖5是圖示出音高變換裝置的另一配置示例的示圖;圖6是圖示出音高變換處理的流程圖; 圖7是圖示出音高變換裝置的另一配置示例的示圖;圖8是圖示出音高變換處理的流程圖9是圖示出音高變換裝置的另一配置示例的示圖;圖10是圖示出音高變換處理的流程圖;圖11是圖示出重疊處理的示圖;圖12是圖示出窗口函數(shù)的示例的示圖;圖13是圖示出重疊處理的示圖;圖14是圖示出窗口函數(shù)的示例的示圖;圖15是圖示出音高變換裝置的另一配置示例的示圖;圖16是圖示出音高變換處理的流程圖; 圖17是圖示出音高變換裝置的另一配置示例的示圖;圖18是圖示出音高變換處理的流程圖;圖19是圖示出音高變換裝置的另一配置示例的示圖;圖20是圖示出音高變換處理的流程圖;并且圖21是圖示出計(jì)算機(jī)的配置示例的示圖。
具體實(shí)施例方式在下文中,將參考附圖描述本技術(shù)所應(yīng)用于的實(shí)施例。第一實(shí)施例音高變換裝置的配置示例圖I示出了本技術(shù)所應(yīng)用于的根據(jù)第一實(shí)施例的音高變換裝置的配置示例。音高變換裝置11對(duì)輸入語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且輸出其中音高(語(yǔ)音的音調(diào)的高度)被變換的語(yǔ)音信號(hào)。此外,在以下描述中,輸入到音高變換裝置11的語(yǔ)音信號(hào)也被稱為輸入語(yǔ)音信號(hào),并且從音高變換裝置11輸出的語(yǔ)音信號(hào)也被稱為輸出語(yǔ)音信號(hào)。此外,作為將經(jīng)受音高變換處理的對(duì)象的語(yǔ)音信號(hào)可以是諸如人的語(yǔ)音、樂曲等的任何語(yǔ)音的信號(hào)。音高變換裝置11包括緩沖器21、誤差檢測(cè)單元22、時(shí)間長(zhǎng)度控制單元23、音高變換單元24、時(shí)間伸縮處理單元25以及精簡(jiǎn)和插入單元26。緩沖器21臨時(shí)存儲(chǔ)所輸入的輸入語(yǔ)音信號(hào),并且將其提供給音高變換單元24。誤差檢測(cè)單元22基于所輸入的輸入語(yǔ)音信號(hào)、存儲(chǔ)在緩沖器21中的未經(jīng)處理的語(yǔ)音信號(hào)以及從精簡(jiǎn)和插入單元26提供的輸出語(yǔ)音信號(hào),來檢測(cè)實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目與期望的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差。誤差檢測(cè)單元22將檢測(cè)到的誤差提供給時(shí)間長(zhǎng)度控制單元23。時(shí)間長(zhǎng)度控制單元23基于從誤差檢測(cè)單元22提供的誤差執(zhí)行對(duì)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度調(diào)節(jié)的控制。就是說,時(shí)間長(zhǎng)度控制單元23對(duì)精簡(jiǎn)和插入單元26給出調(diào)節(jié)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度(即語(yǔ)音信號(hào)的樣本數(shù)目)的指令。音高變換單元24對(duì)從緩沖器21中讀出的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且將由此得到的語(yǔ)音信號(hào)提供給時(shí)間伸縮處理單元25。時(shí)間伸縮處理單元25對(duì)從音高變換單元24提供的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且在不改變音程(musical interval)的情況下對(duì)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度進(jìn)行伸縮,然后將由此得到的語(yǔ)音信號(hào)提供給精簡(jiǎn)和插入單元26。精簡(jiǎn)和插入單元26根據(jù)時(shí)間長(zhǎng)度控制單元23的控制對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)的樣本進(jìn)行精簡(jiǎn)或者對(duì)語(yǔ)音信號(hào)插入樣本,由此調(diào)節(jié)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度。精簡(jiǎn)和插入單元26把通過對(duì)語(yǔ)音信號(hào)調(diào)節(jié)時(shí)間長(zhǎng)度而獲得的輸出語(yǔ)音信號(hào)輸出到誤差檢測(cè)單元22以及后續(xù)級(jí)(未示出)。音高變換處理的描述然而,當(dāng)輸入音頻信號(hào)被提供給音高變換裝置11并且音高變換指令被給出時(shí),音高變換裝置11執(zhí)行音高變換處理,并且將輸入語(yǔ)音信號(hào)變換為具有相同數(shù)目樣本和不同音高的輸出語(yǔ)音信號(hào),然后輸出由此得到的語(yǔ)音信號(hào)。在下文中,將參考圖2中的流程圖來描述由音高變換裝置11執(zhí)行的音高變換處理。
在步驟Sll中,緩沖器21臨時(shí)存儲(chǔ)所輸入的輸入語(yǔ)音信號(hào)。在步驟S12中,誤差檢測(cè)單元22基于所輸入的輸入語(yǔ)音信號(hào)、在緩沖器21中存儲(chǔ)的輸入語(yǔ)音信號(hào)以及從精簡(jiǎn)和插入單元26提供的輸出語(yǔ)音信號(hào)來計(jì)算輸出語(yǔ)音信號(hào)的樣本數(shù)目誤差。例如,在所輸入的輸入語(yǔ)音信號(hào)的樣本數(shù)目被設(shè)置為NI、存儲(chǔ)在緩沖器21中的輸入語(yǔ)音信號(hào)的樣本數(shù)目被設(shè)置為N2并且輸出語(yǔ)音信號(hào)的樣本數(shù)目被設(shè)置為N3的狀態(tài)下,誤差檢測(cè)單元22通過計(jì)算以下式(I)來計(jì)算輸出語(yǔ)音信號(hào)的樣本數(shù)目的誤差ER。誤差ER = N3- (N1-N2)…(I)此外,在式(I)中,輸入語(yǔ)音信號(hào)的樣本數(shù)目NI和輸出語(yǔ)音信號(hào)的樣本數(shù)目N3被設(shè)置為來自預(yù)定位置(樣本)的樣本的數(shù)目,例如,來自作為將被處理的對(duì)象的語(yǔ)音信號(hào)的前部樣本的樣本的數(shù)目,等等。在對(duì)音高進(jìn)行變換的情況下,為了使在可在變換中獲得的輸出語(yǔ)音信號(hào)中不發(fā)生伸縮變化,實(shí)際輸出的輸出語(yǔ)音信號(hào)的總樣本的數(shù)目和輸入語(yǔ)音信號(hào)的總樣本的數(shù)目?jī)?yōu)選彼此相同。因此,誤差檢測(cè)單元22計(jì)算當(dāng)前時(shí)間點(diǎn)的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際處理的輸入語(yǔ)音信號(hào)的樣本數(shù)目之間的差異,作為誤差ER。這里,輸入語(yǔ)音信號(hào)的每個(gè)樣本被從緩沖器21中順序讀出,并且被音高變換單元24處理,使得尚未被處理的樣本存在于輸入到音高變換裝置11的輸入語(yǔ)音信號(hào)中。這種未經(jīng)處理的樣本是存儲(chǔ)在緩沖器21中的樣本,使得當(dāng)輸入語(yǔ)音信號(hào)的樣本數(shù)目NI與緩沖器21中存儲(chǔ)的語(yǔ)音信號(hào)的樣本數(shù)目N2之間的差異被獲得時(shí),實(shí)際處理的樣本的數(shù)目可被獲得。因此,當(dāng)實(shí)際處理的樣本的數(shù)目(N1-N2)和實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本的數(shù)目N3彼此相同時(shí),就是說當(dāng)誤差ER為零時(shí),不發(fā)生輸出語(yǔ)音信號(hào)中的伸縮變化。輸入語(yǔ)音信號(hào)的樣本數(shù)目NI、緩沖器21的語(yǔ)音信號(hào)的樣本數(shù)目N2以及輸出語(yǔ)音信號(hào)的樣本數(shù)目N3可被誤差檢測(cè)單元22準(zhǔn)確掌握,并且這些數(shù)目變?yōu)榱慊蛘哒麛?shù)。因此,誤差檢測(cè)單元22通過根據(jù)上述的零或正整數(shù)對(duì)式(I)進(jìn)行計(jì)算可以準(zhǔn)確地計(jì)算出誤差ER,而不依賴于誤差檢測(cè)單元22的計(jì)算精度。當(dāng)誤差檢測(cè)單元22將計(jì)算出的誤差ER提供給時(shí)間長(zhǎng)度控制單元23時(shí),處理從步驟S12前進(jìn)到步驟S13。在步驟S13中,時(shí)間長(zhǎng)度控制單元23基于從誤差檢測(cè)單元22提供的誤差ER執(zhí)行對(duì)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度調(diào)節(jié)的控制。
例如,在誤差ER是正值的情況下,時(shí)間長(zhǎng)度控制單元23對(duì)精簡(jiǎn)和插入單元26給出對(duì)來自語(yǔ)音信號(hào)的樣本進(jìn)行精簡(jiǎn)的指令,并且在誤差ER是負(fù)值的情況下,時(shí)間長(zhǎng)度控制單元23對(duì)精簡(jiǎn)和插入單元26給出向語(yǔ)音信號(hào)插入樣本的指令。在誤差ER為零的情況下,時(shí)間長(zhǎng)度控制單元23抑制在精簡(jiǎn)和插入單元26中的處理執(zhí)行。在步驟S14中,音高變換單元24從緩沖器21中讀出預(yù)定數(shù)量的語(yǔ)音信號(hào),并且對(duì)讀出的語(yǔ)音信號(hào)執(zhí)行音高變換處理,然后將音高被變換了的語(yǔ)音信號(hào)提供給時(shí)間伸縮處理單元25。例如,語(yǔ)音信號(hào)被從緩沖器21中逐幀讀出并且被處理。此外,音高變換單元24例如執(zhí)行對(duì)語(yǔ)音信號(hào)的采樣速率變換,并且使語(yǔ)音信號(hào)的語(yǔ)音波形的周期變長(zhǎng)或變短,以將語(yǔ)音信號(hào)的音高變換為希望的高度。此外,語(yǔ)音信號(hào)的音高變換可由諸如PSOLA(音高同步重疊添加)之類的另一方法實(shí)現(xiàn)。在步驟S15中,時(shí)間伸縮處理單元25對(duì)從音高變換單元24提供的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理(例如,PIC0LA、相位聲碼器(phase vocoder)等),并且將可從其結(jié)果獲得的語(yǔ)音信號(hào)提供給精簡(jiǎn)和插入單元26。 例如,在時(shí)間伸縮處理中,語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的伸縮比的倒數(shù)(其被由音高變換單元24執(zhí)行的音高變換處理改變)被設(shè)置為時(shí)間伸縮比,并且語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度被時(shí)間伸縮比調(diào)節(jié)。因此,語(yǔ)音信號(hào)的樣本數(shù)目以如下方式增大和減少通過由音高變換單元24執(zhí)行的音高變換而增大和減少后的語(yǔ)音信號(hào)的樣本數(shù)目變?yōu)榕c音高變換之前的樣本數(shù)目基本相同。在步驟S16中,精簡(jiǎn)和插入單元26根據(jù)時(shí)間長(zhǎng)度控制單元23的控制來執(zhí)行對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)的樣本精簡(jiǎn)或樣本插入,并且生成輸出語(yǔ)音信號(hào)。例如,在誤差ER是正值的情況下,精簡(jiǎn)和插入單元26按照誤差ER所指示的數(shù)目從語(yǔ)音信號(hào)中精簡(jiǎn)(刪除)樣本。此外,在多個(gè)樣本被從語(yǔ)音信號(hào)中精簡(jiǎn)的情況下,接連彼此平行的多個(gè)語(yǔ)音信號(hào)樣本可被精簡(jiǎn),或者來自語(yǔ)音信號(hào)的若干位置的各個(gè)樣本可被精簡(jiǎn)。此外,誤差ER是負(fù)值,精簡(jiǎn)和插入單元26按照誤差ER所指示的數(shù)目向語(yǔ)音信號(hào)的預(yù)定位置插入樣本。這里,被插入語(yǔ)音信號(hào)的樣本的樣本值可被設(shè)置為具有與位于緊鄰所要插入的樣本之前或之后的樣本相同的樣本值,或者可被設(shè)置為預(yù)先確定的值,例如零。此外,在多個(gè)樣本被插入語(yǔ)音信號(hào)的情況下,多個(gè)樣本可被接連插入在語(yǔ)音信號(hào)的一個(gè)區(qū)間中,或者每個(gè)樣本可被插入到語(yǔ)音信號(hào)的若干位置中的每一個(gè)。此外,在誤差ER為零的情況下,精簡(jiǎn)和插入單元26將從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)原樣設(shè)置為輸出語(yǔ)音信號(hào),而不對(duì)語(yǔ)音信號(hào)執(zhí)行樣本精簡(jiǎn)或者樣本插入。當(dāng)輸出語(yǔ)音信號(hào)被生成時(shí),精簡(jiǎn)和插入單元26將所生成的輸出語(yǔ)音信號(hào)提供給誤差檢測(cè)單元22,并且將輸出語(yǔ)音信號(hào)輸出到位于下一級(jí)的再現(xiàn)單元等。這樣,在精簡(jiǎn)和插入單元26中,按照誤差ER的數(shù)量從語(yǔ)音信號(hào)刪除樣本或向語(yǔ)音信號(hào)插入樣本以校正語(yǔ)音信號(hào)的樣本數(shù)目,并且輸出語(yǔ)音信號(hào)的樣本數(shù)目由此可以是所期望(預(yù)期)的樣本數(shù)目。就是說,可能無法在時(shí)間伸縮處理單元25中執(zhí)行的對(duì)樣本數(shù)目的微小調(diào)節(jié)被執(zhí)行,并且輸出語(yǔ)音信號(hào)的樣本數(shù)目由此可以與輸入語(yǔ)音信號(hào)的樣本數(shù)目相同。在步驟S17中,音高變換裝置11判定處理是否將被終止。例如,在所提供的輸入語(yǔ)音信號(hào)的所有樣本都被處理的情況下,音高變換裝置11判定處理將被終止。在步驟S17中,在判定處理將不被終止的情況下,處理返回到步驟S11,并且上述處理被重復(fù)。相反,在步驟S17中,在判定處理將被終止的情況下,音高變換處理被終止。這樣,音高變換裝置11計(jì)算期望輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差,并且響應(yīng)于該誤差而增大和減少語(yǔ)音信號(hào)的樣本數(shù)目。因此,輸出語(yǔ)音信號(hào)的樣本數(shù)目可變?yōu)樗谕臉颖緮?shù)目。具體而言,因?yàn)樵谝舾咦儞Q裝置11中當(dāng)執(zhí)行音高變換處理時(shí)一直執(zhí)行向輸出語(yǔ)音信號(hào)的期望樣本數(shù)目的校正,因此輸出語(yǔ)音的伸縮變化可被抑制。
第一修改音高變換裝置的配置示例此外,已經(jīng)對(duì)在執(zhí)行音高變換處理之后執(zhí)行時(shí)間伸縮處理的情況進(jìn)行了描述,但是音高變換處理可被在時(shí)間伸縮處理之后執(zhí)行。在這種情況下,音高變換裝置例如可被配置為如圖3所示。此外,在圖3中,相似的標(biāo)號(hào)將被給與與圖I情況下的那些部件相對(duì)應(yīng)的部件,并且其描述將被適當(dāng)省略。圖3中的音高變換裝置51包括緩沖器21至精簡(jiǎn)和插入單元26。音高變換裝置51與圖I中的音高變換裝置11的彼此不同之處在于音高變換單元24與時(shí)間伸縮處理單元25之間的連接關(guān)系,并且其他配置彼此相同。就是說,在音高變換裝置51中,時(shí)間伸縮處理單元25對(duì)從緩沖器21中讀出的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且將由此得到的語(yǔ)音信號(hào)提供給音高變換單元24。此外,音高變換單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且將由此得到的語(yǔ)音信號(hào)提供給精簡(jiǎn)和插入單元26。音高變換處理的描述接下來,將參考圖4中的流程圖來描述由圖3中的音高變換裝置51執(zhí)行的音高變換處理。此外,步驟S41至步驟S43中的處理與圖2中的步驟Sll至步驟S13中的那些相同,因此其描述將被省略。在步驟S44中,時(shí)間伸縮處理單元25從緩沖器21中讀出語(yǔ)音信號(hào)并且執(zhí)行時(shí)間伸縮處理,然后將由此得到的語(yǔ)音信號(hào)提供給音高變換單元24。在步驟S45中,音高變換單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且將由此得到的語(yǔ)音信號(hào)提供給精簡(jiǎn)和插入單元26。此外,在步驟S44和步驟S45中,與圖2中的步驟S15和步驟S14中的那些處理相同的處理被執(zhí)行。步驟S46和步驟S47中的處理在步驟S45中的處理被執(zhí)行之后被執(zhí)行,然后音高變換處理被終止,但是這些處理與圖2的步驟S16和步驟S17中的那些相同,因此其描述將被省略。這樣,即使當(dāng)音高變換處理在時(shí)間伸縮處理之后被執(zhí)行時(shí),輸出語(yǔ)音的伸縮變化也可被抑制。第二實(shí)施例音高變換裝置的配置示例此外,已經(jīng)對(duì)通過樣本精簡(jiǎn)或樣本插入執(zhí)行按照誤差ER數(shù)量對(duì)樣本數(shù)目進(jìn)行校正的情況,但是可以通過采樣速率變換處理來執(zhí)行按照誤差ER數(shù)量的校正。在這種情況下,音高變換裝置例如可被配置為如圖5所示。此外,在圖5中,相似的標(biāo)號(hào)將被給與與圖I情況下的那些部件相對(duì)應(yīng)的部件,并且其描述將被適當(dāng)省略。圖5中的音高變換裝置71與圖I中的音高變換裝置11的彼此不同之處在于音高變換裝置71設(shè)有變換處理單元81而非音高變換裝置11的精簡(jiǎn)和插入單元26,并且其他配置彼此相同。變換處理單元81根據(jù)時(shí)間長(zhǎng)度控制單元23的控制對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行采樣速率變換處理,并且調(diào)節(jié)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度。變換處理單元81將可通過對(duì)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度調(diào)節(jié)而獲得的輸出語(yǔ)音信號(hào)輸出到誤差檢測(cè)單元22和下一級(jí)(未示出)。 音高變換處理的描述接下來,將參考圖6中的流程圖來描述由音高變換裝置71執(zhí)行的音高變換處理。此外,步驟S71至步驟S75中的處理與圖2中的步驟Sll至步驟S15中的那些相同,因此其描述將被省略。在步驟S76中,變換處理單元81根據(jù)時(shí)間長(zhǎng)度控制單元23的控制對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行采樣速率變換,并且變換語(yǔ)音信號(hào)的采樣速率。例如,在誤差ER是正值的情況下,變換處理單元81以由誤差ER決定的變換比對(duì)語(yǔ)音信號(hào)執(zhí)行下采樣,使得從語(yǔ)音信號(hào)刪除與誤差ER所指示的數(shù)目一樣多的樣本。此外,在誤差ER是負(fù)值的情況下,變換處理單元81以由誤差ER決定的變換比對(duì)語(yǔ)音信號(hào)執(zhí)行上采樣,使得向語(yǔ)音信號(hào)插入與誤差ER所指示的數(shù)目一樣多的樣本。這樣,作為采樣速率變換處理,響應(yīng)于誤差ER而執(zhí)行下采樣或上采樣,使得語(yǔ)音信號(hào)的樣本數(shù)目通過內(nèi)插等而增大或減少,并且輸出語(yǔ)音信號(hào)的樣本數(shù)目由此可以變?yōu)樗谕臉颖緮?shù)目。此外,在誤差ER為零的情況下,變換處理單元81不對(duì)語(yǔ)音信號(hào)執(zhí)行采樣速率變換處理,并且將從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)原樣輸出為輸出語(yǔ)音信號(hào)。當(dāng)輸出語(yǔ)音信號(hào)被生成時(shí),變換處理單元81將所生成的輸出語(yǔ)音信號(hào)提供給誤差檢測(cè)單元22,并且將輸出語(yǔ)音信號(hào)輸出到位于下一級(jí)的再現(xiàn)單元等。步驟S77中的處理在步驟S76中的處理被執(zhí)行之后被執(zhí)行,然后音高變換處理被終止,但是步驟S77中的處理與圖2的步驟S17中的處理相同,因此其描述將被省略。這樣,音高變換裝置71計(jì)算期望輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差,并且響應(yīng)于該誤差而變換語(yǔ)音信號(hào)的采樣速率,并由此增大或減少語(yǔ)音信號(hào)的樣本數(shù)目。結(jié)果,輸出語(yǔ)音信號(hào)的樣本數(shù)目可變?yōu)樗谕臉颖緮?shù)目,輸出語(yǔ)音的伸縮變化由此可被抑制。第二修改音高變換裝置的配置示例此外,在響應(yīng)于誤差ER執(zhí)行采樣速率變換處理的情況下,音高變換處理可被在時(shí)間伸縮處理之后執(zhí)行。在這種情況下,音高變換裝置例如可被配置為如圖7所示。此外,在圖7中,相似的標(biāo)號(hào)將被給與與圖5情況下的那些部件相對(duì)應(yīng)的部件,并且其描述將被適當(dāng)省略。圖7中的音高變換裝置111與圖5中的音高變換裝置71的彼此不同之處在于音高變換單元24與時(shí)間伸縮處理單元25之間的連接關(guān)系是相反的,并且其他配置彼此相同。就是說,在音高變換裝置111中,時(shí)間伸縮處理單元25對(duì)從緩沖器21中讀出的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且音高變換單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且將由此得到的語(yǔ)音信號(hào)提供給變換處理單元81。音高變換處理的描述接下來,將參考圖8中的流程圖來描述由圖7中的音高變換裝置111執(zhí)行的音高變換處理。此外,步驟SlOl至步驟S103中的處理與圖6中的步驟S71至步驟S73中的那些相同,因此其描述將被省略。在步驟S104中,時(shí)間伸縮處理單元25從緩沖器21中讀出語(yǔ)音信號(hào)并且執(zhí)行時(shí)間伸縮處理,然后將由此得到的語(yǔ)音信號(hào)提供給音高變換單元24。在步驟S105中,音高變換 單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且將由此得到的語(yǔ)音信號(hào)提供給變換處理單元81。此外,在步驟S104和步驟S105中,與圖6中的步驟S75和步驟S74中的那些處理相同的處理被執(zhí)行。步驟S106和步驟S107中的處理在步驟S105中的處理被執(zhí)行之后被執(zhí)行,然后音高變換處理被終止,但是這些處理與圖6的步驟S76和步驟S77中的那些相同,因此其描述將被省略。這樣,即使當(dāng)音高變換處理在時(shí)間伸縮處理之后被執(zhí)行時(shí),輸出語(yǔ)音的伸縮變化也可被抑制。第三實(shí)施例音高變換裝置的配置示例此外,已經(jīng)對(duì)通過采樣速率變換處理執(zhí)行按照誤差ER數(shù)量的校正的示例進(jìn)行了描述,但是可以通過按照窗口框定(window framing)的重疊處理來執(zhí)行按照誤差ER數(shù)量的校正。在這種情況下,音高變換裝置例如可被配置為如圖9所示。此外,在圖9中,相似的標(biāo)號(hào)將被給與與圖I情況下的那些部件相對(duì)應(yīng)的部件,并且其描述將被適當(dāng)省略。圖9中的音高變換裝置141與圖I中的音高變換裝置11的彼此不同之處在于音高變換裝置141設(shè)有重疊處理單元151而非音高變換裝置11的精簡(jiǎn)和插入單元26,并且其他配置彼此相同。重疊處理單元151根據(jù)時(shí)間長(zhǎng)度控制單元23的控制對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)通過窗口框定執(zhí)行重疊處理,并且由此調(diào)節(jié)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度。重疊處理單元151將可通過對(duì)語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度調(diào)節(jié)而獲得的輸出語(yǔ)音信號(hào)輸出到誤差檢測(cè)單元22和下一級(jí)(未示出)。音高變換處理的描述接下來,將參考圖10中的流程圖來描述由音高變換裝置141執(zhí)行的音高變換處理。此外,步驟S131至步驟S135中的處理與圖2中的步驟Sll至步驟S15中的那些相同,因此其描述將被省略。在步驟S136中,重疊處理單元151根據(jù)時(shí)間長(zhǎng)度控制單元23的控制對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行重疊處理,并且增大或減少語(yǔ)音信號(hào)的樣本數(shù)目。例如,在誤差ER是正值的情況下,重疊處理單元151通過長(zhǎng)度(在下文中稱為窗口框長(zhǎng)度)為按照誤差ER數(shù)量的樣本數(shù)目的窗口框定,對(duì)語(yǔ)音信號(hào)執(zhí)行重疊處理。因此,例如,長(zhǎng)度為語(yǔ)音信號(hào)的窗口框長(zhǎng)度兩倍的區(qū)間被變換為長(zhǎng)度為窗口框長(zhǎng)度的區(qū)間,樣本數(shù)目的調(diào)節(jié)由此被執(zhí)行。就是說,語(yǔ)音信號(hào)的樣本被減少了與窗口框長(zhǎng)度(誤差ER)的長(zhǎng)
度一樣多。此外,在誤差ER是負(fù)值的情況下,重疊處理單元151通過長(zhǎng)度為按照誤差ER數(shù)量的樣本數(shù)目的窗口框定,對(duì)語(yǔ)音信號(hào)執(zhí)行重疊處理。因此,例如,長(zhǎng)度為語(yǔ)音信號(hào)的窗口框長(zhǎng)度兩倍的區(qū)間被變換為長(zhǎng)度為窗口框長(zhǎng)度三倍的區(qū)間,樣本數(shù)目的調(diào)節(jié)由此被執(zhí)行。就是說,語(yǔ)音信號(hào)的樣本增大了與窗口框長(zhǎng)度(誤差ER)的長(zhǎng)度一樣多。此外,在誤差ER為零的情況下,重疊處理單元151將從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)原樣設(shè)置為輸出語(yǔ)音信號(hào),而不對(duì)語(yǔ)音信號(hào)執(zhí)行重 疊處理。此外,在重疊處理中使用的窗口可以是具有任意形狀的窗口,例如,三角形窗口、矩形窗口、漢寧(hanning)窗口、正弦窗口、余弦窗口等。例如,在誤差ER是正值并且三角形窗口被用于重疊處理的情況下,如圖11所示,語(yǔ)音信號(hào)DAll被在時(shí)間方向上縮小。此外,在圖11中,水平方向代表時(shí)間,并且垂直方向代表信號(hào)或函數(shù)值的大小。此外,在該附圖中,語(yǔ)音信號(hào)的波形上的圓圈代表樣本。在圖11中,如箭頭All所指示,假定語(yǔ)音信號(hào)DAll被從時(shí)間伸縮處理單元25提供到重疊處理單元151。此外,假定重疊處理單元151將包括語(yǔ)音信號(hào)DAll的區(qū)間NHl和區(qū)間NH2的區(qū)間縮小為具有一半樣本數(shù)目的區(qū)間。此外,區(qū)間NHl和區(qū)間NH2是長(zhǎng)度為窗口框長(zhǎng)度的區(qū)間,其包括語(yǔ)音信號(hào)DAll的N個(gè)樣本。在這種情況下,對(duì)語(yǔ)音信號(hào)DAll的區(qū)間NHl和區(qū)間NH2執(zhí)行按照三角形窗口 TFl和三角形窗口 TF2的窗口框定,如箭頭A12所指示。這里,三角形窗口 TFl是表明區(qū)間NHl中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向區(qū)間NHl內(nèi)位于圖中右側(cè)的樣本所乘以的權(quán)重而變小。三角形窗口 TFl的權(quán)重的大小在時(shí)間方向上(在未來方向上)線性減小。此外,三角形窗口 TF2是表明區(qū)間NH2中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向區(qū)間NH2內(nèi)位于圖中右側(cè)的樣本所乘以的權(quán)重而變大。三角形窗口 TF2的權(quán)重的大小在時(shí)間方向上(在未來方向上)線性增大。當(dāng)利用三角形窗口 TFl和三角形窗口 TF2的窗口框定被執(zhí)行時(shí),由箭頭A13指示的信號(hào)DNl和信號(hào)DN2可被獲得。就是說,語(yǔ)音信號(hào)DAll的區(qū)間NHl內(nèi)的每個(gè)樣本被乘以作為權(quán)重的與該樣本位于相同位置的三角形窗口 TFl的值,并且信號(hào)DNl由此被得到。類似地,語(yǔ)音信號(hào)DAll的區(qū)間NH2內(nèi)的每個(gè)樣本被乘以作為權(quán)重的與該樣本位于相同位置的三角形窗口 TF2的值,并且信號(hào)DN2由此被得到。此外,信號(hào)DNl和信號(hào)DN2中位于彼此相同位置的樣本被彼此相加,并且由箭頭A14指示的信號(hào)DCl由此被生成。這樣,包括可以通過合成信號(hào)DNl和信號(hào)DN2而獲得的N個(gè)樣本的信號(hào)DCl被插入包括語(yǔ)音信號(hào)DAll的區(qū)間NHl和區(qū)間NH2的區(qū)間,并且由此得到的信號(hào)變?yōu)橹丿B處理之后的語(yǔ)音信號(hào)。就是說,包括語(yǔ)音信號(hào)DAll的區(qū)間NHl和區(qū)間NH2的區(qū)間中的信號(hào)可被信號(hào)DCl替代,語(yǔ)音信號(hào)DAll由此被縮小多達(dá)N個(gè)樣本。此外,在使語(yǔ)音信號(hào)DAll縮小的情況下,例如,圖12中示出的窗口可被使用。就是說,如圖中上側(cè)所示,可對(duì)語(yǔ)音信號(hào)DAll的區(qū)間NHl和區(qū)間NH2執(zhí)行按照矩形窗口 TFll和矩形窗口 TF12的窗口框定。這里,矩形窗口 TFll和矩形窗口 TF12是如下窗口函數(shù)其中每個(gè)樣本所乘以的權(quán)重在每種情況下具有相同值。此外,如圖中下側(cè)所示,可對(duì)語(yǔ)音信號(hào)DAll的區(qū)間NHl和區(qū)間NH2執(zhí)行按照漢寧窗口 TF21和漢寧窗口 TF22的窗口框定。這里,漢寧窗口 TF21是代表區(qū)間NHl中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向位于區(qū)間NHl內(nèi)未來方向側(cè)的樣本所乘以的權(quán)重而減小。此夕卜,漢寧窗口 TF22是代表區(qū)間NH2中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向位于區(qū)間NH2內(nèi)未來方向側(cè)的樣本所乘以的權(quán)重而增大。漢寧窗口 TF21和漢寧窗口 TF22的值(權(quán)重)在時(shí)間方向上非線性地變化。
另外,例如,在誤差ER是負(fù)值并且三角形窗口被用于重疊處理的情況下,如圖13所不,語(yǔ)音信號(hào)DA21被在時(shí)間方向上擴(kuò)大。此外,在圖13中,水平方向代表時(shí)間,并且垂直方向代表信號(hào)或者函數(shù)值的大小。此外,在該附圖中,語(yǔ)音信號(hào)的波形上的圓圈代表樣本。在圖13中,如箭頭A21所指示,假定語(yǔ)音信號(hào)DA21被從時(shí)間伸縮處理單元25提供到重疊處理單元151。此外,假定重疊處理單元151使包括語(yǔ)音信號(hào)DA21的區(qū)間NHll和區(qū)間NH12的區(qū)間擴(kuò)大為具有3/2倍樣本數(shù)目的區(qū)間。此外,區(qū)間NHll和區(qū)間NH12是長(zhǎng)度為窗口框長(zhǎng)度的區(qū)間,其包括語(yǔ)音信號(hào)DA21的N個(gè)連續(xù)樣本。在這種情況下,對(duì)語(yǔ)音信號(hào)DA21的區(qū)間NHll和區(qū)間NH12執(zhí)行按照三角形窗口TF31和三角形窗口 TF32的窗口框定,如箭頭A22所指示。這里,三角形窗口 TF31是表明區(qū)間NHll中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向區(qū)間NHll內(nèi)位于圖中右側(cè)的樣本所乘以的權(quán)重而變大。三角形窗口 TF31的權(quán)重的大小在時(shí)間方向上(在未來方向上)線性增大。此外,三角形窗口 TF32是表明區(qū)間NH12中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向區(qū)間NH12內(nèi)位于圖中右側(cè)的樣本所乘以的權(quán)重而變小。三角形窗口 TF32的權(quán)重的大小在時(shí)間方向上(在未來方向上)線性減小。當(dāng)利用三角形窗口 TF31和三角形窗口 TF32的窗口框定被執(zhí)行時(shí),由箭頭A23指示的信號(hào)DNll和信號(hào)DN12可被獲得。就是說,語(yǔ)音信號(hào)DA21的區(qū)間NHll內(nèi)的每個(gè)樣本被乘以作為權(quán)重的與該樣本位于相同位置的三角形窗口 TF31的值,并且信號(hào)DNll由此被得到。類似地,語(yǔ)音信號(hào)DA21的區(qū)間NH12內(nèi)的每個(gè)樣本被乘以作為權(quán)重的與該樣本位于相同位置的三角形窗口 TF32的值,并且信號(hào)DN12由此被得到。此外,信號(hào)DNll和信號(hào)DN12中位于相同位置的樣本被彼此相加,并且由此得到的信號(hào)如箭頭A24所指示被插入在語(yǔ)音信號(hào)DA21中的區(qū)間NHll和區(qū)間NH12之間,擴(kuò)大之后的語(yǔ)音信號(hào)DA21’由此被得到。在該語(yǔ)音信號(hào)DA21’中,包括N個(gè)樣本的區(qū)間NH13被插入在區(qū)間NHll和區(qū)間NH12之間,并且區(qū)間NH13是由可通過合成信號(hào)DNll和信號(hào)DN12而得到的信號(hào)組成的區(qū)間。這樣,當(dāng)新生成的信號(hào)(區(qū)間NH13)被插入到語(yǔ)音信號(hào)DA21時(shí),具有2N個(gè)樣本的區(qū)間被變換為具有3N個(gè)樣本的區(qū)間,語(yǔ)音信號(hào)由此可被擴(kuò)大多達(dá)N個(gè)樣本(誤差ER)。此外,在使語(yǔ)音信號(hào)DA21擴(kuò)大的情況下,例如,圖14中示出的窗口可被使用。就是說,如圖中上側(cè)所示,可對(duì)語(yǔ)音信號(hào)DA21的區(qū)間NHll和區(qū)間NH12執(zhí)行按照矩形窗口 TF41和矩形窗口 TF42的窗口框定。這里,矩形窗口 TF41和矩形窗口 TF42是如下窗口函數(shù)其中每個(gè)樣本所乘以的權(quán)重在每種情況下具有相同值。此外,如圖中下側(cè)所示,可對(duì)語(yǔ)音信號(hào)DA21的區(qū)間NHll和區(qū)間NH12執(zhí)行按照漢寧窗口 TF51和漢寧窗口 TF52的窗口框定。這里,漢寧窗口 TF51是代表區(qū)間NHll中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向位于區(qū)間NHll內(nèi)未來方向側(cè)的樣本所乘以的權(quán)重而增大。此夕卜,漢寧窗口 TF52是代表區(qū)間NH12中的每個(gè)樣本所乘以的權(quán)重的窗口函數(shù),并且該權(quán)重的大小隨著其趨向位于區(qū)間NH12內(nèi)未來方向側(cè)的樣本所乘以的權(quán)重而減小。此外,漢寧窗口TF51和漢寧窗口 TF52的值(權(quán)重)在時(shí)間方向上非線性地變化。如上所述,當(dāng)重疊處理被執(zhí)行時(shí),語(yǔ)音信號(hào)的樣本數(shù)目被使得增大或減小,輸出語(yǔ)音信號(hào)的樣本數(shù)目由此可以是所期望的樣本數(shù)目。當(dāng)輸出語(yǔ)音信號(hào)被生成時(shí),重疊處理單元151將所生成的輸出語(yǔ)音信號(hào)提供給誤 差檢測(cè)單元22,并且將輸出語(yǔ)音信號(hào)輸出到位于下一級(jí)的再現(xiàn)單元等?;氐綄?duì)圖10中的流程圖的描述,步驟S137中的處理在步驟S136中的處理被執(zhí)行之后被執(zhí)行,然后音高變換處理被終止,但是步驟S137中的處理與圖2的步驟S17中的處理相同,因此其描述將被省略。如上所述,音高變換裝置141計(jì)算期望輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差,并且然后響應(yīng)于該誤差而對(duì)語(yǔ)音信號(hào)執(zhí)行重疊處理,并由此使語(yǔ)音信號(hào)的樣本數(shù)目增大或減少。因此,輸出語(yǔ)音信號(hào)的樣本數(shù)目可變?yōu)樗谕臉颖緮?shù)目,輸出語(yǔ)音的伸縮變化由此可被抑制。第三修改音高變換裝置的配置示例此外,在響應(yīng)于誤差ER而執(zhí)行重疊處理的情況下,音高變換處理可被在時(shí)間伸縮處理之后執(zhí)行。在這種情況下,音高變換裝置例如可被配置為如圖15所示。此外,在圖15中,相似的標(biāo)號(hào)將被給與與圖9情況下的那些部件相對(duì)應(yīng)的部件,并且其描述將被適當(dāng)省略。圖15中的音高變換裝置181與圖9中的音高變換裝置141的彼此不同之處在于音高變換單元24與時(shí)間伸縮處理單元25之間的連接關(guān)系是相反的,并且其他配置彼此相同。就是說,在音高變換裝置181中,時(shí)間伸縮處理單元25對(duì)從緩沖器21中讀出的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且音高變換單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且將由此得到的語(yǔ)音信號(hào)提供給重疊處理單元151。音高變換處理的描述接下來,將參考圖16中的流程圖來描述由圖15中的音高變換裝置181執(zhí)行的音高變換處理。此外,步驟S161至步驟S163中的處理與圖10中的步驟S131至步驟S133中的那些相同,因此其描述將被省略。在步驟S164中,時(shí)間伸縮處理單元25從緩沖器21中讀出語(yǔ)音信號(hào)并且執(zhí)行時(shí)間伸縮處理,然后將由此得到的語(yǔ)音信號(hào)提供給音高變換單元24。在步驟S165中,音高變換單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且將由此得到的語(yǔ)音信號(hào)提供給重疊處理單元151。此外,在步驟S164和步驟S165中,與圖10中的步驟S135和步驟S134中的那些處理相同的處理被執(zhí)行。
步驟S166和步驟S167中的處理在步驟S165中的處理被執(zhí)行之后被執(zhí)行,然后音高變換處理被終止,但是這些處理與圖10的步驟S136和步驟S137中的那些相同,因此其描述將被省略。這樣,即使當(dāng)音高變換處理在時(shí)間伸縮處理之后被執(zhí)行時(shí),輸出語(yǔ)音的伸縮變化也可被抑制。第四實(shí)施例音高變換裝置的配置示例此外,已經(jīng)對(duì)按照窗口框定的重疊處理來執(zhí)行按照誤差ER數(shù)量的校正的示例進(jìn)行了描述,但是可以按照誤差ER的數(shù)量來校正時(shí)間伸縮處理中的時(shí)間伸縮比。在這種情況下,音高變換裝置例如可被配置為如圖17所示。此外,在圖17中,相似的標(biāo)號(hào)將被給與與圖I情況下的那些部件相對(duì)應(yīng)的部件,并且其描述將被適當(dāng)省略。圖 17中的音高變換裝置211與圖I中的音高變換裝置11的彼此不同之處在于音高變換裝置211并未設(shè)有精簡(jiǎn)和插入單元26,并且其他配置彼此相同。就是說,在音高變換裝置211中,時(shí)間長(zhǎng)度控制單元23對(duì)由時(shí)間伸縮處理單元25執(zhí)行的時(shí)間伸縮處理執(zhí)行控制。時(shí)間伸縮處理單元25根據(jù)時(shí)間長(zhǎng)度控制單元23的控制以添加了誤差ER的時(shí)間伸縮比對(duì)從音高變換單元24提供的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且由此使語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度擴(kuò)大或縮小。時(shí)間伸縮處理單元25將可通過時(shí)間伸縮處理獲得的輸出語(yǔ)音信號(hào)輸出到誤差檢測(cè)單元22和下一級(jí)(未示出)。音高變換處理的描述接下來,將參考圖18中的流程圖來描述由音高變換裝置211執(zhí)行的音高變換處理。此外,步驟S191至步驟S194中的處理與圖2中的步驟Sll至步驟S14中的那些相同,因此其描述將被省略。在步驟S195中,時(shí)間伸縮處理單元25根據(jù)時(shí)間長(zhǎng)度控制單元23的控制對(duì)從音高變換單元24提供的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,例如,PIC0LA、相位聲碼器等。此時(shí),時(shí)間伸縮處理單元25獲得語(yǔ)音信號(hào)的時(shí)間伸縮比的倒數(shù)(其被由音高變換單元24執(zhí)行的音高變換處理改變),作為時(shí)間伸縮處理中的時(shí)間伸縮比。此外,時(shí)間伸縮處理單元25響應(yīng)于誤差ER而使所獲得的時(shí)間伸縮比增大或減小,然后將由此得到的值設(shè)置為最終的時(shí)間伸縮比。例如,在誤差ER是正值的情況下,時(shí)間伸縮處理單元25以使語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度縮短誤差ER的數(shù)量的方式來減小時(shí)間伸縮比,并且在誤差ER是負(fù)值的情況下,時(shí)間伸縮處理單元25以使語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度加長(zhǎng)誤差ER的數(shù)量的方式來增大時(shí)間伸縮比。這樣,當(dāng)通過誤差ER的數(shù)量而被校正的時(shí)間伸縮比被獲得時(shí),時(shí)間伸縮處理單元25以所獲得的時(shí)間伸縮比對(duì)語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且由此調(diào)節(jié)時(shí)間信號(hào)的時(shí)間長(zhǎng)度。時(shí)間長(zhǎng)度通過時(shí)間伸縮處理得以調(diào)節(jié)的語(yǔ)音信號(hào)被設(shè)置為輸出語(yǔ)音信號(hào)。這樣,當(dāng)時(shí)間伸縮比通過誤差ER的量被校正并且時(shí)間伸縮處理被執(zhí)行時(shí),語(yǔ)音信號(hào)的樣本數(shù)目被增大或減小,輸出語(yǔ)音信號(hào)的樣本數(shù)目由此可以變?yōu)樗谕臉颖緮?shù)目。當(dāng)輸出語(yǔ)音信號(hào)被生成時(shí),時(shí)間伸縮處理單元25將所生成的輸出語(yǔ)音信號(hào)提供給誤差檢測(cè)單元22,并且將輸出語(yǔ)音信號(hào)輸出到位于下一級(jí)的再現(xiàn)單元等。步驟S196中的處理在步驟S195中的處理被執(zhí)行之后被執(zhí)行,然后音高變換處理被終止,但是步驟S196中的處理與圖2的步驟S17中的處理相同,因此其描述將被省略。這樣,音高變換裝置211計(jì)算期望輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差,并且響應(yīng)于該誤差而對(duì)語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并由此增大或減少語(yǔ)音信號(hào)的樣本數(shù)目。結(jié)果,輸出語(yǔ)音信號(hào)的樣本數(shù)目可變?yōu)樗谕臉颖緮?shù)目,并且輸出語(yǔ)音的伸縮變化由此可被抑制。第四修改音高變換裝置的配置示例此外,即使在響應(yīng)于誤差ER而執(zhí)行時(shí)間伸縮處理的情況下,音高變換處理可被在時(shí)間伸縮處理之后執(zhí)行。在這種情況下,音高變換裝置例如可被配置為如圖19所示。此外,在圖19中,相似的標(biāo)號(hào)將被給與與圖17情況下的那些部件相對(duì)應(yīng)的部件,并且其描述將被適當(dāng)省略。 圖19中的音高變換裝置231與圖17中的音高變換裝置211的彼此不同之處在于音高變換單元24與時(shí)間伸縮處理單元25之間的連接關(guān)系是相反的,并且其他配置彼此相同。就是說,在音高變換裝置231中,時(shí)間伸縮處理單元25對(duì)從緩沖器21中讀出的語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且音高變換單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且生成輸出語(yǔ)音信號(hào)。音高變換處理的描述接下來,將參考圖20中的流程圖來描述由圖19中的音高變換裝置231執(zhí)行的音高變換處理。此外,步驟S221至步驟S223中的處理與圖18中的步驟S191至步驟S193中的那些相同,因此其描述將被省略。在步驟S224中,時(shí)間伸縮處理單元25根據(jù)時(shí)間長(zhǎng)度控制單元23的控制從緩沖器21中讀出語(yǔ)音信號(hào)并且執(zhí)行時(shí)間伸縮處理,然后將由此得到的語(yǔ)音信號(hào)提供給音高變換單元24。在步驟S225中,音高變換單元24對(duì)從時(shí)間伸縮處理單元25提供的語(yǔ)音信號(hào)執(zhí)行音高變換處理,并且生成輸出語(yǔ)音信號(hào)。當(dāng)輸出語(yǔ)音信號(hào)被生成時(shí),音高變換單元24將所生成的輸出語(yǔ)音信號(hào)提供給誤差檢測(cè)單元22,并且將輸出語(yǔ)音信號(hào)輸出到位于下一級(jí)的再現(xiàn)單元等。此外,在步驟S224和步驟S225中,與圖18中的步驟S195和步驟S194中的那些處理相同的處理被執(zhí)行。步驟S226中的處理在步驟S225中的處理被執(zhí)行之后被執(zhí)行,然后音高變換處理被終止,但是步驟S226中的處理與圖18的步驟S196中的處理相同,因此其描述將被省略。這樣,即使當(dāng)音高變換處理在時(shí)間伸縮處理之后被執(zhí)行時(shí),輸出語(yǔ)音的伸縮變化也可被抑制。上面描述的各系列的處理可由硬件或軟件執(zhí)行。在上面描述的各系列處理是由軟件執(zhí)行的情況下,構(gòu)成該軟件的程序可被從程序記錄介質(zhì)安裝到裝配有專用硬件的計(jì)算機(jī)上,或者安裝到例如可以通過安裝各種程序來執(zhí)行各種功能的通用個(gè)人計(jì)算機(jī)等上。圖21示出了圖示出通過程序執(zhí)行上述串行處理的計(jì)算機(jī)硬件的配置示例的框圖。關(guān)于計(jì)算機(jī),CPU (中央處理器)501、R0M (只讀存儲(chǔ)器)502和RAM (隨機(jī)訪問存儲(chǔ)器)503通過總線504彼此相連。輸入和輸出接口 505也被連接到總線504。諸如鍵盤、鼠標(biāo)和麥克風(fēng)之類的輸入單元506、諸如顯示器和揚(yáng)聲器之類的輸出單元507、諸如硬盤和非易失性存儲(chǔ)器之類的記錄單元508、諸如網(wǎng)絡(luò)接口之類的通信單元509、以及驅(qū)動(dòng)諸如磁盤、光盤、磁光盤和半導(dǎo)體存儲(chǔ)器之類的可移除介質(zhì)511的驅(qū)動(dòng)器510被連接到輸入和輸出接口 505。在如上所述配置的計(jì)算機(jī)中,CPU 501例如通過經(jīng)由輸入和輸出接口 505和總線504將存儲(chǔ)在記錄單元508中的程序加載到RAM 503并且執(zhí)行該程序來執(zhí)行上述的這種串行處理。由計(jì)算機(jī)(CPU 501)執(zhí)行的程序可以通過被記錄在作為封裝介質(zhì)的諸如磁盤(包括柔性盤)、光盤(例如⑶-ROM(光盤-只讀存儲(chǔ)器),DVD (數(shù)字通用盤)等)、磁光盤和半導(dǎo)體存儲(chǔ)器之類的可移除介質(zhì)511上來提供,或者可以通過諸如局域網(wǎng)、因特網(wǎng)和數(shù)字廣播之類的有線或無線傳輸介質(zhì)來提供。通過將可移除介質(zhì)511掛在驅(qū)動(dòng)器510中,程序可以通過輸入和輸出接口 505被 安裝在記錄單元508中。此外,程序可通過有線或無線傳輸介質(zhì)由通信單元509接收并且 可被安裝在記錄介質(zhì)508中。在其他情況下,程序可被預(yù)先安裝在ROM 502或者記錄單元508 中。此外,由計(jì)算機(jī)執(zhí)行的程序可以是根據(jù)在本說明書中描述的序列以時(shí)間順序執(zhí)行處理的程序,或者并行執(zhí)行處理或者在諸如當(dāng)被調(diào)用時(shí)之類的必要時(shí)刻執(zhí)行處理的程序。本公開包含與2011年3月17日于日本專利局遞交的日本優(yōu)先權(quán)專利申請(qǐng)JP2011-058956中所公開的主題相關(guān)的主題,該申請(qǐng)的全部?jī)?nèi)容通過引用結(jié)合于此。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,取決于設(shè)計(jì)需求和其他因素,在所附權(quán)利要求或其等同物的范圍內(nèi)可出現(xiàn)各種修改、組合、子組合和變更。
權(quán)利要求
1.一種語(yǔ)音處理裝置,包括 音高變換單元,該音高變換單元對(duì)輸入語(yǔ)音信號(hào)執(zhí)行音高變換處理并且對(duì)所述輸入語(yǔ)音信號(hào)的音高進(jìn)行變換; 誤差檢測(cè)單元,該誤差檢測(cè)單元檢測(cè)所預(yù)期的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差;以及 時(shí)間長(zhǎng)度控制單元,該時(shí)間長(zhǎng)度控制單元以通過所述誤差的數(shù)量校正所述輸出語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的方式來控制對(duì)所述時(shí)間長(zhǎng)度的調(diào)節(jié)。
2.根據(jù)權(quán)利要求I所述的語(yǔ)音處理裝置, 其中,所述誤差檢測(cè)單元基于所述輸入語(yǔ)音信號(hào)的樣本數(shù)目、所輸出的所述輸出語(yǔ)音信號(hào)的樣本數(shù)目以及所述輸入語(yǔ)音信號(hào)的未經(jīng)處理的樣本的數(shù)目來檢測(cè)所述誤差。
3.根據(jù)權(quán)利要求I所述的語(yǔ)音處理裝置,還包括 時(shí)間伸縮處理單元,該時(shí)間伸縮處理單元對(duì)所述輸入語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且調(diào)節(jié)所述輸入語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度。
4.根據(jù)權(quán)利要求I所述的語(yǔ)音處理裝置,還包括 精簡(jiǎn)和插入單元,該精簡(jiǎn)和插入單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制對(duì)被執(zhí)行了所述音高變換處理的輸入語(yǔ)音信號(hào)執(zhí)行樣本精簡(jiǎn)或者樣本插入,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度。
5.根據(jù)權(quán)利要求I所述的語(yǔ)音處理裝置,還包括 變換單元,該變換單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制對(duì)被執(zhí)行了所述音高變換處理的輸入語(yǔ)音信號(hào)執(zhí)行采樣速率變換,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度。
6.根據(jù)權(quán)利要求I所述的語(yǔ)音處理裝置,還包括 重疊處理單元,該重疊處理單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制利用具有由所述誤差決定的長(zhǎng)度的窗口對(duì)被執(zhí)行了所述音高變換處理的輸入語(yǔ)音信號(hào)執(zhí)行重疊處理,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度。
7.根據(jù)權(quán)利要求I所述的語(yǔ)音處理裝置,還包括 時(shí)間伸縮處理單元,該時(shí)間伸縮處理單元根據(jù)所述時(shí)間長(zhǎng)度控制單元的控制以由所述誤差決定的時(shí)間伸縮比對(duì)所述輸入語(yǔ)音信號(hào)執(zhí)行時(shí)間伸縮處理,并且調(diào)節(jié)所述時(shí)間長(zhǎng)度。
8.一種語(yǔ)音處理裝置的語(yǔ)音處理方法,所述語(yǔ)音處理裝置包括對(duì)輸入語(yǔ)音信號(hào)執(zhí)行音高變換處理并且對(duì)所述輸入語(yǔ)音信號(hào)的音高進(jìn)行變換的音高變換單元,檢測(cè)所預(yù)期的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差的誤差檢測(cè)單元,以及以通過所述誤差的數(shù)量校正所述輸出語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的方式來控制對(duì)所述時(shí)間長(zhǎng)度的調(diào)節(jié)的時(shí)間長(zhǎng)度控制單元,所述方法包括 允許所述音高變換單元對(duì)所述輸入語(yǔ)音信號(hào)執(zhí)行所述音高變換處理; 允許所述誤差檢測(cè)單元檢測(cè)所述誤差;以及 允許所述時(shí)間長(zhǎng)度控制單元控制對(duì)所述時(shí)間長(zhǎng)度的調(diào)節(jié)。
9.一種使得計(jì)算機(jī)執(zhí)行處理的程序,所述處理包括 對(duì)輸入語(yǔ)音信號(hào)執(zhí)行音高變換處理并且對(duì)所述輸入語(yǔ)音信號(hào)的音高進(jìn)行變換; 檢測(cè)所預(yù)期的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差;以及 以通過所述誤差的數(shù)量校正所述輸出語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的方式來控制對(duì)所述時(shí)間長(zhǎng)度 的調(diào)節(jié)。
全文摘要
本申請(qǐng)涉及語(yǔ)音處理裝置、方法和程序。語(yǔ)音處理裝置包括對(duì)輸入語(yǔ)音信號(hào)執(zhí)行音高變換處理并且對(duì)輸入語(yǔ)音信號(hào)的音高進(jìn)行變換的音高變換單元,檢測(cè)所預(yù)期的輸出語(yǔ)音信號(hào)的樣本數(shù)目與實(shí)際輸出的輸出語(yǔ)音信號(hào)的樣本數(shù)目之間的誤差的誤差檢測(cè)單元,以及以通過誤差的數(shù)量校正輸出語(yǔ)音信號(hào)的時(shí)間長(zhǎng)度的方式來控制對(duì)時(shí)間長(zhǎng)度的調(diào)節(jié)的時(shí)間長(zhǎng)度控制單元。
文檔編號(hào)G10L21/04GK102682782SQ20121006569
公開日2012年9月19日 申請(qǐng)日期2012年3月9日 優(yōu)先權(quán)日2011年3月17日
發(fā)明者井上晃, 向井昭廣 申請(qǐng)人:索尼公司