两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法與流程

文檔序號:40613787發(fā)布日期:2025-01-07 21:00閱讀:來源:國知局

技術(shù)特征:

1.一種基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,包括

2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,在所述步驟s50中,音頻區(qū)間未識別有效文本內(nèi)容,識別得到音頻區(qū)間的聲音特征以及特征分類,使第二文本中這類文本的文本區(qū)間無對應(yīng)文本內(nèi)容,但文本區(qū)間對應(yīng)說話對象標記,這類文本是第二文本中的特別文本;

3.根據(jù)權(quán)利要求1或2所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,所述步驟s10中提取視頻文件中的音頻文件的方法,包括

4.根據(jù)權(quán)利要求1或2所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,所述步驟s30中通過聲紋識別對所述音頻文件中的音頻中的不同聲音特征分類的方法包括

5.根據(jù)權(quán)利要求4所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,步驟s50的識別音頻區(qū)間的音頻對應(yīng)的第二文本,包括

6.根據(jù)權(quán)利要求4所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,所述預(yù)處理包括幀切割、對語音的高頻部分進行預(yù)加重、增加語音的高頻分辨率的操作中的任一種或者其組合。

7.一種電子設(shè)備,所述電子設(shè)備包括:一個或多個處理器,存儲器,以及,一個或多個程序;其中,所述一個或多個程序被存儲在所述存儲器中,所述一個或多個程序包括指令,當所述指令被所述電子設(shè)備執(zhí)行時,使得所述電子設(shè)備執(zhí)行權(quán)利要求1~6任一所述方法。

8.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)包括計算機程序,當計算機程序在電子設(shè)備上運行時,使得所述電子設(shè)備執(zhí)行權(quán)利要求1~6任一所述方法。


技術(shù)總結(jié)
一種基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,屬于語音識別領(lǐng)域,為了解決現(xiàn)有分段語音文本識別中較短時間音頻文本處理不準確,導(dǎo)致轉(zhuǎn)錄文本不完整的問題,要點是根據(jù)所述音頻時間標記,將所述第二文本與所述第一文本匹配,對所述第二文本中各音頻區(qū)間的音頻對應(yīng)的文本對應(yīng)在所述第一文本的相應(yīng)的文本位置,根據(jù)第二文本的所述文本區(qū)間標記對所述第一文本的對應(yīng)文本的區(qū)間標記說話對象,所述標記文本區(qū)間的說話對象的第一文本是所述語音轉(zhuǎn)錄所得。

技術(shù)研發(fā)人員:林國凱,王志永,劉詩慧,王勇
受保護的技術(shù)使用者:中檢美亞(廈門)科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/6
當前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
霞浦县| 青田县| 武冈市| 四子王旗| 蒲城县| 通海县| 龙井市| 平陆县| 双辽市| 明星| 广汉市| 涞水县| 崇州市| 达拉特旗| 启东市| 综艺| 苍南县| 金川县| 清徐县| 武胜县| 呼玛县| 平南县| 黑河市| 柳河县| 柘城县| 兴仁县| 霍林郭勒市| 衢州市| 九龙坡区| 绥宁县| 谷城县| 明溪县| 许昌市| 荥经县| 马鞍山市| 元江| 峨山| 灵台县| 天柱县| 自治县| 灵川县|