本發(fā)明涉及醫(yī)工交叉領(lǐng)域,尤其涉及一種基于深度學(xué)習(xí)的流行病患者數(shù)量預(yù)測方法及系統(tǒng)。
背景技術(shù):
1、在當(dāng)前的醫(yī)療環(huán)境中,流行性疾病的爆發(fā)和傳播速度使得公共衛(wèi)生系統(tǒng)面臨巨大的挑戰(zhàn),尤其是在資源有限的情況下。流行性疾病的預(yù)測和預(yù)防在很多國家中至關(guān)重要,因為這些疾病可以迅速蔓延,影響大范圍的人口,并且對社會和經(jīng)濟(jì)產(chǎn)生重大影響。隨著時間的推移,醫(yī)療信息的發(fā)展帶來了流行病學(xué)研究的日益復(fù)雜和資源分配的不可預(yù)測性。在當(dāng)前的醫(yī)療環(huán)境中,以大量電子病歷和公共衛(wèi)生數(shù)據(jù)為代表的多樣化臨床信息,迫使公共衛(wèi)生專家和臨床醫(yī)生根據(jù)對大量數(shù)據(jù)的評估做出決定。事實證明,深度學(xué)習(xí)通過有效處理復(fù)雜的輸入數(shù)據(jù)和智能學(xué)習(xí)不同的知識,成功地解決了復(fù)雜的智能任務(wù)。在實踐中,深度學(xué)習(xí)是一種高效的特征提取方法,可以捕捉更抽象的特征,實現(xiàn)對大數(shù)據(jù)更本質(zhì)的描述。在這種情況下,深度學(xué)習(xí)能夠高效捕捉數(shù)據(jù)特征等特點,同時捕捉以往數(shù)據(jù)中的結(jié)構(gòu)變化以及突變點的發(fā)生,有助于流行性疾病的預(yù)測、預(yù)防措施的制定和公共衛(wèi)生資源的合理分配。公開號為cn117540336a的中國發(fā)明申請公開了一種時間序列預(yù)測方法,通過對歷史時間序列數(shù)據(jù)進(jìn)行多變量分解,提取時間序列數(shù)據(jù)中的異常變量數(shù)據(jù)以及季節(jié)性變量數(shù)據(jù)、趨勢變量數(shù)據(jù)、殘差變量數(shù)據(jù),再將提取出的異常變量數(shù)據(jù)以及季節(jié)性變量數(shù)據(jù)、趨勢變量數(shù)據(jù)、殘差變量數(shù)據(jù)與歷史時間序列數(shù)據(jù)一起輸入到預(yù)先訓(xùn)練好的時間序列預(yù)測模型中,利用時間序列預(yù)測模型預(yù)測出目標(biāo)預(yù)測時間的時間序列預(yù)測結(jié)果。然而該方法采用的乘法分解方法在應(yīng)用于流行病患者數(shù)量預(yù)測時會面臨復(fù)雜且巨大的計算量,且該方法采用的注意力機(jī)制主要用于處理異常時間步驟的數(shù)據(jù),重點關(guān)注異常時間點的變化。這種局部化的處理方式應(yīng)用于流行病患者數(shù)量預(yù)測時可能導(dǎo)致模型在捕捉全局趨勢和長期依賴關(guān)系方面存在以下問題:模型過于關(guān)注異常時間點,可能忽略了正常時間步驟中的信息,導(dǎo)致整體預(yù)測的準(zhǔn)確性下降;注意力機(jī)制未能專門處理季節(jié)性特征,無法充分利用數(shù)據(jù)中的周期性變化,這對于流行病預(yù)測中常見的季節(jié)性波動是一個重要缺陷;在數(shù)據(jù)存在長周期特征時,模型可能偏向于短期異常變化,忽視了長期穩(wěn)定的趨勢和模式。這種局限性影響了模型在捕捉全局趨勢和長期依賴關(guān)系方面的能力,從而限制了其在流行病數(shù)據(jù)分析中的應(yīng)用。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于解決現(xiàn)有技術(shù)中的問題。
2、本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:提供一種基于深度學(xué)習(xí)的流行病患者數(shù)量預(yù)測方法,包括以下步驟:
3、構(gòu)建包括長短期記憶網(wǎng)絡(luò)和兩個全連接層的基礎(chǔ)模塊;
4、基于基礎(chǔ)模塊構(gòu)建流行病患者數(shù)量預(yù)測模型并進(jìn)行訓(xùn)練;
5、使用訓(xùn)練好的流行病患者數(shù)量預(yù)測模型實現(xiàn)流行病患者數(shù)量的預(yù)測;
6、所述流行病患者數(shù)量預(yù)測模型包括依次連接的趨勢模塊、季節(jié)模塊、殘差模塊和多頭注意力層;趨勢模塊包括一個基礎(chǔ)模塊和一個多項式函數(shù),用于捕捉輸入數(shù)據(jù)的長期趨勢,輸出趨勢部分,并且將趨勢部分與輸入數(shù)據(jù)的差異作為第一中間殘差部分進(jìn)行下一步的季節(jié)周期特征捕捉;季節(jié)模塊包括一個基礎(chǔ)模塊和一個周期性函數(shù),用于捕捉第一中間殘差部分的季節(jié)規(guī)律,輸出季節(jié)部分,并且將季節(jié)部分與第一中間殘差部分的差異作為第二中間殘差部分進(jìn)行下一步的突變點特征捕捉;殘差模塊包括兩個基礎(chǔ)模塊,接收季節(jié)模塊輸出的第二中間殘差部分,捕捉突變點等不同層次的特征輸出第一殘差部分和第二殘差部分;多頭注意力層接收趨勢部分、季節(jié)部分、第一殘差部分和第二殘差部分,強(qiáng)化對重要信息的處理,同時抑制不相關(guān)或次要信息的影響,輸出結(jié)果經(jīng)過一個全連接層后作為預(yù)測結(jié)果。
7、優(yōu)選的,基礎(chǔ)模塊包含了一個單元數(shù)為256的長短期記憶網(wǎng)絡(luò),緊接兩個神經(jīng)元分別為128和64的全連接層。
8、優(yōu)選的,基礎(chǔ)模塊還包括dropout層。
9、優(yōu)選的,趨勢模塊的多項式函數(shù)表示為:
10、
11、其中,表示基礎(chǔ)模塊包含的網(wǎng)絡(luò)層的正向預(yù)測系數(shù),t=[1,t,...,tp]是t的冪矩陣,t為時間向量,代表預(yù)測步長;p為預(yù)設(shè)值。
12、優(yōu)選的,季節(jié)模塊的周期性函數(shù)表示為:
13、
14、其中,表示基礎(chǔ)模塊包含的網(wǎng)絡(luò)層的正向預(yù)測系數(shù),s=[1,cos(2πt),...,cos(2πit)),sin(2πt),...,sin(2πit))]。
15、優(yōu)選的,所述使用訓(xùn)練好的流行病患者數(shù)量預(yù)測模型實現(xiàn)流行病患者數(shù)量的預(yù)測,包括以下步驟:
16、將觀測數(shù)據(jù)作為輸入數(shù)據(jù),趨勢模塊捕捉輸入數(shù)據(jù)的趨勢結(jié)果作為趨勢部分輸出,輸入數(shù)據(jù)與趨勢結(jié)果的殘差結(jié)果作為第一中間殘差部分輸出;
17、季節(jié)模塊接收第一中間殘差部分,捕捉到季節(jié)規(guī)律結(jié)果之后,輸出季節(jié)部分和第二中間殘差部分;
18、殘差模塊接收第二中間殘差部分,輸出第一殘差部分和第二殘差部分;
19、多頭注意力層接收趨勢部分、季節(jié)部分、第一殘差部分和第二殘差部分,多頭自我注意機(jī)制以賦予不同權(quán)重,輸出結(jié)果經(jīng)過一個全連接層后輸出預(yù)測結(jié)果。
20、優(yōu)選的,所述觀測數(shù)據(jù)包括觀測時間段內(nèi)不同變量的患病數(shù)量數(shù)據(jù);所述變量包括患者性別、患者年齡以及流行病;
21、將觀測時間段內(nèi)不同變量的患病數(shù)量數(shù)據(jù)作為流行病患者數(shù)量預(yù)測模型的輸入數(shù)據(jù),獲得的預(yù)測結(jié)果包括未來不同變量的患病數(shù)量預(yù)測數(shù)據(jù)。
22、本發(fā)明還提供一種基于深度學(xué)習(xí)的流行病患者數(shù)量預(yù)測系統(tǒng)方法,包括:
23、基礎(chǔ)構(gòu)建模塊,構(gòu)建包括長短期記憶網(wǎng)絡(luò)和兩個全連接層的基礎(chǔ)模塊;
24、模型構(gòu)建模塊,基于基礎(chǔ)模塊構(gòu)建流行病患者數(shù)量預(yù)測模型并進(jìn)行訓(xùn)練;
25、預(yù)測模塊,使用訓(xùn)練好的流行病患者數(shù)量預(yù)測模型實現(xiàn)流行病患者數(shù)量的預(yù)測;
26、所述流行病患者數(shù)量預(yù)測模型包括依次連接的趨勢模塊、季節(jié)模塊、殘差模塊和多頭注意力層;趨勢模塊包括一個基礎(chǔ)模塊和一個多項式函數(shù),用于捕捉輸入數(shù)據(jù)的長期趨勢,輸出趨勢部分和第一中間殘差部分;季節(jié)模塊包括一個基礎(chǔ)模塊和一個周期性函數(shù),用于捕捉第一殘差部分的季節(jié)規(guī)律,輸出季節(jié)部分和第二中間殘差部分;殘差模塊包括兩個基礎(chǔ)模塊,接收第二中間殘差部分,輸出第一殘差部分和第二殘差部分;多頭注意力層接收趨勢部分、季節(jié)部分、第一殘差部分和第二殘差部分,強(qiáng)化對重要信息的處理,同時抑制不相關(guān)或次要信息的影響,輸出結(jié)果經(jīng)過一個全連接層后作為模型預(yù)測結(jié)果。本發(fā)明具有如下有益效果:
27、(1)本發(fā)明支持將患者的性別、不同年齡、不同患病系統(tǒng)等多個變量的觀測數(shù)據(jù)輸入預(yù)測模型,并通過擬合觀測數(shù)據(jù)的潛在模式,同時預(yù)測未來時間多個不同變量的患者數(shù)量,能夠同時考慮多個變量之間的相互關(guān)系和依賴性,可以探索不同年齡段、地區(qū)和人群的流感感染模式,為制定針對性的防控策略和醫(yī)療措施提供更全面的分析視角;
28、(2)本發(fā)明的預(yù)測模型包含趨勢模塊、季節(jié)模塊和殘差模塊,考慮了趨勢、季節(jié)性以及突變點等因素,增強(qiáng)了預(yù)測的準(zhǔn)確性和可解釋性,這意味著不僅可以預(yù)測流感病例的數(shù)量,還可以分析其中的變化趨勢和影響因素,為醫(yī)學(xué)臨床和公共衛(wèi)生領(lǐng)域提供更深入的理解;
29、(3)本發(fā)明的預(yù)測模型引入多頭注意力機(jī)制強(qiáng)化對重要信息的處理,同時抑制不相關(guān)或次要信息的影響,支持查看三個模塊的權(quán)重信息,從而分析三個模塊對預(yù)測結(jié)果的影響程度,增強(qiáng)了模型的可解釋性,對預(yù)測結(jié)果提供了更加清晰的分析方式。
30、(4)本發(fā)明的基礎(chǔ)模塊包含一個lstm以及兩個全連接層,通過lstm捕捉上下文信息和長期依賴關(guān)系,緩解梯度消失的問題,全連接層能夠?qū)W習(xí)到輸入數(shù)據(jù)的復(fù)雜非線性關(guān)系,從而適應(yīng)各種類型的數(shù)據(jù)。
31、以下結(jié)合附圖及實施例對本發(fā)明作進(jìn)一步詳細(xì)說明,但本發(fā)明不局限于實施例。