本技術(shù)涉及網(wǎng)絡(luò)安全,尤其涉及一種數(shù)據(jù)共享場景下加密流量數(shù)據(jù)檢測的方法和系統(tǒng)。
背景技術(shù):
1、在數(shù)據(jù)共享的場景下,網(wǎng)絡(luò)節(jié)點之間由于其公開的信道,很容易帶來隱私泄露和安全威脅,現(xiàn)有技術(shù)通常會先加密數(shù)據(jù)再進行傳輸,如何保證加密數(shù)據(jù)通信安全,快速準確檢測加密數(shù)據(jù)是否被篡改或偽造,成為急需解決的問題。以及,如何提高模型的訓(xùn)練效率,也是急需改善的問題。
2、因此,急需一種針對性的數(shù)據(jù)共享場景下加密流量數(shù)據(jù)檢測的方法和系統(tǒng)。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種數(shù)據(jù)共享場景下加密流量數(shù)據(jù)檢測的方法和系統(tǒng),使用過采樣算法和欠采樣算法,解決訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)不平衡的問題,優(yōu)化深度異常檢測模型,參與共享的節(jié)點上傳訓(xùn)練好的模型參數(shù),由控制節(jié)點進行優(yōu)化聚合,再把聚合后的參數(shù)下發(fā)給各個節(jié)點,使得節(jié)點們可以使用相同檢測效果的模型,使用深度異常檢測模型識別出偽造合成或篡改等攻擊,從而保證數(shù)據(jù)通信安全和高效匹配。
2、第一方面,本技術(shù)提供一種數(shù)據(jù)共享場景下加密流量數(shù)據(jù)檢測的方法,所述方法包括:
3、各個普通節(jié)點構(gòu)建和訓(xùn)練深度異常檢測模型;
4、所述深度異常檢測模型通過結(jié)構(gòu)化處理,能從流量數(shù)據(jù)中提取關(guān)鍵特征,該深度異常檢測模型包括輸入層、多個子層、均衡采樣模塊和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);所述輸入層接收不同采樣時間窗口下的多個基礎(chǔ)特征;多個具有不同編碼維度的所述子層對所述多個基礎(chǔ)特征進行編碼,得到層次化的特征表示,生成嵌入空間;所述均衡采樣模塊融合過采樣算法和欠采樣算法,計算各類別特征的平均數(shù),將數(shù)量大于等于該平均數(shù)的特征定義為多數(shù)類特征,將數(shù)量小于該平均數(shù)的特征定義為少數(shù)類特征,對所述多數(shù)類特征采用欠采樣算法,對所述少數(shù)類特征采用過采樣算法,匯總過采樣算法和欠采樣算法的結(jié)果,將該結(jié)果輸入神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);所述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)所述匯總的結(jié)果、檢測異常;
5、其中,所述深度異常檢測模型采用最大邊際損失函數(shù)和多重損失函數(shù)作為優(yōu)化目標,使得具有相似特征的流量在所述嵌入空間聚集在一起,而不同特征的流量隔開一定的距離;
6、所述控制節(jié)點將模型訓(xùn)練任務(wù)下發(fā)到各個普通節(jié)點,由各個普通節(jié)點輸入自己的訓(xùn)練數(shù)據(jù)集,在該普通節(jié)點本地進行訓(xùn)練;
7、所述普通節(jié)點得到訓(xùn)練好的深度異常檢測模型的參數(shù),使用同態(tài)加密算法對模型的參數(shù)進行加密,得到同態(tài)密文,并使用對稱加密算法對該同態(tài)密文進行二次加密,所述同態(tài)加密算法的密鑰只在參與模型訓(xùn)練的普通節(jié)點之間共享,對稱加密密鑰在普通節(jié)點和參與模型聚合的控制節(jié)點之間共享,同時普通節(jié)點和控制節(jié)點之間的通信使用不同的對稱加密密鑰;
8、所述普通節(jié)點將所述訓(xùn)練好的深度異常檢測模型的參數(shù)上傳給控制節(jié)點,由該控制節(jié)點進行優(yōu)化聚合,進而該控制節(jié)點再把聚合的結(jié)果發(fā)給各個普通節(jié)點,統(tǒng)一各個普通節(jié)點的模型參數(shù);
9、普通節(jié)點對用戶上傳的流量數(shù)據(jù)進行清洗、過濾和標準化處理,再由本地經(jīng)過統(tǒng)一參數(shù)后的深度異常檢測模型,識別該流量數(shù)據(jù)是否異常,如果異常則繼續(xù)通過推斷攻擊分析流量數(shù)據(jù)的分布特征,進而推斷出被合成篡改的位置,以及,通過流量數(shù)據(jù)中攜帶的偽身份信息,猜測攻擊者的真實身份;
10、輸出所述識別的結(jié)果,其中包括:被合成篡改的位置、猜測的攻擊者真實身份,提供給用戶使用。
11、第二方面,本技術(shù)提供一種數(shù)據(jù)共享場景下加密流量數(shù)據(jù)檢測的系統(tǒng),所述系統(tǒng)包括:普通節(jié)點、控制節(jié)點、深度異常檢測模型和輸出單元;
12、各個普通節(jié)點,用于構(gòu)建和訓(xùn)練深度異常檢測模型;
13、所述深度異常檢測模型,用于通過結(jié)構(gòu)化處理,能從流量數(shù)據(jù)中提取關(guān)鍵特征,該深度異常檢測模型包括輸入層、多個子層、均衡采樣模塊和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);所述輸入層接收不同采樣時間窗口下的多個基礎(chǔ)特征;多個具有不同編碼維度的所述子層對所述多個基礎(chǔ)特征進行編碼,得到層次化的特征表示,生成嵌入空間;所述均衡采樣模塊融合過采樣算法和欠采樣算法,計算各類別特征的平均數(shù),將數(shù)量大于等于該平均數(shù)的特征定義為多數(shù)類特征,將數(shù)量小于該平均數(shù)的特征定義為少數(shù)類特征,對所述多數(shù)類特征采用欠采樣算法,對所述少數(shù)類特征采用過采樣算法,匯總過采樣算法和欠采樣算法的結(jié)果,將該結(jié)果輸入神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);所述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)所述匯總的結(jié)果、檢測異常;
14、其中,所述深度異常檢測模型采用最大邊際損失函數(shù)和多重損失函數(shù)作為優(yōu)化目標,使得具有相似特征的流量在所述嵌入空間聚集在一起,而不同特征的流量隔開一定的距離;
15、所述控制節(jié)點,用于將模型訓(xùn)練任務(wù)下發(fā)到各個普通節(jié)點,由各個普通節(jié)點輸入自己的訓(xùn)練數(shù)據(jù)集,在該普通節(jié)點本地進行訓(xùn)練;
16、所述普通節(jié)點,還用于得到訓(xùn)練好的深度異常檢測模型的參數(shù),使用同態(tài)加密算法對模型的參數(shù)進行加密,得到同態(tài)密文,并使用對稱加密算法對該同態(tài)密文進行二次加密,所述同態(tài)加密算法的密鑰只在參與模型訓(xùn)練的普通節(jié)點之間共享,對稱加密密鑰在普通節(jié)點和參與模型聚合的控制節(jié)點之間共享,同時普通節(jié)點和控制節(jié)點之間的通信使用不同的對稱加密密鑰;
17、所述普通節(jié)點將所述訓(xùn)練好的深度異常檢測模型的參數(shù)上傳給控制節(jié)點,由該控制節(jié)點進行優(yōu)化聚合,進而該控制節(jié)點再把聚合的結(jié)果發(fā)給各個普通節(jié)點,統(tǒng)一各個普通節(jié)點的模型參數(shù);
18、普通節(jié)點對用戶上傳的流量數(shù)據(jù)進行清洗、過濾和標準化處理,再由本地經(jīng)過統(tǒng)一參數(shù)后的深度異常檢測模型,識別該流量數(shù)據(jù)是否異常,如果異常則繼續(xù)通過推斷攻擊分析流量數(shù)據(jù)的分布特征,進而推斷出被合成篡改的位置,以及,通過流量數(shù)據(jù)中攜帶的偽身份信息,猜測攻擊者的真實身份;
19、輸出單元,用于輸出所述識別的結(jié)果,其中包括:被合成篡改的位置、猜測的攻擊者真實身份,提供給用戶使用。
20、第三方面,本技術(shù)提供一種數(shù)據(jù)共享場景下加密流量數(shù)據(jù)檢測的系統(tǒng),所述系統(tǒng)包括:處理器以及存儲器:
21、所述存儲器用于存儲程序代碼,并將所述程序代碼傳輸給所述處理器;
22、所述處理器用于根據(jù)所述程序代碼中的指令執(zhí)行第一方面各種可能中任一項所述的方法。
23、第四方面,本技術(shù)提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)用于存儲程序代碼,所述程序代碼用于被處理器執(zhí)行實現(xiàn)第一方面各種可能中任一項所述的方法。
24、有益效果
25、本發(fā)明提供一種數(shù)據(jù)共享場景下加密流量數(shù)據(jù)檢測的方法和系統(tǒng),通過使用過采樣算法和欠采樣算法,解決訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)不平衡的問題,優(yōu)化深度異常檢測模型,參與共享的節(jié)點上傳訓(xùn)練好的模型參數(shù),由控制節(jié)點進行優(yōu)化聚合,再把聚合后的參數(shù)下發(fā)給各個節(jié)點,使得節(jié)點們可以使用相同檢測效果的模型,使用深度異常檢測模型識別出偽造合成或篡改等攻擊,從而保證數(shù)據(jù)通信安全和高效匹配,克服現(xiàn)有技術(shù)不能快速準確檢測加密數(shù)據(jù)是否被篡改或偽造的問題。
26、本發(fā)明具有以下優(yōu)點和效果:
27、使用過采樣算法和欠采樣算法,解決訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)不平衡的問題;
28、控制節(jié)點進行優(yōu)化聚合,再把聚合后的參數(shù)下發(fā)給各個節(jié)點,使得節(jié)點們可以使用相同檢測效果的模型;
29、能夠識別出偽造合成或篡改等攻擊,從而保證數(shù)據(jù)通信安全和高效匹配。