本發(fā)明涉及云計算和云桌面領(lǐng)域,更具體地,涉及一種云桌面系統(tǒng)的災(zāi)難恢復(fù)及動態(tài)遷移系統(tǒng)。
背景技術(shù):
隨著云桌面技術(shù)的普及,云桌面具有隨時隨地均可訪問,能動態(tài)配置等特點促使越來越多的中小企業(yè)將員工的辦公環(huán)境遷往云桌面。為了保持云桌面的可持續(xù)服務(wù),中小企業(yè)往往需要投入雙倍的硬件資源來使得一個云桌面能在兩個不同的服務(wù)器上進行相互同步,并在一個云桌面服務(wù)中斷時能及時切換到另外一個同步的云桌面上繼續(xù)進行服務(wù)。但是在這種模式下,中小企業(yè)雖然能享受云計算所帶來的好處,但是企業(yè)需要承受高昂的成本。這是中小企業(yè)往往所無法承受的。
在現(xiàn)有的解決方案中,均是使用雙桌面互同步的方案來確保云桌面的可持續(xù)服務(wù)。在這種技術(shù)下,企業(yè)往往需要投入雙倍的硬件資源。該技術(shù)的成本問題往往令中小企業(yè)望而卻步。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種云桌面系統(tǒng)的災(zāi)難恢復(fù)及動態(tài)遷移系統(tǒng),該系統(tǒng)可實現(xiàn)當桌面所在機器出現(xiàn)故障時,故障機器上的桌面能被撤離到其他正常運行的服務(wù)器上,同時在正常運作的機器上還能實現(xiàn)動態(tài)負載均衡。
為了達到上述技術(shù)效果,本發(fā)明的技術(shù)方案如下:
一種云桌面系統(tǒng)的災(zāi)難恢復(fù)及動態(tài)遷移系統(tǒng),包括:
遷移管理模塊,提供整機一鍵遷移,桌面批量遷移,單個桌面遷移,集群機器狀態(tài)查詢,機器是否為備用機器的設(shè)置;
集群機器狀態(tài)實時監(jiān)控模塊,通過代理的方式實時監(jiān)測集群中各機器的網(wǎng)絡(luò)狀態(tài)、服務(wù)狀態(tài),負載狀態(tài),以供故障判別及動態(tài)負載均衡處理策略參考;
實時災(zāi)難恢復(fù)及動態(tài)遷移模塊,負責在出現(xiàn)服務(wù)器故障時自動進行故障判別,執(zhí)行故障處理措施并及時通知管理員故障的發(fā)生以及在出現(xiàn)服務(wù)器負載不均衡時根據(jù)服務(wù)器的當前負載狀態(tài)執(zhí)行負載均衡策略。
進一步地,所述遷移管理模塊包括:
1)整機一鍵遷移單元:用于管理員選擇某一主機,發(fā)起一鍵遷移請求,管理系統(tǒng)根據(jù)遷移策略將主機上的所有云桌面遷移或撤離到其他合適的主機上;
2)桌面批量遷移單元:用于管理員選擇多個桌面進行遷移,遷移前由用戶選擇適當?shù)囊慌_主機或多臺主機,管理系統(tǒng)根據(jù)管理員提供的主機信息和系統(tǒng)的遷移策略將所選擇的桌面遷移或撤離到所選擇的主機上;
3)單個桌面遷移單元:用于管理系統(tǒng)根據(jù)遷移策略將該桌面遷移到負載最小的主機上或由用戶指定目的主機,管理系統(tǒng)將該桌面遷移或撤離到目的主機上;
4)集群機器狀態(tài)查詢單元:用于管理員查看集群機器的實時健康狀況;
5)備用機器設(shè)置單元:用于是否設(shè)置機器為備用極,機器設(shè)置為備用機器后,主機不參與新建云桌面的調(diào)度中,只能保留為應(yīng)急使用。
進一步地,所述集群機器狀態(tài)實時監(jiān)控模塊由管理系統(tǒng)的機器狀態(tài)監(jiān)控數(shù)據(jù)接收器和處于各機器上的監(jiān)控代理組成,機器狀態(tài)監(jiān)控數(shù)據(jù)接收器負責接收由監(jiān)控代理反饋的監(jiān)控數(shù)據(jù),并修改管理系統(tǒng)上保存的機器狀態(tài)信息,根據(jù)機器狀態(tài)信息觸發(fā)動態(tài)遷移;處于各機器上的監(jiān)控代理負責收集機器上的運行狀態(tài)并定期發(fā)送給接收器;接收器和監(jiān)控代理之間保持網(wǎng)絡(luò)連接,以便于接收器診斷網(wǎng)絡(luò)狀態(tài),觸發(fā)災(zāi)難恢復(fù)策略,確保云桌面提供持續(xù)服務(wù)。
進一步地,所述實時災(zāi)難恢復(fù)及動態(tài)遷移模塊包括:
災(zāi)難恢復(fù)執(zhí)行器:負責將一臺處于故障機器上的云桌面在其他正常運行的機器上進行重建;
在線遷移執(zhí)行器:負責將一臺處于正常運行的機器上的云桌面無中斷地熱遷移到其他正常運行的機器上,繼續(xù)提供服務(wù);
遷移或撤離計算模塊:根據(jù)監(jiān)控信息對桌面選擇負載最小的主機進行遷移或撤離。
進一步地,所述集群機器健康狀態(tài)包括:訪問網(wǎng)絡(luò)狀態(tài),管理網(wǎng)絡(luò)狀態(tài)以及計算服務(wù)狀態(tài)。
進一步地,所述集群機器的運行狀態(tài)包括當前機器的負載,機器的處理器核心總數(shù),機器的內(nèi)存總數(shù),當前機器上所有運行的云桌面所使用的虛擬CPU數(shù),當前機器上所有運行的云桌面所占用的虛擬內(nèi)存總數(shù)。
進一步地,所述遷移或撤離計算模塊的計算過程包括以下步驟:
a)實時災(zāi)難恢復(fù)及動態(tài)遷移模塊接收并診斷由監(jiān)控模塊提供的機器狀態(tài)信息;
b)實時災(zāi)難恢復(fù)及動態(tài)遷移模塊判斷機器的相關(guān)服務(wù)狀態(tài)是否健康,如訪問網(wǎng)絡(luò)狀態(tài),管理網(wǎng)絡(luò)狀態(tài),計算服務(wù)狀態(tài);
c)如果機器的相關(guān)服務(wù)狀態(tài)不健康,則按情況判斷需采用的故障動作;
d)如果訪問網(wǎng)絡(luò)狀態(tài)正常,管理網(wǎng)絡(luò)狀態(tài)正常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警;
e)如果訪問網(wǎng)絡(luò)狀態(tài)正常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)正常,則發(fā)郵件或短信向管理員告警;
f)如果訪問網(wǎng)絡(luò)狀態(tài)正常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警;
g)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)正常,計算服務(wù)狀態(tài)正常,則發(fā)郵件或短信向管理員告警,并將該主機上的云桌面遷移到其他負載小的機器上;
h)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)正常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警,并將該主機上的云桌面撤離到其他負載小的機器上;
i)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)正常,則發(fā)郵件或短信向管理員告警,等待計算服務(wù)狀態(tài)異常,并將該主機上的云桌面撤離到其他負載小的機器上;
j)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警,并將該主機上的云桌面撤離到其他負載小的機器上;
k)如果機器的相關(guān)服務(wù)狀態(tài)健康,則判斷該機器的負載是否高于半數(shù)集群中的機器負載;
l)如果該機器的負載高于半數(shù)集群中的機器的負載,則選擇部分云桌面遷移到其他負載較小的機器上;
m)如果該機器的負載不高于半數(shù)集群中的機器的負載,則不作任何處理。
與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案的有益效果是:
本發(fā)明能有效地在缺乏大量冗余硬件資源的情況下出現(xiàn)故障時能及時恢復(fù)問題主機上的云桌面的對外服務(wù)能力;在機器健康的情況下能動態(tài)地平衡機器的負載,提供更優(yōu)質(zhì)的桌面體驗。
附圖說明
圖1為本發(fā)明系統(tǒng)的總體架構(gòu)圖;
圖2為本發(fā)明遷移或撤離計算模塊的計算過程流程圖。
具體實施方式
附圖僅用于示例性說明,不能理解為對本專利的限制;
為了更好說明本實施例,附圖某些部件會有省略、放大或縮小,并不代表實際產(chǎn)品的尺寸;
對于本領(lǐng)域技術(shù)人員來說,附圖中某些公知結(jié)構(gòu)及其說明可能省略是可以理解的。
下面結(jié)合附圖和實施例對本發(fā)明的技術(shù)方案做進一步的說明。
實施例1
如圖1所示,一種云桌面系統(tǒng)的災(zāi)難恢復(fù)及動態(tài)遷移系統(tǒng),包括:
遷移管理模塊,提供整機一鍵遷移,桌面批量遷移,單個桌面遷移,集群機器狀態(tài)查詢,機器是否為備用機器的設(shè)置;
集群機器狀態(tài)實時監(jiān)控模塊,通過代理的方式實時監(jiān)測集群中各機器的網(wǎng)絡(luò)狀態(tài)、服務(wù)狀態(tài),負載狀態(tài),以供故障判別及動態(tài)負載均衡處理策略參考;
實時災(zāi)難恢復(fù)及動態(tài)遷移模塊,負責在出現(xiàn)服務(wù)器故障時自動進行故障判別,執(zhí)行故障處理措施并及時通知管理員故障的發(fā)生以及在出現(xiàn)服務(wù)器負載不均衡時根據(jù)服務(wù)器的當前負載狀態(tài)執(zhí)行負載均衡策略。
遷移管理模塊包括:
1)整機一鍵遷移單元:用于管理員選擇某一主機,發(fā)起一鍵遷移請求,管理系統(tǒng)根據(jù)遷移策略將主機上的所有云桌面遷移或撤離到其他合適的主機上;
2)桌面批量遷移單元:用于管理員選擇多個桌面進行遷移,遷移前由用戶選擇適當?shù)囊慌_主機或多臺主機,管理系統(tǒng)根據(jù)管理員提供的主機信息和系統(tǒng)的遷移策略將所選擇的桌面遷移或撤離到所選擇的主機上;
3)單個桌面遷移單元:用于管理系統(tǒng)根據(jù)遷移策略將該桌面遷移到負載最小的主機上或由用戶指定目的主機,管理系統(tǒng)將該桌面遷移或撤離到目的主機上;
4)集群機器狀態(tài)查詢單元:用于管理員查看集群機器的實時健康狀況;
5)備用機器設(shè)置單元:用于是否設(shè)置機器為備用極,機器設(shè)置為備用機器后,主機不參與新建云桌面的調(diào)度中,只能保留為應(yīng)急使用。
集群機器狀態(tài)實時監(jiān)控模塊由管理系統(tǒng)的機器狀態(tài)監(jiān)控數(shù)據(jù)接收器和處于各機器上的監(jiān)控代理組成,機器狀態(tài)監(jiān)控數(shù)據(jù)接收器負責接收由監(jiān)控代理反饋的監(jiān)控數(shù)據(jù),并修改管理系統(tǒng)上保存的機器狀態(tài)信息,根據(jù)機器狀態(tài)信息觸發(fā)動態(tài)遷移;處于各機器上的監(jiān)控代理負責收集機器上的運行狀態(tài)并定期發(fā)送給接收器;接收器和監(jiān)控代理之間保持網(wǎng)絡(luò)連接,以便于接收器診斷網(wǎng)絡(luò)狀態(tài),觸發(fā)災(zāi)難恢復(fù)策略,確保云桌面提供持續(xù)服務(wù)。
實時災(zāi)難恢復(fù)及動態(tài)遷移模塊包括:
災(zāi)難恢復(fù)執(zhí)行器:負責將一臺處于故障機器上的云桌面在其他正常運行的機器上進行重建;
在線遷移執(zhí)行器:負責將一臺處于正常運行的機器上的云桌面無中斷地熱遷移到其他正常運行的機器上,繼續(xù)提供服務(wù);
遷移或撤離計算模塊:根據(jù)監(jiān)控信息對桌面選擇負載最小的主機進行遷移或撤離。
集群機器健康狀態(tài)包括:訪問網(wǎng)絡(luò)狀態(tài),管理網(wǎng)絡(luò)狀態(tài)以及計算服務(wù)狀態(tài);集群機器的運行狀態(tài)包括當前機器的負載,機器的處理器核心總數(shù),機器的內(nèi)存總數(shù),當前機器上所有運行的云桌面所使用的虛擬CPU數(shù),當前機器上所有運行的云桌面所占用的虛擬內(nèi)存總數(shù)。
如圖2所示,遷移或撤離計算模塊的計算過程包括以下步驟:
a)實時災(zāi)難恢復(fù)及動態(tài)遷移模塊接收并診斷由監(jiān)控模塊提供的機器狀態(tài)信息;
b)實時災(zāi)難恢復(fù)及動態(tài)遷移模塊判斷機器的相關(guān)服務(wù)狀態(tài)是否健康,如訪問網(wǎng)絡(luò)狀態(tài),管理網(wǎng)絡(luò)狀態(tài),計算服務(wù)狀態(tài);
c)如果機器的相關(guān)服務(wù)狀態(tài)不健康,則按情況判斷需采用的故障動作;
d)如果訪問網(wǎng)絡(luò)狀態(tài)正常,管理網(wǎng)絡(luò)狀態(tài)正常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警;
e)如果訪問網(wǎng)絡(luò)狀態(tài)正常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)正常,則發(fā)郵件或短信向管理員告警;
f)如果訪問網(wǎng)絡(luò)狀態(tài)正常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警;
g)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)正常,計算服務(wù)狀態(tài)正常,則發(fā)郵件或短信向管理員告警,并將該主機上的云桌面遷移到其他負載小的機器上;
h)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)正常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警,并將該主機上的云桌面撤離到其他負載小的機器上;
i)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)正常,則發(fā)郵件或短信向管理員告警,等待計算服務(wù)狀態(tài)異常,并將該主機上的云桌面撤離到其他負載小的機器上;
j)如果訪問網(wǎng)絡(luò)狀態(tài)異常,管理網(wǎng)絡(luò)狀態(tài)異常,計算服務(wù)狀態(tài)異常,則發(fā)郵件或短信向管理員告警,并將該主機上的云桌面撤離到其他負載小的機器上;
k)如果機器的相關(guān)服務(wù)狀態(tài)健康,則判斷該機器的負載是否高于半數(shù)集群中的機器負載;
l)如果該機器的負載高于半數(shù)集群中的機器的負載,則選擇部分云桌面遷移到其他負載較小的機器上;
m)如果該機器的負載不高于半數(shù)集群中的機器的負載,則不作任何處理。
相同或相似的標號對應(yīng)相同或相似的部件;
附圖中描述位置關(guān)系的用于僅用于示例性說明,不能理解為對本專利的限制;
顯然,本發(fā)明的上述實施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實施方式的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明權(quán)利要求的保護范圍之內(nèi)。