專利名稱:同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法
同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法技術領域
本發(fā)明屬于計算機數(shù)據(jù)庫領域,特別涉及一種同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán) 匹配方法。
背景技術:
發(fā)布訂閱系統(tǒng)(HSPUB SUB)是一種使分布式系統(tǒng)中的各個參與者,以發(fā)布訂閱 的方式進行交互式通信的中間件系統(tǒng),發(fā)布者除了發(fā)布信息(發(fā)布者擁有的),還需要具 有選擇訂閱(發(fā)布者需求的)的能力,即發(fā)布和訂閱的角色是對稱的;同構對稱發(fā)布訂閱 系統(tǒng)有著越來越廣泛的應用,如醫(yī)院間器官交換和房子交換等,其中,上面所述的同構 對稱是指在對稱的應用中,用戶擁有和需求的信息采用相同的數(shù)據(jù)結構來描述;環(huán)匹 配是發(fā)布訂閱系統(tǒng)要解決的關鍵問題之一,根據(jù)訂閱的索引結構,發(fā)布訂閱的匹配方法 可以分為如下四類
基于一維索引一維索引結構,如紅黑樹,哈希表,B+樹等,用來索引訂閱 中定義的謂詞并對符合條件的謂詞進行計數(shù);一般的,用相同的操作在相同的屬性中 定義的謂詞被索引在一個索引結構中,主要有兩種基于一維索引的方法Count方法和 Hanson 方法;
基于多維索引在多維空間中,一個訂閱被視為一個對象,并且匹配操作和查 找操作是相同的,主要思想是用多維索引來為訂閱直接建立索引,或者把一個d維超立 方體轉(zhuǎn)換成2d維的點,從而避免多維空間中的嚴重交叉;
基于網(wǎng)絡測試基于測試網(wǎng)絡的技術,首先把訂閱信息存儲到匹配樹上,和謂 詞索引不同,網(wǎng)絡測試技術根據(jù)訂閱信息模塊建立訂閱信息索引樹,每一個非葉子結點 包含一個測試,該結點的邊代表測試的結果,一個葉子節(jié)點包含一個訂閱信息和代表測 試結果的邊,匹配就是通過執(zhí)行每個結點描述的測試和跟蹤測試結果形成的邊來遍歷這 棵匹配樹;
基于圖基于圖匹配的基本觀點,在有向圖中找到環(huán),該有向圖由同構對稱的 發(fā)布訂閱應用中的訂閱建立,圖中的每個結點代表一個訂閱,如果訂閱S1和&匹配,就 可以建立一條從S1到&的帶權有向邊;
前三種匹配方法的目標是在訂閱之間高效地找到一對一匹配,不能直接用于對 稱的匹配,第四種基于圖方法的目標是找到環(huán)匹配的最優(yōu)集,該圖形結構不適用于頻繁 插入和刪除操作的實時應用,在WISA2010中,Botao Wang提出動態(tài)更新的環(huán)匹配算 法,能夠在動態(tài)環(huán)境里高效地找到環(huán)匹配,但是在匹配過程中,生成的環(huán)匹配數(shù)量隨著 環(huán)的長度的增加成指數(shù)增長,需要大量的存儲空間。發(fā)明內(nèi)容
為克服現(xiàn)有方法的不足,本發(fā)明提出一種同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配 方法,本方法只將大于閾值的鏈訂閱存儲在訂閱數(shù)據(jù)庫中,實現(xiàn)用較少的空間求解出絕大多數(shù)的環(huán)匹配。
本發(fā)明方法涉及到的概念包括匹配、鏈訂閱以及環(huán)匹配,其定義分別如下
匹配是指對于都具有2d個屬性的兩個訂閱S” S2和l<i<d,如果Iai e S1和 131+(1£&有交集,那么我們稱S1與&單向擁有-需要匹配,簡稱“單向匹配”,如
圖1 所示,如果同時&與S1也單向匹配,稱S1*^為“匹配”,如圖2所示;
鏈訂閱是指對于一個訂閱集,Ln=P1,…,S1,…,SN},其中η >2,如 果S1和Sw相匹配(l<i<n-l),則Lb叫做長度為η的鏈;Ln由和S1相同的需求謂詞和與 民相同的擁有謂詞組成,被認為和處理成一個訂閱,因此也叫鏈訂閱,如圖3所示;
環(huán)匹配是指對于訂閱集C1^S1,…,S1,…,SJ,其中η >2,如果SJPSw 相匹配(I^n-I),并且Sn與SjB匹配,則Cn叫做長度為η的環(huán)匹配,如圖4所示;
訂閱鏈與環(huán)匹配的不同之處在于環(huán)匹配中Sn必須與S1相匹配,因此環(huán)匹配也 是一個鏈,可以把長度為N環(huán)匹配看作一個鏈,來創(chuàng)建長度為η+1的環(huán)匹配,如圖5所 示;
本發(fā)明的技術方案是這樣實現(xiàn)的同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法包 括以下步驟
步驟1 計算訂閱概率,方法為
在一個訂閱中有兩組謂詞擁有謂詞和需求謂詞,擁有謂詞的概率和需求謂詞 的概率分別定義成Pro。和Prow, —個訂閱被匹配的概率是
Pro = Pro0XProw(1.1)
其中,Pro。被估算為
權利要求
1.一種同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法,其特征在于包括以下步驟步 驟1 :計算訂閱概率,方法為在一個訂閱中有兩組謂詞擁有謂詞和需求謂詞,擁有謂詞的概率和需求謂詞的概 率分別定義成Pro。和Prow, —個訂閱被匹配的概率是 Pr0 = Pro0XProw(1.1)
2.根據(jù)權利要求1所述的同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法,其特征在于 步驟3-2所述的設置過濾訂閱的閾值,方法如下即閾值的大小在選擇度士5%范圍波 動,默認情況下,選擇度和閾值的值大小相等。
3.根據(jù)權利要求1所述的同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法,其特征在于 步驟3-3所述的計算存儲空間,方法為2)計算存儲空間,方法為每個訂閱由若干個屬性組成,每個屬性的描述信息可以用與該屬性對應空間上的一 段間隔來表示,定義間隔的基本單位是1,間隔[S,E]的間隔寬度為Ε-S+l,其中,間隔 寬度為1表示是一個點,即S = E;定義WPWl和OPWl分別表示寬度為1的需求謂詞和擁有謂詞的集合,其中WPWs 和OPWs中的數(shù)值表示該間隔的寬度;計算間隔[S,E]被匹配的概率P1,公式如下
全文摘要
一種同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法,屬于計算機數(shù)據(jù)庫領域,包括以下步驟步驟1計算訂閱概率;步驟2確定鏈訂閱的長度,即拋出長度為MaxLength-1的鏈訂閱;步驟3設置過濾訂閱的閾值并估算節(jié)省的存儲空間;本發(fā)明同構對稱發(fā)布訂閱系統(tǒng)的近似環(huán)匹配方法,采用基于閾值的方法,能夠在得到正確的結果的情況下,節(jié)省出大量的存儲空間;當閾值設置為時,可以在節(jié)省超過50%的空間的情況下求解出約98%的結果;當閾值設置為時,可以在節(jié)省約90%的空間的情況下求解出約90%的結果。
文檔編號G06F17/30GK102024053SQ20101059490
公開日2011年4月20日 申請日期2010年12月17日 優(yōu)先權日2010年12月17日
發(fā)明者于亞新, 王波濤, 王立軍, 譚賢婷 申請人:東北大學