两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦系統(tǒng)及推薦方法

文檔序號(hào):10726292閱讀:343來(lái)源:國(guó)知局
一種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦系統(tǒng)及推薦方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦系統(tǒng)及推薦方法。針對(duì)新學(xué)生用戶(hù)沒(méi)有歷史評(píng)分的情況,系統(tǒng)以用戶(hù)屬性為基礎(chǔ)計(jì)算用戶(hù)之間相似度,然后根據(jù)近鄰用戶(hù)對(duì)用人單位的評(píng)分預(yù)測(cè)該新用戶(hù)對(duì)用人單位的評(píng)分,預(yù)測(cè)評(píng)分在一定程度上反映了新用戶(hù)對(duì)這些用人單位的興趣度,基于該預(yù)測(cè)評(píng)分即可對(duì)新用戶(hù)進(jìn)行工作推薦??紤]到新用戶(hù)對(duì)用人單位的預(yù)測(cè)評(píng)分可能來(lái)自于不同數(shù)量的近鄰用戶(hù)對(duì)該用人單位的評(píng)分,系統(tǒng)引入評(píng)分支持度評(píng)價(jià)預(yù)測(cè)評(píng)分的可信度,以達(dá)到優(yōu)化推薦效果的目的。在工作推薦領(lǐng)域,用戶(hù)的興趣并不能直接轉(zhuǎn)化成對(duì)用人單位的錄用行為,系統(tǒng)又引入的興趣效能參數(shù),以進(jìn)一步優(yōu)化推薦效果。
【專(zhuān)利說(shuō)明】
一種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦系統(tǒng)及推薦方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘的技術(shù)領(lǐng)域,具體涉及一種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦 系統(tǒng)及推薦方法,適用于工作推薦結(jié)果的優(yōu)化。
【背景技術(shù)】
[0002] 個(gè)性化推薦技術(shù)在電子商務(wù)領(lǐng)域已經(jīng)得到了成功的應(yīng)用,在人力資源領(lǐng)域,工作 推薦系統(tǒng)可以幫助建立求職者和招聘者之間的聯(lián)系。當(dāng)面向高校畢業(yè)生的時(shí)候,工作推薦 系統(tǒng)面臨著一些新的挑戰(zhàn)。例如:學(xué)生通常沒(méi)有工作經(jīng)歷,缺乏工作培訓(xùn),有時(shí)他們也缺乏 明確的求職目標(biāo)。高校需要一種引導(dǎo)性的工作推薦系統(tǒng),將學(xué)生可能的潛在就業(yè)單位在學(xué) 生開(kāi)始求職之前推薦給學(xué)生,以幫助學(xué)生明晰求職目標(biāo),做好求職準(zhǔn)備。在這種情況下,學(xué) 生用戶(hù)沒(méi)有行為信息,屬于冷啟動(dòng)的情況。因此,傳統(tǒng)的基于內(nèi)容或基于協(xié)同過(guò)濾的推薦模 型無(wú)法應(yīng)對(duì)這種情況。高校擁有大量歷史的就業(yè)信息和人才培養(yǎng)數(shù)據(jù)。
[0003] 文南犬《A Hybrid Job Recommendation Framework for University Students》給 出了一種基于學(xué)生用戶(hù)屬性相似度進(jìn)行工作推薦的方法,該方法通過(guò)計(jì)算待就業(yè)學(xué)生用戶(hù) 與已就業(yè)學(xué)生用戶(hù)的屬性相似度,基于相似度將已就業(yè)學(xué)生用戶(hù)的就業(yè)單位直接推薦給待 就業(yè)學(xué)生用戶(hù),并進(jìn)行了推薦優(yōu)化。該方法未考慮學(xué)生用戶(hù)對(duì)用人單位的興趣評(píng)分和投遞 簡(jiǎn)歷的過(guò)程。本發(fā)明的學(xué)生用戶(hù)屬性相似度計(jì)算部分只是利用了該文獻(xiàn)的過(guò)程,但基于相 似度的評(píng)分預(yù)測(cè)及推薦優(yōu)化該文獻(xiàn)未涉及,也不具有本發(fā)明的優(yōu)點(diǎn)。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明要解決的技術(shù)問(wèn)題:克服現(xiàn)有技術(shù)的不足,提供一種面向冷啟動(dòng)學(xué)生用戶(hù) 的工作推薦系統(tǒng)及推薦方法,基于興趣效能的工作推薦優(yōu)化針對(duì)工作推薦雙向選擇的特 點(diǎn),提高了推薦效率。
[0005] 本發(fā)明通過(guò)學(xué)生用戶(hù)屬性計(jì)算待就業(yè)學(xué)生用戶(hù)與已就業(yè)學(xué)生用戶(hù)之間的相似度, 并基于近鄰模型預(yù)測(cè)待就業(yè)學(xué)生用戶(hù)對(duì)某用人單位的評(píng)分。鑒于工作推薦系統(tǒng)的雙向推 薦,及已就業(yè)學(xué)生用戶(hù)對(duì)用人單位評(píng)分?jǐn)?shù)量分布不均等特點(diǎn),提出了評(píng)分支持度和興趣效 能優(yōu)化參數(shù),提供了更好的工作推薦效果。
[0006] 本發(fā)明解決上述技術(shù)問(wèn)題采用的技術(shù)方案:一種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦 系統(tǒng),包括:學(xué)生用戶(hù)屬性模塊、學(xué)生用戶(hù)屬性相似度計(jì)算模塊、基于近鄰模型的預(yù)測(cè)評(píng)分 模塊、基于評(píng)分支持度的工作推薦優(yōu)化模塊和基于興趣效能的工作推薦優(yōu)化模塊;其中:
[0007] 學(xué)生用戶(hù)屬性模塊,用于存儲(chǔ)學(xué)生用戶(hù)屬性,學(xué)生屬性為就業(yè)密切相關(guān)的各類(lèi)信 息,包括專(zhuān)業(yè)、生源地、性別、課程和成績(jī)多種;
[0008] 學(xué)生用戶(hù)屬性相似度計(jì)算模塊,利用學(xué)生用戶(hù)屬性,計(jì)算學(xué)生用戶(hù)屬性相似度;所 述學(xué)生用戶(hù)屬性相似度為學(xué)生用戶(hù)間各屬性相似度加權(quán)之和,如公式1所示,其中X和Y代表 兩個(gè)學(xué)生,ai代表學(xué)生用戶(hù)的某一種屬性,Wi是代表該屬性的權(quán)重,Wi取值在0-1之間,并且 Ewi = 1,即各個(gè)屬性權(quán)重之和為1,
[0009] S(X, V) = ELi w: SLm(Xajl YUi) (1 ):
[0010] 基于近鄰模型的預(yù)測(cè)評(píng)分模塊,根據(jù)屬性相似的已就業(yè)學(xué)生用戶(hù)對(duì)用人單位的評(píng) 分,預(yù)測(cè)待就業(yè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分;基于具有相似屬性的學(xué)生用戶(hù)具有相似的求 職興趣的思想,根據(jù)學(xué)生用戶(hù)屬性相似度計(jì)算結(jié)果,選取與待就業(yè)學(xué)生用戶(hù)相似度大于某 一閾值的近鄰已就業(yè)學(xué)生用戶(hù),并計(jì)算待就業(yè)學(xué)生對(duì)近鄰已就業(yè)學(xué)生用戶(hù)已評(píng)分的用人單 位的預(yù)測(cè)評(píng)分,預(yù)測(cè)評(píng)分計(jì)算如公式2所示,代表學(xué)生用戶(hù)u對(duì)用人單位e的預(yù)測(cè)評(píng)分, KNN(u)代表與待就業(yè)學(xué)生u的屬性相似度大于某一閾值的已就業(yè)學(xué)生集,sim(u,v)代表學(xué) 生用戶(hù)u和v的相似度,代表學(xué)生用戶(hù)v對(duì)用人單位e的評(píng)分;獲得待就業(yè)學(xué)生用戶(hù)對(duì)所有 近鄰已就業(yè)學(xué)生用戶(hù)已評(píng)分用人單位的預(yù)測(cè)評(píng)分后,則根據(jù)預(yù)測(cè)評(píng)分的大小進(jìn)行工作推 薦;
[0012]基于評(píng)分支持度的工作推薦優(yōu)化模塊,用于對(duì)基于預(yù)測(cè)評(píng)分的工作推薦效果的優(yōu) 化,使待就業(yè)學(xué)生用戶(hù)獲得更多的感興趣的推薦;預(yù)測(cè)評(píng)分可能來(lái)源于多個(gè)近鄰已就業(yè)學(xué) 生用戶(hù)對(duì)項(xiàng)目的評(píng)分,也有可能僅來(lái)自一個(gè)近鄰已就業(yè)學(xué)生用戶(hù)對(duì)項(xiàng)目的評(píng)分,來(lái)自多個(gè) 近鄰已就業(yè)學(xué)生用戶(hù)的評(píng)分的預(yù)測(cè)評(píng)分可信度高,來(lái)自少量已就業(yè)學(xué)生用戶(hù)的預(yù)測(cè)評(píng)分的 可信度低;為了降低數(shù)據(jù)稀疏對(duì)預(yù)測(cè)評(píng)分的影響,采用預(yù)測(cè)評(píng)分支持度,定義如公式3所示, 其中sn表示生成預(yù)測(cè)評(píng)分的近鄰已就業(yè)學(xué)生用戶(hù)數(shù),sn max表示所有預(yù)測(cè)評(píng)分的最大近鄰已 就業(yè)學(xué)生用戶(hù)數(shù),snmin表示所有預(yù)測(cè)評(píng)分的最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù),sn的數(shù)值在計(jì)算 預(yù)測(cè)評(píng)分時(shí)同時(shí)獲得,
[0014] 獲得預(yù)測(cè)評(píng)分支持度后,將推薦排序依據(jù)定義為預(yù)測(cè)評(píng)分與評(píng)分支持度乘積,如 公式4所示,
[0015] Sort = ru e * Support ( 1 );
[0016] 基于興趣效能的工作推薦優(yōu)化模塊,用于提升系統(tǒng)的推薦效率,使待就業(yè)學(xué)生用 戶(hù)獲得更大的被錄用的幾率;工作推薦系統(tǒng)是一類(lèi)雙向推薦系統(tǒng),學(xué)生用戶(hù)在選擇用人單 位的同時(shí),用人單位也在選擇學(xué)生用戶(hù),將某用人單位實(shí)際錄用的人數(shù)nofkr與收到學(xué)生用 戶(hù)投遞簡(jiǎn)歷的數(shù)量m nt_st的比值定義為用人單位的興趣效能,如公式5所示,
[0018] 基于興趣效能的工作推薦優(yōu)化模塊可與基于評(píng)分支持度的工作推薦優(yōu)化模塊組 合使用,進(jìn)行用人單位推薦時(shí),將排序依據(jù)定義為基于近鄰模型的預(yù)測(cè)評(píng)分模塊的預(yù)測(cè)評(píng) 分、基于評(píng)分支持度的工作推薦優(yōu)化模塊的評(píng)分支持度、基于興趣效能的工作推薦優(yōu)化模 塊的興趣效能三者的乘積,如公式6所示,
[0019] Sort'. = fu,c * Support * Efficiency. (6 )
[0020] -種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦方法,步驟如下:
[0021] (1)首先需計(jì)算學(xué)生用戶(hù)屬性的相似度,并預(yù)測(cè)評(píng)分,學(xué)生用戶(hù)屬性包括多種數(shù)據(jù) 類(lèi)型,學(xué)生用戶(hù)屬性相似度可定義為學(xué)生用戶(hù)間各屬性相似度加權(quán)之和,如公式1所示,其 中X和Y代表兩個(gè)學(xué)生用戶(hù),Wi是學(xué)生第i個(gè)屬性的權(quán)重,ai代表第i個(gè)屬性。
[0022] S(X, Y) = Σι:=? wf, sim(Xai, Υα.) ( 1)
[0023] (2)獲得了學(xué)生用戶(hù)之間的屬性相似度后,則可利用近鄰模型計(jì)算待就業(yè)學(xué)生用 戶(hù)對(duì)某用人單位的預(yù)測(cè)評(píng)分;預(yù)測(cè)評(píng)分計(jì)算如公式2所示,f u,c代表待就業(yè)學(xué)生用戶(hù)u對(duì)用人 單位e的預(yù)測(cè)評(píng)分,sim(U,v)代表學(xué)生用戶(hù)1!和7的相似度,r ve代表已就業(yè)學(xué)生用戶(hù)v對(duì)用人 單位e的評(píng)分,計(jì)算預(yù)測(cè)評(píng)分的同時(shí),可以獲得用于計(jì)算預(yù)測(cè)評(píng)分的近鄰用戶(hù)數(shù)sn,
[0025] (3)根據(jù)用于生成預(yù)測(cè)評(píng)分的近鄰用戶(hù)數(shù)sn,計(jì)算預(yù)測(cè)評(píng)分的支持度,如公式3所 示,其中sn表示生成預(yù)測(cè)評(píng)分的近鄰學(xué)生用戶(hù)數(shù),snmax表示所有預(yù)測(cè)評(píng)分的最大近鄰學(xué)生 用戶(hù)數(shù),snmin表示所有預(yù)測(cè)評(píng)分的最小近鄰學(xué)生用戶(hù)數(shù),
[0027] (4)根據(jù)用人單位實(shí)際錄用的人數(shù)noffer與收到學(xué)生投遞簡(jiǎn)歷的數(shù)量mnterest的比 值計(jì)算用人單位的興趣效能,如公式5所示,
[0029] (5)將預(yù)測(cè)評(píng)分、評(píng)分支持度與興趣效能的乘積作為工作推薦的依據(jù),如公式5所 示,進(jìn)行工作推薦,
[0030] Sort, = i\, c * Support * Efficiency (5 )
[0031] 本發(fā)明的原理:首先需計(jì)算學(xué)生用戶(hù)屬性的相似度,并預(yù)測(cè)評(píng)分。學(xué)生用戶(hù)屬性包 括多種數(shù)據(jù)類(lèi)型,學(xué)生用戶(hù)屬性相似度可定義為學(xué)生間各屬性相似度加權(quán)之和。如公式1所 示,其中X和Y代表兩個(gè)學(xué)生用戶(hù),^是學(xué)生第i個(gè)屬性的權(quán)重代表第i個(gè)屬性。
[0032] S(^, Y) - Σ/Lt sim(Xa., Υα.) ( 1)
[0033] 獲得了學(xué)生用戶(hù)之間的屬性相似度后,則可利用近鄰模型計(jì)算待就業(yè)學(xué)生對(duì)某用 人單位的預(yù)測(cè)評(píng)分。
[0034] 本發(fā)明特征在于對(duì)預(yù)測(cè)評(píng)分的優(yōu)化,以提升推薦效果:具體包括:
[0035](一)基于評(píng)分支持度的工作推薦優(yōu)化
[0036] 面對(duì)新用戶(hù)冷啟動(dòng)問(wèn)題,利用用戶(hù)的屬性信息進(jìn)行推薦是應(yīng)對(duì)冷啟動(dòng)問(wèn)題的重要 方法。本發(fā)明利用學(xué)生用戶(hù)的屬性信息,計(jì)算學(xué)生用戶(hù)的相似度,并基于近鄰模型進(jìn)行評(píng)分 預(yù)測(cè)?;诮彽耐扑]模型的推薦效果與數(shù)據(jù)的稠密程度密切相關(guān)。預(yù)測(cè)評(píng)分可能來(lái)源于 多個(gè)近鄰用戶(hù)對(duì)項(xiàng)目的評(píng)分,也有可能僅來(lái)自一個(gè)近鄰用戶(hù)對(duì)項(xiàng)目的評(píng)分。若近鄰用戶(hù)對(duì) 某特定項(xiàng)目給予了較高評(píng)分,且僅有該近鄰用戶(hù)對(duì)這個(gè)項(xiàng)目評(píng)分,則待推薦的新用戶(hù)對(duì)這 個(gè)項(xiàng)目的評(píng)分就是該近鄰用戶(hù)對(duì)其的評(píng)分,這個(gè)評(píng)分的可信度顯然是不高的。在工作推薦 領(lǐng)域,由于用人單位的招聘規(guī)模及熱門(mén)程度不同,廣泛存在著評(píng)分不均勻的情況,有些用人 單位獲得了大量評(píng)分,而有些用人單位僅獲得了極少量的評(píng)分。
[0037] 本優(yōu)化方法在利用近鄰模型預(yù)測(cè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分的同時(shí),記錄了 生成該預(yù)測(cè)評(píng)分的近鄰學(xué)生用戶(hù)數(shù)sn,然后計(jì)算該預(yù)測(cè)評(píng)分的支持度,最后根據(jù)預(yù)測(cè)評(píng)分 和支持度進(jìn)行工作推薦。
[0038]預(yù)測(cè)評(píng)分支持度參數(shù),定義如下:
[0040]其中sn表示生成預(yù)測(cè)評(píng)分的近鄰已就業(yè)學(xué)生用戶(hù)數(shù),snmax表示所有預(yù)測(cè)評(píng)分的最 大近鄰已就業(yè)學(xué)生用戶(hù)數(shù),snmin表示所有預(yù)測(cè)評(píng)分的最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù),將生成 預(yù)測(cè)評(píng)分的近鄰已就業(yè)學(xué)生用戶(hù)數(shù)與所有預(yù)測(cè)評(píng)分的最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù)的差值 跟所有預(yù)測(cè)評(píng)分的最大近鄰已就業(yè)學(xué)生用戶(hù)數(shù)與最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù)的差值的比 值作為預(yù)測(cè)評(píng)分的支持度。
[0041 ]獲得預(yù)測(cè)評(píng)分支持度后,將推薦排序依據(jù)定義為預(yù)測(cè)評(píng)分與評(píng)分支持度乘積,如 公式(3)所示。
[0042] Sort = ru>e * Support (3)
[0043] (二)基于興趣效能的工作推薦優(yōu)化
[0044] 評(píng)分預(yù)測(cè)的最終目的是將符合用戶(hù)的興趣的項(xiàng)目推薦給用戶(hù),并且用戶(hù)對(duì)該項(xiàng)目 產(chǎn)生購(gòu)買(mǎi)或其他行為,而不是預(yù)測(cè)評(píng)分是否符合用戶(hù)最終對(duì)該項(xiàng)目的評(píng)分。在實(shí)際推薦過(guò) 程中,往往會(huì)出現(xiàn)用戶(hù)對(duì)推薦列表中的某個(gè)項(xiàng)目感興趣,但由于各種原因最終并沒(méi)有產(chǎn)生 購(gòu)買(mǎi)等行為。在這種情況下,推薦雖然符合了用戶(hù)的興趣,但可能并不滿(mǎn)足用戶(hù)的實(shí)際需 求,這種推薦可以認(rèn)為是低效的或者無(wú)效的。工作推薦是一類(lèi)雙向推薦系統(tǒng),這樣的問(wèn)題更 為明顯。根據(jù)學(xué)生的特點(diǎn)為學(xué)生推薦用人單位,推薦單位若符合學(xué)生的興趣,學(xué)生就會(huì)投遞 簡(jiǎn)歷。當(dāng)學(xué)生發(fā)生投遞簡(jiǎn)歷的行為時(shí),可以認(rèn)為推薦有效。但是,學(xué)生投遞簡(jiǎn)歷的最終目的 是獲得用人單位的錄用,若不能獲得錄用,推薦其實(shí)是無(wú)效的。由于求職招聘是一類(lèi)雙向選 擇的過(guò)程,學(xué)生最終能否獲得錄用取決于用人單位的需求與學(xué)生的能力的匹配程度,而不 是學(xué)生的主觀(guān)意愿,因此常常會(huì)出現(xiàn)學(xué)生投遞了大量的簡(jiǎn)歷而沒(méi)有獲得錄用的情況。
[0045] 本優(yōu)化方法將某用人單位實(shí)際錄用的人數(shù)noffa與收到學(xué)生用戶(hù)投遞簡(jiǎn)歷的數(shù)量 nint_st的比值定義為用人單位的興趣效能,如公式(4)所示:
[0047] 進(jìn)行用人單位推薦時(shí),將排序依據(jù)定義為預(yù)測(cè)評(píng)分、評(píng)分支持度和興趣效能三者 的乘積,如公式(5)所示:
[0048] Sort, = rq;e * Support * Efficiency CS)
[0049] 本發(fā)明的原理在于:
[0050] -種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦系統(tǒng),系統(tǒng)通過(guò)計(jì)算學(xué)生用戶(hù)屬性相似度進(jìn) 行評(píng)分預(yù)測(cè)應(yīng)對(duì)學(xué)生用戶(hù)的冷啟動(dòng)問(wèn)題。針對(duì)預(yù)測(cè)評(píng)分系統(tǒng)給出了兩種優(yōu)化方法:基于評(píng) 分支持度的工作推薦優(yōu)化和基于興趣效能的工作推薦優(yōu)化。基于評(píng)分支持度的工作推薦優(yōu) 化通過(guò)評(píng)分支持度參數(shù)降低了稀疏且分布不均的歷史評(píng)分?jǐn)?shù)據(jù)對(duì)推薦的影響,提升了推薦 效果?;谂d趣效能的工作推薦優(yōu)化針對(duì)工作推薦雙向選擇的特點(diǎn),通過(guò)興趣效能參數(shù)考 量了應(yīng)聘某用人單位競(jìng)爭(zhēng)的激烈程度,提高了推薦效率。
[0051] 本發(fā)明優(yōu)點(diǎn)及功效在于:
[0052] (1)本發(fā)明采用學(xué)生用戶(hù)屬性計(jì)算學(xué)生相似度,進(jìn)行評(píng)分預(yù)測(cè)有效地應(yīng)對(duì)了新學(xué) 生用戶(hù)沒(méi)有歷史評(píng)分的冷啟動(dòng)問(wèn)題;
[0053] (2)本發(fā)明通過(guò)評(píng)分支持度參數(shù)考量了預(yù)測(cè)評(píng)分的可信度,降低了數(shù)據(jù)稀疏的影 響,提升了推薦效果;
[0054] (3)本發(fā)明通過(guò)興趣效能參數(shù)考量學(xué)生用戶(hù)獲得用人單位錄用的可能性,提高了 推薦效率。
[0055] 本發(fā)明優(yōu)點(diǎn)及功效(1)中,學(xué)生用戶(hù)屬性相似度計(jì)算方法與文獻(xiàn)《A Hybrid Job Recommendation Framework for University Students》中所提及方法相同,但是該文獻(xiàn) 未使用屬性相似度進(jìn)行待就業(yè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分預(yù)測(cè),優(yōu)點(diǎn)及功效(2)、(3)該文 獻(xiàn)未涉及,而且本發(fā)明提出的評(píng)分支持度和興趣效能優(yōu)化參數(shù),提供了更好的工作推薦效 果。
【附圖說(shuō)明】
[0056] 圖1是面向冷啟動(dòng)學(xué)生用戶(hù)工作推薦系統(tǒng)框架圖;
[0057]圖2是基于屬性的評(píng)分預(yù)測(cè)模型處理流程。
【具體實(shí)施方式】
[0058]基于具有相似屬性的用戶(hù)有著相似的興趣這一思想,通過(guò)分析就業(yè)歷史數(shù)據(jù),并 結(jié)合求職招聘領(lǐng)域的特點(diǎn),可以發(fā)現(xiàn)具有相似條件的學(xué)生就業(yè)去向相近。本發(fā)明基于學(xué)生 屬性信息構(gòu)建了一個(gè)面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦系統(tǒng)。
[0059] 本發(fā)明通過(guò)針對(duì)待就業(yè)學(xué)生用戶(hù)沒(méi)有歷史評(píng)分的情況,系統(tǒng)以學(xué)生屬性為基礎(chǔ)計(jì) 算用待就業(yè)學(xué)生用戶(hù)與已就業(yè)學(xué)生用戶(hù)間相似度,然后根據(jù)近鄰已就業(yè)學(xué)生用戶(hù)對(duì)用人單 位的評(píng)分預(yù)測(cè)該待就業(yè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分,基于該預(yù)測(cè)評(píng)分即可對(duì)待就業(yè)學(xué)生用 戶(hù)進(jìn)行工作推薦。考慮到待就業(yè)學(xué)生用戶(hù)對(duì)用人單位的預(yù)測(cè)評(píng)分可能來(lái)自于不同數(shù)量的近 鄰已就業(yè)用戶(hù)對(duì)該用人單位的評(píng)分,系統(tǒng)引入評(píng)分支持度評(píng)價(jià)預(yù)測(cè)評(píng)分的可信度,以達(dá)到 優(yōu)化推薦效果的目的。在工作推薦領(lǐng)域,學(xué)生用戶(hù)的興趣并不能直接轉(zhuǎn)化成對(duì)用人單位的 錄用行為,系統(tǒng)又引入的興趣效能參數(shù),以進(jìn)一步優(yōu)化推薦效果。
[0060] 1.學(xué)生用戶(hù)屬性相似度計(jì)算
[0061] 圖示如圖1所示。系統(tǒng)進(jìn)行推薦的基礎(chǔ)是學(xué)生屬性相似度的計(jì)算,鑒于學(xué)生屬性包 含多種數(shù)據(jù)類(lèi)型,學(xué)生用戶(hù)屬性相似度可通過(guò)學(xué)生用戶(hù)間各屬性相似度加權(quán)之和計(jì)算。如 公式1所示,其中X和Y代表兩個(gè)學(xué)生用戶(hù),^是學(xué)生第i個(gè)屬性的權(quán)重代表第i個(gè)屬性。
[0062] S:(^, r) = wt sim(xa., (1)
[0063] 學(xué)生用戶(hù)屬性中的相似度定義為若屬性值相同相似度為1,如屬性值不同相似度 為〇,形式化定義如下:
[0065]學(xué)生用戶(hù)屬性中的數(shù)字型屬性相似度計(jì)算公式如下所示,其中氣代表 屬性ai取值的最大值和最小值。
[0067]本發(fā)明系統(tǒng)中使用學(xué)生專(zhuān)業(yè)、生源地和平均成績(jī)?nèi)齻€(gè)屬性作為相似度計(jì)算依據(jù), 專(zhuān)業(yè)和生源地為枚舉屬性,平均成績(jī)?yōu)閿?shù)值屬性。
[0068] 專(zhuān)業(yè)是影響學(xué)生求職的重要因素。專(zhuān)業(yè)相似度如果能準(zhǔn)確地體現(xiàn)出專(zhuān)業(yè)間的差 異,將為工作推薦提供有力的支持。但是專(zhuān)業(yè)數(shù)據(jù)信息為專(zhuān)業(yè)的名稱(chēng),是枚舉型的,根據(jù)對(duì) 枚舉型數(shù)據(jù)相似度的定義,兩個(gè)學(xué)生用戶(hù)的專(zhuān)業(yè)名稱(chēng)相同則專(zhuān)業(yè)相似度為1,不同則為0。用 專(zhuān)業(yè)名稱(chēng)衡量專(zhuān)業(yè)的相似度太粗粒度了,是不夠準(zhǔn)確的。例如:計(jì)算機(jī)應(yīng)用技術(shù)專(zhuān)業(yè)與電子 信息工程專(zhuān)業(yè)之間的相似度明顯應(yīng)大于其與經(jīng)濟(jì)管理專(zhuān)業(yè)的相似度。同時(shí),對(duì)于同專(zhuān)業(yè)的 學(xué)生來(lái)說(shuō),其研究方向不同,就業(yè)的方向也存在著明顯的差異。例如,計(jì)算機(jī)應(yīng)用技術(shù)專(zhuān)業(yè) 中的虛擬現(xiàn)實(shí)方向和工程應(yīng)用方向,其就業(yè)方向也存在著明顯的不同。因此,利用專(zhuān)業(yè)名稱(chēng) 計(jì)算專(zhuān)業(yè)相似度既不能準(zhǔn)確體現(xiàn)出專(zhuān)業(yè)之間的差異,也不無(wú)法反映專(zhuān)業(yè)內(nèi)部的差異。高校 為不同專(zhuān)業(yè)的學(xué)生提供了不同的培養(yǎng)計(jì)劃,培養(yǎng)計(jì)劃中既包括公共基礎(chǔ)課,又包含了專(zhuān)業(yè) 基礎(chǔ)課和專(zhuān)業(yè)方向課。學(xué)生可以根據(jù)自己的專(zhuān)業(yè)方向和專(zhuān)業(yè)興趣選修相應(yīng)的課程。本發(fā)明 使用課程集的相似度作為專(zhuān)業(yè)的相似度。課程集相似度計(jì)算公式如下所示,其中C(X)和C (Y)代表學(xué)生所修課程集。
[0070]系統(tǒng)分別學(xué)生用戶(hù)之間課程集、生源地和平均成績(jī)的相似度,然后計(jì)算學(xué)生用戶(hù) 之間的總相似度,各屬性權(quán)重通過(guò)超參數(shù)檢驗(yàn),根據(jù)推薦效果獲得。
[0071] 2、待就業(yè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分預(yù)測(cè)及工作推薦
[0072] 如圖2所示,獲得學(xué)生用戶(hù)屬性相似度后可進(jìn)行評(píng)分預(yù)測(cè)。預(yù)測(cè)評(píng)分計(jì)算公式如下 所示,e代表待就業(yè)學(xué)生用戶(hù)u對(duì)用人單位e的預(yù)測(cè)評(píng)分,sim(u,v)代表待就業(yè)學(xué)生用戶(hù)u 和已就業(yè)學(xué)生用戶(hù)v的相似度,r ve代表已就業(yè)學(xué)生用戶(hù)v對(duì)用人單位e的評(píng)分。
[0074] 獲得了待就業(yè)學(xué)生用戶(hù)的對(duì)用人單位的預(yù)測(cè)評(píng)分后,則可根據(jù)評(píng)分的大小進(jìn)行推 薦,算法如下。
[0075] 算法1:基于預(yù)測(cè)評(píng)分的工作推薦算法 [0076]輸入:待就業(yè)學(xué)生用戶(hù)u、已就業(yè)學(xué)生用戶(hù)集V [0077] 輸出:推薦工作單位列表E
[0078] a.算法首先計(jì)算待就業(yè)學(xué)生用戶(hù)u與所有已就業(yè)學(xué)生用戶(hù)集V中的每一個(gè)學(xué)生用 戶(hù)v之間的屬性相似度,依據(jù)相似度大小對(duì)已有用戶(hù)集V進(jìn)行排序;
[0079] b.選取與待就業(yè)學(xué)生用戶(hù)u最相似的K個(gè)已就業(yè)學(xué)生用戶(hù),獲得K個(gè)已就業(yè)學(xué)生用 戶(hù)的就業(yè)單位列表,并匯總為單位列表E;
[0080] c.根據(jù)K個(gè)最相似已就業(yè)學(xué)生用戶(hù)對(duì)單位列表E中的每個(gè)單位e的評(píng)分,計(jì)算加權(quán) 平均分,作為待就業(yè)學(xué)生用戶(hù)u對(duì)單位e的預(yù)測(cè)評(píng)分;
[0081] d.根據(jù)預(yù)測(cè)評(píng)分對(duì)單位列表E進(jìn)行排序,系統(tǒng)可以根據(jù)需要推薦前N個(gè)項(xiàng)目。
[0082] 3、基于評(píng)分支持度的工作推薦優(yōu)化
[0083]本系統(tǒng)利用學(xué)生用戶(hù)的屬性信息,計(jì)算學(xué)生用戶(hù)的相似度,并基于近鄰模型進(jìn)行 評(píng)分預(yù)測(cè)?;诮彽耐扑]模型的推薦效果與數(shù)據(jù)的稠密程度密切相關(guān)。預(yù)測(cè)評(píng)分可能來(lái) 源于多個(gè)近鄰用戶(hù)對(duì)項(xiàng)目的評(píng)分,也有可能僅來(lái)自一個(gè)近鄰用戶(hù)對(duì)項(xiàng)目的評(píng)分。若近鄰用 戶(hù)對(duì)某特定項(xiàng)目給予了較高評(píng)分,且僅有該近鄰用戶(hù)對(duì)這個(gè)項(xiàng)目評(píng)分,則待推薦的新用戶(hù) 對(duì)這個(gè)項(xiàng)目的評(píng)分就是該近鄰用戶(hù)對(duì)其的評(píng)分,這個(gè)評(píng)分的可信度顯然是不高的。在工作 推薦領(lǐng)域,由于用人單位的招聘規(guī)模及熱門(mén)程度不同,廣泛存在著評(píng)分不均勻的情況,有些 用人單位獲得了大量評(píng)分,而有些用人單位僅獲得了極少量的評(píng)分。
[0084]本發(fā)明方法在利用近鄰模型預(yù)測(cè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分的同時(shí),記錄了 生成該預(yù)測(cè)評(píng)分的近鄰已就業(yè)學(xué)生用戶(hù)數(shù)sn,然后計(jì)算該預(yù)測(cè)評(píng)分的支持度,最后根據(jù)預(yù) 測(cè)評(píng)分和支持度進(jìn)行工作推薦。
[0085]預(yù)測(cè)評(píng)分支持度參數(shù),定義如下:
[0087]其中sn表示生成預(yù)測(cè)評(píng)分的近鄰已就業(yè)學(xué)生用戶(hù)數(shù),snmax表示所有預(yù)測(cè)評(píng)分的最 大近鄰已就業(yè)學(xué)生用戶(hù)數(shù),snmin表示所有預(yù)測(cè)評(píng)分的最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù),將生成 預(yù)測(cè)評(píng)分的近鄰已就業(yè)學(xué)生用戶(hù)數(shù)與所有預(yù)測(cè)評(píng)分的最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù)的差值 跟所有預(yù)測(cè)評(píng)分的最大近鄰已就業(yè)學(xué)生用戶(hù)數(shù)與最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù)的差值的比 值作為預(yù)測(cè)評(píng)分的支持度。
[0088] 獲得預(yù)測(cè)評(píng)分支持度后,將推薦排序依據(jù)定義為預(yù)測(cè)評(píng)分與評(píng)分支持度乘積,公 式如下所示。
[0089] Sort = fLi c * Support (7)
[0090] 4、基于興趣效能的工作推薦優(yōu)化
[0091] 評(píng)分預(yù)測(cè)的最終目的是將符合用戶(hù)的興趣的項(xiàng)目推薦給用戶(hù),并且用戶(hù)對(duì)該項(xiàng)目 產(chǎn)生購(gòu)買(mǎi)或其他行為,而不是預(yù)測(cè)評(píng)分是否符合用戶(hù)最終對(duì)該項(xiàng)目的評(píng)分。在實(shí)際推薦過(guò) 程中,往往會(huì)出現(xiàn)用戶(hù)對(duì)推薦列表中的某個(gè)項(xiàng)目感興趣,但由于各種原因最終并沒(méi)有產(chǎn)生 購(gòu)買(mǎi)等行為。在這種情況下,推薦雖然符合了用戶(hù)的興趣,但可能并不滿(mǎn)足用戶(hù)的實(shí)際需 求,這種推薦可以認(rèn)為是低效的或者無(wú)效的。工作推薦是一類(lèi)雙向推薦系統(tǒng),這樣的問(wèn)題更 為明顯。根據(jù)學(xué)生的特點(diǎn)為學(xué)生推薦用人單位,推薦單位若符合學(xué)生的興趣,學(xué)生就會(huì)投遞 簡(jiǎn)歷。當(dāng)學(xué)生發(fā)生投遞簡(jiǎn)歷的行為時(shí),可以認(rèn)為推薦有效。但是,學(xué)生投遞簡(jiǎn)歷的最終目的 是獲得用人單位的錄用,若不能獲得錄用,推薦其實(shí)是無(wú)效的。由于求職招聘是一類(lèi)雙向選 擇的過(guò)程,學(xué)生最終能否獲得錄用取決于用人單位的需求與學(xué)生的能力的匹配程度,而不 是學(xué)生的主觀(guān)意愿,因此常常會(huì)出現(xiàn)學(xué)生投遞了大量的簡(jiǎn)歷而沒(méi)有獲得錄用的情況。
[0092] 本發(fā)明將某用人單位實(shí)際錄用的人數(shù)與收到學(xué)生用戶(hù)投遞簡(jiǎn)歷的數(shù)量 nint_st的比值定義為用人單位的興趣效能,公式如下所示:
[0094] 進(jìn)行用人單位推薦時(shí),將排序依據(jù)定義為預(yù)測(cè)評(píng)分、評(píng)分支持度和興趣效能三者 的乘積,公式如下所示:
[0095] Sort' = * Support * Efficiency C 9 )...
[0096] 提供以上實(shí)施例僅僅是為了描述本發(fā)明的目的,而并非要限制本發(fā)明的范圍。本 發(fā)明的范圍由所附權(quán)利要求限定。不脫離本發(fā)明的精神和原理而做出的各種等同替換和修 改,均應(yīng)涵蓋在本發(fā)明的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦系統(tǒng),其特征在于:包括學(xué)生用戶(hù)屬性模塊、學(xué) 生用戶(hù)屬性相似度計(jì)算模塊、基于近鄰模型的預(yù)測(cè)評(píng)分模塊、基于評(píng)分支持度的工作推薦 優(yōu)化模塊和基于興趣效能的工作推薦優(yōu)化模塊;其中: 學(xué)生用戶(hù)屬性模塊,用于存儲(chǔ)學(xué)生用戶(hù)屬性,學(xué)生屬性為就業(yè)密切相關(guān)的各類(lèi)信息,包 括專(zhuān)業(yè)、生源地、性別、課程和成績(jī)多種; 學(xué)生用戶(hù)屬性相似度計(jì)算模塊,利用學(xué)生用戶(hù)屬性,計(jì)算學(xué)生用戶(hù)屬性相似度;所述學(xué) 生用戶(hù)屬性相似度為學(xué)生用戶(hù)間各屬性相似度加權(quán)之和,如公式1所示,其中X和Y代表兩個(gè) 學(xué)生,日1代表學(xué)生用戶(hù)的某一種屬性,Wi是代表該屬性的權(quán)重,Wi取值在0-1之間,并且Ewi =1,即各個(gè)屬性權(quán)重之和為1,(1); 基于近鄰模型的預(yù)測(cè)評(píng)分模塊,根據(jù)屬性相似的已就業(yè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分, 預(yù)測(cè)待就業(yè)學(xué)生用戶(hù)對(duì)用人單位的評(píng)分;基于具有相似屬性的學(xué)生用戶(hù)具有相似的求職興 趣的思想,根據(jù)學(xué)生用戶(hù)屬性相似度計(jì)算結(jié)果,選取與待就業(yè)學(xué)生用戶(hù)相似度大于某一闊 值的近鄰已就業(yè)學(xué)生用戶(hù),并計(jì)算待就業(yè)學(xué)生對(duì)近鄰已就業(yè)學(xué)生用戶(hù)已評(píng)分的用人單位的 預(yù)測(cè)評(píng)分,預(yù)測(cè)評(píng)分計(jì)算如公式2所示,Pu,e代表學(xué)生用戶(hù)U對(duì)用人單位e的預(yù)測(cè)評(píng)分,K順(U) 代表與待就業(yè)學(xué)生U的屬性相似度大于某一闊值的已就業(yè)學(xué)生集,sim(u,v)代表學(xué)生用戶(hù)U 和V的相似度,rve代表學(xué)生用戶(hù)V對(duì)用人單位e的評(píng)分;獲得待就業(yè)學(xué)生用戶(hù)對(duì)所有近鄰已就 業(yè)學(xué)生用戶(hù)已評(píng)分用人單位的預(yù)測(cè)評(píng)分后,則根據(jù)預(yù)測(cè)評(píng)分的大小進(jìn)行工作推薦;(2) 基于評(píng)分支持度的工作推薦優(yōu)化模塊,用于對(duì)基于預(yù)測(cè)評(píng)分的工作推薦效果的優(yōu)化, 使待就業(yè)學(xué)生用戶(hù)獲得更多的感興趣的推薦;預(yù)測(cè)評(píng)分可能來(lái)源于多個(gè)近鄰已就業(yè)學(xué)生用 戶(hù)對(duì)項(xiàng)目的評(píng)分,也有可能僅來(lái)自一個(gè)近鄰已就業(yè)學(xué)生用戶(hù)對(duì)項(xiàng)目的評(píng)分,來(lái)自多個(gè)近鄰 已就業(yè)學(xué)生用戶(hù)的評(píng)分的預(yù)測(cè)評(píng)分可信度高,來(lái)自少量已就業(yè)學(xué)生用戶(hù)的預(yù)測(cè)評(píng)分的可信 度低;為了降低數(shù)據(jù)稀疏對(duì)預(yù)測(cè)評(píng)分的影響,采用預(yù)測(cè)評(píng)分支持度,定義如公式3所示,其中 sn表示生成預(yù)測(cè)評(píng)分的近鄰已就業(yè)學(xué)生用戶(hù)數(shù),Snmax表示所有預(yù)測(cè)評(píng)分的最大近鄰已就業(yè) 學(xué)生用戶(hù)數(shù),snmin表示所有預(yù)測(cè)評(píng)分的最小近鄰已就業(yè)學(xué)生用戶(hù)數(shù),sn的數(shù)值在計(jì)算預(yù)測(cè) 評(píng)分時(shí)同時(shí)獲得,(3) 獲得預(yù)測(cè)評(píng)分支持度后,將推薦排序依據(jù)定義為預(yù)測(cè)評(píng)分與評(píng)分支持度乘積,如公式4 所示,(4) ; 基于興趣效能的工作推薦優(yōu)化模塊,用于提升系統(tǒng)的推薦效率,使待就業(yè)學(xué)生用戶(hù)獲 得更大的被錄用的幾率;工作推薦系統(tǒng)是一類(lèi)雙向推薦系統(tǒng),學(xué)生用戶(hù)在選擇用人單位的 同時(shí),用人單位也在選擇學(xué)生用戶(hù),將某用人單位實(shí)際錄用的人數(shù)noffer與收到學(xué)生用戶(hù)投 遞簡(jiǎn)歷的數(shù)量mnterest的比值定義為用人單位的興趣效能,如公式5所示,(5) 基于興趣效能的工作推薦優(yōu)化模塊可與基于評(píng)分支持度的工作推薦優(yōu)化模塊組合使 用,進(jìn)行用人單位推薦時(shí),將排序依據(jù)定義為基于近鄰模型的預(yù)測(cè)評(píng)分模塊的預(yù)測(cè)評(píng)分、基 于評(píng)分支持度的工作推薦優(yōu)化模塊的評(píng)分支持度、基于興趣效能的工作推薦優(yōu)化模塊的興 趣效能Ξ者的乘積,如公式6所示,(6)。2.-種面向冷啟動(dòng)學(xué)生用戶(hù)的工作推薦方法,其特征在于步驟如下: (1) 首先需計(jì)算學(xué)生用戶(hù)屬性的相似度,并預(yù)測(cè)評(píng)分,學(xué)生用戶(hù)屬性包括多種數(shù)據(jù)類(lèi) 型,學(xué)生用戶(hù)屬性相似度可定義為學(xué)生用戶(hù)間各屬性相似度加權(quán)之和,如公式1所示,其中X 和Y代表兩個(gè)學(xué)生用戶(hù),wi是學(xué)生第i個(gè)屬性的權(quán)重,ai代表第i個(gè)屬性。(1) (2) 獲得了學(xué)生用戶(hù)之間的屬性相似度后,則可利用近鄰模型計(jì)算待就業(yè)學(xué)生用戶(hù)對(duì) 某用人單位的預(yù)測(cè)評(píng)分;預(yù)測(cè)評(píng)分計(jì)算如公式2所示,fu,e代表待就業(yè)學(xué)生用戶(hù)U對(duì)用人單位 e的預(yù)測(cè)評(píng)分,sim(u,v)代表學(xué)生用戶(hù)U和V的相似度,rve代表已就業(yè)學(xué)生用戶(hù)V對(duì)用人單位e 的評(píng)分,計(jì)算預(yù)測(cè)評(píng)分的同時(shí),可W獲得用于計(jì)算預(yù)測(cè)評(píng)分的近鄰用戶(hù)數(shù)sn,(2) (3) 根據(jù)用于生成預(yù)測(cè)評(píng)分的近鄰用戶(hù)數(shù)sn,計(jì)算預(yù)測(cè)評(píng)分的支持度,如公式3所示,其 中sn表示生成預(yù)測(cè)評(píng)分的近鄰學(xué)生用戶(hù)數(shù),Snmax表示所有預(yù)測(cè)評(píng)分的最大近鄰學(xué)生用戶(hù) 數(shù),snmin表示所有預(yù)測(cè)評(píng)分的最小近鄰學(xué)生用戶(hù)數(shù),(3) (4) 根據(jù)用人單位實(shí)際錄用的人數(shù)noffer與收到學(xué)生投遞簡(jiǎn)歷的數(shù)量mnterest的比值計(jì)算 用人單位的興趣效能,如公式5所示,<:4> (5) 將預(yù)測(cè)評(píng)分、評(píng)分支持度與興趣效能的乘積作為工作推薦的依據(jù),如公式5所示,進(jìn) 行工作推薦,(百)。
【文檔編號(hào)】G06Q50/20GK106097204SQ201610474388
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月24日
【發(fā)明人】劉睿, 榮文戈, 唐翠, 歐陽(yáng)元新, 熊璋
【申請(qǐng)人】北京航空航天大學(xué)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
韶关市| 安龙县| 信阳市| 霍山县| 巫山县| 秀山| 大邑县| 五原县| 永定县| 拉萨市| 兴隆县| 营口市| 洞头县| 利辛县| 灵丘县| 迁安市| 呼和浩特市| 长武县| 略阳县| 皋兰县| 汉中市| 蓝田县| 遂宁市| 济源市| 定南县| 金溪县| 宁海县| 浦江县| 松江区| 汤原县| 沙田区| 苍梧县| 禹城市| 鄂伦春自治旗| 泰兴市| 丰原市| 阳江市| 星座| 神池县| 米泉市| 赣榆县|