梁冰芳
摘要
在互聯(lián)網(wǎng)不斷發(fā)展與推動(dòng)下,出現(xiàn)了一個(gè)新的概念名詞——云計(jì)算,在云計(jì)算的大環(huán)境下應(yīng)用的數(shù)據(jù)數(shù)量不斷增長,幾乎已經(jīng)達(dá)到一個(gè)頂峰,所以此時(shí)就必須提出更具有創(chuàng)新性的東西,特別是極具個(gè)性化的內(nèi)容,但是受限于云計(jì)算龐大的數(shù)據(jù)計(jì)算量和它獨(dú)有的處理框架結(jié)構(gòu),不能將傳統(tǒng)的技術(shù)直接運(yùn)用到云計(jì)算當(dāng)中,必須進(jìn)行一系列的改革與創(chuàng)新才能發(fā)揮云計(jì)算最好的效果。為了更好的解決上面的問題,在云計(jì)算的大環(huán)境下提出基于協(xié)同過濾的個(gè)性化推薦機(jī)制是十分必要的,這一機(jī)制首先會(huì)制定分散式評(píng)分管理策略,然后會(huì)使用候選鄰居的概念對(duì)結(jié)果影響比較大的項(xiàng)目進(jìn)行分析與研究,并推出協(xié)同過濾的個(gè)性化推薦機(jī)制,幫助用戶更好地解決問題。
【關(guān)鍵詞】云計(jì)算環(huán)境 協(xié)同過濾 個(gè)性化推薦機(jī)制
聯(lián)網(wǎng)的快速發(fā)展與壯大為用戶的生活和工作提供了充足的快捷和便利,但是在帶來方便的同時(shí)也帶來了諸如信息超載的問題,信息的急速超載導(dǎo)致用戶的工作效率大大降低,很多工作不能及時(shí)完成,所以適時(shí)的推出基于協(xié)同過濾的個(gè)性化推薦機(jī)制是非常合理與科學(xué)的,它是一種重要的信息過濾方法,它主要通過對(duì)用戶的興趣愛好和歷史搜索行為等一系列的行為進(jìn)行分析,然后根據(jù)用戶的需求推薦科學(xué)合理的項(xiàng)目,這可以在很大程度上解決目前信息超載的問題。而且協(xié)同過濾推薦是一項(xiàng)非常成功的個(gè)性化推薦機(jī)制,可以說是到目前最成功的一個(gè)個(gè)性化推薦機(jī)制之一吧。下面就詳細(xì)的對(duì)協(xié)同過濾個(gè)性化推薦機(jī)制進(jìn)行詳細(xì)的分析和研究。
1 相關(guān)工作
其實(shí)除了本文要講到的協(xié)同過濾的個(gè)性化推薦機(jī)制,還有許多分布式推薦機(jī)制,它們大多數(shù)都遵循著一個(gè)基本思想,就是:首先它們互相之間在網(wǎng)絡(luò)上進(jìn)行評(píng)分向量的運(yùn)送,然后就是對(duì)每一個(gè)具體用戶進(jìn)行分布式運(yùn)算,最后代表鄰居關(guān)系的覆蓋網(wǎng)絡(luò)就可以在網(wǎng)絡(luò)上建設(shè)完成了。但是這些算法基本上都存在著這樣一個(gè)問題就是:這種算法一般都會(huì)產(chǎn)生巨大的費(fèi)用,而且網(wǎng)絡(luò)數(shù)據(jù)的更新也比較緩慢和滯后,而且整個(gè)算法的完成需要花費(fèi)大量的時(shí)間。為了解決上面所提到的問題,Miller、Kim、Ormadi、Berkvosky等人紛紛提出了自己的解決方案和措施,有的提出泛洪策略的推薦法,有的則提出了用面向鄰居運(yùn)送評(píng)分向量的方式來代替前面所提到的泛洪策略的推薦法,甚至有的人設(shè)計(jì)出面向社交網(wǎng)絡(luò)的分布式推薦機(jī)制的想法。雖然他們提出的想法都在某些方面存在著優(yōu)勢和可取之處,但是它們的缺點(diǎn)也是比較明顯的,所以最終沒有得到長久的發(fā)展[2]。
2 云計(jì)算環(huán)境的協(xié)同過濾推薦機(jī)制
關(guān)于模型的描述,按照功能和具體結(jié)構(gòu),我們可以將云計(jì)算環(huán)境下的協(xié)同過濾推薦模型分為四個(gè)部分,分別是:基礎(chǔ)設(shè)施層、數(shù)據(jù)預(yù)處理層、推薦服務(wù)層、用戶接入層。首先基礎(chǔ)設(shè)施層數(shù)據(jù)核心,是由以SN架構(gòu)為基礎(chǔ)的數(shù)據(jù)中心構(gòu)成,負(fù)責(zé)計(jì)算本地的評(píng)分?jǐn)?shù)據(jù);數(shù)據(jù)預(yù)處理層是負(fù)責(zé)管理數(shù)據(jù)的部門,主要對(duì)用戶的數(shù)據(jù)進(jìn)行管理與收集,還附帶查詢功能;推薦服務(wù)層是負(fù)責(zé)接受用戶的數(shù)據(jù)的,然后對(duì)這些數(shù)據(jù)進(jìn)行響應(yīng)與分析;最后用戶接入層是提供推薦機(jī)制的泛在接入。
3 分布式評(píng)分管理
3.1 評(píng)分過濾
說到傳統(tǒng)的評(píng)分過濾,在此處我們主要講述一下傳統(tǒng)的推薦算法的使用,傳統(tǒng)的使用通常是對(duì)用戶使用協(xié)同過濾的推薦思想,然后對(duì)用戶的相似度進(jìn)行計(jì)算,然后獲得用戶的k鄰值。最后通過對(duì)k鄰值的一系列計(jì)算與分析得出k近鄰加權(quán)產(chǎn)生的推薦結(jié)果。還有就是,當(dāng)推薦算法在計(jì)算項(xiàng)目的相似度時(shí),如果兩個(gè)不同的項(xiàng)目的存儲(chǔ)位置分別在不同的位置時(shí),那么推薦算法就需要在數(shù)據(jù)傳輸過程中將一邊的數(shù)據(jù)傳輸?shù)搅硗庖贿?。而且單次推薦過程需要很多記錄,大約是n(n-1)m/2次。
3.2 兩階段評(píng)分索引
在進(jìn)行評(píng)分索引時(shí),由于項(xiàng)目的候選鄰居可能會(huì)存在以下情況即:候選鄰居的分布式可能會(huì)存儲(chǔ)在多個(gè)不同的位置,因此如何快速找到它們的存儲(chǔ)位置成為了十分重要的一點(diǎn),也是在進(jìn)行評(píng)分索引時(shí)必須要注意和重視的一點(diǎn),如果不能足夠重視這一點(diǎn)的話就會(huì)對(duì)用戶造成很多的不便和問題,從而加劇信息超載的問題。
3.3 評(píng)分存儲(chǔ)
在進(jìn)行評(píng)分存儲(chǔ)時(shí),要注意具體的存儲(chǔ)規(guī)則,這樣有幫助用戶找到最適合他們的推薦機(jī)制,并最快速的找到它們的位置,這樣就可以節(jié)省大量的時(shí)間,這樣用戶就可以利用這些時(shí)間做一些對(duì)于他們而言更加有意義的事情。
3.4 評(píng)分查詢
評(píng)分查詢是用戶在進(jìn)行數(shù)據(jù)索引步驟后十分重要的一步,可以很有效的找到k鄰值,然后找到自己的評(píng)分值。
3.5 參數(shù)分析
本節(jié)通過調(diào)節(jié)R八《的候選鄰居數(shù)量、興趣度模型更新間隔以及模型規(guī)模等參數(shù)優(yōu)化RAC的MAE和NIF。實(shí)驗(yàn)中訓(xùn)練集的項(xiàng)目數(shù)量分別設(shè)置為500,2500和5000,并從測試集中分別選擇500個(gè)用戶作為目標(biāo)用戶,然后通過對(duì)這些目標(biāo)用戶的分析得住一個(gè)合理科學(xué)的理論,并通過這一理論指導(dǎo)實(shí)踐,更好的解決信息超載的問題,幫助用戶更好地生活和工作。
4 基于候選鄰居的協(xié)同過濾推薦算法
在進(jìn)行候選鄰居的協(xié)同過濾推薦算法時(shí),一般的項(xiàng)目是具有相似性的,而且它們之間的相似性是一般不會(huì)發(fā)生變化的,本文就是對(duì)協(xié)同過濾算法進(jìn)行研究與創(chuàng)新,推出一種全新的思想,構(gòu)建一個(gè)好的思路,然后通過這種思路來推出更加優(yōu)化的算法,幫助用戶有效解決信息超載這一問題,然后提出具體的個(gè)性化推薦方案,幫助櫻花解決這一問題。
5 結(jié)語
隨著云計(jì)算的不斷發(fā)展與創(chuàng)新,信息超載的情況越來越嚴(yán)重,已經(jīng)嚴(yán)重的影響到人們?nèi)粘5膶W(xué)習(xí)與工作,為了解決這一問題,必須提出更好地個(gè)性化推薦機(jī)制,這樣才能有效的提高人們的工作效率,減輕工作負(fù)擔(dān),達(dá)到最好的效果。而本文就是對(duì)在云計(jì)算的大環(huán)境下基于協(xié)同過濾的個(gè)性化推薦機(jī)制進(jìn)行研究與分析,來解決傳統(tǒng)的個(gè)性化推薦所不能解決的問題,在大幅度上解決當(dāng)下信息超載的問題,幫助人們推薦最適合自己的應(yīng)用,充分提高人們的工作效率,將人們從繁雜的工作中解放出來,促進(jìn)人們的健康可持續(xù)發(fā)展。
參考文獻(xiàn)
[1]Tunkelang D.Recommendations as a con-versation with the user[C].Proc ofthe 5th ACM Conf on Recommender Sys-tems.New York:ACM.2016(09):11-12.
[2]Breese 7,Heckerman D,Kadie C.Bmpiri-cal analysis of predictive algorithmsfor collaborative filtering [C]//Procof the 14th Conf on Uncertainty inArtificial Intelligence.San Francis-cc:Morgan Kaufmann,2016(11):43-52.