劉珍珍 楊懷洲
摘要:隨著Web服務(wù)技術(shù)的發(fā)展,網(wǎng)絡(luò)中涌現(xiàn)出很多功能性屬性相同或相似但非功能性屬性如QoS具有明顯差異的Web服務(wù)。如何選擇最佳的Web服務(wù)構(gòu)建滿足用戶QoS需求的Web應(yīng)用成為一個(gè)極具價(jià)值的研究課題[1]。時(shí)間和空間因素是影響Web 服務(wù)的QoS屬性的主要因素,在實(shí)際應(yīng)用中,時(shí)空信息不同Web服務(wù)的性能有很大差異。該文針對(duì)綜合時(shí)空信息的Web服務(wù)QoS預(yù)測(cè)方法進(jìn)行了綜合對(duì)比分析,總結(jié)了當(dāng)下QoS預(yù)測(cè)方法的研究趨勢(shì)和發(fā)展前景。
關(guān)鍵詞:Web服務(wù);QoS預(yù)測(cè);協(xié)同過(guò)濾;矩陣分解;個(gè)性化推薦
中圖分類號(hào):TP301? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)18-0233-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 背景
Web服務(wù)的QoS屬性是選取最佳候選服務(wù)時(shí)需要考慮的關(guān)鍵性因素,是動(dòng)態(tài)服務(wù)發(fā)現(xiàn)、查詢、選擇和主動(dòng)推薦的基礎(chǔ),通常用來(lái)體現(xiàn)Web服務(wù)的非功能特性。由于在實(shí)際應(yīng)用中,Web服務(wù)數(shù)量非常多,用戶對(duì)大多數(shù)服務(wù)并不了解,因此Web服務(wù)的QoS屬性值不完整。而且,不同用戶的網(wǎng)絡(luò)環(huán)境及服務(wù)運(yùn)行環(huán)境均存在差異,QoS屬性表現(xiàn)得很不穩(wěn)定。因此預(yù)測(cè)活動(dòng)用戶缺少的QoS值非常必要,不僅能更好地進(jìn)行服務(wù)推薦,還便于用戶進(jìn)行服務(wù)的選擇。Web服務(wù)的QoS性能與用戶地理位置高度相關(guān),QoS性能受網(wǎng)絡(luò)距離及各自的網(wǎng)絡(luò)環(huán)境的影響。同時(shí),Web服務(wù)的QoS性能與調(diào)用時(shí)間高度相關(guān),網(wǎng)絡(luò)環(huán)境以及服務(wù)狀態(tài)會(huì)隨時(shí)間而變化?;ヂ?lián)網(wǎng)上不同用戶調(diào)用同一Web服務(wù)時(shí),感受到的服務(wù)性能也不同。通過(guò)綜合時(shí)空信息進(jìn)行QoS預(yù)測(cè)不僅可以對(duì)Web服務(wù)的多個(gè)QoS屬性進(jìn)行合理的綜合評(píng)價(jià),還可以準(zhǔn)確地預(yù)測(cè) QoS值,幫助用戶選擇在海量的Web服務(wù)中選擇最合適的服務(wù),完成服務(wù)的個(gè)性化推薦。
2 Web服務(wù)QoS主要預(yù)測(cè)方法說(shuō)明
2.1 基于內(nèi)容(content-based)的預(yù)測(cè)方法
基于內(nèi)存的預(yù)測(cè)算法使用用戶服務(wù)數(shù)據(jù)庫(kù)的整個(gè)或一個(gè)樣本來(lái)生成預(yù)測(cè)。這種算法易于實(shí)現(xiàn)且效率很高,直觀易懂、更容易解決冷啟動(dòng)問(wèn)題、容易落地到真實(shí)的業(yè)務(wù)場(chǎng)景中,但推薦精準(zhǔn)度不太高,且無(wú)法擴(kuò)展。基于內(nèi)容的推薦算法有很多的應(yīng)用實(shí)例,比如今日頭條中有很大比例是基于內(nèi)容的推薦算法。
2.2 基于協(xié)同過(guò)濾(collaboration filtering)的預(yù)測(cè)方法
1)基于歷史記錄(memory-based)的CF算法
基于用戶的協(xié)同過(guò)濾算法是通過(guò)對(duì)鄰居用戶的QoS信息進(jìn)行分析生成待推薦服務(wù),然后為目標(biāo)用戶推薦其相似用戶喜歡的服務(wù)。此算法首先計(jì)算用戶間相似度,然后選擇目標(biāo)用戶近鄰,最后基于用戶近鄰預(yù)測(cè)QoS值。近鄰篩選通常用Top-K 近鄰選擇算法。
基于服務(wù)項(xiàng)的協(xié)同過(guò)濾算法是通過(guò)用戶對(duì)相似服務(wù)的QoS信息進(jìn)行分析,然后預(yù)測(cè)目標(biāo)服務(wù)項(xiàng)的QoS值,最后為用戶推薦喜歡及相似的服務(wù)。其過(guò)程與基于用戶的CF算法類似。
基于混合的協(xié)同過(guò)濾算法是將基于用戶和基于Web服務(wù)的CF算法結(jié)合,提出了混合的推薦系統(tǒng)來(lái)預(yù)測(cè)缺失的QoS值。后來(lái)有許多學(xué)者通過(guò)調(diào)整參數(shù)改變基于用戶的CF算法和基于Web服務(wù)項(xiàng)的CF算法對(duì)不同數(shù)據(jù)集的依賴程度,不僅提升了信息的利用價(jià)值,還提高預(yù)測(cè)的準(zhǔn)確度。
基于歷史記錄的CF算法是使用現(xiàn)有的數(shù)據(jù)進(jìn)行預(yù)測(cè),是一種啟發(fā)式算法。這種算法雖然計(jì)算簡(jiǎn)單,但由于QoS值的不完整性和不穩(wěn)定性,存在QoS矩陣稀疏性和在處理大量數(shù)據(jù)時(shí)的時(shí)效性等問(wèn)題。同時(shí),該算法對(duì)歷史數(shù)據(jù)集的依賴性比較大,存在一定的局限性,例如冷啟動(dòng)問(wèn)題,忽略了網(wǎng)絡(luò)環(huán)境等外部因素的影響。
2)基于模型(model-based)的協(xié)同過(guò)濾算法
近年來(lái),隨著機(jī)器學(xué)習(xí)的興起,已有學(xué)者提出多種基于模型的協(xié)同過(guò)濾方法,除了可以克服QoS矩陣極度稀疏和在處理大量數(shù)據(jù)時(shí)的時(shí)效性等問(wèn)題,在推薦效果以及算法可行性方面均有突破?;谀P偷膮f(xié)同過(guò)濾是通過(guò)各種機(jī)器學(xué)習(xí)算法對(duì)歷史QoS數(shù)據(jù)進(jìn)行訓(xùn)練得到一個(gè)學(xué)習(xí)模型,再使用此學(xué)習(xí)模型進(jìn)行QoS預(yù)測(cè)。目前,基于模型的CF算法有矩陣因子模型、聚類模型、潛在語(yǔ)義模型、貝葉斯模型等。下面我主要介紹基于矩陣分解(MF)的各個(gè)模型(如表1所示)。
矩陣分解是協(xié)同過(guò)濾是目前使用很廣泛的一種方法,它的核心思想是將矩陣分解成兩個(gè)低維度矩陣,分解后的兩個(gè)特征矩陣突出了重要特征,減少了一些無(wú)關(guān)因素的干擾,可以更好地挖掘用戶與服務(wù)間的關(guān)系,進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確性。常用兩種矩陣分解的技術(shù)如表2所示。
3 綜合時(shí)空信息預(yù)測(cè)關(guān)鍵技術(shù)
由于時(shí)空因素對(duì)Web服務(wù)的QoS性能有一定影響,為此眾多學(xué)者對(duì)加入空間信息和時(shí)間信息的預(yù)測(cè)方法都做了不少的研究,并取得了一定的成果。
3.1 空間信息的研究
部分研究工作注意到用戶的地理位置對(duì)于QoS屬性值的影響,即網(wǎng)絡(luò)環(huán)境與地理位置存在差異的用戶調(diào)用相同的 Web 服務(wù)時(shí),QoS記錄可能不同。例如Zheng[2]等人認(rèn)為 QoS 受到地理位置以及網(wǎng)絡(luò)環(huán)境的影響比較大,提出了一種基于鄰域綜合矩陣分解(NIMF)的個(gè)性化Web服務(wù)QoS值預(yù)測(cè)方法。通過(guò)融合基于鄰域和基于模型的協(xié)同過(guò)濾方法,探索用戶過(guò)去的Web服務(wù)使用情況,以獲得更高的預(yù)測(cè)精度。P.He[3]等人針對(duì)QoS預(yù)測(cè)方法預(yù)測(cè)精度上不足的問(wèn)題,提出了一種基于位置的層次矩陣分解(HMF)方法。根據(jù)用戶的位置將用戶和服務(wù)分為多個(gè)組,使用全局QoS矩陣和基于位置的局部QoS矩陣對(duì)HMF模型進(jìn)行分層訓(xùn)練,將兩者緊密結(jié)合來(lái)預(yù)測(cè)丟失的QoS值。實(shí)驗(yàn)表明,此方法較之前的算法預(yù)測(cè)精度更高。有研究者針對(duì)數(shù)據(jù)稀疏,Web服務(wù)QoS預(yù)測(cè)精度不高,算法可擴(kuò)展性的問(wèn)題,增加網(wǎng)絡(luò)位置正則項(xiàng)來(lái)預(yù)測(cè)用戶的QoS值,根據(jù)用戶功能需求對(duì)待推薦服務(wù)進(jìn)行排序,然后選擇最合適的服務(wù)進(jìn)行推薦。實(shí)驗(yàn)表明,該方法不僅在預(yù)測(cè)精度上優(yōu)于目前主流的推薦算法,可以在一定程度上解決數(shù)據(jù)稀疏和可擴(kuò)展性差的問(wèn)題。還有學(xué)者針對(duì)冷啟動(dòng),QoS數(shù)據(jù)中存在異常值的問(wèn)題,提出了以矩陣分解為基礎(chǔ)的服務(wù)推薦模型:LA-LFM和LA-PMF。這種模型加入Web服務(wù)隱式反饋因子,根據(jù)用戶網(wǎng)絡(luò)位置特征進(jìn)行聚類分析,在數(shù)據(jù)稀疏的情形下,預(yù)測(cè)精確度要比一些經(jīng)典方法更好。X等人從概率的角度出發(fā),提出了改進(jìn)的矩陣分解模型,即基于位置的概率矩陣分解模型(PMF),并在真實(shí)QoS數(shù)據(jù)集進(jìn)行了驗(yàn)證。在Netflix競(jìng)賽中,PMF模型取得了較好的成績(jī)。
3.2 時(shí)間信息的研究
T.Chen[4]等人為了有效地解決基于特征的矩陣分解問(wèn)題,設(shè)計(jì)了SVD特征,構(gòu)建包含時(shí)間動(dòng)態(tài)、層次信息和鄰域關(guān)系等邊信息的因子分解模型。通過(guò)對(duì)模型的改進(jìn),提出了SVD Feature模型,并且用于Twitter的好友推薦系統(tǒng)。C.Zhou[5]等人針對(duì)數(shù)據(jù)稀疏以及Web服務(wù)的QoS值可能會(huì)隨著時(shí)間推移而改變的問(wèn)題,提出了一個(gè)考慮時(shí)態(tài)信息的Web服務(wù)推薦框架。針對(duì)包含用戶、服務(wù)和時(shí)間等多維信息的模型,提出了一種Tucker分解方法,將QoS值數(shù)據(jù)視為張量,將其轉(zhuǎn)化為張量分解問(wèn)題。同時(shí)為了處理具有服務(wù)質(zhì)量?jī)r(jià)值的動(dòng)態(tài)數(shù)據(jù)流,引入了一種可擴(kuò)展的、節(jié)省空間的增量張量因子分解(ITF)方法。實(shí)驗(yàn)結(jié)果表明,該方法在效率和準(zhǔn)確度上優(yōu)于其他方法。除此之外,有些學(xué)者針對(duì)缺乏時(shí)間信息導(dǎo)致的靜態(tài)性模型問(wèn)題,提出一個(gè)能夠處理用戶服務(wù)時(shí)間模型三元關(guān)系的非負(fù)張量分解(NTF)算法,將二維用戶服務(wù)矩陣擴(kuò)展為一個(gè)由三維張量表示的更復(fù)雜的用戶服務(wù)時(shí)間三元關(guān)系,核心思想是考慮不同時(shí)刻QoS值的差異,用用戶服務(wù)時(shí)間交互關(guān)系代替MF中的用戶服務(wù)矩陣,利用張量將MF模型擴(kuò)展到三維空間,采用非負(fù)張量分解方法來(lái)提高考慮時(shí)態(tài)信息的QoS感知Web服務(wù)推薦性能,進(jìn)一步的提高的預(yù)測(cè)的精度。
通過(guò)大量研究,基于矩陣分解的協(xié)同過(guò)濾算法在大規(guī)模數(shù)據(jù)稀疏的情況下預(yù)測(cè)效果更好,加入時(shí)空信息能更好地提高預(yù)測(cè)的準(zhǔn)確性,提升服務(wù)推薦的性能,但其算法復(fù)雜度較高,更適合離線計(jì)算。
4 結(jié)束語(yǔ)
由此可見(jiàn),基于矩陣分解的協(xié)同過(guò)濾算法在研究綜合時(shí)空
信息的Web服務(wù)QoS預(yù)測(cè)值得進(jìn)一步研究?;谀P偷腃F算法能更加全面的考慮QoS信息,豐富時(shí)空信息,提高了QoS值完整性及預(yù)測(cè)精確度,不僅能提升推薦質(zhì)量,還可以實(shí)現(xiàn)準(zhǔn)實(shí)時(shí)預(yù)測(cè)。然而,隨著Web服務(wù)數(shù)量激增以及用戶要求的不斷提高,綜合時(shí)空信息的Web服務(wù)QoS預(yù)測(cè)方法還要有很多改進(jìn)的空間。冷啟動(dòng)問(wèn)題、相似度的計(jì)算方法以及預(yù)測(cè)模型的效果及時(shí)間復(fù)雜度等都需要進(jìn)一步的深入研究和改善。
參考文獻(xiàn):
[1] 唐妮.基于位置聚類和張量分解的Web服務(wù)推薦研究與應(yīng)用[D].重慶:重慶大學(xué),2016.
[2] Zheng Z B,Ma H,Lyu M R,et al.Collaborative web service QoS prediction via neighborhood integrated matrix factorization[J].IEEE Transactions on Services Computing,2013,6(3):289-299.
[3] He P J,Zhu J M,Zheng Z B,et al.Location-based hierarchical matrix factorization for web service recommendation[C]//2014 IEEE International Conference on Web Services.June 27 - July 2,2014,Anchorage,AK,USA.IEEE,2014:297-304.
[4] Chen T,Zhang W,Lu Q,et al.SVDFeature:a toolkit for feature-based collaborative filtering[J].Journal of Machine Learning Research,2012,13(1):3619-3622.
[5] Zhou C,Zhang W C,Li B.Web service recommendation via exploiting temporal QoS information[C]//Algorithms and Architectures for Parallel Processing,2014:15-27.
【通聯(lián)編輯:謝媛媛】