国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于上下文感知推薦的協(xié)同過(guò)濾技術(shù)

2022-08-31 23:35馬永波彭玉
電腦知識(shí)與技術(shù) 2022年19期
關(guān)鍵詞:個(gè)性化推薦移動(dòng)電子商務(wù)協(xié)同過(guò)濾

馬永波 彭玉

摘要:移動(dòng)電子商務(wù)已經(jīng)開(kāi)始在用戶(hù)的決策和偏好中扮演著越來(lái)越重要的角色。為了更有效地在移動(dòng)環(huán)境中為用戶(hù)提供推薦信息,該文提出了基于上下文感知推薦的協(xié)同過(guò)濾技術(shù),該技術(shù)利用用戶(hù)重要的移動(dòng)上下文信息來(lái)改進(jìn)基于項(xiàng)目的協(xié)同過(guò)濾算法中相似性的度量,重新用改進(jìn)的相似度計(jì)算方法來(lái)獲得項(xiàng)目的預(yù)測(cè)評(píng)分。通過(guò)實(shí)驗(yàn)數(shù)據(jù)表明,基于上下文感知推薦的協(xié)同過(guò)濾技術(shù)可以在用戶(hù)處于移動(dòng)環(huán)境時(shí)為用戶(hù)提供更準(zhǔn)確的推薦結(jié)果,可以有效緩解移動(dòng)用戶(hù)評(píng)分?jǐn)?shù)據(jù)稀疏性所帶來(lái)的推薦結(jié)果失真的問(wèn)題。

關(guān)鍵詞:上下文信息;協(xié)同過(guò)濾;移動(dòng)電子商務(wù);個(gè)性化推薦

中圖分類(lèi)號(hào):TP302.1? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2022)19-0085-02

1引言

隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,移動(dòng)電子商務(wù)逐漸走進(jìn)人們的生活。但是,人們?cè)谝苿?dòng)環(huán)境中購(gòu)物的上下文信息不能與PC購(gòu)物的上下文信息完全一致。各種應(yīng)用于傳統(tǒng)電子商務(wù)的個(gè)性化推薦技術(shù),當(dāng)然也未必完全適用于移動(dòng)電子商務(wù)。當(dāng)用戶(hù)在移動(dòng)設(shè)備上購(gòu)物時(shí),天氣、溫度和位置等上下文信息是不同的。因此,在進(jìn)行個(gè)性化推薦時(shí),應(yīng)考慮這些上下文信息,從而為客戶(hù)提供更高效、更個(gè)性化的推薦服務(wù)。例如,在一個(gè)在線旅游網(wǎng)站中季節(jié)是較重要的推薦背景因素之一,向客戶(hù)推薦的夏季和冬季旅游內(nèi)容信息可能完全不同。因此,如何在移動(dòng)環(huán)境中為用戶(hù)提供更高效的個(gè)性化服務(wù)也開(kāi)始成為研究熱點(diǎn)。

目前一些研究人員已開(kāi)始將傳統(tǒng)的個(gè)性化推薦技術(shù)與無(wú)處不在的移動(dòng)網(wǎng)絡(luò)環(huán)境下的用戶(hù)上下文因素相結(jié)合。例如,Adomavicius等人強(qiáng)調(diào)了下一代個(gè)性化推薦技術(shù)會(huì)將用戶(hù)的上下文信息整合到個(gè)性化推薦過(guò)程中[1]。 Annie Chen提出了一個(gè)上下文感知協(xié)同過(guò)濾系統(tǒng),該系統(tǒng)主要基于用戶(hù)的協(xié)同過(guò)濾推薦,而不是基于項(xiàng)目的協(xié)同過(guò)濾推薦[2]。高敏等人提出了一種基于神經(jīng)網(wǎng)絡(luò)和 Slope One 算法的個(gè)性化上下文感知協(xié)同過(guò)濾[3]。

綜上所述,將特定的個(gè)性化推薦技術(shù)與用戶(hù)的各種上下文因素相結(jié)合,是個(gè)性化推薦系統(tǒng)發(fā)展的一個(gè)新方向。本文在上述文獻(xiàn)的研究基礎(chǔ)上繼續(xù)探索,用上下文信息來(lái)改進(jìn)項(xiàng)目之前相似度的計(jì)算,從而能獲得更準(zhǔn)確的項(xiàng)目預(yù)測(cè)評(píng)分,得到更準(zhǔn)確的項(xiàng)目推薦給用戶(hù),提高電子商務(wù)系統(tǒng)的用戶(hù)體驗(yàn)。

2傳統(tǒng)的Item-based協(xié)同過(guò)濾技術(shù)

2.1傳統(tǒng)基于項(xiàng)目的協(xié)同過(guò)濾算法的基本原理

Item-based協(xié)同過(guò)濾推薦算法的核心就是通過(guò)計(jì)算項(xiàng)目之間的相似度,然后選擇最相似的項(xiàng)目進(jìn)行預(yù)測(cè)[4]。

1)首先,應(yīng)該建立一個(gè)用戶(hù)檔案?;陧?xiàng)目的協(xié)同過(guò)濾技術(shù)的基本數(shù)據(jù)源是一個(gè)用戶(hù)評(píng)分?jǐn)?shù)據(jù)矩陣R。它存儲(chǔ)了[a]個(gè)用戶(hù)對(duì)[b]個(gè)項(xiàng)目給出的評(píng)分。[a]表示用戶(hù)信息[U=(u1,u2,…ua)],[b]表示項(xiàng)目信息[I=(i1,i2,…ib)]。如果用戶(hù)[u]對(duì)項(xiàng)目[i]進(jìn)行了評(píng)分,它將生成評(píng)分[Rui],[Rui]的值介于 0 和 5 之間。用評(píng)分?jǐn)?shù)值越大,則用戶(hù)越喜歡該項(xiàng)目。

2)選擇最近鄰居:協(xié)同過(guò)濾技術(shù)的關(guān)鍵是選擇目標(biāo)項(xiàng)目的最近鄰居,并利用鄰居的偏好來(lái)預(yù)測(cè)活躍用戶(hù)的偏好。在基于項(xiàng)目的 CF 算法中,應(yīng)該首先計(jì)算項(xiàng)目之間的相似度。我們使用 Pearson 相關(guān)性來(lái)計(jì)算項(xiàng)目之間的相似度。計(jì)算公式如式(1)。

[sim(i,j)=u∈Ui,j(Ru,i-Ri)(Ru,j-Rj)u∈Ui,j(Ru,i-Ri)2u∈Ui,j(Ru,j-Rj)2]? ? ? [(1)]

[sim(i,j)]表示目標(biāo)項(xiàng)[i]與最近鄰居[j]之間的相似性,[Ru,i]、[Ru,j]表示用戶(hù)[u]對(duì)項(xiàng)目[i]和[j]的評(píng)分,[Ri]和[Rj]分別表示對(duì)項(xiàng)目[i]和項(xiàng)目[j]的平均評(píng)分。

3)當(dāng)?shù)玫剿邢嗨菩詴r(shí),按大小排序并選擇前 K個(gè)相似性最大的項(xiàng)目,組成項(xiàng)目[i]的最近鄰集合[Ii]。最后,可以通過(guò)計(jì)算評(píng)分的加權(quán)平均值來(lái)利用K個(gè)鄰居的評(píng)分來(lái)預(yù)測(cè)活躍用戶(hù)的偏好,該加權(quán)平均值表示如公式(2):

[Pu,i=Ri+j∈Iisim(i,j)*(Ru,j-Rj)j∈Ii(|sim(i,j)|)]? ? ? ? ? ? ? ? (2)

通過(guò)上述方法預(yù)測(cè)用戶(hù)對(duì)所有未評(píng)分項(xiàng)的評(píng)分,然后選擇預(yù)測(cè)評(píng)分最高的前若干個(gè)項(xiàng)作為推薦結(jié)果反饋給當(dāng)前用戶(hù)。

這三個(gè)步驟涵蓋了基于項(xiàng)目的協(xié)同過(guò)濾算法的基本過(guò)程。然后,我們將介紹如何基于上下文信息為用戶(hù)在移動(dòng)環(huán)境中生成預(yù)測(cè)。

3基于上下文感知推薦的協(xié)同過(guò)濾技術(shù)

3.1上下文信息的概念

本文介紹的是一種基于項(xiàng)目的協(xié)同過(guò)濾技術(shù),它結(jié)合了移動(dòng)用戶(hù)的上下文信息,所以我們首先應(yīng)該介紹一下上下文信息是什么。

上下文信息是一個(gè)多方面的概念,許多研究人員給出了不同的定義。 2001年,Dey提出了他對(duì)上下文信息的定義:“上下文信息是可以用來(lái)表征實(shí)體狀況的任何信息[5]。實(shí)體是被認(rèn)為與用戶(hù)和應(yīng)用程序之間的交互相關(guān)的人、地點(diǎn)或?qū)ο螅ㄓ脩?hù)和應(yīng)用程序本身?!痹诒疚闹?,提出上下文是可以影響用戶(hù)行為和偏好的一些物理環(huán)境因素(如時(shí)間、地點(diǎn)、天氣等)和用戶(hù)信息特征因素(性別、行為、知識(shí)、背景、職業(yè)等)。為了在個(gè)性化推薦過(guò)程中有效地使用這些上下文信息,應(yīng)將上下文信息表示如下:

[C=(c1,c2,…cn)]? ? ? ? ? ? ? ? ? ? ? ? ? (3)

C 表示一種類(lèi)型的上下文信息,例如時(shí)間、天氣或地點(diǎn)。[ci]由許多不同的變量組成。例如,在時(shí)間類(lèi)型中,有多個(gè)值(比如上午、中午、下午和晚上)或者特定的時(shí)間值(例如 5:00pm,11:00am 等)。而用戶(hù)在上下文信息的不同變量中,可能對(duì)同一項(xiàng)目有不同的偏好。例如,用戶(hù)可能喜歡在早上瀏覽有關(guān)股市的新聞和信息,而在晚上更喜歡瀏覽娛樂(lè)新聞。所以可以給出C的定義:

[c=(ci1,ci2,…cik)]? ? ? ? ? ? ? ? ? ? ? ? (4)

然后,將詳細(xì)介紹基于上下文感知推薦的協(xié)同過(guò)濾技術(shù)的具體過(guò)程。該推薦技術(shù)是基于傳統(tǒng)的item-based CF,所以下面介紹的過(guò)程與本文第2節(jié)中提到的內(nèi)容類(lèi)似。

改進(jìn)推薦技術(shù)的第一步也是建立用戶(hù)檔案,必須結(jié)合一些用戶(hù)的上下文信息來(lái)建立用戶(hù)矩陣。在傳統(tǒng)的item-based CF中,構(gòu)建的是一個(gè)包含用戶(hù)信息和項(xiàng)目信息的二維模型。當(dāng)加入用戶(hù)上下文信息之后,就可以構(gòu)建用戶(hù)、項(xiàng)目以及相關(guān)上下文信息的[User×Item×Context]三維模型。比如用戶(hù)[U1]對(duì)項(xiàng)目[I1]在上下文[C11]下的偏好評(píng)分值可記為[RU1,I1,C11]。

3.2計(jì)算上下文之間的相似度

計(jì)算上下文之間的相似度旨在找出在其他上下文中給出的哪些評(píng)分與當(dāng)前上下文更相關(guān)。但是每種上下文類(lèi)型中都有許多變量。因此,首先要找出其他上下文的哪些變量與當(dāng)前上下文的變量相同??梢允褂靡韵碌仁接?jì)算兩個(gè)上下文信息變量之間的相似性:

[simt(x,y,i)=u=1m(Ru,i,x-Ri)(Ru,i,y-Ri)u=1m(Ru,i,x-Ri)2u=1m(Ru,i,y-Ri)2]? ? ? ? ? [(5)]

這個(gè)公式中,[t]表示一種上下文信息變量,[Ru,i,x]表示用戶(hù)[u]在上下文[t]中對(duì)變量[x]給項(xiàng)目[i]的評(píng)分,[Ri]表示對(duì)項(xiàng)目[i]評(píng)分的平均值。

可以利用公式(5) 來(lái)計(jì)算活動(dòng)用戶(hù)的當(dāng)前上下文與其他上下文之間的相似度記為[sim(c,s,i)],其中 C 表示當(dāng)前上下文,[s]表示當(dāng)前上下文中與其他上下文中的變量相同的變量。

3.3選擇最近鄰居并產(chǎn)生推薦

在選擇目標(biāo)項(xiàng)目的最近鄰居之前,可以根據(jù)上面計(jì)算得到相似度來(lái)計(jì)算活躍用戶(hù)在當(dāng)前上下文信息C中對(duì)項(xiàng)目[i]的評(píng)分。計(jì)算方法定義如下:

[Ru,i,c=s?cRu,i,x(t=1nsimt(c,s,i))t=1nsimt(c,s,i)]? ? ? ? ? ? ? ? ? ? ?[(6)]

然后,可以利用包含了上下文信息的評(píng)分來(lái)計(jì)算項(xiàng)目[i]和項(xiàng)目[j]之間的相似度。然后選擇相似度較高的前[k]個(gè)項(xiàng)目作為項(xiàng)目[i]的最近鄰集合。相似度計(jì)算公式定義如下:

[sim(i,j,C)=u∈Ui,j(Ru,i,c-Ri,c)(Ru,j,c-Rj,c)u∈Ui,j(Ru,i,c-Ri,c)2u∈Ui,j(Ru,j,c-Rj,c)2]

接下來(lái)可以利用用戶(hù)對(duì)鄰居項(xiàng)目的評(píng)分來(lái)預(yù)測(cè)活躍用戶(hù)在當(dāng)前上下文 C 中對(duì)項(xiàng)目[i]的評(píng)分。將評(píng)分計(jì)算方法定義為[Pu,i,C]。

[Pu,i,C=Ri,c+j∈Iisim(i,j,C)*(Ru,j,c-Rj,c)j∈Ii(|sim(i,j,C)|)]

4實(shí)驗(yàn)結(jié)果及分析

為了驗(yàn)證本文提出的推薦技術(shù)能具有更好的推薦性能,筆者設(shè)計(jì)了下面的實(shí)驗(yàn)。為實(shí)驗(yàn)提供的數(shù)據(jù)集來(lái)自著名的推薦系統(tǒng)MovieLens。抽取出該站點(diǎn)的10萬(wàn)條評(píng)分記錄,這些記錄是由943個(gè)用戶(hù)對(duì)1682部電影的評(píng)分,評(píng)分?jǐn)?shù)值從0到5。同時(shí)將用戶(hù)的年齡、性別和職業(yè)作為推薦系統(tǒng)的上下文信息。

推薦系統(tǒng)的推薦質(zhì)量標(biāo)準(zhǔn)可以用平均絕對(duì)偏差MAE(mean absolute error)作為預(yù)測(cè)指標(biāo)進(jìn)行衡量。MAE越小,推薦質(zhì)量越高。對(duì)于評(píng)分?jǐn)?shù)據(jù),預(yù)測(cè)的評(píng)分集合表示為{[β1],[β2],[…][βn] },實(shí)際的評(píng)分集合表示為{[r1],[r2],[…][rn]},采用常用的推薦質(zhì)量度量方法——平均絕對(duì)偏差[6][MAE=i=1Nβi-riN]進(jìn)行度量。

在實(shí)驗(yàn)過(guò)程中,將本文改進(jìn)算法與傳統(tǒng)的基于項(xiàng)目的協(xié)同過(guò)濾算法Item-based CF進(jìn)行比較。最近鄰居的數(shù)量從10增加到100,每次增加10。通過(guò)實(shí)驗(yàn)數(shù)據(jù)分析,可以看出改進(jìn)算法能有更低的絕對(duì)偏差,這也說(shuō)明在同樣的環(huán)境下,改進(jìn)的推薦方法有更好的推薦精度,因此推薦效果更好。當(dāng)隨著所預(yù)測(cè)產(chǎn)品的近鄰數(shù)目的增加,預(yù)測(cè)的質(zhì)量也隨之提升,在用戶(hù)較多的情況下,實(shí)驗(yàn)結(jié)果提升尤為明顯。實(shí)驗(yàn)結(jié)果如圖1所示。

5結(jié)論與未來(lái)工作

考慮到用戶(hù)在不同的上下文環(huán)境中對(duì)物品有不同的偏好,本文研究提出了一種基于上下文感知的協(xié)同過(guò)濾推薦算法,該方法將用戶(hù)的重要上下文信息融入傳統(tǒng)的基于項(xiàng)目的協(xié)同過(guò)濾推薦技術(shù)中。筆者提出的方法局限性在于筆者在實(shí)驗(yàn)中只選擇了三個(gè)屬性,即年齡、性別和職業(yè)作為用戶(hù)的上下文信息。但實(shí)際上,有時(shí)用戶(hù)的時(shí)間、位置、關(guān)系和其他上下文信息可能更重要。因此,在未來(lái),筆者會(huì)設(shè)計(jì)實(shí)驗(yàn)涵蓋更多的上下文信息和更多的數(shù)據(jù)評(píng)分來(lái)評(píng)估方法的有效性。同時(shí),筆者將繼續(xù)研究將更多類(lèi)型的上下文信息融入個(gè)性化推薦系統(tǒng)中。

參考文獻(xiàn):

[1] Adomavicius G,Sankaranarayanan R,Sen S,et al.Incorporating contextual information in recommender systems using a multidimensional approach[J].ACM Transactions on Information Systems,2005,23(1):103-145.

[2] Chen AN.Context-aware collaborative filtering system:predicting the user's preference in the ubiquitous computing environment[C]//Location- and Context-Awareness,2005:75-81.

[3] Gao M,Wu Z F. Personalized context-aware collaborative filtering based on neural network and slope one[C]//Cooperative Design,Visualization,and Engineering,2009:109-116.

[4] 鄧愛(ài)林.電子商務(wù)推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].上海:復(fù)旦大學(xué),2003.

[5] Dey A K.Understanding and using context[J].Personal and Ubiquitous Computing,2001,5(1):4-7.

[6]Starwar G, Karypis J,et al.Item-based collaborative filtering recommendationalgorithms[C].In proceedings of the 10th Intl World Wide Web Conference. New York,2011:285-295.

收稿日期:2022-03-06

作者簡(jiǎn)介:馬永波(1979—),男,四川成都人,講師,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)技術(shù)、智能推薦系統(tǒng);彭玉(1982—),女,四川成都人,副教授,碩士研究生,主要研究方向?yàn)殡娮由虅?wù)、智能推薦系統(tǒng)。

猜你喜歡
個(gè)性化推薦移動(dòng)電子商務(wù)協(xié)同過(guò)濾
移動(dòng)電子商務(wù)在旅游行業(yè)中的應(yīng)用研究