国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于社交網(wǎng)圖和興趣標(biāo)簽的協(xié)同推薦算法

2015-03-27 03:27:57王慶福呂小剛
關(guān)鍵詞:圖譜標(biāo)簽社交

王慶福,呂小剛

(遼寧行政學(xué)院 a.信息技術(shù)系;b.公共管理教研部,沈陽 110161)

基于社交網(wǎng)圖和興趣標(biāo)簽的協(xié)同推薦算法

王慶福a*,呂小剛b

(遼寧行政學(xué)院 a.信息技術(shù)系;b.公共管理教研部,沈陽 110161)

為了提高用戶對社交平臺(tái)的粘性,通過用戶的社交關(guān)系網(wǎng)來豐富用戶的興趣標(biāo)簽。以微博為例,用戶的關(guān)注用戶可以對用戶的內(nèi)容推薦進(jìn)行協(xié)同性過濾,用戶的關(guān)注用戶的重要性受到自身粉絲數(shù)的制約,綜合用戶興趣標(biāo)簽和用戶社交網(wǎng)絡(luò)圖完成對用戶推薦內(nèi)容的協(xié)同過濾。以Last.fm數(shù)據(jù)作為測試數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果表明:改進(jìn)的算法能夠較明顯地提高推薦的準(zhǔn)確度,從而表明融入用戶社交關(guān)系網(wǎng)進(jìn)行內(nèi)容推薦對于提升用戶的平臺(tái)粘性具有一定的作用。

用戶社交網(wǎng)絡(luò);興趣標(biāo)簽;協(xié)同過濾;用戶身份加權(quán)

目前,社交平臺(tái)和電商平臺(tái)上都有針對用戶的個(gè)性化推薦部分,即根據(jù)用戶的興趣和其他特征對用戶進(jìn)行相似好友、相似新聞、相似商品等的推薦[1]。因此,提高對用戶推薦內(nèi)容的準(zhǔn)確性,改進(jìn)用戶的體驗(yàn),從而提高用戶對平臺(tái)的粘性,提升用戶對平臺(tái)的滿意度,對平臺(tái)有著非常重要的意義。

對于用戶的推薦方法,目前有:1)基于協(xié)同過濾的個(gè)性化推薦方法。此類方法需要找到與用戶具備相似興趣或者有共同特征的用戶,但此類方法在具有共同特征的用戶收集上較為不便,難以對共同特征進(jìn)行規(guī)范化和量化的定義;同時(shí),此類方法對于共同特征用戶稀疏的問題不好解決,對于用戶推薦內(nèi)容的準(zhǔn)確率不好保證[2]。2)基于用戶興趣的推薦方法。此類方法針對用戶的興趣特征進(jìn)行推薦,但需要解決用戶興趣稀疏和用戶興趣的動(dòng)態(tài)變化[3]等問題。

本文針對用戶個(gè)性化內(nèi)容的推薦,將用戶的興趣標(biāo)簽進(jìn)行規(guī)范化和結(jié)構(gòu)化,采用興趣圖譜的方式來構(gòu)建用戶興趣,同時(shí)對用戶的興趣標(biāo)簽進(jìn)行量化定義。結(jié)合用戶交屬性,用戶在社交平臺(tái)上存在關(guān)注用戶,可以通過關(guān)注的興趣標(biāo)簽和關(guān)注用戶的權(quán)威度進(jìn)行協(xié)同過濾,關(guān)注用戶的權(quán)威度可以通過其粉絲數(shù)總和來反映。通過用戶興趣標(biāo)簽和用戶社交關(guān)系圖的關(guān)注用戶進(jìn)行綜合過濾,提高用戶內(nèi)容推薦的準(zhǔn)確率。

1 用戶興趣結(jié)構(gòu)化

對于互聯(lián)網(wǎng)用戶而言,用戶興趣是隱式的。用戶在商品評(píng)論、網(wǎng)頁瀏覽等方面都可以隱式地反饋出用戶的興趣特征。因此需要從用戶的行為中提取用戶的興趣特征,并將興趣特征進(jìn)行結(jié)構(gòu)化[4]。

用戶在進(jìn)行網(wǎng)頁瀏覽時(shí)會(huì)留下與用戶相關(guān)的諸多信息,比如:登錄用戶會(huì)被記錄個(gè)人信息和網(wǎng)頁瀏覽記錄;非登錄用戶的瀏覽記錄可以通過IP地址來標(biāo)志。提取用戶興趣時(shí),可獲得4類常用的信息(通稱為瀏覽歷史):歷史、書簽、頁面內(nèi)容和訪問日志。瀏覽器通常會(huì)保留用戶當(dāng)前和以往會(huì)話中的請求記錄。全局歷史存儲(chǔ)了訪問頁面的標(biāo)題、URL(Uniform Resoure Locator,統(tǒng)一資源定位器)、最初訪問時(shí)間戳、最近訪問時(shí)間戳、截止時(shí)間戳、URL訪問的次數(shù)。通過瀏覽歷史記錄可以初步認(rèn)定訪問頻率高的網(wǎng)頁為用戶的較高興趣。書簽服務(wù)提供了用戶對感興趣站點(diǎn)的快速訪問,用戶通常將自身經(jīng)常需要訪問或者感興趣的網(wǎng)頁內(nèi)容以書簽的形式加以存儲(chǔ),其中的URL可認(rèn)為是用戶很感興趣的內(nèi)容站點(diǎn)。

采用當(dāng)前通用的興趣圖譜分布方式對用戶的歷史瀏覽行為進(jìn)行歸類。通過對用戶瀏覽日志的分析,對用戶的每種瀏覽行為進(jìn)行興趣分類,將抽象的用戶行為表征為規(guī)則化的興趣標(biāo)簽。

2 用戶興趣圖譜構(gòu)建

用向量空間模型表示用戶的興趣,其中每個(gè)維度對應(yīng)用戶的某一興趣標(biāo)簽。每個(gè)興趣標(biāo)簽被賦予一定的權(quán)值,以表示用戶對該興趣標(biāo)簽的偏好程度。以用戶在該類型內(nèi)容上停留時(shí)間的比例定義興趣標(biāo)簽的權(quán)值w:

(1)

假設(shè)用戶具備如下幾種興趣標(biāo)簽:Set={“internet”,“education”,“movie”,“music”,“book”,“travel”}。通過式(1)得到用戶在每種興趣標(biāo)簽下的w,如表1所示。

表1 用戶興趣標(biāo)簽下的興趣權(quán)值

根據(jù)表1中用戶的興趣標(biāo)簽情況,將每個(gè)興趣標(biāo)簽作為一個(gè)向量維度,w為該維度上的坐標(biāo)點(diǎn),中心點(diǎn)為坐標(biāo)原點(diǎn),連接坐標(biāo)原點(diǎn)和各個(gè)維度上的坐標(biāo)點(diǎn)構(gòu)建用戶的興趣圖譜,如圖1所示。

圖1 用戶興趣圖譜

用戶的興趣是動(dòng)態(tài)變化的,因此用戶興趣圖譜也應(yīng)該是動(dòng)態(tài)變化的,需要根據(jù)用戶興趣的動(dòng)態(tài)變化來調(diào)整圖譜結(jié)構(gòu),設(shè)定興趣圖譜更新周期為T。

3 改進(jìn)的協(xié)同過濾算法

基于興趣標(biāo)簽和用戶社交網(wǎng)絡(luò)圖的協(xié)同推薦算法主要融合了用戶興趣標(biāo)簽與推薦內(nèi)容相似度,并使用用戶社交關(guān)系圖對推薦內(nèi)容進(jìn)行協(xié)同過濾。

3.1 興趣標(biāo)簽與推薦內(nèi)容相似度

根據(jù)用戶的興趣標(biāo)簽,可以獲得基于用戶興趣標(biāo)簽與內(nèi)容之間的相關(guān)度,然后根據(jù)相關(guān)度的高低對用戶進(jìn)行推薦[5]。將推薦內(nèi)容向量化,即C={c1,c2,…,cn},其中每個(gè)向量維度對應(yīng)一個(gè)興趣維度,c1為每個(gè)興趣維度上的權(quán)重值:

(2)

其中:ni為該興趣標(biāo)簽詞在C中出現(xiàn)的次數(shù);Σknk為C中所有興趣標(biāo)簽詞出現(xiàn)的次數(shù)之和。

將用戶的興趣圖譜以向量的方式加以結(jié)構(gòu)化表示為I={i1,i2,…,in},i1表示每個(gè)興趣標(biāo)簽對應(yīng)的權(quán)重。通過向量空間余弦相似度(Cosine Similarity)計(jì)算方法,可以得到用戶興趣和推薦內(nèi)容之間的相似度Simi→c:

(3)

3.2 興趣標(biāo)簽和用戶社交網(wǎng)絡(luò)圖的協(xié)同過濾

用戶在社交網(wǎng)絡(luò)平臺(tái)上可以關(guān)注其他用戶,關(guān)注人當(dāng)前的興趣偏好在很大程度上會(huì)影響當(dāng)前用戶的瀏覽選擇。重要社交用戶的興趣特征更容易影響用戶的瀏覽習(xí)慣。關(guān)注人的興趣偏好也可以通過興趣標(biāo)簽得以反映,因此,應(yīng)考慮關(guān)注人的重要性。

在社交網(wǎng)絡(luò)中,用戶的重要性可以通過關(guān)注人的多少來反映。當(dāng)某個(gè)用戶被眾多用戶所關(guān)注,那么該用戶在社交網(wǎng)絡(luò)平臺(tái)上就具有較高的知名度,該用戶的瀏覽興趣和瀏覽習(xí)慣就更能影響到普通用戶。定義用戶被關(guān)注的次數(shù)(即用戶的粉絲數(shù))為用戶的重要性F。用戶A的關(guān)注用戶列表為U={u1,u2,…,un},得到基于社交網(wǎng)絡(luò)圖的用戶興趣量化表示:

(4)

根據(jù)式(4),達(dá)到基于關(guān)注用戶興趣標(biāo)簽協(xié)同過濾效果,對于用戶的關(guān)注用戶而言,每個(gè)關(guān)注用戶的興趣標(biāo)簽也各不相同,需要對用戶的每個(gè)關(guān)注用戶做一次興趣標(biāo)簽到推薦內(nèi)容的相似度計(jì)算并進(jìn)行平均化,得到基于用戶關(guān)注的社交用戶和推薦內(nèi)容之間的相似度Simu→c:

(5)

綜合Simi→c和Simu→c,得到推薦內(nèi)容與用戶之間的總體相似度Sim:

Sim=α×Simi→c+(1-α)Simu→c

(6)

其中:α為比例系數(shù),表示基于興趣標(biāo)簽的相似度比例。

4 實(shí)驗(yàn)

以Last.fm作為實(shí)驗(yàn)數(shù)據(jù)集[6]。Last.fm是一家音樂網(wǎng)站,其用戶已經(jīng)達(dá)到4 000萬人次,遍布世界190多個(gè)國家。Last.fm數(shù)據(jù)集通過對用戶和用戶間關(guān)系進(jìn)行梳理,將用戶表征為節(jié)點(diǎn),用戶和用戶之間的關(guān)系表征為邊,整個(gè)數(shù)據(jù)集以csv格式組合。數(shù)據(jù)示例如表2所示。

表2 Last.fm數(shù)據(jù)示例

Last.fm數(shù)據(jù)集定義每首音樂作者為artist,同時(shí)也會(huì)為該作者創(chuàng)作的歌曲編訂標(biāo)簽詞。針對本文算法,首先需要確定式(6)中α的取值。設(shè)用戶興趣的興趣維度為N,得到用戶興趣維度和α不同取值時(shí)的平均絕對誤差(minimum average error)Ema,如圖2所示。

圖2 不用興趣維度下α取值各異對應(yīng)的Ema

由圖2可知,當(dāng)N=4,α=0.6時(shí),本文算法的Ema達(dá)到最低,說明在該情況下本文算法的性能較好。N=5時(shí),Ema變化相對較為平滑;N=3時(shí),Ema的數(shù)據(jù)變化相對較為明顯,可見N=5時(shí),數(shù)據(jù)穩(wěn)定性較好。當(dāng)N值偏大時(shí),用戶的興趣維度過于分散,導(dǎo)致最終對內(nèi)容的過濾過于稀疏,Ema過大。本文所選取的N=5是一個(gè)比較合適觀測的值。

設(shè)定α=0.6,分別比較基于本文算法(GIA)、基于用戶興趣標(biāo)簽的內(nèi)容推薦算法(UIA)和基于共同興趣用戶的協(xié)同推薦算法(CIA)在內(nèi)容推薦時(shí)的Ema,如圖3所示。

圖3 3種算法在內(nèi)容推薦時(shí)的Ema

由圖3可知,UIA算法和CIA算法在N=6時(shí)Ema達(dá)到極低值。相對而言,當(dāng)共同興趣數(shù)目重合較多時(shí),這2種算法較準(zhǔn)確;當(dāng)N值過大時(shí),同樣會(huì)出現(xiàn)圖2所示的情況,興趣維度過大而導(dǎo)致內(nèi)容篩選過于稀疏使得Ema偏高。

5 結(jié)語

本文通過分析用戶在社交網(wǎng)絡(luò)中社交關(guān)系,通過關(guān)注人的協(xié)同過濾和用戶自身的興趣標(biāo)簽進(jìn)行推薦內(nèi)容篩選,將用戶的興趣以興趣維度為單位構(gòu)建興趣圖譜;對于社交關(guān)系用戶,綜合考慮社交關(guān)系用戶自身的影響力和興趣標(biāo)簽,加權(quán)之后對推薦內(nèi)容進(jìn)行過濾。實(shí)驗(yàn)以Last.fm為測試數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果表明:本文算法能夠較好地提高推薦內(nèi)容的準(zhǔn)確度。

[1] WANG C Q, SU H Y, ZHU Y, et al. Distributed collaborative filtering recommendation model based on two-phase similarity [J]. Future Communication, Information and Computer Science, 2015, 28(1): 123.

[2] LV H,YU G,WU G. Celebrity endorsement problem on social media: formulation, analysis and recommendation algorithm [J]. International Journal of U-and E-service, Science and Technology, 2015, 8(1): 357-370.

[3] ZHANG W, YU L. Hybrid personalized tag recommendation algorithm design and evaluation[C]// Management of e-Commerce and e-Government (ICMeCG), 2014 International Conference on. IEEE, 2014:61-64.

[4] WANG Q X, GONG L, HE N Q.A recommendation algorithm for multiple e-commerce sites [J].Applied Engineering Sciences, 2014, 13(2):1.

[5] YU S, CHEN D, LI B, et al. A personalized recommendation algorithm based on interest graph[C]// Systems and Informatics (ICSAI), 2014 2nd International Conference on. IEEE, 2014:933-937.

[6] CHANG N, TERANO T. Development of a hybrid recommendation approach based on item content and user social influence[C]//Information Management and Management Engineering, Hong Kong,2015:29.

Research on Collaborative Recommending Algorithm based on Social Network and Interesting Tag

WANGQingfua*,LVXiaogangb

(a.Information Technology Department; b.Public Administration Department,Liaoning School of Administration, Shenyang 110161, China)

Through user’s social network, user’s interest tags could be showed much more enough in order that improving the dependence of platform. As an example of micro-blog, the importance of followed users would be affected by following number, the user’s recommending content would achieve the collaborative filtering both from user’s interesting tag and user’s social networking graph. The experimental results on an open dataset of Last.fm show that the improved algorithm could obviously improve the recommendation accuracy.

user social network; interesting tag; collaborative filtering; user identity weighting

10.13542/j.cnki.51-1747/tn.2015.04.007

2015-10-10

王慶福(1979— ),男(漢族),遼寧盤錦人,講師,研究方向:計(jì)算機(jī)網(wǎng)絡(luò)與數(shù)據(jù)庫技術(shù),通信作者郵箱:wangqingfu2011@163.com。 呂小剛(1983— ),男(漢族),遼寧沈陽人,講師,碩士,研究方向:信息管理、電子政務(wù)。

TP391

A

2095-5383(2015)04-0022-03

猜你喜歡
圖譜標(biāo)簽社交
社交之城
英語世界(2023年6期)2023-06-30 06:28:28
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
繪一張成長圖譜
社交距離
你回避社交,真不是因?yàn)閮?nèi)向
文苑(2018年17期)2018-11-09 01:29:28
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
車迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
主動(dòng)對接你思維的知識(shí)圖譜
標(biāo)簽化傷害了誰
嘉黎县| 苏尼特左旗| 安康市| 江华| 兴海县| 华阴市| 青州市| 辉南县| 雷山县| 古交市| 泰宁县| 马山县| 香港| 丹棱县| 阳谷县| 正安县| 原阳县| 类乌齐县| 井陉县| 鄂托克旗| 额尔古纳市| 潢川县| 马鞍山市| 靖宇县| 阿勒泰市| 锦屏县| 六安市| 涟水县| 札达县| 太湖县| 定日县| 滁州市| 察雅县| 乐陵市| 米脂县| 娄底市| 双辽市| 全州县| 达日县| 晋州市| 镇宁|