国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向D2D移動社交網(wǎng)絡(luò)的用戶相似度分析方法

2019-08-08 06:23:04史愛靜王盼盼
電腦知識與技術(shù) 2019年18期

史愛靜 王盼盼

摘要:為了緩解海量社交信息傳播給底層通信網(wǎng)絡(luò)帶來的負(fù)擔(dān),越來越多的社交網(wǎng)絡(luò)開始利用Device-to-Device(D2D)技術(shù)傳播信息,基于D2D的社交網(wǎng)絡(luò)應(yīng)運而生。作為社交網(wǎng)絡(luò)分析領(lǐng)域的重要研究方向,用戶行為分析在輿情分析、網(wǎng)絡(luò)安全、社區(qū)發(fā)現(xiàn)、民意調(diào)查、市場預(yù)測方面發(fā)揮重要作用。為此,該文將針對D2D移動社交網(wǎng)絡(luò)的用戶行為分析開展工作,重點研究此類社交網(wǎng)絡(luò)中的用戶相似度建模方法。針對現(xiàn)有的用戶相似度分析方法未考慮用戶主觀因素的問題,參考傳統(tǒng)的用戶相似度分析方法,提出了適用于D2D移動社交網(wǎng)絡(luò)的、基于內(nèi)容偏好的用戶相似度模型。該模型將用戶活躍度、用戶空間特征和用戶偏好等作為度量因素,建立用戶相似度模型,并在真實環(huán)境中對模型進行驗證。

關(guān)鍵詞:用戶相似度;用戶行為分析;D2D技術(shù);移動社交網(wǎng)絡(luò)

中圖分類號:TP319? ? ? ? 文獻標(biāo)識碼:A

文章編號:1009-3044(2019)18-0277-03

隨著智能移動設(shè)備的普及,移動社交網(wǎng)絡(luò)飛速發(fā)展。相比傳統(tǒng)社交網(wǎng)絡(luò),移動社交網(wǎng)絡(luò)滿足了用戶隨時隨地都會產(chǎn)生的社交需求,吸引了越來越多的用戶參與其中。然而,移動社交網(wǎng)絡(luò)中產(chǎn)生的大量社交信息卻給底層通信網(wǎng)絡(luò)帶來了沉重的負(fù)擔(dān)。已有的研究結(jié)果表明[1-2],通過Device-to-Device(D2D)技術(shù)分流通信網(wǎng)絡(luò)的負(fù)載可以緩解底層通信網(wǎng)絡(luò)的負(fù)擔(dān),而D2D環(huán)境中的用戶行為是利用D2D技術(shù)分流時重要的參考因素。

用戶行為分析是社交網(wǎng)絡(luò)分析的重要內(nèi)容,它包括用戶影響力分析、用戶相似度分析等。用戶相似度被廣泛用來衡量不同用戶在興趣愛好、選擇傾向等方面的相似程度。通過用戶相似度分析,可以挖掘出群體用戶的特征,進而為不同特征的群體用戶提供個性化服務(wù),如精準(zhǔn)營銷[3-5]、好友推薦[6-8]等。

基于以上分析,本文以真實的、面向信息共享的D2D移動社交網(wǎng)絡(luò)為研究對象,重點研究該網(wǎng)絡(luò)中的用戶相似度問題。該網(wǎng)絡(luò)不同于微博等社交網(wǎng)絡(luò),它沒有粉絲、關(guān)注、提及等可以量化分析的因素,需要從用戶的社交行為入手,分析用戶的行為特點,以此為基礎(chǔ)建立用戶相似度評價模型。

1背景

1.1國內(nèi)外研究現(xiàn)狀分析

用戶相似度用來衡量不同用戶在興趣愛好、選擇傾向等方面的相似程度。目前,用戶相似度的研究主要以微博為研究對象,重點從用戶背景信息、微博內(nèi)容、用戶交互行為和用戶社交關(guān)系等方面進行分析[9][10]。徐志明[11]通過分析用戶背景信息、博文內(nèi)容以及用戶的社交行為等因素,發(fā)現(xiàn)以社交信息為基礎(chǔ)的用戶相似度能夠較好地反映用戶之間關(guān)系的緊密程度。Yu等[12]主要關(guān)注用戶興趣相似度與用戶社交關(guān)系之間的聯(lián)系,其研究結(jié)果表明用戶之間的興趣相似度和用戶之間的現(xiàn)實社交關(guān)系之間存在著較強的正相關(guān)。Krishnamurthy等[13]將關(guān)注和被關(guān)注兩個因素作為用戶分類標(biāo)準(zhǔn),進而計算用戶相似度。仲兆滿等[14]在分析用戶相似度時,同時考慮用戶之間的關(guān)注關(guān)系和用戶之間的粉絲關(guān)系。逯鵬等[15]利用用戶之間的共同好友數(shù)計算用戶相似度。

與上述研究所涉及的社交網(wǎng)絡(luò)不同,本文研究的D2D移動社交網(wǎng)絡(luò)用戶主要的社交活動是進行信息共享。在該社交網(wǎng)絡(luò)中,不存在關(guān)注、被關(guān)注、粉絲等概念,難以應(yīng)用已有方法?;诖耍疚膶⑨槍υ撋缃痪W(wǎng)絡(luò)開展用戶相似度研究。

1.2 Xender數(shù)據(jù)集概要

Xender是一款利用D2D技術(shù)為用戶提供信息共享服務(wù)的智能移動設(shè)備應(yīng)用程序。它擁有超過8000萬的活躍用戶,覆蓋了所有時區(qū)。在文件傳輸過程中,不會產(chǎn)生移動網(wǎng)絡(luò)通信費用。本文收集了長達一個月的信息傳播日志數(shù)據(jù),總量超過500GB,共8億多條記錄。這些記錄包含了20多個屬性[1],本文僅分析與文件名、文件類型、發(fā)送者、接收者、接收時間和地理分布對應(yīng)的屬性。本文分析均在Hadoop集群上運行。該集群包括20個節(jié)點,640GB內(nèi)存空間和60TB磁盤空間。本文所有分析工作都在MapReduce模型編程實現(xiàn)。

2用戶相似度相關(guān)因素分析

在本文所研究的移動社交網(wǎng)絡(luò)中,用戶在D2D技術(shù)的支持下進行多種類型的文件共享活動。每個文件共享活動涉及文件類型、參與用戶(時間因素、空間因素等)等等,本節(jié)將從以下三方面出發(fā),分析各因素與用戶相似度的關(guān)系。

(1)用戶因素

本節(jié)首先分析了用戶在分享文件時對文件的偏好。在分析過程中,首先利用程序分析了分享活動中涉及的文件類型和用戶對文件類型的偏好,約50%的用戶傾向共享一種類型文件,25%左右的用戶傾向共享兩種類型文件,不到10%的用戶傾向于4種及以上類型文件的共享。

用戶傾向性比較明顯的文件類型組合。如圖1展示了,在分享了Folder的用戶中, 65%的用戶分享App文件,約20%的用戶分享Audio文件。在File相關(guān)分享活動中,約10%的用戶分享了APP文件,在Audio相關(guān)分享活動中,約33%的用戶分享了App文件。由上可知,不同用戶對不同的文件類型有不同的偏好,在分析用戶相似度時應(yīng)充分考慮用戶偏好這一因素。

(2) 時間因素

用戶的分享行為在時間上的特征如圖2所示。其中x軸表示時間,以天為單位;y軸表示不同分享偏好所占的比例。由圖可知,用戶的文件分享行為具有比較明顯的時間特征,在時間上顯現(xiàn)出鮮明的傳播高峰和低谷,有一定的周期性可循。因此,本文在計算用戶相似度時將考慮用戶的分享活動在時間上表現(xiàn)出的特征。

(3)空間因素

在不同文化背景和社會認(rèn)知的影響下,不同地區(qū)的用戶會展示不同的生活和社交習(xí)慣,這些習(xí)慣必然會在文件分享行為上有所表現(xiàn)。故,在度量用戶的相似度時應(yīng)當(dāng)考慮空間因素對用戶相似度的影響。

黄梅县| 东阳市| 四川省| 宜都市| 青川县| 博兴县| 利津县| 安庆市| 晋城| 南靖县| 保山市| 锦州市| 崇州市| 丹棱县| 金沙县| 昌黎县| 衢州市| 武汉市| 当雄县| 萨迦县| 雷山县| 嘉禾县| 揭西县| 武宣县| 塔河县| 垣曲县| 新竹市| 南木林县| 罗平县| 乳山市| 大连市| 米泉市| 钟祥市| 大港区| 昌邑市| 中卫市| 金乡县| 通城县| 临桂县| 当阳市| 当涂县|