摘 要:探究綜合考慮多交互關(guān)系與情感傾向因素的微博用戶可信度評(píng)估方法。首先基于用戶間交互關(guān)系的類型和頻率,得到用戶交互度與參與度;然后根據(jù)情感詞典計(jì)算用戶間評(píng)論、回復(fù)等文本內(nèi)容的情感得分,并據(jù)此判斷用戶情感傾向;其次以PageRank算法為基礎(chǔ),從用戶資料、博文中提取特征,計(jì)算每個(gè)用戶的個(gè)體可信度作為初始PR值,并將用戶交互度和情感傾向融合調(diào)整PR值分配權(quán)重、使用參與度修正阻尼系數(shù),實(shí)現(xiàn)對PageRank算法的改進(jìn);最終,改進(jìn)的PageRank算法迭代穩(wěn)定后得到待評(píng)估用戶的可信度。實(shí)驗(yàn)結(jié)果顯示,與未考慮用戶間多交互關(guān)系以及情感傾向的方法相比,所提方法在AUC值、查準(zhǔn)率、查全率和F1值上均取得了更好的效果,最高提升了13.86%。綜合考慮用戶間多交互關(guān)系和情感傾向可以提高微博用戶可信度評(píng)估效果。
關(guān)鍵詞:微博用戶;多交互關(guān)系;情感傾向;交互度;參與度
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2024)10-017-3000-08
doi:10.19734/j.issn.1001-3695.2024.03.0049
Microblog users’ credibility evaluation algorithm considering multi-interaction relationships and emotional tendencies
Wang Zining,Zhang Guofang
(School of Cyberspace Security & Computer,Hebei University,Baoding Hebei 071000,China)
Abstract:This paper proposed a new algorithm of the credibility evaluation concerning microblog users,based on their multiple interactive relationships and emotional tendencies.Firstly,the algorithm calculated the interaction degree and participation degree of users by analyzing the types and frequency of interactions among users.Secondly,this algorithm made the emotional scores of the textual contents including comments and replied among users by using a sentiment dictionary,and assessed users’ emotional tendencies.Thirdly,based on the PageRank algorits5UOywq2fA5yPx9b+/IBew==hm,the new algorithm extracted the features from user profiles and blog posts in order to compute the initial PageRank value for representing individual user credibility,adjusted the distribution of PageRank weights by integrating the user interaction degree and emotional tendencies,and modified the damping factor in accordance with the participation degree.Finally,the proposed algorithm made the credibility of the evaluated users after the iterative stabilization.The experimental results show that,compared to methods that overlook multi-interaction relationships and emotional tendencies,the new algorithm achieves better results with an improvement of up to 13.86% in terms of AUC value,precision,recall,and F1-measure.The method that considers multiple interaction relationships and emotional tendencies can enhance the effectiveness of microblog user credibility evaluation with respect to microblog users.
Key words:Microblog users;multi-interaction relationship;emotional tendency;interaction degree;participation degree
0 引言
微博平臺(tái)是國內(nèi)重要的信息服務(wù)提供者之一,截至2023年第二季度末,其月活躍用戶已達(dá)5.99億[1]。然而微博用戶的信用狀況良莠不齊,一些用戶造謠誹謗、煽動(dòng)仇恨,損害網(wǎng)絡(luò)生態(tài)[2]。為維護(hù)網(wǎng)絡(luò)生態(tài)環(huán)境,我國2022年8月頒布了《互聯(lián)網(wǎng)用戶賬號(hào)信息管理規(guī)定》,要求互聯(lián)網(wǎng)信息服務(wù)提供者建立完善的用戶賬號(hào)信用管理體系,根據(jù)用戶賬號(hào)信用狀況提供相應(yīng)服務(wù)[3]。有效的微博用戶可信度評(píng)估方法有助于平臺(tái)管理者更好地了解用戶賬號(hào)信用狀況,及時(shí)發(fā)現(xiàn)微博網(wǎng)絡(luò)中的不可信用戶,凈化網(wǎng)絡(luò)環(huán)境,相關(guān)研究已經(jīng)受到廣泛的關(guān)注[4]。
早期的可信度評(píng)估方法集中于用戶個(gè)體層面,從用戶資料或博文中提取特征評(píng)估用戶可信度。Castillo等人[5]從用戶資料中提取平均博文數(shù)量、平均粉絲數(shù)量等特征作為用戶可信度的評(píng)估指標(biāo);文獻(xiàn)[6]進(jìn)一步選取用戶認(rèn)證情況、教育經(jīng)歷等特征識(shí)別不可信用戶。除用戶資料外,Abu-Salih等人[7]認(rèn)為在過多領(lǐng)域發(fā)布博文的用戶不可信,根據(jù)用戶博文得到用戶感興趣的主題數(shù)量、每個(gè)主題下發(fā)布內(nèi)容的單詞數(shù)等特征度量用戶可信度;Wanda等人[8]從用戶歷史博文中提取博文發(fā)布規(guī)律、語言風(fēng)格等特征判斷用戶是否可信。但是這類方法忽略了用戶的社會(huì)屬性,僅依賴于用戶提供信息的真實(shí)性和完整性,其準(zhǔn)確率較低[9]。隨著用戶之間的交互增多,一些學(xué)者注意到了用戶通過交互形成的拓?fù)鋱D,并根據(jù)用戶的社交關(guān)系圖結(jié)構(gòu)來判斷他們是否可信。李志宏等人[10]提出節(jié)點(diǎn)的結(jié)構(gòu)重要性越高,該節(jié)點(diǎn)的影響力也越高,并據(jù)此利用中介中心性、緊密中心性和點(diǎn)度中心性等指標(biāo)來發(fā)現(xiàn)水軍用戶;楊艷萍[11]利用局部最小路徑搜索算法,計(jì)算以指定用戶為根節(jié)點(diǎn)的“朋友圈”中該用戶與其他用戶之間的可信度關(guān)系圖生成規(guī)則。通過社交網(wǎng)絡(luò)圖的拓?fù)浣Y(jié)構(gòu)判斷用戶是否可信相對較為客觀。然而,僅僅依靠網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)可能無法完全了解節(jié)點(diǎn)的內(nèi)部特征,同時(shí)這些方法也未考慮其他節(jié)點(diǎn)對評(píng)估的影響。近年來,一些研究人員發(fā)現(xiàn)用戶更傾向于與可信度相似或更高的用戶建立關(guān)聯(lián)[12],因此從用戶交互層面出發(fā),提出基于信任傳播的可信度評(píng)估方法。這類方法是一種通過分析社交網(wǎng)絡(luò)圖中的信任傳遞過程來評(píng)估節(jié)點(diǎn)可信度的方法,利用了節(jié)點(diǎn)可信度不僅受節(jié)點(diǎn)自身特征影響,還受到其周圍節(jié)點(diǎn)可信度和信任關(guān)系影響的思想[13],其中常見的方法是以PageRank算法為基礎(chǔ)的改進(jìn)算法[14]。李付民等人[15]基于PageRank算法提出用戶可信度評(píng)價(jià)模型user-rank,首先從用戶資料中提取特征,得到用戶自評(píng)價(jià)可信度,然后利用用戶關(guān)注網(wǎng)絡(luò)中其他用戶節(jié)點(diǎn)的自評(píng)價(jià)可信度對待分析用戶節(jié)點(diǎn)的可信度進(jìn)行綜合評(píng)價(jià);Zare等人[13]進(jìn)一步利用了用戶屬性,首先對相似用戶進(jìn)行聚類,然后依托用戶關(guān)注關(guān)系構(gòu)造網(wǎng)絡(luò),最后根據(jù)用戶資料計(jì)算得分來改進(jìn)PageRank算法中節(jié)點(diǎn)PR值的分配方式,以找出網(wǎng)絡(luò)中的異常用戶;蘭瑋等人[16]注意到不同用戶之間可信度影響程度不同,因此將用戶關(guān)注關(guān)系視為無向邊構(gòu)造網(wǎng)絡(luò),通過用戶信息提取得到用戶脆弱度和相似度作為權(quán)重改進(jìn)PageRank算法計(jì)算用戶可信度。這些方法雖注意到了社交網(wǎng)絡(luò)圖中用戶鄰居節(jié)點(diǎn)信息對評(píng)估的影響,但是在度量用戶可信度受其鄰居節(jié)點(diǎn)影響的程度時(shí)存在明顯的不足:a)這些方法或?qū)⑧従庸?jié)點(diǎn)視為同等重要,或根據(jù)相似程度進(jìn)行區(qū)分,并沒有考慮相鄰節(jié)點(diǎn)間的連接強(qiáng)度,也沒有考慮目標(biāo)節(jié)點(diǎn)在整體網(wǎng)絡(luò)中所處位置,因此評(píng)估的準(zhǔn)確性不足[17];b)這些方法未考慮用戶間的信任情況,若目標(biāo)節(jié)點(diǎn)不被其鄰居節(jié)點(diǎn)信任,則其可信度可能降低[18]。
在微博中,用戶間可以通過轉(zhuǎn)發(fā)、評(píng)論和回復(fù)等交互行為分別建立轉(zhuǎn)發(fā)、評(píng)論和回復(fù)等關(guān)系[10]。這些交互關(guān)系可以體現(xiàn)用戶間密切程度以及用戶參與交互的積極程度的不同[19,20],是衡量用戶之間影響與被影響程度的一個(gè)重要因素[21]。因此,在度量用戶可信度受其他用戶影響的程度時(shí)有必要考慮用戶間錯(cuò)綜復(fù)雜的多交互關(guān)系。此外,Qazvinian等人[22]認(rèn)為分析社交網(wǎng)絡(luò)中的用戶信任關(guān)系時(shí)需要考慮情感傾向的影響。用戶之間的交互在情感方面并非都表現(xiàn)出認(rèn)同的傾向,也有反對的情況,不同的傾向體現(xiàn)了用戶間信任情況的不同,進(jìn)而對評(píng)估的影響不同[23]。基于此,本文提出一種考慮多交互關(guān)系與情感傾向的微博用戶可信度評(píng)估方法,以基于改進(jìn)PageRank算法的評(píng)估策略為切入點(diǎn),在度量用戶可信度受關(guān)聯(lián)用戶影響程度時(shí)考慮了用戶間多種交互關(guān)系與情感傾向,提高了評(píng)估的準(zhǔn)確性。
1 研究框架
本文研究框架如圖1所示。整體上分為三個(gè)部分:a)交互關(guān)系的量化。依據(jù)用戶間的關(guān)注、轉(zhuǎn)發(fā)、評(píng)論和回復(fù)等交互行為,分析相應(yīng)的交互關(guān)系,量化用戶對用戶的交互度和用戶對交互的參與度。b)情感傾向的判斷。根據(jù)用戶間評(píng)論、轉(zhuǎn)發(fā)等文本內(nèi)容計(jì)算用戶間情感得分,進(jìn)而判斷用戶的情感傾向是正向或負(fù)向。c)用戶可信度評(píng)估。首先根據(jù)用戶資料、博文計(jì)算每個(gè)用戶的個(gè)體可信度,其次根據(jù)用戶的個(gè)體可信度、交互度、參與度與情感傾向?qū)ageRank算法進(jìn)行改進(jìn),最終多次迭代后得到待評(píng)估用戶的可信度。
2 考慮多交互關(guān)系與情感傾向評(píng)估用戶可信度
2.1 交互關(guān)系的量化
在微博中,人們更傾向于與自己可信度接近或更可信的用戶形成關(guān)系,信任程度與關(guān)系強(qiáng)度呈正相關(guān)[24],因而與用戶關(guān)系越緊密的用戶,對其可信度評(píng)估的影響越大[25]。基于此,本文綜合考慮微博用戶間關(guān)注、轉(zhuǎn)發(fā)、評(píng)論、回復(fù)和提及五種交互關(guān)系,并定義交互度來計(jì)算用戶間關(guān)系強(qiáng)度。
定義1 交互用戶、目標(biāo)用戶。若用戶ui對uj有關(guān)注、轉(zhuǎn)發(fā)、評(píng)論、回復(fù)或提及等交互行為,則稱用戶ui是uj的交互用戶,稱用戶uj是ui交互的目標(biāo)用戶。
定義2 交互用戶對目標(biāo)用戶的交互度。交互用戶ui對其目標(biāo)用戶uj的交互度可定義為uj收到的所有交互中來自u(píng)i的比例,其計(jì)算公式如式(1)所示。
w(ui,uj)=αfwNfw(ui,uj)+αryNry(ui,uj)+αrtNrt(ui,uj)+αmnNmn(ui,uj)+αctNct(ui,uj)∑ue∈Uj[αfwNfw(ue,uj)+αryNry(ue,uj)+αrtNrt(ue,uj)+αmnNmn(ue,uj)+αctNct(ue,uj)](1)
其中:Uj是用戶uj的交互用戶集合;Nfw(ui,uj)、Nry(ui,uj)、Nrt(ui,uj)、Nmn(ui,uj)和Nct(ui,uj)分別表示用戶ui關(guān)注、回復(fù)、轉(zhuǎn)發(fā)、提及和評(píng)論用戶uj的次數(shù),值得注意的是關(guān)注次數(shù)Nfw(ui,uj)的取值只有取0或1;αfw、αry、αrt、αmn和αct分別是關(guān)注、回復(fù)、轉(zhuǎn)發(fā)、提及和評(píng)論五種關(guān)系的權(quán)重,且αfw+αry+αrt+αmn+αct=1。
用戶參與交互有主動(dòng)參與和被動(dòng)參與兩種形式[26]。用戶越積極與其他用戶交互,其主動(dòng)參與程度越高,該用戶更有可能發(fā)起、參與熱點(diǎn)話題傳播,其自身因素在評(píng)估中更重要[20]。用戶接受其他用戶所發(fā)出關(guān)系的數(shù)量、類型越多,其被動(dòng)參與程度越高,則該用戶在網(wǎng)絡(luò)中的地位更高,那么由該用戶傳遞的其他用戶的可信度更可能被接受[18]。基于此,本文首先給出用戶主動(dòng)參與度與被動(dòng)參與度的定義與計(jì)算方法,然后在其基礎(chǔ)上給出用戶參與度的定義與計(jì)算方法。
定義3 用戶主動(dòng)參與度。用戶ui的主動(dòng)參與度可描述為其主動(dòng)對其他用戶交互的程度,記為a(ui)。
用戶ui的主動(dòng)參與度由ui對其他用戶交互的次數(shù)與權(quán)重度量,計(jì)算公式如式(2)所示。
a(ui)=Nout(ui)max(Nout)+[αfwactfw(ui)+αryactry(ui)+αrtactrt(ui)+αmnactmn(ui)+αctactct(ui)](2)
其中:Nout(ui)是用戶ui對其他用戶交互的次數(shù);max(Nout)表示所有用戶中,對其他用戶交互次數(shù)的最大值;actfw(ui)、actry(ui)、actrt(ui)、actmn(ui)、actct(ui)分別表示用戶ui是否對其他用戶有關(guān)注、回復(fù)、轉(zhuǎn)發(fā)、提及和評(píng)論行為,以actfw(ui)為例,計(jì)算公式如式(3)所示。
actfw(ui)=1ui對其他用戶有關(guān)注行為0其他(3)
定義4 用戶被動(dòng)參與度。用戶ui的被動(dòng)參與度描述了其被動(dòng)接受其他用戶交互的程度,記為p(ui)。
用戶ui的被動(dòng)參與度通過其他用戶對用戶ui交互的次數(shù)與權(quán)重度量,計(jì)算公式如式(4)所示。
p(ui)=Nin(ui)max(Nin)+[αfwpasfw(ui)+αrypasry(ui)+αrtpasrt(ui)+αmnpasmn(ui)+αctpasct(ui)](4)
其中:Nin(ui)是用戶ui接受其他用戶交互的次數(shù);max(Nin)表示所有用戶中,接受其他用戶交互次數(shù)的最大值;pasfw(ui)、pasry(ui)、pasrt(ui)、pasmn(ui)、pasct(ui)分別表示是否有其他用戶對用戶ui有關(guān)注、回復(fù)、轉(zhuǎn)發(fā)、提及和評(píng)論行為,以pasfw(ui)為例,計(jì)算公式如式(5)所示。
pasfw(ui)=1其他用戶對ui有關(guān)注行為0其他(5)
定義5 用戶參與度。用戶ui的參與度定義為其主動(dòng)參與度與其主動(dòng)、被動(dòng)參與度之和的比值,計(jì)算公式如式(6)所示。
d(ui)=a(ui)a(ui)+p(ui)(6)
2.2 情感傾向的判斷
用戶情感傾向是交互用戶對其目標(biāo)用戶所持有的贊同、中立或反對立場。微博用戶評(píng)論、回復(fù)、提及和轉(zhuǎn)發(fā)追加的文本內(nèi)容中隱含著能夠反映該用戶對其目標(biāo)用戶的情感傾向:正向的情感傾向通常表明交互用戶對目標(biāo)用戶的認(rèn)可與信任,可能會(huì)增加目標(biāo)用戶的可信度[23];負(fù)向的情感傾向表明交互用戶與目標(biāo)用戶之間存在分歧或不信任,可能降低目標(biāo)用戶的可信度[27]。因此,對用戶可信度進(jìn)行評(píng)估需要考慮其他用戶對該用戶的情感傾向[28]。
本文采用情感詞典的方法判斷交互用戶ui對其目標(biāo)用戶uj的情感傾向,使用包含情感詞匯相對較多的大連理工大學(xué)中文情感詞典本體庫[29]作為情感詞典,基本格式如表1所示。
首先,將用戶ui對uj評(píng)論、回復(fù)、提及和轉(zhuǎn)發(fā)追加的文本內(nèi)容進(jìn)行預(yù)處理,以標(biāo)點(diǎn)符號(hào)為分割標(biāo)志將文本分為若干個(gè)分句。再對分句進(jìn)行分詞和去停用詞處理,通過對比情感詞典找出每個(gè)分句中的正向詞匯和負(fù)向詞匯,并以詞匯為基準(zhǔn)尋找其所在分句中的否定詞。依據(jù)詞匯的強(qiáng)度得分、極性與分句中否定詞數(shù)量計(jì)算每個(gè)情感詞匯的得分,計(jì)算公式如式(7)所示。
sen(wordk)=str(wordk)×pol(wordk)×(-1)n(7)
其中:sen(wordk)表示情感詞wordk的情感分;str(wordk)表示wordk在詞典中的強(qiáng)度得分;pol(wordk)表示wordk在詞典中的極性,正向極性取值為1,負(fù)向極性取值為-1;n是wordm所在分句中的否定詞數(shù)量。
然后,分別將所有分句中情感分為正的情感詞與情感分為負(fù)的情感詞的得分求和,計(jì)算用戶ui對uj的正向情感值和負(fù)向情感值,計(jì)算公式分別如式(8)(9)所示。
scorepos(ui,uj)=∑sen(wordk)>0sen(wordk)(8)
scoreneg(ui,uj)=∑sen(wordk)<0sen(wordk)(9)
其中:scorepos(ui,uj)是用戶ui對uj的正向情感值;scoreneg(ui,uj)是用戶ui對uj的負(fù)向情感值。
最后,將用戶ui對uj的正向情感值和負(fù)向情感值進(jìn)行比較,當(dāng)正向情感值大于或等于負(fù)向情感值時(shí)認(rèn)為用戶ui對uj情感傾向s(ui,uj)為正,取值為1,否則s(ui,uj)取值為-1,計(jì)算公式如式(10)所示。
s(ui,uj)=1scorepos(ui,uj)≥scoreneg(ui,uj)-1scorepos(ui,uj)<scoreneg(ui,uj)(10)
2.3 微博用戶可信度評(píng)估
用戶可信度評(píng)估既涉及用戶自身因素,也和與其交互的用戶相關(guān)[18],基于這一思想,本文以PageRank算法為基礎(chǔ),提出一種考慮多交互關(guān)系和情感傾向的微博用戶可信度評(píng)估方法,通過鄰居節(jié)點(diǎn)的可信度迭代計(jì)算目標(biāo)節(jié)點(diǎn)的可信度。
2.3.1 PageRank算法
經(jīng)典的PageRank算法同時(shí)考慮了節(jié)點(diǎn)隨機(jī)跳轉(zhuǎn)其他網(wǎng)頁的固定概率以及其鄰居節(jié)點(diǎn)的質(zhì)量計(jì)算頁面排名順序,計(jì)算公式如式(11)所示。
PRt+1(vi)=d×1N+(1-d)×∑vj→viPRt(vi)out(vj)(11)
其中:PRt+1(vi)代表節(jié)點(diǎn)vi在t+1次迭代時(shí)的PR值;N是網(wǎng)頁總數(shù);1/N表示當(dāng)前網(wǎng)頁隨機(jī)跳轉(zhuǎn)其他網(wǎng)頁的概率,同時(shí)也是每個(gè)節(jié)點(diǎn)的初始PR值;out(vj)是節(jié)點(diǎn)vj的出鏈數(shù)量;d是阻尼系數(shù),用于平衡節(jié)點(diǎn)自身隨機(jī)跳轉(zhuǎn)概率和鄰居節(jié)點(diǎn)質(zhì)量對計(jì)算的影響,一般取0.15[15]。
2.3.2 考慮多交互關(guān)系和用戶情感傾向的可信度評(píng)估方法
PageRank算法同時(shí)考慮了節(jié)點(diǎn)自身隨機(jī)跳轉(zhuǎn)概率和鄰居節(jié)點(diǎn)質(zhì)量,本文以式(14)得到的用戶個(gè)體可信度替代節(jié)點(diǎn)自身隨機(jī)跳轉(zhuǎn)概率,并作為節(jié)點(diǎn)初始PR值。同時(shí),將交互度與情感傾向的乘積作為邊權(quán)重,修正用戶的交互用戶對其可信度的貢獻(xiàn)。交互度體現(xiàn)了用戶的交互用戶對其可信度影響程度的大小[24],情感傾向決定了交互用戶對其可信度的影響是正向或是負(fù)向[23]。此外,積極與其他用戶交互的用戶其個(gè)體因素在評(píng)估中的影響更大[19],被動(dòng)接受其他用戶交互的用戶傳遞其他用戶的影響更大[20]。所以選擇式(2)計(jì)算得到的用戶參與度作為阻尼系數(shù)平衡用戶個(gè)體可信度與鄰居節(jié)點(diǎn)可信度對評(píng)估的影響。最終,本文用戶可信度評(píng)估方法的迭代公式如式(12)所示。
rt+1(ui)=d(ui)×ru(ui)+[1-d(ui)]×∑uj∈Uirt(uj)×w(uj,ui)×s(uj,ui)(12)
其中:t是迭代次數(shù);rt+1(ui)是t+1次迭代時(shí)用戶ui的可信度;Ui是用戶ui的交互用戶集合;d(ui)是用戶ui的參與度;w(uj,ui)是用戶uj對ui的交互度;s(uj,ui)是用戶uj對ui的情感傾向;ru(ui)是用戶ui的個(gè)體可信度,根據(jù)用戶資料、歷史博文提取特征計(jì)算得到,所選取的特征如表2所示。
用戶ui的個(gè)體可信度計(jì)算如式(13)所示。
ru(ui)=γ×[21+e-∑11j=1Xj(ui)-1]+(1-γ)×∑4k=1[βk×Yk(ui)](13)
其中:∑11j=1Xj(ui)是用戶ui資料提取特征得分的和;Yk(ui)是用戶ui歷史博文提取特征得分;參數(shù)β、γ為權(quán)值系數(shù),滿足β,γ∈(0,1),其值將通C5H9WI0nxtNTT8rdTotWKg==過實(shí)驗(yàn)獲取。
本文微博用戶可信度評(píng)估算法(UCEM-IGIS)的具體過程如算法1所示。
算法1 考慮多交互關(guān)系和情感傾向的可信度評(píng)估算法
輸入:待評(píng)估用戶user;與user交互的用戶集U;交互關(guān)系集I;博文集C。
輸出:user的可信度。
a)在交互關(guān)系集I中,根據(jù)式(1)計(jì)算用戶間交互度;
b)在交互關(guān)系集I中,根據(jù)式(2)~(6)計(jì)算各用戶的參與度;
c)提取交互關(guān)系集I包含的文本內(nèi)容,根據(jù)式(7)~(10)判斷用戶情感傾向;
d)提取user與交互用戶集U中用戶資料、博文特征,根據(jù)式(12)(13)計(jì)算用戶個(gè)體可信度;
e)根據(jù)步驟b)c)得到的交互度和參與度確定節(jié)點(diǎn)間邊的權(quán)重;
f)根據(jù)式(12)迭代計(jì)算每個(gè)節(jié)點(diǎn)的可信度;
g)重復(fù)步驟f)直到每個(gè)用戶節(jié)點(diǎn)的可信度不再變化;
h)得到user的可信度。
3 用戶可信度評(píng)估實(shí)驗(yàn)和分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
目前尚無用于微博用戶可信度評(píng)估的權(quán)威數(shù)據(jù)集,因此本文參考文獻(xiàn)[30]給出的數(shù)據(jù)集構(gòu)建方式,通過新浪微博平臺(tái)提供的API接口和爬蟲工具爬取真實(shí)數(shù)據(jù)用于研究。實(shí)驗(yàn)數(shù)據(jù)包括:可信用戶集、不可信用戶集、交互用戶集、交互關(guān)系集和博文集。為了使用戶分類更符合真實(shí)情況,不可信用戶集中的用戶為隨機(jī)爬取的2021年2月到2023年2月微博社區(qū)管理中心中被多次舉報(bào)的用戶,可信用戶集中的用戶為同一時(shí)間段內(nèi)微博熱門隨機(jī)爬取的用戶。交互用戶集由與這些用戶有直接或間接交互關(guān)系的用戶構(gòu)成,交互關(guān)系集收集了上述所有用戶間的交互數(shù)據(jù),博文集由上述所有用戶在同時(shí)間段內(nèi)發(fā)布的原創(chuàng)博文構(gòu)成。表3列出了本文所構(gòu)建數(shù)據(jù)集的詳細(xì)統(tǒng)計(jì)數(shù)據(jù)。
其中,可信用戶集、不可信用戶集以及交互用戶集中數(shù)據(jù)包括用戶名、粉絲數(shù)等表2涉及到的用戶資料信息,博文集中數(shù)據(jù)包括博文內(nèi)容、發(fā)布者id、發(fā)布時(shí)間以及轉(zhuǎn)贊評(píng)數(shù)量信息,交互關(guān)系集包括交互用戶id、目標(biāo)用戶id、交互關(guān)系類型以及文本內(nèi)容信息。
3.2 評(píng)價(jià)指標(biāo)
本文評(píng)價(jià)指標(biāo)選擇查準(zhǔn)率(Pre)、查全率(Rec)、F1值(F1-scroe)和AUC值,對應(yīng)計(jì)算公式分別如式(14)~(17)所示。
Pre=TPTP+FP(14)
Rec=TPTP+FN(15)
F1=2×Pre×RecPre+Rec(16)
AUC=∑樣本i∈正樣本ranki-P×(P+1)2P×N(17)
其中:P表示不可信用戶數(shù);N表示可信用戶數(shù);TP表示正確識(shí)別為不可信用戶數(shù);TN表示正確識(shí)別為可信用戶數(shù);FP表示將可信用戶識(shí)別為不可信用戶數(shù);FN表示將不可信用戶識(shí)別為可信用戶數(shù);ranki表示樣本i的排序位置;F1值是查準(zhǔn)率和查全率的綜合值。
3.3 參數(shù)設(shè)置
本文用到的相關(guān)參數(shù)有交互行為權(quán)重α、博文特征權(quán)重β和用戶個(gè)體可信度權(quán)重γ三個(gè)。
1)交互行為權(quán)重α
交互行為權(quán)重α通過層次分析法計(jì)算,五種交互行為權(quán)重大小依次為關(guān)注、回復(fù)、轉(zhuǎn)發(fā)、提及和評(píng)論[31,32],其判斷矩陣如表4所示。
通過計(jì)算,得到矩陣的最大特征值為5.111 1,一致性比率CR=0.025,遠(yuǎn)小于0.1,符合一致性檢驗(yàn)要求,說明矩陣是合理的。最終計(jì)算得到,在本文實(shí)驗(yàn)中它們的值為
(αfw,αry,αct,αmn,αrt)=(0.398 19,0.242 25,0.071 97,0.118 30,0.169 29)
2)博文特征權(quán)重β
博文特征權(quán)重β采用熵權(quán)法確定,其中,粉絲活躍度為正向指標(biāo),博文發(fā)布頻率、博文重復(fù)度和情感豐富度為負(fù)向指標(biāo)。經(jīng)計(jì)算得到博文重復(fù)度、博文發(fā)布頻率、博文互動(dòng)率和情感豐富度的權(quán)重分別為0.224 9,0.129 8,0.275 1,0.370 2。
3)用戶個(gè)體可信度權(quán)重γ
圖2給出了在交互行為權(quán)重α和博文特征權(quán)重β確定的情況下,不同γ值對AUC值的影響。
從圖2可以看出:在γ取0時(shí),即在計(jì)算個(gè)體可信度時(shí)僅考慮用戶歷史博文特征,此時(shí)效果最差;在γ取1時(shí),即在計(jì)算個(gè)體可信度時(shí)僅考慮用戶資料特征,此時(shí)效果比γ取0好,說明相比用戶博文特征,用戶資料特征對可信度評(píng)估準(zhǔn)確性的影響更大;在γ取0.5時(shí),評(píng)估效果達(dá)到了最優(yōu),表明此時(shí)評(píng)估方法相比其他參數(shù)取值效果更好,因此將參數(shù)γ設(shè)為0.5。
3.4 實(shí)驗(yàn)結(jié)果及分析
從數(shù)據(jù)集中隨機(jī)抽取300名用戶,將計(jì)算得到的可信度繪制成散點(diǎn)圖,結(jié)果如圖3所示。
圖3中,每個(gè)點(diǎn)表示一個(gè)用戶,空心圓代表該用戶是可信用戶,實(shí)心三角代表該用戶是不可信用戶??v坐標(biāo)對應(yīng)的值是本文方法計(jì)算出該用戶的可信度。通過分析圖3可以發(fā)現(xiàn),將可信度閾值設(shè)為0.5時(shí),可信用戶和不可信用戶的區(qū)分效果最好,因此本文將分類閾值設(shè)置為0.5。
為驗(yàn)證評(píng)估方法性能,實(shí)驗(yàn)分為五部分:a)本文方法與官方排名的比較;b)本文評(píng)估方法與其他方法在AUC值、查準(zhǔn)率、查全率和F1值上的比較;c)本文評(píng)估方法的消融實(shí)驗(yàn);d)選取代表性用戶進(jìn)行案例分析;e)本文方法的泛化性分析。
3.4.1 本文方法與官方排名的比較
新浪微博的人氣榜根據(jù)用戶粉絲數(shù)排名,媒體勢力榜根據(jù)內(nèi)容質(zhì)量、傳播影響力和粉絲影響力三個(gè)指標(biāo)計(jì)算綜合得分。表3所示數(shù)據(jù)為2023年3月24日新浪微博媒體勢力榜中十名上榜官方認(rèn)證報(bào)紙媒體,這些媒體經(jīng)過新浪認(rèn)證,其勢力值一定程度上可以反映其可信度[15]。表5列出了十名媒體報(bào)紙用戶的勢力值、人氣值和按本文方法計(jì)算得到的可信度值,按照可信度由高到低排序。
從表5可以看出,對于受信賴的報(bào)紙媒體,本文方法得到的可信度符合實(shí)際情況。用戶可信度與勢力值變化趨勢大致相同,勢力值一定程度上能體現(xiàn)媒體的可信度,而媒體的人氣值(粉絲數(shù))與可信度值之間并非線性關(guān)系。
3.4.2 本文方法與其他方法的比較
為了進(jìn)一步評(píng)估本文用戶可信度評(píng)估方法,選擇了其他三種考慮關(guān)聯(lián)用戶信息的方法進(jìn)行對比,如表6所示。
表6中:UPWPR[33]在PageRank的基礎(chǔ)上將鏈入用戶屬性得分作為PR值分配的權(quán)重;HITSCE[34]在HITS算法的基礎(chǔ)上考慮用戶相似度,越相似的用戶分配權(quán)重越高;UCEM是在PageRank基礎(chǔ)上僅利用個(gè)體可信度初始化PR值,不考慮交互度、參與度以及用戶間的情感傾向;UCEM-IGIS是本文方法。實(shí)驗(yàn)結(jié)果如表7所示。
從表7可以看出,與未考慮多交互關(guān)系和用戶情感傾向的UPWPR、HITSCE和UCEM相比,UCEM-IGIS在各項(xiàng)指標(biāo)的比較中均取得了更好的實(shí)驗(yàn)效果。在AUC值上,本文方法分別提升了0.228 7、0.130 4和0.11,在F1值上分別提升0.222 2、0.168 2和0.138 6,表明本文方法對可信用戶和不可信用戶的區(qū)分能力最好,對用戶可信度的評(píng)估最合理。UPWPR在查全率、AUC值和F1值上的表現(xiàn)最差,表明UPWPR在評(píng)估用戶可信度時(shí),可能會(huì)錯(cuò)誤地提高一些不可信用戶的可信度,這是因?yàn)閿?shù)據(jù)集中的不可信用戶為微博中被多次舉報(bào)成功的用戶,這些用戶中存在擁有水軍、僵尸粉的營銷號(hào),而UPWPR受節(jié)點(diǎn)入鏈數(shù)量的影響較大,因此對這些用戶的評(píng)估效果較差。HITSCE在各項(xiàng)指標(biāo)上優(yōu)于UPWPR,這是因?yàn)镠ITSCE還考慮了鏈入節(jié)點(diǎn)的出度,相對而言受虛假關(guān)系的影響小于UPWPR。UCEM只關(guān)注用戶及其交互用戶的個(gè)體可信度,受節(jié)點(diǎn)入鏈、出鏈數(shù)量影響較小,擁有水軍、僵尸粉的營銷號(hào)其交互用戶群體的可信度較低,UCEM面對這些用戶表現(xiàn)較好。但UCEM在查準(zhǔn)率方面表現(xiàn)較差,表明該方法可能會(huì)錯(cuò)誤地將一些可信用戶判定為不可信用戶,這是因?yàn)閁CEM只關(guān)注用戶及其交互用戶的個(gè)體可信度,可能會(huì)將一些擁有不活躍粉絲的正常用戶誤判為不可信用戶。
3.4.3 消融實(shí)驗(yàn)
為驗(yàn)證多交互關(guān)系與用戶情感傾向?qū)υu(píng)估結(jié)果的影響,對本文方法進(jìn)行消融實(shí)驗(yàn),消融后的方法如表8所示。
表8中,UCEM-IG是在UCEM基礎(chǔ)上,考慮了基于多交互關(guān)系得到的交互度、參與度的方法,UCEM-IS是在UCEM基礎(chǔ)上,考慮了用戶情感傾向的方法,實(shí)驗(yàn)結(jié)果如表9所示。
從表9可以看出,考慮多交互關(guān)系與用戶情感傾向的UCEM-IGIS總體上取得了更好的實(shí)驗(yàn)效果。與UCEM、UCEM-IG和UCEM-IS相比,UCEM-IGIS在AUC值上分別提升了0.11、0.057 5和0.012 1,在F1值上分別提升了0.138 6、0.159 8和0.021 1,表明考慮多交互關(guān)系與情感傾向因素會(huì)提高用戶可信度評(píng)估的效果。在查準(zhǔn)率的表現(xiàn)上,UCEM-IG表現(xiàn)最好,與未考慮多交互關(guān)系的UCEM相比提高了0.136 8,這是因?yàn)閁CEM-IG比UCEM考慮了更多因素,對權(quán)重的分配更合理,一些擁有不活躍粉絲的可信用戶不會(huì)被誤報(bào)。在查全率的表現(xiàn)上,UCEM-IGIS表現(xiàn)較好,這是因?yàn)閁CEM-IS融入了用戶情感傾向,可以發(fā)現(xiàn)受公眾反對的不可信用戶,而UCEM-IGIS在其基礎(chǔ)上還考慮了多交互關(guān)系的影響,關(guān)系密切的交互用戶反對的影響將更大,因此能更準(zhǔn)確地對不可信用戶的可信度進(jìn)行評(píng)估。綜上所述,多交互關(guān)系與情感傾向均可提高用戶可信度評(píng)估效果,考慮多交互關(guān)系因素能夠提高評(píng)估方法的查準(zhǔn)率,考慮用戶情感傾向因素可以提高評(píng)估方法的查全率,將二者同時(shí)考慮的方法通過少量犧牲多交互關(guān)系提升的查準(zhǔn)率,換得了查全率更高的提升,并獲得了最優(yōu)的效果與最穩(wěn)定的性能。
3.4.4 泛化性分析
為了更加全面評(píng)價(jià)改進(jìn)算法的性能,對本文方法進(jìn)行泛化性分析。將本文數(shù)據(jù)集按照不同規(guī)模劃分為五個(gè)測試集,測試本文方法在不同規(guī)模數(shù)據(jù)集上的表現(xiàn),實(shí)驗(yàn)結(jié)果如表10所示。
表10中,測試集5的待評(píng)估用戶數(shù)最少,平均交互關(guān)系數(shù)遠(yuǎn)高于其他測試集,而其在AUC值上的表現(xiàn)最好,這是因?yàn)榻换?shù)據(jù)的豐富性有助于算法更好地評(píng)估用戶的可信度。交互關(guān)系數(shù)的增多使得AUC值也得到了提高,這一結(jié)果符合預(yù)期,因?yàn)楦嗟慕换?shù)據(jù)可以提供更多的信息,從而提高算法識(shí)別用戶的能力。測試集1和2的表現(xiàn)低于其他測試集,這是因?yàn)殡m然用戶數(shù)較多,但交互數(shù)據(jù)較少,算法結(jié)果更偏向于由其自身因素得出的個(gè)體可信度。此外,盡管測試集的規(guī)模和交互關(guān)系數(shù)存在顯著差異,但AUC值始終保持在0.8以上,這表明算法具有較好的穩(wěn)定性,在不同規(guī)模的數(shù)據(jù)集上都能取得良好的效果。
結(jié)合本文方法在表10中交互信息較少的測試集1上的表現(xiàn),以及4.3節(jié)參數(shù)設(shè)置中不同γ值對AUC值的影響可以發(fā)現(xiàn),本文從用戶資料、博文中提取常用于可信度評(píng)估的特征計(jì)算用戶的個(gè)體可信度,而個(gè)體可信度的準(zhǔn)確性會(huì)對結(jié)果產(chǎn)生影響。因此,選取更多、更有效的特征或采用更準(zhǔn)確的融合方法可以進(jìn)一步提高本文方法的準(zhǔn)確性。
此外,本文選擇新浪微博平臺(tái)作為研究對象,而提出算法在設(shè)計(jì)時(shí)考慮的因素使其具有良好的擴(kuò)展性,包括用戶特征的選擇、交互關(guān)系的選擇等,因此可以將算法用于其他領(lǐng)域,例如在電子商務(wù)領(lǐng)域,用戶的評(píng)分和評(píng)論可以被用來計(jì)算交互強(qiáng)度和情感傾向,幫助識(shí)別可信的買家和賣家;對于新聞網(wǎng)站、博客等內(nèi)容平臺(tái),用戶的評(píng)論和參與度可以用于評(píng)估內(nèi)容的可信度,以及用戶對特定內(nèi)容的信任度;通過考慮不同文化背景下的交互習(xí)慣和情感表達(dá)方式的差異,可以使算法在不同國家和地區(qū)的用戶可信度評(píng)估中都能發(fā)揮作用。
3.4.5 案例分析
為了進(jìn)一步說明本文方法的有效性,從數(shù)據(jù)集中選取4名代表性用戶進(jìn)行案例分析,選取用戶信息如表11所示。
表11中,用戶1曾因?qū)ι綎|某高校發(fā)布多條造謠微博而被舉報(bào),對其評(píng)論、回復(fù)等內(nèi)容中存在多條反駁文本。用戶2曾因?qū)μ粕侥呈录l(fā)布多條造謠微博而被舉報(bào),對其評(píng)論、回復(fù)等內(nèi)容中存在多條辟謠、質(zhì)疑等文本。用戶3是某市級(jí)消防機(jī)構(gòu)官方賬號(hào),用戶4是某運(yùn)營商官方賬號(hào)。案例分析結(jié)果如表12所示。
表12中,UCEM和UCEM-IG將用戶1與2誤判為HoYcBS2L1TFbgCjcz/+xbg==可信用戶,這是因?yàn)榇嬖诟呖尚哦鹊挠脩魧ζ湮⒉┌l(fā)布辟謠、反駁評(píng)論或回復(fù),不考慮情感傾向的UCEM和UCEM-IG將這些用戶視為增加可信度的因素,從而提高了他們的可信度評(píng)分。而UCEM-IS和UCEM-IGIS考慮了情感因素,因此能夠較好地反映兩個(gè)用戶的真實(shí)可信度。用戶3和4為機(jī)構(gòu)認(rèn)證賬號(hào),二者評(píng)論中下屬單位賬號(hào)可信度較高且高度活躍,但其粉絲活躍度較低,且評(píng)論、轉(zhuǎn)發(fā)用戶中存在廣告、抽獎(jiǎng)賬號(hào),不考慮用戶交互強(qiáng)度的UCEM和UCEM-IS將所有用戶的貢獻(xiàn)視為平等,因此產(chǎn)生了誤報(bào)。而考慮交互關(guān)系的UCEM-IG和UCEM-IGIS增加了與二者關(guān)系緊密的高可信度用戶的貢獻(xiàn),因此能夠相對準(zhǔn)確的對用戶3和4進(jìn)行評(píng)估。
4 結(jié)束語
研究微博用戶可信度評(píng)估有助于幫助平臺(tái)管理者更好地了解用戶賬戶信用情況,進(jìn)而維護(hù)微博網(wǎng)絡(luò)生態(tài)環(huán)境,具有重要的現(xiàn)實(shí)意義。本文利用用戶間多種交互關(guān)系量化出用戶間的交互程度和用戶對交互的參與程度,再結(jié)合用戶情感傾向改進(jìn)PageRank算法,用于評(píng)估微博用戶可信度。經(jīng)過實(shí)驗(yàn)證明,用本文方法評(píng)估微博用戶可信度是行之有效的。相比于一般的用戶可信度評(píng)估方法,本文方法在AUC值、查準(zhǔn)率、查全率和F1值上具有更加良好的表現(xiàn),既能更準(zhǔn)確地找出高可信度的用戶,又能減少對低可信度用戶的誤判。在消融實(shí)驗(yàn)中發(fā)現(xiàn),用戶間多交互關(guān)系與用戶情感傾向都對評(píng)估準(zhǔn)確率有著重要影響,將二者結(jié)合能夠獲得最優(yōu)的評(píng)估效果。本文方法可以選取其他特征進(jìn)行結(jié)合,具有良好的擴(kuò)展性,進(jìn)行相應(yīng)擴(kuò)展后可以應(yīng)用于一些其他研究工作:
a)本文未考慮主題對用戶可信度評(píng)估的影響,但用戶在不同主題下的可信度可能是不同的,可以考慮劃分主題后分別計(jì)算用戶在各主題下的可信度;
b)本文方法在選取特征對用戶個(gè)體可信度計(jì)算時(shí),可以考慮加入更多特征或結(jié)合機(jī)器學(xué)習(xí)方法,提高評(píng)估的準(zhǔn)確性;
c)本文方法可以應(yīng)用于其他領(lǐng)域,結(jié)合不同的特征可以用來識(shí)別社交網(wǎng)絡(luò)中的意見領(lǐng)袖、發(fā)現(xiàn)專利引文網(wǎng)絡(luò)中的核心專利以及找出貿(mào)易網(wǎng)絡(luò)中的關(guān)鍵企業(yè)等。
參考文獻(xiàn):
[1]新浪財(cái)經(jīng).微博月活躍用戶近6億[EB/OL].(2023-11-22).https://finance.sina.com.cn/jjxw/2023-08-25/doc-imziknyi9001689.shtml.(Sina Finance.Weibo has nearly 6 million monthly active users[EB/OL].(2023-11-22).https://finance.sina.com.cn/jjxw/2023-08-25/doc-imziknyi9001689.shtml.)
[2]Verma P K,Agrawal P,Madaan V,et al.UCred:fusion of machine learning and deep learning methods for user credibility on social media[J].Social Network Analysis and Mining,2022,12(1):54-64.
[3]國家互聯(lián)網(wǎng)信息辦公室.互聯(lián)網(wǎng)用戶賬號(hào)信息管理規(guī)定[EB/OL].(2023-11-22).https://www.gov.cn/zhengce/zhengceku/2022-06/28/content_5698179.htm.(Cyberspace Administration of China.Internet user account information management regulations[EB/OL].(2023-11-22).https://www.gov.cn/zhengce/zhengceku/2022-06/28/content_5698179.htm.)
[4]Li Junhao,Paananen V,Suryanarayana S A,et al.It is an online platform and not the real world,I don’t care much:investigating Twitter profile credibility with an online machine learning-based tool[C]//Proc of Conference on Human Information Interaction and Retrieval.New York:ACM Press,2023:117-127.
[5]Castillo C,Mendoza M,Poblete B.Information credibility on Twitter[C]//Proc of the 20th International Conference on World Wide Web.New York:ACM Press,2011:675-684.
[6]Al-Khalifa H S,Al-Eidan R M.An experimental system for measuring the credibility of news content in Twitter[J].International Journal of Web Information Systems,2011,7(2):130-151.
[7]Abu-Salih B,Qudah D A,Al-Hassan M,et al.An intelligent system for mfef447ceb29740da5c7e82412bb44b561267fa4afbc9f109e4ac361acdf86ae1ulti-topic social spam detection in microblogging[J/OL].Journal of Information Science.(2022-09-15).https://doi.org/10.1177/01655515221124062.
[8]Wanda P,Jin Jiehuang.DeepProfile:finding fake profile in online social network using dynamic CNN[J].Journal of Information Secu-rity and Applications,2020,52:102465.
[9]沈旺,代旺,高雪倩,等.基于多重圖的社交網(wǎng)絡(luò)用戶可信度評(píng)價(jià)方法研究——網(wǎng)絡(luò)欺凌與隱私泄露視角[J].現(xiàn)代情報(bào),2020,40(8):27-37.(Shen Wang,Dai Wang,Gao Xueqian,et al.Research on credibility evaluation method of social network users based on multigraph[J].Journal of Modern Information,2020,40(8):27-37.)
[10]李志宏,莊云蓓.基于水軍信任懲罰的多維用戶影響力度量模型[J].系統(tǒng)工程理論與實(shí)踐,2017,37(7):1820-1832.(Li Zhihong,Zhuang Yunbei.Multidimensional user influence measurement model based on spammer trust punishment[J].Systems Engineering-Theory & Practice,2017,37(7):1820-1832.)
[11]楊艷萍.基于雙向加權(quán)圖的社交網(wǎng)絡(luò)用戶可信度算法研究[J].信息網(wǎng)絡(luò)安全,2017(7):40-44.(Yang Yanping.The algorithm of social network users reliability based on bidirectional weighted graph[J].Netinfo Security,2017(7):40-44.)
[12]陽雨,胡亞洲,郭勇,等.基于在線社交網(wǎng)絡(luò)的用戶信任傳遞建模與分析[J].計(jì)算機(jī)工程,2018,44(11):265-270.(Yang Yu,Hu Yazhou,Guo Yong,et al.Modeling and analysis of user trust transfer based on online social network[J].Computer Engineering,2018,44(11):265-270.)
[13]Zare M,Khasten S H,Ghafouri S.Automatic ICA detection in online social networks with PageRank[J].Peer-to-Peer Networking and Applications,2020,13:1297-1311.
[14]尚麗維,張向先,盧恒,等.在線社區(qū)信息交互關(guān)系網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)研究綜述[J].情報(bào)科學(xué),2020,38(8):170-177.(Shang Liwei,Zhang Xiangxian,Lu Heng,et al.A review of research on key nodes in online community information interaction network[J].Information Science,2020,38(8):170-177.)
[15]李付民,佟玲玲,杜翠蘭,等.基于關(guān)聯(lián)關(guān)系的微博用戶可信度分析方法[J].計(jì)算機(jī)應(yīng)用,2017,37(3):654-659.(Li Fumin,Tong Lingling,Du Cuilan,et al.Weibo users credibility evaluation based on user relationships[J].Journal of Computer Applications,2017,37(3):654-659.)
[16]蘭瑋.面向在線社交網(wǎng)絡(luò)的虛假用戶攻擊及檢測研究[D].西安:西安電子科技大學(xué),2022.(Lan Wei.Research on fake user attack and detection for online social networks[D].Xi’an:Xidian Univer-sity,2022.)
[17]琚春華,趙凱迪,鮑福光.融入緊密度中心性與信用的社交網(wǎng)絡(luò)用戶影響力強(qiáng)度計(jì)算模型[J].情報(bào)學(xué)報(bào),2019,38(2):170-177.(Ju Chunhua,Zhao Kaidi,Bao Fuguang.A user influence strength model in e-commerce social networks based on closeness and users’credit[J].Journal of the China Society for Scientific and Technical Information,2019,38(2):170-177.)
[18]景東,張大勇.社交媒體環(huán)境下用戶信任度評(píng)估與傳播影響力研究[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2018,2(7):26-33.(Jing Dong,Zhang Dayong.Assessing trust-based users’ influence in social media[J].Data Analysis and Knowledge Discovery,2018,2(7):26-33.)
[19]Zheng Qiong,Qu Song.Credibility assessment of mobile social networking users based on relationship and information interactions:evidence from China[J].IEEE Access,2020,8:99519-99527.
[20]韓忠明,苑麗玲,楊偉杰,等.加權(quán)社會(huì)網(wǎng)絡(luò)中重要節(jié)點(diǎn)發(fā)現(xiàn)算法[J].計(jì)算機(jī)應(yīng)用,2013,33(6):1553-1557,1562.(Han Zhongming,Yuan Liling,Yang Weijie,et al.Algorithm for discovering influential nodes in weighted social networks[J].Journal of Computer Applications,2013,33(6):1553-1557,1562.)
[21]段震,倪云鵬,陳潔,等.基于多關(guān)系網(wǎng)絡(luò)的話題意見領(lǐng)袖挖掘[J].數(shù)據(jù)采集與處理,2022,37(3):576-585.(Duan Zhen,Ni Yunpeng,Chen Jie,et al.Topic opinion leader mining based on multi-relational networks[J].Journal of Data Acquisition and Proces-sing,2022,37(3):576-585.)
[22]Qazvinian V,Rosengren E,Radev D,et al.Rumor has it:identifying misinformation in microblogs[C]//Proc of Conference on Empirical Methods in Natural Language Processing.Stroudsburg,PA:Association for Computational Linguistics,2011:1589-1599.
[23]肖宇,許煒,夏霖.一種基于情感傾向分析的網(wǎng)絡(luò)團(tuán)體意見領(lǐng)袖識(shí)別算法[J].計(jì)算機(jī)科學(xué),2012,39(2):34-37,46.(Xiao Yu,Xu Wei,Xia Lin.Network groups opinion leader identification algorithms based on sentiment analysis[J].Computer Science,2012,39(2):34-37,46.)
[24]徐建民,申永平,吳樹芳.基于分層社交關(guān)系的微博推薦算法[J].計(jì)算機(jī)應(yīng)用研究,2021,38(12):3597-3603,3610.(Xu Jianmin,Shen Yongping,Wu Shufang.Algorithm of micro-blog recommendation based on hierarchical social relationships[J].Application Research of Computers,2021,38(12):3597-3603,3610.)
[25]琚春華,陶婉瓊,馬希驁.基于關(guān)系圈與個(gè)體交互習(xí)慣的用戶關(guān)系強(qiáng)度計(jì)算方法[J].情報(bào)學(xué)報(bào),2019,38(9):974-987.(Ju Chunhua,Tao Wanqiong,Ma Xi’ao.User relationship strength estimation model in online social networks based on fusion of activity field classification and indirect relationship[J].Journal of the China Society for Scientific and Technical Information,2019,38(9):974-987.)
[26]樂洪舟,何水龍,王敬.基于抖音共同聯(lián)系人的群體用戶關(guān)系分析[J].計(jì)算機(jī)研究與發(fā)展,2022,59(4):796-812.(Yue Hongzhou,He Shuilong,Wang Jing.Analysis of group users’relationship based on TikTok mutual contacts[J].Journal of Computer Research and Development,2022,59(4):796-812.)
[27]張亞楠,何建佳.基于網(wǎng)民心理的微博輿論傳播模型及仿真研究[J].計(jì)算機(jī)應(yīng)用研究,2018,35(5):1298-1303,1319.(Zhang Yanan,He Jianjia.Spreading model and simulation analysis of microblog public opinion based on psychology of netizen[J].Application Research of Computers,2018,35(5):1298-1303,1319.)
[28]Cho J H,Chan K,Adali S.A survey on trust modeling[J].ACM Computing Surveys,2015,48(2):1-40.
[29]徐琳宏,林鴻飛,趙晶.情感語料庫的構(gòu)建和分析[J].中文信息學(xué)報(bào),2008,22(1):116-122.(Xu Linhong,Lin Hongfei,Zhao Jing.Construction and analysis of emotional corpus[J].Journal of Chinese Information Processing,2008,22(1):116-122.)
[30]馮蘭萍,董陳超,徐緒堪.基于混合神經(jīng)網(wǎng)絡(luò)的突發(fā)公共衛(wèi)生事件微博謠言識(shí)別研究[J].情報(bào)雜志,2022,41(12):81-88.(Feng Lanping,Dong Chenchao,Xu Xukan.Research on Weibo rumor identification in public health emergencies based on hybrid neural network[J].Journal of Intelligence,2022,41(12):81-88.)
[31]張繼東,段小萌.基于移動(dòng)社交平臺(tái)的用戶信任度分析研究[J].現(xiàn)代情報(bào),2017,37(9):93-96,102.(Zhang Jidong,Duan Xiaomeng.Research on analysis of user trust degree based on mobile social platform[J].Journal of Modern Information,2017,37(9):93-96,102.)
[32]朱侯,方清燕.社會(huì)化媒體用戶隱私計(jì)算量化模型構(gòu)建及隱私悖論均衡解驗(yàn)證[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2021,5(7):111-125.(Zhu Hou,F(xiàn)ang Qingyan.Quantifying and examining privacy paradox of social media users[J].Data Analysis and Knowledge Discovery,2021,5(7):111-125.)
[33]Alhaidari F,Alwarthan S,Alamoudi A.User preference based weighted page ranking algorithm[C]//Proc of International Conference on Computer Applications & Information Security.Piscataway,NJ:IEEE Press,2020:1-6.
[34]Tibermacine O,Tibermacine C,Kerdoudi M L.Reputation evaluation with malicious feedback prevention using a HITS-based model[C]//Proc of IEEE International Conference on Web Services.Piscataway,NJ:IEEE Press,2019:180-187.