盧 悅,曹春萍
(上海理工大學(xué)光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)謠言逐漸泛濫,與傳統(tǒng)謠言相比,網(wǎng)絡(luò)謠言的傳播速度不斷增長(zhǎng),傳播范圍也更為廣泛,給國(guó)家和社會(huì)的和諧穩(wěn)定帶來了巨大的隱患。網(wǎng)絡(luò)謠言常見于社交平臺(tái),尤以微博平臺(tái)為甚,而新浪微博對(duì)此推出的官方辟謠平臺(tái),通過人工查驗(yàn)的方式識(shí)別謠言,不僅浪費(fèi)人力和財(cái)力,還存在嚴(yán)重的時(shí)間滯后問題。因此,微博謠言的自動(dòng)檢測(cè)[1]成為了研究的熱點(diǎn)話題。
現(xiàn)有的謠言檢測(cè)工作大致可以分為2大類:1)基于特征工程的謠言檢測(cè),核心技術(shù)主要包括從文本內(nèi)容、用戶屬性、圖片信息等各方面構(gòu)建特征,并使用分類器來對(duì)謠言進(jìn)行判別,包括早期傳統(tǒng)機(jī)器學(xué)習(xí)方法[2-3]和目前更為主流的深度學(xué)習(xí)方法;2)基于傳播過程的謠言檢測(cè),該類工作又可細(xì)分為基于傳播模型的謠言檢測(cè)[4-5]和基于傳播過程中用戶反饋信息的謠言檢測(cè)方法。通過對(duì)現(xiàn)有研究的分析,本文發(fā)現(xiàn)基于特征工程的謠言檢測(cè)工作雖然取得了一定的效果,但是許多文本、用戶和圖片信息并不具有顯著的謠言特征,基于特征工程的謠言檢測(cè)存在較大的局限性和較差的可移植性。
而基于傳播過程的謠言檢測(cè)研究者提出在面對(duì)一個(gè)可疑言論時(shí),社交媒體用戶會(huì)不斷地對(duì)信息真實(shí)性提出異議或基于常識(shí)的評(píng)論,對(duì)于謠言檢測(cè)具有更加顯著的效果,然而由于一條消息需要經(jīng)過一定范圍的傳播才能產(chǎn)生足夠的評(píng)論信息,基于傳播過程的謠言檢測(cè)往往導(dǎo)致檢測(cè)時(shí)間的滯后,無法滿足謠言檢測(cè)的現(xiàn)實(shí)需求。通過對(duì)數(shù)據(jù)集中大量微博用戶的歷史數(shù)據(jù)進(jìn)行分析,本文發(fā)現(xiàn)發(fā)布謠言的用戶為了引發(fā)爭(zhēng)議和增大互動(dòng)量,其往往不只發(fā)布一條謠言,歷史微博數(shù)據(jù)中也可能有謠言的存在。因此本文提出一種融合用戶歷史傳播信息的微博謠言檢測(cè),對(duì)微博用戶微博傳播過程的評(píng)論及反饋信息進(jìn)行語(yǔ)義特征提取,利用注意力機(jī)制與原文信息特征進(jìn)行組合,進(jìn)行謠言檢測(cè)。
文字是網(wǎng)絡(luò)謠言傳播的主要載體。因此不論是基于特征工程還是基于傳播過程中用戶反饋信息的謠言檢測(cè),研究者們大多將其視為自然語(yǔ)言處理中的文本二分類問題,其主要任務(wù)是采用文本向量化和神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)文本中的語(yǔ)義向量表示。文本向量化是指把人的語(yǔ)言轉(zhuǎn)換成計(jì)算機(jī)的語(yǔ)言,研究者們相繼提出的One-hot向量、CBOW模型、Skip-gram神經(jīng)語(yǔ)言模型以及Word2Vec等[6]模型在謠言檢測(cè)領(lǐng)域也得到了廣泛的應(yīng)用。如毛二松等人[7]使用Skip-gram模型來訓(xùn)練微博評(píng)論中的詞向量,通過對(duì)情感極性的判別來識(shí)別謠言;林榮蓉[8]通過Word2Vec模型獲取詞向量,并構(gòu)建謠言敏感詞庫(kù)特征與詞向量相結(jié)合,輸入到GBRT模型中訓(xùn)練,提高了謠言檢測(cè)的準(zhǔn)確率。以上文本特征的提取方法在一定程度上提高了謠言檢測(cè)的精度,但是由于中文中詞語(yǔ)的靈活度較高,相同的詞在不同語(yǔ)境下往往具有不同的含義,而上述方法都沒有解決文本特征提取中的一詞多義問題。因此本文選擇ALBERT模型[9]提取微博數(shù)據(jù)的文本特征,該模型為輕量化的BERT模型[10],具有強(qiáng)大的語(yǔ)義理解能力,能夠解決一詞多義問題,再通過神經(jīng)網(wǎng)絡(luò)進(jìn)行深層次的語(yǔ)義提取,從而保證謠言檢測(cè)的精準(zhǔn)率。
以往研究者們?cè)谶x擇神經(jīng)網(wǎng)絡(luò)模型檢測(cè)謠言時(shí),多采用單一的卷積神經(jīng)網(wǎng)絡(luò)(CNN)或是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),如Ma等人[11]提出使用RNN對(duì)評(píng)論等時(shí)間序列信息進(jìn)行建模,學(xué)習(xí)相關(guān)微博的上下文信息隨時(shí)間變化的語(yǔ)義特征,來實(shí)現(xiàn)謠言檢測(cè);Yu等人[12]提出使用CNN捕捉文本語(yǔ)義特征來識(shí)別謠言。雖然能夠?qū)χ{言進(jìn)行識(shí)別,但是由于單一的CNN、RNN模型不能結(jié)合上下文信息對(duì)語(yǔ)義特征進(jìn)行提取,在檢測(cè)的最終效果上仍存在較大的提升空間。而后有研究者提出使用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)[13]檢測(cè)謠言,孫王斌[14]利用LSTM神經(jīng)網(wǎng)絡(luò)挖掘謠言文本的深層語(yǔ)義特征,并引入3個(gè)淺層特征,使用SVM分類器進(jìn)行謠言檢測(cè),實(shí)驗(yàn)證明了LSTM具有更好的謠言識(shí)別能力。門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(GRU)[15]是LSTM的一種變體,擁有和LSTM相似的功能,但它對(duì)于LSTM來說,訓(xùn)練時(shí)間短、參數(shù)較少、網(wǎng)絡(luò)結(jié)構(gòu)更簡(jiǎn)單,但是在使用GRU對(duì)文本序列建模時(shí),也沒有很好地考慮到上下文信息,而本文采用雙向門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(BiGRU)來搭建模型,它增加了反向輸入的GRU,利用2個(gè)并行通道,使得模型能同時(shí)獲得正反向的積累依賴信息,從而可以更加充分地學(xué)習(xí)文本前后語(yǔ)義之間的聯(lián)系,使得提取的特征信息更加豐富。
除此之外,還有研究者將注意力(Attention)機(jī)制引用到謠言檢測(cè)的研究中[16-18],利用注意力機(jī)制給提取出的特征分配權(quán)重,有效提高了謠言識(shí)別的精度。綜合以上所有問題,本文提出一種融合用戶歷史傳播信息的ALBERT-BiGRU-Attention(AbaNet)微博謠言檢測(cè)模型,對(duì)現(xiàn)有的數(shù)據(jù)集進(jìn)行擴(kuò)充,爬取待檢測(cè)微博用戶歷史微博下的評(píng)論和交互信息,使用ALBERT預(yù)訓(xùn)練模型獲取文本特征向量,并通過BiGRU進(jìn)行全局語(yǔ)義建模,獲取上下文語(yǔ)義特征,再引入Attention分配特征權(quán)重,優(yōu)化特征,最后將獲取的字詞特征融合進(jìn)行分類,得到謠言的判別結(jié)果。
謠言檢測(cè)的最終目標(biāo)是能夠準(zhǔn)確并且及時(shí)地預(yù)測(cè)出該信息是否為虛假信息,其實(shí)質(zhì)上是基于內(nèi)容和用戶的二分類問題,即謠言檢測(cè)模型在已經(jīng)被標(biāo)記的輸入數(shù)據(jù)上訓(xùn)練后,能預(yù)測(cè)出無標(biāo)記測(cè)試數(shù)據(jù)的真實(shí)性。該問題的形式化定義如下。
給定一個(gè)帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)集合D和一個(gè)類別標(biāo)簽集合y:
D={(x1,y1),(x2,y2),(x3,y3),…,(xn,yn)}
(1)
y={1,0}
(2)
其中,n表示訓(xùn)練數(shù)據(jù)集合的大小,(xi,yi)為訓(xùn)練數(shù)據(jù)集合中的記錄,xi表示D中記錄的微博文本數(shù)據(jù),yi表示xi的標(biāo)簽,分別用1和0代表“謠言”和“非謠言”2個(gè)類別的標(biāo)簽。
本文謠言檢測(cè)的任務(wù)是要學(xué)習(xí)一個(gè)分類模型M,將文本數(shù)據(jù)映射成一個(gè)類別標(biāo)簽yi,即M:xi→yi,模型的輸入是需要被判定的微博文本和用戶歷史傳播信息,輸出是該文本對(duì)應(yīng)的“謠言”或“非謠言”標(biāo)簽。
微博的傳播周期中,每個(gè)用戶在不同時(shí)刻產(chǎn)生了不同的評(píng)論,將所有評(píng)論平鋪到一條線上,則每條評(píng)論就對(duì)應(yīng)每個(gè)時(shí)間節(jié)點(diǎn)的輸入信息。因此本文對(duì)用戶的歷史傳播信息進(jìn)行建模,將用戶歷史微博下的評(píng)論信息對(duì)應(yīng)BiGRU網(wǎng)絡(luò)每個(gè)時(shí)間節(jié)點(diǎn)的輸入信息,構(gòu)成整個(gè)輸入空間,學(xué)習(xí)評(píng)論間的相互影響及整個(gè)評(píng)論的語(yǔ)義表示。本文首先將微博用戶歷史傳播信息進(jìn)行預(yù)處理,即對(duì)數(shù)據(jù)進(jìn)行清洗及分詞。用戶歷史傳播信息R由n條用戶評(píng)論組成,即R={r1,r2,…,rn},樣本中的第i條評(píng)論表示為ri={wi1,wi2,…,wim},其中wij表示第i條評(píng)論的第j個(gè)詞。用戶歷史傳播信息特征提取模塊結(jié)構(gòu)如圖1所示。該模塊主要由2個(gè)部分組成:首先ALBERT提取文本的表示特征,主要使用ALBERT中的Transformer編碼器獲取全局的語(yǔ)義信息,其次使用雙向GRU加強(qiáng)特征表示,得到用戶歷史傳播信息的深層特征表示。
圖1 用戶歷史傳播信息特征提取
1)首先通過ALBERT預(yù)訓(xùn)練模型訓(xùn)練得到用戶歷史傳播信息的文本特征向量,將每個(gè)時(shí)間節(jié)點(diǎn)對(duì)應(yīng)的評(píng)論轉(zhuǎn)化為輸入向量。ALBERT模型的輸入可以是一個(gè)句子或句子對(duì),實(shí)際的輸入值是經(jīng)過3個(gè)嵌入層的編碼向量加和而成的。將每層得到的字向量EToken、段向量ESegment和位置向量EPosition相加求和,從而得到單一的向量表示E。E的計(jì)算公式如式(3)所示,序列化后的文本數(shù)據(jù)如式(4)所示,其中Ei表示文本中第i個(gè)詞的序列化字符。
E=EToken+ESegment+EPosition
(3)
E=(E1,E2,…,Em-1,Em)
(4)
獲取用戶歷史傳播信息的輸入表征后,經(jīng)過Transformer編碼器[19]進(jìn)行訓(xùn)練,得到文本的動(dòng)態(tài)特征表示。在利用Transformer編碼器來獲取謠言的文本特征時(shí),計(jì)算當(dāng)前句子中每個(gè)詞與其他詞之間的相互關(guān)系,然后利用這些關(guān)系去調(diào)整句子中每個(gè)詞的權(quán)重,最終獲得每個(gè)句子的新的表達(dá)。文本特征表示如式(5)所示,其中Ti表示文本中第i個(gè)評(píng)論的特征向量。
T=(T1,T2,…,Tn-1,Tn)
(5)
其中每個(gè)用戶歷史評(píng)論的文本特征表示如式(6)所示,ti表示每個(gè)評(píng)論中第i個(gè)詞的特征向量,⊕表示連接操作。
Ti=t1⊕t2⊕…⊕tm
(6)
2)將ALBERT模型輸出的用戶歷史傳播信息的文本語(yǔ)義特征向量輸入到BiGRU模型。設(shè)輸入的特征向量為{x1,x2,…,xn},其中xt表示一個(gè)單元的輸入向量,即用戶歷史傳播信息中不同時(shí)刻不同用戶的評(píng)論信息,則GRU模型結(jié)構(gòu)公式表示為:
rt=σ(Wrhht-1+Wrxxt)
(7)
zt=σ(Wzhht-1+Wzxxt)
(8)
(9)
(10)
(11)
(12)
(13)
在本次研究中,本文將微博原文本X作為第一個(gè)塊的輸入,用戶歷史傳播信息R=(r1,r2,r3,…,rn)作為其他輸入塊??紤]到每個(gè)塊對(duì)謠言檢測(cè)的影響程度各不相同,本文在模型中引入注意力機(jī)制來提取輸入信息中的重要部分,有效突出在謠言判別過程中起關(guān)鍵作用的信息的權(quán)重,從而改善樣本表示,提高謠言檢測(cè)的準(zhǔn)確率。融合用戶歷史傳播信息的微博謠言檢測(cè)模型(AbaNet模型)如圖2所示。
圖2 AbaNet模型
(14)
其中,ai是每個(gè)原始隱藏層狀態(tài)在新的隱藏層狀態(tài)中所占的比重,hi是該時(shí)刻的原始隱藏層狀態(tài),權(quán)重ai的計(jì)算公式如下:
(15)
ei=vitanh(wihi+bi)
(16)
其中,ei表示隱藏層狀態(tài)向量hi被處理后的向量,wi、vi為i時(shí)刻的網(wǎng)絡(luò)權(quán)重矩陣參數(shù),bi為i時(shí)刻的偏置。
(17)
最后用argmax進(jìn)行分類,取概率值大的標(biāo)簽作為謠言檢測(cè)的最終結(jié)果,計(jì)算公式如式(18):
y=argmax(Pi)
(18)
本文模型使用反向傳播算法來訓(xùn)練和更新模型,通過二元交叉熵作為損失函數(shù)來優(yōu)化模型,優(yōu)化目標(biāo)是使訓(xùn)練樣本的預(yù)測(cè)值和實(shí)際輸出值的交叉熵最小化,損失函數(shù)的計(jì)算公式如式(19)所示:
(19)
3.1.1 數(shù)據(jù)集的選擇
為了增加數(shù)據(jù)量,本文采用2016年Ma等人[11]公開的微博謠言數(shù)據(jù)集和2018年Song等人[20]公開的數(shù)據(jù)集,共包含8051條微博。為了證明本文的模型可以在謠言發(fā)布早期就將其檢測(cè)出,而微博下的評(píng)論信息往往具有滯后性,因此本文不使用數(shù)據(jù)集中的評(píng)論文本,只選用其中的原始微博文本,并另行爬取數(shù)據(jù)集中所涉及的用戶歷史微博傳播過程中的評(píng)論數(shù)據(jù)。由于部分用戶賬號(hào)更換微博名或已被封停,無法爬取用戶歷史傳播信息,因此將此類數(shù)據(jù)刪除,經(jīng)整理后數(shù)據(jù)集共包含6421名用戶,6593條微博,其中包含謠言數(shù)據(jù)3394條,非謠言數(shù)據(jù)3199條。
3.1.2 數(shù)據(jù)集的擴(kuò)充
本文設(shè)計(jì)微博爬蟲在微博網(wǎng)站上爬取這6421名用戶的歷史微博評(píng)論,經(jīng)統(tǒng)計(jì)計(jì)算,這些用戶平均擁有58條微博,為了減小系統(tǒng)和時(shí)間開銷,本文設(shè)置了閾值選擇實(shí)驗(yàn),來確定所需爬取評(píng)論的最佳歷史微博數(shù)量,分別令閾值為0、5、15、20、…、55,爬取該閾值對(duì)應(yīng)的用戶歷史微博下的評(píng)論數(shù)據(jù),然后分別在這11份數(shù)據(jù)上進(jìn)行微博謠言檢測(cè)實(shí)驗(yàn)。11組實(shí)驗(yàn)的準(zhǔn)確率對(duì)比折線圖如圖3所示。
圖3 閾值選擇實(shí)驗(yàn)對(duì)比
從圖3中可以看出,當(dāng)不采用用戶歷史傳播信息,只對(duì)微博文本進(jìn)行謠言檢測(cè)時(shí),模型只有87%的準(zhǔn)確率,而隨著模型用戶歷史傳播數(shù)據(jù)的增加,準(zhǔn)確率是不斷增加的。當(dāng)閾值取35時(shí),模型已達(dá)到了較高的準(zhǔn)確度,且逐漸趨于穩(wěn)定,因此本文對(duì)于歷史微博數(shù)超過35條的用戶只爬取最新的35條下的評(píng)論文本,不足35條的全部爬取,共爬取用戶歷史交互信息3371025條。
本文采用五折交叉驗(yàn)證實(shí)驗(yàn),將待檢測(cè)微博數(shù)據(jù)按照4:1的比例分為訓(xùn)練集和測(cè)試集。
本文模型的實(shí)驗(yàn)參數(shù)主要包括ALBERT模型和BiGRU模型的參數(shù),其中ALBERT采用Google發(fā)布的預(yù)訓(xùn)練模型ALBERT-Base,默認(rèn)使用12頭注意力機(jī)制的Transformer,詞嵌入維度為128,預(yù)訓(xùn)練詞向量長(zhǎng)度為768維。BiGRU模型的隱藏層大小為128,網(wǎng)絡(luò)層數(shù)為1,選取ReLU作為模型的激活函數(shù)。在整個(gè)網(wǎng)絡(luò)的訓(xùn)練中,設(shè)置訓(xùn)練批次大小為64,迭代輪數(shù)30次,學(xué)習(xí)率為5×10-5,并采用Adam優(yōu)化器來尋找神經(jīng)網(wǎng)絡(luò)的最優(yōu)參數(shù)。
為評(píng)價(jià)模型的效果,本文采用混淆矩陣對(duì)判別結(jié)果進(jìn)行統(tǒng)計(jì),采用準(zhǔn)確率Acc、精確率P、召回率R以及精確率與召回率的調(diào)和平均值F1對(duì)模型的謠言檢測(cè)效果進(jìn)行評(píng)價(jià),計(jì)算公式如下所示:
(20)
(21)
(22)
(23)
本文實(shí)驗(yàn)主要探究3個(gè)問題:一是探究本文所提出的模型中各個(gè)模塊對(duì)模型表現(xiàn)的貢獻(xiàn)如何;二是探究本文模型方法與基準(zhǔn)方法相比,謠言判別結(jié)果的準(zhǔn)確性如何;三是探究本文模型能否在謠言發(fā)布早期將謠言判別出,即謠言的早期檢測(cè)效果如何。針對(duì)前2個(gè)問題,在本文所構(gòu)建的數(shù)據(jù)集上開展了消融實(shí)驗(yàn)和對(duì)比實(shí)驗(yàn),分別比較了Acc、P、R、F1這4項(xiàng)指標(biāo),來驗(yàn)證本文模型在謠言檢測(cè)方面的準(zhǔn)確性;針對(duì)問題三,本文將本模型所需要的檢測(cè)時(shí)間與以往研究進(jìn)行對(duì)比與分析,從而驗(yàn)證本文模型的早期檢測(cè)效果。
3.3.1 準(zhǔn)確性對(duì)比與分析
本文通過替換AbaNet模型中的部分結(jié)構(gòu)開展消融實(shí)驗(yàn),對(duì)比分析驗(yàn)證被替換部分的有效性。消融模型包含使用Word2Vec替換ALBERT模型的Word2Vec-BiGRU-Att模型、使用單向的LSTM和單向的GRU替換雙向GRU的ALBERT-LSTM-Att模型和ALBERT-GRU-Att模型以及直接用全連接層替換后面模塊的ALBERT模型和ALBERT-BiGRU模型。而在對(duì)比實(shí)驗(yàn)中,本文分別選取基于傳統(tǒng)機(jī)器學(xué)習(xí)和基于深度學(xué)習(xí)的謠言檢測(cè)相關(guān)模型開展對(duì)比實(shí)驗(yàn):Castillo等人[2]的Bayes模型、Ma等人的SVM模型[21]和RNN模型[11]、Yu等人[12]的CNN模型、Chen等人[18]的RNN-Att模型以及李力釗等人[22]的C-GRU。表1和表2分別展示了消融實(shí)驗(yàn)和對(duì)比實(shí)驗(yàn)中本文的AbaNet模型與其他模型的效果對(duì)比。
表1 消融實(shí)驗(yàn)結(jié)果
表2 對(duì)比實(shí)驗(yàn)結(jié)果
1)消融實(shí)驗(yàn)結(jié)果與分析。
通過表1實(shí)驗(yàn)結(jié)果可以看出,使用Word2Vec進(jìn)行文本特征提取的模型指標(biāo)不理想,而ALBERT模型的表現(xiàn)較為出色,僅使用ALBERT提取文本特征向量進(jìn)行謠言檢測(cè)的模型效果就達(dá)到了87.2%的準(zhǔn)確率和87.7%的F1值,這是由于Word2Vec不能對(duì)不同語(yǔ)境下的多義詞進(jìn)行區(qū)分,而ALBERT模型經(jīng)過了大規(guī)模語(yǔ)料的預(yù)訓(xùn)練,語(yǔ)義編碼能力很強(qiáng),解決了一詞多義的問題,模型表現(xiàn)能力也明顯優(yōu)于Word2Vec模型。
ALBERT-LSTM-Att、ALBERT-GRU-Att和本文模型的對(duì)比證明了使用BiGRU進(jìn)行謠言檢測(cè)的有效性,可以看出GRU和LSTM在性能上差別不大,但是與LSTM相比,GRU內(nèi)部結(jié)構(gòu)簡(jiǎn)單且訓(xùn)練時(shí)間更短,更適合本文的謠言檢測(cè)任務(wù);而本文采用的BiGRU模型,由于增加了反向的GRU,可以充分學(xué)習(xí)文本前后語(yǔ)義關(guān)系,提取的語(yǔ)義特征也更加豐富,所以模型的各項(xiàng)指標(biāo)相比采用GRU和LSTM的模型也都更加優(yōu)秀。
為了提高謠言檢測(cè)的準(zhǔn)確率,本文在ALBERT和BiGRU模型的基礎(chǔ)上增加了注意力機(jī)制,從ALBERT-BiGRU和AbaNet的對(duì)比中可以看出,注意力機(jī)制在謠言檢測(cè)任務(wù)中的作用也是較為明顯的,加入注意力后實(shí)驗(yàn)的準(zhǔn)確率提升了約2.6%。圖4為數(shù)據(jù)集中部分用戶歷史傳播信息的Attention權(quán)重示例,從圖中可以看出,在用戶歷史微博的評(píng)論信息中,“流傳很久了”“假的吧”“求證啊”等用戶反饋的質(zhì)疑性評(píng)論權(quán)重明顯更高,而與信息的真實(shí)性無關(guān)的評(píng)論信息權(quán)重較低。
圖4 Attention權(quán)重示例
2)對(duì)比實(shí)驗(yàn)結(jié)果與分析。
通過表2可以看出,在相同的數(shù)據(jù)集和實(shí)驗(yàn)環(huán)境下,基于人工構(gòu)建特征的Bayes模型和SVM模型在各方面的表現(xiàn)都明顯低于基于深度學(xué)習(xí)的方法,即使是單一的RNN模型在謠言檢測(cè)任務(wù)中的準(zhǔn)確率和F1值都比傳統(tǒng)機(jī)器學(xué)習(xí)的方法高4%以上。這是因?yàn)閭鹘y(tǒng)機(jī)器學(xué)習(xí)的謠言檢測(cè)方法依賴人的經(jīng)驗(yàn)來構(gòu)建特征,其模型也是根據(jù)特征進(jìn)行選擇的,可移植性差,因此使用深度學(xué)習(xí)模型自動(dòng)構(gòu)造特征的方法明顯優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)的方法。
在基于深度學(xué)習(xí)模型的幾組對(duì)比實(shí)驗(yàn)中,RNN的準(zhǔn)確率大概是82.2%,其次依次是RNN-Att、CNN、C-GRU,而本文所提出的AbaNet模型在準(zhǔn)確率、召回率和F1值等各項(xiàng)指標(biāo)的表現(xiàn)中都是最好的,其中準(zhǔn)確率和F1值分別達(dá)到了92.0%和91.9%。為了更直觀地表現(xiàn)模型的對(duì)比效果,本文繪制了AbaNet模型和其他各模型準(zhǔn)確率隨迭代輪數(shù)變化的折線圖,如圖5所示。從圖中可以看出,7組模型準(zhǔn)確率都在不斷上升,在第4次迭代后,基于深度學(xué)習(xí)的謠言檢測(cè)模型準(zhǔn)確率都逐漸趨于穩(wěn)定,其中AbaNet模型的準(zhǔn)確率達(dá)到了90%以上,且趨勢(shì)波動(dòng)明顯更小。綜合以上分析,本文的AbaNet模型具有準(zhǔn)確率高、穩(wěn)定性強(qiáng)的特點(diǎn),相較于其他模型在謠言檢測(cè)上更具優(yōu)勢(shì)。
圖5 對(duì)比實(shí)驗(yàn)結(jié)果
3.3.2 早期檢測(cè)效果分析
在謠言檢測(cè)的時(shí)效性方面,新浪微博中人工查驗(yàn)并確認(rèn)謠言大概需要一周左右的時(shí)間。而通過尹鵬博等人[23]的分析可知,對(duì)于使用微博全部評(píng)論數(shù)據(jù)進(jìn)行訓(xùn)練的研究而言,在評(píng)論數(shù)超過500條時(shí)才能取得較好的校測(cè)效果,而一條微博產(chǎn)生第500條評(píng)論的平均時(shí)長(zhǎng)為31 h,即使用微博全部評(píng)論數(shù)據(jù)進(jìn)行訓(xùn)練的研究,其平均檢測(cè)時(shí)效為微博發(fā)布后的31 h[24],已經(jīng)遠(yuǎn)遠(yuǎn)錯(cuò)過了謠言控制的“黃金四小時(shí)”。除此之外,其他多數(shù)研究者在謠言檢測(cè)時(shí)效性上的探索也沒有脫離對(duì)待檢測(cè)微博下評(píng)論轉(zhuǎn)帖信息的依賴,如Ma等人[11]采取劃分時(shí)間序列的方法來實(shí)現(xiàn)謠言的早期檢測(cè),其檢測(cè)謠言的平均用時(shí)為23 h;劉政等人[25]引入了可信檢測(cè)點(diǎn)的概念,使檢測(cè)出謠言的時(shí)間縮短至7 h。
而本文提出的融合用戶歷史傳播信息的微博謠言檢測(cè)模型依賴于用戶歷史微博下的評(píng)論信息,不需要結(jié)合待檢測(cè)微博樣本下的評(píng)論信息,因此也避免了等待微博傳播所需要的時(shí)間,可以在微博發(fā)布之初就對(duì)其進(jìn)行檢測(cè),在檢測(cè)模型已經(jīng)訓(xùn)練好和微博數(shù)據(jù)爬取不受限制的情況下,對(duì)于單條微博可以在極短時(shí)間內(nèi)得到檢測(cè)結(jié)果,其所用時(shí)間主要取決于爬取和預(yù)處理用戶歷史微博下的評(píng)論信息的時(shí)間,更能滿足實(shí)際檢測(cè)中的時(shí)間需求,避免謠言泛濫所帶來的負(fù)面影響。
通過以上實(shí)驗(yàn)結(jié)果和分析可知,本文的微博謠言識(shí)別模型與其他檢測(cè)模型相比,能夠在保證謠言檢測(cè)準(zhǔn)確率的前提下,大大提高微博謠言的檢測(cè)時(shí)效。
針對(duì)現(xiàn)有謠言檢測(cè)工作中存在的問題,本文提出了一種融合用戶歷史傳播信息的微博謠言檢測(cè)模型,即AbaNet模型,采用ALBERT模型獲取微博文本和用戶歷史傳播信息的特征向量,解決了不同語(yǔ)境下詞語(yǔ)含義不同的問題;然后通過BiGRU進(jìn)行全局語(yǔ)義建模,綜合考慮微博的上下文信息;再引入Attention機(jī)制優(yōu)化權(quán)重,最后利用獲取的特征得到謠言的檢測(cè)結(jié)果。同時(shí),本文將用戶歷史微博下的評(píng)論信息作為輸入,不依賴待檢測(cè)微博下的評(píng)論信息,避免了因等待獲取傳播信息而產(chǎn)生的時(shí)間消耗。實(shí)驗(yàn)結(jié)果表明,本文模型具有準(zhǔn)確率高、穩(wěn)定性強(qiáng)的特點(diǎn),并且能夠在獲得較高檢測(cè)精度的情況下大大縮短謠言檢測(cè)的時(shí)間。但是,本文研究?jī)H將謠言檢測(cè)問題視為文本分類問題,忽略了用戶以及微博中普遍存在的圖片信息等特征,因此引入用戶等其他非文本特征,進(jìn)一步提高微博謠言檢測(cè)的準(zhǔn)確性是本文未來研究的主要方向。