張 玄,李保濱
(中國(guó)科學(xué)院大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,北京 100049)
微博(Microblog)是一種廣播式的社交媒體和網(wǎng)絡(luò)平臺(tái),用戶可以在平臺(tái)中發(fā)布、獲取和傳播信息,并通過關(guān)注和好友機(jī)制進(jìn)行公開或私密的信息分享。相比于傳統(tǒng)社交媒體平臺(tái),微博的寫作時(shí)間更加靈活,信息發(fā)布更加便利,信息溝通更加迅速,瀏覽和發(fā)布方式更加自由,任何人都可以通過網(wǎng)頁、手機(jī)客戶端、短信、第三方應(yīng)用等不同方式隨時(shí)隨地發(fā)送和閱讀微博、即時(shí)上傳圖片和視頻?;谏鲜鰞?yōu)勢(shì),微博逐漸成為人們?nèi)粘I钪兄匾纳缃还ぞ吆托畔⑵脚_(tái)。據(jù)統(tǒng)計(jì),截至2019年,全球總共有超過35億人參與到微博平臺(tái)主導(dǎo)的社交活動(dòng)中[1]。
在微博普及和發(fā)展的過程中,出于信息發(fā)布的現(xiàn)實(shí)需求,微博平臺(tái)內(nèi)逐漸出現(xiàn)了一些機(jī)器人賬戶,它們的背后并不是真實(shí)的人類使用者,而是受個(gè)人或團(tuán)體操縱的自動(dòng)化程序[2]。機(jī)器人賬戶能夠按照操縱者的設(shè)定自動(dòng)發(fā)布推文,可以自動(dòng)生成并定時(shí)發(fā)布天氣和路況預(yù)報(bào)等規(guī)律性信息,也可以自動(dòng)收集整理新聞時(shí)事、突發(fā)事件和用戶創(chuàng)作作品等內(nèi)容以供其他用戶獲取和使用,這些由機(jī)器人賬戶開展的自動(dòng)化業(yè)務(wù)大大降低了人力成本,有效地提升了信息發(fā)布的時(shí)效性,客觀上促進(jìn)了信息的傳播和交流。
然而,有些機(jī)器人賬戶也被用于傳播虛假信息和操縱話題討論等不良用途,給微博的信息傳播環(huán)境帶來了巨大的負(fù)面影響。由于機(jī)器人能在短時(shí)間內(nèi)自動(dòng)發(fā)布大量?jī)?nèi)容,因此一些機(jī)器人賬戶被應(yīng)用于廣告營(yíng)銷[3]、推廣惡意網(wǎng)站[4]、傳播虛假信息[5]、煽動(dòng)負(fù)面情緒[6]等場(chǎng)景,造成了有害信息的擴(kuò)散。除影響信息傳播外,更進(jìn)一步地,機(jī)器人賬戶還會(huì)影響網(wǎng)絡(luò)群體用戶的觀點(diǎn)和意見的形成。機(jī)器人賬戶可以偽裝成正常用戶加入一個(gè)群體,影響和改變?cè)撊后w對(duì)于某些事物和事件的認(rèn)知,左右相關(guān)意見的形成過程。在特定話題中,機(jī)器人賬戶只需要占據(jù)足夠大的比重,就能改變公眾意見,從而使其傳播的觀點(diǎn)最終成為主流觀點(diǎn)[7]。一旦虛假信息或錯(cuò)誤觀點(diǎn)在微博社區(qū)中大范圍傳播開來,就會(huì)形成謠言,危害公共安全。
調(diào)查表明,各種微博平臺(tái)上活躍的真實(shí)用戶數(shù)量與注冊(cè)用戶數(shù)量嚴(yán)重不符,大量賬戶被惡意注冊(cè)或劫持并運(yùn)作為機(jī)器人賬戶[8]。這些機(jī)器人賬戶不僅嚴(yán)重影響了正常用戶的使用,也極大地妨礙了網(wǎng)絡(luò)空間的信息治理,危害了信息安全。因此,研究微博環(huán)境中機(jī)器人賬戶的檢測(cè),對(duì)于輿情監(jiān)測(cè)、網(wǎng)絡(luò)治理等方面具有重要意義。
以此為背景,微博平臺(tái)不斷提高檢測(cè)能力;但相對(duì)地,機(jī)器人賬戶的信息發(fā)布和偽裝技術(shù)也在與微博平臺(tái)檢測(cè)的對(duì)抗中不斷演進(jìn),其隱匿性越來越高,行為表現(xiàn)越來越接近真人用戶,檢測(cè)難度也越來越高。如何在如此復(fù)雜的環(huán)境中實(shí)現(xiàn)準(zhǔn)確而高效的微博機(jī)器人賬戶檢測(cè)已經(jīng)成為當(dāng)前學(xué)術(shù)界和商業(yè)界普遍關(guān)注的研究熱點(diǎn)。有鑒于此,許多研究者已經(jīng)提出了表現(xiàn)優(yōu)異的檢測(cè)方法,但這些研究成果尚缺系統(tǒng)性整理。在已有的綜述類文獻(xiàn)中,對(duì)現(xiàn)有成果的分類要么基于檢測(cè)方法采用的模型框架(監(jiān)督/無監(jiān)督,傳統(tǒng)統(tǒng)計(jì)方法/深度學(xué)習(xí)等),要么基于選取的數(shù)據(jù)特征(依據(jù)推文/依據(jù)賬戶等),但單一的分類法僅能提供研究領(lǐng)域的一個(gè)剖面,欠缺綜觀;另一方面,領(lǐng)域內(nèi)的一些新的成果和新的突破也尚缺進(jìn)一步的跟進(jìn)。本文將嘗試從多角度區(qū)分和比對(duì)不同的檢測(cè)方法,更細(xì)致地歸類和列舉現(xiàn)有成果,以期對(duì)機(jī)器人賬戶檢測(cè)的研究現(xiàn)狀給出一個(gè)比較全面的梳理。
本文的以下內(nèi)容分為五節(jié)。第1節(jié)簡(jiǎn)要介紹了微博平臺(tái)和微博賬戶活動(dòng),并描述了微博中機(jī)器人賬戶的類型和每一類機(jī)器人的行動(dòng)模式,以此為基礎(chǔ)給出了機(jī)器人賬戶檢測(cè)的整體模型。第2節(jié)主要描述了微博機(jī)器人賬戶檢測(cè)領(lǐng)域中獲取數(shù)據(jù)的一般方法,并介紹了一些公開的數(shù)據(jù)集。第3節(jié)描述了基于統(tǒng)計(jì)方法和傳統(tǒng)機(jī)器學(xué)習(xí)的機(jī)器人賬戶檢測(cè)方法。第4節(jié)描述了基于深度學(xué)習(xí)的機(jī)器人賬戶檢測(cè)方法。第5節(jié)總結(jié)了目前關(guān)于機(jī)器人賬戶檢測(cè)的研究中面臨的突出困難,并展望未來可能的發(fā)展方向。
許多網(wǎng)站提供了微博服務(wù),其中最知名的是Twitter(推特)和Weibo(微博)。Twitter是當(dāng)今世界上使用最為廣泛的微博社交網(wǎng)站,截至2021年第三季度,Twitter的平均日活躍用戶為2.11億,每日發(fā)送的推文總數(shù)累計(jì)在5億以上[9]。Weibo是最大的中文微博社區(qū),其前身是新浪網(wǎng)旗下的新浪微博,截至2021年第三季度,Weibo的月活躍用戶達(dá)到5.73億,平均日活躍用戶為2.48億[10]。除Twitter和Weibo外,許多國(guó)家和地區(qū)也有更本地化的微博社區(qū),如俄羅斯的VKontakte、日本的LINE等[11]。
在Twitter與Weibo中,用戶可以設(shè)置自己的個(gè)人資料,包括昵稱、頭像、個(gè)人簡(jiǎn)介、個(gè)人網(wǎng)站等。用戶可以發(fā)布不超過280個(gè)字符或140個(gè)中文字符的文本信息,并在信息中附帶圖片、視頻、超鏈接等多媒體元素。這則信息在Twitter中被稱為一條“推文(tweet)”,在Weibo中則被稱為一條“微博”,為避免混淆以下均稱為“推文”。用戶可以在推文中通過“@”字符+用戶名的方式來“提及”其他人,被提及的用戶會(huì)收到一條通知。用戶可以在推文中通過“#”字符+描述的方式來把這條推文置于一個(gè)或多個(gè)“話題”中,并可以訪問某個(gè)話題頁面來查看屬于該話題的全部推文。用戶可以“關(guān)注”另一個(gè)賬戶,當(dāng)被關(guān)注賬戶發(fā)布推文時(shí),這條推文會(huì)被推送給所有關(guān)注了他的人。用戶關(guān)注的人稱為該用戶的“關(guān)注”或“朋友(friend)”,關(guān)注用戶的人稱為他的“粉絲”或“關(guān)注者(follower)”,用戶的關(guān)注數(shù)和粉絲數(shù)同樣顯示在個(gè)人資料中。用戶可以“點(diǎn)贊”“轉(zhuǎn)發(fā)”或“評(píng)論”其他人發(fā)布的推文。用戶可以向其他用戶發(fā)送“私信”來向該用戶發(fā)送一條第三方不可見的消息。
微博平臺(tái)以用戶協(xié)議的方式規(guī)定了用戶享有的權(quán)利和需要履行的義務(wù)[12-13]。用戶在注冊(cè)賬戶時(shí)需要簽署用戶協(xié)議,承諾在日后的使用中遵循微博平臺(tái)給出的使用規(guī)則。如果用戶違背了協(xié)議,微博平臺(tái)可能暫停該賬戶在一段時(shí)間內(nèi)的使用,或者徹底封禁該賬戶。
不同微博平臺(tái)對(duì)于機(jī)器人賬戶的政策是不同的。Twitter鼓勵(lì)開發(fā)者運(yùn)營(yíng)自動(dòng)化的機(jī)器人賬戶來構(gòu)建信息解決方案,開展創(chuàng)意活動(dòng),高效率地回復(fù)用戶,或者進(jìn)行其他有價(jià)值的社區(qū)活動(dòng),前提是開發(fā)者及其運(yùn)營(yíng)的機(jī)器人不違反用戶協(xié)議,不破壞網(wǎng)站穩(wěn)定,不干擾其他用戶的正常使用[14]。在這樣的氛圍中,Twitter上活躍著許多有益無害的機(jī)器人賬戶,例如Botwiki.org網(wǎng)站中收錄了大量的這類賬戶。
與Twitter不同,Weibo對(duì)于機(jī)器人賬戶的政策相當(dāng)嚴(yán)格。Weibo的用戶協(xié)議中規(guī)定: “未經(jīng)微博運(yùn)營(yíng)方事先書面許可,任何人不得擅自在微博平臺(tái)上實(shí)施自動(dòng)化行為或發(fā)布垃圾信息?!盵12]其中,“自動(dòng)化行為”是指用戶采用自動(dòng)化手段或“明顯異于常人地、遠(yuǎn)高于正常用戶頻率地”發(fā)布微博、評(píng)論、私信或?qū)ζ渌脩絷P(guān)注、點(diǎn)贊等的行為。以此為背景,Weibo平臺(tái)內(nèi)鮮見名義上的機(jī)器人賬戶,但可以觀察到一些事實(shí)上的機(jī)器人賬戶同樣活躍在Weibo社區(qū)中[15]。一些機(jī)器人賬戶或許能夠?yàn)檎S脩籼峁┯袔椭男畔⒎?wù),另一些則影響了正常用戶的使用體驗(yàn)。
按照設(shè)計(jì)的功能與影響其他用戶的方式,微博平臺(tái)中的機(jī)器人賬戶大致可以分為五類: 無害的機(jī)器人,公開廣告機(jī)器人,定向廣告機(jī)器人,僵尸粉絲機(jī)器人和熱點(diǎn)推手機(jī)器人,以下分別介紹這幾類機(jī)器人的特點(diǎn)。
無害的機(jī)器人: 這類機(jī)器人賬戶通常圍繞某個(gè)主題或按照某個(gè)預(yù)設(shè)的計(jì)劃發(fā)送或轉(zhuǎn)發(fā)推文,如圖1(a)中的Twitter賬戶@representabot自動(dòng)收集并發(fā)布美國(guó)國(guó)會(huì)的投票結(jié)果。這些機(jī)器人不僅沒有干擾其他用戶的正常使用,而且有時(shí)能夠提供有價(jià)值或者有娛樂性的內(nèi)容,對(duì)于微博社區(qū)的整體環(huán)境是有益無害的。
圖1 Twitter中的機(jī)器人
公開廣告機(jī)器人: 這類機(jī)器人賬戶同樣圍繞某個(gè)主題發(fā)送或轉(zhuǎn)發(fā)推文,但發(fā)布的內(nèi)容主要為廣告,如圖1(b)展示了一個(gè)為公司定時(shí)發(fā)布商務(wù)合作廣告的機(jī)器人。這類機(jī)器人并不一定會(huì)干擾其他用戶,一些由正規(guī)公司運(yùn)營(yíng)的機(jī)器人賬戶可能為其他用戶提供有價(jià)值的商業(yè)信息或購(gòu)物指南。這類機(jī)器人對(duì)其他用戶的負(fù)面影響在于: 一方面,有些機(jī)器人賬戶發(fā)布色情、賭博、詐騙等非法廣告,影響網(wǎng)絡(luò)環(huán)境;另一方面,有些機(jī)器人賬戶會(huì)在熱門話題下發(fā)布廣告以獲得更高的曝光度,污染了其他用戶所見的信息內(nèi)容。
定向廣告機(jī)器人: 這類機(jī)器人賬戶通過在推文中提及、轉(zhuǎn)發(fā)、評(píng)論或發(fā)送私信的方式定向地向其他用戶發(fā)送廣告。由于用戶在收到消息時(shí)會(huì)收到提醒,因此定向廣告機(jī)器人相較于公開廣告而言會(huì)更嚴(yán)重地影響其他用戶的正常使用。
僵尸粉絲機(jī)器人: 這類機(jī)器人賬戶會(huì)有計(jì)劃地對(duì)其他賬戶及其創(chuàng)作內(nèi)容進(jìn)行關(guān)注、點(diǎn)贊、評(píng)論或轉(zhuǎn)發(fā),為其他賬戶創(chuàng)造虛假的熱度和人氣。如圖1(c)中的賬戶至今從未發(fā)布原創(chuàng)推文,關(guān)注數(shù)異常多而粉絲數(shù)極少,極有可能是僵尸粉絲機(jī)器人。被僵尸粉絲機(jī)器人操縱的熱度和人氣將會(huì)影響正常用戶對(duì)某一賬戶或消息的可信程度的判斷,對(duì)整個(gè)社區(qū)的信息安全有巨大的損害。僵尸粉絲現(xiàn)象普遍存在于各個(gè)微博社區(qū)中,一些個(gè)人或組織豢養(yǎng)著大量的機(jī)器人賬戶并且出售給其他人,如Cresci等人報(bào)告他們購(gòu)買了3 351個(gè)Twitter上的機(jī)器人賬戶[16]。
熱點(diǎn)推手機(jī)器人: 這類機(jī)器人賬戶會(huì)在個(gè)人或組織的控制下參與熱點(diǎn)事件,發(fā)布、點(diǎn)贊、評(píng)論或轉(zhuǎn)發(fā)特定立場(chǎng)的信息,從而影響和操縱輿論方向。例如,一些Twitter機(jī)器人試圖在社區(qū)中宣揚(yáng)某些政治觀點(diǎn),或在選舉期間支持某些政治候選人[17];另一些機(jī)器人污染網(wǎng)絡(luò)輿論生態(tài)[15],或者左右社區(qū)投票結(jié)果[18]。隨著微博逐漸成為公共意見的表達(dá)平臺(tái),這些機(jī)器人越來越嚴(yán)重地影響了網(wǎng)絡(luò)空間的輿論安全。
機(jī)器人賬戶檢測(cè)的主要目的是,以微博平臺(tái)中的賬戶活動(dòng)行為為依據(jù),識(shí)別出平臺(tái)中的機(jī)器人、特別是有害的機(jī)器人,及時(shí)限制其活動(dòng),以免對(duì)微博社區(qū)環(huán)境造成危害。一種限制機(jī)器人活動(dòng)的方案是檢測(cè)賬戶發(fā)布的推文并及時(shí)刪除有害推文。有害的推文包括違規(guī)廣告、極端言論、不當(dāng)內(nèi)容等,通過推文的發(fā)布時(shí)間、發(fā)布設(shè)備等元數(shù)據(jù)和推文的文本內(nèi)容可以完成檢測(cè)。另一種限制機(jī)器人活動(dòng)的方案是對(duì)整個(gè)賬戶的行為進(jìn)行檢測(cè),及時(shí)封禁有害的機(jī)器人賬戶。對(duì)整個(gè)賬戶的檢測(cè)可以綜合考慮賬戶產(chǎn)生的各種數(shù)據(jù),如個(gè)人資料、發(fā)布推文、與其他用戶的互動(dòng)關(guān)系等。
圖2描述了機(jī)器人賬戶檢測(cè)的一般流程: 從微博平臺(tái)中采集若干賬戶的活動(dòng)數(shù)據(jù)構(gòu)建數(shù)據(jù)集,根據(jù)使用場(chǎng)景的具體要求,提取用戶特征、推文特征或其他所需特征,利用統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)或深度學(xué)習(xí)等方法,訓(xùn)練從提取的特征到檢測(cè)結(jié)果的映射,并將訓(xùn)練好的模型應(yīng)用到待檢測(cè)的賬戶上,判斷該賬戶是人類還是機(jī)器人。
圖2 機(jī)器人賬戶檢測(cè)的一般流程
對(duì)于一個(gè)訓(xùn)練好的機(jī)器人賬戶檢測(cè)模型,應(yīng)當(dāng)以一定方法對(duì)它的檢測(cè)性能進(jìn)行評(píng)價(jià)。準(zhǔn)確率(Accuracy)和精確率(Precision)是微博環(huán)境中的機(jī)器人賬戶檢測(cè)相關(guān)研究中常用的分類模型評(píng)估指標(biāo)[19]。準(zhǔn)確率和精確率的定義如式(1)、式(2)所示。
(1)
(2)
準(zhǔn)確率反映檢測(cè)模型整體的正確程度,但在樣本不均衡時(shí)單獨(dú)的準(zhǔn)確率并不一定能如實(shí)反映模型性能。精確率反映了模型檢測(cè)機(jī)器人的正確程度,在微博環(huán)境中,如果人類用戶經(jīng)常被錯(cuò)誤地識(shí)別為機(jī)器人并遭到錯(cuò)誤懲罰,將會(huì)極大地影響人類用戶的使用體驗(yàn),因此在訓(xùn)練機(jī)器人賬戶檢測(cè)模型時(shí)應(yīng)當(dāng)著重考慮如何保證高水平的精確率。性能良好的機(jī)器賬戶檢測(cè)模型可以為微博平臺(tái)提供具有參考價(jià)值的檢測(cè)結(jié)果,以便對(duì)可疑賬戶及時(shí)做出處理,從而防止機(jī)器人賬戶危害社區(qū)環(huán)境。
微博平臺(tái)以用戶生成內(nèi)容為主體、鼓勵(lì)用戶之間的互動(dòng),在為正常用戶提供一個(gè)低門檻、高效率的信息交流渠道的同時(shí),也為形形色色的機(jī)器人賬戶鋪設(shè)了一個(gè)理想的運(yùn)作環(huán)境。一部分機(jī)器人對(duì)平臺(tái)內(nèi)的溝通和交流有所貢獻(xiàn),另一部分機(jī)器人則可能危害網(wǎng)絡(luò)空間的信息安全。微博平臺(tái)往往對(duì)機(jī)器人賬戶的活動(dòng)有所限制,一些機(jī)器人為了達(dá)成信息傳播的目的而與平臺(tái)的審查機(jī)制進(jìn)行著對(duì)抗。在這樣的對(duì)抗中,機(jī)器人運(yùn)行機(jī)制的隱蔽性正變得越來越強(qiáng),發(fā)布信息的種類和機(jī)制也變得更加繁雜[20]。當(dāng)然,機(jī)器人賬戶存在無害與有害的區(qū)別,有害的機(jī)器人賬戶是需要重點(diǎn)關(guān)注與檢測(cè)的對(duì)象。機(jī)器人賬戶檢測(cè)的一般流程如圖2所示,下文將對(duì)每個(gè)環(huán)節(jié)展開具體說明。
微博平臺(tái)的數(shù)據(jù)是機(jī)器人賬戶識(shí)別研究的基礎(chǔ)。研究者可以自行獲取并標(biāo)注數(shù)據(jù),以Twitter為例,Twitter向開發(fā)人員提供了豐富的API資源[21]。利用Twitter提供的API,研究者可以方便地批量下載需要的數(shù)據(jù),包括用戶發(fā)布的推文、用戶的個(gè)人資料、用戶的具體行為等。對(duì)于Weibo而言,研究者則可能需要從平臺(tái)中自行獲取數(shù)據(jù)。
圍繞一個(gè)微博賬戶收集到的數(shù)據(jù)特征可以概括為三類: 資料、推文和關(guān)注關(guān)系(圖3)。資料包括用戶的昵稱、頭像、個(gè)人簡(jiǎn)介和賬號(hào)創(chuàng)建時(shí)間等;推文由文本數(shù)據(jù)和發(fā)布時(shí)間、地點(diǎn)、設(shè)備、點(diǎn)贊和轉(zhuǎn)發(fā)人數(shù)等元數(shù)據(jù)組成;關(guān)注關(guān)系指用戶之間關(guān)注和被關(guān)注的情況。一些數(shù)據(jù)集收集了用戶的關(guān)注人數(shù)和粉絲人數(shù)[22],另一些數(shù)據(jù)集則進(jìn)一步記錄了某一用戶關(guān)注和關(guān)注這一用戶的用戶ID或用戶名[16,23-24]。
圖3 一個(gè)微博賬戶的數(shù)據(jù)特征
為了訓(xùn)練和評(píng)價(jià)檢測(cè)模型,需要將收集到的用戶數(shù)據(jù)標(biāo)注為機(jī)器人賬戶和人類賬戶。常用的標(biāo)注策略可大致分為人工標(biāo)注和自動(dòng)標(biāo)注兩類。人工標(biāo)注是最直觀的標(biāo)注方法,通過檢查用戶的個(gè)人資料、發(fā)布的推文、與其他用戶的互動(dòng)等特征,人工識(shí)別出機(jī)器人賬戶和人類賬戶。人工標(biāo)注的主要問題是標(biāo)注效率,逐個(gè)識(shí)別賬戶種類需要花費(fèi)大量時(shí)間,例如Cresci團(tuán)隊(duì)的兩名成員標(biāo)注1 481個(gè)賬戶花費(fèi)了兩個(gè)月以上[16]。一種常見的提高標(biāo)注效率的方法是多人合作或使用眾包平臺(tái),例如Feng等人介紹了在Appen平臺(tái)上發(fā)起眾包業(yè)務(wù)進(jìn)行數(shù)據(jù)標(biāo)注的具體策略[23]。多人合作不僅可以提高效率,通過引入多數(shù)裁決的方法也可以提高標(biāo)注的準(zhǔn)確性。然而,人工對(duì)于賬戶的分類能力始終存在一定局限,例如Chavoshi等人報(bào)告了一種抄襲其他用戶發(fā)送的推文的機(jī)器人[25],人工幾乎不可能分辨出這種機(jī)器人賬戶。
除人工標(biāo)注外,一些研究人員在已有資源的基礎(chǔ)上,自動(dòng)地捕獲了已標(biāo)注的數(shù)據(jù)。例如,Cresci等人募集了真人賬戶志愿者[16]、購(gòu)買了第三方市場(chǎng)豢養(yǎng)的機(jī)器人賬戶[24],Yang等人收集了認(rèn)證賬戶作為人類用戶的實(shí)例、利用了現(xiàn)有識(shí)別系統(tǒng)的識(shí)別結(jié)果[26]等。采納這些自動(dòng)標(biāo)注的數(shù)據(jù)能夠擴(kuò)大數(shù)據(jù)集的規(guī)模,但如此獲得的用戶往往具有相當(dāng)程度的相似性、無法更廣泛地代表機(jī)器人賬戶或人類賬戶,因此這些自動(dòng)標(biāo)注的數(shù)據(jù)更適合作為人工標(biāo)注數(shù)據(jù)的補(bǔ)充,而不宜作為訓(xùn)練模型的主要依據(jù)。
考慮到數(shù)據(jù)捕獲和數(shù)據(jù)標(biāo)注的客觀困難,一些研究者分享了他們的數(shù)據(jù)集,為其他研究者提供了數(shù)據(jù)獲取方面的幫助。表1列舉了Twitter環(huán)境下一部分常用的公開數(shù)據(jù)集,并簡(jiǎn)要描述了它們的數(shù)據(jù)規(guī)模和包含的數(shù)據(jù)特征,這些數(shù)據(jù)集大部分可以聯(lián)機(jī)下載[27]。對(duì)于Weibo平臺(tái)而言,公開數(shù)據(jù)集相對(duì)較為缺乏,且未經(jīng)過系統(tǒng)的整理,但也同樣存在一些公開數(shù)據(jù)集,如“Weibo-COV” 數(shù)據(jù)集收集了2020年新冠肺炎疫情期間的數(shù)千萬條相關(guān)推文[28],“Double 11 Shopping Day”數(shù)據(jù)集收集了2013年至2017年“雙十一購(gòu)物節(jié)”時(shí)Weibo用戶創(chuàng)建的文本[29],“中文社交評(píng)論類事件標(biāo)注數(shù)據(jù)”數(shù)據(jù)集收集了2013年Weibo平臺(tái)中的熱門新聞和關(guān)于熱門新聞的用戶評(píng)論[30]等。
表1 Twitter平臺(tái)的部分公開數(shù)據(jù)集
續(xù)表
利用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法進(jìn)行機(jī)器人賬戶檢測(cè)可以分為兩個(gè)步驟: ①根據(jù)已有的研究結(jié)果和先驗(yàn)知識(shí),從數(shù)據(jù)集中手工計(jì)算一些特征;②利用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法,建立從提取的特征到檢測(cè)結(jié)果的映射模型。根據(jù)不同需求,可選擇的特征包括推文信息、賬戶信息、賬戶活動(dòng)等,可使用的模型則包括監(jiān)督學(xué)習(xí)的SVM、LR、樸素貝葉斯、決策樹,以及無監(jiān)督的聚類模型等。
一條推文由元數(shù)據(jù)和文本數(shù)據(jù)組成。元數(shù)據(jù)包含與內(nèi)容無關(guān)的信息,文本數(shù)據(jù)則描述推文的內(nèi)容??墒褂玫脑獢?shù)據(jù)特征包括推文ID、用戶ID、創(chuàng)建時(shí)間、是否原創(chuàng)、地理位置、點(diǎn)贊數(shù)、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)等;可使用的文本特征包括推文內(nèi)容、推文字?jǐn)?shù)、構(gòu)成推文的字詞計(jì)數(shù)、推文長(zhǎng)度、是否提及他人、是否引用話題、是否包含URL等。
通過對(duì)文本數(shù)據(jù)進(jìn)一步的技術(shù)分析又可以得到更高級(jí)的分析特征,例如:
文法特征: 分析推文的文法和措辭習(xí)慣,如縮略語比例、標(biāo)點(diǎn)符號(hào)比例、各詞性的詞匯比例等。
語義特征: 分析推文表達(dá)的具體語義,判斷是否為廣告、無用內(nèi)容、騷擾信息等低質(zhì)量推文。
情感特征: 分析推文中蘊(yùn)含的觀點(diǎn)和情緒,如是否客觀、是否友好、是否自信、心情狀態(tài)等。
相似度: 分析一條推文與該用戶先前發(fā)布推文或其他用戶推文的相似程度,判斷是否重復(fù)。
利用基于推文提取的特征,可以解決推文級(jí)的檢測(cè)問題[37]。Lundberg等人[38]提出了一種僅利用推文元數(shù)據(jù)的多語言Twitter機(jī)器人賬戶檢測(cè)方法,他們收集了5 000多條英語、瑞典語和法語的推文,利用4 000多條推文的元數(shù)據(jù)訓(xùn)練了多個(gè)決策樹,報(bào)告稱J48-HP分類器對(duì)1 000條測(cè)試推文的分類精確率超過99%。金丹等人[39]捕獲了Weibo平臺(tái)的數(shù)據(jù),提取了推文的轉(zhuǎn)發(fā)率和重復(fù)率、發(fā)布賬戶的名譽(yù)度、發(fā)布設(shè)備等特征,依據(jù)這些特征使用單一決策樹C4.5和組合決策樹的隨機(jī)森林構(gòu)建了機(jī)器人賬戶的識(shí)別模型,二者均有良好的檢測(cè)效果,準(zhǔn)確率達(dá)到94%以上。
除監(jiān)督學(xué)習(xí)的方法外,通過計(jì)算文本的相似度來進(jìn)行無監(jiān)督的聚類,同樣可以檢測(cè)出可疑的機(jī)器人賬戶。Chen等人[40]針對(duì)Twitter上重復(fù)發(fā)布帶有短URL內(nèi)容的機(jī)器人提出了一種無監(jiān)督的檢測(cè)方法,他們根據(jù)推文的文本內(nèi)容和發(fā)布推文的時(shí)間信息對(duì)賬戶進(jìn)行聚類,對(duì)發(fā)布URL的機(jī)器人起到了相當(dāng)良好的檢測(cè)效果。Abu等人[41]收集了大量活躍在政治話題中的機(jī)器人賬戶,他們對(duì)機(jī)器人發(fā)布的推文基于發(fā)布時(shí)間和文本內(nèi)容進(jìn)行多方位的聚類,并對(duì)聚類進(jìn)行組合以確定機(jī)器人賬戶的行為模式。他們觀察到,機(jī)器人賬戶在許多方面存在相似性,如同步的發(fā)布時(shí)間、相近的文本情感、一致的文本主題等,利用這種共通的模式可以識(shí)別機(jī)器人賬戶。徐帥帥等人[42]提出了一種無監(jiān)督的微博評(píng)論分析方法,利用搜索引擎擴(kuò)展微博文本,通過比較評(píng)論與擴(kuò)展后文本的相似性評(píng)估評(píng)論的價(jià)值,可以檢測(cè)發(fā)布廣告和垃圾信息等低價(jià)值內(nèi)容的機(jī)器人賬戶。
盡管基于推文信息的機(jī)器人賬戶檢測(cè)主要實(shí)現(xiàn)推文級(jí)別的檢測(cè),但在實(shí)際使用中,可以逐條分析一個(gè)賬戶發(fā)布的全部推文并綜合出對(duì)賬戶的評(píng)價(jià),實(shí)現(xiàn)賬戶級(jí)別的檢測(cè),Sneha等人[43]報(bào)告了一個(gè)相當(dāng)好的使用案例。
面對(duì)推文相關(guān)的識(shí)別問題,研究者既可以只憑借元數(shù)據(jù)和簡(jiǎn)單數(shù)據(jù)訓(xùn)練簡(jiǎn)單的統(tǒng)計(jì)模型,也可以引入自然語言處理、情感計(jì)算等復(fù)雜的任務(wù)來更多樣、更深入地對(duì)推文進(jìn)行處理,可見基于推文的識(shí)別方法仍然有十分廣闊的發(fā)展前景。
賬戶信息可分為靜態(tài)信息和動(dòng)態(tài)信息,二者均體現(xiàn)在用戶主頁上。靜態(tài)信息往往由用戶主動(dòng)設(shè)置,反映了與用戶身份相關(guān)的基本信息;動(dòng)態(tài)信息是用戶在微博活動(dòng)中產(chǎn)生的信息,反映了用戶的使用情況和使用偏好。具體而言,靜態(tài)信息包括用戶名、昵稱、是否經(jīng)過驗(yàn)證、自我介紹、頭像、個(gè)人背景圖像、生日、主頁、所在地、賬戶的創(chuàng)建時(shí)間等;動(dòng)態(tài)信息包括推文數(shù)、關(guān)注數(shù)、粉絲數(shù)、點(diǎn)贊數(shù)、轉(zhuǎn)發(fā)數(shù)、收藏?cái)?shù)、時(shí)間線等。
利用基于賬戶信息提取的特征,可以解決賬戶級(jí)的檢測(cè)問題。李赫元等人[44]在Weibo環(huán)境中提取了推文內(nèi)容和用戶個(gè)人資料,并根據(jù)提取到的信息額外定義了用戶權(quán)威度、近期活躍度、粉絲質(zhì)量等特征,利用這些特征訓(xùn)練了SVM分類器。他們使用Wrapper策略尋找最優(yōu)的特征組合,最終使用不含URL微博的百分比、純粉絲度、近期活躍度等7個(gè)特征構(gòu)造了分類器,識(shí)別準(zhǔn)確率達(dá)到94.4%。Efthimion等人[45]基于Cresci-2017數(shù)據(jù)集訓(xùn)練了一個(gè)LR分類器。他們注意到機(jī)器人賬戶具有的可疑特征——沒有頭像、沒有昵稱、粉絲太少、推文太少等,試圖利用這些特征來判斷賬戶種類。此外,他們還計(jì)算了用戶各條推文之間的Levenshtein距離,將推文的重復(fù)度納入模型考量。每個(gè)特征被當(dāng)作布爾類型的變量,訓(xùn)練得到的LR模型識(shí)別準(zhǔn)確率為97.75%。
無監(jiān)督的方法同樣適用于基于賬戶信息的檢測(cè)。Adewole等人[46]基于廣告機(jī)器人之間的相似性提出了一種檢測(cè)Twitter機(jī)器人賬戶的方法,他們?cè)?00 000個(gè)賬戶上應(yīng)用主成分分析和K-means對(duì)收集到的賬戶進(jìn)行聚類,依據(jù)聚類得到的特征訓(xùn)練了隨機(jī)森林、MLP和SVM三個(gè)分類器,其準(zhǔn)確率分別達(dá)到96.30%、96.00%和95.60%。Williom等人[47]利用兩種改良的無監(jiān)督流聚類算法StreamKM++和DenStream依據(jù)賬戶信息對(duì)Twitter賬戶進(jìn)行實(shí)時(shí)聚類,將異常值視為機(jī)器人賬戶。他們報(bào)告,在他們的數(shù)據(jù)集上StreamKM++和DenStream的準(zhǔn)確率都超過98%。
一些作者進(jìn)一步討論了選擇哪些特征能更加鮮明地區(qū)分機(jī)器人和人類賬戶,為模型提供了更高的可解釋性。Loyola等人[48]從大量推文和賬戶特征中挖掘了更加鮮明的“對(duì)比模式”,并基于對(duì)比模式使用PBC4cip決策樹作為分類器。他們比較了挖掘?qū)Ρ饶J降牟煌椒?LCMine和RFm),評(píng)估了構(gòu)造決策樹的不同分裂標(biāo)準(zhǔn)(Hellinger距離、巴氏距離和信息增益),最終報(bào)告隨機(jī)森林模型是分類結(jié)果最好的方案。Qi等人[49]基于Cresci-2017數(shù)據(jù)集訓(xùn)練了一個(gè)LR分類器,他們?cè)噲D解釋特定賬戶為何被歸類為機(jī)器人,因此他們對(duì)數(shù)據(jù)集中的每一類機(jī)器人賬戶都討論了每個(gè)賬戶特征在LR模型中的貢獻(xiàn)。作為結(jié)果,他們具體報(bào)告了機(jī)器人賬戶與真人、不同種類機(jī)器人賬戶之間的行為差異,并證實(shí)可以通過機(jī)器人與人類的不同特征來推斷賬戶是否為機(jī)器人。
許多基于賬戶信息的分類模型收獲了相當(dāng)好的分類結(jié)果,這是因?yàn)闄C(jī)器人賬戶與真人賬戶在賬戶信息方面經(jīng)常存在許多不同。機(jī)器人賬戶可能缺少個(gè)人資料、粉絲太少、推文太少、關(guān)注-粉絲比例異常等,使用統(tǒng)計(jì)方法和傳統(tǒng)機(jī)器學(xué)習(xí)方法可以敏銳地捕獲到這些差異。即便是在更復(fù)雜的深度學(xué)習(xí)模型中,賬戶信息也是重要的分類依據(jù)。但隨著機(jī)器人技術(shù)的發(fā)展,一些與真人賬戶相差無幾的機(jī)器人賬戶逐漸出現(xiàn),這些機(jī)器人賬戶對(duì)基于賬戶信息的檢測(cè)方法具有致命的混淆能力。以此為背景,如何更好地使用采集到的賬戶信息、如何設(shè)計(jì)效果更好的分類特征,愈發(fā)值得考量。
賬戶活動(dòng)包括對(duì)推文的發(fā)布、轉(zhuǎn)發(fā)、點(diǎn)贊、評(píng)論、收藏和對(duì)其他賬戶的關(guān)注、被關(guān)注、屏蔽、互動(dòng)等。真人用戶擁有靈活的活動(dòng)內(nèi)容,而機(jī)器人往往只在操縱者的設(shè)計(jì)下以特定方式活動(dòng),因此基于賬戶活動(dòng)可以構(gòu)建效果良好的檢測(cè)方法。
機(jī)器人與真人的賬戶活動(dòng)往往存在顯著差異,據(jù)此可以對(duì)機(jī)器人賬戶與真人進(jìn)行分類。李自豪[50]收集并分析了Weibo中的用戶數(shù)據(jù),發(fā)現(xiàn)機(jī)器人賬戶與正常用戶對(duì)于 “收藏”功能的使用習(xí)慣有著較大的差別: 正常用戶會(huì)靈活使用這一功能,而機(jī)器人賬戶則僅會(huì)機(jī)械地使用或完全不使用。因此他們將“收藏?cái)?shù)量”及“收藏速度”作為特征訓(xùn)練了C4.5決策樹與隨機(jī)森林,其中隨機(jī)森林的識(shí)別準(zhǔn)確率超過90%。Gobriela等人[51]注意到了人類和機(jī)器人發(fā)布推文時(shí)間和頻率上的差異: 機(jī)器人發(fā)推更頻繁、時(shí)間分布更隨機(jī),而且經(jīng)常在人類工作和睡覺的時(shí)間發(fā)布推文。他們發(fā)現(xiàn)人類用戶的發(fā)布行為明顯符合冪律,而機(jī)器人賬戶則并未表現(xiàn)出顯著特征。據(jù)此他們訓(xùn)練了一個(gè)NB分類器,具有84.6%的準(zhǔn)確率。
同一操縱者控制的機(jī)器人則可能表現(xiàn)出相似的賬戶活動(dòng),據(jù)此可以聚類并識(shí)別出可疑的用戶。Chavoshi等人[25]提出了DeBot,一個(gè)無監(jiān)督的機(jī)器人賬戶檢測(cè)系統(tǒng)。他們提出了“扭曲相關(guān)”來衡量用戶行為之間的相似程度,根據(jù)這個(gè)指標(biāo)對(duì)用戶進(jìn)行層次聚類,把行為高度相似的用戶視作由同一個(gè)操縱者控制的機(jī)器人賬戶。他們報(bào)告稱他們的方法有94%的準(zhǔn)確率,在某些情況下超過了Twitter的檢測(cè)算法。Minnich等人[52]提出了BotWalk,一種無監(jiān)督的、近乎實(shí)時(shí)的Twitter機(jī)器人賬戶檢測(cè)算法。他們用一個(gè)特征向量來描述用戶,該向量由賬戶信息、推文內(nèi)容、行為時(shí)間線等組成。在進(jìn)行檢測(cè)時(shí),他們從預(yù)先收集的機(jī)器人賬戶池中隨機(jī)取出一個(gè)作為種子,在Twitter實(shí)時(shí)數(shù)據(jù)中尋找與該賬戶相似的賬戶,將選出的賬戶視作潛在的機(jī)器人添到種子池中。新種子的不斷加入使他們能夠識(shí)別新的機(jī)器人行為。他們報(bào)告,使用BotWalk平均每天可以識(shí)別6 000個(gè)潛在機(jī)器人,精確率達(dá)到90%。
以上方法往往將微博平臺(tái)中的賬戶活動(dòng)視作時(shí)間序列。除此以外,賬戶活動(dòng)也可以被表示為一個(gè)圖結(jié)構(gòu): 將微博中的實(shí)體(用戶和推文)表示為節(jié)點(diǎn),將實(shí)體間關(guān)系(賬戶活動(dòng))表示為節(jié)點(diǎn)之間的邊,利用圖算法基于賬戶活動(dòng)實(shí)現(xiàn)機(jī)器人賬戶檢測(cè)。本文將在后續(xù)相關(guān)小節(jié)討論類似方法。
為了限制機(jī)器人賬戶的有害活動(dòng),可以對(duì)機(jī)器人賬戶發(fā)布的推文進(jìn)行檢測(cè),或者對(duì)整個(gè)賬戶進(jìn)行檢測(cè)。檢測(cè)推文的優(yōu)勢(shì)在于具有很強(qiáng)的即時(shí)性,每當(dāng)機(jī)器人發(fā)布有害推文時(shí)便可以立刻刪除;但由于檢測(cè)對(duì)象是推文,對(duì)于僵尸粉絲等不以發(fā)布推文為主要運(yùn)作方式的機(jī)器人便作用有限,因此推文級(jí)的方法往往更適合發(fā)布廣告或引導(dǎo)輿論的機(jī)器人。檢測(cè)賬戶的方法對(duì)于僵尸粉絲機(jī)器人等活動(dòng)明顯異于正常用戶的機(jī)器人有很好的檢測(cè)能力,對(duì)于其他類型的機(jī)器人也有不錯(cuò)的表現(xiàn),但即時(shí)性相對(duì)較差,往往需要收集一段時(shí)間的數(shù)據(jù)才能判斷一個(gè)賬戶的類別;同時(shí),賬戶級(jí)的檢測(cè)有可能會(huì)“誤傷”到一部分無害機(jī)器人和正常用戶,且錯(cuò)誤結(jié)果(封禁賬號(hào))明顯比推文級(jí)的方法(刪除一條推文)嚴(yán)重得多。
訓(xùn)練特征可以基于推文信息、賬戶信息、賬戶活動(dòng)信息等提取。在實(shí)踐中,研究者往往綜合多種特征: 在基于推文信息的檢測(cè)方法中,經(jīng)常引入發(fā)推者的賬戶信息作為有效的補(bǔ)充;在基于賬戶活動(dòng)的識(shí)別方法中,也總是引入推文和賬戶信息來具體地描述活動(dòng)中的實(shí)體對(duì)象。
表2總結(jié)了前文所述的統(tǒng)計(jì)方法和傳統(tǒng)機(jī)器學(xué)習(xí)的機(jī)器人賬戶檢測(cè)方法。各項(xiàng)研究的創(chuàng)新點(diǎn)大多集中在特征提取和使用的方式上,建模方法則多是采用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)領(lǐng)域內(nèi)一些成熟的工具。各項(xiàng)研究匯報(bào)了不同的評(píng)價(jià)指標(biāo): 有些研究報(bào)告了準(zhǔn)確率和精確率二者其一,有些則列出了兩個(gè)指標(biāo)。所有研究均報(bào)告了相當(dāng)理想的識(shí)別精度,但應(yīng)當(dāng)警惕在給定數(shù)據(jù)集上的過擬合問題,這一點(diǎn)在下文中會(huì)繼續(xù)進(jìn)行討論。
表2 基于傳統(tǒng)機(jī)器學(xué)習(xí)的機(jī)器人賬戶檢測(cè)方法
續(xù)表
深度學(xué)習(xí)已在計(jì)算機(jī)視覺到自然語言處理等眾多領(lǐng)域取得了巨大成功。相較傳統(tǒng)的機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)可以針對(duì)規(guī)模更大的數(shù)據(jù)集,自動(dòng)地從原始數(shù)據(jù)中提取目標(biāo)特征,而不依賴手工計(jì)算特征。微博社區(qū)中的信息十分豐富,信息之間關(guān)聯(lián)十分密切,利用深度學(xué)習(xí)能夠避免手工提取特征造成的信息損失,更充分地利用原始數(shù)據(jù)。因此,越來越多的研究者開始引入深度學(xué)習(xí),以期實(shí)現(xiàn)更高精度的機(jī)器人賬戶檢測(cè)。
深度學(xué)習(xí)能夠有效實(shí)現(xiàn)文本分類,它可以處理結(jié)構(gòu)化數(shù)據(jù)并自動(dòng)獲取特征,從而避免了手工的特征選擇[53]。深度神經(jīng)網(wǎng)絡(luò),如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)經(jīng)常被用于自然語言處理問題的特征提取器或分類器,推文作為一種文本,也適合這樣的分類任務(wù)。RNN是一類用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),其常見變體包括LSTM、SRV等,這些變體設(shè)計(jì)了更復(fù)雜的計(jì)算單元,能夠面對(duì)要求更高的使用場(chǎng)景[54]。CNN以卷積運(yùn)算為主要特征,通過對(duì)卷積核和信息傳播方式的不同設(shè)計(jì)能夠適應(yīng)文本、圖像視頻等不同領(lǐng)域的不同任務(wù)[55]??紤]到深度神經(jīng)網(wǎng)絡(luò)需要結(jié)構(gòu)化的輸入,推文文本往往需要用預(yù)訓(xùn)練模型(如Word2Vec)轉(zhuǎn)換為網(wǎng)絡(luò)能接受的形式,然后輸入到深度神經(jīng)網(wǎng)絡(luò)中,利用產(chǎn)生的特征進(jìn)行分類。圖4顯示了一個(gè)典型的基于CNN和RNN進(jìn)行機(jī)器人賬戶檢測(cè)的檢測(cè)流程。
圖4 一種基于CNN與RNN的機(jī)器人賬戶檢測(cè)流程[56]
Wei等人[57]用Cresci-2017數(shù)據(jù)集訓(xùn)練了一個(gè)雙向LSTM網(wǎng)絡(luò),他們宣稱這是第一個(gè)檢測(cè)Twitter平臺(tái)機(jī)器人賬戶的帶有詞嵌入的RNN模型。每條推文首先經(jīng)過預(yù)處理和標(biāo)記化以適應(yīng)詞嵌入,然后利用LSTM提取特征并經(jīng)過softmax進(jìn)行分類,最終得到了93%的準(zhǔn)確度,優(yōu)于未使用RNN的其他模型。Cai等人[56]提出了一個(gè)由LSTM和CNN組合的模型,命名為BeDM。他們宣稱這是第一個(gè)將CNN應(yīng)用于機(jī)器人賬戶檢測(cè)的模型。該模型將推文視為具有時(shí)間特征的文本流而不是純文本,以提取潛在的時(shí)間模式。每個(gè)用戶的推文使用DeepTalk做詞嵌入,然后用CNN提取特征,這些特征隨后被送入LSTM分析用戶的整體行為并進(jìn)行分類,分類結(jié)果具有88.4%的精確率。F?rber等人[58]同樣使用了CNN,根據(jù)Twitter賬戶的推文內(nèi)容來檢測(cè)機(jī)器人。他們對(duì)比了不同的嵌入方法和不同的CNN架構(gòu),并比較了它們的效率。在CLEF 2019 Bots Profiling Subtask數(shù)據(jù)集上,他們最高達(dá)到了90.34%的準(zhǔn)確率。
一些研究者繼續(xù)向模型中引入賬戶信息以期進(jìn)一步提高模型的檢測(cè)水平。Alom等人[59]提出了一種深度學(xué)習(xí)的方法,他們使用TextCNN從推文中提取特征,并將賬戶信息和推文元數(shù)據(jù)附加在后,利用這個(gè)組合的特征向量進(jìn)行分類。他們?cè)贑averlee-2011和Cresci-2017數(shù)據(jù)集上分別進(jìn)行了測(cè)試,在前者上達(dá)到了99.32%的準(zhǔn)確率,在后者上則達(dá)到93.38%,相較于未引入深度學(xué)習(xí)的方法有較大提升。Sneha等人[43]提出了一種用于Twitter機(jī)器人賬戶檢測(cè)的LSTM網(wǎng)絡(luò)。他們將推文內(nèi)容輸入到處理推文文本的LSTM網(wǎng)絡(luò)中提取特征,結(jié)合元數(shù)據(jù)進(jìn)行分類。盡管這一框架是針對(duì)推文級(jí)的分類設(shè)計(jì),但通過分析一個(gè)Twitter賬戶下的全部推文并匯總,他們的方法也可以實(shí)現(xiàn)賬戶級(jí)的分類。在Cresci-2017數(shù)據(jù)集上,他們報(bào)告了一個(gè)近乎完美的分類結(jié)果——推文層面的準(zhǔn)確率高于96%,賬戶層面的準(zhǔn)確率高于99%。Wu等人[60]針對(duì)Weibo提出了DABot模型,該模型由輸入層、殘差網(wǎng)絡(luò)層、GRU層、注意力層和推理層組成。他們?cè)谳斎雽又袑?duì)用戶的元數(shù)據(jù)和用戶的行為序列進(jìn)行標(biāo)準(zhǔn)化,用殘差網(wǎng)絡(luò)初步分析用戶特征向量的時(shí)間模式,隨后在GRU單元中對(duì)時(shí)間模式做進(jìn)一步提取。注意力層用于甄別關(guān)鍵信息和重要模式,這些關(guān)鍵信息最終經(jīng)由全連接層進(jìn)行分類,準(zhǔn)確率達(dá)到98.87%。
除監(jiān)督學(xué)習(xí)方法外,深度學(xué)習(xí)同樣為無監(jiān)督和自監(jiān)督方法提供了新的可能性。Afzal等人[61]提出了一種檢測(cè)Twitter推文中惡意URL的方法,命名為URLDeepDetect。他們使用一個(gè)LSTM網(wǎng)絡(luò)對(duì)惡意URL進(jìn)行建模,利用提取出的特征對(duì)新的推文進(jìn)行分類,從而檢測(cè)推送惡意URL的機(jī)器人。Feng等人[62]提出了SATAR,一個(gè)學(xué)習(xí)Twitter賬戶表示的自監(jiān)督框架。他們以粉絲數(shù)作為訓(xùn)練的自監(jiān)督信號(hào),將賬戶依據(jù)粉絲數(shù)進(jìn)行自動(dòng)分類,據(jù)此構(gòu)造了多個(gè)網(wǎng)絡(luò),分別處理推文時(shí)間線、推文語義、賬戶信息和關(guān)注關(guān)系,最終綜合為一個(gè)賬戶的表示向量。他們證實(shí),引入SATAR的檢測(cè)模型在不同數(shù)據(jù)集上的表現(xiàn)均優(yōu)于基線模型。
對(duì)抗學(xué)習(xí)往往以生成對(duì)抗網(wǎng)絡(luò)(GAN)為基礎(chǔ)。GAN包含一個(gè)生成器和一個(gè)判別器,兩個(gè)網(wǎng)絡(luò)在同一時(shí)間訓(xùn)練并且進(jìn)行競(jìng)爭(zhēng),在生成圖像、視頻和自然語言等數(shù)據(jù)方面有著廣泛應(yīng)用[63]。對(duì)抗學(xué)習(xí)可以生成“虛假”的數(shù)據(jù),為其他任務(wù)提供豐富的樣本資源,從而提高其他任務(wù)的表現(xiàn)。這一技術(shù)在其他課題中已取得可喜的成果[64],在微博機(jī)器人檢測(cè)領(lǐng)域也有研究者完成了成功的實(shí)驗(yàn)。
Najari等人[65]圍繞GAN建立了一套機(jī)器人檢測(cè)的框架,命名為GANBOT。他們收集了人類和機(jī)器人發(fā)布的推文,利用SeqGAN學(xué)習(xí)這些文本生成虛假的推文。他們構(gòu)建的機(jī)器人檢測(cè)框架如圖5所示: 一個(gè)LSTM被用作生成器,經(jīng)過訓(xùn)練后生成虛假的推文以欺騙判別器;為了檢測(cè)人類和機(jī)器人賬戶,他們繼續(xù)利用同一個(gè)LSTM模塊提取文本的隱藏狀態(tài),最終經(jīng)由全連接層對(duì)文本進(jìn)行分類。他們報(bào)告該框架的檢測(cè)性能優(yōu)于現(xiàn)有的僅基于LSTM的方法,并且能夠觀察到GAN的引入對(duì)提高精確率和減少誤報(bào)有積極作用。
圖5 一種基于對(duì)抗學(xué)習(xí)的機(jī)器人賬戶檢測(cè)流程
圖深度學(xué)習(xí)旨在研究如何應(yīng)用深度學(xué)習(xí)技術(shù)完成圖上的各類任務(wù)。目前,圖深度學(xué)習(xí)已經(jīng)取得了諸多突破,各類圖神經(jīng)網(wǎng)絡(luò)模型在不同應(yīng)用場(chǎng)景中紛紛取得成功。例如,Jiang等人[66]總結(jié)了一系列將圖深度學(xué)習(xí)應(yīng)用于分子性質(zhì)預(yù)測(cè)課題的具體方法,Diehl等人[67]提出了一種基于圖神經(jīng)網(wǎng)絡(luò)的車輛調(diào)度和交通測(cè)試方法,Schilichthrull等人[68]實(shí)現(xiàn)了一種將圖卷積和網(wǎng)絡(luò)用于建模知識(shí)、圖譜的開創(chuàng)性方法等。微博中的用戶行為構(gòu)成了一張圖,將圖深度學(xué)習(xí)技術(shù)引入機(jī)器人賬戶檢測(cè)課題中應(yīng)當(dāng)有良好的效果。
基于圖深度學(xué)習(xí)的機(jī)器人賬戶檢測(cè)方法往往將賬戶表示為節(jié)點(diǎn),將賬戶之間的關(guān)注、被關(guān)注、轉(zhuǎn)發(fā)、點(diǎn)贊等活動(dòng)表示為節(jié)點(diǎn)之間的邊,從而將微博環(huán)境中的社群關(guān)系表示為圖結(jié)構(gòu);以此為基礎(chǔ),通過共享參數(shù)的局部操作對(duì)圖進(jìn)行學(xué)習(xí),在相鄰節(jié)點(diǎn)之間交換信息,以社群為背景捕獲某個(gè)節(jié)點(diǎn)的狀態(tài),從而達(dá)到更好的檢測(cè)結(jié)果。圖6顯示了一個(gè)典型的基于圖深度學(xué)習(xí)進(jìn)行機(jī)器人賬戶檢測(cè)的檢測(cè)流程: 首先根據(jù)推文信息、賬戶信息、賬戶活動(dòng)等特征對(duì)節(jié)點(diǎn)進(jìn)行編碼,根據(jù)用戶之間的關(guān)注關(guān)系繪制有向邊,形成一個(gè)有向圖;對(duì)于每個(gè)節(jié)點(diǎn),利用定義的圖卷積運(yùn)算,聚合本節(jié)點(diǎn)及鄰接節(jié)點(diǎn)的特征并不斷迭代;最后,利用更新后的節(jié)點(diǎn)特征判斷待檢測(cè)用戶是否為機(jī)器人。 不同研究可能采取不同方法繪制社群關(guān)系的圖示(同質(zhì)圖/異質(zhì)圖,有向圖/無向圖等),并采取不同的方法聚合節(jié)點(diǎn)特征(GCN,GAT,圖Transformer等)。
圖6 一種基于圖深度學(xué)習(xí)的機(jī)器人賬戶檢測(cè)流程
Kolomeets等人[69]提出了一種只根據(jù)用戶之間的關(guān)注關(guān)系進(jìn)行機(jī)器人檢測(cè)的方法。他們以俄羅斯VKontakte平臺(tái)中的數(shù)據(jù)為背景,基于用戶之間的關(guān)注關(guān)系構(gòu)建了一個(gè)圖,除此之外并未引入其他任何賬戶信息或推文信息。他們使用兩種方法從圖中提取信息: 直接訓(xùn)練一個(gè)GNN模型,以及用待檢測(cè)節(jié)點(diǎn)所在子圖的圖指標(biāo)訓(xùn)練一個(gè)隨機(jī)森林模型。兩種方法均取得了良好的分類結(jié)果。
Feng等人[70]提出了BotRGCN,一個(gè)使用關(guān)系圖卷積網(wǎng)絡(luò)的Twitter機(jī)器人賬戶檢測(cè)框架。他們將用戶視為節(jié)點(diǎn),并將用戶之間的關(guān)系視為邊。各種推文和賬戶信息被編碼并拼接起來作為節(jié)點(diǎn)特征。通過將關(guān)注和粉絲定義為節(jié)點(diǎn)的兩種鄰居,他們構(gòu)建了一個(gè)反映Twitter用戶互動(dòng)的異質(zhì)圖。他們?cè)谶@個(gè)異質(zhì)圖上使用R-GCN匯總鄰接節(jié)點(diǎn)的信息以在圖中學(xué)習(xí)用戶表征,并應(yīng)用一個(gè)softmax層來基于用戶表征進(jìn)行機(jī)器人賬戶檢測(cè)。他們?cè)赥wiBot-20數(shù)據(jù)集上訓(xùn)練了BotRGCN,從數(shù)據(jù)集中獲得了一個(gè)有229 580個(gè)節(jié)點(diǎn)和227 979條邊的異質(zhì)圖并使用前述方法,最終報(bào)告了一個(gè)明顯優(yōu)于傳統(tǒng)方法的實(shí)驗(yàn)結(jié)果。
Li等人[71]提出了一個(gè)基于圖神經(jīng)網(wǎng)絡(luò)的異常Twitter用戶檢測(cè)框架,名為RAU-GNN。他們繪制了一組關(guān)系圖,其中節(jié)點(diǎn)代表用戶,邊代表用戶之間的提及、轉(zhuǎn)發(fā)、評(píng)論關(guān)系。他們根據(jù)不同的關(guān)系繪制了不同的圖,使用GCN來學(xué)習(xí)每個(gè)關(guān)系圖中的用戶節(jié)點(diǎn)表示,并將學(xué)到的特征整合到待檢測(cè)的中心節(jié)點(diǎn);為了捕捉更多的關(guān)系信息,他們利用一個(gè)具有注意力機(jī)制的GAT模塊來學(xué)習(xí)社交網(wǎng)絡(luò)中用戶之間不同關(guān)系的重要程度。最終他們將不同關(guān)系中的輸出表示結(jié)合起來,得到中心節(jié)點(diǎn)的最終表示,利用softmax層進(jìn)行分類和檢測(cè)。他們報(bào)告,與單獨(dú)使用GCN、GAT相比,他們采用的RAU-GNN是處理Twitter和Yelp數(shù)據(jù)集上相關(guān)用戶數(shù)據(jù)的最佳方式。
Feng等人[72]提出,他們把Twitter用戶作為圖中的節(jié)點(diǎn),用不同類型的邊代表Twitter上的多樣化關(guān)系。他們使用一個(gè)高度定制的GNN來處理這個(gè)圖,其中每一層都包含一個(gè)關(guān)系圖Transformer和一個(gè)語義注意力網(wǎng)絡(luò)。關(guān)系圖Transformer模擬用戶之間的影響、學(xué)習(xí)用戶節(jié)點(diǎn)的表征,語義注意力網(wǎng)絡(luò)則衡量特定關(guān)系的重要性,并依據(jù)不同關(guān)系從鄰近節(jié)點(diǎn)處匯總信息。經(jīng)過幾層GNN,他們得到了節(jié)點(diǎn)的最終表示,最后利用softmax完成Twitter機(jī)器人賬戶檢測(cè)。
表3總結(jié)了前文所述的基于深度學(xué)習(xí)的機(jī)器人賬戶檢測(cè)方法?;谏疃葘W(xué)習(xí)的方法往往比傳統(tǒng)的基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的方法起到更好的效果,盡管一些數(shù)據(jù)集的提升空間已經(jīng)不大。應(yīng)當(dāng)警惕的是,Yang等人[35]和Feng等人[73]均報(bào)告了在某個(gè)數(shù)據(jù)集上表現(xiàn)良好的模型遷移到另一個(gè)數(shù)據(jù)集上時(shí)會(huì)表現(xiàn)出明顯的不適應(yīng),這說明現(xiàn)有的訓(xùn)練很容易發(fā)生過擬合,不一定具備良好的泛化能力。為了解決這個(gè)問題,更健壯的模型和更豐富的數(shù)據(jù)都是必須的。無監(jiān)督方法可以作為補(bǔ)充,可以很好地處理數(shù)據(jù)不足或標(biāo)注不全的情況。
表3 基于深度學(xué)習(xí)的機(jī)器人賬戶檢測(cè)方法
一些研究者在文中評(píng)估了使用不同特征訓(xùn)練的模型[45,59,71],實(shí)驗(yàn)結(jié)果顯示,盡管他們引入了推文的文本內(nèi)容、關(guān)系的圖結(jié)構(gòu)等相對(duì)高級(jí)的特征,但對(duì)分類結(jié)果貢獻(xiàn)最大的仍然是推文和賬戶元數(shù)據(jù)等傳統(tǒng)的特征。如據(jù)Alom等人[59]報(bào)告,只采用推文的文本內(nèi)容訓(xùn)練的檢測(cè)模型僅有61.76%的準(zhǔn)確率,而引入元數(shù)據(jù)后準(zhǔn)確率則達(dá)到了93.38%。這似乎說明,盡管推文的文本內(nèi)容、用戶間的圖結(jié)構(gòu)等高級(jí)特征應(yīng)當(dāng)對(duì)機(jī)器人賬戶檢測(cè)大有裨益,但是研究者還沒有找到一個(gè)足夠好的方式來妥善使用這些特征。
本文闡述了機(jī)器人賬戶檢測(cè)的基本方法以及最新進(jìn)展,包括基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的方法,以及基于深度學(xué)習(xí)的方法。許多研究者已經(jīng)提出了效用良好的機(jī)器人賬戶檢測(cè)框架,一些方法也已被吸收進(jìn)Twitter和Weibo等平臺(tái),在與機(jī)器人賬戶的對(duì)抗中發(fā)揮著重要作用。然而,日常使用中仍然能在微博里發(fā)現(xiàn)機(jī)器人賬戶,機(jī)器人賬戶仍然影響著微博的社區(qū)環(huán)境。雖然新成果不斷涌現(xiàn),但機(jī)器人賬戶檢測(cè)仍然面臨著以下問題。
特征選擇: 在與檢測(cè)機(jī)制的對(duì)抗中,機(jī)器人賬戶的偽裝能力越來越強(qiáng),一些經(jīng)典的特征逐漸失效。例如,當(dāng)前很多機(jī)器人設(shè)置了看起來可信的個(gè)人資料,一些基于賬戶信息的識(shí)別方法由此陷入困境。對(duì)研究者而言,能否注意到機(jī)器人賬戶與真人賬戶之間更顯著的差異,能否提出一個(gè)強(qiáng)有力的模型把握好這些特征,很大程度上決定了機(jī)器人賬戶檢測(cè)技術(shù)的后續(xù)發(fā)展。
數(shù)據(jù)標(biāo)注: 當(dāng)前數(shù)據(jù)集的標(biāo)注在很大程度上依賴人力,而人工標(biāo)注始終面臨著效率低、時(shí)效性差、標(biāo)準(zhǔn)不統(tǒng)一的問題,數(shù)據(jù)集的缺乏制約著機(jī)器人賬戶檢測(cè)技術(shù)的發(fā)展。在這樣的背景下,一方面,應(yīng)當(dāng)鼓勵(lì)研究者聯(lián)合起來分享收集到的數(shù)據(jù);另一方面,由于無監(jiān)督和半監(jiān)督方法能夠很好地利用未標(biāo)注數(shù)據(jù),對(duì)無監(jiān)督和半監(jiān)督方法的研究或許能為機(jī)器人賬戶檢測(cè)帶來新的突破。
數(shù)據(jù)集遷移: 數(shù)據(jù)豐富程度對(duì)訓(xùn)練效果的影響是不言而喻的,單一數(shù)據(jù)集上的訓(xùn)練很容易過擬合。由于微博環(huán)境數(shù)據(jù)獲取和標(biāo)注存在一定的難度,許多研究者使用了相同的公共數(shù)據(jù)集,這使得一些方法并不具備令人滿意的泛化能力。一些研究者嘗試尋找解決方法,對(duì)抗學(xué)習(xí)、重采樣[73]、遷移學(xué)習(xí)[74]等技術(shù)已被證實(shí)能起到一定作用,然而更多處理和使用數(shù)據(jù)集的方法仍然有待提出。
多語言支持: 推文內(nèi)容是分辨機(jī)器人與真人的重要特征,但一條推文存在一定的語言背景。在英文環(huán)境下訓(xùn)練的文法、語義和情感處理方法,并不一定能直接遷移到中文語境。多語言支持對(duì)于自然語言處理而言是一個(gè)亟待解決的課題,對(duì)于機(jī)器人賬戶檢測(cè)而言則是一個(gè)切實(shí)存在的客觀障礙。如何實(shí)現(xiàn)一個(gè)多語言的計(jì)算模型,或者如何提取出更有效的元數(shù)據(jù),對(duì)于微博平臺(tái)中、尤其是對(duì)于Twitter這樣用戶國(guó)別復(fù)雜的平臺(tái)中的機(jī)器人賬戶檢測(cè)具有重要意義。
多樣化分類: 傳統(tǒng)的機(jī)器人賬戶檢測(cè)方法將機(jī)器人賬戶檢測(cè)定義為一個(gè)二分類問題,一個(gè)用戶要么被分類為機(jī)器人,要么被分類為真人。但隨著技術(shù)的發(fā)展和微博環(huán)境的變化,越來越多的賬戶逐漸步入了“機(jī)器人”和“真人”之間的模糊地帶: 自動(dòng)管理的企業(yè)賬戶、研究團(tuán)隊(duì)訓(xùn)練的AI賬戶、扮演真人的機(jī)器人賬戶甚至扮演機(jī)器人的真人賬戶紛紛出現(xiàn),二分類課題面臨巨大的困難。在這樣的背景下,一些研究者重新制定了分類標(biāo)準(zhǔn),例如進(jìn)行個(gè)人賬戶、企業(yè)賬戶和機(jī)器人賬戶的三分類[51,75]。構(gòu)造更復(fù)雜的模型、提高分類的多樣性,或許可以解決機(jī)器人分類的新問題。
總而言之,機(jī)器人賬戶不斷提高的偽裝水平為機(jī)器人賬戶檢測(cè)帶來了愈發(fā)嚴(yán)苛的挑戰(zhàn),但令人欣慰的是,不斷發(fā)展的信息技術(shù)方法也為機(jī)器人賬戶檢測(cè)創(chuàng)造了越來越強(qiáng)大的武器。提升網(wǎng)絡(luò)綜合治理能力,清朗網(wǎng)絡(luò)空間,我們?nèi)匀辉诼飞稀?/p>