劉榮叁+張宇+王星
摘 要: 隨著微博的高速發(fā)展,微博信息溯源成為信息內(nèi)容安全管理的重要研究?jī)?nèi)容之一。此前的信息溯源研究中,事件數(shù)據(jù)純度不高,且用戶(hù)影響力涉及的因素考慮得不夠全面,本文即針對(duì)以上問(wèn)題進(jìn)行研究。首先,由于微博信息采集過(guò)程中,得到的數(shù)據(jù)純度較低,對(duì)大量的新浪微博數(shù)據(jù)進(jìn)行事件聚類(lèi),得到某一具體事件的相關(guān)微博。接著,為了得到更合理的用戶(hù)影響力數(shù)值,針對(duì)具體事件涉及到的用戶(hù),考慮多個(gè)因素,進(jìn)行用戶(hù)影響力分析,得到用戶(hù)的影響力數(shù)值。最后,綜合考慮微博的發(fā)布時(shí)間和用戶(hù)影響力數(shù)值,使用Hacker News排序算法,對(duì)具體事件進(jìn)行信息溯源。最終分析得出了事件傳播過(guò)程中,發(fā)布時(shí)間較早,且用戶(hù)影響力較大的一篇微博為事件源頭。
關(guān)鍵詞: 新浪微博;事件聚類(lèi);用戶(hù)影響力分析;信息溯源
中圖分類(lèi)號(hào):TP391.41
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):2095-2163(2017)02-0094-05