張寧熙
(廣西壯族自治區(qū)人民政府辦公廳電子政務(wù)中心,廣西?南寧 530013)
·理論探索·
大數(shù)據(jù)在突發(fā)公共事件網(wǎng)絡(luò)輿情信息工作中的應(yīng)用
張寧熙
(廣西壯族自治區(qū)人民政府辦公廳電子政務(wù)中心,廣西?南寧 530013)
〔摘要〕大數(shù)據(jù)既是新技術(shù)也是方法論,大數(shù)據(jù)側(cè)重于挖掘有價(jià)值的信息,將大數(shù)據(jù)應(yīng)用到網(wǎng)絡(luò)輿情信息工作中,是新形勢(shì)新環(huán)境下突發(fā)公共事件應(yīng)對(duì)的新需求。本文分析了大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情的現(xiàn)狀和特點(diǎn),以及當(dāng)前網(wǎng)絡(luò)輿情信息工作存在的問題,通過對(duì)大數(shù)據(jù)的概念和特性及其主要技術(shù)的研究,結(jié)合突發(fā)公共事件的特點(diǎn),探討如何將大數(shù)據(jù)應(yīng)用到突發(fā)公共事件網(wǎng)絡(luò)輿情信息工作中,為網(wǎng)絡(luò)輿情信息工作提供技術(shù)解決參考和方法論支持。
〔關(guān)鍵詞〕大數(shù)據(jù);Hadoop;MapReduce;輿情分析
近年來,我國(guó)各類突發(fā)公共事件頻繁發(fā)生,給人民生命財(cái)產(chǎn)和經(jīng)濟(jì)社會(huì)發(fā)展造成了重大損失。隨著近年來我國(guó)網(wǎng)民數(shù)量的激增和移動(dòng)智能設(shè)備的普及,社交網(wǎng)絡(luò)等新媒體工具逐漸滲透到人們的生活當(dāng)中,突發(fā)公共事件在網(wǎng)上傳播的速度越來越快,人們對(duì)突發(fā)公共事件的關(guān)注度越來越高。發(fā)生突發(fā)公共事件,相關(guān)職能部門如何迅速收集網(wǎng)絡(luò)輿情信息,跟蹤事態(tài)變化,及時(shí)向有關(guān)部門通報(bào),是新形勢(shì)和新環(huán)境下亟待解決的問題[1]。新時(shí)期的網(wǎng)絡(luò)輿情是錯(cuò)綜復(fù)雜的,因此,做好網(wǎng)絡(luò)輿情信息工作關(guān)乎國(guó)家政治穩(wěn)定和社會(huì)安全。
在大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)承載的信息數(shù)據(jù)規(guī)模越來越巨大,給網(wǎng)絡(luò)輿情信息工作帶來了挑戰(zhàn)也帶來了機(jī)遇,借助大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),輿情信息工作部門可以從網(wǎng)上海量的、多樣的信息數(shù)據(jù)中迅速分析、挖掘出有價(jià)值的輿情信息,大數(shù)據(jù)將在突發(fā)公共事件網(wǎng)絡(luò)輿情信息工作中發(fā)揮重要的作用。
1.1大數(shù)據(jù)的產(chǎn)生及其特征
大數(shù)據(jù)時(shí)代的到來,從信息技術(shù)發(fā)展史上看,是有必然性的。首先,信息基礎(chǔ)設(shè)施持續(xù)完善,網(wǎng)絡(luò)規(guī)模不斷擴(kuò)大,存儲(chǔ)設(shè)備性能不斷提高,是大數(shù)據(jù)產(chǎn)生的物質(zhì)基礎(chǔ);其次,物聯(lián)網(wǎng)與移動(dòng)智能終端持續(xù)不斷的產(chǎn)生大量數(shù)據(jù),數(shù)據(jù)類型多樣化,是大數(shù)據(jù)產(chǎn)生的重要來源。隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)理論變得越來越豐富,其特征可概括為4個(gè)方面[2]:一是容量( Volume),數(shù)據(jù)容量大,“體積”從TB~PB甚至到EB級(jí);二是速度(Velocity),能持續(xù)、實(shí)時(shí)的產(chǎn)生數(shù)據(jù),且要求處理速度快;三是多樣(Variety),數(shù)據(jù)類型多樣,包括結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù);四是價(jià)值(Value),具有對(duì)數(shù)據(jù)的預(yù)測(cè)分析能力,能挖掘有用的數(shù)據(jù)價(jià)值。這些特征使得大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)區(qū)別開來,強(qiáng)調(diào)了大數(shù)據(jù)是高度分散的、結(jié)構(gòu)松散的、形式復(fù)雜的、有利用價(jià)值的信息資源。
1.2大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情現(xiàn)狀
根據(jù)中國(guó)互聯(lián)網(wǎng)信息中心(CNNIC)《第34次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示[3]:截至2014年6月,我國(guó)網(wǎng)民規(guī)模已達(dá)6.32億,其中手機(jī)網(wǎng)民5.27億,手機(jī)上網(wǎng)比例(83.4%)首次超越傳統(tǒng)PC上網(wǎng)比例(80.9%)??梢?,隨著移動(dòng)互聯(lián)技術(shù)的發(fā)展,移動(dòng)智能終端應(yīng)用迅速推廣普及,我國(guó)已邁向全面網(wǎng)絡(luò)化的“大數(shù)據(jù)時(shí)代”。
作為自媒體較集中的區(qū)域,社交網(wǎng)絡(luò)平臺(tái)一直是突發(fā)公共事件網(wǎng)絡(luò)輿情監(jiān)測(cè)的重點(diǎn)區(qū)域,加上近年來農(nóng)村地區(qū)上網(wǎng)普及工作取得成效,城鄉(xiāng)間互聯(lián)網(wǎng)普及差距逐步縮小,網(wǎng)絡(luò)的話語(yǔ)權(quán)不再局限于城市里的年輕一代,一些農(nóng)村地區(qū)和城鄉(xiāng)結(jié)合部的網(wǎng)民開始直接通過網(wǎng)絡(luò)反映民情民意以及社會(huì)問題,表達(dá)對(duì)一些事件的認(rèn)識(shí)和看法,網(wǎng)上各種真實(shí)的、虛假的、理性的、非理性的言論相互疊加,混淆視聽,給互聯(lián)網(wǎng)監(jiān)管工作和網(wǎng)絡(luò)輿情監(jiān)測(cè)帶來了挑戰(zhàn)。
1.3大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿論的特點(diǎn)
與過去傳統(tǒng)媒體輿論傳播相比,大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)輿論主要有以下幾個(gè)特點(diǎn):
1.3.1輿論信息相對(duì)開放
社交網(wǎng)絡(luò)服務(wù)(SNS)使網(wǎng)民掌握越來越多的話語(yǔ)權(quán),網(wǎng)民在自然狀態(tài)下直接表達(dá)個(gè)人情緒,發(fā)表言論觀點(diǎn),各種意見來自四面八方,打破了主流媒體“統(tǒng)一聲音”的格局,網(wǎng)絡(luò)輿論進(jìn)入自由開放的“自媒體時(shí)代”。
1.3.2輿論信息傳播迅速
突發(fā)公共事件時(shí),在事件現(xiàn)場(chǎng)的網(wǎng)民即可通過手機(jī)在社交網(wǎng)絡(luò)“爆料”,事件在網(wǎng)絡(luò)上迅速傳開,從事件發(fā)生到信息傳播蔓延,從個(gè)體意見產(chǎn)生到群體意見匯集,從意見綜合到輿論形成,在大數(shù)據(jù)時(shí)代,幾乎就是一個(gè)“核裂變”式的“蝴蝶效應(yīng)”過程[4]。
1.3.3輿論信息豐富多樣
在大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)信息是海量的、多樣的:在內(nèi)容上,網(wǎng)絡(luò)輿論包羅萬(wàn)象,既有積極健康的言論,也有缺乏理性的言論和個(gè)性化的情緒表達(dá)[5];在傳播形式上,播客(broadcasting)與微博(weibo)相結(jié)合的音視頻社交網(wǎng)絡(luò)應(yīng)用異軍突起,微博、微信等社交網(wǎng)絡(luò)工具不再局限于純文本格式交流應(yīng)用,而是整合了拍照、攝像、網(wǎng)絡(luò)對(duì)講、播客等形式的多媒體音視頻網(wǎng)絡(luò)應(yīng)用,使網(wǎng)絡(luò)輿論信息在傳播形式上更加多元化。
1.3.4輿論信息有傾向性
由于事件發(fā)生時(shí),事件現(xiàn)場(chǎng)的手機(jī)網(wǎng)民受某些情緒化因素影響,對(duì)事件的認(rèn)識(shí)、看法和言論存在愛憎偏好的傾向性,抓拍的照片可能并非事件全貌,有的事件本身信息源的可信度就不高,但在網(wǎng)絡(luò)上某些“活躍分子”們的作用下,一些缺乏理性的網(wǎng)絡(luò)言論被層層轉(zhuǎn)發(fā),迅速蔓延,有的甚至被加工、演變成謠言,給政府突發(fā)事件應(yīng)對(duì)與處置造成極大被動(dòng)。
網(wǎng)絡(luò)輿情信息工作,是相關(guān)信息工作部門和人員對(duì)特定時(shí)期或特定事件的網(wǎng)上言論和意見等輿情信息進(jìn)行收集、分析和整理形成報(bào)送材料,為決策者提供決策依據(jù)的工作[6]。網(wǎng)絡(luò)輿情與突發(fā)公共事件是密切相關(guān)的,結(jié)合大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿論的新特點(diǎn),當(dāng)前網(wǎng)絡(luò)輿情信息工作主要存在以下幾個(gè)問題,這些問題的存在既有主觀因素也有客觀因素。
2.1輿情分析不足,信息質(zhì)量不高
網(wǎng)絡(luò)環(huán)境下收集獲取的事件信息有的是不可靠的,一些部門的輿情信息報(bào)送仍停留在類似事件日志和工作動(dòng)態(tài)形式的報(bào)送上,對(duì)事件背景和事件反映的具體問題沒有及時(shí)深入的分析研究,信息的情報(bào)價(jià)值作用和參謀服務(wù)作用不夠明顯。
2.2輿情監(jiān)測(cè)的工具和方法滯后
網(wǎng)絡(luò)輿情監(jiān)測(cè)關(guān)鍵在于及時(shí)發(fā)現(xiàn),目前大多數(shù)單位對(duì)網(wǎng)絡(luò)輿情監(jiān)測(cè)仍停留在以人工網(wǎng)頁(yè)瀏覽和搜索為主的階段,由于人工監(jiān)測(cè)方式的頻度及范圍相當(dāng)有限,難免出現(xiàn)遺漏和疏忽,一些網(wǎng)上事件難以及時(shí)發(fā)現(xiàn)。
2.3輿情分析研判不準(zhǔn),事件預(yù)警能力不強(qiáng)
網(wǎng)絡(luò)輿情信息的情報(bào)價(jià)值只有通過及時(shí)準(zhǔn)確的分析研判才得以體現(xiàn),然而目前大多數(shù)單位的信息工作人員輿情分析專業(yè)化程度有限,對(duì)事件隱含的信息缺少掌握,一些事件沒有按照突發(fā)公共事件分類分級(jí)標(biāo)準(zhǔn)明確,對(duì)輿情信息跟蹤分析的靈敏度不高,輿情的分析研判能力和事件預(yù)警能力需要進(jìn)一步加強(qiáng)。
網(wǎng)絡(luò)輿情信息工作要主動(dòng)適應(yīng)大數(shù)據(jù)時(shí)代的新特點(diǎn)和新變化,將大數(shù)據(jù)和突發(fā)公共事件應(yīng)對(duì)緊密結(jié)合起來,充分發(fā)揮大數(shù)據(jù)對(duì)網(wǎng)絡(luò)輿情信息工作的重要技術(shù)支撐作用,推進(jìn)互聯(lián)網(wǎng)治理現(xiàn)代化,提高政府突發(fā)公共事件應(yīng)急處置能力。
大數(shù)據(jù)技術(shù)有很多,目前應(yīng)用較成熟的是Apache軟件基金會(huì)提出的Hadoop分布式計(jì)算系統(tǒng)基礎(chǔ)框架[7],該框架由多個(gè)大數(shù)據(jù)技術(shù)開源項(xiàng)目組成,相關(guān)核心技術(shù)主要是:分布式計(jì)算模型MapReduce、分布式文件系統(tǒng)HDFS(Hadoop Distributed File System)、數(shù)據(jù)倉(cāng)庫(kù)工具Hive和分布式數(shù)據(jù)庫(kù)Hbase,其中,MapReduce分布式計(jì)算模型對(duì)大數(shù)據(jù)網(wǎng)絡(luò)輿情分析起著關(guān)鍵作用。Hadoop的工作機(jī)制是通過分布式計(jì)算模型MapReduce實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)輿情的重點(diǎn)監(jiān)測(cè)、數(shù)據(jù)分析、趨勢(shì)分析和跟蹤預(yù)警,提供高效率的數(shù)據(jù)挖掘與分析能力,通過分布式文件系統(tǒng)HDFS實(shí)現(xiàn)硬件資源和存儲(chǔ)資源的有效利用與管理,提供高吞吐量的數(shù)據(jù)存取能力,通過數(shù)據(jù)倉(cāng)庫(kù)工具Hive加快數(shù)據(jù)查詢,數(shù)據(jù)挖掘和建立索引,使用基于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫(kù)Hbase實(shí)現(xiàn)不同類型數(shù)據(jù)的兼容和分布式存儲(chǔ)。
面對(duì)傳統(tǒng)輿情監(jiān)管工具、方法和流程難以處理大數(shù)據(jù),基于Hadoop的大數(shù)據(jù)技術(shù)具有處理速度快、存取效率高、平臺(tái)應(yīng)用靈活、硬件系統(tǒng)通用等良好的性能,能在大數(shù)據(jù)環(huán)境下完成輿情信息搜索采集、輿情信息數(shù)據(jù)加工處理、輿情分析及事件預(yù)警支持、輿情信息報(bào)告等工作,滿足突發(fā)公共事件網(wǎng)絡(luò)輿情信息工作的高標(biāo)準(zhǔn)和高要求。
大數(shù)據(jù)既是新技術(shù)也是方法論,網(wǎng)絡(luò)輿情信息工作要結(jié)合當(dāng)前突發(fā)公共事件的特點(diǎn),用大數(shù)據(jù)作為加強(qiáng)與創(chuàng)新網(wǎng)絡(luò)輿情信息工作的重要手段。一是輿情監(jiān)測(cè)與信息搜集,對(duì)論壇、博客等網(wǎng)絡(luò)平臺(tái),尤其是對(duì)微博、微信等社交網(wǎng)絡(luò)輿情的重點(diǎn)監(jiān)測(cè)和信息搜集;二是輿情信息數(shù)據(jù)處理,利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)信息數(shù)據(jù)的兼容、分類、去重、轉(zhuǎn)換、建立索引等數(shù)據(jù)整理;三是輿情分析及事件趨勢(shì)預(yù)警,從輿情數(shù)據(jù)中快速定位、識(shí)別有價(jià)值的信息,分析事件的背景和特征,分析事件的關(guān)聯(lián)性、背后隱藏的規(guī)律和發(fā)展趨勢(shì),提供突發(fā)公共事件預(yù)警支持;四是強(qiáng)化網(wǎng)絡(luò)輿情信息報(bào)送效果,將輿情信息用圖表方式直觀化,拓寬報(bào)送及發(fā)布渠道,利用移動(dòng)互聯(lián)技術(shù)實(shí)現(xiàn)輿情信息集納和推送。
4.1大數(shù)據(jù)輿情監(jiān)測(cè)及信息搜集
傳統(tǒng)網(wǎng)絡(luò)輿情信息的搜索采集主要依靠人工監(jiān)測(cè)采集和網(wǎng)頁(yè)定時(shí)抓取方式實(shí)現(xiàn),搜索采集效率低,事件的一些動(dòng)態(tài)情況難以及時(shí)掌握。大數(shù)據(jù)網(wǎng)絡(luò)輿情信息搜集可采用定向站點(diǎn)網(wǎng)頁(yè)信息抓取、RSS(聚合內(nèi)容)摘要搜集、社交網(wǎng)站信息搜集、全文檢索系統(tǒng)等搜集技術(shù)與傳統(tǒng)人工監(jiān)測(cè)采集相結(jié)合的方式進(jìn)行。
(1)定向站點(diǎn)網(wǎng)頁(yè)信息抓取主要是利用網(wǎng)頁(yè)爬蟲程序?qū)浨樾畔⒆罨钴S、反映問題較突出的綜合性論壇網(wǎng)站的網(wǎng)頁(yè)信息抓取,如天涯論壇地方版塊、紅豆社區(qū)等反映地方社情民意的網(wǎng)絡(luò)論壇。
(2)RSS(聚合內(nèi)容)摘要搜集主要對(duì)新聞?lì)惡筒┛皖惥W(wǎng)站開放的RSS摘要信息進(jìn)行搜索采集,對(duì)某事件密切相關(guān)的上千個(gè)RSS Feed(種子)進(jìn)行聚合,能快速的、全面的了解突發(fā)事件的動(dòng)態(tài)情況。
(3)社交網(wǎng)絡(luò)信息搜集主要對(duì)微博等提供社交網(wǎng)絡(luò)服務(wù)(SNS)平臺(tái)的信息進(jìn)行實(shí)時(shí)監(jiān)測(cè)和搜集。目前,國(guó)內(nèi)主流的社交網(wǎng)站為便于信息資源交換和共享,提供了支持單點(diǎn)登錄的開放式社交網(wǎng)絡(luò)服務(wù)API,如新浪WeiboAPI和騰訊微博OpenAPI(見表1),利用分布式微博爬蟲程序可調(diào)用社交網(wǎng)絡(luò)服務(wù)API進(jìn)行信息抓取,對(duì)用戶標(biāo)簽(Tags)和事件話題(如“#XX事件話題調(diào)查#”)等內(nèi)容進(jìn)行搜索采集。
表1 國(guó)內(nèi)主流社交網(wǎng)絡(luò)提供的API(部分)
(4)全文檢索系統(tǒng)是使用全文搜索引擎通過特定的協(xié)議接口直接對(duì)網(wǎng)站的數(shù)據(jù)庫(kù)或非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行信息采集和檢索?;诖髷?shù)據(jù)技術(shù)的全文檢索系統(tǒng)能夠利用特定的協(xié)議接口,如SQL Server的Microsoft Search服務(wù)和MySQL的InnoDB引擎等,建立動(dòng)態(tài)的全文檢索中間庫(kù),滿足海量的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的采集檢索需求。一般情況下,全文檢索系統(tǒng)主要應(yīng)用于文獻(xiàn)檢索,當(dāng)突發(fā)公共事件在網(wǎng)上傳播時(shí),通過其強(qiáng)大的搜索功能直接對(duì)網(wǎng)站的數(shù)據(jù)庫(kù)和文件進(jìn)行掃描、搜索和抓取,實(shí)現(xiàn)更有效的突發(fā)公共事件網(wǎng)絡(luò)輿情信息搜集。
4.2大數(shù)據(jù)輿情信息的數(shù)據(jù)處理
大數(shù)據(jù)對(duì)海量信息數(shù)據(jù)進(jìn)行搜索采集,這些信息數(shù)據(jù)的種類和來源是多樣化的,有結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),也有半結(jié)構(gòu)化數(shù)據(jù),需要對(duì)搜集的信息數(shù)據(jù)進(jìn)行分類、聚類、信息去重、數(shù)據(jù)轉(zhuǎn)換、建立索引等數(shù)據(jù)處理工作,便于下一步數(shù)據(jù)挖掘、輿情分析和研判。
大數(shù)據(jù)信息處理的技術(shù)實(shí)現(xiàn)是在HDFS存儲(chǔ)的支持下通過數(shù)據(jù)倉(cāng)庫(kù)工具Hive和非關(guān)系型分布式數(shù)據(jù)庫(kù)HBase完成,HDFS作為面向大數(shù)據(jù)應(yīng)用的分布式文件系統(tǒng),在底層提供高性能的硬件資源管理和存儲(chǔ)管理支持,實(shí)現(xiàn)輿情大數(shù)據(jù)的高效存取和交換。Hive作為建立數(shù)據(jù)倉(cāng)庫(kù)模型的ETL工具,對(duì)信息數(shù)據(jù)進(jìn)行提取(Extract)、轉(zhuǎn)換(Transform)、加載(Load)等處理過程,形成數(shù)據(jù)索引和輿情詞匯庫(kù),建立輿情數(shù)據(jù)倉(cāng)庫(kù),將這些信息數(shù)據(jù)加載到Hbase數(shù)據(jù)庫(kù)中,Hbase采用面向列的稀疏存儲(chǔ)模式,以非關(guān)系型數(shù)據(jù)庫(kù)NoSQL替代傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),解決當(dāng)前Web2.0社交網(wǎng)絡(luò)大規(guī)模、高并發(fā)的數(shù)據(jù)處理問題。
4.3大數(shù)據(jù)輿情分析及事件預(yù)警支持
網(wǎng)絡(luò)輿情分析首先要對(duì)突發(fā)公共事件進(jìn)行科學(xué)的特征分析和類型界定,突發(fā)公共事件通常具有突發(fā)性、不確定性、社會(huì)性、易擴(kuò)散和周期性等特征,按類型主要分為自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生和社會(huì)安全4類事件。
輿情分析的數(shù)據(jù)輸入輸出、特征參數(shù)設(shè)置和數(shù)據(jù)分析框架可依據(jù)國(guó)家、本地區(qū)或本行業(yè)突發(fā)公共事件分類分級(jí)標(biāo)準(zhǔn)設(shè)計(jì),通過大數(shù)據(jù)輿情分析,不但能夠掌握事件所處的階段(如潛伏期、引發(fā)期、發(fā)展期、高潮期、處理期和平緩期等不同階段),還能夠通過數(shù)據(jù)分析提供對(duì)突發(fā)公共事件的預(yù)警支持[8](如表2示例),更重要的是能夠反映出事件的背景、概況與發(fā)展趨勢(shì),公眾對(duì)事件的主要態(tài)度與情緒,對(duì)公共部門形象的影響,對(duì)社會(huì)安全的危害程度,法律法規(guī)和制度是否存在缺漏等問題。
表2 某地公共衛(wèi)生事件數(shù)據(jù)分析及事件預(yù)警示例
MapReduce分布式計(jì)算模型是實(shí)現(xiàn)大數(shù)據(jù)背景下突發(fā)公共事件輿情分析及事件預(yù)警支持的關(guān)鍵技術(shù)。MapReduce的工作機(jī)制是將大數(shù)據(jù)量的、雜亂無(wú)章的事件信息數(shù)據(jù)按照某些特征組織起來,將信息數(shù)據(jù)歸納處理得到最終分析結(jié)果。MapReduce計(jì)算分為Map(映射)過程和Reduce(歸約)過程,原始信息由Map輸入,信息初始是雜亂無(wú)章的,每條信息數(shù)據(jù)之間看似毫無(wú)關(guān)系,經(jīng)過Map的映射和解析,從中提取出key(關(guān)鍵字)和value(值),從而分析出信息數(shù)據(jù)的特征,經(jīng)過MapReduce的Reduce過程的歸約和化簡(jiǎn),就能得出已經(jīng)歸納好的信息數(shù)據(jù)。MapReduce對(duì)大批量數(shù)據(jù)集的計(jì)算處理有更高的執(zhí)行效率,能更好地滿足突發(fā)公共事件輿情監(jiān)測(cè)的需求,實(shí)現(xiàn)突發(fā)公共事件輿情分析及事件趨勢(shì)預(yù)警支持。
4.4大數(shù)據(jù)輿情信息報(bào)告
使用大數(shù)據(jù)強(qiáng)化網(wǎng)絡(luò)輿情信息報(bào)送效果,將輿情監(jiān)測(cè)、輿情分析、趨勢(shì)預(yù)警等信息以直觀的圖表方式展現(xiàn)出來,使輿情信息報(bào)告直觀化。輿情信息報(bào)告的基本要求是報(bào)告要符合客觀實(shí)際,數(shù)據(jù)要真實(shí)可靠,語(yǔ)言要簡(jiǎn)明、準(zhǔn)確和易懂,在報(bào)告中運(yùn)用圖表能夠清晰、直觀的表現(xiàn)事件的輿情,大數(shù)據(jù)輿情信息報(bào)告可在信息報(bào)送簡(jiǎn)明、準(zhǔn)確和易懂的文字基礎(chǔ)上,科學(xué)選擇能夠直觀反映事件情況的圖表示意呈現(xiàn),如事件趨勢(shì)圖、觀點(diǎn)百分比餅圖、頻率分布網(wǎng)狀圖、負(fù)面輿情度直方圖等豐富的圖表工具,為更進(jìn)一步的輿情分析和研判提供更直觀的決策參考。在輿情信息的報(bào)送發(fā)布渠道上,充分發(fā)揮大數(shù)據(jù)將各種網(wǎng)絡(luò)媒體融合的技術(shù)優(yōu)勢(shì),在確保安全保密的前提下,利用移動(dòng)互聯(lián)技術(shù)以電子郵件、Web、App客戶端等報(bào)送方式實(shí)現(xiàn)輿情信息報(bào)告的集納和推送,使決策者便于及時(shí)跟蹤事件動(dòng)態(tài)和輿情影響,更好地發(fā)揮網(wǎng)絡(luò)輿情信息工作的參謀服務(wù)作用。
大數(shù)據(jù)不僅僅是一種信息技術(shù),更是一種方法論,它帶來了一場(chǎng)全新的信息技術(shù)革命,代表著一個(gè)新時(shí)代的到來。從大數(shù)據(jù)的特性和應(yīng)用目標(biāo)來看,大數(shù)據(jù)追求的不只是信息容量和處理速度,更重要的是信息的價(jià)值,將大數(shù)據(jù)應(yīng)用到網(wǎng)絡(luò)輿情信息工作中,是新形勢(shì)新環(huán)境下突發(fā)公共事件應(yīng)對(duì)的新需求。本文分析了大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)輿情現(xiàn)狀和輿論特點(diǎn),對(duì)當(dāng)前網(wǎng)絡(luò)輿情信息工作存在的問題提出了看法,通過對(duì)大數(shù)據(jù)的概念和特性及其主要技術(shù)的研究,結(jié)合突發(fā)公共事件網(wǎng)絡(luò)輿論的新特點(diǎn),對(duì)如何將大數(shù)據(jù)應(yīng)用到突發(fā)公共事件網(wǎng)絡(luò)輿情信息工作中進(jìn)行了探討和研究,為網(wǎng)絡(luò)輿情信息工作提供技術(shù)解決參考和方法論支持。
參考文獻(xiàn)
[1]閆利平,陶衛(wèi)江,韓曉虎,等.政府網(wǎng)絡(luò)輿情監(jiān)測(cè)分析及預(yù)警[J].現(xiàn)代情報(bào),2011,31(4):46.
[2]馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國(guó)防科技,2013,(2):12.
[3]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.第34次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[EB/OL].http:∥www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/t20140721-47437.htm,2014-07-21.
[4]喬夏陽(yáng).公眾網(wǎng)絡(luò)參與中的“蝴蝶效應(yīng)”[J].理論探索,2013,(4):71.
[5]姜?jiǎng)俸?網(wǎng)絡(luò)輿情的內(nèi)涵及主要特點(diǎn)[J].理論界,2010,(3):152.
[6]王小蘭.輿情信息工作的實(shí)踐困境及現(xiàn)實(shí)建構(gòu)[J].福建行政學(xué)院學(xué)報(bào),2012,(2):70-71.
[7]尹培培.大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)輿情分析系統(tǒng)[J].廣播與電視技術(shù),2013,(7):44.
[8]張倩.大數(shù)據(jù)在突發(fā)事件政府決策中的應(yīng)用[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2013,11(6):75.
(本文責(zé)任編輯:孫國(guó)雷)
Application of Big Data in Network Public Opinion Information Work of Public Emergency
Zhang Ningxi
(The General Office of Guangxi Government,E-government Center,Nanning 530013,China)
〔Abstract〕Big data is both new technologies and methodologies,big data focused on valuable information mining,the application of big data in network public opinion information work is a new requirements of public emergency response which under the new situation and new environment.This article analyzed the present situation and characteristics of network public opinion in the era of big data,and problems existing in the network public opinion information work,based on the study of the concept and characteristics of big data and its main technologies,combining with the characteristics of public emergency,explored how to apply big data to network public opinion information work in public emergency,to provide technical solution to reference and methodological support for network public opinion information work.
〔Key words〕big data;Hadoop;MapReduce;public opinion analysis
〔中圖分類號(hào)〕C912.6
〔文獻(xiàn)標(biāo)識(shí)碼〕A
〔文章編號(hào)〕1008-0821(2015)06-0038-05
DOI:10.3969/j.issn.1008-0821.2015.06.008
作者簡(jiǎn)介:張寧熙(1981-),男,碩士,研究方向:電子政務(wù)、安全保密管理。
收稿日期:2014-12-02