国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于云計算技術(shù)的網(wǎng)絡(luò)輿情數(shù)據(jù)挖掘研究

2018-02-02 05:38易珩馬琪琪朱璽諭顧振宇
電腦知識與技術(shù) 2018年1期
關(guān)鍵詞:線性回歸網(wǎng)絡(luò)輿情云計算

易珩+馬琪琪+朱璽諭+顧振宇

摘要:梳理現(xiàn)有網(wǎng)絡(luò)輿情文獻研究,基于云計算爬蟲技術(shù)獲取微博API開放平臺大數(shù)據(jù),量化影響網(wǎng)絡(luò)輿情傳播三大主要因素,利用SPSS統(tǒng)計學(xué)軟件針對大數(shù)據(jù)進行數(shù)據(jù)挖掘,構(gòu)建散點圖、直方圖、折線圖等描述性統(tǒng)計量,進而利用R語言構(gòu)建線性回歸方程,并針對數(shù)據(jù)處理結(jié)果進行分析,揭示網(wǎng)絡(luò)輿情傳播特點,就網(wǎng)絡(luò)輿情監(jiān)管、處理、預(yù)防過程中的缺失提出建議,為現(xiàn)存網(wǎng)絡(luò)輿情傳播提供新的研究工具。

關(guān)鍵詞:網(wǎng)絡(luò)輿情;云計算;數(shù)據(jù)挖掘;描述統(tǒng)計學(xué);線性回歸

中圖分類號:TP393 文獻標(biāo)識碼:A 文章編號:1009-3044(2018)01-0032-03

1 社會背景

我們已邁入大數(shù)據(jù)時代,數(shù)據(jù)挖掘技術(shù)與云處理技術(shù)的融合運用于多方問題的解決,具有廣泛應(yīng)用性。作為網(wǎng)絡(luò)輿情這一愈發(fā)突出的網(wǎng)絡(luò)社會問題,我國此類研究仍處于初級階段,停留在簡單的理論分析層面。面對問題的發(fā)生,政府部門的解決方案仍多處于隱瞞、躲避等低效處理手段,往往治理效果不佳?,F(xiàn)如今,計算機網(wǎng)絡(luò)與云計算技術(shù)的發(fā)展與運用可有效地達到“事前預(yù)防,事中控制,事候安置”的效果,更好地解決輿情問題,保持社會的和諧安定。

1.2 研究現(xiàn)狀

網(wǎng)絡(luò)輿情現(xiàn)主要存在于中國,屬于網(wǎng)絡(luò)發(fā)展中的突出問題。國內(nèi)現(xiàn)研究主要集中于基于社會學(xué)與管理學(xué)研究,主要探討公眾對于政府行政工作、社會矛盾等事件的態(tài)度與反應(yīng),多基于某一特定事件進行具體研究,利用問卷調(diào)查或理論描述分析,雖具有一定的現(xiàn)實意義,但是由于網(wǎng)絡(luò)輿情其突發(fā)性、不穩(wěn)定性與復(fù)雜性,事件涉及各方人員較為復(fù)雜,事件性質(zhì)各不統(tǒng)一,研究缺乏基于大數(shù)據(jù)對于網(wǎng)絡(luò)輿情的整體發(fā)展情況與影響因素進行廣泛性研究。故本文將結(jié)合數(shù)據(jù)挖掘技術(shù)與云計算處理技術(shù)針對網(wǎng)絡(luò)輿情大數(shù)據(jù)進行分析討論,更具代表性與適用性。

2 相關(guān)理論

2.1 網(wǎng)絡(luò)輿情

網(wǎng)絡(luò)輿情是對社會輿情的反映,也是輿情在互聯(lián)網(wǎng)上的映射[1]。隨著現(xiàn)如今互聯(lián)網(wǎng)已全面普及,據(jù)截至2017年6月中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的2017年度《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,我國網(wǎng)民規(guī)模達到7.51億。中國網(wǎng)民、新媒體更多地利用互聯(lián)網(wǎng)平臺進行發(fā)聲,使得網(wǎng)絡(luò)輿情的傳播范圍更加廣泛,傳播速度更加快速。

2.2 云計算

現(xiàn)如今,對于云計算沒有確切的定義,在本文中,我們引用認可度較廣的NIST定義。NIST 認為云計算是一種模式,能泛在地、便利地、按需地通過網(wǎng)絡(luò)訪問可配置的計算資源,如網(wǎng)絡(luò)、服務(wù)器、存儲器、應(yīng)用和服務(wù)等,這些資源可實現(xiàn)快速部署與發(fā)布,并且只需要極少的管理成本或服務(wù)提供商的干預(yù)[2]。合理地運用云計算技術(shù)可以更為高效地預(yù)防、處理、監(jiān)控網(wǎng)絡(luò)輿情發(fā)展情況。

2.3 數(shù)據(jù)挖掘

所謂數(shù)據(jù)挖掘, 就是從大量無序的數(shù)據(jù)中發(fā)現(xiàn)隱含的、有效的、有價值的、可理解的模式, 進而發(fā)現(xiàn)有用的知識, 并得出時間的趨向和關(guān)聯(lián), 為用戶提供問題求解層次的決策支持能力[3]。利用數(shù)據(jù)挖掘技術(shù)可以將輿情進行精準(zhǔn)分類、特定分析、數(shù)據(jù)擬合,建立高效的數(shù)據(jù)庫,實現(xiàn)快速準(zhǔn)確的信息檢索。

3 應(yīng)用過程

3.1 數(shù)據(jù)選取

新浪微博以其會員人數(shù)眾多、信息量較大、結(jié)合移動與PC端等優(yōu)勢,在網(wǎng)絡(luò)信息的傳播過程中成為主流平臺,本次我們選取新浪微博作為數(shù)據(jù)源進行分析。

網(wǎng)絡(luò)輿情按其政府在網(wǎng)絡(luò)輿情應(yīng)對中的角色,可分為涉及政府事件,政府作為當(dāng)事方與非政府事件,政府作為社會管理者角色[4]。政府事件包含城管暴力執(zhí)法等事件,非政府事件包含娛樂新聞等事件。近些年,網(wǎng)絡(luò)輿情情況愈發(fā)突出,例2017年8月日,魏凱揚陪同學(xué)鄧某某、唐某飲酒,導(dǎo)致下午開庭不能正常進行等涉及政府部門事件頻發(fā)。政府由于其特殊地位,作為敏感性問題更易引起社會關(guān)注并造成社會動蕩與政府公信力下降等嚴(yán)重后果,成為社會治安的又一不穩(wěn)定因素。因此,本次將重點分析涉及政府類信息,討論政府在輿情處理方面存在的缺失環(huán)節(jié)并加以改進分析。

3.1 數(shù)據(jù)收集

我們利用Python的爬蟲技術(shù)編寫代碼用于搜集微博平臺移動端與PC端涉及“政府”、“城管”、“法官”等敏感性字樣的輿情數(shù)據(jù),獲取以下信息:①微博發(fā)表時間;②微博的內(nèi)容;③發(fā)微博的工具(手機類型或者平臺);④微博被轉(zhuǎn)發(fā)的數(shù)量,以此作為本次研究的數(shù)據(jù)基礎(chǔ)。

3.2 數(shù)據(jù)分析

首先探討網(wǎng)絡(luò)輿情傳播程度與事件發(fā)布時間之間的關(guān)系。

將自變量定義為發(fā)表時間(以微博輿情事件發(fā)表時間表示),我們構(gòu)建散點圖將微博平臺近3個月內(nèi)343件轉(zhuǎn)發(fā)數(shù)量大于500的涉及“政府事件”在時間軸中標(biāo)出,分析輿情發(fā)生時間主要集中的時間段進行分析。利用SPSS軟件進行描述性統(tǒng)計學(xué)分析,得出結(jié)果如下:

我們發(fā)現(xiàn)近3個月內(nèi)343件“政府事件”發(fā)布時間多集中6:00至11:00白天的時間段,在夜間17:00以后呈明顯下降趨勢。

接著探討網(wǎng)絡(luò)輿情傳播程度與輿情內(nèi)容敏感字段個數(shù)之間的關(guān)系。

利用統(tǒng)計學(xué)多元線性回歸知識,將定義為輿情內(nèi)容(以內(nèi)容涉及“政府”、“城管”等敏感字段個數(shù)表示),利用SPSS軟件對于所選取數(shù)據(jù)構(gòu)建散點圖,得出結(jié)果如下:

通過圖我們發(fā)現(xiàn)輿情數(shù)量與敏感詞條個數(shù)存在正相關(guān)的線性關(guān)系,即敏感詞條個數(shù)越多,轉(zhuǎn)發(fā)數(shù)量越多,為進一步分析兩者之間具體量化關(guān)系,我們利R語言構(gòu)建一元線性回歸,得出結(jié)果如下:

根據(jù)表1分析,二者所構(gòu)建回歸方程為: 即平均每增長一條敏感性詞條,轉(zhuǎn)發(fā)數(shù)量會平均增加710條轉(zhuǎn)發(fā)數(shù)量,為此,得以證明敏感性詞條個數(shù)對于最終輿情的傳播效果有著重大的影響。

接著探討網(wǎng)絡(luò)輿情傳播程度與傳播設(shè)備端之間的關(guān)系。

利用SPSS軟件繪制描述統(tǒng)計學(xué)直方圖分析因變量與自變量:傳播方式(以傳播方式是否利用移動端設(shè)備/PC端設(shè)備傳播表示)之間的關(guān)系,得出結(jié)果如下:endprint

由圖可知,所獲取的數(shù)據(jù)中消息發(fā)布者與轉(zhuǎn)發(fā)者使用移動端設(shè)備傳播的人數(shù)占絕大多數(shù),大約占據(jù)所有轉(zhuǎn)發(fā)數(shù)量的,由此可見移動設(shè)備端的傳播對于輿情傳播起更大程度的影響作用。

3.3 討論和分析

根據(jù)網(wǎng)絡(luò)輿情傳播程度與事件發(fā)布時間所作折線圖分析,微博發(fā)表時間多集中于6:00至11:00白天的時間段,在夜間17:00以后呈明顯下降趨勢,由此分析其成因有①涉及政府事件的網(wǎng)絡(luò)輿情發(fā)生時間多集中于白天,且由于現(xiàn)如今移動設(shè)備的普及,導(dǎo)致社會實踐可以在第一時間發(fā)布與傳播;②涉及政府類事件的曝光可以有效達到輿論監(jiān)督的效果,在白天有關(guān)責(zé)任部門可第一時間進行核實,確保事件的真實性并及時做出應(yīng)對與措施,減少事件所造成的不良影響;③夜間多集中娛樂性等非政府類事件的傳播,政府類消息的關(guān)注度有所下降,傳播效果不佳,故各媒體人為新聞關(guān)注度擇時而發(fā)。

根據(jù)網(wǎng)絡(luò)輿情傳播程度與輿情內(nèi)容敏感字段個數(shù)所作散點圖與一元線性回歸所作結(jié)論,敏感性詞條的個數(shù)會大大影響輿情傳播的程度,由此分析其成因有①敏感性詞條數(shù)量增多,反應(yīng)此事件涉及多方矛盾,影響人群范圍更加廣,社會關(guān)注度更高,輿論監(jiān)督力度更大,更易導(dǎo)致輿情的快速傳播②基于微博等互聯(lián)網(wǎng)平臺信息檢索功能,敏感性詞條數(shù)量增多可以增強微博詞條的搜索效果,其信息檢索效果更佳,更易被搜索,可吸引更多網(wǎng)民關(guān)注。

根據(jù)網(wǎng)絡(luò)輿情傳播程度與傳播設(shè)備端所作消息發(fā)布者與轉(zhuǎn)發(fā)者使用移動端與PC端設(shè)備傳播的直方圖所示,移動端設(shè)備較PC端設(shè)備對于輿情的傳播擁有更重要的地位,我們分析其成因有:①現(xiàn)如今,移動端設(shè)備普及度較高,據(jù)工信部公布《2017年第1季度通信水平分省情況》,報告顯示我國,移動電話普及率為97.9部/百人,“移動網(wǎng)民”也成了網(wǎng)絡(luò)安全中又一股重要的人群。②由于移動端設(shè)備其便捷性與實時性的特點,“移動網(wǎng)民”可以達到“隨時發(fā)布、隨時查看、隨時評論”的便利,其便捷性也客觀上增強了輿情傳播的程度。

3.4 改進建議

針對網(wǎng)絡(luò)輿情傳播程度與事件發(fā)布時間問題,官方政府機構(gòu)開通各類大型平臺官方賬號,開通便民反饋通道,加強平臺監(jiān)督與信息的實時反饋,白天進行具體事項的處理與監(jiān)控,確保其面對突發(fā)的網(wǎng)絡(luò)輿情可以及時接收、及時核實、及時處理,避免引起不良影響。

針對網(wǎng)絡(luò)輿情傳播程度與輿情內(nèi)容敏感字段個數(shù)問題,面對敏感詞條數(shù)對于輿情傳播的巨大影響力,增設(shè)敏感性詞條監(jiān)控手段,網(wǎng)絡(luò)安全部門設(shè)定敏感詞條數(shù)警戒線,對于不當(dāng)內(nèi)容及時發(fā)現(xiàn)、核實、處理,減少網(wǎng)絡(luò)輿論的不當(dāng)引導(dǎo)與不良謠言的散播。

針對網(wǎng)絡(luò)輿情傳播程度與傳播設(shè)備端問題,面對現(xiàn)如今移動端設(shè)備作為網(wǎng)絡(luò)輿情傳播中重要的用戶使用工具,需要更加關(guān)注移動端設(shè)備信息的監(jiān)控,完善網(wǎng)絡(luò)實名制與網(wǎng)絡(luò)信息的管理制度,關(guān)注“移動網(wǎng)民”的實時動態(tài)。

4 結(jié)論

本文以網(wǎng)絡(luò)輿情中政府部門在網(wǎng)絡(luò)輿情應(yīng)對中所處角色,將其分為以政府作為當(dāng)事方的政府事件與政府作為監(jiān)管方的非政府事件。以政府其特殊性地位與其所易造成的公信力下降等嚴(yán)重影響,本文主要針對政府類實踐研究。

通過Python網(wǎng)絡(luò)爬蟲技術(shù)獲取微博平臺所需信息,分別給予描述統(tǒng)計學(xué)與線性回歸基礎(chǔ),利用SPSS與R語言軟件構(gòu)建散點圖、直方圖、線性回歸,具體分析網(wǎng)絡(luò)輿情傳播程度與事件發(fā)布時間、輿情內(nèi)容敏感字段個數(shù)、傳播設(shè)備端三大影響因素之間的關(guān)系。分析得出事件發(fā)布時間多集中于6:00至11:00白天的時間段,在夜間17:00以后呈明顯下降趨勢;輿情內(nèi)容敏感字段個數(shù)與輿情傳播程度存在顯著的正相關(guān)關(guān)系,平均每增長一條敏感性詞條,轉(zhuǎn)發(fā)數(shù)量會平均增加710條轉(zhuǎn)發(fā)數(shù)量;消息發(fā)布者與轉(zhuǎn)發(fā)者使用移動端設(shè)備傳播的人數(shù)占絕大多數(shù),大約占據(jù)所有轉(zhuǎn)發(fā)數(shù)量的,對于輿情的傳播起主導(dǎo)作用。后基于以上分析,并結(jié)合政府先行輿情管理模式提出針對性解決方案,旨在加強網(wǎng)絡(luò)輿情的監(jiān)督、預(yù)防與處理,確保網(wǎng)絡(luò)社會的和諧。

本文主要利用統(tǒng)計學(xué)與計算機知識,利用現(xiàn)有的新型大數(shù)據(jù)處理工具,以獨特的視角分析輿情事件其特征與傳播過程中各因素影響情況。在之后的研究中,將研究范圍拓展至非政府事件的研究,以更大的數(shù)據(jù)量使結(jié)論更具代表性。

參考文獻:

[1] 曾潤喜.網(wǎng)絡(luò)輿情管控工作機制研究[J].圖書情報工作,2009,53(18):79-8.

[2] Peter M, Timothy G. The NIST Definition of Cloud Computing[011-9-1]. http://csrc.nist.gov/publications/ nistpubs/800-145/SP800-145.pdf.

[3] 賀玲,吳玲達,蔡益朝. 數(shù)據(jù)挖掘中的聚類算法綜述[J]. 計算機應(yīng)用研究,007,(01):10-13.

[4] 王晰巍,邢云菲,趙丹,等. 基于社會網(wǎng)絡(luò)分析的移動環(huán)境下網(wǎng)絡(luò)輿情信息傳播研究——以新浪微博“霧霾”話題為例[J]. 圖書情報工作,2015,59(07):14-22.

[5] 余江,萬勁波,張越.推動中國云計算技術(shù)與產(chǎn)業(yè)創(chuàng)新發(fā)展的戰(zhàn)略思考[J].中國科學(xué)院院刊,2015,30(02):181-186.

[6] 王國華,馮偉,王雅蕾.基于網(wǎng)絡(luò)輿情分類的輿情應(yīng)對研究[J].廉政文化研究,2013,4(4):92.

[7] 梁俊山.基于云計算的政府網(wǎng)絡(luò)輿情治理研究[A].燕山大學(xué)文法學(xué)院.學(xué)習(xí)十八大精神與河北沿海地區(qū)發(fā)展論壇論文集[C].燕山大學(xué)文法學(xué)院,2012:7.

[8] 丁勝鋒,楊紹輝.數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情管理中的研究[J].大學(xué)教育,2016(11):173-174.

[9] 何雅琴,朱葛俊,張飛.基于云計算的常州本地網(wǎng)絡(luò)輿情特點與對策研究[J].常州信息職業(yè)技術(shù)學(xué)院學(xué)報,2013,12(1):92-94.endprint

猜你喜歡
線性回歸網(wǎng)絡(luò)輿情云計算
淺析網(wǎng)絡(luò)輿情治理
基于社會穩(wěn)定視角的網(wǎng)絡(luò)輿情預(yù)警機制構(gòu)建的思考
實驗云:理論教學(xué)與實驗教學(xué)深度融合的助推器
乾安县| 山东省| 会宁县| 绥德县| 新泰市| 瑞安市| 施甸县| 长宁区| 吉水县| 卫辉市| 富平县| 吕梁市| 台前县| 昆山市| 镇坪县| 天等县| 沁阳市| 上犹县| 汶上县| 柘城县| 双辽市| 新巴尔虎右旗| 平陆县| 碌曲县| 南通市| 花莲县| 龙门县| 武清区| 大渡口区| 余干县| 乌兰县| 射阳县| 普安县| 阿坝| 呼玛县| 竹溪县| 伊川县| 江山市| 辽源市| 那曲县| 修水县|