国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于時(shí)間序列網(wǎng)絡(luò)輿情熱點(diǎn)事件發(fā)現(xiàn)模型

2016-12-15 08:07:01林麗娜魏德志
關(guān)鍵詞:熱點(diǎn)排序輿情

林麗娜,魏德志,2

(1.集美大學(xué) 誠(chéng)毅學(xué)院,福建 廈門 361021; 2.福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福建 福州 350108)

?

一種基于時(shí)間序列網(wǎng)絡(luò)輿情熱點(diǎn)事件發(fā)現(xiàn)模型

林麗娜1,魏德志1,2

(1.集美大學(xué) 誠(chéng)毅學(xué)院,福建 廈門 361021; 2.福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福建 福州 350108)

在大數(shù)據(jù)背景下,互聯(lián)網(wǎng)每天都能產(chǎn)生大量的輿情信息,如何從大量的輿情信息中及時(shí)發(fā)現(xiàn)熱點(diǎn)事件,有利于政府及時(shí)監(jiān)控相關(guān)熱點(diǎn)事件的發(fā)展趨勢(shì),對(duì)網(wǎng)民進(jìn)行輿論導(dǎo)向的引導(dǎo),減少輿情信息對(duì)社會(huì)的不良影響,保護(hù)網(wǎng)民的權(quán)益,促進(jìn)社會(huì)的穩(wěn)定.本文針對(duì)目前網(wǎng)絡(luò)輿情熱點(diǎn)事件發(fā)現(xiàn)模型存在的一些問題,提出了一個(gè)基于時(shí)間序列的排序模型用于發(fā)現(xiàn)熱點(diǎn)事件,該模型采用影響熱點(diǎn)事件的相關(guān)因素作為評(píng)價(jià)指標(biāo),并且指標(biāo)的相關(guān)數(shù)據(jù)全部為客觀數(shù)據(jù),有利于模型評(píng)價(jià)的客觀性.為了求解該模型,首先采用熵權(quán)法確定模型中指標(biāo)的權(quán)重,然后提出將TOPSIS法和灰色關(guān)聯(lián)法以相對(duì)貼近度的形式結(jié)合起來進(jìn)行計(jì)算,以判斷方案的優(yōu)劣,最后通過實(shí)驗(yàn)驗(yàn)證,和其他熱點(diǎn)事件發(fā)現(xiàn)算法進(jìn)行對(duì)比,最終得出該方法具有比較好的客觀性和準(zhǔn)確性.

網(wǎng)絡(luò)輿情;時(shí)間序列;排序模型;大數(shù)據(jù)

1 概述

在互聯(lián)網(wǎng)的新時(shí)代,無論是重大事件或國(guó)際活動(dòng),可以形成在網(wǎng)絡(luò)上的輿論在很短的時(shí)間,甚至有輿論的巨大力量.面對(duì)幾億網(wǎng)民和幾百萬的媒體網(wǎng)站,每天都能產(chǎn)生海量的網(wǎng)絡(luò)輿情信息,這些信息符合大數(shù)據(jù)的四個(gè)特點(diǎn):大量、高速、多樣、價(jià)值.如何準(zhǔn)確快速?gòu)暮A枯浨樾畔⒅邪l(fā)現(xiàn)熱點(diǎn)事件已經(jīng)成為科研工作的研究熱點(diǎn).對(duì)網(wǎng)絡(luò)輿情熱度目前的研究主要是基于兩個(gè)方面:一方面主要是基于數(shù)據(jù)挖掘技術(shù),主要采用的是聚類算法[1~5],另一方面主要是基于內(nèi)容的輿情熱度分析方法[6],通過對(duì)網(wǎng)絡(luò)內(nèi)容[7]、網(wǎng)絡(luò)結(jié)構(gòu)及網(wǎng)絡(luò)應(yīng)用[8~11]、網(wǎng)絡(luò)技術(shù)監(jiān)控和模型計(jì)算[12~15]的分析來獲取輿情信息,進(jìn)而推到輿情熱度變化趨勢(shì).

以上研究主要集中在網(wǎng)絡(luò)輿情熱點(diǎn)事件的發(fā)現(xiàn),取得了比較好的效果.但是在大數(shù)據(jù)背景下,每天產(chǎn)生的熱點(diǎn)新聞數(shù)量比較多的,不同媒體網(wǎng)站對(duì)熱點(diǎn)新聞的排序也是不一樣,主要在于針對(duì)熱點(diǎn)事件的因素考慮得不夠全面.如何全面考慮和熱點(diǎn)事件相關(guān)的因素比如新聞數(shù)量、新聞點(diǎn)擊率、網(wǎng)友評(píng)論等指標(biāo)在目前的研究中還比較有限.本文提出基于時(shí)間序列的熱度排序模型,綜合考慮和熱點(diǎn)事件相關(guān)因素,全面客觀的分析影響熱點(diǎn)事件的因素,找出相關(guān)熱點(diǎn)事件,有利于政府及時(shí)調(diào)控輿論走向,使輿論朝健康正確的方向發(fā)展將有一定的現(xiàn)實(shí)意義.

2 基于時(shí)間序列的排序數(shù)學(xué)模型

根據(jù)上述存在的問題,提出一個(gè)基于時(shí)間序列的熱點(diǎn)事件排序數(shù)學(xué)模型,主要指標(biāo)包括:新聞瀏覽數(shù)量L、新聞回復(fù)數(shù)量R、新聞發(fā)布數(shù)量S、參與發(fā)布媒體數(shù)量M、新聞分享數(shù)P,這些客觀指標(biāo)數(shù)據(jù)的獲取可以根據(jù)新聞采集軟件獲取.排序決策矩陣A如公式(1)所示,n代表排序的事件數(shù).

(1)

各項(xiàng)指標(biāo)的具體計(jì)算如下:假設(shè)按照時(shí)間間隔t進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)的網(wǎng)站媒體數(shù)量為n,需要統(tǒng)計(jì)的時(shí)間為k個(gè)間隔t.

以上基于時(shí)間序列模型可以根據(jù)用戶要求指定任意時(shí)間間隔進(jìn)行統(tǒng)計(jì)(可以是1天或者n天),統(tǒng)計(jì)覆蓋范圍可以是整個(gè)網(wǎng)絡(luò),也可以是單一網(wǎng)站(n=1),該模型具有較廣泛的適用性,統(tǒng)計(jì)指標(biāo)也比較全面.

3 指標(biāo)權(quán)重的確定

基于時(shí)間序列的熱點(diǎn)事件排序數(shù)學(xué)模型的指標(biāo)有5個(gè),每個(gè)指標(biāo)的屬性權(quán)重的確定對(duì)整個(gè)數(shù)學(xué)模型最終排序的結(jié)果影響非常大,為了更好確定屬性權(quán)重,本文考慮采用熵權(quán)法來確定指標(biāo)的權(quán)重,熵權(quán)法是一種根據(jù)排序數(shù)據(jù)來確定權(quán)重的客觀方法,不會(huì)受人為因素影響,比較適合本模型的計(jì)算機(jī)自動(dòng)求解.

熵權(quán)法求解排序矩陣指標(biāo)屬性客觀權(quán)重的具體步驟如下.

1)將矩陣A的指標(biāo)屬性H列歸一化得

2)計(jì)算指標(biāo)屬性熵值

4 改進(jìn)的TOPSIS方法對(duì)決策排序矩陣進(jìn)行計(jì)算

TOPSIS法是一種多屬性決策方法從幾何學(xué)的角度,從屬性的角度來評(píng)估各種選項(xiàng),類似于維空間的多點(diǎn)分析,根據(jù)點(diǎn)和理想點(diǎn)的位置來確定方案的貼近度.灰色關(guān)聯(lián)分析的對(duì)象是一種時(shí)間序列圖,和灰色關(guān)聯(lián)度為標(biāo)準(zhǔn),從直接反映幾何中曲線的相似程度的幾何,兩個(gè)時(shí)間序列曲線形狀接近,他們的灰色關(guān)聯(lián)度較大的.

灰色關(guān)聯(lián)法是從序列點(diǎn)的形狀相似性反映了方案與理想方案的接近程度,TOPSIS法從空間點(diǎn)的位置上的距離來反映方案與理想方案的接近程度.把TOPSIS法結(jié)合灰色關(guān)聯(lián)法形成一種新的方法GR-TOPSIS,綜合考慮了決策方案位置的接近和形狀相似,充分利用兩種方法的優(yōu)點(diǎn),該方法能夠更好的解決排序方案的優(yōu)劣.

具體算法步驟如下.

1)對(duì)原始決策矩陣X=(xij)m×n規(guī)范化處理

得到規(guī)范化矩陣:Y=(yij)m×n

2)計(jì)算加權(quán)規(guī)范化決策矩陣Z=(zij)m×n,其中zij=ωjyij.

3)確定加權(quán)規(guī)范化矩陣的正理想解Z+和負(fù)理想解Z-

4)計(jì)算各方案到正負(fù)理想解的距離

5)計(jì)算各個(gè)方案和正負(fù)理想解之間的灰色關(guān)聯(lián)系數(shù)矩陣R+和R-

ε∈(0,1)為分辨系數(shù),一般取值0.5.

6)具有同正負(fù)理想解的灰色關(guān)聯(lián)度r+和r-的計(jì)算公式;

8)計(jì)算各方案的相對(duì)貼近度

5 實(shí)驗(yàn)案例分析

考慮到實(shí)驗(yàn)數(shù)據(jù)采集的復(fù)雜度,本文采用網(wǎng)絡(luò)礦工對(duì)新浪、網(wǎng)易、搜狐三個(gè)網(wǎng)站媒體進(jìn)行采集,時(shí)間為2016年3月10日,采集的時(shí)間周期為一周,即k=1,t=7 d,采集新聞數(shù)量為熱點(diǎn)前10相關(guān)新聞,經(jīng)過整理并根據(jù)本文5個(gè)指標(biāo)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)得出10個(gè)網(wǎng)絡(luò)熱點(diǎn)事件,具體如表1.

表1 3~10日網(wǎng)絡(luò)熱點(diǎn)事件列表

根據(jù)表1統(tǒng)計(jì)的數(shù)據(jù)可以得到排序決策矩陣A1.

表2 不同方法的排序結(jié)果

三種方法最終都能得到自己的排序方案,但是灰度關(guān)聯(lián)的方法和TOPSIS的方法在結(jié)果上存在較大的不同,主要原因是兩種方法在排序時(shí)考慮的因素不一樣,灰色關(guān)聯(lián)法主要是考慮了序列點(diǎn)的形狀相似性,TOPSIS法考慮了空間點(diǎn)的位置上的距離,GR-TOPSIS方法結(jié)合了兩者的優(yōu)點(diǎn)能夠更好和準(zhǔn)確地得到較好的排序方案.比如E1事件江西35歲女縣長(zhǎng)直升副廳級(jí)領(lǐng)導(dǎo)事件是目前網(wǎng)絡(luò)最為熱點(diǎn)的輿情事件,但是如果使用灰度關(guān)聯(lián)方法就無法表現(xiàn)出來該事件的熱度,比如E3原鐵道部副部長(zhǎng)炮轟發(fā)改委事件和E6深圳一小區(qū)市值抵中國(guó)第五大機(jī)場(chǎng),E5延遲退休方案今年推出和E9購(gòu)房首付貸違法,TOPSIS方法和灰度關(guān)聯(lián)方法存在較大不同,采用GR-TOPSIS方法可以綜合考慮兩種方法,更好表示排序方案的客觀性和準(zhǔn)確性.

6 結(jié)論

在大數(shù)據(jù)背景下,每天都能產(chǎn)生海量的網(wǎng)絡(luò)輿情事件,本文對(duì)網(wǎng)絡(luò)輿情事件的熱度排序方法進(jìn)行了有效的探討,基于時(shí)間序列綜合考慮網(wǎng)絡(luò)新聞的5個(gè)指標(biāo),更客觀的反應(yīng)網(wǎng)絡(luò)輿情事件熱度的全面性.該熱點(diǎn)事件發(fā)現(xiàn)模型有利于政府相關(guān)管理部門及時(shí)發(fā)現(xiàn)輿情的相關(guān)熱點(diǎn)信息,對(duì)不良輿情信息進(jìn)行有效監(jiān)控,維護(hù)廣大網(wǎng)民的權(quán)益,保護(hù)社會(huì)的穩(wěn)定.

[1] 馬雯雯,魏文晗,鄧一貴.基于隱含語義分析的微博話題發(fā)現(xiàn)方法[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(1):96-100.

[2] 王 巍,楊 武,齊海鳳.基于多中心模型的網(wǎng)絡(luò)熱點(diǎn)話題發(fā)現(xiàn)算法[J].南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,33(4):422-426

[3] 王 林,戴冠中.基于復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的論壇熱點(diǎn)主題發(fā)現(xiàn)[J].計(jì)算機(jī)工程,2008,34(11):214-216

[4] 張壽華,叢 帥,尚開雨,等.網(wǎng)絡(luò)輿情追蹤中熱點(diǎn)關(guān)鍵詞的提取[J].河北大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,32(3):311-315

[5] 陳 翰,韓永峰,李弼程.基于突發(fā)事件熱度的站點(diǎn)地圖構(gòu)建算法[J].計(jì)算機(jī)應(yīng)用研究,2012,29(8):2943-2947

[6] 楊 震,段立娟,賴英旭.基于字符串相似性聚類的網(wǎng)絡(luò)短文本輿情熱點(diǎn)發(fā)現(xiàn)技術(shù)[J].北京工業(yè)大學(xué)學(xué)報(bào),2010,36(5):669-673

[7] 劉星星,何婷婷,龔海軍,等.網(wǎng)絡(luò)熱點(diǎn)事件發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)[J].中文信息學(xué)報(bào),2008,22(6):80-85

[8] 閆力君,趙玉芳.極小化加權(quán)總完工時(shí)間的可拒絕單機(jī)排序問題[J].沈陽師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,33(1):33-37

[9] 謝曉娟,石新宇.網(wǎng)絡(luò)輿情與網(wǎng)絡(luò)話語權(quán)[J]. 沈陽師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2014,31(4):10-12

[10] 曹依霏,孟 韜.虛擬社區(qū)網(wǎng)絡(luò)傳播機(jī)制分析[J]. 沈陽師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2014,31(5):168-170

[11] ZHAO J C,GUO J X.The research of network public opinion hotspots technologies for internet web[J].Applied Mechanics and Materials,2013,24(1):2500-2503

[12] XUREN W,BEI S,SHUO Y.Research of Internet public opinion based on data mining[C]//Proceedings of 2011 International Conference on Computer Science and Network Technology,2011,4(2):2414-2418

[13] ZHANG S,SHANG K,Cong S,etal.WIPOMTS:An internet public opinion monitoring system[C]//Information Computing and Applications.Springer Berlin Heidelberg,2012,5(2):1-8

[14] WANG Y M,LUO Y,Zhongsheng Hua,On the extent analysis method for fuzzy AHP and its applications[J].European Journal of Operational Research,2008,186(2):735-747

[15] Ying-Ming WANG,Kwai-Sang CHIN.Fuzzy analytic hierarchy process:A logarithmic fuzzy preference programming methodology[J].International Journal of Approximate Reasoning,2011,52(4):541-553

Sort Model about Hotspots Public Opinion Event Based on Time-series in the Context of Large Data

LIN Lina1, WEI Dezhi1,2

(1.Jimei University, Chengyi College, Xiamen 361021;2.School of Economics and Management, Fuzhou University, Fuzhou 350108, China)

A lot of public opinion information were produced on the Internet every day in the context of big date. How to find a hot spot in time from a lot of public opinion information is in order to monitor the development trend of the relevant hot events,and it is in order to reduce the adverse effects of public opinion information about society. It can also help to protect the rights and interests of the Internet users, and promote the stability of social. According to the the some problems of the models which were found the hotspot events of the public opinion, a sort model based on time serial was proposed to solve the sort of hotspots public opinion event. Firstly, the weight of indicators was determined by the combination of entropy method and fuzzy AHP. Then, a method was proposed by the combination of TOPSIS method and gray correlation method in the form of relative nearness to determine the merits of the program. Finally, with the experimental verification, the method has better objectivity and accuracy by the comparison of TOPSIS method and gray correlation method.

internet public opinion;time series;sort model;big data

2016-08-17

國(guó)家自然科學(xué)基金(71271056);福建省教育廳項(xiàng)目資助的課題(C13001,JA14368).

林麗娜(1984-),女,福建莆田人,碩士,集美大學(xué)講師,主要從事網(wǎng)絡(luò)安全、網(wǎng)絡(luò)輿情研究.

1672-2027(2016)03-0052-05

G354;TP393

A

猜你喜歡
熱點(diǎn)排序輿情
熱點(diǎn)
排序不等式
恐怖排序
熱點(diǎn)
車迷(2019年10期)2019-06-24 05:43:28
節(jié)日排序
結(jié)合熱點(diǎn)做演講
快樂語文(2018年7期)2018-05-25 02:32:00
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
輿情
輿情
輿情
西畴县| 铁岭县| 汝城县| 镇平县| 磴口县| 高雄县| 嘉鱼县| 营口市| 平舆县| 高碑店市| 山丹县| 义乌市| 若羌县| 宜昌市| 神农架林区| 朔州市| 桐城市| 大渡口区| 和龙市| 内乡县| 天台县| 宜兴市| 达拉特旗| 房山区| 集安市| 镇宁| 大冶市| 黑龙江省| 稷山县| 沙雅县| 潞西市| 五莲县| 财经| 上饶县| 丰镇市| 南充市| 武宁县| 资阳市| 西充县| 华阴市| 内江市|