国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于復(fù)雜網(wǎng)絡(luò)構(gòu)建面向主題的在線評(píng)論挖掘模型

2015-10-28 03:17:30何有世等
軟科學(xué) 2015年10期
關(guān)鍵詞:在線評(píng)論復(fù)雜網(wǎng)絡(luò)

何有世等

摘要:以在線評(píng)論內(nèi)容為節(jié)點(diǎn),內(nèi)容間的語(yǔ)義相似度為鏈接的權(quán)重,結(jié)合復(fù)雜網(wǎng)絡(luò)思想,構(gòu)建在線評(píng)論網(wǎng)絡(luò),該網(wǎng)絡(luò)的可行性也通過(guò)網(wǎng)絡(luò)的全局統(tǒng)計(jì)數(shù)據(jù)得到了論證。在評(píng)論網(wǎng)絡(luò)的“社區(qū)結(jié)構(gòu)特性”的基礎(chǔ)上劃分面向主題的網(wǎng)絡(luò)社區(qū);基于傳統(tǒng)復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)價(jià)方法的同時(shí),結(jié)合社區(qū)屬性,構(gòu)建重要評(píng)論的多屬性決策方法。并通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了該模型在全局以及局部網(wǎng)絡(luò)的可行性與準(zhǔn)確性。

關(guān)鍵詞:在線評(píng)論;復(fù)雜網(wǎng)絡(luò);網(wǎng)絡(luò)社區(qū);語(yǔ)義相似度

DOI:10.13956/j.ss.1001-8409.2015.10.25

中圖分類號(hào):F713;TP311文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1001-8409(2015)10-0115-05

Abstract:Based on complex network theory, this paper constructed online reviews network through regarding reviews content as the network nodes and the semantic similarity between reviews as the weights of link. The feasibility of network was demonstrated by the analysis of the global statistics. This paper demonstrated the rationality of the network through the analysis of the global statistics of reviews network. And it divided the reviews network community of subjectoriented according to the “community structure features” of reviews network. Based on the traditional node importance evaluation methods of complex network in combination with community attribute, it built a multipleattribute decisionmaking method of important reviews. And through the simulation experiments, it verified the feasibility and accuracy of the model.

Key words:online reviews; complex networks; network community; semantic similarity

據(jù)CNNIC關(guān)于網(wǎng)絡(luò)購(gòu)物中消費(fèi)者的相關(guān)行為研究發(fā)現(xiàn),43%的消費(fèi)者將在線評(píng)論作為網(wǎng)絡(luò)購(gòu)買決策的重要依據(jù)[1]。而且在線評(píng)論也可以作為反饋信息,幫助生產(chǎn)商和網(wǎng)絡(luò)銷售商改進(jìn)產(chǎn)品以及服務(wù),從而獲得優(yōu)勢(shì)。

但是面對(duì)海量評(píng)論,消費(fèi)者無(wú)法快速辨別和利用有價(jià)值的信息來(lái)作出正確的決策。因此針對(duì)在線評(píng)論挖掘的研究被學(xué)者們所關(guān)注,Popescuam等將在線評(píng)論挖掘細(xì)分為4個(gè)子任務(wù):特征抽取、觀點(diǎn)抽取、極性判斷、結(jié)果匯總[2]。而關(guān)于在線評(píng)論的有用性影響因素的研究[3],大多數(shù)基于特定的易于獲取的評(píng)論數(shù)據(jù)源,如亞馬遜商城數(shù)據(jù)[4]等。

傳統(tǒng)在線評(píng)論的有用性研究中,評(píng)論數(shù)據(jù)源獲取缺乏普遍性,并沒有充分挖掘網(wǎng)絡(luò)世界中海量的相關(guān)主題的在線評(píng)論,導(dǎo)致研究方法缺乏適用性,并且針對(duì)在線評(píng)論的有用性研究只是對(duì)評(píng)論進(jìn)行有用或無(wú)用的劃分,評(píng)論數(shù)據(jù)源并沒有實(shí)質(zhì)性的縮減,而且有用的評(píng)論間也有可能存在不同的觀點(diǎn),這時(shí)確定誰(shuí)的觀點(diǎn)更重要就尤為關(guān)鍵。本文依據(jù)相關(guān)主題在線評(píng)論在內(nèi)容上具有的“普遍聯(lián)系”、“語(yǔ)義內(nèi)聚”的特點(diǎn),將在線評(píng)論數(shù)據(jù)源看做以特定方式相聯(lián)系的一種網(wǎng)絡(luò)拓?fù)湫螒B(tài),并引入復(fù)雜網(wǎng)絡(luò)思想[5],將在線評(píng)論中的每條評(píng)論設(shè)定為復(fù)雜網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),利用評(píng)論節(jié)點(diǎn)間的語(yǔ)義相似度確定節(jié)點(diǎn)的鏈接關(guān)系,構(gòu)建基于復(fù)雜網(wǎng)絡(luò)的評(píng)論網(wǎng)絡(luò)模型。

1在線評(píng)論網(wǎng)絡(luò)模型分析

面對(duì)海量的在線評(píng)論,幫助消費(fèi)者快速識(shí)別評(píng)論內(nèi)容的重要性是評(píng)論網(wǎng)絡(luò)模型的關(guān)鍵功能,而若要從海量、存在大量噪聲的評(píng)論數(shù)據(jù)中提取出合適的數(shù)據(jù)源,不能單獨(dú)以評(píng)論文本內(nèi)容的長(zhǎng)度以及深度作為判斷標(biāo)準(zhǔn)。就評(píng)論節(jié)點(diǎn)個(gè)體而言,節(jié)點(diǎn)的內(nèi)容是隨機(jī)的,但評(píng)論節(jié)點(diǎn)組成的網(wǎng)絡(luò)呈現(xiàn)出的“語(yǔ)義內(nèi)聚”與“普遍聯(lián)系”的特點(diǎn)恰好與復(fù)雜網(wǎng)絡(luò)的“無(wú)標(biāo)度特性”、“小世界效應(yīng)”以及“社區(qū)結(jié)構(gòu)特性”相吻合。所以不能片面看待評(píng)論節(jié)點(diǎn)的內(nèi)容質(zhì)量,而要結(jié)合節(jié)點(diǎn)內(nèi)容之間的語(yǔ)義關(guān)聯(lián),從宏觀層面上識(shí)別對(duì)消費(fèi)者指定主題具有重要影響的評(píng)論[6]。本文以網(wǎng)絡(luò)化的視角來(lái)刻畫在線評(píng)論之間的關(guān)聯(lián),并提出基于復(fù)雜網(wǎng)絡(luò)融合產(chǎn)品主題的重要在線評(píng)論挖掘方法,主要包括以下兩個(gè)模塊。

(1)構(gòu)建評(píng)論節(jié)點(diǎn)的復(fù)雜網(wǎng)絡(luò)

將評(píng)論以網(wǎng)絡(luò)的形式進(jìn)行表示,評(píng)論間的語(yǔ)義關(guān)聯(lián)轉(zhuǎn)化為鏈接的關(guān)系,可以將原本無(wú)序的評(píng)論以清晰的網(wǎng)絡(luò)結(jié)構(gòu)整合起來(lái),利于探索評(píng)論節(jié)點(diǎn)間的相互作用。評(píng)論網(wǎng)絡(luò)與傳統(tǒng)的社會(huì)網(wǎng)絡(luò)具有相似性,構(gòu)建評(píng)論網(wǎng)絡(luò)需要明確網(wǎng)絡(luò)中的兩個(gè)要素,節(jié)點(diǎn)以及節(jié)點(diǎn)間的鏈接,節(jié)點(diǎn)間的鏈接關(guān)系必須是基于節(jié)點(diǎn)中某種可度量的屬性來(lái)確定的。

(2)面向主題的評(píng)論網(wǎng)絡(luò)社區(qū)劃分

評(píng)論網(wǎng)絡(luò)中的“社區(qū)結(jié)構(gòu)特性”是由于同一產(chǎn)品或相似產(chǎn)品主題的評(píng)論節(jié)點(diǎn)在語(yǔ)義上具有相似性,使得評(píng)論網(wǎng)絡(luò)依據(jù)產(chǎn)品主題呈現(xiàn)社區(qū)結(jié)構(gòu),評(píng)論社區(qū)的劃分可以快速定位消費(fèi)者指定的主題。在面向主題的社區(qū)基礎(chǔ)上,基于多屬性決策提取相關(guān)主題的重要評(píng)論[7]。

2構(gòu)建評(píng)論網(wǎng)絡(luò)

一個(gè)完整的網(wǎng)絡(luò)是節(jié)點(diǎn)以及節(jié)點(diǎn)間鏈接的集合體,參照一般社會(huì)網(wǎng)絡(luò)的構(gòu)建方法,本文以每條評(píng)論的文本內(nèi)容為節(jié)點(diǎn)信息,評(píng)論間的語(yǔ)義關(guān)聯(lián)為鏈接,構(gòu)建評(píng)論網(wǎng)絡(luò)G=(V,E), V={v1,v2,…,vn}是評(píng)論網(wǎng)絡(luò)中的n個(gè)節(jié)點(diǎn),即n條在線評(píng)論集合,E是vi與vj組成的邊的集合,而邊(vi,vj)依據(jù)節(jié)點(diǎn)之間的相似性wij確定,設(shè)定閥值μ,若wij≥μ,則節(jié)點(diǎn)vi、vj間存在鏈接。

21節(jié)點(diǎn)表示以及鏈路預(yù)測(cè)

評(píng)論網(wǎng)絡(luò)中的節(jié)點(diǎn)以單條在線評(píng)論為主體,并將評(píng)論的文本內(nèi)容以向量空間模型(VSM)的形式表示,考慮到節(jié)點(diǎn)的社區(qū)歸屬問題,節(jié)點(diǎn)的信息還包括社區(qū)標(biāo)號(hào),節(jié)點(diǎn)v的信息在網(wǎng)絡(luò)中表示成v={(v1,v2,…,vm),m}。

網(wǎng)絡(luò)中的鏈路預(yù)測(cè)是指通過(guò)已知的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)或節(jié)點(diǎn)屬性等信息預(yù)測(cè)網(wǎng)絡(luò)中兩個(gè)節(jié)點(diǎn)之間存在鏈接的可能性。本文構(gòu)建的評(píng)論網(wǎng)絡(luò),不同于人際網(wǎng)絡(luò)、生物網(wǎng)絡(luò)等,鏈路預(yù)測(cè)之前并不存在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),因此利用節(jié)點(diǎn)的語(yǔ)義信息預(yù)測(cè)網(wǎng)絡(luò)中的鏈路。

在構(gòu)建評(píng)論網(wǎng)絡(luò)的過(guò)程中,采用TF.IDF的方法計(jì)算評(píng)論節(jié)點(diǎn)間的語(yǔ)義相似度,設(shè)節(jié)點(diǎn)u和v的文檔向量形式是U=u1,u2,...,um,V=v1,v2,...,vm,其中,ui和vi分別表示特征詞i在各自評(píng)論中的指標(biāo)值,通過(guò)TF.IDF計(jì)算[8]:

w(u,v)=U·VU×V=∑mi=1uivi∑mi=1u2i∑mi=1v2i(1)

并用w(u,v)表示邊(u,v)的權(quán)重,若w(u,v)≥μ,則節(jié)點(diǎn)u、v間存在鏈接。

在利用節(jié)點(diǎn)間的語(yǔ)義相似度進(jìn)行鏈路預(yù)測(cè)的同時(shí),通過(guò)實(shí)驗(yàn)結(jié)果分析得到同一網(wǎng)頁(yè)中的評(píng)論絕大多數(shù)描述的是同一個(gè)主題,但可能存在評(píng)論觀點(diǎn)相對(duì),導(dǎo)致網(wǎng)頁(yè)內(nèi)評(píng)論間的語(yǔ)義相似度較低,使得網(wǎng)頁(yè)內(nèi)的鏈路較少,因此本文初始化評(píng)論網(wǎng)絡(luò)中網(wǎng)頁(yè)內(nèi)的節(jié)點(diǎn)間存在鏈接。

22閥值μ的確定

本文通過(guò)百度搜索引擎獲取實(shí)驗(yàn)數(shù)據(jù),并以手機(jī)、筆記本以及相機(jī)3種產(chǎn)品作為研究對(duì)象,進(jìn)行實(shí)驗(yàn)數(shù)據(jù)的采集,并以各采集到1000個(gè)網(wǎng)頁(yè)為采集器停止條件,對(duì)采集的網(wǎng)頁(yè)進(jìn)行清洗,提取產(chǎn)品評(píng)論數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)集如表1所示。

通過(guò)實(shí)驗(yàn)數(shù)據(jù)集構(gòu)建評(píng)論網(wǎng)絡(luò),并初始化網(wǎng)頁(yè)內(nèi)的節(jié)點(diǎn)間存在鏈接。運(yùn)用半正態(tài)概率圖法對(duì)評(píng)論節(jié)點(diǎn)間語(yǔ)義相似度數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn),結(jié)果顯示它們近似服從半正態(tài)分布,如圖1所示。

在初始化的評(píng)論網(wǎng)絡(luò)中,網(wǎng)頁(yè)內(nèi)的節(jié)點(diǎn)間存在鏈接,網(wǎng)頁(yè)間的節(jié)點(diǎn)間沒有鏈接,隨著閾值μ的增大,網(wǎng)頁(yè)內(nèi)節(jié)點(diǎn)間的鏈接減少的比例不斷增加,而網(wǎng)頁(yè)間節(jié)點(diǎn)間的鏈接增加的比例不斷減少,如圖2所示。

由圖2發(fā)現(xiàn),在半正態(tài)分布的4σ點(diǎn)評(píng)論網(wǎng)絡(luò)鏈接數(shù)量保持穩(wěn)定,說(shuō)明這時(shí)網(wǎng)絡(luò)魯棒性最強(qiáng),本文設(shè)定節(jié)點(diǎn)間語(yǔ)義相似度的閾值μ=4σ,并且在4σ點(diǎn)網(wǎng)頁(yè)內(nèi)節(jié)點(diǎn)間的鏈接比例占80%左右,網(wǎng)頁(yè)間節(jié)點(diǎn)間的鏈接比例只占20%左右,符合帕累托法則。評(píng)論網(wǎng)絡(luò)的閥值設(shè)定與節(jié)點(diǎn)間鏈接的關(guān)系如表2所示,從表2中的節(jié)點(diǎn)數(shù)與節(jié)點(diǎn)間鏈接的比例發(fā)現(xiàn),隨著評(píng)論節(jié)點(diǎn)數(shù)的增加,節(jié)點(diǎn)間的鏈接占整個(gè)評(píng)論網(wǎng)絡(luò)的比例逐漸減少,這是由于節(jié)點(diǎn)數(shù)增多時(shí)網(wǎng)頁(yè)間的節(jié)點(diǎn)對(duì)占整個(gè)網(wǎng)絡(luò)的比例上升,而網(wǎng)頁(yè)間的節(jié)點(diǎn)間語(yǔ)義相似度相比于網(wǎng)頁(yè)內(nèi)的節(jié)點(diǎn)間語(yǔ)義相似度而言相對(duì)較小。

23評(píng)論網(wǎng)絡(luò)的全局統(tǒng)計(jì)數(shù)據(jù)分析

通過(guò)節(jié)點(diǎn)間的語(yǔ)義相似度與閥值μ的比較,去除網(wǎng)頁(yè)內(nèi)節(jié)點(diǎn)間語(yǔ)義相似度wij<μ的鏈接,添加網(wǎng)頁(yè)間節(jié)點(diǎn)間語(yǔ)義相似度wij≥μ的鏈接,形成評(píng)論網(wǎng)絡(luò),對(duì)構(gòu)建的評(píng)論網(wǎng)絡(luò)使用可視化網(wǎng)絡(luò)分析軟件pajek,通過(guò)分析評(píng)論網(wǎng)絡(luò)的度分布[9]、平均路徑長(zhǎng)度[10]和聚集系數(shù)3個(gè)指標(biāo)與隨機(jī)網(wǎng)絡(luò)的關(guān)系,以確定本文構(gòu)建的評(píng)論網(wǎng)絡(luò)符合復(fù)雜網(wǎng)絡(luò)的特性。全局統(tǒng)計(jì)數(shù)據(jù)如表3所示。

(1)度分布

在評(píng)論網(wǎng)絡(luò)中,度分布表示與某一評(píng)論節(jié)點(diǎn)具有鏈接的節(jié)點(diǎn)數(shù)量,實(shí)驗(yàn)中3個(gè)評(píng)論網(wǎng)絡(luò)的節(jié)點(diǎn)平均度分布分別為11、12、14,基本符合隨機(jī)網(wǎng)絡(luò)的節(jié)點(diǎn)平均度分布,而且評(píng)論網(wǎng)絡(luò)中少數(shù)評(píng)論節(jié)點(diǎn)具有較大的度分布,包含了某一主題內(nèi)的消費(fèi)者關(guān)注的大部分信息,因此,評(píng)論網(wǎng)絡(luò)的度分布基本滿足冪律分布。

(2)平均路徑長(zhǎng)度

平均路徑長(zhǎng)度是指評(píng)論網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)之間距離的平均值[6]。由上表可知3個(gè)評(píng)論網(wǎng)絡(luò)的平均路徑長(zhǎng)度與相同規(guī)模的隨機(jī)網(wǎng)絡(luò)平均路徑長(zhǎng)度基本一樣,可以認(rèn)為3個(gè)網(wǎng)絡(luò)都具有良好的連通性,基于在線評(píng)論構(gòu)建的評(píng)論網(wǎng)絡(luò)相比其他的數(shù)據(jù)源,更適合評(píng)論的挖掘。

(3)聚集系數(shù)

聚集系數(shù)反映的是相鄰節(jié)點(diǎn)之間聯(lián)系的緊密程度,具有小世界效應(yīng)的評(píng)論網(wǎng)絡(luò)的聚集系數(shù)遠(yuǎn)遠(yuǎn)大于隨機(jī)網(wǎng)絡(luò)的聚集系數(shù)[6],這是因?yàn)槊嫦騿蝹€(gè)主題的評(píng)論網(wǎng)絡(luò)中的大多數(shù)節(jié)點(diǎn)具有較高的語(yǔ)義相似度而聚集,并聚集在度大的節(jié)點(diǎn)旁,這也近一步說(shuō)明了評(píng)論網(wǎng)絡(luò)中能對(duì)消費(fèi)者購(gòu)買決策產(chǎn)生影響的節(jié)點(diǎn)是少部分重要評(píng)論節(jié)點(diǎn)。

通過(guò)分析評(píng)論網(wǎng)絡(luò)的全局統(tǒng)計(jì)數(shù)據(jù),發(fā)現(xiàn)評(píng)論網(wǎng)絡(luò)的度分布符合冪律分布,認(rèn)為評(píng)論網(wǎng)絡(luò)具有復(fù)雜網(wǎng)絡(luò)的無(wú)標(biāo)度特征,另外,較小的平均路徑長(zhǎng)度以及較高的聚集系數(shù)體現(xiàn)了評(píng)論網(wǎng)絡(luò)的小世界特征。因此,本文經(jīng)過(guò)3個(gè)在線評(píng)論數(shù)據(jù)集的實(shí)證,論證了基于復(fù)雜網(wǎng)絡(luò)理論構(gòu)建評(píng)論網(wǎng)絡(luò)的合理性。

3面向主題的評(píng)論網(wǎng)絡(luò)社區(qū)劃分

31在線評(píng)論網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)

消費(fèi)者需求的不同導(dǎo)致評(píng)論內(nèi)容的不同,不同消費(fèi)者在意的產(chǎn)品特征具有很大差異,但關(guān)注相同特征的評(píng)論發(fā)布者,所發(fā)布的評(píng)論之間又具有較強(qiáng)的語(yǔ)義相似度。在構(gòu)建的評(píng)論網(wǎng)絡(luò)中,以具有相同特征的評(píng)論節(jié)點(diǎn)為中心,形成若干規(guī)模不等的局部語(yǔ)義相似度較大的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),就是本文需要?jiǎng)澐值脑诰€評(píng)論網(wǎng)絡(luò)社區(qū)。

評(píng)論網(wǎng)絡(luò)中評(píng)論節(jié)點(diǎn)間的語(yǔ)義除了具有相似性之外,還可能存在包含關(guān)系,如評(píng)論節(jié)點(diǎn)Vi是關(guān)于筆記本整體的評(píng)論,而Vj是關(guān)于某具體品牌筆記本的評(píng)論,那么節(jié)點(diǎn)Vj從屬于Vi,評(píng)論網(wǎng)絡(luò)就具有了層次性的社區(qū)結(jié)構(gòu)特征。社區(qū)結(jié)構(gòu)的另一個(gè)特征是重疊性,指評(píng)論網(wǎng)絡(luò)中的某些節(jié)點(diǎn)同時(shí)屬于多個(gè)社區(qū),如評(píng)論節(jié)點(diǎn)Vi的語(yǔ)義中同時(shí)包括對(duì)特征A和B的描述,那么節(jié)點(diǎn)Vi就被同時(shí)劃分到社區(qū)A和B中。這樣的節(jié)點(diǎn)被稱為“騎墻節(jié)點(diǎn)”。

傳統(tǒng)的社團(tuán)結(jié)構(gòu)劃分方法都是從節(jié)點(diǎn)的角度出發(fā),把網(wǎng)絡(luò)中的節(jié)點(diǎn)看作是研究對(duì)象,根據(jù)節(jié)點(diǎn)之間的相似度,把它們劃分到不同的社區(qū),這樣的處理方法很難從根本上解決“騎墻節(jié)點(diǎn)”的歸屬問題[11]。

考慮到評(píng)論網(wǎng)絡(luò)具有的層次性以及重疊性,本文采用一種能夠同時(shí)劃分層次性與重疊性的算法[12],該算法以邊為研究對(duì)象,依據(jù)邊之間的相似度對(duì)網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,由于邊的社區(qū)歸屬性是唯一確定的,這就可以避免“騎墻節(jié)點(diǎn)”對(duì)社區(qū)劃分結(jié)果的影響。

32基于邊的社區(qū)劃分算法

該算法核心是根據(jù)邊的凝聚過(guò)程得到網(wǎng)絡(luò)的層次樹結(jié)構(gòu),對(duì)層次樹在合適位置處切割,得到社區(qū)結(jié)構(gòu)。為了完成邊的凝聚,定義相鄰邊的相似度S為:

4面向主題的在線評(píng)論挖掘

復(fù)雜網(wǎng)絡(luò)非同質(zhì)的拓?fù)浣Y(jié)構(gòu),決定了評(píng)論網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性的差異。挖掘評(píng)論網(wǎng)絡(luò)中的特定主題的在線評(píng)論社區(qū),對(duì)其中的重要性在線評(píng)論進(jìn)行深入分析,可以幫助消費(fèi)者快速做出購(gòu)買決策。目前,復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要性的評(píng)估方法分為社會(huì)網(wǎng)絡(luò)分析和系統(tǒng)科學(xué)分析兩類[13],這兩類方法各有其優(yōu)缺點(diǎn),缺點(diǎn)在于將研究視角局限在某一種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中。

41結(jié)合社區(qū)屬性的多屬性決策

評(píng)論網(wǎng)絡(luò)是一個(gè)加權(quán)網(wǎng)絡(luò),從單一的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征分析節(jié)點(diǎn)的重要性具有局限性,評(píng)論網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性與評(píng)論網(wǎng)絡(luò)的整體結(jié)構(gòu)相關(guān),需要依據(jù)不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征綜合分析。因此,本文提出了一種多屬性決策方法,綜合考慮評(píng)論網(wǎng)絡(luò)的社會(huì)網(wǎng)絡(luò)分析中的介數(shù)中心性以及系統(tǒng)科學(xué)分析中的Damage值,這些指標(biāo)綜合考慮了評(píng)論網(wǎng)絡(luò)的各項(xiàng)拓?fù)浣Y(jié)構(gòu),計(jì)算公式分別為:

為了能夠確定網(wǎng)絡(luò)社區(qū)內(nèi)節(jié)點(diǎn)的排序,對(duì)網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行編號(hào),給網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)賦予一個(gè)ID編碼,編碼形式為(n,m),n為網(wǎng)絡(luò)中節(jié)點(diǎn)的唯一標(biāo)識(shí),m為節(jié)點(diǎn)被劃分到社區(qū)的編號(hào)。結(jié)合社區(qū)屬性的節(jié)點(diǎn)1~10的多屬性決策值如表4所示。

對(duì)多屬性決策變量a的結(jié)果進(jìn)行排序,首先基于整個(gè)評(píng)論網(wǎng)絡(luò)進(jìn)行排序,排序結(jié)果為r;再基于所屬社區(qū)進(jìn)行排序,得到結(jié)果r′。

則將多屬性決策變量a表示為a=(n,m,r,r′,a),其中,n為節(jié)點(diǎn)編號(hào),m為節(jié)點(diǎn)n的所屬的社區(qū)編號(hào),r為節(jié)點(diǎn)n在整個(gè)網(wǎng)絡(luò)中的重要性排名,r′為節(jié)點(diǎn)n在社區(qū)m中的重要性排名。

5結(jié)論與展望

在線評(píng)論作為產(chǎn)品口碑傳播的一種新形式,對(duì)消費(fèi)者的決策起著重要的影響,但其中大量的良莠不齊的評(píng)論也影響了消費(fèi)者對(duì)可靠信息的獲取[2]。本文以不同于以往的重要在線評(píng)論挖掘研究的思路,構(gòu)建以評(píng)論為節(jié)點(diǎn)、節(jié)點(diǎn)間的語(yǔ)義相似度作為鏈接的復(fù)雜網(wǎng)絡(luò),將原本無(wú)序的評(píng)論以清晰的網(wǎng)絡(luò)結(jié)構(gòu)整合起來(lái)。在分析評(píng)論網(wǎng)絡(luò)的全局統(tǒng)計(jì)數(shù)據(jù)的基礎(chǔ)上,論證了基于復(fù)雜網(wǎng)絡(luò)思想構(gòu)建在線評(píng)論網(wǎng)絡(luò)的合理性。

考慮到評(píng)論網(wǎng)絡(luò)具有的層次性以及重疊性,本文采用以邊為研究對(duì)象的一種能夠同時(shí)劃分層次性與重疊性的算法,得到了評(píng)論網(wǎng)絡(luò)的層次樹狀圖,并通過(guò)分區(qū)密度D對(duì)其進(jìn)行了社區(qū)劃分。

最后通過(guò)結(jié)合社區(qū)屬性的多屬性決策方法來(lái)評(píng)估評(píng)論網(wǎng)絡(luò)中的節(jié)點(diǎn)重要性,該方法不僅具有良好的穩(wěn)定性,而且將重要在線評(píng)論的挖掘細(xì)化到產(chǎn)品主題,適合消費(fèi)者從產(chǎn)品的不同角度進(jìn)行決策。

參考文獻(xiàn):

[1]CNNIC.2009年中國(guó)網(wǎng)絡(luò)購(gòu)物市場(chǎng)研究報(bào)告[R].北京:中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心,2009.38-42.

[2]李金海,何有世.在線評(píng)論信息挖掘分析的數(shù)據(jù)來(lái)源可靠性研究[J].軟科學(xué),2015,29(4):94-99.

[3]龔艷萍,梁樹霖. 在線評(píng)論對(duì)新技術(shù)產(chǎn)品消費(fèi)者采用意愿的影響研究[J].軟科學(xué),2014,28(2):96-105.

[4]廖成林,蔡春江,李憶.電子商務(wù)中在線評(píng)論有用性影響因素實(shí)證研究[J].軟科學(xué),2013,27(5):46-50.

[5]Sun Ye, Liu Chuang, Zhang Chuxu, et al. Epidemic Spreading on Weighted Complex Networks [J]. Physics Letters A, 2014, 378(7):635-640.

[6]姜巍,張莉,戴翼,等.面向用戶需求獲取的在線評(píng)論有用性分析[J].計(jì)算機(jī)學(xué)報(bào),2013,36(1):119-131.

[7]肖忠東,羅志潔,周光輝.復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)價(jià)方法在生態(tài)工業(yè)系統(tǒng)中的應(yīng)用[J].科技進(jìn)步與對(duì)策,2014,31(5):123-126.

[8]Salton G. The SMART Retrieval System- Experiments in Automatic Document Processing [M]. Englewood Cliffs, New Jersey : Prentice Hall Inc,1971.

[9]Gabrilovich E, Markovitch S. Computing Semantic Relatedness Using Wikipedia-based Explicit Semantic Analysis[A].Proceedings of the 20th International Jonit Conference on Artificial Intelligence[C].2007.1606-1611.

[10]汪小帆,李翔,陳關(guān)榮.復(fù)雜網(wǎng)絡(luò)理論及其應(yīng)用[M].北京:清華大學(xué)出版社,2006.

[11]汪小帆,劉亞冰.復(fù)雜網(wǎng)絡(luò)中的社團(tuán)結(jié)構(gòu)算法綜述[J].電子科技大學(xué)學(xué)報(bào),2009,38(5):537-543.

[12]Ahn Y Y, Bagrow J P, Lehmann S. Communities and Hierarchical Organization of Links in Complex Networks [EB/OL]. http://www.arXiv.org, 2009-03-12.

[13]周漩,張鳳鳴,李克武等.利用重要度評(píng)價(jià)矩陣確定復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)[J].物理學(xué)報(bào),2012,61(5):1-7.

(責(zé)任編輯:楊銳)

猜你喜歡
在線評(píng)論復(fù)雜網(wǎng)絡(luò)
基于復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要性的鏈路預(yù)測(cè)算法
基于復(fù)雜網(wǎng)絡(luò)視角的海關(guān)物流監(jiān)控網(wǎng)絡(luò)風(fēng)險(xiǎn)管理探索
基于圖熵聚類的重疊社區(qū)發(fā)現(xiàn)算法
在線評(píng)論情感屬性的動(dòng)態(tài)變化
在線評(píng)論對(duì)電子商務(wù)商品銷量的影響研究
中文信息(2016年10期)2016-12-12 11:01:20
基于復(fù)雜網(wǎng)絡(luò)理論的通用機(jī)場(chǎng)保障網(wǎng)絡(luò)研究
城市群復(fù)合交通網(wǎng)絡(luò)復(fù)雜性實(shí)證研究
科技視界(2016年20期)2016-09-29 11:19:34
在線評(píng)論對(duì)消費(fèi)者購(gòu)買意圖的影響研究
商(2016年10期)2016-04-25 10:03:58
人類社會(huì)生活空間圖式演化分析
商情(2016年11期)2016-04-15 22:00:31
在線評(píng)論與消費(fèi)者行為的研究進(jìn)展與趨勢(shì)展望
軟科學(xué)(2015年6期)2015-07-10 02:32:49
宁阳县| 师宗县| 阳新县| 巴南区| 海南省| 遂川县| 盱眙县| 台中市| 云阳县| 科尔| 会东县| 远安县| 米林县| 如皋市| 庆城县| 奉化市| 松阳县| 北流市| 九龙城区| 晋中市| 呼和浩特市| 华阴市| 敦煌市| 东兰县| 龙南县| 任丘市| 江安县| 黄梅县| 绍兴市| 论坛| 长葛市| 沛县| 罗平县| 北宁市| 北京市| 永康市| 彭州市| 大厂| 晋中市| 岳西县| 喀喇沁旗|