国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

產(chǎn)品在線評(píng)論活躍狀態(tài)演變模式分析

2018-01-15 22:49施慧斌李紅苗蕊姚忠
廣義虛擬經(jīng)濟(jì)研究 2017年3期
關(guān)鍵詞:在線評(píng)論

施慧斌+李紅+苗蕊+姚忠

摘 要:本文建立了產(chǎn)品Web信息活躍狀態(tài)演化模式。利用隱馬爾可夫模型對(duì)產(chǎn)品Web信息活躍狀態(tài)進(jìn)行建模,分析產(chǎn)品Web信息隨時(shí)間變化的趨勢(shì),最后采用時(shí)間序列聚類算法對(duì)不同產(chǎn)品對(duì)應(yīng)的Web信息進(jìn)行聚類,得到產(chǎn)品Web信息活躍狀態(tài)演變的模式,為廠商和賣家做出科學(xué)的營(yíng)銷,提供一定的幫助。

關(guān)鍵詞:在線評(píng)論; 活躍狀態(tài); 廣義虛擬經(jīng)濟(jì); 演化模式

中圖分類號(hào):F273 文獻(xiàn)標(biāo)識(shí):A 文章編號(hào):1674-9448 (2017) 03-0032-07

The Analysis of the Evolution Patterns of Product Online Review Activeness

SHI Hui-bin LI Hong MIAO Rui YAO Zhong

(1.School of Economics and Management, Beihang University, Beijing 100191, China; 2.School of Management, Shenyang University of Technology, Shenyang 110870, China ; 3. School of Management Science and Engineering, Dongbei University of Finance and Economics, Dalian 116025, China)

Abstract: This paper proposes the evolution patterns of product online review activeness. This paper builds the model of product online review activeness using HMM model. And then analyzes the product online review change trends over time. Finally, chooses time series clustering algorithm to cluster the online reviews of the different products, and gets the product online review activeness evolution patterns. This can help the manufacturers and sellers to make more effective decision of marketing.

Key words: online review, activeness, the generalized virtual economy, evolution pattern

一、引言

廣義虛擬經(jīng)濟(jì)學(xué)理論已經(jīng)在多個(gè)領(lǐng)域得到應(yīng)用[1-5]。產(chǎn)品在線評(píng)論在一定程度上,可以顯示出消費(fèi)者對(duì)該產(chǎn)品的消費(fèi)熱情,通常會(huì)隨著時(shí)間的流逝而發(fā)生變化,所以產(chǎn)品在線評(píng)論的活躍程度正是消費(fèi)者(主體)和產(chǎn)品(客體)、產(chǎn)品(物質(zhì)態(tài))和產(chǎn)品在線評(píng)論(信息態(tài))之間的相互作用所產(chǎn)生的二元價(jià)值容介態(tài)的體現(xiàn)[6,7]。因此,產(chǎn)品在線評(píng)論的活躍度及其演化趨勢(shì),是產(chǎn)品競(jìng)爭(zhēng)力和受關(guān)注程度的現(xiàn)在及未來(lái)狀況的直接體現(xiàn)。

如果將一段時(shí)間內(nèi)的產(chǎn)品在線評(píng)論在固定時(shí)間間隔內(nèi)處于的活躍狀態(tài),可以發(fā)現(xiàn),不同產(chǎn)品在線評(píng)論對(duì)應(yīng)圖形的形狀是有區(qū)別的,但從圖形的走勢(shì)上看,可以歸類成幾種模式。對(duì)產(chǎn)品在線評(píng)論活躍狀態(tài)演化模式的分析,可以找出產(chǎn)品所處的生命周期階段,從而幫助廠商和賣家做出更為科學(xué)合理的營(yíng)銷決策。

本文利用隱馬爾可夫模型,對(duì)產(chǎn)品在線評(píng)論活躍狀態(tài)演變進(jìn)行建模分析,發(fā)現(xiàn)產(chǎn)品在線評(píng)論的時(shí)間變化趨勢(shì),最后采用時(shí)間序列聚類算法對(duì)不同產(chǎn)品對(duì)應(yīng)的在線評(píng)論進(jìn)行聚類,得到產(chǎn)品在線評(píng)論活躍狀態(tài)演變的模式,并進(jìn)行了分析。

二、基于隱馬爾可夫模型的產(chǎn)品在線評(píng)論活躍狀態(tài)演化建模

隱馬爾可夫模型(Hidden Markov Model, HMM)最初是在20世紀(jì)60年代后半期Leonard E. Baum和其他一些作者在一系列的統(tǒng)計(jì)學(xué)論文中提出的[8]。HMM最初的應(yīng)用之一是開始于20世紀(jì)70年代中期的語(yǔ)音識(shí)別,隨后又廣泛應(yīng)用于生物序列、故障診斷和信息提取等領(lǐng)域[9-13]。

在某一時(shí)間段內(nèi),產(chǎn)品在線評(píng)論數(shù)據(jù)數(shù)量對(duì)應(yīng)著產(chǎn)品在線評(píng)論的活躍狀態(tài)(activeness)。如果這段時(shí)間內(nèi),產(chǎn)品在線評(píng)論數(shù)據(jù)數(shù)量呈現(xiàn)快速增長(zhǎng)的趨勢(shì),則產(chǎn)品在線評(píng)論所處活躍狀態(tài)的活躍度比較高。本文采用基于隱馬爾可夫模型的建模方法對(duì)產(chǎn)品在線評(píng)論活躍狀態(tài)進(jìn)行建模,產(chǎn)品在線評(píng)論的活躍度建模就相當(dāng)于建立相應(yīng)的隱馬爾可夫模型并求解隱馬爾可夫模型的第二類問(wèn)題,即解碼問(wèn)題。

(一) 模型構(gòu)建

本文提出的模型構(gòu)建過(guò)程分如下4個(gè)步驟:

(4) 狀態(tài)轉(zhuǎn)移概率矩陣A和初始狀態(tài)概率分布向量π是未知的,在給定觀察值序列的前提下,可通過(guò)求解隱馬爾可夫模型的第三類問(wèn)題(即學(xué)習(xí)問(wèn)題)來(lái)獲得。本文采用Baum-Welch算法求出A和 π,使得p(O|A,λ)最大。

(二) 狀態(tài)序列的計(jì)算

根據(jù)前文提出的方法,可以計(jì)算出參數(shù)A,B和 的值。在給定觀察值序列O和模型λ=(A,B,π)的條件下,使用Viterbi算法求解狀態(tài)序列q=(q1,q2,…,qr),使得該序列能夠最為合理的解釋觀察值序列。其中qt 表示在第t周該產(chǎn)品對(duì)應(yīng)的在線評(píng)論所處的活躍性狀態(tài)。endprint

三、產(chǎn)品在線評(píng)論活躍狀態(tài)的演化模式分析

活躍狀態(tài)的演化模式并不是單一固定的,不同產(chǎn)品的在線評(píng)論活躍狀態(tài)演化可能存在不同的模式[14],如果將一段時(shí)間內(nèi)的產(chǎn)品在線評(píng)論在固定時(shí)間間隔內(nèi)處于的活躍狀態(tài),按照時(shí)間序列順序繪制圖形,可以很直觀的發(fā)現(xiàn),不同產(chǎn)品在線評(píng)論對(duì)應(yīng)圖形的形狀是有區(qū)別的,但從圖形的走勢(shì)上看,可以歸類成幾種模式。對(duì)產(chǎn)品在線評(píng)論活躍狀態(tài)演化模式的分析,可以找出產(chǎn)品所處的生命周期階段,從而幫助廠商和賣家做出更為科學(xué)合理的營(yíng)銷決策。Chen[15]和Parikh[16]都使用了隱馬爾可夫模型對(duì)在線評(píng)論進(jìn)行了活躍度建模,但是他們分別采用動(dòng)態(tài)時(shí)間扭曲距離和小波變換兩種時(shí)間序列聚類算法對(duì)在線評(píng)論活躍度的演化模式進(jìn)行了研究,但是研究中,并沒有利用到隱馬爾可夫模型所得的結(jié)果。本文選用文獻(xiàn)[17]中提出的基于隱馬爾可夫模型的時(shí)間序列聚類算法對(duì)不同產(chǎn)品對(duì)應(yīng)的在線評(píng)論活躍狀態(tài)序列進(jìn)行聚類,識(shí)別出不同的產(chǎn)品在線評(píng)論活躍狀態(tài)演化模式。

設(shè){O0,O1,…,OP}是需要聚類的產(chǎn)品在線評(píng)論活躍狀態(tài)時(shí)間序列的集合,Oi 表示第i個(gè)產(chǎn)品對(duì)應(yīng)的在線評(píng)論數(shù)量所構(gòu)成的時(shí)間序列,λi 表示通過(guò)序列Oi 訓(xùn)練學(xué)習(xí)得到的隱馬爾可夫模型。每一個(gè)序列Oi 可表示為一個(gè)P維向量D(Oi) 的形式:

其中,Ti 表示Oi 的長(zhǎng)度,p(Oi |λp)可通過(guò)求解隱馬爾可夫模型第一類問(wèn)題(評(píng)估問(wèn)題)來(lái)得到。

通過(guò)向量D(Oi) ,將序列Oi 映射為P維歐式空間中的一個(gè)點(diǎn),然后就可以選用適用于P維歐式空間中的點(diǎn)的聚類算法,包括k-means聚類、層次聚類等方法。根據(jù)聚類的結(jié)果,可以得到不同產(chǎn)品對(duì)應(yīng)的在線評(píng)論的活躍狀態(tài)演化模式。

四、實(shí)驗(yàn)與分析

(一) 數(shù)據(jù)收集

本文從卓越亞馬遜網(wǎng)站(http://www.amazon. cn)上收集了30個(gè)正在銷售的產(chǎn)品的在線評(píng)論信息,這些產(chǎn)品包括圖書、化妝品、電子產(chǎn)品和日常用品等類型的產(chǎn)品。產(chǎn)品開始出售的時(shí)間各不相同,評(píng)論的數(shù)量也相差很大[18]。本文首先對(duì)這30種產(chǎn)品的在線評(píng)論信息的活躍狀態(tài)進(jìn)行建模,并針對(duì)活躍狀態(tài)變化情況,提出相應(yīng)的營(yíng)銷策略,最后對(duì)這30種產(chǎn)品的在線評(píng)論信息的時(shí)間序列進(jìn)行聚類,識(shí)別出產(chǎn)品在線評(píng)論活躍狀態(tài)演化模式及相應(yīng)的特征。

(二) 實(shí)驗(yàn)結(jié)果與分析

1. 活躍狀態(tài)分析

依照前文節(jié)中提出的模型建立過(guò)程,為每一個(gè)產(chǎn)品對(duì)應(yīng)的在線評(píng)論信息條數(shù)序列建立一個(gè)對(duì)應(yīng)的隱馬爾可夫模型。所建立的模型中,活躍狀態(tài)數(shù)量N越大,則該模型的描述能力越強(qiáng),但模型訓(xùn)練學(xué)習(xí)的時(shí)間和計(jì)算成本都會(huì)越大。本文分別取狀態(tài)數(shù)量N=2,4,6,8,10。然后選用Baum-Welch算法求解模型參數(shù) 和A,最后選用Viterbi算法求解最優(yōu)的可以解釋觀察值序列的活躍性狀態(tài)序列。圖1為卓越亞馬遜網(wǎng)站上熱銷的一本圖書《別相信任何人》的在線評(píng)論數(shù)量隨著時(shí)間變化的趨勢(shì)圖,圖2~圖6分別表示N=2、4、6、8、10的時(shí)候,該圖書對(duì)應(yīng)的在線評(píng)論信息活躍狀態(tài)的變化趨勢(shì)。

從圖2~圖6可以看出,利用隱馬爾可夫模型求解得到的活躍狀態(tài)變化趨勢(shì)能夠準(zhǔn)確的反映出在線評(píng)論信息數(shù)量隨時(shí)間變化的趨勢(shì)。在評(píng)論信息出現(xiàn)的前5周,由于在線評(píng)論信息數(shù)量較少,低于在線評(píng)論信息數(shù)量的平均值,所以所處的狀態(tài)為不活躍狀態(tài);之后,隨著在線評(píng)論信息數(shù)量的增加,活躍狀態(tài)隨之升高;接下來(lái),在線評(píng)論信息數(shù)量又繼續(xù)減少,活躍狀態(tài)也隨之降低,最后在線評(píng)論信息數(shù)量又顯著上升,活躍狀態(tài)也隨之上升。當(dāng)N=2的時(shí)候,只有1和2兩種狀態(tài),無(wú)法細(xì)致的區(qū)分在線評(píng)論活躍狀態(tài)的高低,信息量就比較單一。

2.活躍狀態(tài)的演化模式分析

采用前文中的聚類算法對(duì)30種產(chǎn)品在線評(píng)論信息量的時(shí)間序列進(jìn)行聚類。將訓(xùn)練得到的隱馬爾可夫模型結(jié)合公式(2)將每一個(gè)產(chǎn)品在線評(píng)論信息數(shù)量的時(shí)間序列均映射為一個(gè)32的向量,然后選用K-means算法進(jìn)行聚類。在實(shí)驗(yàn)中,K可以通過(guò)輪廓系數(shù)(silhouette coefficient)的大小來(lái)確定,其值域?yàn)閇-1, 1],其計(jì)算方法由式(3)給出。

其中,ai表示聚類對(duì)象i到其所屬類中所有其他聚類對(duì)象的平均距離,bi表示對(duì)象i到任意其他類中所有對(duì)象的平均距離的最小值。

在計(jì)算出所有聚類對(duì)象輪廓系數(shù)的平均值,選擇平均值最大對(duì)應(yīng)的K值作為最終的聚類類別數(shù)。

本文在上一節(jié)中,分別取N=2, 4, 6, 8, 10,根據(jù)產(chǎn)品在線評(píng)論信息數(shù)量,訓(xùn)練得到隱馬爾可夫模型,然后利用K-means聚類方法對(duì)產(chǎn)品在線評(píng)論信息數(shù)量的時(shí)間序列進(jìn)行了聚類,得到了基本一致的聚類結(jié)果。因此,本文僅對(duì)N=8時(shí)所得到的聚類結(jié)果進(jìn)行分析。K=3, 4, 5, 6時(shí),輪廓系數(shù)的平均值如圖7所示。由圖7可以看出:K=5時(shí),輪廓系數(shù)的平均值為最大,等于0.8424,故取K=5。

比較這30個(gè)產(chǎn)品在線評(píng)論信息的活躍狀態(tài)序列,可以很容易的發(fā)現(xiàn)聚類所得的5類演化模式的特征。本文將這四類變化模式分別命名為單峰型、寬峰型、多峰型、穩(wěn)定型和波動(dòng)型,其特征如表1所示。endprint

五種產(chǎn)品在線評(píng)論信息活躍狀態(tài)演化模式如圖8~圖12所示。

五、結(jié) 論

在實(shí)際的營(yíng)銷決策制定過(guò)程中,產(chǎn)品Web信息活躍狀態(tài)的演化模式可以與產(chǎn)品生命周期理論相結(jié)合。產(chǎn)品生命周期描述了產(chǎn)品從進(jìn)入市場(chǎng)開始,直到最終退出市場(chǎng)為止所經(jīng)歷的市場(chǎng)生命循環(huán)過(guò)程,企業(yè)可以通過(guò)對(duì)處于不同生命周期的產(chǎn)品使用不同的營(yíng)銷策略來(lái)形成營(yíng)銷優(yōu)勢(shì)。了解產(chǎn)品Web信息活躍狀態(tài)可以輔助判斷產(chǎn)品所處的產(chǎn)品生命周期。

當(dāng)新產(chǎn)品開始投入市場(chǎng)進(jìn)入介紹期,消費(fèi)者對(duì)產(chǎn)品還不了解,只有少數(shù)追求新奇的顧客可能會(huì)購(gòu)買,與之對(duì)應(yīng)的產(chǎn)品Web信息也就很少。此階段的營(yíng)銷目標(biāo)是要?jiǎng)?chuàng)造產(chǎn)品的知名度,促進(jìn)試用。在產(chǎn)品生命周期中的成長(zhǎng)期,消費(fèi)者對(duì)產(chǎn)品逐漸了解,大量的新顧客開始購(gòu)買,市場(chǎng)逐步擴(kuò)大,顧客對(duì)產(chǎn)品的反饋和評(píng)論也會(huì)相應(yīng)的增加,產(chǎn)品Web信息會(huì)迅速增長(zhǎng)。隨著產(chǎn)品進(jìn)入成熟期,市場(chǎng)需求趨向飽和,潛在的顧客已經(jīng)很少,產(chǎn)品Web信息的活躍狀態(tài)會(huì)逐漸穩(wěn)定直至產(chǎn)品開始衰退期,隨著產(chǎn)品用戶數(shù)量在衰退期的大量減少,產(chǎn)品Web信息的活躍狀態(tài)也會(huì)迅速降低。

結(jié)合產(chǎn)品所屬的Web信息活躍狀態(tài)的演化模式推斷產(chǎn)品所在的產(chǎn)品生命周期階段然后采取不同的市場(chǎng)營(yíng)銷策略,這可以使企業(yè)的市場(chǎng)營(yíng)銷策略達(dá)到最佳組合。對(duì)于產(chǎn)品Web信息還沒有出現(xiàn)快速增長(zhǎng)的商品可以將價(jià)格高低與促銷費(fèi)用高低結(jié)合起來(lái),形成能有效創(chuàng)造產(chǎn)品知名度的營(yíng)銷策略(如:快速撇脂策略,快速滲透策略等)。當(dāng)產(chǎn)品Web信息已經(jīng)處于快速增長(zhǎng)階段時(shí),尤其對(duì)Web信息活躍狀態(tài)的演化模式是單峰型的產(chǎn)品,企業(yè)根據(jù)原有的策略和市場(chǎng)地位選擇定價(jià)策略以維持其市場(chǎng)的增長(zhǎng)率,延長(zhǎng)獲取最大利潤(rùn)的時(shí)間(如:改變廣告宣傳的重心,適時(shí)調(diào)整價(jià)格等)。產(chǎn)品Web信息活躍狀態(tài)穩(wěn)定處于高位時(shí),特別是針對(duì)Web信息活躍狀態(tài)的演化模式是寬峰型的產(chǎn)品,企業(yè)宜采取主動(dòng)出擊策略(如,競(jìng)爭(zhēng)價(jià)格策略),使產(chǎn)品得到更長(zhǎng)時(shí)間的高度關(guān)注。一旦產(chǎn)品Web信息活躍度快速下降,對(duì)于演化模式為單峰型的產(chǎn)品就要認(rèn)真的研究分析采取何種策略,在何時(shí)退出市場(chǎng)(如,集中策略,收縮策略等)。對(duì)于演化模式是寬峰型或者是多峰的產(chǎn)品則要采取市場(chǎng)調(diào)整策略(如,發(fā)現(xiàn)產(chǎn)品新用途,適當(dāng)降價(jià)等)使得產(chǎn)品生命周期出現(xiàn)再循環(huán)。

參考文獻(xiàn):

[1]朱沁夫. 海南產(chǎn)業(yè)結(jié)構(gòu)選擇與演變——基于廣義虛擬經(jīng)濟(jì)思路的研究[J]. 廣義虛擬經(jīng)濟(jì)研究, 2010, 1(2): 42-47.

[2]亓元, 單德朋. 中國(guó)港口城市郵輪產(chǎn)業(yè)競(jìng)爭(zhēng)力測(cè)度——兼論三亞郵輪產(chǎn)業(yè)發(fā)展[J]. 廣義虛擬經(jīng)濟(jì)研究, 2010, 1(2): 35-41.

[3]胡延杰, 楊東方. 微觀企業(yè)層面人力資本研究評(píng)析[J]. 廣義虛擬經(jīng)濟(jì)研究,2011, 2(1): 58-64.

[4]田東文, 姚微. 虛擬價(jià)值鏈下促進(jìn)服務(wù)外包發(fā)展的策略選擇[J]. 廣義虛擬經(jīng)濟(jì)研究,2011, 2(1): 86-94.

[5]蘇州, 胡榮. 廣義虛擬經(jīng)濟(jì)視角下的民用機(jī)場(chǎng)非航空性資源價(jià)值[J]. 廣義虛擬經(jīng)濟(jì)研究,2012, 3(1): 29-35.

[6]林左鳴, 尹國(guó)平. 價(jià)值理論的困境、出路及創(chuàng)新研究——廣義虛擬經(jīng)濟(jì)理論關(guān)于價(jià)值的主要觀點(diǎn)[J]. 廣義虛擬經(jīng)濟(jì)研究, 2011, 2(1): 5-14.

[7]張明立, 任淑霞, 許月恒. 廣義虛擬經(jīng)濟(jì)視角下的顧客感知價(jià)值及其對(duì)滿意、忠誠(chéng)的影響研究[J]. 廣義虛擬經(jīng)濟(jì)研究, 2011, 2(1): 36-46.

[8]Rabiner L R. A tutorial on hidden markov models and selected applications in speech recognition [C]. Proceedings of the IEEE, 1989, 77 (2): 257–286.

[9]Durbin R, Eddy S R, Krogh A, et al. Biological sequence analysis: probabilistic models of proteins and nucleic acids. Cambridge University Press, 1999.

[10]Krogh A, Brown M, Mian I S, et al. Hidden markov models in computational biology: applications to protein modeling [J]. Journal of Molecular Biology, 1994, 235(5): 1501-1531.

[11]Baldi P, Chauvin Y, Hunkapiller T, et al. Hidden markov models of biological primary sequence information [R]. Proceedings of the natioanl academy of sciences of the united states of America, 1994, 91(3): 1059-1063.

[12]Eddy S R, Mitchison G, Durbin R. Maximum discrimination hidden markov models of sequence consensus [J]. Journal of computational biology, 1995, 2(1): 9-23.endprint

[13]Churchill G A. Stochastic models for heterogeneous DNA sequences[J]. Bulletin of mathematical biology, 1989, 51(1): 79-94.

[14]Barlas Y, Kanar K. A dynamic pattern-oriented test for model validation [A]. Proceedings of 4th systems science European congress [C]. Emerald Group Pubilishing Limited, 1999: 269-286.

[15]Chen C C, Chen M C, Chen M S. An adaptive threshold framework for event detection using HMM-based life profiles [J]. ACM Transactions on Information Systems, 2009, 27(2): 1-35.

[16]Parikh N, Sundaresan N. Scalable and near real-time burst detection from e-commerce queries [A]. Proceedings of the 14th ACM SIGKDD international conference on knowledge discovery and data mining [C]. New York, USA, ACM Press, 2008: 972-980.

[17]Bicego M, Murino V, Figueiredo M A T. Similarity-based clustering of sequences using hidden markov models[A]. Lecture notes in computer science [C], 2003, 2734/2003: 95-104.

[18]Chen Y, Xie J-H. Third-Party Product Review and Firm Marketing Strategy[J]. Marketing Science, 2005, 24(2):218-240.endprint

猜你喜歡
在線評(píng)論
消費(fèi)者個(gè)體特征對(duì)在線評(píng)論有效性的影響研究
在線評(píng)論情感屬性的動(dòng)態(tài)變化
基于復(fù)雜網(wǎng)絡(luò)構(gòu)建面向主題的在線評(píng)論挖掘模型
巧用“在線評(píng)論”提升圖書網(wǎng)上銷量
消費(fèi)者個(gè)體行為偏好對(duì)在線評(píng)論真實(shí)性的影響機(jī)理研究
彭阳县| 宁陵县| 桦甸市| 闸北区| 巴马| 电白县| 绥化市| 西藏| 简阳市| 泗水县| 江西省| 安西县| 黄浦区| 峨边| 临沂市| 清丰县| 蒲江县| 临澧县| 鱼台县| 深圳市| 来凤县| 祁东县| 望都县| 灌阳县| 苏州市| 久治县| 洪雅县| 土默特左旗| 滨海县| 城固县| 松阳县| 措美县| 武强县| 福鼎市| 新化县| 聂拉木县| 双辽市| 邯郸县| 岚皋县| 平塘县| 五莲县|