白曉萌
摘要:互聯(lián)網(wǎng)時代,參與網(wǎng)購的消費者和銷售商越來越多。商品的網(wǎng)購評論情況不僅可以幫助顧客做出產(chǎn)品購買決策,還可以幫助企業(yè)制定銷售策略?;趤嗰R遜平臺上的商品銷量和評論信息,本文通過情感分析將評語量化為分?jǐn)?shù),并用相關(guān)性分析找到商品評星、評語和銷量的關(guān)系,通過多元線性回歸確定了通過評論衡量產(chǎn)品成功程度的度量方式。
Abstract: In the Internet era, more and more consumers and sellers participate in online shopping. Online comments of goods can not only help customers to make product purchase decisions, but also help enterprises to make sales strategies. Based on the sales and comments of products on the Amazon online market, sentiment analysis is used to transform the textual review into review score. The correlation analysis is used to find out the relationship between commodity ratings, comments and sales volume, and the method to measure the success of commodities through comments is developed based on Multiple Linear Regression.
關(guān)鍵詞:網(wǎng)購評論;情感分析;相關(guān)性分析;多元線性回歸
Key words: online reviews;sentiment analysis;correlation analysis;Multiple Linear Regression
中圖分類號:F724.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)29-0013-03
0? 引言
在線購物網(wǎng)站亞馬遜的用戶無論是否購買,都可以發(fā)表對產(chǎn)品的評論。對不同產(chǎn)品的評論各不相同,為市場分析提供了可獲得的和豐富的數(shù)據(jù)。評論包括星級和評語,此外網(wǎng)站上還可以獲取商品的銷量和評論用戶的部分個人信息。
在過去的幾十年里,解釋和處理用戶意見信息的方法已經(jīng)完成了許多工作。本文所做的不僅僅是對文字評論進(jìn)行處理,而是根據(jù)所提供的所有與評論相關(guān)的數(shù)據(jù)進(jìn)行全面的分析,建立衡量產(chǎn)品成功度的評價模型,幫助公司制定合適的銷售策略。
1? 評語量化
1.1 數(shù)據(jù)過濾
網(wǎng)購平臺上可能存在無效評論,以下幾種數(shù)據(jù)不做分析考慮。①評論總數(shù)少于15條的商品不進(jìn)行分析。②同一個用戶重復(fù)發(fā)表多條內(nèi)容相同的評論,僅保留一條。③評論星級和評語情感色彩明顯相反的評論(可能是誤評),剔除出數(shù)據(jù)集。
1.2 量化分值的計算
文本形式的評語是一種不能直接參與計算的非數(shù)值數(shù)據(jù),這給分析其中隱藏的信息帶來了很大的困難。對出現(xiàn)在文本評論中的單詞進(jìn)行普查,可以發(fā)現(xiàn)除了虛詞這類無意義的詞之外,還有兩種經(jīng)常出現(xiàn)在復(fù)習(xí)中的詞。一種是表達(dá)態(tài)度,另一種是描述產(chǎn)品特征。評論中出現(xiàn)的特征詞比態(tài)度詞更加多樣化,這可能暗示了人們對具有特定特征的產(chǎn)品的偏好。在對不同類型產(chǎn)品的評論中態(tài)度詞幾乎相同,所以在處理文本時態(tài)度詞比特征詞更容易識別?;跀?shù)據(jù)的這一特點,可以采用情感分析對文本數(shù)據(jù)進(jìn)行處理。
Vader算法[1]是一種基于詞庫和語法規(guī)則來進(jìn)行文本情感識別的方法,其基本思想是通過人工標(biāo)注為常用情感詞(包括形容詞、名詞、副詞等)進(jìn)行了情感極性及強度判定。從-4到+4表示從極度負(fù)面和極度正面情感,從而構(gòu)建vader詞庫。該算法還考慮了語法規(guī)則對情感判別的影響,如標(biāo)點會加強句子的情感強度、否定詞導(dǎo)致隨后的情感次極性反轉(zhuǎn)等,使用該算法處理文本后的量化值比較符合人的情感認(rèn)知。
對于給定的輸入文本數(shù)據(jù),Vader情感分析算法返回一個極性分?jǐn)?shù)百分比的三元組。它還提供了一個單個的評分標(biāo)準(zhǔn),這是一個在[-1,1]范圍內(nèi)的實值,即評語量化后的分?jǐn)?shù),可以作為一種顧客對商品的評分。
1.3 評語和星級的相關(guān)性
通常情況下,當(dāng)人們給予產(chǎn)品高星級時,他們傾向于給予正面評語,使用皮爾遜相關(guān)因數(shù)來找出評語和星級之間是否存在關(guān)系,此過程由SPSS軟件完成。經(jīng)檢驗,評語與星級之間的相關(guān)關(guān)系在0.01水平上顯著,說明評語與星級之間存在正相關(guān)關(guān)系,且相關(guān)關(guān)系非常顯著。
2? 產(chǎn)品的聲譽
2.1 評論的可信度
不同類型的客戶做出的評論可信度是不同的。一些客戶是亞馬遜會員,這意味著他們更可靠,他們可以從亞馬遜免費獲得產(chǎn)品。有些顧客在發(fā)表評論之前并沒有在亞馬遜購買過該產(chǎn)品,這可能表明他們的評論不如那些購買過該產(chǎn)品的人可信。此外,亞馬遜還為顧客提供了為他人評論“點贊”的機會。有些評論得到了很多點贊,但有些沒有得到任何點贊。因此,在綜合考慮所有評論之前,有必要使用一個參數(shù)來描述每個評論的可信度。根據(jù)上面的分析,每個評論的可信度與客戶是否是亞馬遜會員,是否購買過該產(chǎn)品,以及有多少點贊數(shù)有關(guān)。
式中wij表示第i件商品的第j條評論的可信度;v1表示每條評論獲得的點贊數(shù);v2表示評論者是否為會員;v3表示評論者是否購買過此商品;β是分配給三個因素的權(quán)重。
2.2 聲譽計算
在評論可信度的基礎(chǔ)上,引入產(chǎn)品市場聲譽的計算方法。聲譽一般指顧客對產(chǎn)品的滿意程度,可以從評論中體現(xiàn),聲譽是評論所蘊含全部信息的高度概括。
實際上,顧客在做出評論時,可能會受到產(chǎn)品已有的評論影響。根據(jù)Park和Lee的實驗結(jié)論[2],產(chǎn)品已有的好評數(shù)量越多,越有可能對后買的顧客產(chǎn)生積極影響。然而,差評的影響與差評數(shù)關(guān)系較小。一旦出現(xiàn)了差評,無論差評多或少,都會對客戶產(chǎn)生較大的負(fù)面影響。據(jù)此,把商品的差評率作為單列的一項指標(biāo)來評價產(chǎn)品聲譽。
衡量產(chǎn)品的市場聲譽時考慮3個因素和1個修正值,3個因素為:評論星級、文本評語量化得分、差評率,1個修正值為評論的可信度,前兩個因素都要乘修正值才能使用。在對三個因素進(jìn)行賦權(quán)時,可以采用簡單的層次分析法。
3? 產(chǎn)品成功度
銷量高的產(chǎn)品就是成功的產(chǎn)品,每個月的銷量數(shù)據(jù)比較容易直接從購物網(wǎng)站上獲取。
下面將成功程度定義為銷售數(shù)量的對數(shù),認(rèn)為銷量的對數(shù)可以由產(chǎn)品評論星級和評語量化值以及差評率的線性組合表示,采用多元線性回歸的方法,確定各項系數(shù),建立由評論信息確定產(chǎn)品成功度的模型。以亞馬遜網(wǎng)站上的電吹風(fēng)、微波爐和嬰兒奶嘴三類商品為例,用matlab軟件的線性擬合工具進(jìn)行擬合,可以得到擬合效果較好的一組參數(shù),參數(shù)值如表1所示,擬合效果如圖1所示。
經(jīng)過回歸方程的顯著性檢驗,置信區(qū)間為95%,P=0.000028<0.0001,說明模型有效。由此,可以得到基于網(wǎng)絡(luò)評論的產(chǎn)品成功度評價模型,如圖2所示。
4? 靈敏度分析
在計算評語可信度時,我們采用了主觀賦權(quán)的方法,對可信度的三個指標(biāo)β1、β2和β3進(jìn)行賦權(quán),缺乏客觀性。為了使結(jié)論更加穩(wěn)定,對權(quán)重進(jìn)行了靈敏度分析。
根據(jù)俞立平等的研究[3],對指標(biāo)權(quán)重的靈敏度分析時,權(quán)重之和必須為1,即一個指標(biāo)權(quán)重的增加必然導(dǎo)致其他指標(biāo)權(quán)重的減少。在一個評價體系的n個指標(biāo)中,當(dāng)某個指標(biāo)vj的權(quán)重由βj增加到βj+σj時,為了保證所有指標(biāo)的權(quán)重之和為1,其它(n-1)個指標(biāo)平均每個指標(biāo)的權(quán)重要減少σj/(n-1)。在可信度評價時共選取了3個指標(biāo),因此權(quán)值調(diào)整后的評價體系為:
在計算時,首先設(shè)置一個初始權(quán)重值,按照一定的步長逐漸增加σj,每改變一次權(quán)重都重新進(jìn)行評價,直到評價后的排序不一致為止。由此可以得到使得評價排序穩(wěn)定的權(quán)重波動范圍。用matlab軟件編寫程序,分析各指標(biāo)權(quán)重的靈敏度,表2是分析結(jié)果。
5? 討論與建議
5.1 發(fā)現(xiàn)與討論
利用情感分析算法對文本進(jìn)行處理,并將文本的情感傾向量化為一個值。研究發(fā)現(xiàn),該值與星級評分有密切的關(guān)系。這很容易解釋,因為人們傾向于同時給出好的評論和高星級評價,同時給出壞的評論和低星級評價。會員用戶的評論更容易獲得點贊。這可能是因為此類用戶的評論通常比其他人長,他們寫過的評論條數(shù)也比其他人多。
特定的星級評分會引發(fā)更多的評論。例如,顧客在看到一系列的低星級評價后,更有可能寫一些不好的評論。同樣地,顧客在看到一系列的高星級評價后,更有可能寫出一些好的評論。
5.2 對商家的建議
通過高頻詞的提取和識別,可以發(fā)現(xiàn)電吹風(fēng)、微波爐、嬰兒奶嘴這三種產(chǎn)品在眾多評論中其潛在的重要設(shè)計特征,以提高產(chǎn)品的可取性。結(jié)果顯示,商家應(yīng)該集中精力改進(jìn)產(chǎn)品的以下方面:
①電吹風(fēng):功率、熱度、外觀、價格、使用壽命。
②微波爐:外觀、空間、可維護性、發(fā)熱性、使用壽命。
③奶嘴:好看、干凈、容量、容納、可愛、洗滌。
另外,這三類產(chǎn)品的年銷售高峰是在12月到次年2月,所以建議商家應(yīng)該在冬季(圣誕節(jié)前后)推出新產(chǎn)品。此外,每款商品從上市起,其評論數(shù)量和銷量都隨時間呈現(xiàn)指數(shù)式增長,這可以反映市場需求量。所以當(dāng)商家進(jìn)入網(wǎng)絡(luò)市場時,其生產(chǎn)廠家應(yīng)該有充足的供應(yīng)保證滿足市場指數(shù)增長的需求。
參考文獻(xiàn):
[1]C. J. Hutto, Eric Gilbert. VADER: A Parsimonious Rule-Based Model for Sentiment Analysis of Social Media Text[J]. 2014.
[2]Park N , Lee K M . Effects of online news forum on corporate reputation[J]. Public Relations Review, 2007, 33(3):346-348.
[3]俞立平,潘云濤,武夷山.科技評價靈敏度分析研究——單個指標(biāo)與組合指標(biāo)[J].軟科學(xué),2009,23(008):1-4.