金家華,吳浪濤,張婷婷,閆相斌
(北京科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京100083)
伴隨著互聯(lián)網(wǎng)的發(fā)展和社會(huì)生活節(jié)奏的加快,外賣這種融合線下產(chǎn)品與線下服務(wù)的商業(yè)模式受到越來越多顧客的青睞。2018年美團(tuán)點(diǎn)評(píng)研究院發(fā)布的《2017年中國外賣發(fā)展研究報(bào)告》顯示:2017年中國在線外賣市場規(guī)模達(dá)到2046 億元,較上年增長23%;在線外賣用戶規(guī)模達(dá)到3 億人,較上年增長15%;入駐外賣平臺(tái)商家由2015 的50 萬家增長到270 萬家[1]。如此大量外賣商家的涌入給平臺(tái)管理和消費(fèi)者選擇造成了困難,作為解決方法,外賣商家評(píng)分應(yīng)運(yùn)而生。外賣商家評(píng)分指的是對(duì)外賣商家提供的產(chǎn)品或服務(wù)進(jìn)行量化評(píng)估的方法,準(zhǔn)確的外賣商家評(píng)分不僅能幫助平臺(tái)實(shí)現(xiàn)優(yōu)勝劣汰管理,而且能降低消費(fèi)者在大量同類商家中的選擇成本,對(duì)平臺(tái)管理者和消費(fèi)者都有重要的現(xiàn)實(shí)指導(dǎo)意義。
在線用戶評(píng)論是消費(fèi)者對(duì)所體驗(yàn)商家產(chǎn)品和服務(wù)的文字性評(píng)價(jià),其不僅為商家的產(chǎn)品和服務(wù)改進(jìn)提供了現(xiàn)實(shí)依據(jù),而且影響著未來消費(fèi)者的購買決策。Rosario 等人整理了96 個(gè)涉及40 個(gè)平臺(tái)26 個(gè)產(chǎn)品類別的研究表明,用戶評(píng)論對(duì)商家的銷售額有正向的影響[2]。文秀賢和徐健利用自然語處理技術(shù)提取了用戶評(píng)論的關(guān)鍵詞,然后,通過關(guān)鍵詞聚類獲取消費(fèi)者顯著偏好的商品特征,以此幫助企業(yè)提升產(chǎn)品研發(fā)能力,更好地滿足消費(fèi)者需求[3]。Jin 等人利用文本挖掘的方法從海量用戶生成內(nèi)容中識(shí)別出酒店投訴信息,并對(duì)投訴信息進(jìn)行分析,給出酒店提升服務(wù)能力的政策建議[4]。楊爽關(guān)于在線產(chǎn)品評(píng)論感知有用性的研究顯示,評(píng)論的信息質(zhì)量及評(píng)論者的社區(qū)地位能增強(qiáng)消費(fèi)者對(duì)評(píng)論有用性感知,從而影響消費(fèi)者購買行為[5]。從以上文獻(xiàn)回顧可知,大量研究表明用戶評(píng)論對(duì)后來消費(fèi)者的購買決策和商家銷售策略都發(fā)揮著重要的作用,然而現(xiàn)有關(guān)于用戶評(píng)論的研究多運(yùn)用實(shí)證方法分析用戶評(píng)論對(duì)后來消費(fèi)者決策的影響作用,而關(guān)于如何進(jìn)一步量化評(píng)論中用戶的觀點(diǎn),及其對(duì)商家綜合評(píng)分作用的研究則較少。
本研究采用情感分析方法,對(duì)用戶評(píng)論中消費(fèi)者的觀點(diǎn)及其情感極性進(jìn)行分析,實(shí)現(xiàn)基于用戶評(píng)論的商家評(píng)分。情感分析是自然語言處理的重要分支,被廣泛用來萃取用戶評(píng)論中的情感元素,進(jìn)而表示用戶對(duì)待評(píng)價(jià)對(duì)象的褒貶。孟園等人基于情感分析方法研究口碑對(duì)產(chǎn)品銷量的影響,結(jié)果表明加入情感維度后的銷量預(yù)測結(jié)果更加準(zhǔn)確[6]。Jin 等人對(duì)社會(huì)化問答社區(qū)中的醫(yī)學(xué)問題回答內(nèi)容進(jìn)行情感分析,結(jié)果表明那些具有正向情感的回答更容易被患者感知和采納[7]。但是已有研究多是對(duì)評(píng)論文本進(jìn)行粗粒度的情感傾向分析,即評(píng)論文本的正面、中性或負(fù)面情感。由于外賣商品屬于體驗(yàn)型產(chǎn)品,用戶評(píng)論通常會(huì)從多個(gè)主題(如服務(wù)、口味、質(zhì)量等)進(jìn)行闡述,以混合情感的形式出現(xiàn),即在肯定某些主題的同時(shí)否定其他一些主題。因此,本研究針對(duì)外賣產(chǎn)品特征,挖掘消費(fèi)者評(píng)論中主題,量化這些主題的情感成分,實(shí)現(xiàn)對(duì)外賣商家的整體評(píng)分,幫助平臺(tái)更好地管理入住商家,減少消費(fèi)者獲得滿意商品的選擇成本。
本研究首先基于美團(tuán)外賣的用戶評(píng)論數(shù)據(jù),利用通用情感詞庫和word2vec 算法得到外賣領(lǐng)域的情感詞庫;然后,利用基于主題情感的分析方法計(jì)算用戶評(píng)論的情感極性和強(qiáng)度;最后,融合情感強(qiáng)度計(jì)算每一個(gè)商家的總體情感指數(shù)。實(shí)驗(yàn)結(jié)果表明該方法的計(jì)算結(jié)果與美團(tuán)平臺(tái)上商家的消費(fèi)者綜合評(píng)分具有很強(qiáng)的相關(guān)性,本文提出的基于主題的用戶評(píng)論情感指數(shù)計(jì)算方法能用于商家綜合評(píng)分,可為外賣平臺(tái)商家管理和消費(fèi)者的購買決策提供現(xiàn)實(shí)依據(jù)。
商家評(píng)分是指第三方機(jī)構(gòu)對(duì)商家提供的產(chǎn)品或服務(wù)質(zhì)量的綜合評(píng)價(jià),評(píng)分結(jié)果不僅能幫助商家明確產(chǎn)品或服務(wù)質(zhì)量的改進(jìn)方向,為監(jiān)管部門進(jìn)行商家管理提供政策建議,而且能極大降低消費(fèi)者綜合海量信息做出正確消費(fèi)決策的成本。因此,準(zhǔn)確計(jì)算商家評(píng)分具有重要的現(xiàn)實(shí)意義,并引起產(chǎn)業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。基于產(chǎn)品或服務(wù)屬性的商家評(píng)分法較早得到了研究者的采納,此類研究主要是基于產(chǎn)品或服務(wù)的價(jià)格、銷量、信譽(yù)、評(píng)分等屬性要素,通過專家打分確定屬性要素的權(quán)重,利用模糊綜合評(píng)價(jià)、數(shù)據(jù)包絡(luò)分析、神經(jīng)網(wǎng)絡(luò)等綜合評(píng)價(jià)方法實(shí)現(xiàn)對(duì)商家提供的產(chǎn)品或服務(wù)的評(píng)分。例如,F(xiàn)eng 等人將商品的價(jià)格、評(píng)論好壞數(shù)量、交貨時(shí)間、賣家信譽(yù)和商品質(zhì)量等屬性結(jié)合在一起對(duì)商品進(jìn)行排序[8],Zhang 等人提出了一種包含吸引性、有效性、商品圖片、網(wǎng)站信息等有效因素的在線商品綜合評(píng)分框架[9]?;诋a(chǎn)品或服務(wù)屬性的評(píng)價(jià)方法在指標(biāo)選擇、權(quán)重確定等環(huán)節(jié)大量依賴專家經(jīng)驗(yàn),評(píng)價(jià)結(jié)果具有較強(qiáng)的主觀性,難以開展大規(guī)模的評(píng)價(jià)活動(dòng)。
近年來,隨著互聯(lián)網(wǎng)普及,以用戶評(píng)分和用戶評(píng)論為代表的商家評(píng)價(jià)機(jī)制被廣泛使用。用戶評(píng)分是用戶對(duì)購買的產(chǎn)品或服務(wù)的總體評(píng)價(jià),大量用戶評(píng)分的平均值在一定程度上反映了提供產(chǎn)品或服務(wù)的商家優(yōu)劣。著名電商平臺(tái)亞馬遜就是采用用戶評(píng)分的平均值來代表商家的信譽(yù)值的,許多研究也采用消費(fèi)者評(píng)分來考察商品的用戶口碑,進(jìn)而研究用戶口碑對(duì)消費(fèi)者購買決策的影響[10-11]。采用用戶評(píng)分來表示商家商譽(yù)是基于所有用戶對(duì)在線商品具有一致的偏好假設(shè),而且消費(fèi)者能按照一致的標(biāo)準(zhǔn)對(duì)商品客觀地進(jìn)行評(píng)分。然而,在開放和動(dòng)態(tài)的網(wǎng)絡(luò)環(huán)境中,由于消費(fèi)背景、消費(fèi)心理、消費(fèi)愛好等因素的影響,用戶對(duì)在線商品的偏好不可能一致,采用消費(fèi)者評(píng)分計(jì)算得出的商家綜合評(píng)分往往不能準(zhǔn)確地反映真實(shí)情況[12]。用戶評(píng)論是一種重要的用戶生成內(nèi)容(User Generated Contents,UGC),是消費(fèi)者用自然語言描述在購買和使用商家產(chǎn)品或服務(wù)后真實(shí)感受的一種評(píng)價(jià)方式,相較于結(jié)構(gòu)化的用戶評(píng)分,非結(jié)構(gòu)化的用戶評(píng)論能更加完整、真實(shí)地表述消費(fèi)者的感受[13-14],降低購物過程的不確定性,對(duì)后來消費(fèi)者的購買決策具有更大的參考作用。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的《2018年中國網(wǎng)絡(luò)購物調(diào)查研究報(bào)告》,80%用戶購買前會(huì)參考商品評(píng)論[15],眾多研究也表明用戶評(píng)論不僅對(duì)消費(fèi)者購買行為具有重要的影響[16-17],而且對(duì)商家提升產(chǎn)品或服務(wù)質(zhì)量具有重大的參考價(jià)值[18]。
然而,隨著評(píng)論數(shù)量的急劇增加,從海量評(píng)論文本中獲取關(guān)于產(chǎn)品和服務(wù)的總體評(píng)價(jià)信息變得愈加困難,基于自然語言處理的情感分析方法被研究者引入,進(jìn)行對(duì)商家產(chǎn)品和服務(wù)的口碑測量。情感分析又稱意見挖掘、傾向性分析,是指對(duì)帶有感情色彩的文本進(jìn)行分析、處理、歸納和推理的過程,被廣泛用于股票價(jià)格的趨勢預(yù)測[19]、突發(fā)事件的輿情分析[20]和產(chǎn)品或服務(wù)的質(zhì)量改進(jìn)等[21-22]。情感分析方法可分為基于機(jī)器學(xué)習(xí)的情感分析方法和基于詞典的情感分析方法兩大類?;跈C(jī)器學(xué)習(xí)的情感分析方法主要利用支持向量機(jī)、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)等有監(jiān)督學(xué)習(xí)算法,基于訓(xùn)練數(shù)據(jù)構(gòu)建情感傾向的分類模型,實(shí)現(xiàn)對(duì)未知情感傾向文本的情感傾向分類[23-24]。該類算法只能給出文本的情感傾向,而不能量化文本情感傾向的程度?;谠~典的情感分析方法是指利用帶有情感極性標(biāo)注和情感強(qiáng)度標(biāo)注的詞典,在對(duì)文本進(jìn)行分詞和句法分析的基礎(chǔ)上,實(shí)現(xiàn)對(duì)文本情感傾向歸類和情感傾向程度計(jì)量。情感詞典是基于詞典情感分析方法的核心,目前國內(nèi)外常用的通用情感詞典包括有知網(wǎng)的Hownet、大連理工大學(xué)情感本體、哈佛大學(xué)的General Inquirer Lexicon 等?;谠~典的情感分析方法具有無須訓(xùn)練樣本標(biāo)注、計(jì)算規(guī)則簡單、結(jié)果可解釋性強(qiáng)等優(yōu)點(diǎn),但該方法嚴(yán)重依賴于情感詞典,情感詞典的質(zhì)量在很大程度上決定最終結(jié)果的準(zhǔn)確程度,由于不同領(lǐng)域的用語習(xí)慣和表達(dá)方式的不同,需要在通用情感詞典的基礎(chǔ)上構(gòu)建領(lǐng)域情感詞典[25-27]。以本文研究的外賣領(lǐng)域?yàn)槔?,作為一個(gè)新興的商業(yè)模式,外賣商品評(píng)論中充斥著大量網(wǎng)絡(luò)用語和傳統(tǒng)的餐飲服務(wù)用語,通用的情感詞典難以準(zhǔn)確反映外賣領(lǐng)域用戶評(píng)論的情感值。另外,用戶評(píng)論通常會(huì)包含多個(gè)主題,不同主題的重要程度也有所區(qū)別,不加區(qū)分地對(duì)評(píng)論文本進(jìn)行情感分析的結(jié)果與評(píng)論者真實(shí)評(píng)價(jià)會(huì)有偏差。因此,針對(duì)外賣這一特殊領(lǐng)域,有必要有針對(duì)性地建立領(lǐng)域詞典,并對(duì)評(píng)論主題萃取的權(quán)重進(jìn)行劃分,從而精準(zhǔn)地計(jì)算用戶評(píng)論的情感值,進(jìn)而實(shí)現(xiàn)對(duì)外賣商家的準(zhǔn)確評(píng)分。
不同領(lǐng)域文本的詞語構(gòu)成具有其領(lǐng)域的特殊性,構(gòu)建充分體現(xiàn)外賣行業(yè)特點(diǎn)的情感詞典是對(duì)外賣評(píng)論進(jìn)行情感分析的重要前提。本研究用于構(gòu)建外賣情感詞典的語料庫來源為中國知名外賣平臺(tái)美團(tuán)網(wǎng),作者在該平臺(tái)隨機(jī)選擇500 家北京外賣商家,采用Python 爬取了每戶商家10 條用戶評(píng)論,構(gòu)建了本研究的語料庫。然后,在大連理工大學(xué)提供的通用情感詞庫的基礎(chǔ)上,使用結(jié)巴分詞對(duì)語料庫進(jìn)行分詞,保留分詞結(jié)果中的名詞、動(dòng)詞、形容詞、副詞、網(wǎng)絡(luò)詞語、成語和介詞短語,并去除重復(fù)詞語,從而得到特征詞集。最后,基于得到的特征詞集,使用word2vec 工具對(duì)原始詞匯進(jìn)行訓(xùn)練,得到每個(gè)詞的詞向量,最后通過相似度計(jì)算實(shí)現(xiàn)對(duì)已有情感詞典的擴(kuò)充。
擴(kuò)充詞的褒貶由3 名同領(lǐng)域?qū)W者進(jìn)行判斷:兩名學(xué)者同時(shí)判斷擴(kuò)充詞的詞性若是判斷結(jié)果相同,則取其判斷結(jié)果;若判斷結(jié)果不同,則由第三名學(xué)者判斷決定。
外賣評(píng)論主題即評(píng)論所描述的主要內(nèi)容,主題往往描述了產(chǎn)品的某些特征,一條評(píng)論往往涉及一個(gè)或多個(gè)主題,如“味道一般,但賣家的服務(wù)態(tài)度還不錯(cuò)。”該條評(píng)論包含口味與服務(wù)兩個(gè)主題。我們通過市場調(diào)研,并結(jié)合已有研究確定消費(fèi)者對(duì)于外賣商品用戶評(píng)論的五個(gè)主題:價(jià)格、分量、口味、衛(wèi)生和配送[28]。在確定用戶評(píng)論主題的基礎(chǔ)上,本文首先給出每個(gè)主題的核心詞匯,并基于上一節(jié)的情感詞典擴(kuò)充方法,得到每一個(gè)主題的主題詞庫。
由于消費(fèi)者對(duì)不同主題的偏好不同,需要確定不同主題的權(quán)重。本研究對(duì)外賣主要群體——學(xué)生和白領(lǐng)進(jìn)行問卷調(diào)查,問卷內(nèi)容包括外賣服務(wù)使用時(shí)長和頻次,以上述5 個(gè)主題的重要性打分(5 分為最高分,1分為最低分)。通過網(wǎng)絡(luò)發(fā)放,共收回100 份答卷,去除異常答卷和外賣軟件使用時(shí)間少于1年的答卷后,收得69 份有效答卷,得到結(jié)果,如表1所示。
表1 外賣評(píng)論主題重要性問卷統(tǒng)計(jì)表
調(diào)查結(jié)果顯示消費(fèi)者對(duì)于外賣的關(guān)注按衛(wèi)生、口味、價(jià)格、配送、分量依次遞減??紤]到最終計(jì)算出來的情感強(qiáng)度的合理性,本文所使用的權(quán)重計(jì)算公式如下:
式中Wi為第i 個(gè)主題的權(quán)重;Ti為第i 個(gè)主題問卷平均分;T 為所有主題的平均分集合。經(jīng)過計(jì)算,衛(wèi)生、口味、價(jià)格、配送、分量的權(quán)重依次為2.649、2.286、1.792、1.364 和1.000。
外賣評(píng)論情感極性計(jì)算是基于上述得到的情感詞庫和主題、主題詞庫及主題權(quán)重,首先判斷評(píng)論中每個(gè)分句所屬主題,然后計(jì)算該分句的情感值,最后將多個(gè)主題的情感值進(jìn)行加權(quán)求和,從而得到外賣評(píng)論的情感極性。計(jì)算外賣評(píng)論的情感極性的要點(diǎn)如下:(1)情感詞:識(shí)別文本的情感傾向最簡潔的方法就是統(tǒng)計(jì)一句話中情感詞的個(gè)數(shù),如“好”“壞”……,若是發(fā)現(xiàn)褒義詞則情感極性+1,若是發(fā)現(xiàn)貶義詞則情感極性-1。(2)程度詞:程度詞會(huì)增加情感詞的強(qiáng)烈程度,如“喜歡”與“非常喜歡”所表現(xiàn)的強(qiáng)烈程度是不同的,不同程度詞的強(qiáng)烈程度不一樣,表2列舉了部分程度副詞的強(qiáng)烈程度及權(quán)重。(3)否定詞:在進(jìn)行查詢的時(shí)候需要查找否定詞如“不”“不是”這樣的詞,“喜歡”與“不喜歡”具有相反的情感傾向。在查找否定詞時(shí)我們需要統(tǒng)計(jì)分句中否定詞的個(gè)數(shù),若否定詞個(gè)數(shù)為奇數(shù),那么,整體情感極性值會(huì)加上負(fù)號(hào),若否定詞個(gè)數(shù)為偶數(shù),則整體情感極性值不變。(4)主題詞:主題詞用于識(shí)別評(píng)論中涉及的主題,通過對(duì)主題進(jìn)行賦權(quán),將其權(quán)重同時(shí)賦給該主題下的所有主題詞,從主題層面來改進(jìn)基于詞典的情感極性計(jì)算。如“糊了”屬于口味主題,“態(tài)度差”屬于配送主題。
基于上述分析,基于主題的外賣評(píng)論情感極性算法如下:
1.對(duì)原數(shù)據(jù)清洗,去除非中文標(biāo)簽、表情符號(hào)等與評(píng)價(jià)無關(guān)的內(nèi)容。
2.將清洗好的文本按照標(biāo)點(diǎn)符號(hào)進(jìn)行分句,并對(duì)分句進(jìn)行分詞。
3.去除停用詞和文本中的無效符號(hào)。
4.遍歷分句的分詞結(jié)果,查找分句的情感詞,若出現(xiàn)多個(gè)相同的情感詞則總體情感值只按兩次計(jì)算,記錄情感詞的情感極性(積極或消極),以及在分句中的位置。
5.查找主題詞,判斷主題詞所屬的主題,查找該主題的權(quán)重,乘以情感值。
6.在上個(gè)情感詞和現(xiàn)找到的情感詞間查找程度詞,找到就停止搜尋。查找程度詞權(quán)值,乘以情感值。
7.在上個(gè)情感詞和當(dāng)前情感詞間查找否定詞并統(tǒng)計(jì)其數(shù)量,若數(shù)量為奇數(shù),則情感值×(-1),若為偶數(shù),則情感值×1。
8.計(jì)算整條評(píng)論的情感值:若情感值為正,則為好評(píng);若情感值為0,則為中評(píng);若情感值為負(fù),則為差評(píng)。
表2是使用的部分程度詞權(quán)重表。
表2 部分程度詞權(quán)重表
下面來舉例說明基于主題的外賣評(píng)論情感極性的計(jì)算方法。以評(píng)論“味道不行,賣家的服務(wù)態(tài)度還不錯(cuò)”為例,其情感計(jì)算方式如下。
最終情感得分= 主題(味道)×情感詞(不行)×主題詞(服務(wù)態(tài)度)×程度詞(還)×情感詞(不錯(cuò))= 2.286×(-1)+1.364×0.5×1=-1.604
從計(jì)算過程來看,該客戶對(duì)本商家外賣的口味持否定態(tài)度,對(duì)賣家服務(wù)保持輕微肯定。結(jié)合各主題權(quán)重后,該評(píng)論的情感極性為負(fù)值,消費(fèi)者對(duì)該商家的評(píng)論整體呈否定態(tài)度。
為了進(jìn)一步驗(yàn)證上述方法的有效性,本研究從未訓(xùn)練的樣本中選出100 條具有混合主題的評(píng)論進(jìn)行測試,使用基于主題的情感分析方法識(shí)別出83 條正面評(píng)論、17 條負(fù)面評(píng)論、0 條中性評(píng)論,使用不基于主題的方法最終識(shí)別出75 條正面評(píng)論、16 條負(fù)面評(píng)論、9 條中性評(píng)論。部分分析結(jié)果如表3所示。
表3 混合主題情感分析部分分析結(jié)果
如實(shí)驗(yàn)結(jié)果所示,使用基于主題的情感分析方法更精確地計(jì)算出了評(píng)論的情感極性值,如評(píng)論1、3、5、6,對(duì)于多個(gè)主題褒貶不一的用戶評(píng)論,基于主題的情感分析方法能夠更科學(xué)地計(jì)算出該評(píng)論的情感傾向,如評(píng)論2、4。
外賣商家情感指數(shù)是指在對(duì)商家所有用戶評(píng)論進(jìn)行情感極性量化的基礎(chǔ)上,利用綜合評(píng)價(jià)算法計(jì)算得出的所有用戶評(píng)論的總體情感強(qiáng)度。有研究中情感指數(shù)的計(jì)算都依賴于帶有情感傾向的文本的數(shù)量。例如劉苗等基于消費(fèi)相關(guān)的17 萬條新聞數(shù)據(jù),利用情感分析得到新聞的情感傾向,基于正向情感的文本數(shù)量和負(fù)向情感的文本數(shù)量構(gòu)建消費(fèi)情感指數(shù)[29];劉玉林等人基于正向評(píng)論數(shù)量與負(fù)面評(píng)論數(shù)量,計(jì)算商家的情感指數(shù)[30]。這些研究對(duì)于情感指數(shù)的計(jì)算都依賴于帶有情感傾向的文本的數(shù)量,情感指數(shù)的大小完全受到正負(fù)面評(píng)論數(shù)量的影響,而不考慮文本的情感極性。本研究在前人研究的基礎(chǔ)上,將單個(gè)評(píng)論的情感強(qiáng)度引入到總體情感指數(shù)計(jì)算中,使得情感指數(shù)對(duì)于文本情感總量的刻畫更為客觀具體。本研究的情感指數(shù)計(jì)算模型如下:
式中F 代表商家的情感指數(shù);Xi代表歸一化后的第i 個(gè)正面評(píng)論的情感極性;N 代表正面評(píng)論的個(gè)數(shù);Yj代表歸一化后的第j 個(gè)負(fù)面評(píng)論的情感極性;M 代表負(fù)面評(píng)論的個(gè)數(shù)。
情感極性歸一化處理公式如式(5)所示。
式中Xnew代表 歸一化的評(píng)論情感值;Xk代表第k 條評(píng)論;Xmin代表商家所有評(píng)論的情感極性最小值;Xmax代表商家所有評(píng)論的情感極性最大值。
實(shí)驗(yàn)數(shù)據(jù)來源于美團(tuán)外賣平臺(tái),本文隨機(jī)選擇了8 家商戶,使用Python 抓取了這8 家商戶從2018年4月到2019年4月之間的所有好評(píng)與差評(píng),然后按照等比例抽樣的原則,從每一個(gè)商家的用戶評(píng)論中根據(jù)好評(píng)與差評(píng)的比例隨機(jī)抽取200 條評(píng)論。實(shí)驗(yàn)數(shù)據(jù)及抽樣結(jié)果如表4所示。
表4 實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)及抽樣方案表
對(duì)于已得到的抽樣數(shù)據(jù),按照前文的情感分析方法,計(jì)算得到一個(gè)200×8 的情感強(qiáng)度值矩陣。對(duì)于情感傾向?yàn)樨?fù)值的樣本,歸一化會(huì)改變其取值方向,因此做以下處理:
1.記錄情感得分矩陣中所有負(fù)面評(píng)論的位置。
2.將情感得分矩陣中所有情感值做取絕對(duì)值處理(使得正負(fù)情感值處于同一尺度)。
3.對(duì)情感得分矩陣做歸一化處理(最大值、最小值為整個(gè)矩陣的最大值、最小值)。
4.查找歸一化處理后的情感得分矩陣中(1)中記錄的位置,對(duì)這些位置上的數(shù)值做乘-1 處理。
經(jīng)過上述處理的部分評(píng)論情感強(qiáng)度值矩陣表如表5所示。
表5 部分歸一化情感得分矩陣表
圖1展示了歸一化后商家的用戶評(píng)論情感強(qiáng)度值分布情況。由圖可知,所有商家的用戶評(píng)論情感強(qiáng)度值在-0.4 到0.4 之間,占統(tǒng)計(jì)樣本的90%以上。從分布態(tài)勢來看,商家的用戶評(píng)論情感強(qiáng)度分布比較符合正態(tài)分布,表明異常過度、褒貶的評(píng)論占總樣本的比例相對(duì)較少,說明本研究提出的情感分析方法得出的情感強(qiáng)度較為符合真實(shí)情況。
圖1 歸一化后情感分析圖
根據(jù)前文情感指數(shù)計(jì)算方法和由計(jì)算得到的情感得分矩陣,得到最終的情感指數(shù)如表6所示。表6第一行為外賣平臺(tái)綜合用戶評(píng)分和評(píng)論得出的商家綜合評(píng)分,第二行為本研究基于情感分析方法對(duì)用戶評(píng)論進(jìn)行計(jì)算得到的商家情感指數(shù)。為了更直觀展示商家綜合評(píng)分與情感指數(shù)的關(guān)系,本研究繪制了如圖2所示的商家綜合得分與情感指數(shù)對(duì)照?qǐng)D。由圖可知本研究計(jì)算得出的情感指數(shù)與網(wǎng)站給出的商家評(píng)分在排序上表現(xiàn)出了較強(qiáng)的一致性,表明本研究提出的情感指數(shù)計(jì)算方法具有較強(qiáng)的科學(xué)性,情感指數(shù)的計(jì)算結(jié)果可替代商家評(píng)分來表征商家的信譽(yù)值。
表6 商家綜合評(píng)分與情感指數(shù)對(duì)照表
圖2 商家綜合評(píng)分與情感指數(shù)比較圖
為了進(jìn)一步驗(yàn)證計(jì)算結(jié)果的科學(xué)性,本研究計(jì)算這8 個(gè)商家的網(wǎng)站評(píng)分值與本研究計(jì)算得出的情感指數(shù)的皮爾遜相關(guān)系數(shù)為0.907,根據(jù)表7所示的相關(guān)性強(qiáng)度對(duì)照表,表明網(wǎng)站評(píng)分與本文的計(jì)算結(jié)果具有極強(qiáng)的相關(guān)關(guān)系,進(jìn)一步說明了本研究提出的情感分析方法的有效性。
表7 相關(guān)性強(qiáng)度對(duì)照表
為了驗(yàn)證本研究中情感分析方法的穩(wěn)定性,本研究在第一次數(shù)據(jù)采集3 周后,對(duì)上述8 個(gè)商家的數(shù)據(jù)進(jìn)行二次采集,采集數(shù)據(jù)包括每個(gè)商家更新后的商家評(píng)分和用戶評(píng)論,使用相同的實(shí)驗(yàn)方法進(jìn)行計(jì)算,結(jié)果如表8所示。
表8 第二次實(shí)驗(yàn)對(duì)照
其中g(shù)rade1 為第一次采集的商戶總體評(píng)分,grade2 為第二次采集的商戶總體評(píng)分,SampleP1 為第一次好評(píng)抽樣數(shù)量,SampleP2 為第二次好評(píng)抽樣數(shù)量,SampleN1 為第一次差評(píng)抽樣數(shù)量,SampleN2 為第二次差評(píng)抽樣數(shù)量,score1 為用本文方法第一次實(shí)驗(yàn)的情感指數(shù)得分,score2 為用本文方法第二次實(shí)驗(yàn)的情感指數(shù)得分。
兩次實(shí)驗(yàn)對(duì)比可以發(fā)現(xiàn)8 個(gè)商戶的評(píng)分僅少部分存在變化。商戶1 從4.6 分下降到4.5 分,商戶5 從4.2分上升到4.4 分,商戶6 從4.4 分上升到4.6 分。針對(duì)商戶1 的好評(píng)與差評(píng)比例有所上升,說明新增評(píng)論中正面情感的量有了增加。商戶5 的情感指數(shù)相差不多,且其評(píng)論中好評(píng)與差評(píng)比例也相近,但是其商家評(píng)分卻從4.2 上升到4.4,主要原因是新增了大量高評(píng)分的用戶評(píng)論。商戶6 的情感指數(shù)有了不小提升,但評(píng)論好評(píng)差評(píng)比例相差不大,主要原因是新增評(píng)論中其正面評(píng)論情感強(qiáng)度較強(qiáng)。商戶8 雖然評(píng)分沒有改變但是其好評(píng)與差評(píng)的比例下降,說明新增評(píng)論中差評(píng)比例上升,消費(fèi)者對(duì)于商家的認(rèn)可程度下降。基于上述結(jié)果分析可知,本研究提出的情感指數(shù)計(jì)算方法能較為準(zhǔn)確地反映商家的真實(shí)評(píng)分,具有較好的穩(wěn)定性和科學(xué)性。
用戶評(píng)論是用戶對(duì)購買和使用商家產(chǎn)品或服務(wù)后所得真實(shí)體驗(yàn)的文字描述,充分挖掘和利用用戶的評(píng)論信息對(duì)商家提升產(chǎn)品或服務(wù)質(zhì)量、管理機(jī)構(gòu)管理商家和消費(fèi)者制定購買決策都具有重要的現(xiàn)實(shí)意義。本研究提出了一套基于情感分析的外賣商家評(píng)分方法,該方法首先構(gòu)建外賣領(lǐng)域情感詞典,確定外賣評(píng)論的主題、主題詞典及主題權(quán)重,然后,基于外賣領(lǐng)域詞典和主題詞典,計(jì)算每一個(gè)評(píng)論文本的情感傾向及強(qiáng)度,最后,綜合商家評(píng)論的情感極性,得出商家的情感指數(shù),并將之作為最后的商家評(píng)分?;诿缊F(tuán)網(wǎng)用戶評(píng)論數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,本研究提出的基于情感分析的外賣商家評(píng)分方法能夠有效挖掘用戶評(píng)論中的情感成分,評(píng)分結(jié)果與網(wǎng)站所給出的評(píng)分結(jié)果具有較強(qiáng)的一致性。
本研究基于主題的情感分析方法提升單文本情感分析的粒度,主題權(quán)重的引入使得混合主題的用戶評(píng)論情感分析結(jié)果更加符合實(shí)際情況。融合情感強(qiáng)度的情感指數(shù)計(jì)算方法克服了傳統(tǒng)的基于情感傾向的情感指數(shù)計(jì)算方法難以對(duì)同一類型(好評(píng)或差評(píng))進(jìn)行更細(xì)粒度區(qū)分的缺點(diǎn),確保了最終評(píng)價(jià)結(jié)果與實(shí)際情況更加契合。本研究提出的基于情感分析的商家評(píng)論方法為平臺(tái)的商家管理提供了新的思路,評(píng)分結(jié)果可為消費(fèi)者制定購買決策提供參考,從而減少消費(fèi)者面對(duì)海量用戶評(píng)論時(shí)的決策成本。
本研究仍然存在不足,未來可以從以下兩個(gè)方面進(jìn)一步展開研究:一是本研究基于主題的情感分析所需要的主題詞庫是通過人工判別的方法構(gòu)建的,效率有待提高,后續(xù)研究可以考慮如何通過自主發(fā)現(xiàn)主題詞匯來提高分析效率。二是本研究所提出的研究方法只在外賣領(lǐng)域進(jìn)行了實(shí)驗(yàn)驗(yàn)證,未來研究可以拓展至其他領(lǐng)域,進(jìn)一步驗(yàn)證該研究方法的通用性。