劉宏宇,高艷,陳寬
(1.黑龍江八一農(nóng)墾大學(xué),大慶 163319;2.青島創(chuàng)跡軟件有限公司)
生鮮電商經(jīng)歷了5 年的高速發(fā)展,2019 年的生鮮電商市場銷售額比上一年度增長了65%。行業(yè)的快速發(fā)展引來諸多資本的進入,也加劇了企業(yè)間的競爭。但是頻繁發(fā)生的消費者投訴與維權(quán)行為,難以掩蓋其過度粗放發(fā)展的事實。根據(jù)《2019 年度中國生鮮電商消費投訴數(shù)據(jù)與典型案例報告》顯示,電商糾紛調(diào)解平臺“電訴寶”在2019 年共收到數(shù)百起消費者對生鮮電商的不滿意投訴,其中物流是熱點被投訴問題,而像中糧我買網(wǎng)、本來生活、順豐優(yōu)選、易果生鮮等知名度較高電商平臺被評為“不建議下單”,許多中小型生鮮電商企業(yè)也正面臨“吃虧”“關(guān)店”“行業(yè)洗牌”等煎熬。行業(yè)競爭加劇的同時,消費者的需求也在不斷提高,生鮮物流中存在的生鮮不“鮮”、用戶體驗不佳等諸多問題,說明已有發(fā)展模式已經(jīng)跟不上市場發(fā)展的需要[1-2]。物流活動作為連接企業(yè)與消費者的直接要素,不僅事關(guān)消費體驗,也是企業(yè)競爭力的保障。如何提高物流服務(wù)水平從而提升消費者滿意度是生鮮電商企業(yè)突破當前發(fā)展瓶頸的主要路徑。
電商消費者常會利用平臺發(fā)表對物流服務(wù)的文字評論形成文本化的網(wǎng)絡(luò)評論,這些評論不但表達個人的滿意度,同時也會對其他消費行為產(chǎn)生影響,如何從大量的網(wǎng)絡(luò)評論中分離出不同要素,并分析其對消費者滿意度的影響,是當前理論研究與企業(yè)實踐關(guān)注的熱點問題[3]。已有電商平臺不是按照語義進行評論分類,因而不能正確區(qū)分消費者滿意度,為此,利用網(wǎng)絡(luò)爬蟲獲取消費者購后網(wǎng)絡(luò)評論,并應(yīng)用機器學(xué)習(xí)方法根據(jù)評論文本語義進行滿意度分類,通過數(shù)據(jù)挖掘方法建立物流詞匯與滿意度詞匯的關(guān)聯(lián)關(guān)系,分析物流要素對消費者滿意度的影響機理,為企業(yè)科學(xué)改進物流服務(wù)質(zhì)量、提高消費者滿意度提供理論支持。
物流從本質(zhì)上講屬于一種服務(wù)產(chǎn)品。物流服務(wù)是從接收客戶訂單開始到將商品送到客戶手中為止所發(fā)生的所有服務(wù)活動,是通過運輸、存儲等活動實現(xiàn)產(chǎn)品或服務(wù)增值,其本質(zhì)是更好地滿足顧客需求,即保證顧客需要的商品在顧客要求的時間內(nèi)準時送達,包括:產(chǎn)品準備、產(chǎn)品輸送、品質(zhì)保證、合理的價值服務(wù)[4]。Perrault[5]認為物流服務(wù)是指企業(yè)以滿足客戶需求為中心,在適當?shù)臅r間、地點以適當?shù)膬r格和方式,提供適當?shù)姆?wù)產(chǎn)品,從而實現(xiàn)價值增值的過程。該觀點一直以來受到其他學(xué)者的廣泛認可。因此,物流服務(wù)的質(zhì)量衡量應(yīng)以客戶的感知與體驗為中心,即客戶感受到的物流服務(wù)和預(yù)期對比評價的結(jié)果[6]。而在大數(shù)據(jù)背景下,企業(yè)應(yīng)通過采集各類消費者互聯(lián)網(wǎng)行為數(shù)據(jù),來分析其物流需求,判斷物流服務(wù)過程要素的水平與能力并進行優(yōu)化,進而滿足消費者個性化需要[7]。張振華[8]認為消費在線網(wǎng)絡(luò)評論作為是發(fā)掘企業(yè)物流服務(wù)質(zhì)量問題的重要途徑,企業(yè)應(yīng)當從用戶感知視角,從在線評論數(shù)據(jù)中識別并分析存在的服務(wù)質(zhì)量問題,進而推動物流服務(wù)創(chuàng)新,并以家具產(chǎn)品網(wǎng)絡(luò)評論為數(shù)據(jù)來源,構(gòu)建了電子商務(wù)物流服務(wù)質(zhì)量問題發(fā)掘模型。侯玉林[9]認為調(diào)查問卷方式已很難滿足電商環(huán)境下企業(yè)把握顧客需求、監(jiān)測與提升快遞服務(wù)質(zhì)量的需求,因此,在研究中以快遞網(wǎng)絡(luò)評論為數(shù)據(jù)來源,提出一種基于文本意見挖掘的快遞服務(wù)質(zhì)量評價方法,通過對用戶評論文本的詞性情感分析判斷快遞服務(wù)水平,進而提出了快遞企業(yè)快遞服務(wù)質(zhì)量評價以及監(jiān)測模式與策略。
生鮮電商是指企業(yè)或商戶借助網(wǎng)購平臺經(jīng)營生鮮產(chǎn)品的電子商務(wù)活動,近年來逐漸成為理論研究的熱點[10]。電商物流是包含著電子商務(wù)和物流兩個概念的復(fù)合名詞。沈坤華[11]從產(chǎn)品、物流、政府責任三個方面針對生鮮電商發(fā)展的問題提出相關(guān)解決對策。余建海[12]認為生鮮電商物流是電商物流的子集,但對運輸、儲存、配送等物流服務(wù)方面要求更加嚴格,與一般物流服務(wù)相比,特殊性更加明顯。已有生鮮物流對消費者滿意度影響的研究,Tang[13]指出我國農(nóng)產(chǎn)品在流通過程中存在基礎(chǔ)條件差、冷鏈設(shè)備不足、物流信息化水平低等問題,導(dǎo)致農(nóng)產(chǎn)品流通環(huán)節(jié)貨損嚴重。針對生鮮電商發(fā)展瓶頸,許多學(xué)者從自營冷鏈配送、優(yōu)化供應(yīng)鏈運營、原產(chǎn)地集中采購、包裝工藝等方面提出解決對策[14-15]。而物流配送作為生鮮電商的重要環(huán)節(jié),已有研究也分析了電子商務(wù)物流服務(wù)對消費者態(tài)度的影響關(guān)系[16-17]。Chou[18]通過采集臺灣地區(qū)用戶樣本,分析了配送服務(wù)質(zhì)量對消費者品牌態(tài)度的影響,結(jié)果表明準時交付、低貨損率、送貨員專業(yè)等被顧客視作配送可靠性,并會影響顧客品牌忠誠。徐廣姝[19]通過問卷調(diào)查與粗糙集數(shù)據(jù)處理方法,分析了生鮮電商服務(wù)要素對顧客滿意度的影響,實證結(jié)果顯示,產(chǎn)品質(zhì)量、發(fā)貨和運送速度、多元配送增值服務(wù)等要素能夠提高顧客的滿意度。
通過文獻的查閱梳理,發(fā)現(xiàn)生鮮電商領(lǐng)域的研究主要集中在生鮮電商行業(yè)發(fā)展,相關(guān)研究大多處于宏觀層面,物流服務(wù)多作為電商服務(wù)的一個組成要素進行整體分析,而從生鮮電商視角,從微觀層面針對物流服務(wù)要素,及其對滿意度影響機理的研究相對匱乏[20]。在研究方法上,已有文獻多通過定性研究,從宏觀層面進行分析,提出行業(yè)發(fā)展對策,在定量研究方法的使用上,已有文獻主要以問卷調(diào)查的實證分析為主。隨著消費者網(wǎng)絡(luò)生成內(nèi)容的日益增多,應(yīng)用數(shù)據(jù)挖掘方法挖掘用戶評論逐漸成為定量研究的趨勢和熱點。如何從網(wǎng)絡(luò)評論文本中挖掘出用戶觀點對互聯(lián)網(wǎng)環(huán)境下的企業(yè)競爭力提升具有重要的實用價值[21]。
意見挖掘又稱文本情感分析,是指對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,從而分析出用戶對于實體及其屬性所表達的觀點、情感、評價、態(tài)度和情緒,要從用戶生成內(nèi)容中挖掘出有用的信息和知識,就需要對意見挖掘與情感分析問題進行研究,這已經(jīng)成為網(wǎng)絡(luò)社會媒體分析的核心問題[22]。
Mudambi 和Schuff[23]以亞馬遜網(wǎng)站上的在線評論為研究對象,經(jīng)過研究得出,在線評論有用性具有顯著性影響的是評論的情感極性與評論字數(shù),商品類型對滿意度也有一定影響。王新宇[24]采用情感詞典對文本特征空間進行降維、應(yīng)用TF-IDF 計算權(quán)重,利用SVM 機器學(xué)習(xí)模型對文本情感進行分類,結(jié)果表明,該方法對旅游評論文本情感分類有效。Wang等[25]利用情感分析方法構(gòu)建Logistic 回歸模型分析不同產(chǎn)品屬性對消費者滿意度的影響。郭立秀[14]基于文本挖掘的方法對電商平臺網(wǎng)絡(luò)評論進行挖掘,研究我國生鮮電商企業(yè)顧客滿意度的影響因素,研究結(jié)果表明物流配送作為整體要素,與電商品牌、產(chǎn)品質(zhì)量、客服態(tài)度,是影響顧客好評的關(guān)鍵要素。
以生鮮電商物流服務(wù)為研究對象,從消費者滿意視角出發(fā),利用機器學(xué)習(xí)方法和Apriori 算法對電商平臺用戶在線評論進行意見挖掘,旨在深入分析與探究生鮮物流服務(wù)影響顧客滿意度的機理,以此提出物流服務(wù)優(yōu)化對策,為生鮮電商企業(yè)提升競爭優(yōu)勢提供理論支持。在平臺選擇上,選取京東生鮮作為網(wǎng)絡(luò)評論獲取平臺。京東生鮮作為國內(nèi)最大的生鮮電商綜合性平臺之一,其在平臺知名度、用戶使用率、物流滿意度等多個方面都位居國內(nèi)生鮮電商第一位。
首先對采集的網(wǎng)絡(luò)評論文本進行清洗,應(yīng)用有監(jiān)督機器學(xué)習(xí)方法,依據(jù)已有研究的滿意度情感分類詞典,對部分評論文本進行滿意度手工標記,然后訓(xùn)練形成樸素貝葉斯分類模型,最終形成全部評論文本的滿意度情感分類。
2.1.1 網(wǎng)絡(luò)評論文本采集
以京東生鮮在售車厘子產(chǎn)品的用戶評論為數(shù)據(jù)獲取對象,利用Python3.6 編寫爬蟲程序抓取了京東生鮮平臺上50 個商戶的車厘子產(chǎn)品用戶評論,共抓取了4.6 萬余條評論文本。
2.1.2 評論文本清洗
由于在網(wǎng)上抓取的文本存在一定程度的噪聲,所以有必要對采集的評論文本進行數(shù)據(jù)清洗,以確保分析結(jié)果更加準確。利用Excel 的len()語句刪除字符數(shù)量少于3,以及內(nèi)容重復(fù)的評論文本,保證評論文本的可用性和唯一性。經(jīng)過對評論文本的清洗,共計保留有效評論文本45 140 條。
2.2.1 評論文本分詞
由于中文語言文字的特殊性,在進行文本挖掘前,必須對文本進行分詞。使用的分詞工具是Python的“jieba”(結(jié)巴)中文分詞模塊。分詞示例:原句“物流很快,東西也很新鮮,為快遞小哥和商家點贊,下次還會購買”,在結(jié)巴精確分詞模式輸出為:“物流/很快,東西/也/很/新鮮/,/為/快遞/小哥/和/商家/點贊/,/下次/還會/購買/”。
2.2.2 滿意度情感分類的標注
選擇有監(jiān)督的機器學(xué)習(xí)方法,通過人工標注形式對訓(xùn)練集進行分類,在標記規(guī)則上基于情感詞語表達的情感強度進行標記,情感分類類型為滿意、中性、不滿意三種滿意度類型。李艷翠等(2014)針對亞馬遜網(wǎng)上收集的產(chǎn)品評論語料的情感分析實驗表明,基于有監(jiān)督方法比無監(jiān)督學(xué)習(xí)對情感特征和評論質(zhì)量的分析效果有顯著提高[26]。消費者滿意度情感分類詞典依據(jù)已有文獻研究結(jié)論形成[27],如表1 所示:
表1 滿意情感分類規(guī)則詞典示例Table 1 Emotional classification rules dictionary examples
根據(jù)已確定的分類規(guī)則詞典,對1 萬條評論文本進行手工標記,部分標記結(jié)果如表2 所示:
2.2.3 基于樸素貝葉斯的評論文本滿意情感分類的實現(xiàn)
應(yīng)用留出法,將上文人工標記的1 萬條評論文本中的8 000 條作為訓(xùn)練集,剩下的2 000 條作為測試集進行情感分類精度測試,且滿足:人工標記樣本訓(xùn)練集∪測試集,訓(xùn)練集∩測試集=φ??倶颖局惺O碌?5 140 條評論分為18 個文本集,然后依次利用訓(xùn)練好的模型進行預(yù)測分類。
表2 評論情感極性手工標記文本樣例Table 2 Comment on emotional polarity manual markup text samples
選取多項式樸素貝葉斯模型進行預(yù)測分類。對分類任務(wù)來說,在所有相關(guān)概率都已知的理想情況下,貝葉斯模型考慮如何基于這些概率和誤判損失來選擇最優(yōu)的類別標記[28]。樸素貝葉斯分類器采用屬性條件獨立性假設(shè)原則,即對于已知事物類別,假設(shè)所有的屬性互相獨立,并假設(shè)每個屬性單獨對分類結(jié)果發(fā)生影響,表達式見公式1:
其中d為屬性數(shù)目,xi為x在第i個屬性上的取值。由于對于所有類別來說P(x)相同,因此貝葉斯的判定準則如公式2:
(1)模型訓(xùn)練
通過Python 語言構(gòu)建多項式樸素貝葉斯模型,對標注的1 萬條文本中的8 000 條進行分類學(xué)習(xí),2 000 條作為精度驗證。模型分類精度如表3 所示:
表3 多項式樸素貝葉斯算法分類精度Table 3 Classification accuracy of polynomia naive Bayesian algorithm
由表3 可知,該算法的訓(xùn)練集與測試集的準確率均大于85%,預(yù)測分類效果比較理想。
(2)網(wǎng)絡(luò)評論文本測試集滿意情感分類
該部分實驗對總樣本余下的35 140 條評論分為18 個文本集,每個文本集2 000 條左右評論,依次利用訓(xùn)練好的模型進行文本情感分類預(yù)測。
(3)評論文本滿意情感分類與統(tǒng)計
本部分對象文本集為:8 000 條訓(xùn)練集(人工標記)、2 000 條測試集(人工標記)、35 140 條預(yù)測集(機器自動標記),共計45 140 條評論文本,最終將全部評論分類為3 個文本集合,分別為“滿意”文本集、“中性”文本集、“不滿意”文本集,統(tǒng)計情況如表4 所示:
表4 總體評論文本滿意度情感分類分布Table 4 Satisfaction polarity distribution of general comment texts
在上文分類基礎(chǔ)上,本部分對不同情感分類下的物流評論進行提取,并設(shè)定在“滿意”文本集中提取出的物流評論為正向物流評論,“中性”文本集中提取出的為中性物流評論,“不滿意”文本集中提取出的為負向物流評論。
參考搜狗平臺物流詞匯包,提取出了描述物流服務(wù)相關(guān)詞匯,構(gòu)建匹配詞典,并通過該詞典匹配出與物流相關(guān)評論文本集合。如表5 所示:
根據(jù)建立好的物流評論詞匯詞典,分別在“滿意”評論文本集、“中性”評論文本集與“不滿意”評論文本集中遍歷每一句評論,若評論語句中含有詞典中的任一詞匯,就將此評論文本語句提取出來。例如,“物流很給力,給小哥點贊”此句評論中含有“物流”和“小哥”等詞,所以就將此句評論提取出來;“車厘子味道不錯,下次還會購買”,此句評論中不含詞典中的詞語,所以,此句不提取。此次實驗,在“滿意”評論文本集提取正向物流評論12 640 條,在“中性”評論文本集提取中性物流評論2 110 條,在“不滿意”評論文本集中提取負向物流評論5 299 條。由表6 可知,正向描述物流的占總物流評論文本為63%,負向文本占比26.5%。
表5 物流評論詞匯匹配詞典示例Table 5 Matching logistics comment text dictionary examples
表6 物流評論情感極性分類Table 6 Emotional polarity of logistics comments
本部分運用詞頻分析法,對正向、負向物流評論進行詞頻分析。
(1)正向物流評論文本詞頻分析
利用Python 語言的“結(jié)巴”分詞工具對正向物流評論文本進行分詞并做詞頻統(tǒng)計,詞頻統(tǒng)計信息如圖1 所示。
圖1 正向物流評論文本前20 位詞頻統(tǒng)計柱形圖Fig.1 Statistical column map of top 20 word frequency in positive logistics comment text
前20 位高頻詞在一定程度說明消費者在網(wǎng)購中比較注重的因素,在這些因素中,與物流相關(guān)的詞有“物流”“包裝”“很快”“快遞”“速度”“發(fā)貨”。通過詞頻統(tǒng)計,可以推理出消費者首要關(guān)注的是物流服務(wù)能否保證生鮮品的新鮮程度。
(2)負向物流評論文本詞頻分析
由圖2 可知,在負向評論中消費者關(guān)注詞匯的排序,為進一步分析,下面統(tǒng)計出物流及相關(guān)詞匯的詞頻,如表7 所示:
圖2 負向物流評論文本前20 位詞頻統(tǒng)計柱形圖Fig.2 Statistical column map of top 20 word frequency in negative logistics comment text
表7 負向物流評論詞頻統(tǒng)計Table 7 Negative logistics comments on logistics related terms
由表7 可知,在負向物流評論中,與物流相關(guān)詞匯有“物流”“快遞”“慢”“發(fā)貨”“包裝”,并可推理出消費者可能會因為物流因素導(dǎo)致的產(chǎn)品不新鮮而發(fā)表負向評論。下文將對具體的物流服務(wù)要素對滿意度的影響機理做進一步分析。
為了能夠進一步挖掘評論文本中的物流服務(wù)要素與消費者態(tài)度的關(guān)聯(lián)關(guān)系,本部分基于關(guān)聯(lián)規(guī)則的Apriori 算法,挖掘消費者評論文本中的物流評論詞匯與消費者滿意詞匯的關(guān)聯(lián)關(guān)系,試圖發(fā)現(xiàn)影響消費者滿意情感與不滿意情感的關(guān)鍵物流詞匯,并進一步分析物流服務(wù)對消費者滿意度影響機理。其中,文本數(shù)據(jù)來自于上文提取出的“滿意”和“不滿意”物流評論文本。消費者滿意與不滿意詞匯來源上文滿意度情感詞典。
關(guān)聯(lián)規(guī)則能夠反映兩個項集同時出現(xiàn)的頻繁性。Apriori 算法主要是通過頻繁項集的發(fā)現(xiàn)來產(chǎn)生關(guān)聯(lián)規(guī)則[29]。本部分應(yīng)用關(guān)聯(lián)規(guī)則來挖掘正向、負向評論中物流詞匯與滿意度詞匯同時出現(xiàn)的關(guān)聯(lián)關(guān)系。描述關(guān)聯(lián)規(guī)則的度量包括支持度(support)、置信度(confidence),當項集之間的支持度和置信度大于閾值則被認為具有強關(guān)聯(lián)關(guān)系。在研究中,支持度support(A?B)表示詞匯A 和詞匯B 同時出現(xiàn)的概率,置信度confidence(A?B)表示詞匯A 出現(xiàn)的同時詞匯B 也出現(xiàn)的概率,表達式見公式3、4:
提升度lifi(A?B)用來反映詞匯A 和詞匯B 的相關(guān)性,如果lift>1,則A 和B 的出現(xiàn)是正相關(guān),lift<1表示A 和B 的出現(xiàn)為負相關(guān),lift=1 表示A 和B 是相互獨立的,表達式見公式5:
研究設(shè)定lift>1、support>0.01、confidence>平均值,作為閾值,用以挖掘詞匯間的關(guān)聯(lián)關(guān)系。
本部分應(yīng)用R 語言對評論文本進行分詞并提取。提取出的詞匯進行同義詞置換,將“物流”“快遞”“配送”等詞匯置換為“物流”,將“特別滿意”“非常滿意”“挺滿意的”等詞匯置換為“很滿意”,將“還可以”“還行”“不錯”等詞匯置換為“很好”,將表示速度快相關(guān)詞匯,置換為“速度快”,并轉(zhuǎn)換形成transaction類型數(shù)據(jù)集,進行Apriori 關(guān)聯(lián)分析。度量閾值為lift>1、support>0.01、confidence>0.328 5(均值),對關(guān)聯(lián)分析結(jié)果進行篩選,數(shù)據(jù)處理結(jié)果及可視化如表8 和圖3 所示:
表8 正向評論物流與滿意詞匯關(guān)聯(lián)分析結(jié)果Table 8 Result of logistics and satisfaction vocabularies association analysis in positive comments
由表8 可知,在正向評論中的詞匯“包裝”“速度快”“物流”“送貨”“發(fā)貨”詞匯都會與表達滿意的詞匯“很滿意”“很好”存在有效的相關(guān)性(lift>1),可以看出生鮮電商企業(yè)的物流服務(wù)質(zhì)量積極影響消費者滿意,尤其是上述詞匯代表的物流作業(yè)環(huán)節(jié)服務(wù)質(zhì)量與滿意度相關(guān)性較高。
根據(jù)置信度(confidence)值挖掘詞匯間的關(guān)聯(lián)度分析如下:{完好}=>{包裝} 置信度為0.888 2,{冰袋}=>{包裝}置信度為0.597 3,表明在“完好”詞匯出現(xiàn)的情況下,“包裝”詞匯出現(xiàn)的概率為88%以上,“冰袋”詞匯出現(xiàn)時,“包裝”出現(xiàn)的概率為59%以上,一定程度說明消費者期望包裝內(nèi)附冰袋,并且完好無損;{送貨}=>{速度快} 置信度為0.608 8,{發(fā)貨}=>{速度快} 置信度為0.505 2,{發(fā)貨,速度快}=>{很滿意}置信度為0.333 3,說明消費者在提及送貨與發(fā)貨環(huán)節(jié)時,期望更快的發(fā)、送速度;{物流}=>{速度快}置信度為0.401 3,{速度快,物流}=>{很滿意} 置信度為0.330 8,說明消費者同樣對整個物流過程的速度同樣有快速的需求。
根據(jù)詞匯支持度(support)值降序排序的前六項為:{物流} =>{速度快}(0.081)、{很滿意}=>{很新鮮}(0.048 2)、{包裝} =>{很新鮮}(0.046 7)、{很滿意}=>{物流}(0.041 7)、{發(fā)貨}=>{速度快}(0.027)、{送貨}=>{速度快}(0.025 5),支持度表明了詞匯組合在所有評論中同時出現(xiàn)的概率,也一定程度反映了消費者關(guān)注度排序,而這其中“物流”“速度快”代表的相近詞匯在正向評論中出現(xiàn)的概率最高。
圖3 正向評論文本詞匯關(guān)聯(lián)分析有向圖Fig.3 The directed graph of positive comment text vocabulary association analysis
通過以上分析可以看出,消費者對發(fā)貨、送貨速度、整個物流速度、包裝質(zhì)量有著較高的期望,并且會高比例正向影響消費者滿意,可能因為消費者認為快速的物流服務(wù)、高質(zhì)量的包裝會影響產(chǎn)品新鮮度,進而影響消費體驗。物流詞匯與滿意度詞匯的整體關(guān)聯(lián)關(guān)系如圖3 所示,其中圓圈大小表示對應(yīng)箭頭鏈接的兩個詞匯的置信度,圓圈顏色表示兩個詞匯的提升度。
將負向物流評論文本進行分詞以后,運用R 語言的arules 包進行關(guān)聯(lián)分析。首先將提取出的詞匯進行同義詞置換,將“物流”“快遞”“順豐”“配送”等詞匯置換為“物流”,將“不太好”“太差了”等詞匯置換為“不滿意”,將“破損”“損壞”等次置換為“不可靠”,將表示速度慢的相關(guān)詞匯,置換為“速度慢”,并將評論詞匯轉(zhuǎn)換形成transaction 類型數(shù)據(jù)集,并進行Apriori 關(guān)聯(lián)分析。度量閾值為lift>1、confidence>0.317 1(均值)、support>0.01 為,并對關(guān)聯(lián)分析結(jié)果進行篩選,數(shù)據(jù)處理結(jié)果及可視化如表9 和圖4 所示。
表9 負向評論物流與滿意詞匯關(guān)聯(lián)分析結(jié)果Table 9 Result of logistics and satisfaction vocabularies association analysis in negative comments
由表9 可知,在負向評論中,與滿意度詞匯存在有效相關(guān)性的詞匯(lift/confidence)為{不會再買}=>{不新鮮}(1.175 3/0.793 3)、{不滿意}=>{不新鮮}(1.170 2/0.789 5),可見造成消費者負面情緒的主要因素在于生鮮品的新鮮程度達不到預(yù)期;而與“不新鮮”詞匯存在有效相關(guān)性的詞匯組合為{不新鮮}=>{物流,包裝}(1.594 8/0.524 8)、{不新鮮}=>{速度慢,物流}(1.332 2/0.375 7)、{不新鮮}=>{速度慢,發(fā)貨}(1.321 7/0.372 8),這個結(jié)果與正向物流評論文本關(guān)聯(lián)分析結(jié)果相似,進一步說明了這些物流服務(wù)要素與消費者滿意相關(guān)性較高。
根據(jù)置信度(confidence)值挖掘詞匯間的關(guān)聯(lián)度分析如下:{發(fā)貨}=>{速度慢}、{物流}=>{速度慢} 分別為0.510 4、0.457 8,說明負向評論中詞匯“發(fā)貨”和“物流”的出現(xiàn)會有45%~50%的概率提到“速度慢”相近的詞匯,{不新鮮,速度慢}=>{物流}置信度0.524 8,說明消費者認為物流速度慢會影響新鮮度因此會降低滿意度;{包裝}=>{不可靠}的置信度0.334 7,說明負向評論中出現(xiàn)“包裝”詞匯時,“不可靠”相近的詞匯出現(xiàn)的概率為33.5%左右。
根據(jù)詞匯支持度(support)值降序排序,{物流}=>{速度慢}(0.150 6)、{發(fā)貨}=>{速度慢}(0.091 9)、{不滿意}=>{不新鮮}(0.080 1)、{不會再買}=>{不新鮮}(0.075 9),支持度表明了詞匯組合在所有評論中出現(xiàn)的比例,也一定程度反映了消費者關(guān)注度排序。其中“物流”“速度慢”代表的相近詞匯在負向評論中同時出現(xiàn)的概率最高。
物流詞匯與滿意度詞匯的整體關(guān)聯(lián)關(guān)系如圖4所示,其中圓圈大小表示對應(yīng)箭頭鏈接的兩個詞匯的置信度,圓圈顏色表示兩個詞匯的提升度。
通過上文對京東電商平臺車厘子評論文本的意見挖掘,發(fā)現(xiàn)高質(zhì)量的物流服務(wù)與消費者購物體驗高度相關(guān)。根據(jù)評論文的詞匯提取、情感分析與關(guān)聯(lián)分析,梳理出了影響消費者滿意的物流要素,在此基礎(chǔ)上進一步提出生鮮電商物流服務(wù)優(yōu)化策略。
圖4 負向評論文本詞匯關(guān)聯(lián)分析有向圖Fig.4 The directed graph of negative comment text vocabulary association analysis
通過評論文本挖掘,消費者在線上購買生鮮時,對物流時效性要求非常高,消費者可能認為較短的物流運作時長可以降低生鮮品變質(zhì)的風(fēng)險。但是,受到產(chǎn)地、季節(jié)等因素影響,部分生鮮品的運輸距離過長,而電商模式下產(chǎn)地企業(yè)多需要以小單快遞物流模式面向終端用戶直接發(fā)貨,導(dǎo)致中轉(zhuǎn)環(huán)節(jié)增多,更容易增加物流時長與貨損風(fēng)險。基于此,生鮮生產(chǎn)企業(yè)可以與渠道平臺或物流企業(yè)開展前置倉的布局,改變小單快遞零擔發(fā)貨模式為整車批量發(fā)貨至銷地倉庫,減少中間作業(yè)環(huán)節(jié),可以有效降低貨損率,同時可以大幅縮減消費者下單后的物流響應(yīng)周期,甚至實現(xiàn)當日或次日達。而銷地前置倉布局不但需要增設(shè)銷地物流倉儲節(jié)點,更主要的是構(gòu)建產(chǎn)銷聯(lián)動的銷售預(yù)測機制,通過引入機器學(xué)習(xí)算法,挖掘銷地用戶行為,有助于提高預(yù)測準確率。
通過上文對網(wǎng)絡(luò)評論的挖掘,結(jié)果顯示“發(fā)貨”與“速度快”、“速度慢”的置信度分別為0.505 2、0.510 4,由此可知,消費者較為重視發(fā)貨的速度。許多生鮮企業(yè)往往重視激勵消費者下單,忽視了下單后與客戶溝通的環(huán)節(jié),因此消費者在遭遇延遲發(fā)貨情況后常常得不到及時的賣家反饋。造成該問題的原因,除了企業(yè)對顧客關(guān)系管理不夠重視因素,現(xiàn)有生鮮電商的產(chǎn)銷分離模式(生產(chǎn)節(jié)點企業(yè)負責生產(chǎn),而電商平臺負責銷售服務(wù)容易導(dǎo)致物流信息鏈的斷鏈,歸根結(jié)底還是生鮮產(chǎn)品供應(yīng)鏈的協(xié)調(diào)機制出了問題。提出策略如下:(1)構(gòu)建產(chǎn)、銷節(jié)點信息共享機制,生產(chǎn)與銷售環(huán)節(jié)要實時共享雙方節(jié)點庫存信息,并聯(lián)合制定補貨計劃;(2)產(chǎn)、銷節(jié)點構(gòu)建聯(lián)合售后服務(wù)機制,共擔顧客關(guān)系維護責任,并構(gòu)建生產(chǎn)、銷售、消費者三方互動的服務(wù)平臺;(3)形成有顧客參與的物流服務(wù)價值共創(chuàng)機制,在發(fā)貨、送貨等物流環(huán)節(jié)與消費者展開更多的互動并給予消費者更多的選擇決策權(quán),這樣既可以降低因選擇困境而給企業(yè)帶來的交易成本,同時也可以提高消費者的品牌認同與滿意度。
通過關(guān)聯(lián)分析,發(fā)現(xiàn){包裝}=>{不可靠}(支持度/置信度:0.023 9/0.334 7),{包裝}=>{很好}(支持度/置信度:0.056 5/0.432 5)具有顯著的關(guān)聯(lián)關(guān)系。而與“包裝”關(guān)聯(lián)性較高的詞匯還有“冰袋”和“完好無損”相近的詞匯。這說明消費者認為生鮮品包裝不僅關(guān)系到產(chǎn)品品質(zhì),還能夠體現(xiàn)出企業(yè)對用戶的態(tài)度。而許多企業(yè)在包裝方式上單一從成本考慮,選擇簡易且無保鮮措施的包裝,不但會增加貨損風(fēng)險,同時不利于品牌形象的構(gòu)建。{服務(wù)態(tài)度好} =>{物流}(支持度/置信度:0.014 9/0.445 2),說明消費者重視物流服務(wù)態(tài)度。通過兩部分分析,消費者一定程度將物流服務(wù)視作生鮮企業(yè)品牌競爭力的一部分,且能夠提高體驗程度,生鮮企業(yè)需要與物流服務(wù)商展開更加緊密的合作關(guān)系,在包裝、信息交互等方面展開定制化的合作。
以生鮮網(wǎng)絡(luò)評論文本為研究對象,運用意見挖掘方法深入分析了生鮮電商物流服務(wù)對消費者滿意度的影響機理,發(fā)現(xiàn)了現(xiàn)有物流服務(wù)存在的問題,并提出相應(yīng)的改進策略。通過以上研究得出如下結(jié)論:(1)生鮮電商物流服務(wù)質(zhì)量與消費者滿意度正向相關(guān),即高質(zhì)量的物流服務(wù)有助于消費者產(chǎn)生滿意感,而低質(zhì)量的物流服務(wù)則容易導(dǎo)致消費者給予差評;(2)線上購買生鮮時消費者關(guān)注的物流因素有:物流運輸時長、發(fā)貨、送貨速度、生鮮包裝、物流服務(wù)態(tài)度;(3)消費者對生鮮電商物流服務(wù)不滿意主要聚焦在:運輸時間過長、發(fā)貨速度慢、包裝體驗差強人意。研究對評論文本情感的處理采用三級分類,未來可以提升至5 級情感分類,從而能夠更深入挖掘消費者的內(nèi)在感知要素;同時,未來的研究可以在數(shù)據(jù)采集的產(chǎn)品類別與電商平臺上進行豐富,展開不同平臺或不同產(chǎn)品的評論文本意見挖掘的比較研究。
黑龍江八一農(nóng)墾大學(xué)學(xué)報2021年2期