楊益興,許洪波
(1.西南交通大學 交通運輸與物流學院,四川 成都 611756;2.中南林業(yè)科技大學 物流與交通學院,湖南 長沙 410004)
生鮮市場對接居民的高頻次剛性消費需求,是資本與行業(yè)巨頭爭相涌入的領域,但同時生鮮電商也面臨貨損高、同質化嚴重、盈利難等諸多問題[1]。在新冠肺炎疫情時期,嚴格的防控措施使電商活動難以正常開展,面臨供應鏈中斷、物流配送中接觸感染、消費者對售后服務不滿繼而流失的風險;而在防控進入常態(tài)化階段后,又出現深度線上化、社群化、碎片化和無人化的特征[2],可達性、響應性與安全性等受到嚴峻挑戰(zhàn)。
服務質量評價是指研究者根據某類標準和規(guī)則,采用某種方法對服務質量優(yōu)劣進行客觀衡量的過程,即在建立評價體系后采用特定評價方法對主體的質量進行綜合評估。評價體系的建立與樣本數據的采集常采用文獻研究、問卷調查與訪談等方法[3-5]。隨著互聯網與電子商務的發(fā)展,商品的評論區(qū)成為消費者購前參考與購后反饋的重要信息交互地點,海量的在線評論促成了主觀需求與購物體驗的合流與共振。Ben-abdallah E等[6]利用大量在線內容,提出了一種基于在線評論和情感分析的情境感知排名方法,結合直覺模糊集理論和PROMETHEE-Ⅱ對互聯網云服務進行了排序。Yang Y X等[7]基于電商在線評論,在準自然實驗框架下對新冠肺炎疫情期間“電商溫度”進行特征洞見與安慰效果檢驗。李銘洋等[8]提出了一種結合隨機占優(yōu)準則與PROMETHEE-Ⅱ的服務質量評價方法,為PROMETHEE-Ⅱ的應用提供了新場景及更為全面的指標體系;而馮坤等[9]在此基礎上利用LDA(Latent Dirichlet Allocation )模型提取了在線評論的主題,并將其運用到生鮮電商消費者滿意度測評中。然而,基于熵權的權重難以反應消費者的真實感知[10]2493-2501,傳統(tǒng)的情感聚類方法也忽略了語義與詞序[11-12]。為此,本文將基于Word2vec的語義相似度與基于改進粗數法的PROMETHEE-Ⅱ相結合,對重大傳染病疫情應急與常態(tài)化時期的生鮮電商服務質量進行綜合評價,為其提升服務水平提供決策參考。
Word2vec是Mikolov T提出的一種基于深度學習的文本向量化方法[13],其通過求合的方式替代了神經網絡中的投射層,將詞庫映射到更低的向量維度,從而解決one-hot等模型空間稀疏的問題,是一種分布式詞向量。Word2vec提供了Skip-gram和CBOW兩種訓練模型,前者通過中心詞預測上下詞,后者通過上下詞預測中心詞,且在大樣本下具有更好的模型精度。本文采用CBOW模型進行向量訓練,目標函數為對數似然函數L[14]:
(1)
式中:Context(W)表示語句中詞語W的上下文,其長度由滑動窗口大小決定;W是語料庫C中的任意一個詞語。
將文本轉化為詞向量后,通過計算詞語間的余弦值來度量其語義相似度。計算公式如下:
(2)
式中:similarity(θ,η)為詞θ與詞η的語義相似度,介于-1與1之間,值越大越相似;q為語料庫的維度;θt為詞θ第t個維度的值;ηt為詞η第t個維度的值。
在得到各詞語間的語義相似度后,需利用聚類算法提取在線評論中的文本主題以構建生鮮電商服務質量評價指標體系。相比于k-means等經典聚類算法,DBSCAN不需要事先預設簇的數量。因此,本文采用DBSCAN算法進行主題聚類,具體流程為:第一步,確定由詞間語義相似度構成的對象集D,隨機選取一個對象p并查找其半徑鄰域內符合密度閾值的所有對象,即p密度可達的所有對象;第二步,若p為核心對象,即以p為圓心、為半徑的圓內所包含的對象不少于MinPts個,則能確定一個簇;第三步,若鄰域內的對象剛好等于MinPts個,則p為邊界點,若小于MinPts個,則p為噪聲點,即在任何一個確定好大小的領域內都無法使對象數不少于MinPts個,需重新尋找下一個對象進行核心對象遍歷篩選;第四步,重復前三步,直到找不到滿足條件的新簇時算法停止,此時可根據主題內的代表詞語確定具體的指標名稱,從而構建生鮮電商服務質量評價指標體系[15]。
情感分析是指對非結構化文本數據進行極性判斷,即數值量化。相較于問卷調查,受試者不用在刻板的數字間做出選擇,具有較高的客觀性。實現途徑分為機器(深度)學習和基于詞典兩類,考慮前者需標注大量標簽及短文本句子級、細粒度等特性,本文采用基于情感詞典對在線評論的屬性值進行量化,計算公式如下:
(3)
式中:Sentiment是某類生鮮商品的情感強度值,n是其包含的評論數目,commenti是第i條評論的情感得分;m是程度詞的種類數(程度詞詞典見表1);npos與nneg是積極、消極情感詞的個數,其中情感詞典由各主題下的代表詞與基于語義相似度的映射詞構成;degreej是第j類程度詞的權重,包括“很”“非?!钡惹跋虺潭仍~與“極了”等后向程度詞;basic是基礎情感權重,值為1,而對含有“沒”“不”等否定前綴的詞語做反向極性處理,權重為-1。
表1 生鮮電商程度詞詞典
生鮮電商服務質量對消費者滿意度的影響程度不同,需為不同的指標設置合適的權重值。確定指標權重的方法通常有兩類:一是主觀賦值法,如專家打分、層次分析法等;二是客觀賦值法,如熵值法、均方差法等。這兩類方法都存在一定不足,前者容易使評估陷入主觀化與碎片化的誤區(qū),后者所得結果精確但解釋性較差[16]。為了在客觀的同時更真實表達消費者感知,本文利用改進粗數法確定指標權重[10]2493-2501,[17]。
假定U是論域,Y是U中的任意對象,即各評價指標。X是U中的評價對象,即不同時期的各生鮮品類。論域中描述屬性的離散值包括c類,記為R={R1,R2,…,Rk,…,Rc},且存在大小關系R1 (4) (5) (6) (7) (8) (9) (10) 為了全面、客觀地評價新冠肺炎疫情期間生鮮電商的服務質量,本文分別選取疫情應急時期(2020年1月20日至4月28日)與常態(tài)化時期(2020年10月17日至今)下冷飲凍食、新鮮水果、海鮮水產、精選肉類及蔬菜蛋品5個生鮮品類作為評價對象。評價指標通過基于語義相似度的情感聚類結果確定,其對應的屬性值通過基于詞典的情感分析獲得。由此,可得到m個評價對象及n個評價指標的評估矩陣O(m×n)。 優(yōu)先函數是指在效益型指標xj下,評價對象Ai優(yōu)于對象Ar的程度(i、r=1,…,m)。PROMETHEE-Ⅱ提供了6種可供選擇的優(yōu)先函數,研究者可在具體的研究場景中根據實際問題與偏好來選擇或重新構建準則??紤]到PROMETHEE-Ⅱ方法是基于流入流出的優(yōu)先關系進行決策的,本文將基于參考點與隨機占優(yōu)的累積前景理論與其結合[18],用改進后的價值函數作為各指標的優(yōu)先函數,具體形式為: (11) 式中:Pj(dir)為第j個指標下對象Ai到Ar的優(yōu)先函數值,dir=xij-xrj(i,r=1,…,m;j=1,…,n),為第j個指標下對象Ai到Ar的距離。α和β分別表示價值函數在益損區(qū)域的凹凸程度,λ為反映規(guī)避損失的程度。Tversky A等[19]通過大量實驗得出α=β=0.88,λ=2.25。在優(yōu)先函數的基礎上,優(yōu)先指數可以定義為: (12) 式中:π(Ai,Ar)是對象Ai到Ar的優(yōu)先指數,即同時考慮所有指標時Ai比Ar的優(yōu)先程度;wj為改進粗數法得出的第j個指標的權重值。 在得到各評估對象間的優(yōu)先指數后,進一步計算具體對象的各類型流量[20]。 (13) (14) φ(Ai)=φ+(Ai)-φ-(Ai) (15) 式(13)~(15)中:φ+(Ai)為對象Ai的正流量,即Ai優(yōu)于其他對象的程度;φ-(Ai)為對象Ai的負流量,即其他對象優(yōu)于Ai的程度;φ(Ai)為對象Ai的凈流量,在PROMETHEE-Ⅱ中可通過凈流量得到各對象的完全序。 地理探測器(Geodetector)是探索空間分異因子與事物影響因素的一種有效統(tǒng)計方法[21],自提出以來,被廣泛應用于自然科學、經濟及生態(tài)環(huán)境等多個領域[22-24]。地理探測器的基本思想為:將研究分為若干個子區(qū)域,若子區(qū)域的方差之和小于區(qū)域總方差,則存在分異;相反,若兩變量的空間分布趨于一致,則兩者存在統(tǒng)計關聯性。由于地理探測器無線性假設,能同時探測主效應與交互效應,并在小樣本量下具有更好的模型精度,因此其具有優(yōu)雅的形式與明確的物理含義,而不僅限于計量經濟學中的乘性交互。地理探測器分為因子探測器、交互探測器、生態(tài)探測器、風險探測器4個子模塊,本文借助因子探測器和交互探測器進一步分析影響生鮮電商服務質量的因素。 因子探測器用于探測自變量對因變量的解釋能力,用q值度量,模型如下: (16) 交互探測器是在因子探測器的基礎上,根據各指標的q值進行對比,以得出交互效應的類型(見表2)。 表2 交互探測器 考慮到數據的代表性與可指導性,本文利用網絡爬蟲技術采集京東生鮮電商平臺上冷飲凍食、新鮮水果、海鮮水產、精選肉類及蔬菜蛋品5個生鮮品類的103 048條在線評論作為語料庫,在經過分詞、去停等預處理后得到以詞為基本單元的干凈評論。 基于Word2vec的語義相似度模型,采用python編程并利用Gensim中的Word2vec包實現詞向量與語義相似度訓練。第一,選擇CBOW訓練模型(sg=0),并將模型維度(vector_size)設置為500,訓練輪次(epochs)設置為15;第二,過濾掉出現次數(min_count)小于5的低頻詞;第三,選取前100的高頻詞作為樣本,利用w2vmodel.wv.similarity計算其兩兩之間的語義相似度(見表3)。在得到高頻詞的語義相似度矩陣后,利用Sklearn中的DBSCAN包對其進行情感聚類,經過多次運行測試,發(fā)現將半徑()設置為1.4、密度閾值(MinPts)設置為5時聚類效果最佳,且聚類數為6。為了便于觀測,本文以二維聚類效果進行局部展示(見圖1和圖2)。 表3 語義相似度矩陣(部分) 圖1 方便與自營基準下的聚類 圖2 京東與速度基準下的聚類 根據每個簇內關鍵詞的語義相似度差異,對主題進行劃分后構建生鮮電商服務質量評價指標體系。在圖3的第一個主題中,“方便”的相似度值遠高于其他詞,將其設置為便捷性指標;“價格”和“實惠”在很大程度上能代表第二個主題,具有相對獨立性,將其設置為經濟性指標;在第三個主題中,“口感”“味道”“完好”反映了消費者對實物與商品描述一致與商品包裝完好的訴求,將其設置為可靠性指標;在第四個主題中,“很快”與“速度”的相似度值居于前列,將其設置為響應性指標;在第五個主題中,各詞的相似度相差無幾,但“新鮮”與“很快”的值仍位居前列,將其設置為新鮮度指標;體現消費者關懷的“服務態(tài)度”的相似度在第六個主題中遠高于其他詞,將其設置為移情性指標。由此,基于消費者在線評論,建立起一個包含便捷性、經濟性、可靠性、響應性、新鮮度與移情性的生鮮電商服務質量評價指標體系(見表4)。 圖3 高頻詞主題分布 表4 生鮮電商服務質量指標體系 根據在線文本內容的分析結果,本文提取了每個維度下正負語義的種子詞,并利用Word2vec對其進行擴展,形成生鮮電商情感詞典(見表5)。 表5 生鮮電商情感詞典(部分) 構建情感詞典后,根據式(3)及生鮮電商程度詞詞典,采用Python編程對新冠肺炎疫情不同發(fā)展時期的各類生鮮在線評論進行遍歷計算,實現情感分析,從而構建評估矩陣(見表6)。 表6 評估矩陣 1.利用自然斷點法將表5中各指標的情感值打斷為5個水平等級,再根據改進粗數法計算每個指標的權重值(見表7)。 表7 基于改進粗數法的各指標屬性值 2.根據式(11)~(12),在優(yōu)先函數的基礎上計算各對象間的優(yōu)先指數。 3.利用式(13)~(15)計算各對象的正流量、負流量與凈流量,進而實現新冠肺炎疫情不同發(fā)展階段各生鮮品類電商服務質量的完全排序(見表8和圖4)。 表8 各生鮮品類的優(yōu)先指數與流量 圖4 各生鮮品類凈流量排序 如表7和圖4所示:從疫情的發(fā)展階段看,新冠肺炎疫情帶來的低復工率、交通管制、社區(qū)封控、線下場所關閉造成了生鮮電商補貨不足、商品發(fā)運緩慢、末端取貨不便、售后不及時等問題。因此,應急時期服務質量的凈流量均低于常態(tài)化時期。從商品品類看,在應急時期,冷飲凍食與精選肉類的凈流量遠高于其他品類,原因是這兩類生鮮商品都具有嚴密的外包裝且能進行真空處理,在途的磕碰也不會直接造成商品質量受損,因而新冠肺炎疫情對其造成的沖擊相對較??;而水果、海鮮水產及蔬菜蛋品較易腐爛損壞,對響應性和完好性要求更高。在常態(tài)化時期,社會經濟的有序恢復與免疫屏障的構筑為生鮮電商提供了穩(wěn)定的運營環(huán)境,各品類的服務質量都得到了提升。然而,隨著境外新冠肺炎疫情的持續(xù)蔓延及“物傳人”鏈條得到證實,在常態(tài)化階段,進口海鮮、水果等商品需進行額外的核酸檢測,這在一定程度上造成了消費者的安全擔憂與購買猶豫,因此,其凈流量與對應的服務質量相較其他品類低。 如前文所述,本文將A1~A10作為研究樣本,其對應的凈流量作為被解釋變量,通過自然斷點法將其對應的評估矩陣(見表6)打斷為“低—中—高”三個等級并作為自變量,利用地理探測器對其進行因子探測與交互探測(見表9、表10、表11)。 表9 因子探測結果 表10 交互探測結果(應急時期) 表11 交互探測結果(常態(tài)化時期) 如表9所示:在新冠肺炎疫情的應急時期,響應性與經濟性能顯著影響各品類生鮮商品的凈流量得分,說明在應急時期消費者更注重商品的及時送達與相關的價格促銷。原因是社區(qū)封控、交通管制等防控措施使供應鏈中斷,“最后一公里”配送不便,商品的在途運輸時間更長、更易變質腐爛。生鮮商品屬于消費者的剛性需求,對電商物流的時效性更敏感。另外,根據公平理論,消費者預期也會影響滿意度,消費者會產生與正常時期服務質量對比后的體驗落差[25-26]。在此情況下,其對價格的容忍度降低,希望商家通過商品促銷或物流費用減免來彌補受損的服務體驗。然而,在交互效應中(見表10),各影響因素相對獨立,尚未存在明顯的交互作用,原因是應急時期消費者僅重點關注影響其基本生活與剛性需求的服務。當疫情進入常態(tài)化階段,追溯原評論發(fā)現,便捷性成為該階段的重要影響因素。例如,送貨上門、預約送貨等物流便捷,商品預處理、烹飪指南等操作便捷,簡約審核、急速賠付等售后便捷。對于交互探測來說(見表11),響應性分別與可靠性、移情性具有較強的交互效應,存在“1+1>2”的增強效果。究其原因是生鮮商品易腐易消耗的特點不僅要求電商物流具備較強的時效性,還需包裝完好、減少商品的在途損耗;同時,網購使消費者與商品在空間上分離,加之食用型的生鮮商品所包含的口味、大小、顏色等商品細節(jié)相較普通商品更具有隱匿性,因此,實物與商品描述的一致性也成為生鮮電商服務質量的重要影響因素。此外,在商品及時送達的前提下,商家與物流人員熱情、耐心的服務態(tài)度能使消費者滿意度得到額外的提升,也能使其在超時配送的不滿中得到內心寬慰。 本文提出了一種基于在線評論的生鮮電商服務質量評價方法。該方法在數據的獲取與量化上對大量在線評論進行情感分析,從而在短時間內以更低的成本捕獲消費者的購后反饋,相較于傳統(tǒng)調查問卷更具即時性與準確性。受新冠肺炎疫情影響,應急時期的生鮮電商服務質量整體低于常態(tài)化時期。在影響因素方面,應急時期響應性與經濟性能顯著影響各品類商品的凈流量得分但不存在明顯的交互作用;在常態(tài)化時期,便捷性是提升服務質量的關鍵,且響應性分別與可靠性、移情性具有較強的交互效應,存在“1+1>2”的增強效果。 利用基于語義相似度的情感聚類替代自上而下設立指標的研究方法,不僅使評價更全面,也彌補了經典主題模型處理短文本時向量空間稀疏與忽略詞序的缺陷。另外,運用粗數與PROMET-HEE-Ⅱ的結合方法對服務質量進行排序,能在兼顧評價客觀性與消費者主觀感受的條件下展示新冠肺炎疫情不同時期的生鮮電商各品類商品的經營狀況,使商家能及時、清晰地了解服務中存在的問題并加以改善。然而,基于詞典的情感分析能以最直接的方式獲取消費者細粒度的服務感知,但情感詞典需根據不同的研究場景進行更新,構建過程也比較繁瑣,情感得分很難完全詮釋人類自然語言。因此,在后續(xù)研究中,可通過基于深度學習的方面級情感分析來加以改進,也可通過實體命名識別的方法來探索細粒度的消費者需求,進而提升情感分析模型的解釋力。四、基于PROMETHEE-Ⅱ的生鮮電商服務質量評價
(一)確定評價對象、指標與評估矩陣
(二)確定各指標優(yōu)先函數與優(yōu)先指數
(三)確定各對象的正流量、負流量及凈流量
(四)基于地理探測器的影響因素
五、實證分析
(一)數據獲取與預處理
(二)生鮮電商服務質量評價指標體系構建
(三)基于生鮮在線評論的情感分析
(四)生鮮電商服務質量排序
(五)生鮮電商服務質量的影響因素
六、結論