王世雄,藍一珍,李 雪
(浙江理工大學經(jīng)濟管理學院,杭州 310018)
物流服務(wù)評論與顧客購買后行為的關(guān)聯(lián)性研究
王世雄,藍一珍,李 雪
(浙江理工大學經(jīng)濟管理學院,杭州 310018)
在網(wǎng)絡(luò)購物平臺中,已購顧客的物流服務(wù)評論通常影響著新顧客購買決策行為。利用網(wǎng)絡(luò)爬蟲獲取京東商城的女裝在線評論數(shù)據(jù),借助中文分詞、情感分析等技術(shù)提取評論中物流服務(wù)相關(guān)要素和顧客購買后行為,得到顧客最關(guān)注的物流服務(wù)要素和最普遍的顧客購買后行為,并運用FP-growth算法挖掘物流服務(wù)要素與顧客購買后行為之間的強關(guān)聯(lián)規(guī)則。研究結(jié)果揭示了不同顧客購買后行為對物流服務(wù)感知的側(cè)重點差異。該結(jié)果有助于B2C企業(yè)尋找物流服務(wù)優(yōu)化的關(guān)鍵點,為改進物流服務(wù)質(zhì)量提供借鑒。
物流服務(wù);內(nèi)容分析;購買后行為;關(guān)聯(lián)挖掘
天貓、京東等B2C電子商務(wù)提供評論功能,顧客發(fā)表的評論內(nèi)容豐富,包含顧客對物流服務(wù)的反饋等海量的信息,其背后蘊含著顧客消費規(guī)律、消費習慣和購買行為。在網(wǎng)絡(luò)購物的過程中,顧客通常會關(guān)注已購物顧客對商品和服務(wù)的評論,并將它們作為購買決策的依據(jù)之一。從商務(wù)運營角度而言,B2C平臺上海量的在線評論是商務(wù)大數(shù)據(jù)的重要組成部分,具有Volume(數(shù)量大)、Variety(多樣化)、Velocity(快速化)、Value(價值大)等典型特征,已經(jīng)成為企業(yè)的核心生產(chǎn)要素和商務(wù)資源。
隨著交易量的持續(xù)增加,已購買商品的顧客對電子商務(wù)物流服務(wù)的評論越來越多,他們常常利用電子商務(wù)平臺提供的評論功能,對物流服務(wù)的評論做出正面或負面的評價,數(shù)據(jù)量大,內(nèi)容的情緒化、信息的破碎化比較突出,常常影響顧客購買決策行為。如何從海量的在線評論中分離出產(chǎn)品質(zhì)量、價格變化、物流服務(wù)相關(guān)內(nèi)容,分析它們對顧客消費行為的影響,是學術(shù)界和產(chǎn)業(yè)界均十分關(guān)注的熱點問題。為此,本文利用網(wǎng)頁爬蟲工具獲取京東商城女裝的在線評論內(nèi)容,采用文本分析的方法提取物流服務(wù)評價和顧客購買后行為信息;結(jié)合關(guān)聯(lián)挖掘技術(shù),研究物流服務(wù)評論與顧客購買后行為的關(guān)聯(lián)性,為企業(yè)準確快速地響應(yīng)顧客對物流服務(wù)的評論、消除負面影響提供支持。
Byrant等[1]在2008年提出的大數(shù)據(jù)在商務(wù)、科學和社會領(lǐng)域的應(yīng)用,是數(shù)據(jù)科學應(yīng)用的革命性突破,引起了廣大學者和業(yè)界高管的重視。最初,數(shù)據(jù)科學主要應(yīng)用于科學研究、商品零售業(yè)、金融投資業(yè)、電信業(yè)以及保險業(yè)。在B2C電子商務(wù)領(lǐng)域,數(shù)據(jù)科學主要通過捕捉、整合消費者的線上行為、互動方式,使得企業(yè)了解顧客的消費行為,進而為企業(yè)向顧客推薦產(chǎn)品、優(yōu)化產(chǎn)品策略、預(yù)測供應(yīng)鏈模型等提供參考依據(jù)。
電子商務(wù)蘊含價值鏈,又依托供應(yīng)鏈,物流服務(wù)是電子商務(wù)服務(wù)的核心內(nèi)容之一。研究物流服務(wù)對顧客消費行為、消費心理等方面的影響是當前的熱點課題。Gefen等[2]提出物流服務(wù)是影響電子商務(wù)顧客忠誠度的重要因素,并根據(jù)顧客物流感知建立了服務(wù)質(zhì)量測評量表。Stank等[3]研究發(fā)現(xiàn),物流服務(wù)感知會影響顧客滿意度,通過提升物流服務(wù)質(zhì)量可以提高顧客滿意度,進而提高市場份額。Hofacker等[4]研究發(fā)現(xiàn),顧客對物流服務(wù)的感知可以影響B(tài)2C企業(yè)的口碑和顧客重購的意愿。張巖巖[5]結(jié)合我國B2C電子商務(wù)的特點和物流服務(wù)質(zhì)量理論研究,將B2C物流服務(wù)質(zhì)量定義為:網(wǎng)絡(luò)購物用戶在B2C商城購物后產(chǎn)生的實際物流服務(wù)感知與期望物流感知的差距感知。宗蕊等[6]從顧客角度出發(fā),采用在線客戶評論的數(shù)據(jù)挖掘方法,發(fā)現(xiàn)不同類型的顧客對物流服務(wù)感知的側(cè)重點有所不同。王家琦等[7]通過文獻分析,得出量化B2C物流服務(wù)質(zhì)量的7個維度,分別為訂購質(zhì)量、定制化服務(wù)質(zhì)量、時間性質(zhì)量、交付質(zhì)量、信息質(zhì)量、補救服務(wù)質(zhì)量和經(jīng)濟性質(zhì)量。
購買后行為[8](posting-purchase behavior)是顧客行為的一部分,是指顧客購物活動后,基于對購物活動的感知或評價而產(chǎn)生的心理活動及行為,主要包括購物后給出的評價、重購、推薦等行為。在電子商務(wù)的評論系統(tǒng)中,顧客的評論包含大量的對商品的評價、重購決策以及推薦行為等。Seiders等[9]首次提出網(wǎng)絡(luò)購物用戶的重復(fù)購買意愿,將其定義為顧客重購行為,即顧客在網(wǎng)絡(luò)購物之后,愿意再次購買的一種意愿。李泓榮[10]則將網(wǎng)購重購行為定義為與商家首次交易承購后,顧客再次瀏覽該商鋪,并有重購行為或重購意向。對于影響顧客重購意愿的因素,Lilijander等[11]通過研究得出影響顧客重購的三個驅(qū)動因素為:顧客的滿意度、對品牌的情感度和之前購物或產(chǎn)品使用經(jīng)歷。推薦行為包括線下的“口頭”推薦和線上的“在線評論”推薦。現(xiàn)有文獻對推薦行為的研究較少,因此,本文通過在線評論中的重購頻率和推薦意愿來研究顧客的推薦行為。
前述研究多數(shù)以問卷調(diào)查的形式獲取研究數(shù)據(jù),本文則借助信息技術(shù)獲取在線評論數(shù)據(jù),主要包括網(wǎng)絡(luò)爬蟲技術(shù)、文本分析技術(shù)、中文分詞技術(shù)和關(guān)聯(lián)挖掘技術(shù)等?,F(xiàn)階段,獲取在線評論數(shù)據(jù)主要依靠網(wǎng)絡(luò)爬蟲技術(shù),常用的挖掘軟件有Metaseeker、八爪魚采集系統(tǒng)、樂思信息采集系統(tǒng)等。獲得數(shù)據(jù)之后,需要對評論進行文本分析,判斷評論的極性,獲取顧客的態(tài)度、情緒等數(shù)據(jù)。
Turney[12]首先提出運用PMI-IR算法計算詞語間的互信息,通過計算與種子詞語之間的互信息,判斷該詞語的情感極性。Dave等[13]首次提出“觀點挖掘”的概念,并研發(fā)了系統(tǒng)“ReviewSeer”用來識別評論文本的情感傾向。Hu等[14]利用關(guān)聯(lián)規(guī)則挖掘商品評論中隱藏的商品特征屬性,并研發(fā)了系統(tǒng)“Opinion Observer”對網(wǎng)絡(luò)評論信息進行情感極性識別。
近年來,中文文本分析技術(shù)不斷取得進展。Tsou[15]通過研究中文期刊上的600多篇關(guān)于政治人物的報道,先標記語料庫得到文本中的極性元素,然后統(tǒng)計極性元素的分布、極性元素的密度和極性元素的語義強度,最后計算文本褒貶分類和強度大小。王根等[16]采用隨機對句子進行情感挖掘,并提出基于多重冗余標記的CRF模型。張成功等[17]通過分析副詞、否定詞和情感詞的不同組合模式,提出在不同組合模式下的具體極性短語的情感計算公式。這些研究為本文的研究奠定良好基礎(chǔ)。關(guān)聯(lián)挖掘技術(shù)目前相對成熟,Agrawal等[18]提出的關(guān)聯(lián)規(guī)則挖掘被廣泛運用于商業(yè)領(lǐng)域,其經(jīng)典算法有:Apriori算法、FP-growth算法等。
總而言之,相對于傳統(tǒng)的問卷調(diào)查方法,以大數(shù)據(jù)相關(guān)技術(shù)獲取電子商務(wù)平臺中的顧客消費、評論數(shù)據(jù),以此分析顧客對商家提供的信息、物流、金融等服務(wù)的評價,獲取顧客消費行為、消費心理以及購買決策等重要商業(yè)信息,這種方法具有數(shù)據(jù)量更大、內(nèi)容更真實、時空跨度更大等特點,是當前的研究熱點。本文以現(xiàn)有研究成果和開源工具技術(shù)挖掘京東商城中有關(guān)評論,分析物流服務(wù)與顧客購買后行為之間的關(guān)聯(lián)性。
(一)關(guān)聯(lián)模型
假設(shè)I={I1,I2,…,Im}是項的集合[19]。設(shè)任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫事務(wù)的集合,其中每個事務(wù)T是一個非空項集,使得T?I。每一個事務(wù)都有一個標識符,稱為TID。設(shè)A是一個項集,事務(wù)T包含A,當且僅當A?T。設(shè)顧客購買后行為項集為W,物流服務(wù)要素項集為U,則可定義AW為顧客購買后行為的子項目集,AU為物流服務(wù)要素的子項目集,其中A?W,A?U。同樣的可以定義B的項目集,分別為BW和BU。
關(guān)聯(lián)規(guī)則是形如A?B的蘊含式,其中A?W,B?W,A≠φ,B≠φ,并且A∩B=φ。關(guān)聯(lián)規(guī)則A?B在事務(wù)集D中成立,具有支持度s、置信度c。其中,s是D中包含A∪B(即集合A和集合B的并或A和B二者)的百分比,如包含物流服務(wù)要素A和顧客購買后行為B的評論占所有評論的百分比,其值為P(A∪B),即:
support(A?B)=P(A∪B).
c是D中包含A的事務(wù)同時也包含B的事務(wù)的百分比,即物流服務(wù)評論A包含顧客購買后行為B的評論占所有評論的百分比,其值為P(B|A),即:
confidence(A?B)=P(B|A).
根據(jù)物流服務(wù)要素以及顧客購買后行為的定義,給出關(guān)聯(lián)規(guī)則集合如下:
AU?BW:該規(guī)則顯示的是物流服務(wù)要素與顧客購買后的行為之間的相關(guān)性。主要挖掘不同物流服務(wù)要素對顧客購買后的行為的關(guān)聯(lián)性強弱,是本文的研究重點。
AU?BU:該規(guī)則顯示的是不同的物流服務(wù)要素之間的相關(guān)性。
AW?BW:該規(guī)則顯示的是不同的購物后的行為之間的相關(guān)性。
后面兩個規(guī)則是第一個規(guī)則的補充。例如,根據(jù)規(guī)則AU?BU挖掘出{u5}→{u4},說明u5和u4兩個物流服務(wù)要素之間有強關(guān)聯(lián)關(guān)系,那么如果AU?BW中有含有規(guī)則{u5}→{w1},則說明具有w1購物行為的顧客在接受物流服務(wù)的時候,不僅關(guān)注u5的物流服務(wù)要素,而且關(guān)注u4的物流服務(wù)要素。
根據(jù)關(guān)聯(lián)規(guī)則定義,同時滿足最小支持度閾值(min_sup)和最小置信度閾值(min_conf)的規(guī)則稱為強規(guī)則,即:
support(A?B)≥min_sup;
confidence(A?B)≥min_conf.
(二)關(guān)聯(lián)性指標
現(xiàn)有研究表明,由于支持度和置信度不足以完全過濾無意義的關(guān)聯(lián)規(guī)則,以此為基礎(chǔ)的關(guān)聯(lián)性分析存在一定的局限性。為了解決上述問題,可以從增加相關(guān)性度量的角度補充關(guān)聯(lián)性指標,如提升度、χ2分析等。本文采用提升度作為關(guān)聯(lián)性分析的補充指標,即關(guān)聯(lián)規(guī)則表示為:
A?B[support,confidence,correlation].
其中,提升度是指在含有A的條件下同時含有B的可能性與沒有這個條件下項集中含有B的可能性之比。具體而言,若P(A∪B)=P(A)P(B),則項集A的出現(xiàn)獨立于項集B的出現(xiàn);否則,項集A和項集B就是相關(guān)的。因此,提升度亦可以表示為:
由于提升度表示的還是當項集A出現(xiàn)的提升時,項集B出現(xiàn)的程度,所以它還可以定義為:
當lift(A?B)<1時,說明A與B是負相關(guān)的;當lift(A?B)>1時,說明A與B是正相關(guān)的;lift(A?B)=1時,說明A與B是獨立的。以物流服務(wù)要素A和顧客后購買行為B在評論中出現(xiàn)的情況而言,當lift(A?B)<1時,評論中僅出現(xiàn)線物流服務(wù)要素而沒有出現(xiàn)相應(yīng)的顧客購買后行為;當lift(A?B)>1時,評論中出現(xiàn)線物流服務(wù)要素的情況下也出現(xiàn)了相應(yīng)的顧客購買后行為;當lift(A?B)=1時,物流服務(wù)要素和顧客購買后行為獨立出現(xiàn)在評論中。由此可見,提升度可以增加衡量規(guī)則的可靠性,是置信度的一種互補指標。
本文采用提升度來度量物流服務(wù)要素與顧客購買行為之間的相關(guān)性、不同物流服務(wù)要素之間的相關(guān)性和不同的購物后的行為之間的相關(guān)性,刪去提升度小于1的關(guān)聯(lián)規(guī)則,保留提升度大于1的關(guān)聯(lián)規(guī)則。
(三)算法
關(guān)聯(lián)挖掘算法的關(guān)鍵步驟包括:
a)找出所有的頻繁項集:根據(jù)關(guān)聯(lián)規(guī)則的定義,這些項集的每一個頻繁出現(xiàn)的次數(shù)都要大于或等于最小支持計數(shù);
b)有頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則:根據(jù)關(guān)聯(lián)規(guī)則的定義,這些規(guī)則必須滿足最小支持度和最小置信度。
其主要的算法有Apriori算法、FP-growth算法等。其中,Apriori算法使用逐層搜索的迭代方式掃描。首先,通過掃描數(shù)據(jù)庫,累計每個項的技術(shù),并收集滿足最小支持度的項,找出頻繁為1的項集的集合,記為L1,然后使用L1找出頻繁為2的項集的集合,記為L2,使用L2找出L3。以此類推,直到不能再找到頻繁k的項集。該算法的優(yōu)點是簡單、易理解、對數(shù)據(jù)要求低,缺點是要多次掃描原始數(shù)據(jù),當原始數(shù)據(jù)較大時,磁盤I/O次數(shù)太多,效率較低。為了解決Apriori算法效率低下的缺點,Han等[19]提出了基于FP樹生成頻繁項集的FP-growth算法,該算法采用分而治之的策略??紤]到本文獲取的數(shù)據(jù)量較大,為保證效率,采用FP-growth算法進行關(guān)聯(lián)性分析。
首先,通過掃描數(shù)據(jù)庫,得到數(shù)據(jù)庫中的頻繁項集F和頻繁項的支持度s,把頻繁項集F按支持度遞降排序記為L。
然后,創(chuàng)建頻繁模式樹(FP-tree)的根節(jié)點,記為T,標記為“null”。根據(jù)L中的順序,對D中每個事務(wù)T進行排序,將D中排好序的事務(wù)項列表記為[p|P],其中p是第一個元素,P是列表的剩余部分,調(diào)用遞歸函數(shù)。
(一)數(shù)據(jù)收集
在當前的B2C平臺中,京東商城提供的物流服務(wù)一直領(lǐng)先于其他競爭對手,這源于其強大的自營物流體系。該平臺中顧客對其物流服務(wù)的評論無論是數(shù)量還是質(zhì)量,都相對客觀,因而具有較好的研究價值。因此,本文以京東商城的評論內(nèi)容作為研究對象。另外一方面,由于京東商城出售的產(chǎn)品種類較多,不同產(chǎn)品的需求量和物流服務(wù)水平差異較大,考慮到女裝的銷售量和評論量均較大,評論內(nèi)容更具可比較性,因而僅獲取與女裝銷售相關(guān)的物流服務(wù)和顧客購買后行為的評論內(nèi)容,以提高研究的準確性和可靠性。
本文在2016年7月1日至2016年8月1日期間,利用深圳樂思軟件技術(shù)有限公司提供的網(wǎng)頁信息采集工具——樂思信息采集系統(tǒng),獲得2013年10月16日至2016年6月30日期間的女裝銷售相關(guān)的數(shù)據(jù),共計7349條,包括商品名、詳細頁面網(wǎng)址等信息。以此為基礎(chǔ),利用詳細頁面網(wǎng)址,采集到商品的其他詳細信息,包括商品名稱、評論總數(shù)、格式化評論信息(包括好評數(shù)、中評數(shù)、差評數(shù)、好評率)、評價客戶、顧客等級、評價內(nèi)容、評價日期等信息,共705719條數(shù)據(jù)。這些數(shù)據(jù)具有較好的結(jié)構(gòu),所承載的信息量很大,具有較好的研究價值。
(二)數(shù)據(jù)處理
獲取的數(shù)據(jù)包含的內(nèi)容豐富,包括產(chǎn)品名稱、總評論數(shù)量、好評數(shù)量、中評數(shù)量、差評數(shù)量、好評率、曬圖數(shù)、評價顧客、顧客等級、評價內(nèi)容和評價日期等。為了更準確地研究物流服務(wù)評論與顧客購買后行為的關(guān)聯(lián)性,分幾個步驟對數(shù)據(jù)進行處理。
首先,對抓取的數(shù)據(jù)進行清洗,刪除缺失值。然后,利用關(guān)鍵詞“物流”、“配送”、“送貨”、“快遞”、“包裝”、“服務(wù)”、“態(tài)度”、“送貨員”、“給力”、“神速”、“完整”、“盒子”、“完整”、“售后服務(wù)”、“完好無損”等關(guān)鍵詞對清洗后的數(shù)據(jù)進行篩選,獲得與物流服務(wù)和顧客購買后行為相關(guān)的評論,共74924條。
接著,使用ICTCLAS分詞系統(tǒng)對篩選后的評論進行內(nèi)容分析,對篩選出的數(shù)據(jù)進行中文分詞,得到分詞詞組,并進行詞頻統(tǒng)計,獲取分詞結(jié)果;根據(jù)分詞結(jié)果提取關(guān)鍵詞,獲得顧客重購行為和推薦行為相關(guān)的評論內(nèi)容,得到10923條。
最后,根據(jù)分詞結(jié)果判斷評論情緒極性,篩選出情緒極性為正向的數(shù)據(jù),得到10805條。根據(jù)詞頻統(tǒng)計結(jié)果,篩選出與物流服務(wù)質(zhì)量相關(guān)的詞頻結(jié)果,并按順序從高到低進行排序,得到表3。
表3 關(guān)于物流服務(wù)要素詞頻統(tǒng)計
依據(jù)表3,可以看到,與物流服務(wù)質(zhì)量相關(guān)的高頻詞(出現(xiàn)次數(shù)大于100)有:“物流”、“服務(wù)”、“態(tài)度”、“給力”“速度”、“發(fā)貨”、“快遞”、“包裝”“送貨”、“快遞員”等,即對應(yīng)在線評論中顧客最為關(guān)注的物流服務(wù)要素,與物流服務(wù)質(zhì)量相關(guān)的中頻詞(出現(xiàn)次數(shù)10~100之間)有“神速”、“負責”、“售后服務(wù)”、“完好無損”、“完整”、“配送”、“盒子”等,即代表著顧客比較關(guān)注的物流服務(wù)要素,與物流服務(wù)質(zhì)量相關(guān)的低頻詞(出現(xiàn)次數(shù)小于10)有“圓通”、“效率”、“外包裝”、“咨詢”、“運輸”、“退換”、“速”、“配”、“派”、“帥哥”等,即顧客關(guān)注的物流服務(wù)要素,但不具有普遍性。整理得到顧客關(guān)注的物流服務(wù)要素,即包裝完整、發(fā)貨速度快、運送速度快、送貨速度快、快遞員服務(wù)態(tài)度好、售后服務(wù)態(tài)度和退換貨速度。
根據(jù)詞頻統(tǒng)計結(jié)果,篩選出與顧客購買后行為相關(guān)的詞頻結(jié)果,并按順序從高到低進行排序,得到表4。
依據(jù)表4,可以發(fā)現(xiàn)高頻詞(出現(xiàn)次數(shù)大于300)有“值得”、“購買”、“光顧”、“推薦”、“購物”、“朋友”、“繼續(xù)”、“下手”、“光臨”等;中頻詞(出現(xiàn)次數(shù)100~300之間)有“同事”、“介紹”、“機會”、“趕快”、“合作”、“放心”、“入手”等;低頻詞(出現(xiàn)次數(shù)小于100)有“MM”等。組合這些詞匯,可以提煉出以下幾種信息:“幫家人/同學/同事也買了一條”、“有機會再次光臨/購買”等關(guān)于顧客再次購買的意向或行為;“值得推薦”、“值得購買”、“值得擁有”、“喜歡的MM可以放心購買”、“趕緊入手”、“介紹給朋友/同事/同學”、“值得推薦的商家”等關(guān)于顧客推薦產(chǎn)品的行為信息。
表4 關(guān)于顧客購買后行為的詞頻統(tǒng)計
詞頻分析結(jié)果顯示,與物流服務(wù)評論相關(guān)的顧客購買后行為主要包括顧客購物后的重購行為和推薦行為。其中,顧客重購行為是指顧客重新購買該商品或顧客有再次購買的意向;顧客推薦行為是指顧客在購買后向朋友或家人推薦購買的商品或所購買的商家以及在網(wǎng)絡(luò)上向其他顧客進行的推薦性行為。因此,后續(xù)研究的重點是物流服務(wù)評論與這兩種行為的之間關(guān)聯(lián)性。
(三)評論矩陣構(gòu)建
為了方便關(guān)聯(lián)規(guī)則的挖掘,首先從顧客評論中提取出相應(yīng)的物流服務(wù)要素和顧客購買后行為。例如,截取下面一條評論:“全五分好評,店家人好耐心服務(wù),物流快速也不含糊,神速到位,裙子顏色亮麗,款式新穎物美價廉,下次還會再來,并推薦朋友們都來買?!睆脑撛u論中可以提取出以下4個信息:a)發(fā)貨速度快;b)快遞速度快;c)會重購;d)會推薦朋友購買。然后,將提取出有效的文本信息數(shù)據(jù)標準化,并將其制成二進制的矩陣形式。設(shè)定集合R={r1,r2,r3,…,rm}表示m條在線評論的集合,集合W={w1,w2,w3,…,wn}表示顧客在購物后的n種行為的集合,集合U={u1,u2,u3,…,uk}表示在線評論中的k個物流服務(wù)要素。
根據(jù)顧客購買后行為和物流服務(wù)要素的劃分,集合W包含2個元素,集合U包含7個元素:w1表示顧客重購行為;w2表示顧客推薦行為;u1表示產(chǎn)品包裝完整;u2表示發(fā)貨速度快;u3表示運送速度快;u4表示送貨的速度快;u5表示快遞員服務(wù)態(tài)度良好;u6表示售后服務(wù)良好;u7表示退換貨的速度快和便捷性。則上述評論例子可記錄為w1→w2→u2→u3。
在評論內(nèi)容中提取物流服務(wù)要素取時,可以發(fā)現(xiàn)有一些意思表達模糊的詞語,例如“快遞給力”、“物流給力”、“快遞速度給力”等。由于“物流”、“快遞”等詞語未指明特定的物流服務(wù)要素,則本文將類似上述的表述定義為對物流整個運作過程的評價,即“快遞給力”表示的是顧客對發(fā)貨速度、運送速度、送貨速度、快遞員的服務(wù)態(tài)度等的滿意度,“快遞速度給力”表示的是顧客對發(fā)貨速度、運送速度和送貨速度的滿意度。同時,類似“送貨上門”等詞語,雖然沒有提及有關(guān)的物流服務(wù)要素,但是這些詞語表達了對快遞員的肯定。因此,在整理的時候,需要對上述評論信息進行補充、修改,最后得到評論矩陣。
表5列舉5條不同內(nèi)容的評論矩陣,矩陣的行表示每條評論,列設(shè)為顧客行為和物流服務(wù)要素,用0或1來顯示每條評論是否提到某一顧客后行為和物流服務(wù)要素,其中1表示提到,0表示未提到。例如,上述評論例子中提到的顧客購買后行為有:w1、w2、物流服務(wù)要素有:u2、u3,則在評論矩陣中記為{1,1,0,1,1,0,0,0,0},即表5中的r1。
表5 在線評論矩陣舉例
(四)分析結(jié)果
運用FP-growth算法挖掘在線評論矩陣中的關(guān)聯(lián)規(guī)則。首先,設(shè)置min_sup=0.01,min_conf=0.3,保證關(guān)聯(lián)規(guī)則之間的強關(guān)聯(lián)性;然后,過濾掉lift≤1的規(guī)則,保證出現(xiàn)物流服務(wù)要素的情況下也出現(xiàn)相應(yīng)的顧客購買后行為;得到179條關(guān)聯(lián)規(guī)則。濾掉如{w1}?{u6}類型的規(guī)則,篩選出符合研究的關(guān)聯(lián)規(guī)則,并將形如{u2}?{u3}和{u3}?{u2}兩種互反規(guī)則合并,最終匯總成68條數(shù)據(jù);其中與顧客重購行為關(guān)聯(lián)的規(guī)則有14條,如表6所示;與顧客推薦行為關(guān)聯(lián)的規(guī)則有9條,如表7所示。
表6 關(guān)于顧客重購行為的關(guān)聯(lián)規(guī)則
表7 關(guān)于顧客推薦行為的關(guān)聯(lián)規(guī)則
根據(jù)表6,可以得到以下結(jié)論:
a)與顧客重購行為w1具有強關(guān)聯(lián)關(guān)系的物流服務(wù)要素有:發(fā)貨速度u2、運送速度u3、送貨速度u4和快遞員服務(wù)態(tài)度u5。
b)支持度support最高的關(guān)聯(lián)規(guī)則是Rule_w1_3,說明在線評論中同時出現(xiàn)顧客重購行為和發(fā)貨速度的概率最大,即當B2C企業(yè)滿足送貨速度快并且準時,顧客重購的可能性最大;
c)置信度confidence最高的關(guān)聯(lián)規(guī)則是Rule_w1_12,說明在線評論中包含顧客重購行為的情況下含有發(fā)貨速度、送貨速度和快遞員的服務(wù)態(tài)度的概率最大,即當B2C企業(yè)滿足發(fā)貨速度迅速、送貨速度快并且準時和快遞員的服務(wù)態(tài)度良好時,顧客重購的可能性最大;
d)提升度lift最高的關(guān)聯(lián)規(guī)則是Rule_w1_12,說明在線評論中出現(xiàn)顧客重購行為的情況下也出現(xiàn)發(fā)貨速度、送貨速度和快遞員的服務(wù)態(tài)度的概率最大,即當B2C企業(yè)滿足發(fā)貨速度迅速、送貨速度快并且準時和快遞員的服務(wù)態(tài)度良好時,顧客重購的可能性最大。
根據(jù)表7,可以得到以下結(jié)論:
a)與顧客推薦行為w2具有強關(guān)聯(lián)關(guān)系的物流服務(wù)要素有:包裝完整u1、發(fā)貨速度u2、運送速度u3和送貨速度u4。
b)支持度support最高的關(guān)聯(lián)規(guī)則是Rule_w2_2,說明在線評論中同時出現(xiàn)顧客推薦行為和發(fā)貨速度的概率最大,即當B2C企業(yè)滿足送貨速度快并且準時時,顧客推薦的可能性最大;
c)置信度confidence最高的關(guān)聯(lián)規(guī)則是Rule_w2_3,說明在線評論中包含顧客推薦行為的情況下含有包裝和運送速度的概率最大,即當B2C企業(yè)滿足包裝完整和運貨速度快時,顧客推薦的可能性最大;
d)提升度lift最高的關(guān)聯(lián)規(guī)則是Rule_w2_3,說明在線評論中出現(xiàn)顧客推薦行為的情況下也出現(xiàn)包裝和運送速的概率最大,即當B2C企業(yè)滿足發(fā)貨速度迅速、送貨速度快并且準時和快遞員的服務(wù)態(tài)度良好時,顧客推薦的可能性最大。
隨著電子商務(wù)的交易量持續(xù)增加,已購買商品的顧客對電子商務(wù)物流服務(wù)的評論增多,物流服務(wù)評論成為顧客購買決策行為的重要影響因素之一,因此,本文對大量的在線評論進行內(nèi)容分析提取出顧客最關(guān)注的物流服務(wù)要素,并運用FP-growth算法從中挖掘出物流服務(wù)評論與顧客購買后行為間的強關(guān)聯(lián)規(guī)則,得到以下結(jié)果:
a)顧客最關(guān)注的物流服務(wù)要素有:包裝完整、快遞員服務(wù)態(tài)度好、發(fā)貨速度快、售后服務(wù)態(tài)度、運送速度快、退換貨速度和送貨速度快。顧客關(guān)注的物流服務(wù)要素貫穿于服務(wù)的全過程,除了對發(fā)貨速度有高要求之外,還包括前期的包裝、中途的運送、終端的配送、收貨后的退換貨等,因而物流服務(wù)企業(yè)提高服務(wù)質(zhì)量需要全過程改善,關(guān)注整體優(yōu)化。
b)與顧客重購行為具有強關(guān)聯(lián)規(guī)則的物流服務(wù)要素有:發(fā)貨速度、運送速度、送貨速度和快遞員服務(wù)態(tài)度。這說明,提高發(fā)貨速度、運送速度、送貨速度能夠促使顧客重購,而快遞員服務(wù)態(tài)度亦顯著影響顧客重購。因此,對于物流企業(yè)而言,除了物流服務(wù)的中間環(huán)節(jié),最后一公里、最后100米的物流服務(wù)至關(guān)重要。
c)與顧客推薦行為具有強關(guān)聯(lián)關(guān)系的物流服務(wù)要素有:包裝完整、發(fā)貨速度、運送速度和送貨速度。這說明,提高發(fā)貨速度、運送速度、送貨速度能夠促使顧客重購,而包裝的完整性亦顯著影響顧客推薦。因此,對于物流企業(yè)而言,除了物流服務(wù)的中間環(huán)節(jié),快遞的包裝的優(yōu)劣至關(guān)重要。
綜上所述,B2C企業(yè)可以從顧客最關(guān)注的物流服務(wù)要素來提升物流服務(wù)質(zhì)量;從改善與顧客重購行為具有強關(guān)聯(lián)規(guī)則的物流服務(wù)要素來增強顧客重購意愿,增加顧客重購次數(shù),降低企業(yè)成本,增加企業(yè)利潤;從改進與顧客推薦行為具有強關(guān)聯(lián)關(guān)系的物流服務(wù)要素來增強顧客推薦意愿,提升企業(yè)或產(chǎn)品的市場知名度。
[1] BRYANT R, KATZ R H, LAZOWSKA E D. Big-data computing: Creating revolutionary breakthroughs in commerce[J/OL]. Computing Research Association ,2008:1-15[2016-12-20]. https://doi.org/10.1145/2487575.2488188.
[2] GEFEN D. Customer loyalty in e-Commerce[J]. Journal of the Association for Information Systems, 2002, 3:27-51.
[3] STANK T P, GOLDSBY T J, VICKERY SK,et al. Logistics service performance: Estimating its influence on market share[J]. Journal of Business Logistics, 2003, 24(1):27-55.
[4] HOFACKER C F, GOLDSMITH R E, BRIDGES E,et al. E-Services: A synthesis and research agenda[J]. International Journal of Value Chain Management, 2007, 1(1):13-44.
[5] 張巖巖.B2C電子商務(wù)物流服務(wù)質(zhì)量測度模型及其應(yīng)用[D].長春:吉林大學,2011.
[6] 宗蕊,葛澤慧.消費者對B2C網(wǎng)購物流服務(wù)因素的感知分析:基于京東商城在線客戶評論的實證研究[J].消費經(jīng)濟,2014(2):53-58.
[7] 王家琦,張耀荔,陳靜.B2C網(wǎng)絡(luò)購物模式下物流服務(wù)質(zhì)量與顧客滿意的關(guān)系研究[J].中國商貿(mào),2013(1):112-114.
[8] 楊永清,于本海.基于物流服務(wù)的消費者在線購買后行為實證分析[J].管理學報,2014,11(3):434-438.
[9] SEIDERS K, VOSS G B, GREWAL D,et al. Do satisfied customers buy more? Examining moderating influences in a retailing context[J]. Journal ofMarketing, 2005, 69(4):26-43.
[10] 李泓蓉.網(wǎng)絡(luò)團購模式下顧客重復(fù)購買意向影響因素研究[D].北京:北京工業(yè)大學,2013.
[11] LILJANDER V, ROOS I. Customer-relationship levels-from spurious to true relationships[J]. Journal of Services Marketing, 2002, 16(7):593-614.
[12] TURNEY P D. Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL[C]// Machine Learning: ECML 2001. Berlin Heidelberg: Springer, 2001:491-502.
[13] DAVE K, LAWRENCE S, PENNOCK D M. Mining the peanut gallery: opinion extraction and semantic classification of product reviews[C]//International World Wide Web Conference. ACM,2003:519-528.
[14] HU M, LIU B. Mining opinion features in customer reviews[C]//Proceedings of the 19th national conference on Artifical intelligence. AAAI Press, 2004:755-760.
[15] TSOU B K Y. Polarity Classification of celebrity coverage in the Chinese Press[C/OL]//Proceedings of International Conference on Intelligence Analysis,Virgina,USA,2005.[2016-12-20]. https://www.mendeley.com/research-papers/polarity-classification-celebrity-coverage-chinese-press/.
[16] 王根,趙軍.基于多重冗余標記CRFs的句子情感分析研究[J].中文信息學報,2007,21(5):51-55.
[17] 張成功,劉培玉,朱振方,等.一種基于極性詞典的情感分析方法[J].山東大學學報(理學版),2012,47(3):50-53.
[18] AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large databases[J]. Acm Sigmod Record, 1993. 22(2):207-216. Mining association rules between sets of items in large databases[C]// ACM SIGMOD International Conference on Management of Data. ACM, 1993:207-216.
[19] 韓家煒,范明,孟小峰.數(shù)據(jù)挖掘概念與技術(shù)[M].北京.機械工業(yè)出版社,2007:158-159.
(責任編輯: 錢一鶴)
Association Analysis Between Logistics Service Review and Custoerms’ Post-purchase Behavior
WANGShixiong,LANYizhen,LIXue
(School of Economics and Management, Zhejiang Sci-Tech University, Hangzhou 310018, China)
In online shopping platform, customers’ logistics service review usually influences purchase decision behavior of new customers. Online reviews data about women's dress were obtained from Jimgdong eMall with web crawler. The factors about logistics service and customers’ post-purchase behaviors were extracted from the review through Chinese words segmentation and emotion analysis. Then, logistics service factors that customers pay most attention to and the most widespread customers’ post-purchase behaviors were gained. Meanwhile, FP-growth algorithm was used to mine the strong association rules between the logistics service factors and the post-purchase behavior. The result shows that different post-purchase behaviors bring different emphasis on logistics service perception. This research will help B2C merchants to find the key point to optimize the logistics service and provide reference for improving the quality of logistics services.
logistics service; content analysis; post-purchase behavior; association mining
10.3969/j.issn.1673-3851.2017.08.001
2016-12-20 網(wǎng)絡(luò)出版日期: 2017-05-24
國家社會科學基金項目(14BXW026)
王世雄(1976—),男,湖北黃岡人,副教授,博士,主要從事信息管理、網(wǎng)絡(luò)傳播和供應(yīng)鏈管理方面的研究。
F252
A
1673- 3851 (2017) 04- 0285- 08