黃官偉 邵立軻
(同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海 200092)
中國(guó)的旅游市場(chǎng)已具有相當(dāng)?shù)囊?guī)模,根據(jù)世界旅游城市聯(lián)合會(huì)(WTCF)和中國(guó)社會(huì)科學(xué)院旅游研究中心共同發(fā)布的《世界旅游經(jīng)濟(jì)趨勢(shì)報(bào)告(2020)》,2019年中國(guó)的旅游行業(yè)總收入居全球第二,國(guó)內(nèi)旅游人次增速、國(guó)內(nèi)旅游收入增速均居亞太地區(qū)首位。此外,得益于國(guó)內(nèi)疫情的有效控制,國(guó)內(nèi)旅游市場(chǎng)恢復(fù)迅速,大量出境游需求回流入國(guó)內(nèi),助推國(guó)內(nèi)旅游市場(chǎng)的進(jìn)一步發(fā)展。作為旅游出行的重要環(huán)節(jié),在線酒店預(yù)訂產(chǎn)業(yè)發(fā)展已漸趨成熟,攜程、藝龍等頭部企業(yè)均已成功登陸資本市場(chǎng)。
相較于發(fā)展日漸成熟的在線預(yù)訂市場(chǎng),我國(guó)酒店業(yè)連鎖化程度低,連鎖化率不到30%,存在大量的單體酒店,服務(wù)缺乏統(tǒng)一標(biāo)準(zhǔn)與有效指引。
服務(wù)質(zhì)量通常被定義為客戶對(duì)服務(wù)提供商及其服務(wù)的印象。高服務(wù)質(zhì)量能提高顧客滿意度,從而吸引更多的顧客,為企業(yè)帶來更多的回報(bào)。由于顧客才是服務(wù)質(zhì)量的最終判定者,傳統(tǒng)的服務(wù)質(zhì)量測(cè)度多采用問卷調(diào)查法,其中最為著名的是Parasuraman等人(1988)開發(fā)的SERVQUAL量表,該量表從可靠性、反應(yīng)性、保證性、移情性和可感知性五個(gè)方面度量了顧客對(duì)服務(wù)的期望值以及最終感知質(zhì)量,為許多學(xué)者提供了思路。在此基礎(chǔ)上,Cronin與Taylor于1992年提出SERVPERF模型,只采用服務(wù)績(jī)效這一個(gè)變量來衡量顧客感知價(jià)值;Parasuraman等人也于1994年對(duì)SERVQUAL量表進(jìn)行了擴(kuò)展,增加了感知質(zhì)量與理想質(zhì)量、感知質(zhì)量與適當(dāng)質(zhì)量的差異。但問卷調(diào)查法存在一些問題:一方面由于問卷的分發(fā)與收集需花費(fèi)大量的時(shí)間與精力,很難大規(guī)模開展,因此收集到的數(shù)據(jù)規(guī)模有限,以致代表性不足;另一方面填問卷時(shí)被訪者會(huì)意識(shí)到自己的觀點(diǎn)被記錄,因此有可能會(huì)隱瞞自己的真實(shí)想法。
進(jìn)入互聯(lián)網(wǎng)2.0時(shí)代后,在線評(píng)論的出現(xiàn)為針對(duì)消費(fèi)者的定量研究的開展提供了理想的數(shù)據(jù)源——在線評(píng)論具有數(shù)據(jù)規(guī)模大與自發(fā)性的特點(diǎn),能更真實(shí)地反映消費(fèi)者群體的態(tài)度,相比傳統(tǒng)的渠道的數(shù)據(jù)具備更高的可信度。許多學(xué)者通過對(duì)在線評(píng)論的挖掘?qū)崿F(xiàn)了對(duì)消費(fèi)者偏好的測(cè)度:Ya-Han Hu與Kuan-Chin Chen(2016)基于在線評(píng)論內(nèi)容、情感傾向、作者以及可見性構(gòu)建了對(duì)評(píng)論有用性的預(yù)測(cè)模型;Paul Phillips等人(2015)使用人工神經(jīng)網(wǎng)絡(luò)對(duì)瑞士酒店的在線評(píng)論進(jìn)行了分析,發(fā)現(xiàn)房間質(zhì)量、積極的評(píng)論數(shù)、酒店聲譽(yù)以及客房星級(jí)評(píng)分對(duì)于酒店的平均客房收入(RevPar)有積極影響。因此,本研究將沿用這一思路,通過機(jī)器學(xué)習(xí)算法對(duì)在線評(píng)論進(jìn)行挖掘,將得到的顧客偏好信息作為后續(xù)服務(wù)質(zhì)量管理的基礎(chǔ)。
服務(wù)質(zhì)量提高的主要思路是通過對(duì)服務(wù)質(zhì)量要素進(jìn)行分類,制定針對(duì)性的服務(wù)提升策略實(shí)現(xiàn)的。Martilla和James(1977)提出的重要性績(jī)效分析模型(IPA)使用重要性和績(jī)效來創(chuàng)建一個(gè)二維矩陣,將整體區(qū)域劃分為四個(gè)象限:“繼續(xù)保持”,“關(guān)注過度”,“低優(yōu)先級(jí)”和“重點(diǎn)關(guān)注”,以此來對(duì)產(chǎn)品質(zhì)量要素進(jìn)行分類;Noriaki Kano等人(1984)認(rèn)為用戶滿意度隨需求被滿足情況的變化應(yīng)是非線性的,并提出了Kano模型(圖1)。
圖1 Kano模型
IPA模型與Kano模型都可用于服務(wù)質(zhì)量要素的分類,但二者側(cè)重點(diǎn)有所差異:IPA模型主要基于重要性和滿意度發(fā)現(xiàn)更具提升潛力的服務(wù)質(zhì)量要素;而Kano模型側(cè)重于刻畫各服務(wù)質(zhì)量要素隨滿意度變化的規(guī)律。將兩者結(jié)合,就能篩選出對(duì)于提高顧客滿意度邊際效應(yīng)最大的服務(wù)質(zhì)量要素,Ying-Feng Kuo等人在2012年提出了IPA-Kano模型(表1):將Kano模型中具備優(yōu)化價(jià)值的興奮要素、必備要素與一維要素從重要性與滿意度兩個(gè)維度進(jìn)行二次分類,得到整合了IPA與Kano后的綜合分類標(biāo)準(zhǔn),并制定了不同類別要素的優(yōu)化方向與優(yōu)化優(yōu)先級(jí)。IPA-Kano模型自提出后已在移動(dòng)圖書館、移動(dòng)餐廳、醫(yī)療服務(wù)等領(lǐng)域應(yīng)用。
表1 IPA-Kano模型與服務(wù)優(yōu)化方向
HS*9
服務(wù)質(zhì)量的研究通常需要?jiǎng)澐址?wù)質(zhì)量要素,由于研究重點(diǎn)與方向的差異,學(xué)者們劃分的要素也有所差異(表2):
表2 酒店服務(wù)質(zhì)量研究進(jìn)展
在總結(jié)前人的研究成果后,本研究最終確定的服務(wù)質(zhì)量要素為餐食、裝修、房間設(shè)施、服務(wù)、酒店設(shè)施、酒店位置、隔音、清潔、性價(jià)比。部分學(xué)者對(duì)酒店品牌進(jìn)行了研究,但由于酒店品牌主要是通過影響用戶對(duì)于服務(wù)的期待值來影響顧客滿意度,對(duì)于酒店服務(wù)質(zhì)量的評(píng)價(jià)與改進(jìn)并無實(shí)質(zhì)影響。因此,本研究劃分的服務(wù)質(zhì)量要素并未包括酒店品牌。
本研究的主要目的是使用機(jī)器學(xué)習(xí)算法對(duì)在線評(píng)論進(jìn)行挖掘,計(jì)算顧客對(duì)于不同服務(wù)質(zhì)量要素的偏好,以此為基礎(chǔ)對(duì)服務(wù)質(zhì)量要素進(jìn)行分類并制定服務(wù)提升策略。整體研究思路分為三部分:(1)評(píng)論特征信息提取;(2)顧客偏好計(jì)算;(3)服務(wù)質(zhì)量要素分類與服務(wù)提升策略制定。研究框架如圖2所示。
圖2 研究框架圖
評(píng)論特征信息提取階段的主要目的是使用機(jī)器學(xué)習(xí)算法對(duì)在線評(píng)論數(shù)據(jù)進(jìn)行處理,將非結(jié)構(gòu)化的文本數(shù)據(jù)轉(zhuǎn)化為能代表評(píng)論特征的結(jié)構(gòu)化數(shù)據(jù)。
首先需要對(duì)在線評(píng)論進(jìn)行預(yù)處理:(1)數(shù)據(jù)清洗。剔除重復(fù)文本、無意義文本以及長(zhǎng)度過短的文本(5個(gè)字以下)。(2)分詞與停用無意義詞。(3)替換近義詞。(4)文本分段。由于在線評(píng)論是對(duì)整個(gè)服務(wù)過程的綜合評(píng)價(jià),一條可能會(huì)涉及多個(gè)服務(wù)質(zhì)量要素,本研究將所有評(píng)論按標(biāo)點(diǎn)符號(hào)拆分為評(píng)論片段,使每條評(píng)論片段盡量只對(duì)應(yīng)一個(gè)要素。
然后需要對(duì)評(píng)論文本進(jìn)行分類。本文采用樸素貝葉斯算法對(duì)所有評(píng)論分段進(jìn)行分類,樸素貝葉斯算法對(duì)于缺失數(shù)據(jù)不敏感且在多分類任務(wù)上表現(xiàn)較好,比較適用于文本分類。分類完成后得到各服務(wù)質(zhì)量要素對(duì)應(yīng)的文本分段集合Xj(j是各服務(wù)質(zhì)量要素對(duì)應(yīng)的編號(hào))。
使用Python語言的開源庫Snow NLP計(jì)算各評(píng)論分段的情感評(píng)分xijn)(第i條評(píng)論在第j個(gè)服務(wù)質(zhì)量要素上的第n條評(píng)論分段),分別匯總屬于同一條評(píng)論、同一服務(wù)質(zhì)量要素的正負(fù)向評(píng)論片段,計(jì)算
顧客偏好計(jì)算階段的主要工作是基于上一階段得到的文本特征,使用聯(lián)合分析方法,測(cè)量各服務(wù)質(zhì)量要素對(duì)顧客滿意度的影響程度。本文采用基于部分價(jià)值函數(shù)模型的聯(lián)合分析方法,模型如下:
其中,y是顧客滿意度的列向量,即每條評(píng)論中顧客對(duì)酒店的整體評(píng)分;α是常數(shù)項(xiàng);J表示服務(wù)質(zhì)量要素的總數(shù);Xjpos是第j個(gè)服務(wù)質(zhì)量要素上的列向量,即同理),如果評(píng)論中未涉及該維度,則與是評(píng)分的權(quán)重,即本階段希望得到的顧客對(duì)該服務(wù)質(zhì)量要素的正/負(fù)向情感偏好。
2.3.1 基于Kano模型的服務(wù)質(zhì)量要素分類
Kano模型將產(chǎn)品質(zhì)量要素分為5類,為了對(duì)服務(wù)質(zhì)量要素進(jìn)行分類,本研究設(shè)置了三個(gè)觀察點(diǎn):(-1,βjneg)、(0,0)和(1,),并基于估計(jì)出的β值,構(gòu)建兩個(gè)指標(biāo):
Rangej表示顧客對(duì)于第j個(gè)服務(wù)質(zhì)量要素偏好的變化范圍,Backlogj表示顧客對(duì)于第j個(gè)服務(wù)質(zhì)量要素的綜合偏好。
若||≤γ且||≤γ(γ是事先確定的閾值),則該服務(wù)質(zhì)量要素為無差異要素;相反地,若|Backlogj|≤δ*Rangej(δ是事先確定的系數(shù))且Backlogj≥0,則該服務(wù)質(zhì)量要素屬于一維要素;若|Backlogj|≤δ*Rangej且Backlogj<0,則該服務(wù)質(zhì)量要素屬于反向要素;若|Backlogj|>δ*Rangej且Backlogj≥0,則該服務(wù)質(zhì)量要素屬于興奮要素;若|Backlogj|>δ*Rangej且Backlogj<0,則該服務(wù)質(zhì)量要素屬于必備要素,根據(jù)分類規(guī)則可以構(gòu)建一個(gè)決策樹,如圖3所示。
圖3 Kano模型分類決策樹
2.3.2 基于IPA模型的服務(wù)質(zhì)量要素分類
IPA模型從重要性和績(jī)效兩個(gè)方面來對(duì)服務(wù)質(zhì)量要素進(jìn)行分類。在重要性方面,本研究通過構(gòu)建Importancej變量來實(shí)現(xiàn)服務(wù)質(zhì)量要素重要性的測(cè)量:
在績(jī)效方面,本研究采用顧客對(duì)某一服務(wù)質(zhì)量要素的滿意度,即該要素上評(píng)論分段情感評(píng)分的均值ˉxj來估計(jì):
其中,N表示第i條評(píng)論中第j個(gè)服務(wù)質(zhì)量要素上的評(píng)論分段的總數(shù);I表示評(píng)論總數(shù)。
對(duì)于各要素的重要性與滿意度,若其值高于平均水平,則記為高,否則應(yīng)記為低。
2.3.3 基于IPA-Kano模型的服務(wù)質(zhì)量要素分類
綜合IPA與Kano模型的分類結(jié)果,決策優(yōu)先級(jí),確定各服務(wù)質(zhì)量要素最終的類別、服務(wù)提升的方向以及決策的優(yōu)先級(jí)。本研究贊同應(yīng)當(dāng)對(duì)低滿意度的要素采取“提升服務(wù)”的策略,對(duì)滿意度高的要素采取“繼續(xù)保持”的策略。但關(guān)于策略的優(yōu)先級(jí),本研究進(jìn)行了一定修改:提升服務(wù)時(shí)優(yōu)先級(jí)Pri必備>Pri一維>Pri興奮,因?yàn)榉?wù)水平由低到高變化時(shí)曲線的斜率k必備>k一維>k興奮;采取繼續(xù)保持策略時(shí),優(yōu)先級(jí)Pri興奮>Pri一維>Pri必備,因?yàn)榉?wù)水平由高到低變化時(shí)曲線的斜率k興奮>k一維>k必備。在相同情況下,重要性較高的要素優(yōu)先級(jí)也較高。最終本研究修改后的IPA-Kano模型如表3所示。
表3 本研究修改后的IPA-Kano模型
由于酒店在線預(yù)訂行業(yè)集中度較高,頭部平臺(tái)活躍用戶數(shù)據(jù)拔高明顯,本研究采用行業(yè)活躍用戶排名第一的攜程網(wǎng)作為數(shù)據(jù)來源。使用Python爬取上海地區(qū)的9家連鎖酒店評(píng)論共計(jì)10389條,如表4所示。將所有評(píng)論按標(biāo)點(diǎn)符號(hào)拆分為評(píng)論片段,然后對(duì)評(píng)論片段進(jìn)行數(shù)據(jù)預(yù)處理,最終將每條評(píng)論片段轉(zhuǎn)化為一組特征詞的集合。
表4 數(shù)據(jù)集合
基于文獻(xiàn)研究,本研究將酒店服務(wù)質(zhì)量劃分為酒店位置、服務(wù)、餐食、裝修、房間設(shè)施、酒店設(shè)施、隔音、清潔和性價(jià)比9個(gè)維度。使用樸素貝葉斯算法對(duì)評(píng)論片段進(jìn)行分類,首先隨機(jī)抽取3000條評(píng)論(約占整體評(píng)論片段5%)進(jìn)行人工標(biāo)注,作為模型訓(xùn)練集與測(cè)試集。使用Python中的sklearn進(jìn)行模型的訓(xùn)練與調(diào)優(yōu),最終模型精度為81.41%,評(píng)論片段的分類結(jié)果如表5所示:
表5 評(píng)論片段分類結(jié)果
使用Python語言的開源庫Snow NLP對(duì)所有評(píng)論片段計(jì)算情感評(píng)分,為方便后續(xù)研究的開展,對(duì)Snow NLP得到的情感評(píng)分進(jìn)行轉(zhuǎn)換,使其取值區(qū)間為[-1,1]。計(jì)算與,將全部10389條評(píng)論數(shù)據(jù)作為輸入數(shù)據(jù)進(jìn)行參數(shù)估計(jì),使用SPSS25進(jìn)行計(jì)算,得到各要素的顧客偏好與的估計(jì)結(jié)果(表6)。
表6 各維度的權(quán)重估計(jì)結(jié)果
結(jié)合實(shí)際數(shù)據(jù),本研究將γ與δ分別設(shè)置為0.01與0.2。計(jì)算各服務(wù)質(zhì)量要素的Range、Backlog、Importance與xj值,得到結(jié)果見表7。
表7 參數(shù)計(jì)算結(jié)果
根據(jù)前文提到的Kano模型分類標(biāo)準(zhǔn),清潔、隔音與裝修屬于必備要素,當(dāng)顧客對(duì)于這些要素的需求得不到滿足時(shí),易造成顧客的滿意度大幅下降,而當(dāng)顧客的需求得到基本滿足后,其對(duì)于滿意度的貢獻(xiàn)并不明顯;酒店設(shè)施與房間設(shè)施屬于一維要素,當(dāng)顧客在這些方面的需求被滿足時(shí)會(huì)提高顧客滿意度,反之亦然;服務(wù)、餐食、酒店位置與性價(jià)比屬于興奮要素,是酒店的加分項(xiàng),這些方面的需求被滿足后能大幅提高顧客的滿意度。
結(jié)合各要素重要性與滿意度的評(píng)分,得到最終IPA-Kano模型分類結(jié)果(表8)。針對(duì)顧客滿意度低于平均值的要素(隔音、裝修與房間設(shè)施)應(yīng)采取提升服務(wù)的策略。又因?yàn)楦粢襞c裝修屬于必備要素,在滿意度水平較低時(shí)提升效率更高,因此優(yōu)先級(jí)排序?yàn)镻ri隔音>Pri裝修>Pri房間設(shè)施;對(duì)于余下顧客滿意度高于平均值的要素,應(yīng)采取繼續(xù)保持的策略,考慮到顧客需求得到滿足后興奮要素、一維要素與必備要素對(duì)滿意度的影響依次遞減,各要素的優(yōu)先級(jí)應(yīng)為Pri服務(wù)>Pri酒店位置>Pri餐食>Pri性價(jià)比>Pri酒店設(shè)施>Pri清潔。
表8 IPA-Kano模型分類結(jié)果
用戶生成內(nèi)容一直是互聯(lián)網(wǎng)2.0時(shí)代以來的研究熱點(diǎn),得益于用戶生成內(nèi)容的出現(xiàn),研究者們終于可以以相對(duì)較低的成本獲取大范圍的用戶數(shù)據(jù)用于研究。本研究提出的服務(wù)質(zhì)量管理研究思路具備以下兩方面意義:
一方面,通過文本挖掘技術(shù)與聯(lián)合分析法實(shí)現(xiàn)了基于大體量用戶數(shù)據(jù)的用戶偏好測(cè)量,研究樣本更具備代表性,研究結(jié)果更具備客觀性與可信度;另一方面,在后期對(duì)用戶數(shù)據(jù)的分析與研究上使用已經(jīng)過學(xué)界驗(yàn)證與認(rèn)可的成熟模型(IPA-Kano),保障了研究體系的科學(xué)性與嚴(yán)謹(jǐn)性,使最終結(jié)果更具備理論與實(shí)際意義。
本研究仍然存在一定不足,后續(xù)的研究可以從以下方向開展:首先,由于目前文本挖掘技術(shù)尚未完全成熟,對(duì)部分反問或包含諷刺、反語的文本未能準(zhǔn)確地進(jìn)行識(shí)別與處理,這需要在未來進(jìn)一步優(yōu)化文本特征提取與語義理解的相關(guān)算法;其次,隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)步,用戶生成內(nèi)容的形式日益豐富,除了評(píng)論文本外,還常常包含圖片、視頻等多媒體數(shù)據(jù),在后續(xù)研究中可以將其他媒體形式的數(shù)據(jù)納入研究范圍,研究多模態(tài)數(shù)據(jù)下服務(wù)質(zhì)量管理研究的新思路。