金 英,蘇 萌,涂 平
(北京大學(xué) 光華管理學(xué)院,北京100871)
具有同樣滿意程度的客戶可能會(huì)有不同的行為意向,滿意度閾的不同可能是造成這種情況的原因之一。以往研究提出,不同的客戶可能有不同的滿意度閾,只有當(dāng)滿意度分?jǐn)?shù)超過(guò)某個(gè)閾值時(shí),客戶才會(huì)體現(xiàn)推薦或出重購(gòu)行為[1]。滿意度調(diào)查通常只能得到客戶的滿意程度,但是無(wú)法了解具體什么程度的滿意度可以導(dǎo)致客戶忠誠(chéng)。而高滿意度不一定能導(dǎo)致客戶忠誠(chéng)[2][3]。因此,只測(cè)量客戶滿意度是不夠的。較低的滿意度閾意味著該客戶的滿意水平容忍度和忠誠(chéng)度較高,而較高的滿意度閾則表示該客戶對(duì)滿意水平的容忍度低,不容易產(chǎn)生重購(gòu)意愿和行為[1][4]。如果企業(yè)能夠估計(jì)出每個(gè)客戶的滿意度閾,則不僅可以幫助企業(yè)加深了解客戶內(nèi)在的忠誠(chéng)性,而且可以根據(jù)不同滿意度閾值,設(shè)計(jì)個(gè)性化的客戶忠誠(chéng)計(jì)劃。
滿意度閾是一個(gè)潛在的變量,如果采用客戶自我報(bào)告的方法來(lái)獲得,其客觀性和可靠性會(huì)存在問(wèn)題。因而滿意度閾更適合采用間接估算的方法。但是,目前有關(guān)這方面的定量研究還非常少,有限的幾個(gè)相關(guān)研究也存在各自的局限性。如Mittal和Kamakura的binary probit模型[1]在估計(jì)個(gè)體層次的重購(gòu)閾上不夠完善,造成所有具有相同人口統(tǒng)計(jì)變量的客戶有完全相同的閾值;而單變量分層Bayes Probit模型[5]雖然可以估計(jì)出客戶個(gè)體層次的推薦閾和重購(gòu)閾,但是推薦意愿和重購(gòu)意愿必須分別考慮。重購(gòu)意愿和推薦意愿是反映客戶忠誠(chéng)的兩個(gè)最主要的維度[6][7][8]??疾炜蛻糁艺\(chéng)應(yīng)當(dāng)同時(shí)考慮客戶在不同維度上的聯(lián)合表現(xiàn)。因?yàn)槌巳丝诮y(tǒng)計(jì)因素和產(chǎn)品及消費(fèi)經(jīng)歷因素,某些消費(fèi)者的人格特征可能會(huì)共同影響其推薦意愿和重購(gòu)意愿。如果能在模型中捕捉到這部分因素,對(duì)推薦閾和重購(gòu)閾進(jìn)行聯(lián)合建模,會(huì)更有利于準(zhǔn)確地估計(jì)。
Mittal和Kamakura的研究[1]針對(duì)美國(guó)汽車(chē)消費(fèi)者,使用Probit模型來(lái)考察客戶滿意度對(duì)未來(lái)實(shí)際重購(gòu)行為的影響,他們的模型中包含了重購(gòu)閾參數(shù)。Mittal和Kamakura假設(shè)消費(fèi)者j有重購(gòu)行為的概率等于他的真實(shí)的滿意度大于其滿意度閾的概率[1]:
其中,Yj是消費(fèi)者j是否重購(gòu)的0-1變量,Sj是消費(fèi)者j的真實(shí)滿意度,uj是該消費(fèi)者的滿意度閾。Mittal和Kamakura進(jìn)一步假設(shè),消費(fèi)者的滿意度閾受他的人口統(tǒng)計(jì)因素的影響,所以他們將滿意度閾表達(dá)為人口統(tǒng)計(jì)變量的回歸:
其中,γ0和γk是參數(shù),K是人口統(tǒng)計(jì)變量的個(gè)數(shù),Zjk是人口統(tǒng)計(jì)變量,η是誤差項(xiàng),服從標(biāo)準(zhǔn)正態(tài)分布。
Mittal和Kamakura認(rèn)為,消費(fèi)者報(bào)告的滿意度分?jǐn)?shù)Oj只是一個(gè)反映消費(fèi)者潛在的真實(shí)滿意度的指標(biāo),因而他們把真實(shí)的滿意度表示為Oj的回歸:
其中,βj是參數(shù),ε是誤差項(xiàng),服從標(biāo)準(zhǔn)正態(tài)分布。
Mittal和Kamakura假設(shè)報(bào)告的滿意度轉(zhuǎn)換為真實(shí)的滿意度的關(guān)系受到消費(fèi)者特征的影響:
其中δ0和δk是參數(shù)。把(3)和(4)式代入(2)式,得到:
從(5)式可以看出,η和ε不能識(shí)別。因此,要計(jì)算客戶個(gè)體層次的重購(gòu)閾只能使用:
這樣就不能把未測(cè)量的消費(fèi)者特征因素考慮進(jìn)去,結(jié)果造成所有具有相同人口統(tǒng)計(jì)變量的消費(fèi)者將具有完全相同的重購(gòu)閾的不合理現(xiàn)象。Mittal和Kamakura的模型主要是為了捕捉客戶特征對(duì)滿意度與重購(gòu)行為之間關(guān)系的調(diào)節(jié)作用,因此對(duì)重購(gòu)閾的建模不夠完善。因此,該模型不適于估計(jì)個(gè)體層次的重購(gòu)閾。
單變量分層Bayes Probit模型分別對(duì)客戶推薦閾和重購(gòu)閾進(jìn)行如下建模[5]:
其中,Yi=1表示客戶i選擇推薦或重購(gòu),ri表示客戶i的推薦閾或重購(gòu)閾,βi是客戶i的線性系數(shù),Oi是客戶i報(bào)告的滿意度分?jǐn)?shù),ε是誤差項(xiàng)。
另外一層模型用于控制參數(shù)異質(zhì)性(heterogeneity),
其中,Zi表示客戶i的特征變量所構(gòu)成的向量;表示系數(shù)向量的轉(zhuǎn)置向量;v是誤差項(xiàng)。單變量分層模型的局限在于沒(méi)有考慮客戶的某些內(nèi)在因素可能會(huì)共同影響推薦意愿或重購(gòu)意愿,因而在一定程度上削弱估計(jì)的準(zhǔn)確性。
本研究采用與Mittal和Kamakura[1]類(lèi)似的假設(shè):客戶報(bào)告的滿意度分?jǐn)?shù)是客戶真實(shí)的滿意度水平的反映,當(dāng)真實(shí)的滿意度超過(guò)其推薦閾時(shí),客戶就有推薦意愿;反之,則無(wú)。也可以說(shuō)是,客戶有推薦意愿的概率等于他的真實(shí)滿意度大于其推薦閾的概率。用公式可以表示為:
其中,Y1i=1表示客戶i(i=1,…,n)表示愿意推薦,Y1i=0表示不愿意推薦;w1i是潛變量;Xi是客戶i自我報(bào)告的滿意度分?jǐn)?shù);β1i是系數(shù),反映了客戶報(bào)告的滿意度對(duì)其推薦閾的影響;r1i表示客戶i的推薦閾;ε1i是誤差項(xiàng)。
用同樣的方法,可以對(duì)重購(gòu)閾建模:
其中,Y2i=1表示客戶i表示愿意重購(gòu),Y2i=0表示不愿意重購(gòu),w2i是潛變量,β2i是系數(shù),r2i表示客戶i的重購(gòu)閾,ε2i是誤差項(xiàng)。
由于可能有某些共同的潛在因素會(huì)影響到客戶對(duì)是否愿意推薦和重購(gòu)的判斷,所以(9)和(10)式的誤差項(xiàng)可能具有一定的相關(guān)關(guān)系,因而可以假設(shè)它們共同服從一個(gè)雙變量正態(tài)分布。用公式表達(dá)為:
需要注意的是,對(duì)于Probit模型來(lái)說(shuō),模型的回歸系數(shù)和協(xié)方差是不能被識(shí)別的[9]。為了處理參數(shù)識(shí)別問(wèn)題,依據(jù)Chib和Greenberg[9]的方法,這里設(shè)定協(xié)方差矩陣Σ等于它的相關(guān)矩陣ρ是兩個(gè)誤差項(xiàng)的相關(guān)系數(shù)。這樣,由(9)、(10)和(11)式共同構(gòu)成了一個(gè)雙變量Probit模型。
對(duì)于上述雙變量Probit模型,需要估計(jì)的參數(shù)有r1i,β1i,r2i,β2i和Σ。由于本研究的目的是估算出每個(gè)客戶的滿意度閾,所以r1i,β1i,r2i和β2i被定義為客戶個(gè)體層次的參數(shù),即不同客戶的r1i,β1i,r2i和β2i值是不同的。Rossi,McCulloch和Allenby等人[10]使用的分層Bayes建模方法適用于處理此類(lèi)異質(zhì)性參數(shù)問(wèn)題。使用該方法需要進(jìn)一步對(duì)系數(shù)r1i,β1i,r2i和β2i建立線性回歸模型。這種分層建模方法假設(shè)客戶各自不同的系數(shù)是受他自身特征因素影響的,因而這些特征因素可以作為解釋變量對(duì)第一層模型的系數(shù)r1i,β1i,r2i和β2i進(jìn)行回歸,并形成第二層模型。具體可用公式表示為:
其中,Zi表示客戶i的特征變量所構(gòu)成的向量;表示系數(shù)向量的轉(zhuǎn)置向量,分別對(duì)應(yīng)參數(shù)r1i,β1i,r2i和β2i。并且,考慮到可能存在某些不可觀測(cè)的客戶特征因素影響其推薦閾和重購(gòu)閾,假設(shè)誤差項(xiàng)ηji服從多變量聯(lián)合Normal(0,V)。V是協(xié)方差矩陣。同樣,為了處理參數(shù)不可識(shí)別問(wèn)題,我們假設(shè)協(xié)方差矩陣等于它的相關(guān)矩陣D:
至此,由(9)~(12)式共同構(gòu)成了一個(gè)分層的雙變量Probit模型。但是該模型的對(duì)數(shù)似然函數(shù)卻難以用傳統(tǒng)方法進(jìn)行估計(jì)。主要是因?yàn)殡p變量的概率形式是非標(biāo)準(zhǔn)的,而且對(duì)參數(shù)求導(dǎo)困難。因此,本文采用Bayes MCMC模擬方法解決模型估計(jì)問(wèn)題。
首先需要對(duì)模型參數(shù)Δ、Σ和D設(shè)定先驗(yàn)概率分布。參照Bayes模型的標(biāo)準(zhǔn)做法,設(shè)定Δ和D的先驗(yàn)概率分布為:
其中,A-1為對(duì)角矩陣,D服從Inverted Wishart分布。
另外,設(shè)定Σ的先驗(yàn)概率分布為InvertedWishart(υ0,Λ0)。
本模型的參數(shù)后驗(yàn)?zāi)M抽樣算法可以由下面的Gibbs抽樣步驟構(gòu)成。
第一步:設(shè)定β1i,r1i,β2i,r2i,Σ和D的初始值;
第二步:給定β1i,r1i,β2i,r2i和Σ,對(duì)潛變量w1i和w2i進(jìn)行抽樣;
第三步:給定D和Σ,對(duì)β1i,r1i,β2i和r2i進(jìn)行抽樣;
第四步:給定β1i,r1i,β2i,r2i,w1i和w2i,對(duì)Σ進(jìn)行抽樣;
第五步:給定β1i,r1i,β2i和r2i,對(duì) Δ 和D進(jìn)行抽樣。返回第二步。
具體來(lái)說(shuō),在第二步為了實(shí)現(xiàn)對(duì)Σ的抽樣,首先對(duì)潛變量 w1i和w2i進(jìn)行抽樣。假設(shè)給定了β1i,r1i,β2i,r2i和Σ,則w1i和w2i可由二元正態(tài)分布隨機(jī)產(chǎn)生。但是,需要注意的是,w1i和w2i的正負(fù)與Y1i和Y2i取值相對(duì)應(yīng)。Y為0時(shí),w應(yīng)當(dāng)小于等于0;Y為1時(shí),w大于0。因此,實(shí)際上這個(gè)隨機(jī)分布應(yīng)當(dāng)是截?cái)嗟亩龖B(tài)分布。在抽取w1i和w2i時(shí),本研究采用GHK算法來(lái)實(shí)現(xiàn)截?cái)喽龖B(tài)隨機(jī)數(shù)的產(chǎn)生[11][12]。該算法可以將截?cái)嗟亩龖B(tài)分布轉(zhuǎn)換為兩個(gè)獨(dú)立的截?cái)嘁辉龖B(tài)分布,這樣可以保證一次性產(chǎn)生符合條件的隨機(jī)數(shù)。
根據(jù)給定的D和Σ,對(duì)β1i,r1i,β2i和r2i進(jìn)行抽樣。β1i,r1i,β2i和r2i是個(gè)體層次的參數(shù),本研究參照分層Logit模型的Gibbs算法中對(duì)個(gè)體層次參數(shù)的處理方法[13],對(duì)β1i,r1i,β2i和r2i的抽樣使用隨機(jī)游走M(jìn)etropolis-Hastings算法來(lái)實(shí)現(xiàn)[14]。具體步驟如下:
(3)令
(4)對(duì) u ~ Uniform[0,1]進(jìn)行隨機(jī)抽樣,如果u≤α(Bi
(k-1);Bi) ,則;否則,
給定β1i,r1i,β2i,r2i,w1i和 w2i,對(duì)Σ進(jìn)行抽樣。只要知道了β1i,r1i,β2i,r2i,w1i,w2i和 Xi,則(9)和(10)式就構(gòu)成兩個(gè)SUR(Seemingly Unrelated Regression)方程[15]。對(duì)于SUR模型,如果假設(shè)Σ的先驗(yàn)概率服從InvertedWishart(υ0, Λ0)分布,那么它的后驗(yàn)概率分布也是Inverted Wishart,即:
Σ|β1i,r1i,β2i,r2i,w1i,w2i,Xi~I(xiàn)nvertedWishart(υ0+n,S+Λ0)
其中,S=E’E,E為誤差,可以根據(jù)β1i,r1i,β2i,r2i,w1i,w2i和Xi計(jì)算出來(lái)。這樣就可以根據(jù)它的后驗(yàn)概率分布對(duì)Σ進(jìn)行抽樣了。
給定β1i,r1i,β2i和r2i,可以對(duì) Δ 和D進(jìn)行抽樣,這相當(dāng)于一個(gè)雙變量線性回歸模型。首先,依據(jù)下面的后驗(yàn)條件概率分布對(duì)D進(jìn)行抽樣:
其中,S=E’E
其次,給定D,根據(jù)下面后驗(yàn)條件概率分布對(duì)Δ進(jìn)行抽樣:
上述步驟完成之后,再回到算法的第二步,進(jìn)入下一次迭代。
本研究以公開(kāi)發(fā)行的自由軟件R 2.7.0[16]為編程環(huán)境,在 bayesm[17],MASS[18],mvtnorm[19],msm[20]等軟件包的基礎(chǔ)上編程實(shí)現(xiàn)數(shù)據(jù)模擬和模型估計(jì)及檢驗(yàn)。
首先,任意設(shè)定參數(shù)取值如下:ρ=-0.1;d12=d13=模擬的樣本大小為n=5000。然后,根據(jù)模型(9)~(12)式生成模擬數(shù)據(jù)。用本研究提出的雙變量分層Bayes Probit模型的MCMC算法對(duì)參數(shù)進(jìn)行估計(jì)。運(yùn)算迭代10000次。為了去除相鄰迭代間可能存在的相關(guān)關(guān)系,每隔5次保留1次抽樣結(jié)果,共獲得2000次抽樣的模擬數(shù)據(jù)。然后再去除其中前1000次數(shù)據(jù),以消除先驗(yàn)假設(shè)的影響。對(duì)模擬數(shù)據(jù)的運(yùn)算結(jié)果表明(表1),絕大多數(shù)參數(shù)的估計(jì)比較準(zhǔn)確。
表1 參數(shù)估計(jì)
本研究的實(shí)證數(shù)據(jù)來(lái)源于某品牌汽車(chē)經(jīng)銷(xiāo)商對(duì)其客戶隨機(jī)抽樣所做的一次滿意度調(diào)查,樣本規(guī)模為1433人。本研究涉及的變量包括四類(lèi):(1)客戶對(duì)經(jīng)銷(xiāo)商服務(wù)的總體滿意度;(2)客戶推薦意愿和重購(gòu)意愿;(3)人口統(tǒng)計(jì)變量;(4)產(chǎn)品和消費(fèi)經(jīng)歷變量。其中,總體滿意度由10分量表測(cè)量,代表5個(gè)滿意度水平。推薦意愿和重購(gòu)意愿都是0-1變量。樣本的滿意度接近正態(tài)分布,其均值為7.6,標(biāo)準(zhǔn)差為1.4。與該公司進(jìn)行的其它滿意度調(diào)查數(shù)據(jù)相比較,該分布正常。對(duì)樣本特征進(jìn)行的描述性統(tǒng)計(jì)分析顯示,樣本構(gòu)成基本符合該汽車(chē)品牌總體客戶的特征,顯示樣本具有代表性。
模型的初始值設(shè)定采用發(fā)散的、無(wú)信息的方式。用MCMC模擬抽樣方法,每個(gè)模型都迭代20000次,采用間隔5次取樣的方法,共獲得4000次的抽樣數(shù)據(jù)。最后進(jìn)入計(jì)算的是后2500次較穩(wěn)定的模擬數(shù)據(jù)。
為了檢驗(yàn)本研究所提出的雙變量分層Bayes Probit模型在實(shí)證數(shù)據(jù)分析中的有效性,本文分別進(jìn)行了內(nèi)部效度和外部效度檢驗(yàn)。在內(nèi)部效度上,本研究比較了兩個(gè)Bayes模型的LML(Log Marginal Likelihood)指標(biāo):雙變量分層Bayes Probit模型(BHP模型)和單變量分層Bayes Probit模型(HP模型)。LML值越大,說(shuō)明模型對(duì)數(shù)據(jù)的擬合情況越好[13]。表2顯示,本研究模型(BHP模型)的LML值(-266.731)比HP模型的LML的(-324.215)要大,說(shuō)明本研究模型對(duì)數(shù)據(jù)的擬合情況比單變量分層模型更好。
表2 模型擬合度比較(LML)
在外部效度上,本研究比較了三個(gè)模型的樣本外預(yù)測(cè)的準(zhǔn)確率。首先將全部數(shù)據(jù)隨機(jī)分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)。針對(duì)訓(xùn)練數(shù)據(jù),三個(gè)模型分別估計(jì)出參數(shù),將估計(jì)出的參數(shù)應(yīng)用于驗(yàn)證數(shù)據(jù),分別預(yù)測(cè)推薦和重購(gòu),與真實(shí)情況比較計(jì)算出預(yù)測(cè)準(zhǔn)確率。表3結(jié)果顯示,本研究模型在推薦意愿和重購(gòu)意愿上都是預(yù)測(cè)最準(zhǔn)確的。
表3 模型預(yù)測(cè)精確度比較
圖1是推薦閾和重購(gòu)閾的直方圖。左側(cè)的圖是用雙變量模型估計(jì)出的結(jié)果,右側(cè)的圖是用單變量模型估計(jì)的結(jié)果。因?yàn)殡p變量模型的數(shù)據(jù)擬合度指標(biāo)LML優(yōu)于單變量模型,因而可以認(rèn)為左圖更接近于數(shù)據(jù)的真實(shí)情況。用單變量模型會(huì)低估推薦閾小于1的客戶數(shù)量。這樣會(huì)高估滿意度分?jǐn)?shù)的作用,但是,雙變量模型的結(jié)果顯示,15.6%的人的推薦意愿不會(huì)隨著滿意度分?jǐn)?shù)的提高而變動(dòng)。這一比例要高于單變量模型的估計(jì)結(jié)果。而從圖1可以看出,單變量模型低估了重購(gòu)閾高于10的那部分人的比例。這也在一定程度上高估了滿意度分?jǐn)?shù)的作用。
圖1 推薦閾和重購(gòu)閾的后驗(yàn)概率分布直方圖
本研究提出了一種雙變量分層方法聯(lián)合估算個(gè)體層次的推薦閾和重購(gòu)閾,并采用Bayes MCMC方法對(duì)模型進(jìn)行了估計(jì)。該方法可以比其他方法更有效地估計(jì)客戶個(gè)體層次的推薦閾和重購(gòu)閾。本研究提出的雙變量分層Bayes Probit模型也為其它關(guān)于二元雙變量的聯(lián)合分析提供了實(shí)用工具。例如,客戶忠誠(chéng)意愿和忠誠(chéng)行為的聯(lián)合分析。本研究的主要局限在于,由于數(shù)據(jù)限制只考察了客戶的忠誠(chéng)意愿而沒(méi)有考察忠誠(chéng)行為。鑒于企業(yè)更加關(guān)心的是客戶的忠誠(chéng)行為,未來(lái)研究應(yīng)當(dāng)聯(lián)合考慮客戶的忠誠(chéng)意愿和行為。對(duì)此,本研究提出的方法可以很容易地應(yīng)用于客戶行為數(shù)據(jù)。
[1] Mittal V,Kamakura W A.Satisfaction,Repurchase Intent,and Repur?chase Behavior:Investigating the Moderating Effect of Customer Char?acteristics[J].Journal of Marketing Research,2001,(38).
[2] Jones T O,Sasser W E.Why Satisfied Customers Defected[J].Har?vard Business Review,1995,(6).
[3] Reichheld F F.Learning from Customer Defections[J].Harvard Busi?ness Review,1996,(2).
[4] Yi Y,La S.What Influences the Relationship between Customer Satis?faction and Repurchase Intention?Investigating the Effects of Adjust?ed Expectations and Customer Loyalty[J].Psychology&Marketing,2004,21(5).
[5] 金英,蘇萌.基于分層Bayes方法的滿意度閾值估計(jì)[J].營(yíng)銷(xiāo)科學(xué)學(xué)報(bào),2008,4(3).
[6]Andreassen T W.From Disgust to Delight:Do Customers Hold a Grudge?[J].Journal of Service Research,2001,4(1).
[7] Brady M K,Cronin J J,Brand R R.Performance-only Measurement of Service Quality:A Replication and Extension[J].Journal of Busi?ness Research,2002,(55).
[8] Olsen L L,Johnson M D.Service Equity,Satisfaction,and Loyalty:from Transaction-Specific to Cumulative Evaluations[J].Journal of Service Research,2003,5(3).
[9] Chib S,Greenberg E.Analysis of Multivariate Probit Models[J].Bio?metika,1998,85(2).
[10] Rossi P E,McCulloch R,Allenby G.The Value of Purchase History Data in Target Marketing[J].Marketing Science,1996,(15).
[11] Geweke J.Efficient Simulation from the Multivariate Normal and Stu?dent-t Distributions Subject to Linear Constraints[C].Computing Science and Statistics:Proceedings of the 23rdSymposium on the In?terface,Alexandria,VA:American Statistical Association,1991.
[12] Hajivassiliou V,McFadden D,Ruud P.Simulation of Multivariate Normal Rectangle Probabilities and their Derivatives[J].Journal of Econometrics,1996,(72).
[13] Rossi P E,Allenby G,McCulloch R.Bayesian Statistics and Market?ing[M].New York:John Wiley and Sons,2005.
[14] Chib S,Greenberg E.Understanding the Metropolis-Hastings Algo?rithm[J].The American Statistician,1995,49(4).
[15] Zellner A.An Efficient Method of Estimating Seemingly Unrelated Regressions and Tests for Aggregation Bias[J].Journal of the Ameri?can Statistical Association,1962,(57).
[16] R Development Core Team.R:A Language and Environment for Sta?tistical Computing[M].Austria:R Foundation for Statistical Comput?ing,2008.
[17] Rossi P E,McCulloch R.Bayesm:Bayesian Inference for Marketing/Micro-econometrics[Z].R Package Version 2.2-1,2008.
[18] Venables W N,Ripley B D.Modern Applied Statistics with S(4thEdition)[M].New York:Springer,2002.
[19] Genz A,Bretz F,Hothorn T.Mvtnorm:Multivariate Normal and Dis?tribution[Z].R Package Version 0.9-0,2008.
[20] Jackson C.Msm:Multi-state Markov and Hidden Markov Models in Continuous Time[Z].R Package Version 0.8,2008.