王美
【摘要】本文基于生存分析方法,結(jié)合美國Cell2Cell電信公司的客戶數(shù)據(jù)進(jìn)行客戶流失分析,探索該公司續(xù)約相關(guān)服務(wù)與客戶流失之間的關(guān)系。首先使用Kaplan-Meier法生成客戶訂購服務(wù)的生存曲線,分析結(jié)果顯示客戶是否曾致電續(xù)約服務(wù)團(tuán)隊(duì)與客戶留存率存在顯著相關(guān)性,無致電記錄的客戶留存概率下降相對較緩。進(jìn)一步采用Cox比例風(fēng)險(xiǎn)回歸模型進(jìn)行多因素分析,結(jié)果表明致電服務(wù)續(xù)約團(tuán)隊(duì)次數(shù)越多的客戶流失風(fēng)險(xiǎn)越大,而接受續(xù)約建議次數(shù)越多的客戶流失風(fēng)險(xiǎn)越小。最終本文根據(jù)分析結(jié)果提供了防止客戶流失的具體建議。
【關(guān)鍵詞】生存分析;客戶流失
作為企業(yè)防止客戶流失的重要手段,客戶流失分析能夠洞悉客戶流失潛在原因,從而為客戶關(guān)系的維系提供參考。隨著客戶獲取成本的提高,如何有效地進(jìn)行客戶流失分析已成為企業(yè)關(guān)注的焦點(diǎn)。近年來,有關(guān)客戶流失的研究主要集中在流失客戶的識別預(yù)測方面,關(guān)注的重點(diǎn)在于如何通過優(yōu)化決策樹、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型實(shí)現(xiàn)對客戶最終是否流失的精準(zhǔn)預(yù)測。然而在大多數(shù)實(shí)際應(yīng)用中,客戶流失往往是一個(gè)動(dòng)態(tài)過程,側(cè)重于識別流失客戶的預(yù)測模型不能很好地利用刪失數(shù)據(jù),很難捕捉到客戶流失的概率隨時(shí)間發(fā)生的變化。因此,本文將生存分析方法引入到客戶流失的場景中。生存分析是統(tǒng)計(jì)學(xué)的一個(gè)重要分支,起源于18世紀(jì),是醫(yī)學(xué)和生物學(xué)領(lǐng)域分析觀察對象死亡發(fā)生時(shí)間及死亡相關(guān)因素的一種重要方法,其優(yōu)勢在于可以充分利用多種生存場景下的刪失數(shù)據(jù)。目前,生存分析已被應(yīng)用于金融、工程、社會(huì)科學(xué)等諸多領(lǐng)域。
本文根據(jù)生存分析方法的基本概念,構(gòu)建客戶流失場景下的生存時(shí)間模型、生存函數(shù)估計(jì)模型與風(fēng)險(xiǎn)函數(shù)回歸模型,并結(jié)合美國Cell2Cell電信公司的客戶數(shù)據(jù)進(jìn)行具體分析,探索該公司續(xù)約相關(guān)服務(wù)與客戶流失的關(guān)系。
1 客戶流失場景下的生存分析模型構(gòu)建
1.1生存時(shí)間模型構(gòu)建
2 基于生存分析方法的客戶流失分析
2.1數(shù)據(jù)獲取與簡介
本文所采用的美國Cell2Cell電信公司客戶數(shù)據(jù)集來自杜克大學(xué)特瑞數(shù)據(jù)客戶關(guān)系管理中心,含記錄共71047條,其中刪失數(shù)據(jù)有14711條,占比約20.9%,說明截止到觀測終止,尚未停止訂購服務(wù)的客戶數(shù)量約占總客戶數(shù)量的20.9%;含變量共58個(gè),包括個(gè)人信息、信用評分、服務(wù)類型、付款方式等客戶信息。其中,表示預(yù)設(shè)事件與生存時(shí)間的兩個(gè)重要變量分別是“是否流失”與“訂購服務(wù)持續(xù)月份數(shù)”,前者表示客戶在觀測期結(jié)束前是否停止訂購服務(wù)(1=流失客戶;0=非流失客戶),后者表示從觀測期開始到客戶停止訂購服務(wù)或觀測期終止所經(jīng)歷的時(shí)間段,即客戶訂購服務(wù)的持續(xù)月份數(shù)(以月為單位)。在此基礎(chǔ)上,為探索該公司續(xù)約相關(guān)服務(wù)與客戶流失概率的關(guān)系,選取與此相關(guān)的三個(gè)變量“是否有致電記錄”、“致電累計(jì)次數(shù)”與“接受續(xù)約建議累計(jì)次數(shù)”用于后續(xù)分析,分別表示客戶是否曾致電公司的續(xù)約服務(wù)團(tuán)隊(duì)(1=有致電記錄;0=無致電記錄)、客戶向服務(wù)續(xù)約團(tuán)隊(duì)致電咨詢的累計(jì)次數(shù)以及客戶接受續(xù)約建議的累計(jì)次數(shù)。
2.2基于Kaplan-Meier法的客戶流失分析
根據(jù)“是否流失”與“訂購服務(wù)持續(xù)月份數(shù)”兩個(gè)變量,可以通過Kaplan-Meier法估計(jì)得到生存函數(shù)并生成全部客戶訂購服務(wù)的生存曲線,如圖1所示。圖中橫軸表示截止到觀測結(jié)束客戶持續(xù)訂購服務(wù)的月份數(shù),縱軸代表t個(gè)月后客戶仍未停止訂購服務(wù)的概率,即客戶留存概率。陰影部分表示生存函數(shù)的上下置信區(qū)間。從圖中可以看出,隨著客戶訂購服務(wù)持續(xù)時(shí)間的增加,客戶留存概率從100%開始逐漸下降。當(dāng)訂購持續(xù)時(shí)間達(dá)到20個(gè)月時(shí),客戶留存概率下降到80%左右。
接下來考慮變量“是否有致電記錄”對客戶留存概率的影響,該變量根據(jù)客戶是否曾致電續(xù)約服務(wù)團(tuán)隊(duì)將全部客戶細(xì)分為兩組。圖2展示了兩組客戶訂購服務(wù)的生存曲線。通過觀察可以初步判斷兩組樣本的客戶留存概率存在一定差異,相比有致電記錄的客戶,無致電記錄的客戶留存概率下降較緩,流失速度較慢。采用Log-Rank法對兩組生存曲線整體比較,檢驗(yàn)結(jié)果顯示P=0.0001,充分驗(yàn)證了在0.05的檢驗(yàn)水平下兩組客戶的留存概率存在顯著差異。
2.3基于Cox比例風(fēng)險(xiǎn)回歸模型的客戶流失分析
由于Kaplan-Meier單變量模型每次只能納入一個(gè)分類變量且無法將連續(xù)變量納入分析,接下來采用Cox比例風(fēng)險(xiǎn)回歸模型分析多個(gè)連續(xù)變量對客戶流失的共同影響。為進(jìn)一步分析客戶致電咨詢續(xù)約與客戶停止訂購服務(wù)之間的聯(lián)系,選取與此相關(guān)的兩個(gè)連續(xù)變量“致電累計(jì)次數(shù)”、“接受續(xù)約建議累計(jì)次數(shù)”作為協(xié)變量,前者表示客戶向服務(wù)續(xù)約團(tuán)隊(duì)致電咨詢的累計(jì)次數(shù),后者表示客戶接受續(xù)約建議的累計(jì)次數(shù)。由于上述變量與Cox模型廣義線性形式中的對數(shù)風(fēng)險(xiǎn)比存在非線性關(guān)系,為使納入模型的變量符合比例風(fēng)險(xiǎn)假設(shè),根據(jù)Python支持生存分析的Liflines包提供的調(diào)整建議分別取變量“致電累計(jì)次數(shù)”、“接受續(xù)約建議累計(jì)次數(shù)”的平方作為協(xié)變量。Cox比例風(fēng)險(xiǎn)回歸模型的分析結(jié)果如表1所示。
結(jié)果中的風(fēng)險(xiǎn)比例exp(coef)以1為基準(zhǔn),反映了協(xié)變量對客戶流失風(fēng)險(xiǎn)產(chǎn)生的效應(yīng)大小。表中結(jié)果可以解釋為在其他協(xié)變量不變的情況下,客戶之間進(jìn)行橫向?qū)Ρ?,客戶向服?wù)續(xù)約團(tuán)隊(duì)致電累計(jì)次數(shù)的平方每多一個(gè)單位,其在該月份停止訂購服務(wù)的風(fēng)險(xiǎn)將橫向高出12%;客戶接受續(xù)約建議累計(jì)次數(shù)的平方每多一個(gè)單位,其在該月份停止訂購服務(wù)的風(fēng)險(xiǎn)將橫向減少12%。根據(jù)結(jié)果中P值的大小可以判定,在0.05的檢驗(yàn)水平下以上兩個(gè)協(xié)變量對客戶流失風(fēng)險(xiǎn)存在顯著影響。
3 結(jié)論與啟示
本文采用生存分析的一系列方法,對美國Cell2Cell電信公司的客戶數(shù)據(jù)進(jìn)行了客戶流失分析。由Kaplan-Meier法估計(jì)得出的全部客戶訂購服務(wù)的生存曲線圖可以看出,當(dāng)訂購持續(xù)時(shí)間小于10個(gè)月時(shí),該公司客戶留存率下降較為平緩,之后隨著訂購持續(xù)時(shí)間的增加,客戶留存率呈明顯的持續(xù)下降趨勢。造成此種現(xiàn)象的原因可能是客戶在初次訂購服務(wù)的前10個(gè)月內(nèi)享受較高程度的優(yōu)惠,客戶留存概率較高;但隨著訂購持續(xù)時(shí)間的增加,續(xù)約條款優(yōu)惠程度下降,用戶陸陸續(xù)續(xù)選擇致電續(xù)約服務(wù)團(tuán)隊(duì)停止續(xù)約。另外,單因素分析的結(jié)果表明有致電記錄的客戶具有更低的留存概率,進(jìn)一步驗(yàn)證了以上原因。根據(jù)Cox比例風(fēng)險(xiǎn)回歸模型的分析結(jié)果,雖然致電續(xù)約服務(wù)團(tuán)隊(duì)次數(shù)越多的客戶具有更高的流失風(fēng)險(xiǎn),但公司提供的服務(wù)續(xù)約建議能夠在一定程度上阻止客戶停止訂購服務(wù)。因此,該公司應(yīng)加強(qiáng)對電話咨詢團(tuán)隊(duì)的培訓(xùn)與建設(shè),提升服務(wù)質(zhì)量,致力于提供更加多樣化、個(gè)性化的服務(wù)續(xù)約方案,提供對客戶更具吸引力的續(xù)約建議,從而進(jìn)一步降低客戶的流失風(fēng)險(xiǎn)。
參考文獻(xiàn):
[1]Luo Bin,Shao Peiji,Liu Juan.Customer Churn Prediction Based on the Decision Tree in Personal Handyphone System Service[P].Service Systems and Service Management,2007 International Conference on,2007.
[2]鄺濤,張倩.改進(jìn)支持向量機(jī)在電信客戶流失預(yù)測的應(yīng)用[J].計(jì)算機(jī)仿真,2011,28(7):329-332.
[3]周捷,嚴(yán)建峰,楊璐,夏鵬,王猛.LSTM模型集成方法在客戶流失預(yù)測中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(11):39-46.
[4]李杏.生存分析的基本方法及其運(yùn)用[J].華南預(yù)防醫(yī)學(xué),2016,42(5):498-500.
[5]Lore Dirick,Gerda Claeskens,Bart Baesens.Time to default in credit scoring using survival analysis:a benchmark study[J].Journal of the Operational Research Society,2017,68(6).
[6]姜勇,韋朝奧,陳紹輝,陳亮,張愛輝,陳余.基于生存分析的設(shè)備剩余壽命預(yù)測技術(shù)研究[J].機(jī)電工程技術(shù),2018,47(4):160-164.
[7]Gao Min,Sa Zhihong,Li Yanyu,Zhang Weijun,Tian Donghua,Zhang Shengfa,Gu Linni.Does social participation reduce the risk of functional disability among older adults in China? A survival analysis using the 2005-2011 waves of the CLHLS data.[J].BMC geriatrics,2018,18(1).