張珠香,駱念蓓
(福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福州 350108)
客戶流失管理研究現(xiàn)狀及展望①
張珠香,駱念蓓
(福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福州 350108)
梳理了客戶流失和客戶流失管理的定義,客戶流失問(wèn)題的研究?jī)?nèi)容、應(yīng)用場(chǎng)景,客戶流失預(yù)測(cè)算法及特征選擇方法,模型評(píng)估的常用技術(shù)與度量等方面的研究現(xiàn)狀,指出當(dāng)前研究的不足,并提出未來(lái)的研究方向.
客戶流失管理; 研究現(xiàn)狀; 展望
隨著信息技術(shù)的高速發(fā)展,客戶對(duì)產(chǎn)品或服務(wù)的信息獲取越來(lái)越充分,顧客的需求也因此更加多樣化.尤其電子商務(wù)的興起,客戶對(duì)產(chǎn)品有了更多的選擇,激烈的市場(chǎng)競(jìng)爭(zhēng),使得客戶流失已經(jīng)成為許多企業(yè)不可避免的問(wèn)題[1]. 而開發(fā)一個(gè)新客戶的成本往往比保留一個(gè)老客戶的成本高得多[2],例如銀行客戶流失率每降低5%,利潤(rùn)就會(huì)增長(zhǎng)85.5%[3],這一數(shù)據(jù)根據(jù)行業(yè)的不同而有所不同. 為了應(yīng)對(duì)客戶流失,很多企業(yè)從過(guò)去的以產(chǎn)品為導(dǎo)向向以客戶保留、減少流失做戰(zhàn)略轉(zhuǎn)型[4].
雖然投放大量廣告或不斷優(yōu)化產(chǎn)品是簡(jiǎn)單易行的保留措施,但是,這種毫無(wú)針對(duì)性的客戶保留會(huì)使企業(yè)面臨浪費(fèi)資源的風(fēng)險(xiǎn)[5],有針對(duì)性地對(duì)潛在流失客戶進(jìn)行挽留已經(jīng)成為企業(yè)客戶關(guān)系管理的重要內(nèi)容. 大數(shù)據(jù)時(shí)代的到來(lái)使得客戶交易數(shù)據(jù)更易被記錄搜集,利用數(shù)據(jù)建立預(yù)警模型來(lái)識(shí)別潛在的流失客戶,為企業(yè)更有效率地理解客戶消費(fèi)行為與應(yīng)對(duì)市場(chǎng)需求變化提供了新的路徑.
本文從多個(gè)方面梳理了客戶流失管理的現(xiàn)狀研究,并指出當(dāng)前研究的不足,提出了未來(lái)可研究的方向,為深入研究客戶流失理論、方法和應(yīng)用提供參考.
客戶流失是指客戶放棄使用某種產(chǎn)品或服務(wù),轉(zhuǎn)而使用市場(chǎng)上另一競(jìng)爭(zhēng)企業(yè)的產(chǎn)品或服務(wù)[6,7]. Hadden等[1]將流失的客戶分為兩種,一種是自愿流失,一種是非自愿流失. 非自愿流失是由于濫用服務(wù)或者未對(duì)服務(wù)付費(fèi)等原因被企業(yè)撤銷的用戶,非自愿流失的客戶容易識(shí)別. 而自愿流失是指客戶主動(dòng)決定和這個(gè)企業(yè)結(jié)束關(guān)系,轉(zhuǎn)向和另一個(gè)企業(yè)合作的流失行為,自愿流失的客戶是企業(yè)流失管理的重點(diǎn)對(duì)象. 對(duì)于不同行業(yè),流失客戶的定義是不同的. Larivière 等[8]將客戶關(guān)閉其金融賬戶時(shí)視為流失. Coussement等[9]和 Huang等[10]是把電信客戶銷號(hào)作為離網(wǎng)流失客戶. 張瑋等[11]將電信客戶報(bào)停、預(yù)銷、強(qiáng)關(guān)、銷號(hào)等八種狀態(tài)確定為離網(wǎng)狀態(tài). Hadiji等[12]將7天內(nèi)沒(méi)有玩該款網(wǎng)絡(luò)游戲的玩家視為流失客戶. Jahromi等[5]把某電子商務(wù)網(wǎng)站半年內(nèi)沒(méi)有任何行為的客戶視為流失客戶. 與基于消費(fèi)頻率的定義方法不同,Miguéis等[13]對(duì)于零售公司的流失客戶是根據(jù)消費(fèi)金額定義的,如果客戶在第t個(gè)時(shí)段內(nèi)的購(gòu)買金額小于第t-1個(gè)時(shí)段消費(fèi)總額的40%,視為流失客戶.
客戶流失管理是指通過(guò)客戶的歷史信息來(lái)對(duì)客戶將來(lái)的流失行為進(jìn)行預(yù)測(cè),通過(guò)計(jì)算客戶流失概率,將高流失概率的客戶作為客戶保留戰(zhàn)的對(duì)象[9]. Datta等[14]于2000年提出客戶流失管理的框架,主要包括研究數(shù)據(jù)的選取、數(shù)據(jù)和業(yè)務(wù)的理解、特征選擇、預(yù)測(cè)模型的建立和模型驗(yàn)證. Lima等[15]將客戶流失管理過(guò)程分解為 6 個(gè)步驟: 業(yè)務(wù)理解; 數(shù)據(jù)理解; 數(shù)據(jù)預(yù)處理; 建模;評(píng)估; 部署. 文獻(xiàn)[5,16,17]認(rèn)為高流失概率的客戶不一定是給企業(yè)帶來(lái)最大收益的客戶,僅依據(jù)流失概率選擇目標(biāo)保留客戶不一定會(huì)增加企業(yè)盈利,因此,流失概率預(yù)測(cè)只是客戶流失管理的一部分. 總體而言,學(xué)者們對(duì)于客戶流失管理的內(nèi)涵有較為一致的認(rèn)識(shí): 客戶流失管理是一個(gè)復(fù)雜的過(guò)程,而核心工作就是對(duì)潛在的流失客戶進(jìn)行識(shí)別并采取保留措施.
客戶流失問(wèn)題是一個(gè)混沌、時(shí)滯、非線性、非對(duì)稱的復(fù)雜系統(tǒng)[18],并具有以下特點(diǎn)[6,19]: (1)屬于典型的二分類問(wèn)題,即流失與非流失. (2)分類結(jié)果要有較高的準(zhǔn)確性. (3)客戶數(shù)據(jù)集極端不平衡,流失客戶和非流失客戶樣本數(shù)目往往不是一個(gè)數(shù)量級(jí). (4)客戶行為數(shù)據(jù)是海量的,而且維數(shù)比較高,數(shù)據(jù)類型涉及結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化,并含有噪聲.
在流失原因方面,目前的文獻(xiàn)多采用定性和實(shí)證的方法進(jìn)行研究. Jamil等[25]認(rèn)為預(yù)測(cè)模型的準(zhǔn)確度可能并不是企業(yè)最關(guān)注的,企業(yè)更想知道顧客是因?yàn)槭裁丛蛄魇? Keaveney[26]較早地對(duì)客戶流失問(wèn)題進(jìn)行研究,通過(guò)對(duì)服務(wù)行業(yè)500個(gè)客戶進(jìn)行調(diào)查,得出重要結(jié)論: 導(dǎo)致客戶流失的最主要原因是不好的服務(wù)質(zhì)量,價(jià)格反而不是最主要的因素. 此后,便出現(xiàn)了很多客戶流失原因的研究,考慮因素包括客戶的統(tǒng)計(jì)學(xué)特征、價(jià)格、市場(chǎng)競(jìng)爭(zhēng)程度、產(chǎn)品升級(jí)、客戶的社會(huì)地位以及客戶滿意度和服務(wù)質(zhì)量等[27]. 盛昭瀚等[28]認(rèn)為產(chǎn)生客戶流失危機(jī)的內(nèi)部因素包括企業(yè)創(chuàng)新能力下降、經(jīng)營(yíng)不善、觀念滯后、戰(zhàn)略決策失誤等,外部因素包括政治、經(jīng)濟(jì)政策、科技發(fā)展、市場(chǎng)需求和競(jìng)爭(zhēng)條件等外部經(jīng)營(yíng)條件的突變或惡化. 內(nèi)部因素可控性較強(qiáng),是企業(yè)自身矛盾的結(jié)果; 外部因素幾乎難以控制,是經(jīng)營(yíng)環(huán)境矛盾的結(jié)果,但客戶流失危機(jī)往往又是二者綜合的結(jié)果和體現(xiàn). Hadden等[1]分析了導(dǎo)致客戶流失的內(nèi)因和外因,例如,競(jìng)爭(zhēng)對(duì)手的產(chǎn)品升級(jí)了或是價(jià)格上更優(yōu)惠了; 自己的服務(wù)不到位導(dǎo)致顧客的體驗(yàn)差等等. 于小兵等[29]根據(jù)電子商務(wù)的交易過(guò)程,提出客戶流失指標(biāo)體系,包括技術(shù)、網(wǎng)頁(yè)、銷售產(chǎn)品、物流、服務(wù)5個(gè)一級(jí)指標(biāo)和10個(gè)二級(jí)指標(biāo),并用模糊直覺(jué)法評(píng)估各流失原因的重要性. 李婷婷[30]采用實(shí)證的方法分析技術(shù)、物流、產(chǎn)品、售后服務(wù)、網(wǎng)絡(luò)安全5個(gè)因素對(duì)客戶流失的影響程度.
在挽救策略方面,學(xué)者們多采用數(shù)學(xué)建模的方法進(jìn)行研究. 在流失預(yù)警系統(tǒng)報(bào)告高危流失群后,決策者并不會(huì)對(duì)所有的潛在流失客戶進(jìn)行挽留,也不會(huì)簡(jiǎn)單的依據(jù)流失概率高低選擇高概率的客戶進(jìn)行挽留,因?yàn)槠髽I(yè)的挽留利潤(rùn)不僅與流失概率有關(guān),也與客戶的價(jià)值、客戶被成功挽留的概率、挽救人數(shù)、企業(yè)的成本等息息相關(guān)[17]. Neslin等[16]基于流失概率、流失成本等參數(shù)構(gòu)建了挽救利潤(rùn)函數(shù). Glady等[31]基于客戶生命周期構(gòu)建了挽救利潤(rùn)函數(shù). 胡理增等[32]研究了用于挽救的總經(jīng)費(fèi)有限的條件下,如何確定各組客戶的挽救比例、費(fèi)用和次序,實(shí)現(xiàn)全體流失客戶價(jià)值總和的最大化. 之后,胡理增等[33]又研究了無(wú)資源約束下的最優(yōu)化挽救方案數(shù)學(xué)模型. 羅彬等[34,35]建立了客戶挽留周期計(jì)算模型、客戶挽留價(jià)值計(jì)算模型、客戶流失挽留評(píng)估模型以及客戶挽留順序選擇模型. 與上述文章思路不同的是,Chen 等[21]和 Tamaddoni等[36]在預(yù)測(cè)模型建立時(shí),就使用了挽留最大利潤(rùn)(MP)作為對(duì)模型的評(píng)估標(biāo)準(zhǔn).
總的來(lái)說(shuō),客戶流失問(wèn)題涵蓋了流失客戶的預(yù)測(cè)識(shí)別、流失原因分析以及挽救策略三方面內(nèi)容,但是,目前對(duì)于客戶流失問(wèn)題的研究重點(diǎn)主要放在提高預(yù)測(cè)模型準(zhǔn)確度上,對(duì)流失原因及挽救策略的研究較少.
Coussement等[9]采用歐洲電信運(yùn)營(yíng)商的30104個(gè)客戶數(shù)據(jù),其中,流失客戶占 4.52%,數(shù)據(jù)包含 956 個(gè)變量,涉及客戶通話行為、客戶和運(yùn)營(yíng)商的交互行為、套餐訂閱以及人口統(tǒng)計(jì)學(xué)特征,通過(guò)Logit模型進(jìn)行客戶流失預(yù)測(cè). Huang等[10]使用104199個(gè)客戶的電信數(shù)據(jù)集,其中流失客戶占比5.8%,數(shù)據(jù)包含121個(gè)變量,涉及客戶的人口統(tǒng)計(jì)學(xué)信息、賬號(hào)信息、通話信息,通過(guò)基于K-means的混合模型進(jìn)行預(yù)測(cè). 張瑋等[11]對(duì)某電信公司184761個(gè)客戶數(shù)據(jù),其中流失客戶占比7.3%,數(shù)據(jù)包含15個(gè)變量,通過(guò)CART與Boosting集成后的模型進(jìn)行客戶流失預(yù)測(cè). Masand等[37]以GTE公司20個(gè)最大的手機(jī)通信市場(chǎng)的客戶為研究對(duì)象,使用簡(jiǎn)單回歸、最近鄰分類、決策樹和神經(jīng)網(wǎng)絡(luò)進(jìn)行客戶流失預(yù)測(cè). 丁君美等[38]收集了某電信公司2013年9月至2014年2月的7913條客戶數(shù)據(jù),其中,流失客戶占比3.3%,通過(guò)改進(jìn)的隨機(jī)森林算法對(duì)客戶流失進(jìn)行預(yù)測(cè). 羅彬等[18]通過(guò)將BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、ELMAN神經(jīng)網(wǎng)絡(luò)和廣義回歸神經(jīng)網(wǎng)絡(luò)4個(gè)子分類器進(jìn)行線性集成,并采用人工蜂群算法優(yōu)化線性組合的權(quán)重,以此對(duì)某電信企業(yè)20000個(gè)客戶數(shù)據(jù)進(jìn)行分析.
Nie 等[3]抽取了某銀行信用卡 5456 條,其中,非流失客戶占8.1%,流失客戶占91.1%,包含135個(gè)變量,涉及信用卡持有人信息、信用卡信息、交易信息、異常使用信息等,使用 Logit和決策樹進(jìn)行預(yù)測(cè). Larivière等[8]使用生存分析研究比利時(shí)金融服務(wù)機(jī)構(gòu)的客戶流失問(wèn)題. 應(yīng)維云等[6]使用改進(jìn)的支持向量機(jī)對(duì)深圳市某銀行個(gè)人信貸部的客戶信貸數(shù)據(jù)進(jìn)行研究,客戶數(shù)據(jù)共計(jì)12萬(wàn)條,每條記錄有16個(gè)變量,且包括文本型變量.
Gordini等[39]研究了意大利某公司在2013年1月至2014年1月期間的80000個(gè)客戶數(shù)據(jù),其中,流失客戶占比10%,數(shù)據(jù)變量涉及注冊(cè)信息、交易信息、訪問(wèn)信息,使用改進(jìn)的支持向量機(jī)進(jìn)行預(yù)測(cè).Yu等[40]利用中國(guó)某電子商務(wù)網(wǎng)站50000個(gè)客戶的注冊(cè)信息、登陸信息、交易信息、網(wǎng)站日志信息建模,通過(guò)改進(jìn)的支持向量機(jī)進(jìn)行預(yù)測(cè). Jahromi等[5]使用Logit、決策樹、Boosting等多個(gè)模型研究了澳大利亞某B2B電子商務(wù)平臺(tái)的客戶流失問(wèn)題. 由于B2B數(shù)據(jù)的獲取渠道比B2C有限,因此在客戶流失方面的研究集中在B2C方面[5].
還有一些例如人才流失研究[41]、網(wǎng)絡(luò)游戲方面的客戶流失研究[12,42]、保險(xiǎn)業(yè)的客戶流失[43]等.
在該階段,政府根據(jù)當(dāng)前的經(jīng)濟(jì)發(fā)展需求以及科技進(jìn)步需求即社會(huì)福利最大化來(lái)決策新能源汽車的CAFC得分效率θ1。本文中的社會(huì)福利為生產(chǎn)者、消費(fèi)者剩余與科技進(jìn)步成果之和。有學(xué)者提出,生產(chǎn)者剩余應(yīng)包含積分出售所得收益[15],本文認(rèn)為,所出售的積分是被市場(chǎng)中那些節(jié)能減排技術(shù)不達(dá)標(biāo)的企業(yè)或者是新能源汽車生產(chǎn)比例不達(dá)標(biāo)的企業(yè)所購(gòu)買的。在積分交易的過(guò)程中,只是發(fā)生了資金轉(zhuǎn)移,整個(gè)汽車市場(chǎng)中的生產(chǎn)者、消費(fèi)者剩余之和并未發(fā)生改變,同時(shí)也未產(chǎn)生科技進(jìn)步成果,因此,積分出售所得收益不能算入社會(huì)福利函數(shù)之中。在本文中政府的目標(biāo)函數(shù),即社會(huì)福利函數(shù)為:
總體上看,目前客戶流失的研究多集中于電信、金融、電子商務(wù),尤其以前兩者居多,而最新的一些研究開始將客戶流失拓寬至網(wǎng)絡(luò)游戲等新領(lǐng)域. 此外,客戶流失問(wèn)題涉及的客戶數(shù)據(jù)規(guī)模大,維數(shù)高,預(yù)測(cè)復(fù)雜程度高,因此,通常需要使用多個(gè)模型進(jìn)行預(yù)測(cè).
由于客戶流失問(wèn)題的復(fù)雜性,傳統(tǒng)的經(jīng)驗(yàn)時(shí)間閾值法、RFM法等均難以奏效,Schmittlein等[44]于1987年提出了預(yù)測(cè)客戶交易行為的概率模型組Pareto/NBD模型,是首個(gè)考慮到客戶流失現(xiàn)象的客戶重復(fù)購(gòu)買預(yù)測(cè)模型[45]. 之后,Fader等[46]對(duì)其進(jìn)行改進(jìn),提出了BG/NBD模型. 客戶流失預(yù)測(cè)研究開始于20世紀(jì)90年代,我國(guó)學(xué)者在21世紀(jì)初開始研究客戶流失預(yù)測(cè)方法[47],目前用于客戶流失預(yù)測(cè)的算法主要包括以下幾種:
(1) 基于傳統(tǒng)統(tǒng)計(jì)學(xué)的方法. 傳統(tǒng)統(tǒng)計(jì)學(xué)分類器包括Logit模型、線性/二次判別器. 前者是通過(guò)假設(shè)服從Logistic分布,后者是通過(guò)假設(shè)服從高斯分布,二者均是通過(guò)極大似然估計(jì)求出參變量,估計(jì)條件概率. 樸素貝葉斯也是通過(guò)求條件概率進(jìn)行分類. 基于傳統(tǒng)統(tǒng)計(jì)學(xué)的方法都是較為基礎(chǔ)的算法.
(2) 基于遞歸分割方法. 遞歸分割的典型代表是決策樹,屬于機(jī)器學(xué)習(xí)領(lǐng)域的方法. 主要包括ID3、J48、C4.5、C5.0等算法.
(3) 基于統(tǒng)計(jì)學(xué)習(xí)理論. 典型代表是支持向量機(jī).SVM從數(shù)學(xué)的角度看與人工神經(jīng)網(wǎng)絡(luò)密切相關(guān),但其起源于統(tǒng)計(jì)學(xué)習(xí)理論.
(4) 基于人工智能的預(yù)測(cè). 典型代表是仿照人腦學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò),其中,多層感知器是最流行的人工神經(jīng)網(wǎng)絡(luò).
(5) 基于集成分類器的預(yù)測(cè). 集成分類器是利用各個(gè)子分類器之間的互補(bǔ)性,按照一定的規(guī)則將各子分類器的輸出結(jié)果進(jìn)行融合,以提高其性能[22]. Bagging,Boosting和隨機(jī)森林是典型的集成方法. 不同集成模型的共同點(diǎn)在于都是由一些基本的模型構(gòu)成,通過(guò)集成實(shí)現(xiàn)將弱分類器轉(zhuǎn)變?yōu)閺?qiáng)分類器,不同之處就在于使用的基本模型的不同以及集成規(guī)則的不同,因此有線性判別法的集成方法[48,49],決策樹的集成方法[50],支持向量機(jī)的集成方法[20],神經(jīng)網(wǎng)絡(luò)的集成方法[18],Hu等[51]將決策樹、貝葉斯網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)等多個(gè)分類器共同集成,Kim[52]將 Logit和 ANN 共同集成等. 另外還有使用旋轉(zhuǎn)集成的算法進(jìn)行客戶流失預(yù)測(cè),如旋轉(zhuǎn)森林和RotBoost[22].
(6)其他方法. 除了上述分類,還有很多其他方法,如Amin等[7]用模糊粗糙集做客戶流失預(yù)測(cè)的研究.Huang等[10]提出基于K-means的有監(jiān)督和無(wú)監(jiān)督混合模型. Lu[53]和 Larivière 等[8]使用生存分析估計(jì)客戶即將流失的時(shí)間. Adebiyi等[54]使用馬爾科夫鏈對(duì)尼日利亞的電信客戶流失進(jìn)行預(yù)測(cè). 袁旭梅等[55]根據(jù)RFM標(biāo)準(zhǔn)劃分顧客群體,利用馬爾可夫鏈構(gòu)建動(dòng)態(tài)CRM模型. 文獻(xiàn)[56-58]使用社會(huì)網(wǎng)絡(luò)分析方法,根據(jù)客戶與客戶之間的通話記錄構(gòu)建電信客戶關(guān)系網(wǎng)絡(luò),研究客戶流失. 文獻(xiàn)[59-61]使用控制圖法研究電信客戶流失. Chen[62]提出控制圖法與貝葉斯分層模型結(jié)合的混合模型,動(dòng)態(tài)監(jiān)測(cè)電子商務(wù)客戶流失.
哪一種預(yù)測(cè)模型精度更高?這個(gè)問(wèn)題目前還沒(méi)有定論. 客戶流失的模型精度通常是基于特定的樣本數(shù)據(jù)而言,同樣的模型在不同的研究中會(huì)有不一樣的表現(xiàn). 因此,學(xué)者們對(duì)于哪一種預(yù)測(cè)模型精度更高沒(méi)有一致的看法. Nie等[3]認(rèn)為L(zhǎng)ogit回歸優(yōu)于J48決策樹.Mozer等[63]認(rèn)為 Adaboost和 boostd neural network 比其他模型好. 盡管支持向量機(jī)是處理高度非線性分類問(wèn)題的高級(jí)方法[64],但是它是一種黑箱模型,只能給出分類結(jié)果,而無(wú)法給出模型所學(xué)習(xí)到的知識(shí)[25].Masand等[37]使用簡(jiǎn)單回歸、最近鄰分類、決策樹和神經(jīng)網(wǎng)絡(luò)進(jìn)行客戶流失預(yù)測(cè),結(jié)果顯示神經(jīng)網(wǎng)絡(luò)的效果最好. Kirui等[65]認(rèn)為樸素貝葉斯和貝葉斯網(wǎng)絡(luò)在召回率上比C4.5決策樹好. Rehman等[58]的結(jié)果顯示社會(huì)網(wǎng)絡(luò)分析比多種決策樹算法精度高了8%-10%.Amin等[7]認(rèn)為粗糙集處理未知分布的數(shù)據(jù)比機(jī)器學(xué)習(xí)更有效. Gordini等[39]認(rèn)為其改進(jìn)的支持向量機(jī)在處理有噪聲、不平衡、非線性的電子商務(wù)數(shù)據(jù)時(shí)比Logit、神經(jīng)網(wǎng)絡(luò)、經(jīng)典的支持向量機(jī)效果更好. Neslin等[16]認(rèn)為L(zhǎng)ogit和決策樹在流失預(yù)測(cè)的實(shí)際應(yīng)用中最為廣泛,在流失預(yù)測(cè)中應(yīng)作為基礎(chǔ)模型先行試驗(yàn). Chen[62]認(rèn)為現(xiàn)有的很多模型在建模時(shí)是基于某段時(shí)間內(nèi)的客戶信息,相對(duì)靜態(tài),因此需要定期建模,而他提出的控制圖法與貝葉斯分層混合模型可以實(shí)現(xiàn)客戶流失的動(dòng)態(tài)監(jiān)測(cè).
總之,用于客戶流失預(yù)測(cè)的算法很多,既包括統(tǒng)計(jì)學(xué)的方法,也包括機(jī)器學(xué)習(xí)的方法,還有一些其他方法.每一種方法都具有自己的特點(diǎn)從而適用于不同的條件,表1對(duì)最常用的幾種預(yù)測(cè)方法進(jìn)行了總結(jié).
由于客戶流失數(shù)據(jù)集里包含了很多無(wú)關(guān)的多余的變量,過(guò)多的變量會(huì)帶來(lái)多重共線性、過(guò)擬合、過(guò)參數(shù)化甚至欺騙性的結(jié)果等問(wèn)題[62],所以在建立預(yù)測(cè)模型之前,需要進(jìn)行變量選擇. De等[22]使用主成分分析、獨(dú)立成分分析、稀疏隨機(jī)投影三種特征提取方式研究模型. Nie等[3]先對(duì)變量做相關(guān)性分析,將相關(guān)性程度很強(qiáng)的變量做刪除,再用逐步回歸篩選變量.Masand等[37]先使用決策樹進(jìn)行屬性選擇,再使用遺傳算法降維. Amin等[24]使用mRMR進(jìn)行特征選擇.Fathian等[66]認(rèn)為使用主成分分析進(jìn)行預(yù)處理后的數(shù)據(jù)更適合建模. 文獻(xiàn)[67-69]通過(guò)粗糙集方法約簡(jiǎn)模型解釋變量. 張瑋等[11]利用直方圖檢驗(yàn)和卡方檢驗(yàn)相結(jié)合的方法對(duì)模型變量進(jìn)行篩選.
表1 客戶流失常用預(yù)測(cè)方法
評(píng)估分類器性能的常用技術(shù)有3種. 保持方法是最常用的方法,在這種方法中,給定的數(shù)據(jù)集隨機(jī)地劃分成兩個(gè)獨(dú)立的集合: 訓(xùn)練集和測(cè)試集. 使用訓(xùn)練集建立模型,使用測(cè)試集檢驗(yàn)?zāi)P? 例如 Vafeiadis等[20]使用2/3的數(shù)據(jù)作為訓(xùn)練集,1/3的數(shù)據(jù)作測(cè)試集.Coussement等[9]將原始數(shù)據(jù)分為學(xué)習(xí)集(50%)、選擇集(20%)、驗(yàn)證集(30%),其中,學(xué)習(xí)集用于建立模型,選擇集用于預(yù)處理和建模過(guò)程的參數(shù)選擇,驗(yàn)證集用于檢驗(yàn)?zāi)P托阅?
k折交叉驗(yàn)證法是將初始數(shù)據(jù)隨機(jī)地劃分成k個(gè)互不相交的子集或“折”,每個(gè)折的大小大致相等.k-1份作為訓(xùn)練集,1份作為驗(yàn)證集,依次輪換訓(xùn)練集和驗(yàn)證集迭代k次,總準(zhǔn)確率取每次迭代準(zhǔn)確率的平均值.例如Vafeiadis等[20]采用100折交叉驗(yàn)證; Moeyersoms等[23]采用10折交叉驗(yàn)證; Huang等[10]采用5折交叉驗(yàn)證; De 等[22]采用 2 折交叉驗(yàn)證.
與上面兩種方法不同,自助法是用小樣本估計(jì)總體值的一種非參數(shù)方法,它是從給定訓(xùn)練集中有放回的均勻抽樣. 最常用的一種是.632自助法: 假定給定的數(shù)據(jù)集有d個(gè)元組,那么從該數(shù)據(jù)集中有放回地抽樣d次,產(chǎn)生的自助樣本集作為訓(xùn)練集,沒(méi)有進(jìn)入訓(xùn)練集的元組作為測(cè)試集,計(jì)算該次迭代的準(zhǔn)確率,繼續(xù)這樣迭代k次,模型的總體準(zhǔn)確率用下式估計(jì):
其中,Acc(Mi)1是自助樣本i得到的模型用于測(cè)試集i的準(zhǔn)確率,Acc(Mi)2是自助樣本用于原數(shù)據(jù)元組集的準(zhǔn)確率. Holtrop等[70]和丁君美等[38]即是采用了Bootstrap抽樣.
最常用的評(píng)估度量包括精度(Precision)、召回率(Recall)或稱敏感度 (Sensitivity)、特效性(Specificity)、準(zhǔn)確率(Accuracy)、F值(F-measure);ROC曲線和AUC值; 提升度(Lift)和Gini系數(shù).
雖然Accuracy在模式分類中是最主要的衡量指標(biāo),但是在客戶流失方面,AUC和Lift是常用的指標(biāo)[22].Masand等[37]指出雖然Accuracy常用來(lái)評(píng)價(jià)模型的性能,但是并不適合市場(chǎng)環(huán)境,因此他對(duì)于模型的評(píng)估采用了Lift而不是Accuracy. Accuracy是需要指定固定閾值計(jì)算而得,而AUC是不受閾值變化影響的,相比Accuracy,AUC具有較強(qiáng)的魯棒性,因此能較為客觀衡量分類模型的性能[71,72]. Chen等[21]也認(rèn)為Accuracy不適合用來(lái)評(píng)估正負(fù)樣本不平衡的數(shù)據(jù). 盡管如此,Hand[73]提出了AUC存在最大的缺點(diǎn)是對(duì)于不同的分類器沒(méi)有采用統(tǒng)一的誤判成本分布,對(duì)于同一個(gè)問(wèn)題,正樣本誤判成本與負(fù)樣本誤判成本的倍數(shù)關(guān)系是固定的,而AUC卻在不同的分類器上采用了不同的倍數(shù)關(guān)系.
在大部分研究中,學(xué)者們通常使用上述多種指標(biāo)共同評(píng)估分類器對(duì)所用樣本的分類能力. Vafeiadis等[20]采用Precision、Recall、Accuracy、F-measure比較SVM、BPN、決策樹、樸素貝葉斯、Logit及SVM集成、BPN集成、決策樹集成的模型效果. Coussement等[9]使用AUC和Top-decile Lift評(píng)估Logit模型效果.De 等[22]使用 Accuracy,AUC 和 Top-decile Lift三個(gè)指標(biāo)衡量模型效果. Neslin 等[16]和 Holtrop 等[70]使用 Topdecile Lift和 Gini系數(shù)作為衡量指標(biāo). Lima 等[15]使用Accuracy、Sensitivity、Specificity、AUC作為評(píng)價(jià)標(biāo)準(zhǔn). Jahromi等[5]采用 ROC 和 Lift對(duì) Logit、決策樹、Boosting 進(jìn)行評(píng)價(jià). 夏國(guó)恩等[74]使用 Accuracy、Precision、Recall、Lift評(píng)估SVM、人工神經(jīng)網(wǎng)絡(luò)、C4.5決策樹、Logit回歸、貝葉斯分類器的分類效果.
除此之外,還有一些其他的評(píng)估標(biāo)準(zhǔn),如Hand[73]于2009年提出了H-measure的評(píng)估指標(biāo). 丁君美等[38]認(rèn)為在不平衡分類中,分類精度并不能作為衡量分類性能的評(píng)價(jià)指標(biāo),因此.提出了生命價(jià)值比(LVR)的評(píng)估指標(biāo). Chen 等[21]除了使用 Accuracy、Sensitivity、Specificity、AUC、Lift指標(biāo),同時(shí)考慮 H-measure、MP(最大利潤(rùn))對(duì)H-MK-SVM、MK-SVM、SVM模型進(jìn)行評(píng)價(jià). Tamaddoni等[36]認(rèn)為現(xiàn)有的評(píng)估標(biāo)準(zhǔn)都關(guān)注模型準(zhǔn)確率,卻忽視了企業(yè)利潤(rùn),因此,他除了使用Lift,也使用了 MP(最大利潤(rùn)). Lessmann 等[75]除了使用 Accuracy,AUC,Gini系數(shù),還將 H-measure,Brier Score,KS統(tǒng)計(jì)量作為評(píng)估指標(biāo).
(1) 流失客戶的定義研究. 流失客戶的定義常見(jiàn)有基于消費(fèi)頻率和基于消費(fèi)金額兩種方法. 對(duì)于不同行業(yè),流失客戶的定義不同,電信業(yè)的客戶屬于契約型客戶,其流失定義較為明確,終止契約即可視為流失,但是對(duì)于諸如電子商務(wù)、零售業(yè)等非契約型應(yīng)用場(chǎng)景,無(wú)法準(zhǔn)確判斷客戶是否真的流失,流失客戶的定義全憑研究者決定,導(dǎo)致研究結(jié)果帶有一定主觀性. 現(xiàn)有文獻(xiàn)中對(duì)如何合理定義流失客戶還未總結(jié)出系統(tǒng)的經(jīng)驗(yàn)指導(dǎo). 因此,探索如何對(duì)流失客戶進(jìn)行合理定義有其必要性.
(2) 客戶流失原因及挽救方案的研究. 目前對(duì)于客戶流失問(wèn)題的研究主要集中在提高預(yù)測(cè)模型準(zhǔn)確度上,對(duì)流失原因及挽救策略的研究較少. 但是,一個(gè)好的流失管理系統(tǒng)不應(yīng)只預(yù)測(cè)潛在流失客戶,也應(yīng)包括對(duì)流失原因的分析以及挽救措施的實(shí)施,因此,客戶流失原因及挽救是客戶流失管理的重要研究方向.
(3) 客戶流失問(wèn)題的方法研究. 從研究方法上看,目前用于流失客戶的預(yù)測(cè)模型很多,但是大多數(shù)預(yù)測(cè)模型都只是對(duì)單個(gè)客戶的流失行為進(jìn)行預(yù)測(cè),對(duì)特征客戶群的預(yù)測(cè)研究較少. 而流失原因分析多以定性和實(shí)證分析為主,缺乏量化研究. 挽救策略多采用數(shù)學(xué)建模的方法,但由于挽救行動(dòng)的利潤(rùn)計(jì)算涉及的變量較多,包括客戶生存時(shí)間、流失速率、流失概率、潛在流失數(shù)量、客戶的價(jià)值、客戶被成功挽救的概率、挽救人數(shù)、企業(yè)的成本等等,很容易遺漏變量導(dǎo)致研究結(jié)果失真.
(4) 客戶流失預(yù)測(cè)模型的評(píng)估度量研究. 對(duì)于客戶流失預(yù)測(cè)模型的評(píng)估度量有很多,Accuracy、AUC和Lift是常用的指標(biāo),但這些傳統(tǒng)的指標(biāo)均聚焦于準(zhǔn)確性上,忽視了企業(yè)利潤(rùn),而企業(yè)進(jìn)行客戶流失管理就是為了實(shí)現(xiàn)利潤(rùn)最大化,因此,探索一些新的評(píng)估度量,例如將企業(yè)利潤(rùn)因素考慮到度量中,使得模型效果的評(píng)判更加有意義.
(5) 客戶流失應(yīng)用場(chǎng)景研究. 從應(yīng)用場(chǎng)景上看,目前客戶流失問(wèn)題研究多集中于電信、金融、電子商務(wù),尤其以前兩者居多. 但事實(shí)上,“客戶”的概念是廣義的,客戶流失問(wèn)題廣泛存在于各行各業(yè),可以考慮將現(xiàn)有的客戶流失研究場(chǎng)景拓寬至其他行業(yè),例如網(wǎng)絡(luò)游戲玩家的流失、人才流失等等.
1Hadden J,Tiwari A,Roy R,et al. Computer assisted customer churn management: State-of-the-art and future trends. Computers & Operations Research,2007,34(10):2902–2917.
2Roberts JH. Developing new rules for new markets. Journal of the Academy of Marketing Science,2000,28(1): 31–44.[doi: 10.1177/0092070300281004]
3Nie GL,Rowe W,Zhang LL,et al. Credit card churn forecasting by logistic regression and decision tree. Expert Systems with Applications,2011,38(12): 15273–15285.[doi: 10.1016/j.eswa.2011.06.028]
4Blattberg RC,Kim BD,Neslin SA. Database Marketing:Analyzing and Managing Customers. New York: Springer,2008.
5Jahromi AT,Stakhovych S,Ewing M. Managing B2B customer churn,retention and profitability. Industrial Marketing Management,2014,43(7): 1258–1268. [doi: 10.1016/j.indmarman.2014.06.016]
6應(yīng)維云,覃正,趙宇,等. SVM 方法及其在客戶流失預(yù)測(cè)中的應(yīng)用研究. 系統(tǒng)工程理論與實(shí)踐,2007,27(7): 105–110.
7Amin A,Anwar S,Adnan A,et al. Customer churn prediction in the telecommunication sector using a rough set approach. Neurocomputing,2017,(237): 242–254.
8Larivière B,Van Den Poel D. Investigating the role of product features in preventing customer churn,by using survival analysis and choice modeling: The case of financial services. Expert Systems with Applications,2004,27(2):277–285. [doi: 10.1016/j.eswa.2004.02.002]
9Coussement K,Lessmann S,Verstraeten G. A comparative analysis of data preparation algorithms for customer churn prediction: A case study in the telecommunication industry.Decision Support Systems,2017,95: 27–36. [doi: 10.1016/j.dss.2016.11.007]
10Huang Y,Kechadi T. An effective hybrid learning system for telecommunication churn prediction. Expert Systems with Applications,2013,40(14): 5635–5647. [doi: 10.1016/j.eswa.2013.04.020]
11張瑋,楊善林,劉婷婷. 基于 CART 和自適應(yīng) Boosting 算法的移動(dòng)通信企業(yè)客戶流失預(yù)測(cè)模型. 中國(guó)管理科學(xué),2014,22(10): 90–96.
12Hadiji F,Sifa R,Drachen A,et al. Predicting player churn in the wild. IEEE Conference on Computational Intelligence and Games. Dortmund,Germany. 2014. 1–8.
13Miguéis VL,Van Den Poel D,Camanho AS,et al. Modeling partial customer churn: On the value of first product-category purchase sequences. Expert Systems with Applications,2012,39(12): 11250–11256. [doi: 10.1016/j.eswa.2012.03.073]
14Datta P,Masand B,Mani DR,et al. Automated cellular modeling and prediction on a large scale. Artificial Intelligence Review,2000,14(6): 485–502. [doi: 10.1023/A:1006643109702]
15Lima E,Mues C,Baesens B. Monitoring and backtesting churn models. Expert Systems with Applications,2011,38(1): 975–982. [doi: 10.1016/j.eswa.2010.07.091]
16Neslin SA,Gupta S,Kamakura W,et al. Defection detection:Measuring and understanding the predictive accuracy of customer churn models. Journal of Marketing Research,2006,43(2): 204–211. [doi: 10.1509/jmkr.43.2.204]
17Lemmens A,Gupta S. Managing churn to maximize profits.Boston,MA: Harvard Business School,2013.
18羅彬,邵培基,羅盡堯,等. 基于粗糙集理論—神經(jīng)網(wǎng)絡(luò)—蜂群算法集成的客戶流失研究. 管理學(xué)報(bào),2011,8(2):265–272.
19于小兵,曹杰,鞏在武. 客戶流失問(wèn)題研究綜述. 計(jì)算機(jī)集成制造系統(tǒng),2012,18(10): 2253–2263.
20Vafeiadis T,Diamantaras KI,Sarigiannidis G,et al. A comparison of machine learning techniques for customer churn prediction. Simulation Modelling Practice and Theory,2015,55: 1–9. [doi: 10.1016/j.simpat.2015.03.003]
21Chen ZY,Fan ZP,Sun MH. A hierarchical multiple kernel support vector machine for customer churn prediction using longitudinal behavioral data. European Journal of Operational Research,2012,223(2): 461–472. [doi: 10.1016/j.ejor.2012.06.040]
22De Bock KW,Van Den Poel D. An empirical evaluation of rotation-based ensemble classifiers for customer churn prediction. Expert Systems with Applications,2011,38(10):12293–12301. [doi: 10.1016/j.eswa.2011.04.007]
23Moeyersoms J,Martens D. Including high-cardinality attributes in predictive models: A case study in churn prediction in the energy sector. Decision Support Systems,2015,72: 72–81. [doi: 10.1016/j.dss.2015.02.007]
24Amin A,Anwar S,Adnan A,et al. Comparing oversampling techniques to handle the class imbalance problem: A customer churn prediction case study. IEEE Access,2016,(4): 7940–7957. [doi: 10.1109/ACCESS.2016.2619719]
25Jamil S,Khan A. Churn comprehension analysis for telecommunication industry using ALBA. 2016 International Conference on Emerging Technologies (ICET) Islamabad,Pakistan. 2016. 1–5.
26Keaveney SM. Customer switching behavior in service industries: An exploratory study. Journal of Marketing,1995,59(2): 71–82. [doi: 10.2307/1252074]
27Padmanabhan B,Hevner A,Cuenco M,et al. From information to operations: Service quality and customer retention.ACM Trans. on Management Information Systems,2011,2(4): 1–21.
28盛昭瀚,柳炳祥. 客戶流失危機(jī)分析的決策樹方法. 管理科學(xué)學(xué)報(bào),2005,8(2): 20–25.
29于小兵,曹杰,張夢(mèng)男. B2C電子商務(wù)客戶流失原因評(píng)估研究. 模糊系統(tǒng)與數(shù)學(xué),2012,26(6): 166–172.
30李婷婷. 影響B(tài)2C電子商務(wù)企業(yè)客戶流失因素的實(shí)證分析. 對(duì)外經(jīng)貿(mào),2014,(1): 136–137.
31Glady N,Baesens B,Croux C. Modeling churn using customer lifetime value. European Journal of Operational Research,2009,197(1): 402–411. [doi: 10.1016/j.ejor.2008.06.027]
32胡理增,于信陽(yáng),張長(zhǎng)賦,等. 基于經(jīng)費(fèi)約束和廣義客戶終身價(jià)值最大化的多客戶流失挽救模型. 系統(tǒng)工程理論與實(shí)踐,2009,29(2): 63–69.
33胡理增,陳建軍. 無(wú)約束條件下多客戶流失挽救最優(yōu)化決策. 中國(guó)管理科學(xué),2009,17(6): 39–43.
34羅彬,邵培基,羅盡堯,等. 基于競(jìng)爭(zhēng)對(duì)手反擊的電信客戶流失挽留研究. 管理科學(xué)學(xué)報(bào),2011,14(8): 17–33.
35羅彬,邵培基,羅盡堯,等. 基于預(yù)算限制和客戶挽留價(jià)值最大化的電信客戶流失挽留研究. 管理學(xué)報(bào),2012,9(2):280–288.
36Tamaddoni A,Stakhovych S,Ewing M. Comparing churn prediction techniques and assessing their performance: A contingent perspective. Journal of Service Research,2015,19(2): 123–141.
37Masand B,Datta P,Mani DR,et al. CHAMP: A prototype for automated cellular churn prediction. Data Mining and Knowledge Discovery,1999,3(2): 219–225. [doi: 10.1023/A:1009873905876]
38丁君美,劉貴全,李慧. 改進(jìn)隨機(jī)森林算法在電信業(yè)客戶流失預(yù)測(cè)中的應(yīng)用. 模式識(shí)別與人工智能,2015,28(11):1041–1049.
39Gordini N,Veglio V. Customers churn prediction and marketing retention Strategies. An application of support vector machines based on the AUC parameter-selection technique in B2B e-commerce industry. Industrial Marketing Management,2016,62: 100–107.
40Yu XB,Guo SS,Guo J,et al. An extended support vector machine forecasting framework for customer churn in ecommerce. Expert Systems with Applications,2011,38(3):1425–1430. [doi: 10.1016/j.eswa.2010.07.049]
41Saradhi VV,Palshikar GK. Employee churn prediction.Expert Systems with Applications,2011,38(3): 1999–2006.[doi: 10.1016/j.eswa.2010.07.134]
42Runge J,Gao P,Garcin F,et al. Churn prediction for highvalue players in casual social games. IEEE Conference on Computational Intelligence and Games (CIG). Dortmund,Germany. 2014. 1–8.
43Günther CC,Tvete IF,Aas K,et al. Modelling and predicting customer churn from an insurance company.Scandinavian Actuarial Journal,2014,2014(1): 58–71. [doi:10.1080/03461238.2011.636502]
44Schmittlein DC,Morrison DG,Colombo R. Counting your customers: Who are they and what will they do next?Management Science,1987,33(1): 1–24. [doi: 10.1287/mnsc.33.1.1]
45馬少輝,劉金蘭. Pareto/NBD 模型實(shí)證與應(yīng)用研究. 管理科學(xué),2006,19(5): 45–49.
46Fader PS,Hardie BGS,Lee KL.“Counting your customers”the easy way: An alternative to the Pareto/NBD model.Marketing Science,2005,24(2): 275–284. [doi: 10.1287/mksc.1040.0098]
47夏國(guó)恩. 客戶流失預(yù)測(cè)的現(xiàn)狀與發(fā)展研究. 計(jì)算機(jī)應(yīng)用研究,2010,27(2): 413–416.
48Xie YY,Li X. Churn prediction with linear discriminant boosting algorithm. 2008 International Conference on Machine Learning and Cybernetics. Kunming,China. 2008.228–233.
49應(yīng)維云,藺楠,謝雅雅,等. 用 LDA Boosting 算法進(jìn)行客戶流失預(yù)測(cè). 數(shù)理統(tǒng)計(jì)與管理,2010,29(3): 400–408.
50Abbasimehr H,Setak M,Tarokh MJ. A comparative assessment of the performanceof of ensemble learning in customer churn prediction. The International Arab Journal of Information Technology,2014,11(6): 599–606.
51Hu XH. A data mining approach for retailing bank customer attrition analysis. Applied Intelligence,2005,22(1): 47–60.[doi: 10.1023/B:APIN.0000047383.53680.b6]
52Kim YS. Toward a successful CRM: Variable selection,sampling,and ensemble. Decision Support Systems,2006,41(2): 542–553. [doi: 10.1016/j.dss.2004.09.008]
53Lu JX. Predicting customer churn in the telecommunications industry—An application of survival analysis modeling using SAS. SAS User Group International (SUGI27) Online Proceedings. http://www2.sas.com/proceedings/sugi27/p114-27.pdf. [2012/2017-02-28].
54Adebiyi SO,Oyatoye EO,Mojekwu JN. Predicting customer churn and retention rates in Nigeria’s mobile telecommunication industry using markov chain modelling. Acta Universitatis Sapientiae Economics and Business,2015,3(1):67–80.
55袁旭梅,康鍵,張昕. 動(dòng)態(tài)CRM模型在電子商務(wù)中的應(yīng)用.中國(guó)管理科學(xué),2003,11(S1): 343–347.
56Richter Y,Yom-Tov E,Slonim N. Predicting customer churn in mobile networks through analysis of social groups. Proc.of the 2010 SIAM International Conference on Data Mining.Columbus. 2010. 732–741.
57Verbeke W,Martens D,Baesens B. Social network analysis for customer churn prediction. Applied Soft Computing,2014,14: 431–446. [doi: 10.1016/j.asoc.2013.09.017]
58Rehman A,Ali AR. Customer churn prediction,segmentation and fraud detection in telecommunication industry.ASE Science Division Conferences. Cambridge,MA,USA.2014. 1–9.
59Pettersson M. SPC with applications to churn management.Quality and Reliability Engineering International,2004,20(5): 397–406. [doi: 10.1002/(ISSN)1099-1638]
60Jiang W,Au T,Tsui KL. A statistical process control approach to business activity monitoring. IIE Trans.,2007,39(3): 235–249. [doi: 10.1080/07408170600743912]
61Samimi Y,Aghaie A. Monitoring usage behavior in subscription-based services using control charts for multivariate attribute characteristics. IEEE International Conference on Industrial Engineering and Engineering Management. Singapore,Singapore. 2008. 1469–1474.
62Chen SH. The gamma CUSUM chart method for online customer churn prediction. Electronic Commerce Research and Applications,2016,17: 99–111. [doi: 10.1016/j.elerap.2016.04.003]
63Mozer MC,Wolniewicz R,Grimes DB,et al. Predicting subscriber dissatisfaction and improving retention in the wireless telecommunications industry. IEEE Trans. on Neural Networks,2000,11(3): 690–696. [doi: 10.1109/72.846740]
64Brandusoiu I,Toderean G. Churn prediction in the telecommunications sector using support vector machines. Acta Technica Napocensis,2016,57(1): 27–30.
65Kirui C,Hong L,Wilson C,et al. Predicting customer churn in mobile telephony industry using probabilistic classifiers in data mining. IJCSI International Journal of Computer Science Issues,2013,10(2): 165–172.
66Fathian M,Hoseinpoor Y,Minaei-Bidgoli B. Offering a hybrid approach of data mining to predict the customer churn based on bagging and boosting methods. Kybernetes,2016,45(5): 732–743. [doi: 10.1108/K-07-2015-0172]
67柳炳祥,盛昭翰. 一種基于Rough集的客戶流失風(fēng)險(xiǎn)分析方法. 中國(guó)管理科學(xué),2002,10(S1): 130–133.
68朱幫助. 基于SMC-RS-LSSVM的電子商務(wù)客戶流失預(yù)測(cè)模型. 系統(tǒng)工程理論與實(shí)踐,2010,30(11): 1960–1967. [doi:10.12011/1000-6788(2010)11-1960]
69琚春華,盧琦蓓,郭飛鵬. 融入個(gè)體活躍度的電子商務(wù)客戶流失預(yù)測(cè)模型. 系統(tǒng)工程理論與實(shí)踐,2013,33(1): 141–150. [doi: 10.12011/1000-6788(2013)1-141]
70Holtrop N,Wieringa JE,Gijsenberg MJ,et al. No future without the past? Predicting churn in the face of customer privacy. International Journal of Research in Marketing,2016,34(1): 154–172.
71Provost FJ,Fawcett T,Kohavi R. The case against accuracy estimation for comparing induction algorithms. Proc. of the 15th International Conference on Machine Learning. Morgan Kaufmann,San Francisco,USA. 1998. 98. 445–453.
72Langley P. Crafting papers on machine learning. Proc. of the 17th International Conference on Machine Learning. San Francisco,CA,USA. 2000. 343–354.
73Hand DJ. Measuring classifier performance: A coherent alternative to the area under the ROC curve. Machine Learning,2009,77(1): 103–123. [doi: 10.1007/s10994-009-5119-5]
74夏國(guó)恩,金煒東. 基于支持向量機(jī)的客戶流失預(yù)測(cè)模型. 系統(tǒng)工程理論與實(shí)踐,2008,28(1): 71–77.
75Lessmann S,Baesens B,Seow HV,et al. Benchmarking state-of-the-art classification algorithms for credit scoring:An update of research. European Journal of Operational Research,2015,247(1): 124–136. [doi: 10.1016/j.ejor.2015.05.030]
Current Situation and Prospect of Customer Churn Management
ZHANG Zhu-Xiang,LUO Nian-Bei
(School of Economics and Management,Fuzhou University,Fuzhou 350108,China)
This paper summarizes the literature about the following aspects: the definitions of customer churn and customer churn management; research contents and application scenarios of customer churn issues; customer churn prediction algorithms and feature extraction methods; the evaluation technologies and measurements. In the end,we point out the shortcomings of the current research and put forward some future research directions.
customer churn management; current situation; prospect
張珠香,駱念蓓.客戶流失管理研究現(xiàn)狀及展望.計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(12):9–17. http://www.c-s-a.org.cn/1003-3254/6086.html
2017-03-10; 修改時(shí)間: 2017-03-27; 采用時(shí)間: 2017-03-29