国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BP 神經(jīng)網(wǎng)絡(luò)的銀行客戶流失預(yù)測

2021-10-18 08:57:36時丹蕾杜寶軍
科學(xué)技術(shù)創(chuàng)新 2021年27期
關(guān)鍵詞:隱層人工神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)

時丹蕾 杜寶軍

(蘭州交通大學(xué),甘肅 蘭州 730070)

1 背景介紹

近年來,隨著支付寶、微信等第三方支付平臺的流行和經(jīng)濟體制改革的深化,銀行同業(yè)間的競爭出現(xiàn)了惡化的趨勢,客戶流失率的與日俱增也使得銀行機構(gòu)的經(jīng)營變得緊張。其次,在“互聯(lián)網(wǎng)+”盛行的21 世紀,互聯(lián)網(wǎng)金融服務(wù)與金融產(chǎn)品猶如雨后春筍般層出不窮,加速了客戶對銀行機構(gòu)的忠實度和依賴性的降低,如何處理客戶流失問題儼然成了擺在各大銀行面前的一大挑戰(zhàn)。

隨著市場競爭的加劇和銀行規(guī)模經(jīng)濟效應(yīng)的逐步下降,銀行同業(yè)間的產(chǎn)品或服務(wù)差異越來越小,而對于銀行來說,客戶顯然是最具有價值的資產(chǎn)和最大財富,越來越多的事實證明“以客戶為中心”的銀行往往能在市場中獲得更大收益[1]。

2 問題綜述

2.1 問題提出

伴隨越來越明顯的國際金融一體化的趨勢以及全世界網(wǎng)絡(luò)經(jīng)濟的不斷進步,我國銀行業(yè)面臨著越來越大的挑戰(zhàn),與此同時,銀行業(yè)的競爭也越來越激烈,如果商業(yè)銀行想要持續(xù)健康發(fā)展,爭取在這個大規(guī)模競爭趨勢下的更大利潤,就需要采用合理競爭的手段,留住理想客戶,從而來增加企業(yè)的收益,這無疑對于各個銀行來說都是至關(guān)重要的。同時,很多銀行都會把過多的精力放在挖掘新型客戶上,認為增加客戶的數(shù)量,增大銀行受眾的規(guī)模就可以提高銀行本身的利潤效益,但是往往這樣就會忽略了對于原有客戶資源類型的分析,進而無法總結(jié)出現(xiàn)在客戶的真實需求,從而造成大量客戶流失的現(xiàn)象,在新客戶轉(zhuǎn)化為老客戶后同樣的問題再次出現(xiàn)。由此可以看出,對于銀行客戶流失進行有效的分析,留住老客戶,并且不斷增加新客戶的數(shù)量,才能從根本上提高銀行的競爭力,使得銀行在現(xiàn)今激烈的競爭中爭取一席之地。本文通過建立客戶流失模型,預(yù)測客戶流失情況,從而幫準銀行調(diào)整服務(wù)和經(jīng)營策略,給銀行帶來更大的效益[2]。

2.2 研究現(xiàn)狀

對于銀行客戶流失案例的研究已經(jīng)有非常多的先例,這方面的研究也涉及到了各種各樣的研究方法,鄧穎凡在對于大數(shù)據(jù)驅(qū)動下的用戶行為分析中展開了客戶細分和流失預(yù)測兩個方面的研究, 同時還引入了縱貫其中的兩大保障體系:“數(shù)據(jù)挖掘技術(shù)”以及“科學(xué)評估指標”來進行分析,其采用理論結(jié)合實踐的方式同時解決了銀行客戶細分問題將自適應(yīng)權(quán)重的雙級聚類算法推進應(yīng)用、深化和驗證。[3]謝斌則主要進行了基于大數(shù)據(jù)挖掘的N 銀行客戶流失分析,分析N 銀行基于大數(shù)據(jù)的客戶現(xiàn)狀分析, 基于大數(shù)據(jù)分析對目前N 銀行的客戶整體現(xiàn)狀進行介紹并總結(jié)了貴賓客戶個性化產(chǎn)品設(shè)計和營銷、強化大數(shù)據(jù)開發(fā)與應(yīng)用、提升客戶體驗、優(yōu)化營銷體系的營銷啟示。[4]而林睿,遲學(xué)芝則利用BP 神經(jīng)網(wǎng)絡(luò)對于銀行客戶流失問題進行分析,利用BP 人工神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)穩(wěn)定、學(xué)習(xí)能力強的特點,通過輸入變量和輸出變量之間的相關(guān)性分析,建立銀行客戶流失分析模型,以此獲取即將流失的客戶,以便銀行做出經(jīng)營決策,挽留有關(guān)用戶,確保銀行效益不受影響。[5]大部分的研究都是基于數(shù)據(jù)挖掘的基本方法,其分類的方式主要是基于客戶的基本特征,本文的改進之處主要是對于神經(jīng)網(wǎng)絡(luò)模型進行進一步的運用。

3 模型研究方法介紹及模型建立

3.1 模型原理

3.1.1 多層感知機

多層感知機(MLP,Multilayer Perceptron)也被稱作人工神經(jīng)網(wǎng)絡(luò)(ANN,Artificial Neural Network),其除了輸入輸出層,它中間可以有多個隱層,最簡單的MLP 只含一個隱層,即三層的結(jié)構(gòu)。

多層感知機層與層之間是全連接的。多層感知機最底層是輸入層,中間是隱藏層,最后是輸出層。

3.1.2 隱藏單元及ReLU 函數(shù)

大部分的隱藏單元可以描述為接受輸入向量x,通過計算仿射變換z=wTx+b,然后使用一個逐元素的非線性函數(shù)g(z)。大多數(shù)隱藏單元的區(qū)別僅僅在于激活函數(shù)g(z)的形式。

整流線性單元(Rectified Linear Unit, ReLU)是隱藏單元極好的默認選擇。許多其它類型的隱藏單元也是可用的。整流線性單元使用激活函數(shù)g(z)=max{0,z}。在z=0 處不可微。這意味著相比于引入二階效應(yīng)的激活函數(shù)來說,它的梯度方向?qū)τ趯W(xué)習(xí)來說更加有用。

3.1.3 softmax 激活函數(shù)

Softmax 函數(shù)常在神經(jīng)網(wǎng)絡(luò)輸出層作為激活函數(shù),將輸出層的值通過激活函數(shù)映射到0-1 區(qū)間,從而將神經(jīng)元輸出構(gòu)造成概率分布,用于多分類問題中,Softmax 激活函數(shù)映射值越大,則真實類別可能性越大,下面先給出Softmax 函數(shù)計算公式:

本文模型建立采用深度前饋網(wǎng)絡(luò)模型,首先對于數(shù)據(jù)標簽進行處理,標簽取1 代表客戶流失,標簽取0 代表正??蛻?。輸入層到第一隱層的結(jié)構(gòu),第一隱層256 個神經(jīng)元,使用sigmod函數(shù),并且使用截斷正態(tài)分布,為了避免過擬合采用了漏失的操作,第一隱層到第二隱層的結(jié)構(gòu)同樣包含256 個神經(jīng)元,并且采用sigmod 函數(shù),第二隱層到輸出層的的結(jié)構(gòu)中,將輸出層設(shè)置成兩個神經(jīng)元并且使用softmax 函數(shù)作為輸出函數(shù)。

3.1.4 反向傳播算法

反向傳播算法在眾多算法中應(yīng)用較為廣泛,通常運用反向傳播算法來訓(xùn)練人工網(wǎng)絡(luò),在這方面該算法十分有效。該算法主要應(yīng)用的思想是:首先將訓(xùn)練集獲取的數(shù)據(jù)傳播到ANN 的輸入層,然后就是通過隱藏層的計算,最后到達輸出之后完成整個算法的傳播,輸出一個算法計算的結(jié)果,上述描述的就是ANN 前向傳播的過程,一般情況下,輸出結(jié)果和實際結(jié)果一般存在誤差,在算法完成后誤差往往會很難處理,因此我們要對誤差提前進行計算,而后該誤差從輸出層向隱藏層反向傳播,最終傳播到輸入層,這就是反向傳播的關(guān)鍵,同時誤差也是我們不斷調(diào)整參數(shù)的依據(jù),通過對于誤差大小的計算和判斷,我們不斷對參數(shù)調(diào)整,而后重復(fù)以上的步驟不斷進行迭代和擬合,一直到收斂為止。

3.2 客戶流失分析

TNS 之前對于中國銀行業(yè)進行調(diào)查,主要針對的是北京、上海已經(jīng)廣州三個發(fā)展較好的城市,調(diào)查的內(nèi)容主要是1500 名零售銀行客戶以及900 名信用卡用戶,根據(jù)調(diào)查結(jié)果可以看出,目前中國銀行業(yè)的客戶維系系數(shù)是低于全球平均水平的,由此可以看出,在老客戶保留以及客戶分析發(fā)展方面,我國在各方面還有待提高,并且根據(jù)調(diào)查可以發(fā)展,我國商業(yè)銀行的客戶流失率竟然高達30%,在現(xiàn)今社會高速發(fā)展之下,我們可以猜測銀行客戶流失的原因是多方面的,如何把握住老客戶,有效對于客戶的流失率進行降低已經(jīng)成為現(xiàn)今銀行業(yè)發(fā)展最為重要的問題,只有針對銀行客戶流失這一現(xiàn)象提出根本性的改革措施,才能保證我國銀行業(yè)在全球更加具有競爭力。為了達到這一目的,銀行需要建立客戶分析模型,這個模型的作用主要歸結(jié)于以下兩個方面:

(1)通過對客戶數(shù)據(jù)的分析,探究客戶信息中的關(guān)鍵因素和客戶流失之間的必然關(guān)系, 在這種關(guān)系的基礎(chǔ)上對于客戶流失的原因進行有效分析,同時提出改變這個狀況的根本性措施。

(2)對可能會流失的客戶進行預(yù)警,提前采取相關(guān)措施。

3.3 在客戶流失分析中應(yīng)用BP 人工神經(jīng)網(wǎng)絡(luò)

BP 人工神經(jīng)網(wǎng)絡(luò)是Rumelhart 和McCelland 為首的科學(xué)家小組在1986 提出的一種神經(jīng)網(wǎng)絡(luò)算法,這是一種按照逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),在眾多的神經(jīng)網(wǎng)絡(luò)算法中,該算法的應(yīng)用相對十分廣泛,這是由于該算法本身具有自適應(yīng)和學(xué)習(xí)能力強的特點,因此該算法在一些分析中應(yīng)用起來十分方便快捷,并且能得到相對準確的分析結(jié)果,在對于客戶流失的分析中,引入這一個算法,對于獲取的樣本數(shù)據(jù)進行學(xué)習(xí)和分類,從而建立客戶流失模型,分析客戶的特點,抓住客戶的關(guān)鍵特征,把握客戶的喜好和心態(tài),從而在完成對于客戶偏好進行分類的同時,對于銀行業(yè)如果避免客戶過度流失提出有效的措施,來提高銀行的競爭力,保證銀行的長遠發(fā)展。

3.3.1 數(shù)據(jù)獲取

數(shù)據(jù)主要包括行號、地理位置、性別、客戶ID、年齡、收入估計、產(chǎn)品數(shù)量、信用積分、開戶時長、有無信用卡、是否活躍、是否流失(即目標變量)。顯然其中行號、客戶Id、姓氏對流失情況的分析預(yù)測意義不大,可以忽略,其余字段可分為分類變量和數(shù)值變量,在數(shù)據(jù)處理環(huán)節(jié)再做變換等操作。另外,剔除少量異常數(shù)據(jù)。本文測試集選取8150 個,訓(xùn)練集選擇1000 個。建立多層感知機模型,利用訓(xùn)練集對于模型擬合準確度進行訓(xùn)練,并且利用測試集對于模型的訓(xùn)練能力進行測試。

3.3.2 數(shù)據(jù)預(yù)處理

由于獲取的銀行客戶數(shù)據(jù)屬性變量比較多, 并且各個屬性變量之間存在著不可公度性和矛盾性,另一方面,各屬性變量的量綱、數(shù)量級和指標類型也不完全相同。以上兩個方面的存在都會對于我們的分析結(jié)果以及模型的建立產(chǎn)生影響,因此為了避免上述情況的發(fā)展, 在建立模型以及評價時要將訓(xùn)練樣本的向量歸一化處理,使網(wǎng)絡(luò)的訓(xùn)練樣本的值都位于[0,1]范圍內(nèi),從而使得模型能夠建立的更加完善,分析結(jié)果更加準確。在預(yù)先處理方面我們一般都是采用最大最小函數(shù)的方法, 獲取神經(jīng)網(wǎng)絡(luò)的輸入值,并且期望輸出的值0 或1,建立兩種可能的情況,如果樣本數(shù)據(jù)中客戶沒有流失,輸出為0,否則為1。

3.3.3 模型的建立

搭建模型, 使得模型包括10 個輸入單元, 存在1 個輸出單元。具有非線性函數(shù)的逼近的特點是BP 人工神經(jīng)網(wǎng)絡(luò)一個重要特征,通過測算我們可以發(fā)現(xiàn)只含有一個隱藏層的BP 網(wǎng)絡(luò)就可實現(xiàn)模型的建立, 所以模型的建立無需過于復(fù)雜,根據(jù)模型中輸入層數(shù)據(jù)的取值范圍, 模型中在每個隱含節(jié)點和輸出節(jié)點的值都是用Sigmoid 轉(zhuǎn)移函數(shù)計算獲得。

3.3.4 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程

對于BP 人工網(wǎng)絡(luò)進行訓(xùn)練,我們將訓(xùn)練的樣本分為兩類,訓(xùn)練集和測試集,第一隱層256 個神經(jīng)元,使用sigmoid 激活函數(shù),使用截斷正態(tài)分布,標準差為0.1,對256 個節(jié)點偏置進行初始化,第一隱層到第二隱層的結(jié)構(gòu),第二隱層同樣256 個神經(jīng)元,使用sigmoid 激活函數(shù),第二隱層到輸出層的結(jié)構(gòu),輸出層兩個神經(jīng)元,使用softmax 輸出,輸出節(jié)點的偏置也要初始化,輸出層使用概率化函數(shù),使得每個輸出都在0-1 之間,并且加和等于1。

3.3.5 結(jié)果分析

epoch:0 train_acc:0.74 test_acc:0.50006133 loss:0.60425085

epoch:50 train_acc:0.74 test_acc:0.50006133 loss:0.57326245

epoch:1000 train_acc:0.74 test_acc:0.50006133 loss:0.5732621

epoch:9950 train_acc:0.806 test_acc:0.637747 loss:0.50620866

epoch:10000 train_acc:0.807 test_acc:0.6390968 loss:0.5060288

本文將訓(xùn)練集每50 為以小組,打亂順序并且不斷進行迭代和訓(xùn)練,根據(jù)訓(xùn)練結(jié)果可以看出,經(jīng)過該模型的訓(xùn)練,測試集和訓(xùn)練集的準確率均不斷提高,損失值一直不斷減少,由此可以看出該模型的建立是合適的。

將訓(xùn)練結(jié)果轉(zhuǎn)化為圖像體現(xiàn)的形式,可以看出,隨著迭代次數(shù)的增加,損失和準確度的結(jié)論和之前完全一致。

圖1 結(jié)果線形圖

4 結(jié)論

本文將人工神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于銀行客戶流失分析預(yù)測,不僅建立了基于人工神經(jīng)網(wǎng)絡(luò)的客戶流失分析模型, 并對模型中的關(guān)鍵問題進行分析和處理;關(guān)鍵屬性變量的選取, 數(shù)據(jù)處理、流失模型建立分析、人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程等進行了重點研究, 通過測試結(jié)果我們可以看到這個模型對于客戶流失進行分析是非??尚械摹Mㄟ^對于模型結(jié)果的觀察使得銀行決策者能夠及時了解客戶流失情況發(fā)生,從而制定相應(yīng)的經(jīng)營決策,挽留有關(guān)的用戶,確保銀行效益不受影響。

對于銀行業(yè),利用Python 技術(shù)中的神經(jīng)網(wǎng)絡(luò)分類方法建立預(yù)測客戶流失模型來支持決策是最直接且較為理性的選擇。本文通過對客戶流失數(shù)據(jù)的探索與預(yù)處理來建立基于Python 的BP 神經(jīng)網(wǎng)絡(luò)模型,目的在于對于模型的優(yōu)良性以及對于銀行客戶的分類訓(xùn)練情況進行進一步的探索。

猜你喜歡
隱層人工神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)
利用人工神經(jīng)網(wǎng)絡(luò)快速計算木星系磁坐標
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)簡單字母的識別
電子制作(2019年10期)2019-06-17 11:45:10
基于RDPSO結(jié)構(gòu)優(yōu)化的三隱層BP神經(jīng)網(wǎng)絡(luò)水質(zhì)預(yù)測模型及應(yīng)用
人民珠江(2019年4期)2019-04-20 02:32:00
基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
基于近似結(jié)構(gòu)風(fēng)險的ELM隱層節(jié)點數(shù)優(yōu)化
計算機工程(2014年9期)2014-06-06 10:46:47
最優(yōu)隱層BP神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷
基于聲發(fā)射和人工神經(jīng)網(wǎng)絡(luò)的混凝土損傷程度識別
满洲里市| 潮州市| 伊川县| 衡南县| 唐河县| 虞城县| 大庆市| 稻城县| 深泽县| 无棣县| 漾濞| 利津县| 茂名市| 沐川县| 宁明县| 蕉岭县| 太湖县| 诸城市| 辽中县| 娄烦县| 天峻县| 故城县| 宁陕县| 临澧县| 同江市| 临漳县| 岑溪市| 乌兰察布市| 伊春市| 子洲县| 邹城市| 五大连池市| 墨脱县| 峨山| 望都县| 会昌县| 若尔盖县| 呼玛县| 新巴尔虎左旗| 鄄城县| 武川县|