霍魁
摘要:伴隨著信息技術(shù)的飛速發(fā)展,各行各業(yè)各個(gè)領(lǐng)域都在積極引進(jìn)信息技術(shù),銀行工作也是如此。當(dāng)今時(shí)代已經(jīng)成為了富含海量數(shù)據(jù)信息的大數(shù)據(jù)時(shí)代,想要在此背景下從眾多信息中迅速挖掘出想要的信息,比以往要困難很多。對(duì)于銀行工作來說,數(shù)據(jù)基本決定了其發(fā)展,但是有些銀行目前卻還沒有發(fā)現(xiàn)海量爆炸性數(shù)據(jù)所造成的威脅,對(duì)此,相關(guān)工作人員必須加以重視,引進(jìn)數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)銀行業(yè)的可持續(xù)發(fā)展。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;銀行;數(shù)據(jù)挖掘
隨著時(shí)代的發(fā)展和進(jìn)步,對(duì)于銀行來說,需要不斷完善計(jì)算機(jī)系統(tǒng)中的操作數(shù)據(jù)存儲(chǔ)。數(shù)據(jù)庫(kù)群、企業(yè)數(shù)據(jù)倉(cāng)庫(kù)、主數(shù)據(jù)存儲(chǔ)等建設(shè)相應(yīng)的基礎(chǔ)網(wǎng)絡(luò)。NoSQL、Lucene、Hadoop、MapReduce等技術(shù)的發(fā)展適當(dāng)?shù)脑黾恿算y行掌握數(shù)據(jù)的能力?,F(xiàn)階段,無論銀行面對(duì)的是外部數(shù)據(jù)和是內(nèi)部數(shù)據(jù)、非結(jié)構(gòu)數(shù)據(jù)或者結(jié)構(gòu)數(shù)據(jù),已經(jīng)具有比較成熟的產(chǎn)生、整合、存儲(chǔ)以及訪問數(shù)據(jù)的技術(shù),此外,要想最大限度實(shí)現(xiàn)數(shù)據(jù)的價(jià)值,需要銀行全面分析挖掘數(shù)據(jù)的發(fā)展趨勢(shì)和規(guī)律,并運(yùn)用到銀行運(yùn)行中。
一、大數(shù)據(jù)時(shí)代銀行面臨的挑戰(zhàn)
(一)銀行中傳統(tǒng)方式對(duì)銀行企業(yè)文化的沖擊
隨著大數(shù)據(jù)的發(fā)展,對(duì)銀行產(chǎn)生很多影響和沖擊,對(duì)于銀行企業(yè)文化發(fā)展的影響主要包括以下幾方面:第一,摒棄偏愛純凈數(shù)據(jù)和有條理數(shù)據(jù),轉(zhuǎn)向接受非結(jié)構(gòu)數(shù)據(jù),允許少量不精確數(shù)據(jù)。第二,逐漸從局部沖擊變?yōu)槿繘_擊,因?yàn)榇髷?shù)據(jù)時(shí)代不同于以往的情況,需要大量數(shù)據(jù),因此全面沖擊企業(yè)文化。第三,企業(yè)文化與數(shù)據(jù)逐漸沖因果關(guān)系變?yōu)橄嚓P(guān)關(guān)系[1]。
(二)銀行面臨的數(shù)字化挑戰(zhàn)
大數(shù)據(jù)分析對(duì)于銀行決策來說就是一定的擴(kuò)展數(shù)據(jù)、快速分析數(shù)據(jù)的作用,支持銀行發(fā)展目標(biāo)。隨著大數(shù)據(jù)時(shí)代的發(fā)展和進(jìn)步,銀行面臨著一些挑戰(zhàn),一方面要使銀行內(nèi)部不斷開發(fā)新業(yè)務(wù)和新產(chǎn)品,另外一方面就是傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)性能問題。數(shù)字化的發(fā)展使得銀行需要面對(duì)大量的數(shù)據(jù),數(shù)據(jù)增長(zhǎng)速度快、規(guī)模龐大;類型多,數(shù)據(jù)類型除了傳統(tǒng)的結(jié)構(gòu)以外,還具有語(yǔ)音、視頻、文字、圖片等形式,結(jié)構(gòu)復(fù)雜,內(nèi)容繁多;分析規(guī)則復(fù)雜,一般有價(jià)值的數(shù)據(jù)藏的都比較深,需要利用多種算法進(jìn)行分析;具有很高的實(shí)時(shí)性,隨著數(shù)字化發(fā)展,數(shù)據(jù)處理的速度更快,實(shí)時(shí)性更強(qiáng),需要及時(shí)準(zhǔn)確地進(jìn)行處理[2]。
二、數(shù)據(jù)挖掘技術(shù)
(一)數(shù)據(jù)挖掘概述
1.數(shù)據(jù)挖掘技術(shù)應(yīng)用步驟
數(shù)據(jù)挖掘?qū)嶋H上就是在海量數(shù)據(jù)中利用各種分析工具來發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系和模型的過程,預(yù)測(cè)數(shù)據(jù)關(guān)系和模型,以便于可以很好的找到潛在的數(shù)據(jù)關(guān)系,發(fā)現(xiàn)被忽視的原因,因此,是目前解決數(shù)據(jù)爆炸的有效方式,被稱作KDD。數(shù)據(jù)挖掘?qū)儆诜磸?fù)的過程,主要包括以下步驟:
第一,定義問題和分析主題。在挖掘數(shù)據(jù)的時(shí)候,需要分析應(yīng)用領(lǐng)域,主要包括應(yīng)用目標(biāo)和知識(shí)[3]。定義問題可以適當(dāng)?shù)某浞至私鈱?shí)際情況,熟悉背景以及用戶需求,不能定義缺少背景的知識(shí)。在確定用戶實(shí)際需求以后,需要評(píng)估歷史數(shù)據(jù),利用數(shù)據(jù)挖掘來不斷滿足用戶需求,然后制定合理的數(shù)據(jù)挖掘計(jì)劃。
第二,準(zhǔn)備數(shù)據(jù)。數(shù)據(jù)挖掘需要處理的數(shù)據(jù)不但具有大量數(shù)據(jù),還會(huì)存在一些冗余數(shù)據(jù)和噪音數(shù)據(jù)以及不完整數(shù)據(jù)。準(zhǔn)備數(shù)據(jù)主要包括數(shù)據(jù)清理、集成數(shù)據(jù)、選擇數(shù)據(jù)、變換數(shù)據(jù)、歸約數(shù)據(jù)以及數(shù)據(jù)質(zhì)量分析。
第三,建立模型。主要就是通過已知知識(shí)和數(shù)據(jù)建立模型,能夠有效的分析和描述知識(shí)和數(shù)據(jù),可以在未知數(shù)據(jù)中進(jìn)行應(yīng)用。建模實(shí)際上就是把一般規(guī)律、相關(guān)經(jīng)驗(yàn)形成抽象的分析模型,挖掘數(shù)據(jù)就是依據(jù)模型分析、處理、預(yù)測(cè)數(shù)據(jù)的過程。
第四,評(píng)估模式。評(píng)估模式主要就是通過知識(shí)來體現(xiàn)用戶需求,然后優(yōu)化挖掘數(shù)據(jù)過程中的數(shù)據(jù),直到符合規(guī)范。
2.數(shù)據(jù)挖掘技術(shù)算法
數(shù)據(jù)挖掘技術(shù)算法實(shí)際上具體實(shí)現(xiàn)數(shù)據(jù)挖掘方法,主要包括模型表示、模型評(píng)價(jià)標(biāo)準(zhǔn)以及發(fā)現(xiàn)方法三部分。數(shù)據(jù)挖掘技術(shù)算法主要包括決策樹、遺傳算法、K—近鄰算法、神經(jīng)網(wǎng)絡(luò)等。具有最佳搜索空間的方式就是遺傳算法,利用應(yīng)用遺傳算法的適應(yīng)函數(shù)來合理的搜索方向,然后通過人工算法來模擬一些生物種群的優(yōu)勝劣汰和多樣性,從而進(jìn)行周而復(fù)始的一代代演化。決策樹是利用樹狀結(jié)構(gòu)來體現(xiàn)影響數(shù)據(jù)變量的分析預(yù)測(cè)模型,屬性就是決策集合或者分類集合,通過自上到下的回歸方式,樹的葉結(jié)點(diǎn)代表不同種類、非終端結(jié)點(diǎn)代表屬性。合理計(jì)算每個(gè)樹期望值,得到最優(yōu)解。K—鄰近算法是在距離度量分類的基礎(chǔ)上進(jìn)行的,假設(shè)所有集合不包括數(shù)據(jù)集,并且包括很多類別的期望值。神經(jīng)網(wǎng)絡(luò)是能夠模仿人類大腦思考結(jié)構(gòu)的分析方式,利用非線性預(yù)測(cè),來進(jìn)行識(shí)別,從而得到各網(wǎng)絡(luò)單元的數(shù)據(jù)。數(shù)據(jù)挖掘工具核心內(nèi)容就是算法,主要包括分類分析、聚類分析、關(guān)聯(lián)分析、統(tǒng)計(jì)分析、時(shí)間序列、相關(guān)分析以及值預(yù)測(cè)。一般比較常用的就是分類算法、值預(yù)測(cè)和聚類分析[4]。
表一數(shù)據(jù)挖掘工具比較分析
三、數(shù)據(jù)挖掘技術(shù)在銀行中的應(yīng)用
(一)貸款方進(jìn)行信用風(fēng)險(xiǎn)評(píng)估應(yīng)用
貸款方進(jìn)行的信用風(fēng)險(xiǎn)評(píng)估是銀行應(yīng)用數(shù)據(jù)挖掘技術(shù)的主要方式之一,可以建立一定的評(píng)級(jí)模型,例如,神經(jīng)網(wǎng)絡(luò)模型、FICO評(píng)估模型以及貝葉斯分析模型等來進(jìn)行貸款方風(fēng)險(xiǎn)評(píng)估。在評(píng)估銀行賬戶信譽(yù)的時(shí)候,可以適當(dāng)?shù)氖褂弥庇^量化的方式。依據(jù)信用評(píng)分為基本例子,在確定權(quán)重的時(shí)候,按照數(shù)據(jù)挖掘模型,對(duì)于申請(qǐng)過程中的每一項(xiàng)進(jìn)行打分,累加起來就是申請(qǐng)人的實(shí)際信用情況。然后銀行依據(jù)信用評(píng)分來確定是否接受申請(qǐng)人的申請(qǐng)以及信用額度[5]。
(二)客戶關(guān)系管理中應(yīng)用
客戶關(guān)系管理也是銀行數(shù)據(jù)挖掘技術(shù)應(yīng)用的重要方式之一。發(fā)現(xiàn)以及開拓新客戶是銀行發(fā)展過程中比較重要的部分,利用探索性挖掘數(shù)據(jù)的方式,可以適當(dāng)?shù)陌l(fā)現(xiàn)數(shù)據(jù)中心的特征以及預(yù)測(cè)營(yíng)銷活動(dòng)的實(shí)際響應(yīng)率,例如,自動(dòng)探測(cè)聚類。利用聚類分析的方式把客戶進(jìn)行分類,然后依據(jù)客戶風(fēng)險(xiǎn)、服務(wù)收入成本等來分析、預(yù)測(cè)以及優(yōu)化相關(guān)因素,以便于能夠發(fā)現(xiàn)并達(dá)到盈利的目標(biāo)。利用決策樹的方式來合理計(jì)算客戶貢獻(xiàn)期望值,以此來分類客戶,然后依據(jù)不同期望值進(jìn)行分組,可以分為三種類別 ,包括黃金客戶、頂級(jí)客戶以及一般客戶。然后依據(jù)不同種類客戶的實(shí)際特點(diǎn)來提供一些特色服務(wù),從而可以有效提高忠誠(chéng)度。數(shù)據(jù)挖掘技術(shù)運(yùn)用到銀行中,可以適當(dāng)?shù)念A(yù)防流失客戶,在風(fēng)險(xiǎn)出現(xiàn)流失客戶的時(shí)候,需要通過特殊待遇、額外增值以及激勵(lì)忠誠(chéng)度來對(duì)客戶進(jìn)行保留。例如,在預(yù)測(cè)客戶停止在此銀行放貸,變?yōu)槿e的銀行,可以利用適當(dāng)降低利率以及增加額度來保留客戶。數(shù)據(jù)挖掘可以在一定程度上及時(shí)轉(zhuǎn)移關(guān)聯(lián)因子,找到客戶中比較類似的轉(zhuǎn)移者,然后利用分析孤立點(diǎn)的方式來體現(xiàn)異??蛻粜袨?,以便于銀行能夠最大限度降低客戶流失[6]。
(三) 關(guān)聯(lián)規(guī)則挖掘在電子銀行產(chǎn)品推薦中的應(yīng)用
隨著信息化技術(shù)的發(fā)展,電子技術(shù)也在不斷進(jìn)步,傳統(tǒng)的銀行柜面服務(wù)模式已經(jīng)逐漸不能符合社會(huì)發(fā)展需求,電子銀行應(yīng)運(yùn)而生。在推薦電子銀行產(chǎn)品的時(shí)候運(yùn)用關(guān)聯(lián)規(guī)則,從大量銀行數(shù)據(jù)中可以適當(dāng)抽取一些有價(jià)值、有效的數(shù)據(jù)信息來推薦電子銀行產(chǎn)品,也是關(guān)聯(lián)技術(shù)的具體實(shí)踐,可以在一定程度上帶動(dòng)銷售、挖掘客戶以及開發(fā)客戶等的發(fā)展。電子銀行發(fā)展,在一定程度上改變傳統(tǒng)的銀行模式,不斷提高銀行處理系統(tǒng)的智能化水平,讓客戶充分了解電子產(chǎn)品的優(yōu)勢(shì),滿足客戶實(shí)際需求,建立相應(yīng)的可以存儲(chǔ)大量數(shù)據(jù)的數(shù)據(jù)庫(kù),利用簡(jiǎn)單的方式進(jìn)行操作就可以得到數(shù)據(jù)信息,需要從多角度、多層次進(jìn)行關(guān)聯(lián)。關(guān)聯(lián)規(guī)則運(yùn)用到推薦電子產(chǎn)品中,可以在一定程度上調(diào)節(jié)資源配置,解決人力和資金,提高銷售率,科學(xué)的進(jìn)行市場(chǎng)預(yù)測(cè),吸引客戶,以便于可以獲得更多利益[7]。
(四) 金融監(jiān)管應(yīng)用
第一,隨著金融市場(chǎng)的不斷發(fā)展和進(jìn)步,保證金融市場(chǎng)正常運(yùn)行的就是金融監(jiān)管,同時(shí)也是預(yù)防市場(chǎng)風(fēng)險(xiǎn)的主要方式?,F(xiàn)階段,金融監(jiān)管方式應(yīng)用數(shù)據(jù)挖掘及時(shí)最主要的就是集中在反洗錢方面。在反洗錢中應(yīng)用數(shù)據(jù)挖掘中的分類研究、孤立點(diǎn)分析、聚類等方式具有很大優(yōu)勢(shì),利用上述挖掘數(shù)據(jù)技術(shù)可以保證金融機(jī)構(gòu)可以有效的監(jiān)測(cè)洗錢行為。
第二,監(jiān)管非現(xiàn)場(chǎng)。在監(jiān)管非現(xiàn)場(chǎng)的時(shí)候,進(jìn)行數(shù)據(jù)挖掘,依據(jù)實(shí)際風(fēng)險(xiǎn)情況、資源情況、流動(dòng)性情況、應(yīng)力情況等,利用定量分析以及模型技術(shù)來逐漸累積監(jiān)管模型庫(kù),以便于能夠及時(shí)的計(jì)量銀行經(jīng)營(yíng)情況??蛻羟闆r以及風(fēng)險(xiǎn)情況,進(jìn)行縱向和橫向比較,可以從根本上了解現(xiàn)場(chǎng)監(jiān)督以及警示非現(xiàn)場(chǎng)監(jiān)督。
第三,數(shù)據(jù)可視化。數(shù)據(jù)挖掘最重要的就是大量數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行可視化處理可以為分析數(shù)據(jù)提供可靠圖形,為金融監(jiān)管人員提供保障和基礎(chǔ)[8]。
結(jié)語(yǔ)
總而言之,隨著大數(shù)據(jù)時(shí)代的發(fā)展,銀行以往通過利息差來當(dāng)作主要收入的形式已經(jīng)成為過去,銀行不僅面臨大數(shù)據(jù)時(shí)代臨挑戰(zhàn)和沖擊,還需要面對(duì)越來越激烈的行業(yè)競(jìng)爭(zhēng),因此,需要從以往的產(chǎn)品為中心的模式變?yōu)榭蛻魹橹行牡哪J剑浞职l(fā)揮數(shù)據(jù)挖掘技術(shù)的作用,掌握好客戶實(shí)際需求,并且開展一些具有一定針對(duì)性的營(yíng)銷活動(dòng),為客戶服務(wù),提高客戶價(jià)值,從而打造出具有競(jìng)爭(zhēng)力的銀行。(作者單位:中國(guó)人民大學(xué))
參考文獻(xiàn):
[1]王日宏,王曉龍.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘在銀行中的應(yīng)用[J].電腦知識(shí)與技術(shù),2014(7):1369-1370,1374.
[2]于上上,陳璐,孫璐等.銀行數(shù)據(jù)挖掘的運(yùn)用及效用研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2014(6):25-26.
[3]戴玉勤,景廣軍,謝俊元等.基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的銀行決策支持系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2012,38(5):224-227.
[4]賀本嵐.大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘在銀行客戶關(guān)系管理中的應(yīng)用研究[C].//第八屆中國(guó)管理學(xué)年會(huì)——中國(guó)管理的國(guó)際化與本土化論文集.2013:1-6.
[5]彭敢.Apriori算法在銀行系統(tǒng)數(shù)據(jù)挖掘中的應(yīng)用[J].電腦編程技巧與維護(hù),2012(24):62-63.
[6]郭瑩,張曉燕.數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)在銀行客戶關(guān)系管理中的應(yīng)用[J].科技管理研究,2013,23(2):75-78.
[7]周晶平.數(shù)據(jù)挖掘在銀行分析型CRM系統(tǒng)應(yīng)用中存在的問題與對(duì)策[J].湖北大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,32(1):46-49.
[8]黃昶君,王林.大數(shù)據(jù)助推銀行零售業(yè)務(wù)量化經(jīng)營(yíng)——大數(shù)據(jù)時(shí)代的零售數(shù)據(jù)挖掘和利用探索[J].海南金融,2014(1):66-69.