呂梁 金淳
摘要:本文在數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基礎(chǔ)理論基礎(chǔ)之上,將其運用于我國中小商業(yè)銀行。以某銀行的業(yè)務(wù)情況為基礎(chǔ)數(shù)據(jù),設(shè)計構(gòu)建了個人及企業(yè)銀行數(shù)據(jù)倉庫的體系結(jié)構(gòu),并對其進(jìn)行數(shù)據(jù)粒度的劃分。在此基礎(chǔ)上,對所構(gòu)建的數(shù)據(jù)倉庫進(jìn)行多維數(shù)據(jù)分析,并通過實施數(shù)據(jù)挖掘操作,實現(xiàn)知識發(fā)現(xiàn)的功能。結(jié)果顯示,通過應(yīng)用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),可以為其獲得巨大的信息收益。
關(guān)鍵詞:數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;OLAP多維數(shù)據(jù)分析;商業(yè)銀行
近年來,由于我國商業(yè)銀行業(yè)務(wù)量的增加,業(yè)務(wù)數(shù)據(jù)也隨之大幅度增加。但由于缺乏有效的方法和手段以對數(shù)據(jù)背后所隱藏的規(guī)律和知識進(jìn)行挖掘,導(dǎo)致銀行工作人員無法利用這些數(shù)據(jù)對銀行相關(guān)業(yè)務(wù)所包含的規(guī)律和未來發(fā)展趨勢進(jìn)行分析。上述現(xiàn)象在信息系統(tǒng)較不發(fā)達(dá)的中小商業(yè)銀行體現(xiàn)則更為明顯。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)作為信息化的有效工具,其在國外的金融領(lǐng)域已經(jīng)得到廣泛應(yīng)用。以北美十大銀行之一的蒙特利爾銀行為例,通過運用數(shù)據(jù)倉庫以及數(shù)據(jù)挖掘技術(shù),對其產(chǎn)品線進(jìn)行重新組織,并基于數(shù)據(jù)挖掘所獲得的經(jīng)驗和知識,進(jìn)行更具針對性的市場營銷,總共為其節(jié)約了2280萬美元。而這一技術(shù)尚未被我國中小商業(yè)銀行所掌握。
一、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘相關(guān)理論概述
(一)數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是“面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合,用于支持管理決策過程”。在這個定義中,W.H.Inmon明確給出了數(shù)據(jù)倉庫的四個重要特點,即“面向主題”、“集成”、“穩(wěn)定”、“隨時間變化”[1]。
數(shù)據(jù)倉庫的數(shù)據(jù)組織方式主要包括有三種,分別是虛擬存儲方式、基于關(guān)系表的存儲方式和多維數(shù)據(jù)庫存儲方式等[3]。其中,多維數(shù)據(jù)庫存儲方式是直接面向數(shù)據(jù)挖掘分析操作所需的數(shù)據(jù)組織形式,它對DW中的海量數(shù)據(jù)從客戶感興趣的角度進(jìn)行層次化處理、抽象概括,并設(shè)置維索引及相應(yīng)的元數(shù)據(jù)管理文件,以對應(yīng)于數(shù)據(jù)倉庫中的數(shù)據(jù)[4]。與虛擬存儲方式、基于關(guān)系表的存儲方式中組織關(guān)系都比較復(fù)雜相比,更適用于組織、存儲數(shù)據(jù)倉庫中的海量數(shù)據(jù)[5]。
(二)基于數(shù)據(jù)倉庫數(shù)據(jù)的OLAP
1.聯(lián)機分析處理(OLAP)的概念和特征
2.OLAP多維分析操作
多維分析是指對數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行切片、切塊、鉆取和旋轉(zhuǎn)等分析操作[9],用戶能從多角度對數(shù)據(jù)進(jìn)行深入剖析,進(jìn)而了解其中的規(guī)律。
(1)切片。切片是指通過在某個或某些維上選取某一特定的屬性成員,而在其他維上則選取一定區(qū)間的屬性成員,對所獲得的數(shù)據(jù)進(jìn)行分析。以某銀行部分業(yè)務(wù)數(shù)據(jù)所形成的數(shù)據(jù)立方為例進(jìn)行說明:從該立方中選取2012年4月這一個時間段內(nèi)所有理財產(chǎn)品的銷售情況進(jìn)行分析,此即為切片。
(2)切塊。切塊是在立方體中的三個維上取一定區(qū)間的屬性成員或全部屬性成員。切塊可以看成是在切片的基礎(chǔ)上,進(jìn)一步確定各個屬性成員的區(qū)間得到的片段體,也即由多個切片疊合起來。
(3)鉆取。鉆取包括上鉆和下鉆兩種操作。從高級數(shù)據(jù)到明細(xì)級數(shù)據(jù)視圖稱為下鉆;從明細(xì)級數(shù)據(jù)到高級數(shù)據(jù)視圖稱為上鉆。
(4)旋轉(zhuǎn)。旋轉(zhuǎn)指改變一個報告或頁面顯示的維方向,通過旋轉(zhuǎn)操作可以最終用戶從不同視角來觀察數(shù)據(jù)。
(三)數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是根據(jù)企業(yè)所設(shè)定的業(yè)務(wù)目標(biāo)和存在的問題,對大量的業(yè)務(wù)數(shù)據(jù)進(jìn)行探索,揭示隱藏其中的規(guī)律并模型化,以指導(dǎo)并應(yīng)用于實際經(jīng)營實踐。通過對業(yè)務(wù)數(shù)據(jù)的挖掘,從中發(fā)現(xiàn)企業(yè)運作的本質(zhì)規(guī)律,優(yōu)化企業(yè)本身的運作[10],或進(jìn)行有效的客戶關(guān)系管理。
常用于銀行業(yè)的數(shù)據(jù)挖掘方法主要包括:
(1)預(yù)測型方法:分類(Classification)/決策樹算法(DecisionTree)、回歸分析(Regression)、時間序列分析(TimeSeries)。
(2)描述型(Descriptive)方法:關(guān)聯(lián)分析(AssociationAnalysis)、序列關(guān)聯(lián)分析(SequentialAnalysis)、聚類分析(Clustering)。
將上述方法應(yīng)用于銀行業(yè)領(lǐng)域,其可實現(xiàn)的功能主要包括:大客戶特征的識別、客戶群體細(xì)分、客戶流失的預(yù)測與控制、業(yè)務(wù)預(yù)測、理財產(chǎn)品銷量預(yù)測、客戶欺騙的早期識別等方面。
二、中小商業(yè)銀行數(shù)據(jù)倉庫的設(shè)計
(一)個人銀行數(shù)據(jù)倉庫構(gòu)建
1.個人銀行數(shù)據(jù)倉庫的體系結(jié)構(gòu)
(二)企業(yè)銀行數(shù)據(jù)倉庫構(gòu)建
1.企業(yè)銀行數(shù)據(jù)倉庫的體系結(jié)構(gòu)
四、結(jié)論
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘在我國中小商業(yè)銀行中的應(yīng)用尚處于探討階段。本文在對數(shù)據(jù)倉庫與數(shù)據(jù)挖掘相關(guān)理論進(jìn)行分析的基礎(chǔ)之上,認(rèn)為將其運用于我國中小商業(yè)銀行具有可行性。以某銀行的業(yè)務(wù)情況為例,對個人及企業(yè)銀行數(shù)據(jù)倉庫的組織構(gòu)建進(jìn)行設(shè)計,實施多維數(shù)據(jù)分析,進(jìn)行數(shù)據(jù)挖掘操作及分析,認(rèn)為通過應(yīng)用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),可以獲得巨大的信息收益?!?/p>
(責(zé)任編輯:張恩娟)
參考文獻(xiàn):
[1]BendellJ.DataModelingandDatabaseDesignforDataWarehouses:TheDataWarehousingInstitute,1996.
[2]袁虹,何厚存.聯(lián)機分析及數(shù)據(jù)倉庫的建模技術(shù)[J].計算機應(yīng)用研究,1999(12):61-63.
[3]史金紅,吳永明.影響數(shù)據(jù)倉庫成功的關(guān)鍵因素[J].電子工程師.2000(1):9-13.
[4]韋洛霞.?dāng)?shù)據(jù)倉庫與OLAP[J].東莞理工學(xué)院學(xué)報,2000(2):19-24.
[5]蔣翊凌.基于數(shù)據(jù)倉庫的銀行業(yè)務(wù)數(shù)據(jù)挖掘研究[D].上海:華東師范大學(xué),2006.
[6]孫其輝.基于數(shù)據(jù)倉庫的集裝箱支線運輸DSS研究[D].遼寧:大連海事大學(xué),2008.
[7]趙璐.?dāng)?shù)據(jù)挖掘技術(shù)及其在電信系統(tǒng)應(yīng)用的研究[D].吉林:長春理工大學(xué),2009.
[8]徐奇,楊光敏,歐陽學(xué)兵,靳志宏.基于數(shù)據(jù)倉庫的口岸跨境運輸決策支持與系統(tǒng)實現(xiàn)[J].交通信息與安全,2011(3):110-115.
[9]靳志宏,徐奇,蘭輝.集裝箱多式聯(lián)運的多維數(shù)據(jù)分析與數(shù)據(jù)挖掘[J].集美大學(xué)學(xué)報.2011(4).
[10]ZhihongJin,QiXu.TheRealizationofDecisionSupportSystemforCross-borderTransportationBasedontheMulti-dimensionalDatabase.JournalofSoftware,2012(5).