摘要:為了克服模糊神經(jīng)網(wǎng)絡(luò)的維數(shù)災(zāi)難、結(jié)構(gòu)復(fù)雜、局部早熟及收斂慢等缺陷,在設(shè)計(jì)一種模糊神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,將模因算法和粗糙集理論引入模糊神經(jīng)網(wǎng)絡(luò),提出一種模因進(jìn)化型粗糙模糊神經(jīng)網(wǎng)絡(luò)(MA-RSFNN)。新模型借助模因算法的全局搜索能力減少網(wǎng)絡(luò)陷入局部極值的可能性,同時(shí)利用粗糙集知識(shí)約簡(jiǎn)對(duì)網(wǎng)絡(luò)輸入數(shù)據(jù)進(jìn)行降維消冗,精簡(jiǎn)輸入維度,避免“維數(shù)災(zāi)難”。實(shí)例仿真結(jié)果表明MA-RSFNN模型的預(yù)測(cè)準(zhǔn)確性較高,是一類解決金融風(fēng)險(xiǎn)管理中高維復(fù)雜問題的有效方法。
關(guān)鍵詞:信用風(fēng)險(xiǎn)預(yù)警; 模糊神經(jīng)網(wǎng)絡(luò); 模因算法; 粗糙集
中圖分類號(hào):TP301.6 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2013)06-0010-05
0引言
近年來,人工神經(jīng)網(wǎng)絡(luò)已廣泛應(yīng)用于信用風(fēng)險(xiǎn)預(yù)警等金融風(fēng)險(xiǎn)管理領(lǐng)域,研究表明神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確性優(yōu)于統(tǒng)計(jì)判別分析等傳統(tǒng)預(yù)警方法,但其中的“黑箱”操作等缺陷卻也導(dǎo)致了神經(jīng)網(wǎng)絡(luò)在信用風(fēng)險(xiǎn)管理領(lǐng)域的應(yīng)用遭到多方質(zhì)疑[1-2]。源自模糊理論與神經(jīng)網(wǎng)絡(luò)相融合的模糊神經(jīng)網(wǎng)絡(luò)(Fuzzy Neural Network,F(xiàn)NN)提高了網(wǎng)絡(luò)的透明性、啟發(fā)性及魯棒性,在一定程度上克服了神經(jīng)網(wǎng)絡(luò)的“黑箱操作”,然而FNN也存在“維數(shù)災(zāi)難”、結(jié)構(gòu)復(fù)雜、學(xué)習(xí)算法冗長、局部早熟等問題,由此也限制了其在金融風(fēng)險(xiǎn)管理領(lǐng)域中的應(yīng)用[3]。據(jù)此,本文試圖在對(duì)模因算法(Memetic Algorithms,MA)進(jìn)行改進(jìn)的基礎(chǔ)上,結(jié)合粗糙集(Rough Set,RS)和模糊神經(jīng)網(wǎng)絡(luò)提出一種模因進(jìn)化型粗糙模糊神經(jīng)網(wǎng)絡(luò)(MA-RSFNN)模型,旨在利用模因算法進(jìn)行模糊神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí),發(fā)揮模因算法的全局優(yōu)化能力,消減網(wǎng)絡(luò)陷入局部早熟的可能性,使網(wǎng)絡(luò)具有進(jìn)化和學(xué)習(xí)的雙重智能,同時(shí)借助粗糙集知識(shí)約簡(jiǎn)精煉訓(xùn)練集、降低輸入維度,避免“維數(shù)災(zāi)難”現(xiàn)象。
1模因算法
模因算法(Memetic Algorithms,MA)由Moscato和Norman等人于1992年提出,是一種超啟發(fā)式全局搜索混合算法,主要思想源自道金斯的文化進(jìn)化思想和達(dá)爾文的自然進(jìn)化法則[4]。其原理是在全局搜索策略中有機(jī)集成局域搜索策略,利用局部搜索策略的局部尋優(yōu)能力提高算法的性能和收斂速度。相關(guān)研究表明模因算法在搜索過程中兼顧深度和廣度,不僅有較強(qiáng)的全局尋優(yōu)能力,同時(shí)算法收斂速度快,在許多問題上的求解獲得了比遺傳算法收斂速度更快[6-9]。
經(jīng)典的模因算法通常采用遺傳算法作為全局搜索策略,因此算法流程與遺傳算法類似。根據(jù)文獻(xiàn)[5],模因算法的流程如圖1所示。
2模因算法改進(jìn)
模糊神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)是一個(gè)連續(xù)函數(shù)優(yōu)化過程,以遺傳算法為基礎(chǔ)的模因算法能有效求解組合優(yōu)化問題,但對(duì)連續(xù)空間問題的求解則效率不高。粒子群算法是一種源自對(duì)鳥類等生物群體覓食行為進(jìn)行模仿的實(shí)編碼優(yōu)化算法,其概念簡(jiǎn)單、結(jié)構(gòu)簡(jiǎn)潔,是求解實(shí)編碼優(yōu)化問題的有力工具。本文提出一種以粒子群算法為全局搜索策略,BP算法為局部搜索策略的改進(jìn)型模因算法,以期設(shè)計(jì)出一種高效的模糊神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。
粒子群算法(Particle Swarm Optimization ,PSO)是一種基于群體智能的全局優(yōu)化算法,其靈感源自鳥群、蟻群等生物群體的覓食過程[10-11]。目前,具有概念簡(jiǎn)單、算法簡(jiǎn)潔、隱含并行及全局收斂等優(yōu)點(diǎn)的粒子群算法已廣泛應(yīng)用到?jīng)Q策分析、知識(shí)發(fā)現(xiàn)等領(lǐng)域[12-13],并取得了豐碩研究成果。基本粒子群算法的數(shù)學(xué)描述如下[10]。
假設(shè)一顆微粒代表尋優(yōu)空間中的一個(gè)解,算法初始化時(shí)隨機(jī)生成一定數(shù)量的微粒構(gòu)成種群,而后通過不斷隨機(jī)有向迭代尋求問題最優(yōu)解。在迭代過程中,微粒通過跟蹤個(gè)體及種群歷史最優(yōu)值,按式(1)、(2)不斷調(diào)整個(gè)體的速度和位置以實(shí)現(xiàn)向最優(yōu)解靠攏。
其中,式(3)為速度vij的調(diào)整量;速度vij為位置xij的調(diào)整量;w∈[0.4,0.9]為慣性因子;c1=c2=2.0為學(xué)習(xí)因子; r(·)∈(0,1)為隨機(jī)數(shù);pij和pg分別為個(gè)體及群體歷史最優(yōu)值。
2.2改進(jìn)型模因算法
改進(jìn)型模因算法基本流程如圖2所示。
3模因進(jìn)化型模糊神經(jīng)網(wǎng)絡(luò)
3.1網(wǎng)絡(luò)結(jié)構(gòu)
信用風(fēng)險(xiǎn)預(yù)警通常為多輸入單輸出的問題,參照文獻(xiàn)[14-15]設(shè)計(jì)的模糊神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如所圖3所示。
3.2網(wǎng)絡(luò)學(xué)習(xí)算法
(1)編碼。微粒的坐標(biāo)值代表了模糊神經(jīng)網(wǎng)絡(luò)的模糊參數(shù)與權(quán)值,其編碼如圖4所示。
其中,yi為實(shí)際輸出;yi為期望輸出,P為群體規(guī)模。
(3)算法步驟。學(xué)習(xí)算法的主要步驟如下:
步驟一:初始化。設(shè)置全局搜索策略和局部搜索策略的相關(guān)參數(shù),隨機(jī)生成種群。
步驟二:BP算子。采用BP算法對(duì)每個(gè)個(gè)體進(jìn)行局部尋優(yōu)。
步驟三:算法終止判斷。如果算法滿足終止條件則跳轉(zhuǎn)步驟六,否則跳轉(zhuǎn)步驟四。
步驟四:PSO算子。①根據(jù)式(4)計(jì)算每個(gè)個(gè)體的適應(yīng)值;②個(gè)體及群體歷史最優(yōu)位置調(diào)整;③按式(1)調(diào)整微粒速度;④按式(2)調(diào)整微粒位置。
步驟五:BP算子。采用BP算法對(duì)每個(gè)個(gè)體進(jìn)行局部尋優(yōu),產(chǎn)生新群體,跳轉(zhuǎn)步驟三。
步驟六:算法結(jié)束。
其中,算法終止條件:① MSE<ε,ε為預(yù)先給定足夠小的數(shù);②算法迭代次數(shù)>最大進(jìn)化代數(shù)。
BP算子的目標(biāo)函數(shù)為式(4)所示的適應(yīng)值函數(shù),學(xué)習(xí)過程中,網(wǎng)絡(luò)參數(shù)與權(quán)值按以下數(shù)學(xué)公式作調(diào)整:
上述模因進(jìn)化型模糊神經(jīng)網(wǎng)絡(luò)采用模因算法對(duì)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)與訓(xùn)練,使得模型具備了學(xué)習(xí)與進(jìn)化的雙重智能,但該模型也存在一般模糊神經(jīng)網(wǎng)絡(luò)的“維數(shù)災(zāi)難”現(xiàn)象。為此,采用粗糙集知識(shí)約簡(jiǎn)對(duì)模型輸入數(shù)據(jù)進(jìn)行前置處理,簡(jiǎn)化訓(xùn)練集、減少輸入維數(shù),從而降低網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜程度,避免“維數(shù)災(zāi)難”現(xiàn)象。前置處理的主要步驟如下:
(1)指標(biāo)初選和數(shù)據(jù)預(yù)處理
在考慮數(shù)據(jù)可獲取性的前提下初步建立預(yù)警指標(biāo)體系,指標(biāo)體系要求涵蓋各方面的信息,力圖從全方位、多層次反映信用風(fēng)險(xiǎn)特征。
數(shù)據(jù)預(yù)處理主要是根據(jù)指標(biāo)的特性,對(duì)連續(xù)型預(yù)警指標(biāo)的數(shù)據(jù)進(jìn)行離散化處理。數(shù)據(jù)離散化的原則是保持?jǐn)?shù)據(jù)集分類或決策能力不變的前提下盡可能壓縮數(shù)據(jù)。
(2)建立決策表
以指標(biāo)初選和數(shù)據(jù)預(yù)處理后的數(shù)據(jù)為基礎(chǔ),建立如表1所示的決策表。
(3)知識(shí)約簡(jiǎn)
對(duì)建立的決策表進(jìn)行約簡(jiǎn)處理,得到條件屬性的相對(duì)約簡(jiǎn),選取相對(duì)約簡(jiǎn)所代表的預(yù)警指標(biāo)組成指標(biāo)集作為模型的輸入指標(biāo)體系。
5模型在信用風(fēng)險(xiǎn)中的應(yīng)用
從商業(yè)銀行的角度看,信用風(fēng)險(xiǎn)是指借款人的違約而造成的損失可能性。本文從商業(yè)銀行的企業(yè)貸款違約方面研究模型在信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用,以檢驗(yàn)?zāi)P驮诮鹑陲L(fēng)險(xiǎn)管理領(lǐng)域中的應(yīng)用成效。
5.1指標(biāo)初選與數(shù)據(jù)采集
在研究國內(nèi)外相關(guān)成果的基礎(chǔ)上,參考相關(guān)商業(yè)銀行的企業(yè)績(jī)效評(píng)價(jià)指標(biāo)體系[16-19],選擇涵蓋企業(yè)盈利能力、償債能力、成長能力及營運(yùn)能力等方面的共21個(gè)指標(biāo)構(gòu)成初選指標(biāo)集,如表2所示。
5.2粗糙集前置處理
(1)數(shù)據(jù)離散化與決策表的建立
采用等頻率劃分算法在保持?jǐn)?shù)據(jù)分類能力的前提下對(duì)數(shù)據(jù)進(jìn)行離散化處理,斷點(diǎn)集數(shù)k可通過試驗(yàn)獲得,一般取k=3。在數(shù)據(jù)離散化的基礎(chǔ)上,以初選指標(biāo)為條件屬性,屬性Bc(1:貸款違約公司,0:貸款正常公司)為決策屬性,建立信用風(fēng)險(xiǎn)預(yù)警的決策表,如表3所示。
(2)屬性約簡(jiǎn)
5.3模型訓(xùn)練學(xué)習(xí)
學(xué)習(xí)算法的相關(guān)參數(shù)初始化如下:
(1)模糊子集數(shù)設(shè)為3(代表高、中、低),則該模型為6-18-3-1結(jié)構(gòu)的模糊神經(jīng)網(wǎng)絡(luò),輸出Y為企業(yè)違約信號(hào)(1:違約;0:不違約)。
(2)參數(shù)初始化。網(wǎng)絡(luò)的模糊參數(shù)及權(quán)值隨機(jī)初始化,隸屬中心∈[-1,1],隸屬寬度∈(0,1],耦合權(quán)值∈(-1,1)。
(3)模因算法的參數(shù)設(shè)置。PSO算子隨機(jī)生成規(guī)模M=30的種群,w=0.729, c1=c2=1.49,[Vup,Vdown]為[-1,1],Vmax=0.3,BP算子的學(xué)習(xí)率η=0.005。
(4)訓(xùn)練終止條件:①適應(yīng)值<0.000 5;② 模因算法迭代次數(shù)>10 000。
在Matlab7.0環(huán)境中,編程實(shí)現(xiàn)上述的模型與算法,采用訓(xùn)練數(shù)據(jù)集的150份數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練學(xué)習(xí),訓(xùn)練過程誤差變化如圖5所示。經(jīng)過3 000多代的進(jìn)化,MSE達(dá)到了0.000 281。
采用測(cè)試集的數(shù)據(jù)對(duì)預(yù)警模型進(jìn)行仿真實(shí)驗(yàn),表4匯總了三類模型的實(shí)驗(yàn)結(jié)果,從中可以看出MA-RSFNN模型的預(yù)測(cè)準(zhǔn)確率高達(dá)90%,相比BP神經(jīng)網(wǎng)絡(luò)及單純模糊神經(jīng)網(wǎng)絡(luò)均有了大幅度提高。無論是第一類錯(cuò)誤還是第二類錯(cuò)誤MA-RSFNN模型的表現(xiàn)都最好。
6結(jié)束語
模糊神經(jīng)網(wǎng)絡(luò)具有啟發(fā)性、透明性等特征,可處理模糊信息,能避免神經(jīng)網(wǎng)絡(luò)的“黑箱操作”,但其存在“維數(shù)災(zāi)難”現(xiàn)象、結(jié)構(gòu)復(fù)雜及收斂性差等缺陷。本文所提出的MA-RSFNN模型將模因算法和粗糙集理論融入模糊神經(jīng)網(wǎng)絡(luò),發(fā)揮模因算法的全局搜索能力提升模糊神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,借助粗糙集知識(shí)約簡(jiǎn)的降維消冗能力對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行降維消冗處理,從而精簡(jiǎn)網(wǎng)絡(luò)結(jié)構(gòu),避免網(wǎng)絡(luò)陷入“維數(shù)災(zāi)難”。應(yīng)用實(shí)例的結(jié)果表明了新模型的有效性,可望為金融風(fēng)險(xiǎn)管理提供一種新方法和新思路。
參考文獻(xiàn):
[1]MIN J H, LEE Y C. Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications, 2005, 28 :603-614.
[2]BAHRAMMIRZAEE A. A comparative survey of artificial intelligence applications in finance: artificial neural networks, expert system and hybrid intelligent systems[J].Neural Comput & Applic,2010,19:1165-1195.
[3]HAMDANI T M, ALIMI A M, FAKHRI K. Enhancing the structure and parameters of the centers for BBF fuzzy neural network classifier construction based on data structure[A]// Proceedings of the International Joint Conference on Neural Networks[C]. Piscataway NJ: IEEE, 2008: 3174-3180.
[4]MOSCATO P. On evolution, search, optimization, genetic algorithms and martial arts: towards memetic algorithms[A]//Tech. Rep. Caltech Concurrent Computation Program [C]. Pasadena, California, USA, 1989: 1-67.
[5]NORA S,CHRISTIAN S, ANDREAS Z.A memetic clustering algorithm for the functional partition of genes based on the gene ontology[C]//Proc of the 2004 IEEE Symposium on Computational Intelligence in Bioinformatics and Computational Biology.San Diego,USA,2004:252-259.
[6]DAWKINS R. The selfish gene[M].UK:Oxford University Press,1976.
[7]MOSCATO P, NORMAN M G. A memetic approach for the traveling salesman problem-implementation of a computational ecology for com-binatorial optimization on message-passing systems[C]// Proceedings of the International Conference on Parallel Computing and Transport Applications. Amsterdam:IOS Press,1992: 177-186.
[8]RADCLIFFE N J, SURRY P D. Formal memetic algorithms[J]. Evolutionary Computing, 1994,865: 1-16.
[9]XU Xin,HE H G.A theoretical model and convergence analysis of memetic evolutionary algorithms[C]//Proc of Int Conf on Natural Computation.Changsha,2005:1035-1043.
[10]KENNEDY J. EBERHART R C. Particle swarm optimization [A]// Proceedings of IEEE, International Conference on Neural Networks [C]. Piscataway NJ:IEEE, 1995: 1942-1948.
[11]KENNEDY J. The particle swarm: social adaptation of knowledge [A]//Preceedings of Evolutionary Computation [C] ,Indianapolis: IEEE, 1997:303-308.
[12]EBERHART R C, SHI Y H. Particle swarm optimization: developments, applications and resources [A]//Proceedings of the IEEE Congress on Evolutionary Computation [C]. Piscataway, USA: IEEE Service Center, 2001:81-86.
[13]吳啟迪,汪鐳. 智能微粒群算法研究及應(yīng)用[M]. 南京:江蘇教育出版社,2005-04.
[14]AKAGI T, SUGENO M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Transactions on Systems, Man, and, Cybernetics, 1985,15(1): 116-132.
[15]黃福員. 金融風(fēng)險(xiǎn)預(yù)警的MPSO-FNN模型構(gòu)建與應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用,2009,45(14):210-212.
[16]ALTMAN E I, MARCO G, VARETTO F. Corporate distress diagnosis: comparisons using linear discriminant Ana analysis and neural networks[J]. Journal of Banking and Finance, 1994, 18: 505-529.
[17]李志輝, 李萌. 我國商業(yè)銀行信用風(fēng)險(xiǎn)識(shí)別模型及其實(shí)證研究[J]. 經(jīng)濟(jì)科學(xué), 2005(5): 61-71.
[18]財(cái)政部統(tǒng)計(jì)評(píng)價(jià)司. 企業(yè)績(jī)效評(píng)價(jià)問答[M]. 北京:經(jīng)濟(jì)科學(xué)出版社, 1999.
[19]章彰. 解讀巴塞爾新資本協(xié)議[M]. 北京: 中國經(jīng)濟(jì)出版社, 2005.