国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度信念網(wǎng)絡(luò)的信用評(píng)估研究

2019-11-06 03:03:14
關(guān)鍵詞:信用神經(jīng)網(wǎng)絡(luò)深度

1.華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,廣東廣州 510631

2.華南師范大學(xué)金融工程與風(fēng)險(xiǎn)管理研究所,廣東廣州 510631

引言

2018年,以土耳其、阿根廷為代表的幾個(gè)新興市場(chǎng)國(guó)家輪番遭遇到貨幣貶值的危機(jī),一度讓人開始擔(dān)心 1998年金融危機(jī)再現(xiàn)。表面上,美國(guó)對(duì)這些國(guó)家開打貿(mào)易戰(zhàn)是造成上述情況的直接原因,但究其深層次原因還是在于這些國(guó)家自身,其中一個(gè)重要因素是它們各自過高的外債比例(如土耳其貨幣危機(jī)爆發(fā)時(shí)其外債規(guī)模已占到本國(guó) GDP的52%),一旦經(jīng)濟(jì)環(huán)境出現(xiàn)不利變化,極易導(dǎo)致信用風(fēng)險(xiǎn)的急劇增加,且該狀況會(huì)迅速向企業(yè)、金融機(jī)構(gòu)、投資者蔓延,給金融市場(chǎng)帶來極大沖擊,最終可能導(dǎo)致金融危機(jī)的爆發(fā)。反觀歷次金融危機(jī)的產(chǎn)生基本上都離不開信用風(fēng)險(xiǎn)惡化這個(gè)重要根源。顯然,信用風(fēng)險(xiǎn)的評(píng)估與防范對(duì)金融監(jiān)管當(dāng)局及相關(guān)金融機(jī)構(gòu)、投資者等而言是至關(guān)重要的。

1 相關(guān)文獻(xiàn)

由于信用風(fēng)險(xiǎn)的復(fù)雜性,信用風(fēng)險(xiǎn)評(píng)估的模型也多種多樣,但從技術(shù)方法角度來看,主要可分為兩類基本模型(Chen et al,2016):一類是以統(tǒng)計(jì)分析為基礎(chǔ)的模型;另一類則是基于智能技術(shù)方法構(gòu)建的模型。前者典型代表包括線性判別分析法、二次判別分析以及 logistic 回歸模型等;后者包括了現(xiàn)今比較流行的一些機(jī)器學(xué)習(xí)方法,主要有神經(jīng)網(wǎng)絡(luò)(NN)、決策樹(DT)、進(jìn)化方法、模糊邏輯(FL)以及支持向量機(jī)(SVM)等。Prado 等人(2016)利用 Web Science 數(shù)據(jù)庫(kù),采用文獻(xiàn)計(jì)量方法分析了從 1968到2014年間所發(fā)表的有關(guān)信用風(fēng)險(xiǎn)和破產(chǎn)研究的期刊文獻(xiàn),他們對(duì)比了研究者使用這兩類模型情況,發(fā)現(xiàn)雖然判別模型和logistic 模型一直是研究者常用的方法,但從上世紀(jì) 90年代以來,以神經(jīng)網(wǎng)絡(luò)為代表的人工智能技術(shù)得到越來越廣泛的運(yùn)用,一個(gè)重要原因是后者不像前者需要嚴(yán)格假設(shè)前提,而且在處理非線性、病結(jié)構(gòu)問題方面比前者有更明顯的優(yōu)勢(shì),因此在面對(duì)日益復(fù)雜的信用風(fēng)險(xiǎn),基于后者的評(píng)估模型也越來越受到相關(guān)研究人員的青睞,并在這方面取得了不少的研究成果。Blanco 等人(2013)運(yùn)用多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)模型構(gòu)建企業(yè)信用評(píng)分模型,以誤判成本為標(biāo)準(zhǔn),對(duì)比線性判別(LDA)及 logistic 等統(tǒng)計(jì)模型,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型結(jié)果要優(yōu)于統(tǒng)計(jì)模型;Korol(2013)則將神經(jīng)網(wǎng)絡(luò)運(yùn)用在對(duì)比中歐地區(qū)和拉美地區(qū)的企業(yè)在破產(chǎn)風(fēng)險(xiǎn)預(yù)測(cè)上的不同;Khashman(2011)也通過神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建信用風(fēng)險(xiǎn)的評(píng)價(jià)模型;楊淑娥等(2007)則利用 BP 神經(jīng)網(wǎng)絡(luò)(BPNN)構(gòu)建了我國(guó)上市公司財(cái)務(wù)預(yù)警模型,并在實(shí)際運(yùn)用中得到了較好的結(jié)果;Wang 等人(2012)、Sun 等人(2012)在進(jìn)行公司信用評(píng)估預(yù)測(cè)研究中則采用了SVM方法并取得了較好的效果。Yao 等(2015)則將 SVM 成功地運(yùn)用在公司債券違約損失的預(yù)測(cè)上。

然而上述模型在使用過程中缺陷也很明顯,如BP 神經(jīng)網(wǎng)絡(luò)為例,存在局部最優(yōu)、泛化性較差的缺點(diǎn),究其原因,一個(gè)重要因素是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(包括支持向量機(jī)等)為代表的這類模型本質(zhì)上是一種淺層學(xué)習(xí)結(jié)構(gòu)(即網(wǎng)絡(luò)結(jié)構(gòu)層次較少,如普通神經(jīng)網(wǎng)絡(luò)一般只包含一個(gè)隱層),當(dāng)遇到高維、數(shù)據(jù)量龐大、結(jié)構(gòu)復(fù)雜的數(shù)據(jù)問題時(shí),這類淺層結(jié)構(gòu)算法在刻畫數(shù)據(jù)特征、表達(dá)復(fù)雜函數(shù)方面的能力就非常有限了;但若采用多層網(wǎng)絡(luò)結(jié)構(gòu),系統(tǒng)復(fù)雜性自然增大,采用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法(如 BP 算法),又會(huì)出現(xiàn)梯度消失或梯度爆炸問題,實(shí)際運(yùn)用中還會(huì)產(chǎn)生嚴(yán)重的過擬合問題?;诖?,Hinton 等人(2006a,2006b)提出了深度學(xué)習(xí)的思想來克服上述缺陷,其主要觀點(diǎn)為:1)采用多隱層的深層網(wǎng)絡(luò)結(jié)構(gòu)相比淺層結(jié)構(gòu)更能學(xué)習(xí)刻畫復(fù)雜數(shù)據(jù)的本質(zhì)特征,對(duì)可視化和分類等任務(wù)而言有很大的幫助;2)通過無監(jiān)督的通過逐層初始化(layer-wise pre-training)策略來有效克服深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的困難。由于深度學(xué)習(xí)在處理復(fù)雜數(shù)據(jù)中體現(xiàn)出的優(yōu)異性能使其一問世便受到許多研究者的關(guān)注和重視。近年來,深度學(xué)習(xí)已經(jīng)在圖像分類、多媒體檢索、交通流預(yù)測(cè)、語(yǔ)音處理及疾病診斷等許多領(lǐng)域得到廣泛的運(yùn)用,并且取得了較傳統(tǒng)方法更優(yōu)的效果(焦李成等,2016)。由于金融市場(chǎng)數(shù)據(jù)有復(fù)雜的非線性特征,因此有研究者借鑒其他領(lǐng)域的成功經(jīng)驗(yàn),將深度學(xué)習(xí)引入到金融領(lǐng)域研究中,如 Shen等(2015)、曾志平等(2017)運(yùn)用深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)方法分別對(duì)匯率和股票走勢(shì)特征進(jìn)行分析和預(yù)測(cè);而 Luo 等人(2017)使用信用違約互換(CDS)數(shù)據(jù)對(duì)比了深度信念網(wǎng)絡(luò)(DBN)模型與logistic 回歸、多層感知器以及 SVM 模型的信用評(píng)分效果,發(fā)現(xiàn)DBN 效果最好;Kvamme 等(2018)則利用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)抵押貸款的違約進(jìn)行預(yù)測(cè)。目前,深度學(xué)習(xí)在金融領(lǐng)域當(dāng)中的應(yīng)用和研究主要集中在金融市場(chǎng)運(yùn)動(dòng)的預(yù)測(cè)及相關(guān)交易策略的改進(jìn)與決策分析等方面(蘇治等,2017),在公司信用評(píng)估方面的研究還是比較少的。鑒于上述分析,特別的,由于深度信念網(wǎng)絡(luò)優(yōu)異的對(duì)數(shù)據(jù)本質(zhì)特征學(xué)習(xí)和刻畫能力以及在其他領(lǐng)域的成功運(yùn)用,本文提出一種基于深度信念網(wǎng)絡(luò)的信用評(píng)估研究模型,并將其運(yùn)用在中國(guó)和美國(guó)上市公司的信用評(píng)估實(shí)踐中。

2 深度信念網(wǎng)絡(luò)評(píng)估模型

深度信念網(wǎng)絡(luò)(DBN)是運(yùn)用較廣的一種深度學(xué)習(xí)模型。DBN 由若干個(gè)疊加的受限玻爾茲曼機(jī)(Restricted Boltzmann Machines,RBM)和一個(gè)BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成,其網(wǎng)絡(luò)結(jié)構(gòu)類似于多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),但在訓(xùn)練算法上,DBN 采用了無監(jiān)督的逐層訓(xùn)練方法,克服了傳統(tǒng)的多層神經(jīng)網(wǎng)絡(luò)很難運(yùn)用梯度下降算法進(jìn)行訓(xùn)練的缺陷。由于DBN的主要構(gòu)成基礎(chǔ)是RBM,這里首先介紹RBM,在此基礎(chǔ)上再介紹DBN的具體結(jié)構(gòu)和訓(xùn)練算法。

2.1 受限玻爾茲曼機(jī)

受限玻爾茲曼機(jī)(RBM)可被看成是一個(gè)二分無向圖模型,如圖1所示。V為可視層,含m個(gè)神經(jīng)元(節(jié)點(diǎn)),代表輸入數(shù)據(jù);H為隱含層,含n個(gè)神經(jīng)元,目的是對(duì)輸入數(shù)據(jù)進(jìn)行特征提取,W為可視層與隱含層之間對(duì)稱的連接權(quán)重。并假設(shè)所有節(jié)點(diǎn)都是隨機(jī)二值變量節(jié)點(diǎn)(取 0 或 1),全概率分布p(v,h)滿足Boltzmann 分布。則 RBM的能量函數(shù)定義為:

其中,Wij為可視層節(jié)點(diǎn)i與隱含層節(jié)點(diǎn)j之間的連接權(quán)重,ai為i的偏置,bi為j的偏置,θ={Wij,ai,bi} 代表RBM 中所有的參數(shù)集,當(dāng)確定時(shí),根據(jù)式(1)易得的聯(lián)合分布概率為:

其中,z(θ)=Σv,he-E(v,h|θ)是配分函數(shù),起歸一化因子的作用。因此,對(duì)(2)取邊緣分布,可得 RBM的可視向量分布和隱含向量分布分別為:

圖1 受限玻爾茲曼機(jī)(RBM)結(jié)構(gòu)示意圖Fig.1 Schematic diagram of the restricted Boltzmann machine

根據(jù) RBM 結(jié)構(gòu)可知,可視層和隱含層各節(jié)點(diǎn)的激活狀態(tài)是相互獨(dú)立的,可知在給定可視層向量v時(shí)隱含層節(jié)點(diǎn)j的條件概率以及給定隱含層向量h時(shí)可視層節(jié)點(diǎn)i的條件概率分別為:

其中,為sigmoid 函數(shù),即:

從上分析可看出。RBM 實(shí)際上就是一種隨機(jī)神經(jīng)網(wǎng)絡(luò),其訓(xùn)練是通過迭代方式完成,訓(xùn)練學(xué)習(xí)的目的就是確定參數(shù)θ={wij,ai,bj}的合適值。RBM 一般使用最大似然估計(jì)來找到其隱含層中輸入的隨機(jī)表達(dá)式(潛在特征),即通過最大似然函數(shù)推導(dǎo)參數(shù)θ的更新公式。參數(shù)的更新迭代公式為:

其中,η為學(xué)習(xí)率。上述迭代理論上可采用梯度下降算法來實(shí)現(xiàn),但實(shí)際上梯度很難計(jì)算。因此文獻(xiàn)(Hinton,2006)提出了一種對(duì)比分歧(contrastive divergence,CD)方法來得到各具體參數(shù)的更新公式。對(duì)比分歧法是首先通過一步完全 Gibbs 采樣,利用式(5)更新所有隱含層節(jié)點(diǎn)h,隨后再由式(7)更新所有可視層節(jié)點(diǎn)得到v’,最后再次通過式(5)得到h’。故各參數(shù)更新規(guī)則可由如下公式給出:

2.2 深度信念網(wǎng)絡(luò)及訓(xùn)練算法

2.2.1 模型結(jié)構(gòu)

深度信念網(wǎng)絡(luò)(DBN)是由若干個(gè)RBM堆疊而成的多層信念網(wǎng)絡(luò),圖2為擁有三個(gè)隱含層的DBN的拓?fù)浣Y(jié)構(gòu)示意圖,為簡(jiǎn)潔起見,連接權(quán)重W及偏置a和b并未在圖上標(biāo)示出來:

在上述DBN 結(jié)構(gòu)圖中,第一個(gè)RBM(即RBM1)將輸入作為可視層,其隱含層可被看成是第二個(gè)RBM(即 RBM2)的可視層,RBM2 將學(xué)習(xí) RBM1的隱含層中的特征輸出,并將該輸出作為下一層的輸入,依次類推,每一層從前一隱含層中學(xué)習(xí)抽象出其包含的特征分布,而 RBM1的輸入是整個(gè)網(wǎng)絡(luò)模型的輸入,這樣通過網(wǎng)絡(luò)的不斷堆疊,模型能夠逐層學(xué)習(xí)提取出原始數(shù)據(jù)中更復(fù)雜、更深層次的數(shù)據(jù)特征。而在頂層的BP 網(wǎng)絡(luò)則利用提取的數(shù)據(jù)特征為輸入,進(jìn)行分類或評(píng)估預(yù)測(cè)。

2.2.2 模型訓(xùn)練算法

由于信用評(píng)估本質(zhì)上可以看成是一種判別分類問題,將DBN 用于信用評(píng)估過程中,其充當(dāng)就是一種判別模型角色。然而,DBN 是一個(gè)具有多隱含層的深度神經(jīng)網(wǎng)絡(luò)模型,其權(quán)值參數(shù)的訓(xùn)練是一個(gè)非常困難的任務(wù),若直接采用傳統(tǒng)的梯度算法(如 BP 算法)來訓(xùn)練參數(shù),會(huì)使模型極易陷入局部最優(yōu),另外,隨著深度的增加,梯度的幅度會(huì)急劇減小,導(dǎo)致淺層(靠近輸入層)神經(jīng)元(節(jié)點(diǎn))權(quán)值參數(shù)難以更新,無法有效學(xué)習(xí)。鑒于此,DBN的判別學(xué)習(xí)過程分為兩個(gè)階段來克服上述缺陷:首先利用 RBM 進(jìn)行逐層無監(jiān)督預(yù)訓(xùn)練,然后再利用 BP 反向傳播算法進(jìn)行有監(jiān)督的調(diào)優(yōu),具體過程如下所述。

圖2 深度信念網(wǎng)絡(luò)(DBN)的拓?fù)浣Y(jié)構(gòu)示意圖Fig.2 Schematic diagram of the topology of the deep belief network

第一階段:利用無監(jiān)督的貪心逐層訓(xùn)練算法對(duì)網(wǎng)絡(luò)權(quán)值等參數(shù)進(jìn)行預(yù)處理。最開始先對(duì) RBM1 進(jìn)行訓(xùn)練(具體訓(xùn)練算法可采用前面所述的對(duì)比分歧算法),然后保存訓(xùn)練好的RBM1的權(quán)值和偏置,將 RBM1 隱含層的輸出作為RBM2的輸入,接著同樣方法對(duì) RBM2 進(jìn)行訓(xùn)練,依次類推,分別對(duì)所有的RBM 進(jìn)行訓(xùn)練,實(shí)現(xiàn)了對(duì)DBN 網(wǎng)絡(luò)權(quán)值的預(yù)處理。這種操作可以降低采樣噪聲,更有利于加快網(wǎng)絡(luò)的學(xué)習(xí)速度,這一階段又被稱為預(yù)訓(xùn)練階段(pre-training)。通過無監(jiān)督的貪心逐層訓(xùn)練算法,能夠有效地對(duì)網(wǎng)絡(luò)權(quán)值進(jìn)行預(yù)處理,使權(quán)值參數(shù)獲得一個(gè)較優(yōu)的值。該算法雖然有效,但所求權(quán)值并非最優(yōu),因此往往需要根據(jù)實(shí)際問題進(jìn)行進(jìn)一步微調(diào)。

第二階段:微調(diào)(fine-tune)階段,亦稱調(diào)優(yōu)階段。這一階段是采用 BP 算法對(duì)整個(gè)網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,即在預(yù)訓(xùn)練結(jié)束之后,處在最后的RBM的輸出作為頂層 BP 網(wǎng)絡(luò)的輸入,此時(shí)整個(gè)網(wǎng)絡(luò)參數(shù)已確定(相當(dāng)于已預(yù)先設(shè)定好了網(wǎng)絡(luò)的初始參數(shù)),然后利用帶標(biāo)簽的訓(xùn)練樣本通過 BP 算法對(duì)整個(gè)DBN 網(wǎng)絡(luò)權(quán)值參數(shù)進(jìn)行調(diào)整,直到停止條件滿足為止。

實(shí)際上,預(yù)訓(xùn)練+微調(diào)的做法可看作是將許多參數(shù)分組,對(duì)每組先各自找到局部比較好的位置,然后再基于這些局部較優(yōu)的初步結(jié)果看成一個(gè)整體,從總體上對(duì)其進(jìn)行全局尋優(yōu)。這樣做的結(jié)果大大提高了模型的學(xué)習(xí)能力,改善了模型的泛化能力,提高了其評(píng)估預(yù)測(cè)的效果?;贒BN 模型的整個(gè)信用評(píng)估框架如圖3所示。

3 模型在信用評(píng)估中的應(yīng)用

3.1 樣本數(shù)據(jù)來源及指標(biāo)選擇

3.1.1 樣本數(shù)據(jù)來源

本文選取了我國(guó)上市公司數(shù)據(jù)和在美國(guó)上市的公司數(shù)據(jù)兩個(gè)公開樣本數(shù)據(jù)集,其中我國(guó)公司數(shù)據(jù)來源于wind、同花順財(cái)經(jīng)數(shù)據(jù)庫(kù)及同花順iFinD 數(shù)據(jù)庫(kù),美國(guó)公司數(shù)據(jù)來源于compustat 數(shù)據(jù)庫(kù)。

我國(guó)上市公司數(shù)據(jù)樣本是從 2000至2014年被宣布實(shí)施 ST的公司中(剔出金融行業(yè)以及由于財(cái)務(wù)作假或非財(cái)務(wù)原因被 ST的)選取共 300 家 ST 公司,另外選取同時(shí)期的非 ST 公司樣本 1200 家,共計(jì) 1500個(gè)樣本公司構(gòu)成*(數(shù)據(jù)來源于Wind 數(shù)據(jù)庫(kù)、深圳國(guó)泰安 CSMAR 數(shù)據(jù)庫(kù)和同花順 iFinD 數(shù)據(jù)庫(kù))。假定公司t年被宣布 ST,由于公司t年被宣布 ST和該公司公布t-1年度財(cái)務(wù)報(bào)表幾乎是同時(shí)發(fā)生的,故本文采用了t-2年的數(shù)據(jù)來預(yù)測(cè)t年是否會(huì)被 ST,例如 2012年被宣布 ST的公司,則采用2010年財(cái)務(wù)數(shù)據(jù)來進(jìn)行分析。即中國(guó)公司樣本數(shù)據(jù)共 1500個(gè),其中信用狀況為好的1200個(gè),為差的300個(gè);

類似,美國(guó)公司數(shù)據(jù)樣本也是從 2000至2014年被標(biāo)普公司評(píng)級(jí)過的公司中選取了 1704個(gè)樣本公司,美國(guó)公司被評(píng)級(jí)范圍從 AAA到D 共 10個(gè)等級(jí)(分別為AAA、AA、A、BBB、BB、B、CCC、CC、C和D,其中AA至CCC 級(jí)可用“+”和“-”號(hào)進(jìn)行微調(diào)),為簡(jiǎn)單起見,我們將美國(guó)上市公司也分為好和差兩類,評(píng)級(jí)在AAA+至B-的被視為信用較好企業(yè),評(píng)級(jí)在CCC+到D的被視為信用較差企業(yè)。這樣在1704個(gè)樣本中,基于上述分類,被歸為信用好的樣本為1549個(gè),差的為155個(gè)。

圖3 基于DBN 模型的信用評(píng)估框架示意圖Fig.3 Schematic diagram of credit evaluation framework based onDBN model

我們將這兩個(gè)數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集與測(cè)試集樣本數(shù)量比例關(guān)系大體為65:35,具體來說,中國(guó)公司樣本訓(xùn)練集包含 975個(gè)樣本(占樣本總數(shù)的65%),其中信用類別為好的790個(gè),為差的185個(gè);測(cè)試樣本集為525個(gè)樣本(占樣本總數(shù)的35%),其中信用為好的410個(gè),為差的115個(gè)。美國(guó)公司訓(xùn)練集為1107個(gè)樣本(占樣本總數(shù)的64.96%),其中信用類別為好的1012個(gè),為差的95個(gè);測(cè)試樣本集為597個(gè)樣本(占樣本總數(shù)的35.04%),其中信用為好的537個(gè),為差的60個(gè)。

3.1.2 指標(biāo)選擇及模型參數(shù)選取

本研究在深入分析公司財(cái)務(wù)報(bào)表結(jié)構(gòu)的基礎(chǔ)上,結(jié)合前人的研究,從償債能力、營(yíng)運(yùn)能力、盈利能力、現(xiàn)金流量及發(fā)展能力等方面分析整理了 40個(gè)指標(biāo),具體見表1所示。

由于上述指標(biāo)之間可能存在高度相關(guān)性,本研究基于相關(guān)系數(shù)的變量選擇方法(這里采用了逐步回歸選擇法)分別對(duì)中美公司樣本指標(biāo)進(jìn)行變量篩選,限于篇幅,具體篩選過程就不再贅述(更詳細(xì)的介紹可參看文獻(xiàn)[Falangis et al,2010]),最后篩選結(jié)果如下:中國(guó)公司樣本指標(biāo)共篩選出 10個(gè)指標(biāo),分別是X3,X5,X8,X14,X16,X24,X25,X27,X33和X36;相應(yīng)的,美國(guó)公司樣本指標(biāo)共篩選出 13個(gè)指標(biāo),分別是X1,X8,X9,X10,X13,X18,X21,X24,X26,X29,X33,X34和X40。由于這兩個(gè)樣本集的信用評(píng)估分析過程基本相同,這里以中國(guó)公司樣本集為例來說明基于DBN的信用評(píng)估模型的構(gòu)建過程。

首先對(duì)原始指標(biāo)數(shù)據(jù)做了歸一化處理,歸一化函數(shù)如式(14)所示:

表1 輸入指標(biāo)名稱一覽表Table1 Enter indicator name list

這里,X代表輸入矩陣,maxx和minx分別為X中的最大和最小值,使得輸入向量的值量化到[-1,1]內(nèi)。DBN 模型的構(gòu)建是基于darch 軟件包(Package for Deep Architectures and Restricted Boltzmann Machines)通過 R 語(yǔ)言編程實(shí)現(xiàn)。由上述分析可知,該網(wǎng)絡(luò)模型的輸入層節(jié)點(diǎn)為10;預(yù)訓(xùn)練階段學(xué)習(xí)率η1=0.001,精調(diào)階段學(xué)習(xí)率η2=0.001,隱含層數(shù)及每個(gè)隱含層節(jié)點(diǎn)數(shù)通過試錯(cuò)法確定,分別對(duì)隱含層數(shù)為2、3、4、5 以及隱含層節(jié)點(diǎn)數(shù)為10、20、30、40 時(shí)的共 16 種結(jié)構(gòu)進(jìn)行訓(xùn)練對(duì)比,最終確定采用 3個(gè)隱含層結(jié)構(gòu),每個(gè)隱含層節(jié)點(diǎn)數(shù)為30的網(wǎng)絡(luò)結(jié)構(gòu),因此,該模型結(jié)構(gòu)為一個(gè)10-30-30-30-1的網(wǎng)絡(luò)結(jié)構(gòu);其中,預(yù)訓(xùn)練階段學(xué)習(xí)率η1=0.001,精調(diào)階段學(xué)習(xí)率η2=0.001,其它參數(shù)為darch 包中的默認(rèn)參數(shù),輸出變量為單變量y,即輸出層為一個(gè)節(jié)點(diǎn),若y=1 則代表信用差(ST 公司),y=0 則代表信用好(非 ST 公司)。

3.2 實(shí)證研究結(jié)果

一般來講,模型的檢驗(yàn)是用對(duì)訓(xùn)練樣本和測(cè)試樣本中分類的判定準(zhǔn)確度來表示,尤其是對(duì)訓(xùn)練樣本外的測(cè)試樣本中的判定準(zhǔn)確度更能反映模型的泛化性和預(yù)測(cè)性。故本研究采用I類錯(cuò)誤率、II 類錯(cuò)誤率和總誤判率三個(gè)指標(biāo)作為衡量模型預(yù)測(cè)準(zhǔn)確度的標(biāo)準(zhǔn)。這里第一類錯(cuò)誤指的是將高信用風(fēng)險(xiǎn)(信用差)公司誤判為低信用風(fēng)險(xiǎn)(信用好)公司,即將 ST 公司判為非 ST 公司;第二類錯(cuò)誤指的是將低信用風(fēng)險(xiǎn)(信用好)公司誤判為高信用風(fēng)險(xiǎn)(信用好)公司,即將非ST 公司判為ST 公司;總誤判率指所有被錯(cuò)判的公司數(shù)與樣本公司總數(shù)的比值。此外,為對(duì)比分析,本研究還利用前面文獻(xiàn)所提到的一些經(jīng)典方法,包括 BPNN、Logistic 回歸、SVM、DT(采用 C5.0 算法)及 LDA 等構(gòu)建了相應(yīng)的信用評(píng)估模型,表2為所構(gòu)建的六種模型對(duì)中國(guó)上市公司測(cè)試樣本集的預(yù)測(cè)結(jié)果。

從表2 可看出,所構(gòu)建的六種模型對(duì)測(cè)試樣本集的預(yù)測(cè)結(jié)果總體來看都相當(dāng)不錯(cuò),其中總誤判率最高的為DT 模型,誤判率為8.57%,最低為DBN 模型,誤判率僅為4.38%;從 I 類錯(cuò)誤率指標(biāo)來看,最高仍為DT 模型,誤判率達(dá)到22.41%,而最低為DBN,只有 13.04%,差不多只有 DT 模型的一半;再看 II類錯(cuò)誤率,最高為L(zhǎng)DA 模型,其誤判率為4.89%,最低還是DBN 模型,僅為1.95%;另外,我們對(duì)美國(guó)公司樣本也做了類似地分析研究,表3為六種模型對(duì)美國(guó)公司測(cè)試樣本集的預(yù)測(cè)結(jié)果。

同樣地,從表3 結(jié)果可看出,I 類錯(cuò)誤率最高為DT 模型的23.33%,II 類錯(cuò)誤率最高則為L(zhǎng)DA 模型的5.96%,總誤判率最高為L(zhǎng)DA 模型的6.53%;而DBN 模型在上述三個(gè)指標(biāo)的結(jié)果分別為10.00%、2.05%和2.85%,表現(xiàn)是最好的。綜上可看出,無論是中國(guó)公司樣本集還是美國(guó)公司樣本集,從 I 類錯(cuò)誤率、II 類錯(cuò)誤率及總誤判率這三個(gè)指標(biāo)的表現(xiàn)來看,基于DBN 模型的信用評(píng)估預(yù)測(cè)效果都要遠(yuǎn)優(yōu)于其它五種模型的評(píng)估效果,這也說明本研究所構(gòu)建的DBN 模型相比其他傳統(tǒng)模型的確能更好地挖掘和刻畫出復(fù)雜數(shù)據(jù)背后的特征關(guān)系,從而大大提高模型預(yù)測(cè)的準(zhǔn)確性和可靠性。

表2 六種模型對(duì)中國(guó)上市公司測(cè)試樣本的預(yù)測(cè)誤判結(jié)果對(duì)比Table2 Comparison of prediction results of six models on test samples of listed companies in China

表3 六種模型對(duì)美國(guó)公司測(cè)試樣本的預(yù)測(cè)誤判結(jié)果對(duì)比Table3 Comparison of prediction results of six models for US company test samples

4 結(jié)束語(yǔ)

傳統(tǒng)的信用評(píng)估模型對(duì)信用風(fēng)險(xiǎn)的高維性、非線性等特點(diǎn)處理起來比較困難,在實(shí)際運(yùn)用中往往存在較大誤差,極大影響評(píng)估效果。深度學(xué)習(xí)作為當(dāng)前新興的一種人工智能學(xué)習(xí)算法,由于其在處理復(fù)雜問題、刻畫非線性數(shù)據(jù)特征方面具有其他方法不可比擬的優(yōu)勢(shì),已經(jīng)受到各方面廣泛關(guān)注,并取得不錯(cuò)的應(yīng)用效果。鑒于此,本研究在分析深度學(xué)習(xí)算法的基礎(chǔ)上,首先通過變量選擇方法將高維信用變量降維,然后采用深度信念神經(jīng)網(wǎng)絡(luò)(DBN)構(gòu)建了基于DBN的信用評(píng)估模型。通過在兩個(gè)公開樣本集(中國(guó)公司樣本集和美國(guó)公司樣本集)的實(shí)際驗(yàn)證,相比其它 5個(gè)經(jīng)典模型,實(shí)證結(jié)果顯示,基于DBN的信用評(píng)估模型在I 類錯(cuò)誤率、II 類錯(cuò)誤率和總誤判率三個(gè)指標(biāo)上都要好于其它 5 種對(duì)比模型,說明了基于深度學(xué)習(xí)方法構(gòu)建信用評(píng)估模型的有效性和可靠性,該研究成果也為探索和豐富符合信用評(píng)估管理方法提供了一些借鑒和參考。

猜你喜歡
信用神經(jīng)網(wǎng)絡(luò)深度
深度理解一元一次方程
為食品安全加把“信用鎖”
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
信用收縮是否結(jié)束
深度觀察
深度觀察
深度觀察
信用中國(guó)網(wǎng)
信用消費(fèi)有多爽?
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
阜康市| 和林格尔县| 灵台县| 扬中市| 洮南市| 高雄县| 吴川市| 望江县| 咸阳市| 五指山市| 永吉县| 昌吉市| 洛宁县| 静宁县| 左云县| 金门县| 长泰县| 政和县| 梁山县| 浦北县| 天门市| 郑州市| 遂昌县| 东山县| 海林市| 依安县| 额济纳旗| 精河县| 易门县| 潮州市| 阜新市| 柳江县| 喀什市| 安陆市| 麟游县| 苏尼特左旗| 博野县| 宁安市| 乌兰察布市| 临邑县| 保靖县|