張穎+黃潔婷+賀正楚
摘要:針對P2P網(wǎng)貸平臺現(xiàn)金流較大、利潤率較低和財務(wù)數(shù)據(jù)獲取困難的特點,構(gòu)建基于平臺交易真實數(shù)據(jù)的危機預(yù)警評價指標體系和組合預(yù)測模型。將傳統(tǒng)的財務(wù)評價指標轉(zhuǎn)換成網(wǎng)貸平臺交易數(shù)據(jù)指標,運用鄰域粗糙集屬性約簡的方法對采集的數(shù)據(jù)指標進行降噪和約減處理,再基于機器學習理論引入神經(jīng)網(wǎng)絡(luò)、支持向量機和Logit回歸等模型對數(shù)據(jù)進行訓練。通過分組進行單模型和組合模擬預(yù)測,提高了新的破產(chǎn)指標下各模型預(yù)測的準確率。
關(guān)鍵詞: P2P網(wǎng)貸;危機預(yù)警;組合模型;神經(jīng)網(wǎng)絡(luò);支持向量機
中圖分類號:F832;F424文獻標識碼:A文章編號:10037217(2017)06002306
一、導(dǎo)論
P2P網(wǎng)貸平臺作為一個新興的個人對個人的投資借貸平臺正處在一個快速成長階段,現(xiàn)有監(jiān)管大多為事后監(jiān)管,對于事前預(yù)測特別是基于網(wǎng)貸平臺外部數(shù)據(jù)的科學預(yù)測理論和應(yīng)用準備不足\[1\]。網(wǎng)貸平臺具有擠兌風險,貸款逾期發(fā)生時,P2P網(wǎng)貸平臺會出現(xiàn)暫時的流動性不足,一旦放款人之間協(xié)調(diào)失敗就會導(dǎo)致平臺出現(xiàn)擠兌風險[2,3]。P2P網(wǎng)貸平臺陷入經(jīng)營困境的整個過程是動態(tài)發(fā)生的,若能在P2P平臺陷入經(jīng)營困境早期就發(fā)現(xiàn)征兆,并能預(yù)測生存狀況惡化的一系列動態(tài)過程,這對于平臺的經(jīng)營者、投資者和行業(yè)監(jiān)管者,都將有著非凡的意義。
現(xiàn)有文獻當中,潘莊晨等梳理債權(quán)產(chǎn)品和產(chǎn)權(quán)產(chǎn)品的信用風險評價模型,認為互聯(lián)網(wǎng)金融企業(yè)更加適合偏重定價功能的產(chǎn)權(quán)產(chǎn)品風險評價模型\[4\];周少甫對2 193家網(wǎng)貸平臺使用Logit模型進行研究,認為網(wǎng)貸平臺能夠提供良好的資金保障、具備健全的資金托管制度和流動性較高的債權(quán)轉(zhuǎn)讓方式,可有效降低平臺出現(xiàn)重大經(jīng)營問題\[5\]。常用的風險預(yù)警模型主要有多元判別分析、Logistic回歸模型、神經(jīng)網(wǎng)絡(luò)、FR模型、STV截面回歸模型和KLR信號分析模型等。由于Logistic回歸模型對變量的分布、變量之間的協(xié)方差沒有過多的假設(shè)要求,因此被廣泛用在信用風險預(yù)警,且國外的許多研究都表明Logistic回歸模型比較有效\[6,7\]。龐素林等利用Logistic回歸模型構(gòu)建風險預(yù)警模型,并以實證研究證明模型的高效性\[8-10\]。
現(xiàn)有文獻對P2P平臺經(jīng)營困境的預(yù)警研究較少,具有一定的研究價值。本文主要研究通過使用最新的前沿信息技術(shù),構(gòu)建科學的評價體系和危機預(yù)警模型,識別問題網(wǎng)貸平臺,預(yù)測P2P網(wǎng)貸平臺的危機風險。
二、P2P網(wǎng)貸平臺危機預(yù)警指標選擇與約簡
本文針對P2P網(wǎng)貸平臺的特點,提出基于真實交易數(shù)據(jù)的評價思路,以交易數(shù)據(jù)代替財務(wù)數(shù)據(jù)保證數(shù)據(jù)真實性。一方面,從理論基礎(chǔ)、國內(nèi)外文獻及國內(nèi)主管部門監(jiān)管指導(dǎo)意見選擇能反映P2P網(wǎng)貸平臺運營和風險的相關(guān)指標;另一方面,根據(jù)P2P網(wǎng)貸平臺所具有的互聯(lián)網(wǎng)大數(shù)據(jù)特性,通過業(yè)內(nèi)門戶網(wǎng)站、網(wǎng)貸之家、網(wǎng)貸天眼收集。同時,將數(shù)據(jù)指標進行科學處理,并對結(jié)果進行檢驗,從而盡可能的保證風險評價指標的科學性、可信性。力求用最少的可觀測指標,盡量多的反映平臺運營風險信息。
(一)危機預(yù)警原始評價指標選擇
本文將能夠觀測到的P2P網(wǎng)貸平臺微觀指標納入評價范圍,盡量確保評價指標的完整性。使用的各項指標數(shù)據(jù)來源于P2P網(wǎng)貸平臺第三方統(tǒng)計
網(wǎng)站,所有數(shù)據(jù)都能夠做到逐月更新,其中大多數(shù)數(shù)據(jù)能夠做到逐日更新,保證了經(jīng)過建模處理過的風險值能夠每月(每日)連續(xù)輸出。在數(shù)據(jù)采集過程中,抓取的信息包括:平臺每日成交量、平均利率、投資人數(shù)、平均貸款期限、借款人數(shù)、累計待還金額等指標作為破產(chǎn)預(yù)測的客觀抓取指標,如表1所示。
(二)單個預(yù)測及組合模型預(yù)測
1.Logit回歸預(yù)測。
根據(jù)上文的模型介紹,應(yīng)用IBM SPSS Statistics V21.0中的二元Logistic回歸預(yù)測進行分析,將80個選定的模擬樣本錄入SPSS工作表格中,10個指標屬性值為協(xié)變量,問題情況(即前文提及的決策屬性,問題取值為1,正常取值為0)作為因變量。用EXCEL編輯函數(shù)來計算概率P,并最終計算得出Logit模型預(yù)測結(jié)果的準確率,如表5所示。
由表5可以看出,經(jīng)過測試樣本的檢驗,所建立的Logit回歸模型總體預(yù)測準確率僅為56.98%,這個水平屬于偏低的預(yù)測正確率,這個正確率還有很大的水平可以提高,因此,此Logit模型不是一個理想的預(yù)測模型。
2.神經(jīng)網(wǎng)絡(luò)預(yù)測。
運用SPSS 軟件中的BP神經(jīng)網(wǎng)絡(luò)的多層感知器預(yù)測方法來實現(xiàn)P2P平臺問題與否的預(yù)測工作。選用樣本的原則與上文一致,即選擇80個樣本為模擬樣本,86個樣本為測試樣本,共166個樣本。模型訓練完成后,生成的神經(jīng)網(wǎng)絡(luò)模型對測試樣本數(shù)據(jù)測試后與實際比較的結(jié)果正確率如表6所示。
從H表中可以看出對于P2P實際出現(xiàn)問題的正確率為73.2%,而P2P實際運行正常的正確率為64.4%,綜合正確率為68.6%,預(yù)測結(jié)果較Logit回歸預(yù)測準確率高,但仍然有很大的提高空間。
3.支持向量機預(yù)測。
已有研究表明,高斯核函數(shù)支持向量機模型的預(yù)測準確率最高,而核函數(shù)的選擇是構(gòu)建支持向量機模型的關(guān)鍵[14],因此高斯核函數(shù)被本文采用。通過對數(shù)據(jù)結(jié)果的比較,當高斯核函數(shù)的閾值δ2=0.7時,支持向量機程序的準確率最高。利用libsvm工具箱在MATLAB2014a中運行得出檢測樣本的實際預(yù)測結(jié)果如表7所示。
由表7可以看出,經(jīng)過測試樣本的檢驗,支持向量機總體預(yù)測準確率為68.6%,介于Logit回歸分析預(yù)測的準確率和BP神經(jīng)網(wǎng)絡(luò)預(yù)測的準確率之間,同樣不是很理想。
(三)基于貝葉斯算法的投票式組合預(yù)測
通過上面的分析,根據(jù)上述三種模型的預(yù)測結(jié)果,結(jié)合上文中的方法,應(yīng)用EXCEL得到基于貝葉斯算法的投票式組合endprint
由表8可知,基于貝葉斯算法的投票式組合預(yù)測中只有13個預(yù)測錯誤,其中 P2P問題平臺只有5個預(yù)測錯誤,而且問題平臺與正常平臺的預(yù)測之間并沒有顯示出明顯的差異。
上文所述的三種預(yù)測模型各有其優(yōu)缺點,其預(yù)測結(jié)果準確率也有較大差異,Logit模型預(yù)測為傳統(tǒng)統(tǒng)計模型,而神經(jīng)網(wǎng)絡(luò)和支持向量機應(yīng)用人工智能和機器學習等新興的學習方法進行預(yù)測分析,對比各模型準確率,如表9所示。
由表9可以看出,傳統(tǒng)統(tǒng)計模型Logit模型的預(yù)測準確率最低,其次為支持向量機預(yù)測方法,而預(yù)測準確率最高的為BP神經(jīng)網(wǎng)絡(luò),從這一結(jié)果可以看出人工智能領(lǐng)域預(yù)測方法的優(yōu)勢之處,傳統(tǒng)的統(tǒng)計模型因其多個弊端無法準確預(yù)測數(shù)據(jù)的正確率。而結(jié)合三種預(yù)測方法的投票式組合預(yù)測方法在本文的應(yīng)用過程中發(fā)揮其優(yōu)勢,綜合了三種預(yù)測模型的利弊,得出相對較好的準確率,且穩(wěn)定性良好。
五、結(jié)論
本文針對當前P2P網(wǎng)貸平臺內(nèi)部財務(wù)信息不透明的現(xiàn)狀及政府、投資者對網(wǎng)貸平臺風險評估預(yù)測的現(xiàn)實需要之間的矛盾,創(chuàng)新性地提出基于網(wǎng)貸平臺公開交易數(shù)據(jù)的危機預(yù)警新方法,通過運用數(shù)據(jù)采集、去噪技術(shù),結(jié)合支持向量機、神經(jīng)網(wǎng)絡(luò)等機器學習方法進行數(shù)據(jù)訓練,得到了較好的預(yù)測結(jié)果。通過研究,得到以下結(jié)論:
1.構(gòu)建了基于網(wǎng)貸平臺公開交易數(shù)據(jù)的危機預(yù)警指標體系。論文在直接抓取的數(shù)據(jù)中選取平臺每日成交量、平均利率、投資人數(shù)、平均貸款期限、借款人數(shù)、累計待還金額等指標作為危機預(yù)警的指標,通過領(lǐng)域粗糙集進行指標約簡后得到相應(yīng)指標體系;
2.結(jié)合機器學習技術(shù),對選擇的P2P網(wǎng)貸平臺變量和數(shù)據(jù)進行約簡、建模、預(yù)測。本文選取了三個準確率較高的模型:Logit回歸,神經(jīng)網(wǎng)絡(luò)和支持向量機模型。采用分別建立相應(yīng)的模型,并將采集的數(shù)據(jù)在預(yù)處理后分別代入各單一個模型,以檢測各模型的效果,最后將三個模型的實際輸出結(jié)果作為輸入,結(jié)合貝葉斯算法構(gòu)建投票式組合預(yù)測模型,使各模型之間可以相互補充,提高預(yù)測的精度和穩(wěn)定性。
3.對166家主流P2P網(wǎng)貸平臺進行實證研究。通過跟蹤采集“網(wǎng)貸之家”等P2P監(jiān)測網(wǎng)站交易數(shù)據(jù)組成模擬樣本進行模擬和測試,驗證本文提出的P2P網(wǎng)貸平臺危機預(yù)警新方法的準確性。從預(yù)測結(jié)果來看,采用本文提出的P2P網(wǎng)貸平臺危機預(yù)警新指標體系,結(jié)合組合式預(yù)測模型,能得到較好的預(yù)測效果。
參考文獻:
[1]肖萍.互聯(lián)網(wǎng)金融與中小企業(yè)融資困境的化解途徑\[J\].河南師范大學學報(哲學社會科學版),2015(4):77-80.
\[2\]蔣玉.互聯(lián)網(wǎng)金融的特殊風險和法律規(guī)制\[J\].廣西財經(jīng)學院學報,2015(4):41-46.
\[3\]朱寶.普惠金融體系下互聯(lián)網(wǎng)金融風險溢出效應(yīng)研究\[J\].廣西財經(jīng)學院學報,2017(1):78-85.
\[4\]潘莊晨,邢博,范小云.信用風險評價模型綜述及對我國P2P網(wǎng)絡(luò)借貸平臺的借鑒\[J\].現(xiàn)代管理科學,2015(1):33-36.
\[5\]周少甫,李逸翔,裴逸杰.P2P網(wǎng)貸平臺資信因素對正常經(jīng)營影響的實證分析\[J\].武漢金融,2016(1):34-36.
\[6\]Vijayakumar P, Naresh R,Deborah L J,et al.An efficient group key agreement protocol for secure P2P communication\[J\].Security and Communication Networks,2016(9):3952-3965.
\[7\]Khan U,SchmidtThieme L,Nanopoulos A.Collaborative SVM classification in scalefree peertopeer networks\[J\].Expert Systems with Applications,2017(1):74-86.
\[8\]龐素琳.Logistic回歸模型在信用風險分析中的應(yīng)用\[J\].數(shù)學的實踐與認識,2006,36(9):129-137.
\[9\]盧永艷.基于面板數(shù)據(jù)的上市公司財務(wù)困境預(yù)測\[D\].大連:東北財經(jīng)大學,2012.
\[10\]陳曉蘭,任萍.基于Logistic混合模型的企業(yè)信用風險評價研究\[J\].山東財政學院學報,2011(2):90-93.
\[11\]王錦虹.互聯(lián)網(wǎng)金融對商業(yè)銀行盈利影響測度研究——基于測度指標體系的構(gòu)建與分析\[J\].財經(jīng)理論與實踐,2015,36(1):7-12.
\[12\]Rogers Chris,Clarke Chris. Mainstreamingsocialfinance:the regulation of the peertopeer lending marketplace in the United Kingdom\[J\].British Journal of Poliltics & International Relations,2016(18):930-945.
\[13\]Pokorna Martina, Sponer Miroslav. Social lending and its risks\[J\].19th International Conference Enterprise and Competitive Environment,2016(20):330-337.
\[14\]Khan U,SchmidtThieme L,Nanopoulos A. Collaborative SVM classification in scalefree peertopeer networks\[J\].Expert Systems with Applications,2017(1):74-86.
\[15\]王效俐,劉瀟,蘇強.鄰域粗糙集融合貝葉斯神經(jīng)網(wǎng)絡(luò)在醫(yī)療決策中的應(yīng)用研究\[J\].工業(yè)工程與管理,2016(5):141-147.
(責任編輯:鐘瑤)
Abstract: Based on the characteristics of assetlight, large cash flow, low profit and difficulty in financial data acquisition, evaluation index system and the combination prediction model for crisis prediction based on the real data of platform transaction were constructed. The traditional bankruptcy financial evaluation index was transformed into the net loan transaction data index and the collected data was reduced by the method of neighborhood rough set. On this basis, the data was trained with the machine learning theory which introduced neural network and support vector, logit regression machine model and so on. Finally, the data was divided into single group and combination group for predictive simulation and the accuracy of each model under the new bankruptcy index was obtained.
Key words:P2P; crisis prediction; combination prediction model; neural network; SVMendprint