唐向紅 饒雷 陸見(jiàn)光
摘 要:解決互聯(lián)網(wǎng)融資時(shí)的項(xiàng)目數(shù)量多,每個(gè)融資項(xiàng)目中所包含的特征數(shù)量較多,但是可用于項(xiàng)目評(píng)價(jià)的評(píng)價(jià)特征少,篩選出相關(guān)特征而且要做到精確評(píng)估是互聯(lián)網(wǎng)融資項(xiàng)目評(píng)估問(wèn)題的關(guān)鍵。本文提出了利用神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行大數(shù)據(jù)下的融資項(xiàng)目評(píng)估。實(shí)驗(yàn)結(jié)果表明,神經(jīng)網(wǎng)絡(luò)很適合處理互聯(lián)網(wǎng)融資項(xiàng)目評(píng)估,能夠很準(zhǔn)確地對(duì)融資項(xiàng)目進(jìn)行評(píng)價(jià)。
關(guān)鍵詞:融資項(xiàng)目評(píng)估;大數(shù)據(jù);神經(jīng)網(wǎng)絡(luò)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,國(guó)內(nèi)的互聯(lián)網(wǎng)融資也得到了飛速發(fā)展,創(chuàng)新模式層出不窮,打破了以往單一的融資渠道,對(duì)小微企業(yè)、個(gè)體創(chuàng)業(yè)者和普通百姓開(kāi)辟了一條快捷的融資渠道。相對(duì)于傳統(tǒng)融資,資金供求雙方不再是一對(duì)一而是一對(duì)多或者是多對(duì)多的融資形式,融資效率要比傳統(tǒng)融資高許多。
國(guó)內(nèi)關(guān)于項(xiàng)目評(píng)估的研究成果有很多,但是大多集中于風(fēng)險(xiǎn)投資項(xiàng)目評(píng)估,如潘雄鋒等提出了基于主成分分析的風(fēng)險(xiǎn)投資項(xiàng)目評(píng)估模型;于冬提出的基于BP神經(jīng)網(wǎng)絡(luò)的風(fēng)險(xiǎn)投資評(píng)估模型;楊哲,顧鋒提出的價(jià)值工程在風(fēng)險(xiǎn)投資項(xiàng)目評(píng)估中成本優(yōu)化的應(yīng)用;陳盛雙,袁正科等人提出的風(fēng)險(xiǎn)投資項(xiàng)目評(píng)估模型研究。然而投資和融資在本質(zhì)上有所不同,投資指的是特投資者為了在未來(lái)的某個(gè)時(shí)期獲得收益或是資金增值,在一段時(shí)間里向某個(gè)目標(biāo)領(lǐng)域投入足夠的資金和物資的經(jīng)濟(jì)行為;融資是指為支付超過(guò)現(xiàn)有購(gòu)買(mǎi)力的購(gòu)貨貸款而進(jìn)行的交易手段,或?yàn)槿〉觅Y產(chǎn)而集資所采取的貨幣手段,所以投資項(xiàng)目評(píng)估模型不能很好適用于融資項(xiàng)目評(píng)估,尤其是互聯(lián)網(wǎng)融資項(xiàng)目。
對(duì)于融資雙方都需要面對(duì)決策問(wèn)題,現(xiàn)在的各種互聯(lián)網(wǎng)融資平臺(tái)都存在著許多融資主體無(wú)法按時(shí)得到自己想要的資金,也有融資主體通過(guò)股聯(lián)網(wǎng)融資平臺(tái)騙取資金或者不按時(shí)歸還投資人的本金和利息。本文利用神經(jīng)網(wǎng)絡(luò)進(jìn)行大數(shù)據(jù)分析對(duì)融資項(xiàng)目進(jìn)行初步判斷,這樣給融資人能不能按時(shí)獲得資金以及投資人能不能按時(shí)收到本金和利息提供一個(gè)參考。
一、融資項(xiàng)目評(píng)估方法
每一個(gè)互聯(lián)網(wǎng)融資項(xiàng)目所包含的特征是非常多的,如果直接將所有特征輸入到神經(jīng)網(wǎng)絡(luò)會(huì)使神經(jīng)網(wǎng)絡(luò)的訓(xùn)練變得復(fù)雜,所以要對(duì)融資項(xiàng)目中包含的原始特征進(jìn)行一定的篩選,對(duì)特征進(jìn)行篩選的好處是可以降低特征的空間維數(shù)提高分類(lèi)器的分類(lèi)精度和泛化性能。因?yàn)檠蛉盒?yīng)能夠反映大眾的投資心理,通過(guò)對(duì)數(shù)據(jù)的簡(jiǎn)單統(tǒng)計(jì)分析發(fā)現(xiàn)羊群效應(yīng)同樣適合互聯(lián)網(wǎng)融資,所以本文利用羊群效應(yīng)將一些直接影響融資項(xiàng)目和與融資項(xiàng)目相關(guān)性較大的特征篩選出來(lái)作為后面用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的特征,比如借款人愿意償還的最大利率這個(gè)特征,貸款人即使知道這個(gè)融資項(xiàng)目的風(fēng)險(xiǎn)高但是他們還是愿意投資這種利率高的融資項(xiàng)目。因?yàn)锽P神經(jīng)網(wǎng)絡(luò)具有非線(xiàn)性映射、聯(lián)想記憶、自主學(xué)習(xí)的特點(diǎn),所以選擇BP神經(jīng)網(wǎng)絡(luò)作為融資項(xiàng)目評(píng)估的分類(lèi)器。
二、基于BP神經(jīng)網(wǎng)絡(luò)融資項(xiàng)目評(píng)估模型的構(gòu)建
1.BP神經(jīng)網(wǎng)絡(luò)概述
BP神經(jīng)網(wǎng)絡(luò)的基本思想是誤差反向傳播算法,樣本從輸入層正向傳播,輸出信號(hào)與期望的輸出目標(biāo)產(chǎn)生的誤差從輸出層向輸入層傳播,輸入層和輸出層之間是一層或者多層隱含層(圖1),誤差信號(hào)不斷對(duì)各隱含層的權(quán)值進(jìn)行修正,權(quán)值的修正過(guò)程就是BP神經(jīng)網(wǎng)絡(luò)的自我學(xué)習(xí)過(guò)程直到輸出與期望值誤差達(dá)到允許的范圍,BP神經(jīng)網(wǎng)絡(luò)達(dá)到穩(wěn)定停止迭代。BP神經(jīng)網(wǎng)絡(luò)適合處理非線(xiàn)性的問(wèn)題,本文對(duì)于融資項(xiàng)目的評(píng)估屬于非線(xiàn)性問(wèn)題,而且BP神經(jīng)網(wǎng)絡(luò)對(duì)于大數(shù)據(jù)的處理要好過(guò)其他分類(lèi)模型。
2.樣本選取本
文選用的數(shù)據(jù)集是來(lái)自美國(guó)在線(xiàn)借貸平臺(tái)Prosper①,鑒于本文研究的問(wèn)題,只抽取了數(shù)據(jù)集中的Listings部分,總共提取出411847個(gè)樣本數(shù)據(jù)。
3.指標(biāo)選取
在每個(gè)樣本數(shù)據(jù)中記錄著56種特征,其中有一些信息是空白還有一些是平臺(tái)沒(méi)有展示隱私信息,經(jīng)過(guò)對(duì)樣本中56種特征的篩選,最后選擇出7種特征Amount Requested,Borrower Maximum Rate,Debt To Income Ratio,Category, Credit Grade, Is Borrower Home Owner, Status(各個(gè)特征所代表的含義如表1所示)。
根據(jù)表1中所描述的七種特征的含義,本文用Status作為樣本的標(biāo)簽,Status中所包含的特征以及對(duì)應(yīng)的樣本數(shù)量如表2所示。
表2中Withdraw表示借款人自己撤回了自己在Prosper平臺(tái)上發(fā)布的借款項(xiàng)目,Active表示借款項(xiàng)目依然在融資過(guò)程中,這兩個(gè)狀態(tài)特征無(wú)法作為樣本的標(biāo)簽,所以刪除狀態(tài)特征是Withdraw和Active對(duì)應(yīng)的樣本。從表1中可以看出負(fù)樣本(借款項(xiàng)目的狀態(tài)為Expired和Cancelled)個(gè)數(shù)為225859個(gè),數(shù)目遠(yuǎn)遠(yuǎn)大于正樣本(借款項(xiàng)目的狀態(tài)為Completed和Pending Completion)的個(gè)數(shù),為了防止在訓(xùn)練模型的時(shí)候,由于正負(fù)樣本的數(shù)目差距過(guò)大而導(dǎo)致模型的訓(xùn)練結(jié)果偏向負(fù)樣本這一方,所以本文在后續(xù)的模型訓(xùn)練之前隨機(jī)抽取了與正樣本個(gè)數(shù)相同的負(fù)樣本組成一個(gè)原始樣本。
4.模型訓(xùn)練和測(cè)試
將提取到的訓(xùn)練樣本中的80%作為訓(xùn)練集20%作為測(cè)試集,輸入到BP神經(jīng)網(wǎng)絡(luò)中對(duì)模型進(jìn)行訓(xùn)練優(yōu)化各層神經(jīng)元之間的權(quán)重和偏差。將樣本進(jìn)行100次迭代,樣本每迭代5次打印一次訓(xùn)練精度,測(cè)試精度和損失值(圖2)。
圖中紅點(diǎn)代表訓(xùn)練精度,藍(lán)點(diǎn)代表測(cè)試精度,黃點(diǎn)代表?yè)p失值。從結(jié)果圖中可以看出,BP神經(jīng)網(wǎng)絡(luò)對(duì)于處理這種非線(xiàn)性的問(wèn)題可以達(dá)到很高的精度,通100次的迭代,訓(xùn)練集的精度最終達(dá)到了99%而且測(cè)試精度達(dá)到了93.4%。
出現(xiàn)這種結(jié)果有如下兩個(gè)原因:第一是因?yàn)楸疚膹脑紭颖局械?6個(gè)特征中挑選出了7個(gè)特征,大大地降低了樣本的空間維度,使模型的收斂速度更快;第二是本文將被挑選出的7個(gè)樣本中選擇Status作為樣本的標(biāo)簽,由于其余6個(gè)特征的與Status的相關(guān)性很強(qiáng),所以能夠達(dá)到很高的測(cè)試精度。所以當(dāng)樣本的數(shù)量較多時(shí),進(jìn)行合適的特征選擇,應(yīng)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行項(xiàng)目評(píng)估不僅模型的收斂速度快而且準(zhǔn)確率還很高。
三、結(jié)語(yǔ)
本文利用BP神經(jīng)網(wǎng)絡(luò)對(duì)借貸項(xiàng)目的成功性進(jìn)行了評(píng)價(jià),通過(guò)這種方法可以在借款人在平臺(tái)發(fā)起借款項(xiàng)目前和貸款人在進(jìn)行罰款前提供一個(gè)有效規(guī)避風(fēng)險(xiǎn)的評(píng)價(jià)標(biāo)準(zhǔn),可以使借款人能夠及時(shí)籌集到資金,也讓貸款人能后及時(shí)收到本金和利息。BP神經(jīng)網(wǎng)絡(luò)自身具有的強(qiáng)學(xué)習(xí)性,自適應(yīng)性與容錯(cuò)性等特點(diǎn)可以與項(xiàng)目評(píng)價(jià)有效地結(jié)合,給項(xiàng)目評(píng)估問(wèn)題提供了一個(gè)新的途徑。
實(shí)際中的項(xiàng)目評(píng)估是具有一定復(fù)雜性的工作,需要考慮的因素有很多,在BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用過(guò)程中,為了使模型有好的評(píng)估效果需要合理的選取用于項(xiàng)目評(píng)估的特征。本文的項(xiàng)目評(píng)估和實(shí)際的項(xiàng)目評(píng)估存在一定的偏差,只能為實(shí)際的項(xiàng)目評(píng)估提供一些想法和思路。
注釋?zhuān)?/p>
①原始數(shù)據(jù)網(wǎng)址:https://www.prosper.com。
參考文獻(xiàn):
[1]翁鍵敏,鄭良琳.我國(guó)互聯(lián)網(wǎng)融資發(fā)展及監(jiān)管路徑探析[J].福建金融,2014,(11):18-23.
[2]胡艾琳,羅真怡,孫舒宜,杜家豪,張麗麗.互聯(lián)網(wǎng)融資風(fēng)險(xiǎn)分析及規(guī)避[J].經(jīng)濟(jì)師,2016,(6):83-87.
[3]潘雄鋒,劉鳳朝,王元地.基于主成分分析方法的風(fēng)險(xiǎn)投資項(xiàng)目評(píng)估模型[J].科技進(jìn)步與對(duì)策,2004,(3):65-67.
[4]于冬.基于BP神經(jīng)網(wǎng)絡(luò)的風(fēng)險(xiǎn)投資評(píng)估模型[J].科技管理研究,2005,(9):206-208.
[5]楊哲,顧鋒.價(jià)值工程在風(fēng)險(xiǎn)投資項(xiàng)目評(píng)估中成本優(yōu)化的應(yīng)用[J].價(jià)值工程,2016,(8):24-25.
[6]陳盛雙,袁正科,王平安.風(fēng)險(xiǎn)投資項(xiàng)目評(píng)估模型研究[J].價(jià)值工程,2008,(9):151-152.
[7]姚旭,王曉丹,張玉璽,權(quán)文.特征選擇方法綜述[J].控制與決策,2012,27(2):161-166.
[8]Simla Ceyhan,Xiaolin Shi,Jure Leskovec. Dynamics of Bidding in a P2P Lending Service:Effects of Herding and Predicting Loan Success[C].New York:ACM Press,2011:547-556.
[9]韓立群.人工神經(jīng)網(wǎng)絡(luò)理論、設(shè)計(jì)及應(yīng)用[M].2版.北京:化學(xué)工業(yè)出版社,2007:38-67.
[10]齊振國(guó),楚秦東.基于BP神經(jīng)網(wǎng)絡(luò)的項(xiàng)目評(píng)估模型研究[J].沈陽(yáng)師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,28(1):109-112.
[11]高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例[M].北京,機(jī)械工業(yè)出版社,2005:55-56.