徐喆
(南京證券股份有限公司,江蘇南京 210008)
邏輯回歸模型在互聯網金融P2P業(yè)務信用風險的應用
徐喆
(南京證券股份有限公司,江蘇南京 210008)
隨著互聯網金融在我國蓬勃發(fā)展,個人借助互聯網金融平臺P2P展開的信貸業(yè)務也在不斷地擴展。在極大地方便了客戶,提高了互聯網金融公司收入的同時,個人信貸違約事件也越來越引起互聯網金融行業(yè)的重視。本文運用Logit和Probit模型,對個人信貸業(yè)務的違約風險相關因素進行量化分析研究。
互聯網金融;個人信貸;Logit模型;Probit模型
信用風險是指借款人、證券發(fā)行人或交易對手因某些原因不愿或無力履行合同而構成違約,使銀行、投資者或交易對手遭受損失的可能性。信用風險還包括由于履約能力的變化引起的損失的可能性。因此信用風險的大小主要取決于客戶的財務狀況和風險狀況。
2010年后,互聯網金融個人借貸P2P(Peer to Peer)業(yè)務平臺初露鋒芒。2012年后,互聯網P2P業(yè)務進入全面爆發(fā)期,一年后,更是以每天1到2家業(yè)務平臺的驚人速度發(fā)展。互聯網金融極大地提高借貸人與收款人之間的資金對接率,部分解決了個人的投融資困難的問題,并推動了我國金融體制的改革。但是,P2P最難的地方就在信用風險控制。很多平臺沒有相應資質或者經驗,審查材料不嚴,導致大量資信不良的個人成功借貸。有些還是大數額的貸款。這種情況導致平臺累積了許多不良借貸,大量的貸款人逾期不能還款,貸款無法按時收回。再加上平臺本身的資本不夠雄厚,無法承受大量的逾期貸款,導致平臺無法正常運行。
在借貸業(yè)務中,個人信用的不確定性包括外在不確定性和內在不確定性兩種。外在不確定性來自于客戶以外,是整體外在經濟運行過程中隨機性、偶然性的變化。內在不確定性來源于客戶自身原因,它是由行為人主觀決策及獲取信息的不充分性等原因造成的,帶有明顯的個人特征。
我國互聯網金融相關機構企業(yè)急需對個人信貸的信用風險展開研究,特別是借貸人的違約可能性。本文采用了兩種邏輯回歸模型:Logit模型和Probit模型,對個人信用數據進行了量化實證分析;并對兩種模型進行了比較。
用Logit模型解決借貸人的信用風險問題最早是由Wiginton在1980年提出,他認為該模型能夠取得比判別分析分更好的效果。Steenackers和Govaerts在1989年對Logit模型做了后續(xù)的應用研究。在2004年,Cramer則對Logit模型的幾個變種進行了研究。Logit模型的因為其前提假設少,穩(wěn)定性高的優(yōu)點而被廣泛運用。Probit模型和Logit模型原理相似,最早由Grablowsky和Talley在1981年使用在信用風險評價模型里,他們得出了該模型比多元判別分析效果更好的結論。綜合各個論文的結論來看,究竟是哪一種模型更好,學者們并沒有得出統(tǒng)一的結論。主要的原因,一是實證的數據差異比較大,二是研究者們采用的模型結構參數有區(qū)別。
本文數據由個人信貸數據庫組成,一共2000個樣本。分為因變量和自變量。
在因變量中,0代表客戶違約,1代表客戶沒有違約。使用Logit和Probit模型進行估計,先建立如下由一個潛在變量方程和遵循邏輯分布的擾動項組成的模型:
概率函數為:
帶入普通對數似然函數
做關于的導數
(一)Logit模型
Logit模型可以由一個潛在變量方程和遵循邏輯分布的擾動項組成:
和密度函數:
Kotz(1970b:Chapter 22)。
(二)Probit模型
和Logit模型相同,Probit模型可以由一個潛在變量方程和遵循邏輯分布的擾動項組成:
同Logit模型,得到下列等式:
Logit模型和Probit模型之間最主要的差別在于對關于的假設,但Logit模型較Probit模型在個人信用評分領域的試用也要廣泛得多,這是由于邏輯分布函數形式簡單,計算方便。因為:
使用Stata軟件,我們得到如下結果:
1.Logit模型
2.Probit模型
上述模型顯示,無論是Logit模型還是Probit模型,兩個模型里自變量與因變量之間的正負關系是一致的,只是兩個模型的自變量系數的大小不同而已。其中正相關系數表示自變量越大,違約概率越小;負相關系數表示自變量越大,違約概率越大。下面逐一分析:
1.違約記錄:之前沒有違約歷史記錄的客戶更加有信用,在之后違約的可能性也比較小。之前有過信用卡逾期未還款、股票融資被平倉后沒有歸還欠款的客戶,違約記錄越多的客戶,以后違約的可能性也比較大。
2.借貸時間:借貸時間越長的客戶,違約的概率越大。借貸時間越長,外在的經濟環(huán)境和客戶自身的資產負債情況的不可預知性越大,違約的概率也隨之增加。
3.銀行存款數額:銀行存款數額的大小,一定程度上反映了客戶的財務狀況,較好的財務狀況表明了更好的償貸能力,違約的可能性更小。
4.工作狀態(tài):客戶目前職業(yè),收入對于客戶的償貸愿望都有著直接影響。如果一個客戶有著良好的工作,穩(wěn)定的收入,該客戶的現金流更加容易預測,違約的幾率也隨之降低。
5.房貸情況:這個比較復雜,一方面較高的房貸對于客戶來說是財政負擔,償還其他貸款的能力有所降低;另一方面,如果有足夠的公積金償還房貸,又恰恰證明了其較高的收入,能夠負擔起其余的債務。所以該自變量的P>|z|比較大,解釋能力比較牽強。
6.個人財產:學區(qū)房、商業(yè)區(qū)等較高房價的住房可以作為借貸抵押。一般擁有這些住房的客戶,資產較高,可以更好地承擔債務。
7.年齡:年齡較小的客戶消費欲望強烈,收入不穩(wěn)定,積蓄不多,更有違約的風險。年齡較大的客戶一般都有明確的消費計劃,收入穩(wěn)定,有著較為豐厚的積蓄,性格也比較穩(wěn)重,個人違約的意愿也比較小。但是P>|z|較大,說明解釋能力比較弱。
8.電話號碼:聯系方式對信用方式有正的方式。且與登記手機號碼的客戶相比,登記座機號碼的客戶更加穩(wěn)定,但是可以這個變量的P>|z|較大,遠遠超過了0.05,也就是這個變量的解釋能力較弱。
9.戶口所在地:城市戶口的客戶一般收入較高,也比較穩(wěn)定;農村戶口的客戶一般在城市打工或者在農村務農,收入無法得到切實的保障,遵守契約的意識也比較淡薄,違約可能性更大。
Logit和Probit模型的穩(wěn)健性好、可解釋性強、建模過程相對簡單、容易操作。兩個模型都得到了相似的結論:客戶的違約記錄、借貸時間、銀行存款數額、工作狀態(tài)、個人財產、戶口所在地這些變量對于客戶的違約可能性有著較為顯著的解釋能力,而房貸情況、年齡、電話號碼的解釋能力較差。隨著互聯網金融深入到社會的各個角落,信用違約事件層出不窮,相關企業(yè)機構應該多加強對信用風險的研究,把風險保持在可以控制的范圍以內。
[1]Wiginton,J.C.,A note on the comparison of logit and discriminant models of consumer credit behavior.Journal of Financial and Quantitative Analysis,1980.15:pp 757-770.
[2]A,S.,M.J Govaerts,A credit scoring model for personal loans.Insurance Mathematics and Economics,1989.98: pp.31-34.
[3]Cramer,J.S.,Scoring bank loans that may go wrong: a case study.Statistica Neerlandica,2004.58:pp365-380.
[4]Grablowsky,B.J.,W.K.Talley,Probit and discriminant functions for classifying credit applicants:a comparison. Journal of Economics and business,1981.33:pp.254-261.
[5.]向暉.個人信用頻分組合模型研究與應用.經濟科學出版社,2012.
(責任編輯:高萍萍)