米傳民,徐潤(rùn)捷,陶 靜
(南京航空航天大學(xué)經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 210016)
互聯(lián)網(wǎng)給商業(yè)、金融、工業(yè)等眾多行業(yè)帶來(lái)了機(jī)遇與挑戰(zhàn),其中互聯(lián)網(wǎng)金融充分地利用了互聯(lián)網(wǎng)的優(yōu)勢(shì),在一定程度上提高了金融資源配置效率,促進(jìn)了金融的普惠發(fā)展[1][2]。但隨著網(wǎng)絡(luò)支付、P2P信貸、眾籌等互聯(lián)網(wǎng)金融新模式的普及,P2P平臺(tái)違約、跑路等互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)問題頻發(fā)?;ヂ?lián)網(wǎng)金融的發(fā)展以及由此帶來(lái)的系統(tǒng)性風(fēng)險(xiǎn)成為學(xué)界和業(yè)界關(guān)注的重要問題。
2007年金融危機(jī)爆發(fā)以來(lái),系統(tǒng)性金融風(fēng)險(xiǎn)的防范已經(jīng)成為各國(guó)金融監(jiān)管部門的重要工作。多元正態(tài)分布是刻畫系統(tǒng)性風(fēng)險(xiǎn)的重要工具,但難以擬合金融時(shí)間序列的尖峰厚尾和非對(duì)稱相依結(jié)構(gòu)等特征[3]。另一方面,金融系統(tǒng)性風(fēng)險(xiǎn)的影響因素具有動(dòng)態(tài)變化特征,例如互聯(lián)網(wǎng)金融新商業(yè)模式層出不窮、監(jiān)管滯后、金融市場(chǎng)流動(dòng)性問題等等。如果不考慮這些現(xiàn)實(shí)因素的影響,則造成金融系統(tǒng)風(fēng)險(xiǎn)分析失真。隨著金融監(jiān)管理論、大數(shù)據(jù)、以及互聯(lián)網(wǎng)金融發(fā)展,一些新的研究方法進(jìn)入研究的視野,如通過降維來(lái)估計(jì)系統(tǒng)性風(fēng)險(xiǎn)的CoVaR[4]、MES[5]等方法。機(jī)器學(xué)習(xí)算法領(lǐng)域的Laurensvan der Maaten和Geoffrey Hinton提出了t-SNE降維聚類算法[6]。本文運(yùn)用t-SNE算法,研究我國(guó)互聯(lián)網(wǎng)金融發(fā)展的空間聚類,通過對(duì)互聯(lián)網(wǎng)金融多種業(yè)務(wù)發(fā)展的指數(shù)數(shù)據(jù)降維來(lái)提取局部空間結(jié)構(gòu),進(jìn)而觀察我國(guó)互聯(lián)網(wǎng)金融發(fā)展聚類情況,并在此基礎(chǔ)上提出三類系統(tǒng)風(fēng)險(xiǎn)問題。
互聯(lián)網(wǎng)金融的虛擬線上空間、跨區(qū)域發(fā)展等帶來(lái)了互聯(lián)網(wǎng)金融發(fā)展區(qū)域和空間聚集的不均衡。一些學(xué)者對(duì)互聯(lián)網(wǎng)金融區(qū)域發(fā)展、空間聚集進(jìn)行了系統(tǒng)研究。北京大學(xué)互聯(lián)網(wǎng)金融研究中心課題組編制了互聯(lián)網(wǎng)金融發(fā)展指數(shù),并對(duì)互聯(lián)網(wǎng)金融空間聚集效應(yīng)進(jìn)行了分析[7][8]。郭海鳳和陳霄(2015)深入考察了中國(guó)網(wǎng)貸平臺(tái)發(fā)展的地區(qū)差異[9]。廖理等(2014)系統(tǒng)分析了網(wǎng)貸平臺(tái)借貸中的地域歧視[10]。王賽芳(2016)通過構(gòu)建指標(biāo)體系,基于因子分析和聚類分析方法實(shí)證研究了我國(guó)31省市的互聯(lián)網(wǎng)金融發(fā)展水平及空間分異[11]。李清磊和王旺(2018)基于北京大學(xué)數(shù)字普惠金融指數(shù)數(shù)據(jù),定量分析了安徽省金融發(fā)展的地域差距[12]。但總體上,受制于互聯(lián)網(wǎng)金融數(shù)據(jù)缺乏,目前的研究多采用統(tǒng)計(jì)分析的方法進(jìn)行空間聚焦和差異分析。
巴塞爾資本協(xié)議III提出了宏觀審慎監(jiān)管的思路,我國(guó)提出了“守住不發(fā)生系統(tǒng)性金融風(fēng)險(xiǎn)”的金融監(jiān)管底線[13]。但業(yè)界和學(xué)界關(guān)于金融系統(tǒng)性風(fēng)險(xiǎn)的定義尚沒有完全統(tǒng)一。從金融穩(wěn)定視角,有的學(xué)者將系統(tǒng)性風(fēng)險(xiǎn)的根本原因歸結(jié)為金融系統(tǒng)本身的內(nèi)在不穩(wěn)定性[14]。Allen(2000)從經(jīng)濟(jì)平衡的角度解釋系統(tǒng)性風(fēng)險(xiǎn),認(rèn)為金融危機(jī)是由于系統(tǒng)不均衡引起的[15]。關(guān)于金融系統(tǒng)性風(fēng)險(xiǎn)的量化研究,一種思路是利用商業(yè)銀行或金融市場(chǎng)的數(shù)據(jù)來(lái)建立系統(tǒng)性金融風(fēng)險(xiǎn)度量模型。例如Iling和Liu(2006)構(gòu)建金融壓力指數(shù)(FSI)研究金融系統(tǒng)風(fēng)險(xiǎn)問題[16]。陳守東和王妍(2014)將極值理論引入到系統(tǒng)性金融風(fēng)險(xiǎn)度量中,從而證明金融機(jī)構(gòu)的市場(chǎng)價(jià)值的非正態(tài)分布特征[17]。王培輝和袁薇(2017)基于CCA和動(dòng)態(tài)因子Copula模型對(duì)我國(guó)金融機(jī)構(gòu)系統(tǒng)風(fēng)險(xiǎn)進(jìn)行了評(píng)估[3]。另一種思路將金融系統(tǒng)視為網(wǎng)絡(luò),利用網(wǎng)絡(luò)科學(xué)的理論方法建模研究整體風(fēng)險(xiǎn)的靜態(tài)和動(dòng)態(tài)特征。巴曙松(2013)[18]、Acemoglu等(2015)[19]研究了金融網(wǎng)絡(luò)及傳染對(duì)金融穩(wěn)定的影響,Axel(2016)利用貝葉斯網(wǎng)絡(luò)進(jìn)行系統(tǒng)性金融風(fēng)險(xiǎn)評(píng)價(jià)[20],Hamed(2016)研究了不均勻金融網(wǎng)絡(luò)的風(fēng)險(xiǎn)傳染問題[21],賈彥東(2011)[22]、隋聰?shù)?2016)[23]從網(wǎng)絡(luò)視角進(jìn)行了金融結(jié)構(gòu)系統(tǒng)重要性分析和銀行業(yè)系統(tǒng)性風(fēng)險(xiǎn)度量,鄧超(2014)[24]、歐陽(yáng)紅兵(2015)[25]利用復(fù)雜網(wǎng)絡(luò)研究系統(tǒng)性風(fēng)險(xiǎn)傳染問題。
互聯(lián)網(wǎng)金融帶來(lái)金融系統(tǒng)結(jié)構(gòu)的內(nèi)在變化,復(fù)雜性和關(guān)聯(lián)性增強(qiáng),金融系統(tǒng)性風(fēng)險(xiǎn)呈現(xiàn)區(qū)別于傳統(tǒng)金融的不同特征。Onay和Ozsoz(2014)分析了互聯(lián)網(wǎng)金融與商業(yè)銀行的貸款審批業(yè)務(wù),發(fā)現(xiàn)互聯(lián)網(wǎng)金融可以享受比較低的貸款利率[26]。吳成頌(2109)等運(yùn)用滬深股市上市商業(yè)銀行數(shù)據(jù)進(jìn)行了互聯(lián)網(wǎng)金融對(duì)商業(yè)銀行金融系統(tǒng)性風(fēng)險(xiǎn)影響的量化實(shí)證[27]。顧海峰和楊立翔(2018)基于中國(guó)銀行業(yè)數(shù)據(jù)研究了互聯(lián)網(wǎng)金融與銀行的風(fēng)險(xiǎn)共擔(dān)問題[28]。Klafft(2008)對(duì)P2P行業(yè)進(jìn)行分析,得出互聯(lián)網(wǎng)金融的交易風(fēng)險(xiǎn)源于對(duì)貸款業(yè)務(wù)經(jīng)驗(yàn)的缺乏[29]。張李義和涂奔(2018)從信息優(yōu)勢(shì)角度研究了互聯(lián)網(wǎng)金融對(duì)同業(yè)市場(chǎng)利率的影響[30]。吳珂和謝晉雯(2018)基于Z值評(píng)分模型識(shí)別互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)誘因和嚴(yán)重程度[31],陳耀輝和楊寧(2018)建立La-VaR模型研究了互聯(lián)網(wǎng)金融流動(dòng)性風(fēng)險(xiǎn)[32]。蘭翔(2017)選擇中證800金融指數(shù),運(yùn)用VaR分析與Copula的方法對(duì)互聯(lián)網(wǎng)金融進(jìn)行了風(fēng)險(xiǎn)測(cè)量,結(jié)果表明互聯(lián)網(wǎng)金融市場(chǎng)的VaR與ES均高于傳統(tǒng)市場(chǎng),互聯(lián)網(wǎng)金融市場(chǎng)本身可能具有更高的系統(tǒng)性風(fēng)險(xiǎn)[33]。王立勇和石穎(2016)采用二層次CRITIC-灰色關(guān)聯(lián)模型構(gòu)建互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)評(píng)價(jià)體系,運(yùn)用VaR方法度量互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)[34]。另外,針對(duì)互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)傳染問題,賈楠(2018)基于層次分析法分析了互聯(lián)網(wǎng)金融在技術(shù)風(fēng)險(xiǎn)、操作風(fēng)險(xiǎn)、法律風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)和業(yè)務(wù)風(fēng)險(xiǎn)方面的影響,得出信用與技術(shù)是互聯(lián)網(wǎng)金融中重要的風(fēng)險(xiǎn)傳染因素[35]。朱宸和華桂宏(2018)根據(jù)互聯(lián)網(wǎng)金融和銀行業(yè)之間的相互作用,研究了互聯(lián)網(wǎng)金融影響下的銀行業(yè)系統(tǒng)性風(fēng)險(xiǎn)引發(fā)和傳染機(jī)制[36]。張婷和米傳民(2016)構(gòu)建了超網(wǎng)絡(luò)模型研究互聯(lián)網(wǎng)金融均衡問題[37],并考慮互聯(lián)網(wǎng)金融中社交網(wǎng)絡(luò)關(guān)系研究了系統(tǒng)性金融風(fēng)險(xiǎn)傳染問題[38]。
綜上可以看出,互聯(lián)網(wǎng)金融快速發(fā)展,帶來(lái)金融開放、效率提升、成本降低的同時(shí),也給互聯(lián)網(wǎng)金融體系乃至整個(gè)金融系統(tǒng)帶來(lái)系統(tǒng)性風(fēng)險(xiǎn)新問題。大量研究表明互聯(lián)網(wǎng)金融無(wú)論從宏觀金融體系層面,還是從微觀業(yè)務(wù)層面,都給傳統(tǒng)金融帶來(lái)了影響,相應(yīng)的金融風(fēng)險(xiǎn)問題也值得深入研究。目前對(duì)互聯(lián)網(wǎng)金融下系統(tǒng)性金融風(fēng)險(xiǎn)的研究還處于初步階段,雖然取得了一些成果,但相對(duì)于互聯(lián)網(wǎng)金融的快速發(fā)展,有必要深入、系統(tǒng)研究其內(nèi)在機(jī)理。隨著互聯(lián)網(wǎng)金融發(fā)展帶來(lái)的數(shù)據(jù)和資料急劇增加,以及機(jī)器學(xué)習(xí)和人工智能的普及發(fā)展和深度應(yīng)用,運(yùn)用大數(shù)據(jù)、人工智能的思路和方法,研究互聯(lián)網(wǎng)金融發(fā)展區(qū)域差異、空間聚集,從宏觀、中觀層面找到系統(tǒng)性金融風(fēng)險(xiǎn)點(diǎn)并進(jìn)行監(jiān)管,是一個(gè)新視角,也符合巴塞爾資本協(xié)議III的監(jiān)管發(fā)展思路。本文基于北京大學(xué)互聯(lián)網(wǎng)金融研究課題組收集的“互聯(lián)網(wǎng)金融發(fā)展指數(shù)”數(shù)據(jù),運(yùn)用t-SNE算法構(gòu)建模型,進(jìn)行互聯(lián)網(wǎng)金融區(qū)域發(fā)展的降維和聚類分析,解決互聯(lián)網(wǎng)金融數(shù)據(jù)復(fù)雜性高和變量多而導(dǎo)致的維度過多問題,得到我國(guó)互聯(lián)網(wǎng)金融空間聚集和不同業(yè)務(wù)模式(支付、貨幣基金、保險(xiǎn)、投資)發(fā)展的分布特征,找出中觀層面的系統(tǒng)性風(fēng)險(xiǎn)因素,進(jìn)而提出互聯(lián)網(wǎng)金融發(fā)展區(qū)域差異造成的三方面系統(tǒng)性風(fēng)險(xiǎn),并提出防范互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)的建議。
“互聯(lián)網(wǎng)金融發(fā)展指數(shù)”由北京大學(xué)聯(lián)合國(guó)內(nèi)主要互聯(lián)網(wǎng)金融企業(yè),根據(jù)2014年1月至2015年12月的互聯(lián)網(wǎng)金融數(shù)據(jù)發(fā)展編制而成[7]。本文選擇了31個(gè)省(不含港澳臺(tái),下同)與335個(gè)地級(jí)市,共計(jì)35136個(gè)數(shù)據(jù)用于實(shí)證研究。該數(shù)據(jù)囊括了四種業(yè)務(wù)模式指標(biāo),并通過時(shí)間戳體現(xiàn)在每一個(gè)城市上,變量多且維數(shù)高。傳統(tǒng)的多元統(tǒng)計(jì)方法在處理這類實(shí)際數(shù)據(jù)時(shí)會(huì)遇到數(shù)據(jù)不符合正態(tài)分布的情況,也難以直接觀察空間結(jié)構(gòu)。本文采用t-SNE機(jī)器學(xué)習(xí)降維算法對(duì)眾多數(shù)據(jù)進(jìn)行訓(xùn)練、可視化和聚類,來(lái)研究互聯(lián)網(wǎng)金融的空間聚焦與業(yè)務(wù)發(fā)展的關(guān)系。
該指數(shù)將國(guó)內(nèi)的互聯(lián)網(wǎng)金融分為互聯(lián)網(wǎng)支付、互聯(lián)網(wǎng)基金、互聯(lián)網(wǎng)信貸、互聯(lián)網(wǎng)保險(xiǎn)四種業(yè)務(wù),是目前國(guó)內(nèi)為數(shù)不多的互聯(lián)網(wǎng)金融研究數(shù)據(jù)。在數(shù)據(jù)集中包括分地區(qū)互聯(lián)網(wǎng)金融指數(shù)。分地區(qū)指數(shù)在計(jì)算過程中考慮了各地區(qū)指數(shù)點(diǎn)位之間的橫向可比性。不同地區(qū)在某時(shí)期下相對(duì)交易滲透率、人均交易金額、人均交易筆數(shù)三個(gè)指標(biāo)的計(jì)算公式如下:
(1)
其中,Ah,i,j,t表示t時(shí)刻下,h地區(qū)中第i類業(yè)務(wù)的第j個(gè)指標(biāo)相對(duì)于全國(guó)總指數(shù)的相對(duì)值,Xi,j,t表示t時(shí)刻全國(guó)總指數(shù)的同業(yè)務(wù)同指標(biāo),Xh,i,j,t表示t時(shí)刻h地區(qū)的同業(yè)務(wù)同指標(biāo)。
不同地區(qū)在某時(shí)期的互聯(lián)網(wǎng)支付、基金、信貸、保險(xiǎn)業(yè)務(wù)相對(duì)于全國(guó)系數(shù)計(jì)算公式如下:
(2)
其中,Bh,i,t表示在t時(shí)期下h地區(qū)中第i類業(yè)務(wù)相對(duì)于全國(guó)總指數(shù)的相對(duì)系數(shù),m1、m2、m3分別表示上述的交易滲透率、人均交易額、人均交易筆數(shù)應(yīng)占的權(quán)重,該指數(shù)中m1=50%,m2=25%,m3=25%。
t分布隨機(jī)鄰嵌入算法(t-distributed stochastic neighbor embedding,t-SNE),由Laurens van der Maaten和 Geoffrey Hinton(2008)提出[6],后期經(jīng)過Maaten的改進(jìn),分別在2015年和2016年提出了LINE與LargeVis算法,很大程度上降低了訓(xùn)練復(fù)雜度[39][40]。該算法目前在降維、聚類、可視化的應(yīng)用上取得了良好效果,Gordon Berman(2014)將t-SNE算法運(yùn)用到對(duì)果蠅地面自由運(yùn)動(dòng)(即除了飛行)錄像上進(jìn)行降維分析[41]。劉豐等(2017)基于t-SNE算法實(shí)現(xiàn)了鳥類音頻情報(bào)辨識(shí)的數(shù)據(jù)可視化[42]。詹威威和王彬等(2018)在高維腦網(wǎng)絡(luò)狀態(tài)觀測(cè)矩陣中使用t-SNE算法,有效的解決了分散、交叉和散點(diǎn)[43]。本文選擇的省級(jí)和地級(jí)市數(shù)據(jù)存在數(shù)據(jù)維度高且復(fù)雜的性質(zhì),包含四個(gè)業(yè)務(wù)模式、三百余個(gè)度量區(qū)域、二十四個(gè)時(shí)間節(jié)點(diǎn)。經(jīng)典數(shù)據(jù)處理方法,如回歸分析、主成分分析、相關(guān)性分析等針對(duì)稀疏和多變量復(fù)雜數(shù)據(jù)集往往只能體現(xiàn)總體的關(guān)聯(lián),忽視了局部之間的聯(lián)系,而t-SNE算法使用高低維二者的聯(lián)合概率,能夠有效解決優(yōu)化困難與維度擁擠的問題,使得降維后的數(shù)據(jù)較好保持原有流形結(jié)構(gòu)。本文運(yùn)用t-SNE算法可將互聯(lián)網(wǎng)金融指數(shù)有效映射為二維圖像,有利于對(duì)整個(gè)互聯(lián)網(wǎng)金融的發(fā)展進(jìn)行觀察,進(jìn)而研究其系統(tǒng)性風(fēng)險(xiǎn)情況。
在高維空間中,t-SNE算法采用高斯分布,對(duì)于高維數(shù)據(jù)點(diǎn)x的低維對(duì)應(yīng)點(diǎn)y而言,可以計(jì)算條件概率pi|j來(lái)表示i點(diǎn)與j點(diǎn)之間的關(guān)系:
(3)
而在低維空間,采用自由度為1的t分布,以qi|j表示。
(4)
復(fù)雜數(shù)據(jù)降維過程中,最理想的狀態(tài)是高維空間樣本點(diǎn)之間的相似度與低維空間樣本點(diǎn)之間的相似度相同。t-SNE利用Kullback-Leibler散度作為目標(biāo)函數(shù)來(lái)判斷差異,從而實(shí)現(xiàn)最佳參數(shù)。
(5)
利用梯度下降法實(shí)現(xiàn)的最小化迭代公式如下:
(6)
在實(shí)驗(yàn)過程中有4個(gè)因素影響降維效果,即概率模型的困惑度(perplexity)、前期放大系數(shù)(early exaggeration factor)、學(xué)習(xí)率(learning rate)、最大迭代次數(shù)(maximum number of iterations)。困惑度是對(duì)后期結(jié)果影響最為關(guān)鍵的因素,它的作用是用來(lái)獲得高斯分布的方差。條件概率矩陣P的任意行困惑度可以定義為:
Perp(Pi)=2H(Pi)
(7)
其中,H(Pi)為Pi的香農(nóng)熵。如果高維空間概率分布的熵越大,則數(shù)據(jù)集的變量不確定性越大,從而造成處理后的數(shù)據(jù)在分布上更加平坦。反之,高維空間概率分布的熵越小,則數(shù)據(jù)的關(guān)聯(lián)性越高,處理后得到的數(shù)據(jù)越具有分布規(guī)律。香農(nóng)熵與高維空間的概率分布關(guān)系為:
(8)
為了檢驗(yàn)t-SNE算法的有效性,通過與經(jīng)典PCA(principal component analysis)的比較研究,對(duì)31個(gè)省級(jí)區(qū)域(不含港澳臺(tái))的數(shù)值進(jìn)行降維、聚類、成像和分析。
PCA作為經(jīng)典的數(shù)據(jù)挖掘算法被應(yīng)用于許多數(shù)據(jù)挖掘場(chǎng)景。PCA通過線性投影簡(jiǎn)化數(shù)據(jù),將高維數(shù)據(jù)映射到低維空間,盡可能保留原數(shù)據(jù)的內(nèi)在信息。本文使用PCA將每個(gè)省份互聯(lián)網(wǎng)金融發(fā)展?fàn)顩r降到2維,并在坐標(biāo)軸上可視化,所得的成像效果見圖1(a),橫坐標(biāo)表示各省的發(fā)展體量指數(shù)大小,數(shù)值越大則發(fā)展情況越領(lǐng)先;縱坐標(biāo)表示互聯(lián)網(wǎng)的支付、保險(xiǎn)、基金、信貸四大業(yè)務(wù)之間發(fā)展的均衡動(dòng)蕩程度,數(shù)值越大表明四大業(yè)務(wù)發(fā)展的體量越不均衡。
從PCA分析結(jié)果來(lái)看,31個(gè)省級(jí)數(shù)據(jù)總體呈現(xiàn)出:個(gè)別省份發(fā)展迅猛、多數(shù)省份聚集的尖峰厚尾特征。但從互聯(lián)網(wǎng)金融業(yè)務(wù)發(fā)展均衡程度上來(lái)觀察,互聯(lián)網(wǎng)金融整體發(fā)展優(yōu)異的區(qū)域在業(yè)務(wù)間發(fā)展的差異性也低。這得益于發(fā)達(dá)省份互聯(lián)網(wǎng)金融基礎(chǔ)設(shè)施完善、互聯(lián)網(wǎng)普及率較高、經(jīng)濟(jì)活力與消費(fèi)水平旺盛。根據(jù)圖來(lái)看,互聯(lián)網(wǎng)金融總體發(fā)展程度較低的區(qū)域也表現(xiàn)出了不同業(yè)務(wù)之間的發(fā)展均衡現(xiàn)象,此現(xiàn)象可能是由于這些區(qū)域本身互聯(lián)網(wǎng)經(jīng)濟(jì)發(fā)展動(dòng)力不足導(dǎo)致的。相較于前兩者,發(fā)展中游的城市出現(xiàn)了業(yè)務(wù)發(fā)展不均衡現(xiàn)象,說(shuō)明了互聯(lián)網(wǎng)金融在發(fā)展中城市的巨大潛力,也令尾部依賴這一特征在系統(tǒng)性風(fēng)險(xiǎn)積累過程中的顯得尤為重要。
依照PCA處理后的數(shù)值結(jié)果,將其依照大小排序,見表1。發(fā)展最快的幾個(gè)城市,例如北京市,相比于全國(guó)平均值高出8倍之多;沿海東部省份互聯(lián)網(wǎng)金融發(fā)展速度遠(yuǎn)遠(yuǎn)超過內(nèi)陸城市,西部省份大部分處于互聯(lián)網(wǎng)金融發(fā)展落后階段。該排名同時(shí)反映出在互聯(lián)網(wǎng)金融的系統(tǒng)性風(fēng)險(xiǎn)考量中,需要考慮城市在互聯(lián)網(wǎng)金融發(fā)展中的重要程度。
表1 基于PCA的31省級(jí)區(qū)域互聯(lián)網(wǎng)金融排名
本文使用python進(jìn)行t-SNE算法計(jì)算,對(duì)31個(gè)省級(jí)區(qū)域的互聯(lián)網(wǎng)金融系統(tǒng)風(fēng)險(xiǎn)分析。由于t-SNE是從非線性降維出發(fā),將高維空間樣本投影到多個(gè)二維空間映射圖上,使用高低維雙向概率分布,得出的結(jié)果具有隨機(jī)性特點(diǎn)。本文結(jié)合了流行正則化技術(shù)來(lái)控制映射圖,從而使得投影到可視化空間的樣本點(diǎn)不但可以保持高維數(shù)據(jù)的整體結(jié)構(gòu),也保持了局部近鄰點(diǎn)的關(guān)系。在t-SNE的數(shù)據(jù)處理中包括兩個(gè)階段,分別為前期放大階段與后期性能選擇階段。實(shí)驗(yàn)中前期放大系數(shù)設(shè)置為12.0,空間的聯(lián)合概率通過乘以前期放大系數(shù)的方式逐步增加。重點(diǎn)調(diào)整困惑度與學(xué)習(xí)率,使得在單點(diǎn)近似區(qū)域?qū)崿F(xiàn)迅速而準(zhǔn)確的訓(xùn)練效果。不同參數(shù)下的分布形態(tài)、聚類效果見表2。
表2 不同t-SNE參數(shù)下的分布形式
31個(gè)省份的聚類分布在Per=5.0時(shí)更具備穩(wěn)定的聚類特征,聚類效果如圖1(b)、(c)所示,存在31個(gè)省級(jí)區(qū)域的聚類劃分,大致劃分為:
Ⅰ級(jí):北京、上海、浙江、廣東。
Ⅱ級(jí):江蘇、福建、天津、湖北、山東、重慶、遼寧。
Ⅲ級(jí):陜西、海南、安徽、四川、山西、河北、江西、黑龍江、河南。
Ⅳ級(jí):吉林、新疆、寧夏、湖南、西藏、廣西、內(nèi)蒙古、云南、青海、貴州、甘肅。
比較圖1(b)和(c),基于t-SNE的結(jié)果囊括了發(fā)展強(qiáng)、較強(qiáng)、中游、以及落后的省份,聚類效果體現(xiàn)了我國(guó)國(guó)內(nèi)互聯(lián)網(wǎng)金融發(fā)展特征為:個(gè)別省份極端發(fā)展、多數(shù)省份聚集的尖峰厚尾現(xiàn)象。t-SNE聚類結(jié)果更能體現(xiàn)互聯(lián)網(wǎng)金融發(fā)展的區(qū)域性,有助于進(jìn)行互聯(lián)網(wǎng)金融的系統(tǒng)性風(fēng)險(xiǎn)分析。
從圖1來(lái)看,PCA算法夠清晰反映各省互聯(lián)網(wǎng)金融發(fā)展水平,解釋不同區(qū)域在誘發(fā)互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)中的重要性。但PCA成像在分布上出現(xiàn)了較為無(wú)序的子集雜糅,不能很好體現(xiàn)統(tǒng)計(jì)特性。一部分城市之間相互吸引,而另一部城市之間卻遠(yuǎn)距離分散,難以直觀觀察到不同區(qū)域在互聯(lián)網(wǎng)金融發(fā)展程度上的關(guān)系特點(diǎn)。
t-SNE降維聚類結(jié)果呈現(xiàn)清晰的聚類團(tuán),不同互聯(lián)網(wǎng)金融區(qū)域發(fā)展程度的界定更為明顯。作為非線性算法,t-SNE通過恢復(fù)數(shù)據(jù)低維度狀態(tài)下的流行結(jié)構(gòu)起到降噪作用,并體現(xiàn)數(shù)據(jù)內(nèi)在關(guān)系,從而更好地反映降維前的系統(tǒng)特征[44]。使用t-SNE對(duì)31個(gè)省份的聚類,反應(yīng)出我國(guó)互聯(lián)網(wǎng)金融發(fā)展過程中區(qū)域間相互關(guān)聯(lián)的特性,這為監(jiān)管部門對(duì)互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)進(jìn)行分級(jí)分區(qū)域監(jiān)管提供了數(shù)據(jù)驅(qū)動(dòng)的決策參考。
圖1 PCA與t-SNE的省級(jí)互聯(lián)網(wǎng)金融發(fā)展類效果對(duì)比
在第四部分,主要從省級(jí)層面進(jìn)行了數(shù)據(jù)分析。但省級(jí)數(shù)據(jù)的橫切面只有31類,無(wú)法體現(xiàn)更細(xì)節(jié)的互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)特征。本節(jié)將使用全國(guó)335個(gè)地級(jí)市(包括自治州、盟、地區(qū))的多業(yè)務(wù)發(fā)展數(shù)據(jù)進(jìn)行實(shí)驗(yàn)與分析。第四部分的PCA分析,在處理數(shù)據(jù)的過程中難以避免維度擁擠和數(shù)據(jù)雜糅的問題,無(wú)法產(chǎn)生良好的聚類效果,因此本節(jié)主要探討基于t-SNE機(jī)器學(xué)習(xí)算法的地級(jí)市層面的互聯(lián)網(wǎng)金融發(fā)展系統(tǒng)風(fēng)險(xiǎn)聚類效果。
在地級(jí)市t-SNE機(jī)器學(xué)習(xí)聚類過程中,參數(shù)設(shè)置如下:前期放大系數(shù)為12.0,困惑度為30.0,訓(xùn)練次數(shù)為5000,然后使用K-means算法對(duì)降維后的數(shù)據(jù)進(jìn)行聚類,得到的聚類結(jié)果如圖2所示,地級(jí)市的互聯(lián)網(wǎng)金融發(fā)展情況匯聚成7大類,另外有一地級(jí)市的點(diǎn)分散在7大主要類的附近。對(duì)于較大相似度的地級(jí)市的點(diǎn),t分布在低維空間中的距離稍小一點(diǎn),即同一簇內(nèi)的點(diǎn)聚合的更緊密;而對(duì)于低相似度的地級(jí)市的點(diǎn),t分布在低維空間中的距離需要更遠(yuǎn),即不同簇之間的點(diǎn)更加疏遠(yuǎn)。
在利用t-SNE機(jī)器學(xué)習(xí)聚類過程中,通過參數(shù)調(diào)整,我們發(fā)現(xiàn):當(dāng)概率分布困惑度Per=10.0時(shí),數(shù)據(jù)分布產(chǎn)生了整體雜糅性,如下圖3所示。這說(shuō)明,第一,互聯(lián)網(wǎng)金融發(fā)展在地區(qū)之間的聚集分布不是完全性的,雖然主要是依從一個(gè)整體,但是存在空間聚集差異。第二,在圖3中,地級(jí)市互聯(lián)網(wǎng)金融發(fā)展區(qū)域分布以橫縱坐標(biāo)原點(diǎn)為中心向外擴(kuò)散。橫坐標(biāo)的大小代表相對(duì)于平均水平的各城市互聯(lián)網(wǎng)金融發(fā)展情況,縱坐標(biāo)表示互聯(lián)網(wǎng)金融的支付、基金、信貸、保險(xiǎn)四大分業(yè)務(wù)發(fā)展的均衡動(dòng)蕩程度,這與上文PCA算法得到的效果類似,也與互聯(lián)網(wǎng)金融發(fā)展指數(shù)局部Moran’s散點(diǎn)圖得到的效果相似[7]。游離在聚焦原點(diǎn)外的數(shù)據(jù)大部分是一、三、四象限分布,少數(shù)在第二象限。第二象的坐標(biāo)具體含義是:互聯(lián)網(wǎng)金融發(fā)展指數(shù)較低、分業(yè)務(wù)發(fā)展的差異性很高,但實(shí)驗(yàn)結(jié)果是第二象限呈現(xiàn)極少的散點(diǎn)分布。結(jié)合我國(guó)互聯(lián)網(wǎng)金融發(fā)展實(shí)際情況,以及上述PCA聚類結(jié)果,可以看出,中國(guó)西部城市在互聯(lián)網(wǎng)金融整體水平較低的情況下,分業(yè)務(wù)發(fā)展的均衡性卻與發(fā)達(dá)城市相同的現(xiàn)象。這也印證了本文第四部分得出的中國(guó)互聯(lián)網(wǎng)金融發(fā)展情況是個(gè)別省份極端發(fā)展、多數(shù)省份相互聚集的尖峰厚尾現(xiàn)象。
圖2 t-SNE下的地級(jí)市互聯(lián)網(wǎng)金融發(fā)展聚類圖
圖3 t-SNE下的地級(jí)市互聯(lián)網(wǎng)金融發(fā)展關(guān)聯(lián)圖
結(jié)合李建平(2010)等風(fēng)險(xiǎn)相關(guān)性與集成的研究成果[45],從管理啟示角度,本文認(rèn)為我國(guó)互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)在區(qū)域上的防控可從以下三個(gè)方面關(guān)注。
我國(guó)互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)需要注意區(qū)域性防范問題,避免區(qū)域性傳染風(fēng)險(xiǎn)。從上述聚類結(jié)果看,中國(guó)互聯(lián)網(wǎng)金融發(fā)展主要集聚在沿海東部地區(qū),呈現(xiàn)區(qū)域特征。這一方面增大了互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)的傳染性,另一方面也反映出對(duì)聚集區(qū)域進(jìn)行針對(duì)性監(jiān)管的必要性。具體來(lái)說(shuō),東部發(fā)達(dá)地區(qū)體現(xiàn)出互聯(lián)網(wǎng)發(fā)展速度極端化特點(diǎn),該類區(qū)域經(jīng)濟(jì)金融發(fā)展水平高、互聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè)完善、互聯(lián)網(wǎng)金融發(fā)展的需求與供給充足。這極大地促進(jìn)了互聯(lián)網(wǎng)金融發(fā)展在空間區(qū)域選擇上的傾斜;經(jīng)濟(jì)發(fā)展良好的地區(qū)在互聯(lián)網(wǎng)金融的發(fā)展速度上增速很高,且伴隨有互聯(lián)網(wǎng)金融不同業(yè)務(wù)之間的發(fā)展差異;經(jīng)濟(jì)欠發(fā)達(dá)的西部地區(qū)雖然受到互聯(lián)網(wǎng)跨時(shí)空障礙、方便快捷的優(yōu)勢(shì)影響,但互聯(lián)網(wǎng)金融發(fā)展的速度與動(dòng)力要落后于東部地區(qū)。這種互聯(lián)網(wǎng)金融發(fā)展的區(qū)域性差異,可能帶來(lái)互聯(lián)網(wǎng)金融的傳染性系統(tǒng)風(fēng)險(xiǎn),在宏觀監(jiān)管過程中需要重點(diǎn)關(guān)注。
業(yè)務(wù)發(fā)展的差異性,可在中觀層面帶來(lái)系統(tǒng)性風(fēng)險(xiǎn),需要關(guān)注。從分級(jí)業(yè)務(wù)的發(fā)展情況來(lái)看,互聯(lián)網(wǎng)金融發(fā)展領(lǐng)先的城市在互聯(lián)網(wǎng)支付、基金、信貸、保險(xiǎn)四大業(yè)務(wù)上發(fā)展均衡,而發(fā)展中等水平的城市呈現(xiàn)了業(yè)務(wù)間發(fā)展高低不平衡的特征。這同Allen的研究一致,即從經(jīng)濟(jì)平衡的角度解釋系統(tǒng)性風(fēng)險(xiǎn),考慮到經(jīng)濟(jì)發(fā)展不僅體現(xiàn)在總體量上的差距,實(shí)際上也需要參考各級(jí)市場(chǎng)的發(fā)展情況[15]。我們的研究認(rèn)為,從系統(tǒng)內(nèi)在聯(lián)系的角度,互聯(lián)網(wǎng)金融發(fā)展處于中游的城市,其不均衡的業(yè)務(wù)發(fā)展意味著互聯(lián)網(wǎng)金融發(fā)展存在市場(chǎng)差異,這也可能帶來(lái)系統(tǒng)風(fēng)險(xiǎn),需要在監(jiān)管過程中關(guān)注業(yè)務(wù)發(fā)展的差異性。
從網(wǎng)絡(luò)科學(xué)角度,網(wǎng)絡(luò)中的節(jié)點(diǎn)間存在聯(lián)系,不同節(jié)點(diǎn)的重要性不同,對(duì)網(wǎng)絡(luò)的影響也不同。如果將全國(guó)互聯(lián)網(wǎng)金融看成一個(gè)網(wǎng)絡(luò),根據(jù)上述聚類實(shí)證研究發(fā)現(xiàn),北京、上海、深圳、杭州等城市是我國(guó)互聯(lián)網(wǎng)金融發(fā)展突出的城市,對(duì)周邊地區(qū)輻射效應(yīng)也最為強(qiáng)烈。北京、上海基于傳統(tǒng)金融中心基礎(chǔ),深圳依托微信相關(guān)互聯(lián)網(wǎng)金融基礎(chǔ),以及杭州依托螞蟻金融為主的互聯(lián)網(wǎng)金融發(fā)展,為這些城市互聯(lián)網(wǎng)金融發(fā)展提供了良好的機(jī)會(huì)。朱曉謙等(2018)的研究發(fā)現(xiàn),單個(gè)金融機(jī)構(gòu)的危機(jī)可能導(dǎo)致整個(gè)金融系統(tǒng)陷入危機(jī),用概率可以度量系統(tǒng)性風(fēng)險(xiǎn)[46]。巴塞爾資本協(xié)議III針對(duì)2007年金融危機(jī)提出了系統(tǒng)性重要金融機(jī)構(gòu)的概念,加強(qiáng)對(duì)系統(tǒng)性重要金融機(jī)構(gòu)的監(jiān)管?;诘谖宀糠盅芯康慕Y(jié)果,我們認(rèn)為,考慮到互聯(lián)網(wǎng)跨時(shí)空、集聚效應(yīng)更強(qiáng)和風(fēng)險(xiǎn)傳播更快的特點(diǎn),除了關(guān)注系統(tǒng)性重要金融機(jī)構(gòu),有必要從中觀層面,關(guān)注系統(tǒng)性重要城市可能給金融體系帶來(lái)的系統(tǒng)性風(fēng)險(xiǎn)。
互聯(lián)網(wǎng)金融給經(jīng)濟(jì)金融帶來(lái)深刻影響,其風(fēng)險(xiǎn)問題也不容小覷。區(qū)別于傳統(tǒng)的系統(tǒng)性風(fēng)險(xiǎn)度量研究方法,本文從風(fēng)險(xiǎn)傳染視角,對(duì)高維數(shù)據(jù)進(jìn)行降維和聚類處理,研究互聯(lián)網(wǎng)金融在空間地理上的可視化展現(xiàn)與業(yè)務(wù)分布上的結(jié)構(gòu)差異,得到了互聯(lián)網(wǎng)金融發(fā)展的系統(tǒng)性風(fēng)險(xiǎn)區(qū)域特征。從實(shí)證結(jié)果來(lái)看,t-SNE算法能夠較好地捕獲系統(tǒng)性風(fēng)險(xiǎn)發(fā)生的特征與薄弱環(huán)節(jié),并得出互聯(lián)網(wǎng)金融市場(chǎng)存在的尖峰、厚尾等特征,在此基礎(chǔ)上本文提出三方面互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)防控建議。
下一步的研究,一方面,可以利用互聯(lián)網(wǎng)金融機(jī)構(gòu)內(nèi)部數(shù)據(jù)或仿真數(shù)據(jù),進(jìn)行更細(xì)顆粒度地建模,或許發(fā)現(xiàn)更有價(jià)值的結(jié)論。另一方面,本文提出的三方面互聯(lián)網(wǎng)金融系統(tǒng)性風(fēng)險(xiǎn)有必要從金融風(fēng)險(xiǎn)傳染、金融監(jiān)管等角度進(jìn)行建模研究,如通過研究區(qū)域聚集系數(shù)從而得到較為精確的區(qū)域風(fēng)險(xiǎn)比重;結(jié)合更具體數(shù)據(jù),對(duì)互聯(lián)網(wǎng)金融系統(tǒng)性城市、以及重要金融機(jī)構(gòu)判斷方法進(jìn)行深入研究;運(yùn)用科學(xué)的理論方法找到不同互聯(lián)網(wǎng)金融業(yè)務(wù)發(fā)展的合適比例。