龐德良,李思卓
(1.吉林大學東北亞研究中心,吉林 長春 130012;2.吉林大學東北亞學院,吉林 長春 130012)
一個運轉(zhuǎn)良好的金融體系應(yīng)盡可能為更多的消費者提供儲蓄、支付和風險管理產(chǎn)品,并為所有有價值的增長尋找融資和機會。[1]美國的金融業(yè)深度和寬度居于全球領(lǐng)先地位。在20世紀20年代,美國進入消費社會初始階段,豐富的金融產(chǎn)品和服務(wù)、健全的法律體系和覆蓋全美85%人口的征信體系,為消費社會的發(fā)展提供了極大的推動力和保障。然而,在美國金融科技公司ZestFinance于2019年發(fā)起的關(guān)于“美國人對目前信用評分及體系滿意程度”的哈里斯民意調(diào)查(Harris Poll)中,很多人認為傳統(tǒng)征信體系無法反映真實信譽,年輕人和少數(shù)族裔的不滿情緒尤其突出。
一方面,在傳統(tǒng)征信過程中“無檔案”(no-file)和“薄檔案”(thin-file)借款人的規(guī)模仍然較大,本文將此類容易被傳統(tǒng)金融服務(wù)排斥的弱勢金融群體稱為“長尾人群”。2018年美國金融消費者保護局(CFPB)官員表示,美國有2600萬人(約占成年人口的11%)是在三大征信機構(gòu)都不存在信用記錄的“無檔案”消費者,有1940萬人(約占成年人口的8%)是擁有不大于三個交易記錄、難以生成信用評分的“薄檔案”消費者?!氨n案”消費者可能有信用評分,但如果沒有足夠的近期交易記錄,貸方通常會忽略這些評分。根據(jù)Creditcards.com2015年的統(tǒng)計,在15~28歲的美國人中從未擁有過信用卡的人數(shù)占36%,信用記錄缺失是主要原因之一,他們經(jīng)常被懷疑具有“高風險”特征。此外,還有數(shù)百萬人的信用檔案存在重大錯誤。CFPB在2019年接到的投訴中,僅關(guān)于“信用報告信息出錯”的投訴就占29%。很多實際信用優(yōu)質(zhì)的借款人因為信用記錄不足或出錯,又缺少其他申訴渠道證明信譽,常遭到主流銀行的排斥,傳統(tǒng)金融服務(wù)和產(chǎn)品的可及性不足。另一方面,信貸歧視在傳統(tǒng)金融服務(wù)業(yè)中仍然廣泛存在。自20世紀60年代美國的《消費者信貸保護法》頒布至今,涉及個人征信的法律多達幾十部。特別是1970年頒布的《公平信用報告法》和1974年頒布的《平等信用機會法》,都強調(diào)信用機構(gòu)檔案中所包含的消費者個人信息應(yīng)具有公平性、準確性和隱私性。但是,據(jù)美國聯(lián)邦金融機構(gòu)審查委員會(FFIEC)公布的2017年HMDA數(shù)據(jù)顯示,黑人和拉美裔白人申請人的傳統(tǒng)購房貸款拒絕率高于非拉美裔白人申請人。此外,還有一些機構(gòu)誘導(dǎo)少數(shù)族裔辦理高風險的次級抵押貸款,甚至有很多金融機構(gòu)在劃定貸款評級時,直接將少數(shù)族裔聚集地標記為低收入、治安差、貸款風險極高的區(qū)域。
P2P網(wǎng)絡(luò)借貸平臺的主要作用之一是彌補傳統(tǒng)金融機構(gòu)的不足,解決被傳統(tǒng)金融機構(gòu)排斥的“長尾”用戶借貸需求,促進信貸公平。由于需要面對許多薄檔案甚至無檔案用戶,以及經(jīng)常被美國傳統(tǒng)征信“歧視”的少數(shù)族裔,P2P平臺引入非傳統(tǒng)來源的另類數(shù)據(jù)(Alternative Data,國內(nèi)早期譯為“替代數(shù)據(jù)”),通過建立高維度的信用評分模型,以期更有效地預(yù)測借款人的信貸風險。
另類數(shù)據(jù)是指在投資研究中使用的區(qū)別于主流來源的新型數(shù)據(jù)。[2]在征信實踐中,美國聯(lián)邦機構(gòu)和業(yè)內(nèi)人士通常將另類數(shù)據(jù)定義為:國家消費者報告機構(gòu)在計算信用評分時使用的非傳統(tǒng)信息。其中,“非傳統(tǒng)信息”包括任何美國三大全國性消費者信用報告機構(gòu)(即Experian、Equifax和TransUnion)傳統(tǒng)上在計算信用評分時不使用的信息。目前,無論是美國的傳統(tǒng)三大征信機構(gòu),還是具備先天技術(shù)優(yōu)勢的金融科技公司,都在積極研發(fā)另類數(shù)據(jù)相關(guān)征信產(chǎn)品,突破傳統(tǒng)數(shù)據(jù)的選取和使用方式,通過海量的另類數(shù)據(jù)對平臺用戶進行畫像,最終評估用戶的信用情況。至此,信貸領(lǐng)域的個人風險評估方法已經(jīng)開始分化,傳統(tǒng)征信和大數(shù)據(jù)征信之間出現(xiàn)一定的互補,理論上有利于促進金融普惠,這也是金融科技發(fā)展的初衷之一。
另類數(shù)據(jù)的選取和應(yīng)用,直接決定最后的信用評分能在多大程度上還原借款人的真實信譽,擴大負責任的信貸規(guī)模。雖然由于行業(yè)亂象風險頻發(fā),P2P網(wǎng)貸平臺已經(jīng)在我國國內(nèi)全部退出經(jīng)營,但隨著國內(nèi)征信民間化的發(fā)展趨勢,P2P網(wǎng)貸平臺作為構(gòu)建新型體系的重要樣本,其經(jīng)驗十分值得借鑒。因此,本文將以近年在CB insights發(fā)布的全球FinTech 250強上榜的10個美國P2P網(wǎng)貸平臺——Upgrade、Upstart、Prosper、Earnest、Sofi、LendUp、LendingClub、Affirm、FuturelFuel、CommonBond 為例,對另類數(shù)據(jù)在征信應(yīng)用中的優(yōu)勢進行定性分析。而后根據(jù)完全信息靜態(tài)博弈的結(jié)論,提出應(yīng)對另類數(shù)據(jù)征信缺陷的辦法。
目前,國內(nèi)外關(guān)于另類數(shù)據(jù)的研究非常豐富,主要視角有二:
一是研究非傳統(tǒng)信息對個人征信評價的影響,并通過實證進行信息含量分析。研究多將借款人信息分為“軟信息”和“硬信息”,主要分析“軟信息”對反映借款人的貸款成功率、違約率的參考價值。Iyer等以Prosper數(shù)據(jù)為例,發(fā)現(xiàn)P2P網(wǎng)貸中的貸款人使用軟信息預(yù)測借款人的違約率時,準確率比傳統(tǒng)信用分高45%,在篩選信用評級較低的借款人時軟信息作用顯著。廖理、吉霖等研究發(fā)現(xiàn),高學歷借款者如約還款的概率更高。[3]劉新海和丁偉發(fā)現(xiàn),信貸記錄并非總與信用狀況相互映射,申請者的其他個人信息和行為信息也會與信用狀況產(chǎn)生聯(lián)系,雖然這種聯(lián)系可能比較弱。[4]Cong等認為另類數(shù)據(jù)為金融行業(yè)提供了一個新視角,人們通過另類數(shù)據(jù)可以更好地監(jiān)控、理解和優(yōu)化市場中的人類決策。[5]在信息含量研究方面,Berg等的研究表明數(shù)字足跡變量能夠體現(xiàn)收入、性格和聲譽,其信息含量甚至比征信機構(gòu)給出的分數(shù)表現(xiàn)得更好。[6]王正位、周從意等對消費行為在個人信用風險識別中的信息含量進行研究,結(jié)果表明消費行為信息能夠顯著提升對借款人信用風險的識別能力,如果將其納入征信評估,能夠在一定程度上減少信貸市場的信息不對稱。[7]另一種研究視角,是探討另類數(shù)據(jù)對提高金融普惠的作用。學者和業(yè)界是肯定另類數(shù)據(jù)對擴大負責任的信貸規(guī)模的作用,但是也提出其仍然無法從根本上消除信貸歧視。20世紀90年代就有學者提出當缺乏征信分數(shù)時,數(shù)字足跡有助于信貸的獲取,從而提高金融包容度,降低信貸中的不平等。[8]近年來隨著具有“普惠”特征的金融科技發(fā)展,相關(guān)研究再次得到重視。Berg等[6]特別提到數(shù)字足跡對新興市場信貸中不被歡迎客戶的幫助作用,這一點在田利輝、李政對“一帶一路”發(fā)展中國家的研究[9]對小額信貸平臺在欠發(fā)達地區(qū)的研究中得到證實,顯示出另類數(shù)據(jù)應(yīng)用在緩解金融市場不平等方面的巨大潛力。
在征信實踐中,另類數(shù)據(jù)相對傳統(tǒng)的單一金融數(shù)據(jù)具有以下優(yōu)勢:
(1)另類數(shù)據(jù)有助于提高數(shù)據(jù)整體質(zhì)量。美國P2P網(wǎng)貸平臺的另類數(shù)據(jù)來源,既包括具有金融屬性的服務(wù)商,也包括非金融屬性的機構(gòu)和平臺(如圖1)。這有助于從多角度評估借款人的違約風險,并且數(shù)據(jù)集之間能夠互為佐證。例如,在GAO于2019年調(diào)查的10家金融科技貸款機構(gòu)中,部分機構(gòu)通過從借款人互聯(lián)網(wǎng)瀏覽器收集的信息來驗證借款人身份,還有機構(gòu)應(yīng)用借款人所提供的電子郵件地址與被第三方認定為欺詐的電子郵件地址進行比對??梢?,另類數(shù)據(jù)的應(yīng)用有助于提高征信評估的準確性,這是僅依靠單一財務(wù)數(shù)據(jù)集不具備的優(yōu)勢。
(2)另類數(shù)據(jù)有助于豐富人物畫像。另類數(shù)據(jù)集的數(shù)據(jù)構(gòu)成豐富,能從多角度對借款人進行畫像,增加被傳統(tǒng)金融機構(gòu)排斥的“長尾”人群獲取信貸的機會。由于數(shù)據(jù)獲取和處理能力的限制,傳統(tǒng)個人信用評分模型由具有強“因果關(guān)系”的結(jié)構(gòu)化數(shù)據(jù)構(gòu)成(如圖2),被稱為“強(財務(wù))特征數(shù)據(jù)”。在數(shù)據(jù)分析方法上,以統(tǒng)計學方法中的判別分析(Discriminant Analysis)為主(以FICO Score為代表)。隨著數(shù)據(jù)儲存成本的下降和數(shù)據(jù)處理能力的提高,使用數(shù)據(jù)的邏輯和習慣也發(fā)生改變,為金融科技機構(gòu)進行預(yù)測性分析(Predictive Analytics)提供了基礎(chǔ)。預(yù)測性分析強調(diào)的是變量間的相關(guān)關(guān)系而非明確的因果關(guān)系,因此可以通過大量的“弱(財務(wù))特征”的另類數(shù)據(jù)彌補“信用隱形者”財務(wù)信息不足的劣勢(如圖3)。
(3)另類數(shù)據(jù)有助于提高分析結(jié)果的代表性和穩(wěn)定性。由于另類數(shù)據(jù)量相對金融數(shù)據(jù)更龐大,有助于提升數(shù)據(jù)分析結(jié)果的代表性和穩(wěn)定性。數(shù)據(jù)的“代表性”指數(shù)據(jù)代表全部的消費者,還是僅代表其中一個子集。數(shù)據(jù)量是否足夠龐大且豐富決定著數(shù)據(jù)集的代表性程度,最終影響數(shù)據(jù)整體質(zhì)量和作用。在數(shù)據(jù)數(shù)量上,P2P網(wǎng)絡(luò)平臺數(shù)據(jù)項個數(shù)能達到幾千個,變量個數(shù)多達上萬個,數(shù)據(jù)量十分豐富;在數(shù)據(jù)格式上,兼具結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);在數(shù)據(jù)性質(zhì)上,既包括財務(wù)性數(shù)據(jù)又涵蓋各類行為數(shù)據(jù)。因此,另類數(shù)據(jù)集比傳統(tǒng)財務(wù)數(shù)據(jù)集更豐富,更能全面展現(xiàn)借款人的特征。數(shù)據(jù)的“穩(wěn)定性”(data stability),在統(tǒng)計學上是用于測量數(shù)據(jù)波動性與離散性的指標。從時間角度縱向觀察,另類數(shù)據(jù)具有動態(tài)特征,P2P平臺的征信分析模型可以根據(jù)最新數(shù)據(jù)進行動態(tài)調(diào)整。與傳統(tǒng)征信評分使用的數(shù)據(jù)相比,另類數(shù)據(jù)能更有效地反映借款人近期的生活狀態(tài)以預(yù)測未來風險。綜上,另類數(shù)據(jù)在征信中的使用更有助于預(yù)測金融消費者近期的真實個人信用。
大數(shù)據(jù)的核心是對數(shù)據(jù)價值的充分挖掘和利用,而機器學習是利用數(shù)據(jù)價值的關(guān)鍵技術(shù)。金融科技的出現(xiàn)及其對另類數(shù)據(jù)的應(yīng)用,使弱勢金融消費者的借貸需求得到一定程度的滿足。但與此同時,基于機器學習的另類數(shù)據(jù)征信也引發(fā)多種新的歧視現(xiàn)象,如數(shù)字歧視和算法歧視。這類新型歧視使信貸歧視更加隱秘,導(dǎo)致信貸公平難以實現(xiàn)。
(1)數(shù)字歧視。數(shù)字歧視是數(shù)字經(jīng)濟時代的特有現(xiàn)象,指用戶由于一些原因不使用或不接觸數(shù)字化產(chǎn)品,導(dǎo)致其被排除在更廣泛的數(shù)字生活模式之外,逐漸在很多方面與主流人群脫離,這些用戶被稱為“數(shù)字弱勢群體”。目前,美國年輕人出于對個人隱私的保護,已經(jīng)表現(xiàn)出對社交網(wǎng)絡(luò)的抵觸情緒。Pew Research Center2018年的調(diào)查顯示(如圖4),美國50歲以上的用戶對Facebook需求較高,并且可能會留下更多公開的個人信息,而在18~29歲的Facebook用戶中,47%的用戶在幾周或更長的時間里沒有登錄賬號,44%的用戶表示已刪除Facebook應(yīng)用程序,64%的用戶在過去一年中對隱私設(shè)置進行調(diào)整。這種選擇使許多人客觀上成為數(shù)字弱勢群體,特別是在基于機器學習的另類數(shù)據(jù)征信方面。例如,LendUp通過申請者的Facebook和Twitter透露出的社會關(guān)系緊密程度判斷其信譽的好壞,這樣的數(shù)據(jù)選擇可能將排斥社交網(wǎng)絡(luò)中不活躍、很少留下或習慣刪除數(shù)字足跡的借款人。機器學習預(yù)測的準確性取決于訓(xùn)練的數(shù)據(jù)是否全面、準確。征信實踐中,P2P平臺無法保證其用于機器學習的另類數(shù)據(jù)樣本足夠多樣。由于缺乏數(shù)字信息、被歧視等原因,從最開始就被拒絕的潛在優(yōu)質(zhì)借款人樣本永遠都不會被觀察到。機器學習樣本不足將導(dǎo)致模型泛化能力比較低,會產(chǎn)生兩種結(jié)果:一是機器無法預(yù)測其風險,借款人的貸款申請被拒絕;二是借款人被錯誤地分類到其他特征人群,最終預(yù)測結(jié)果產(chǎn)生偏差,例如一些照片識別軟件會因為沒有包含足夠多樣的數(shù)據(jù),錯誤地分辨非洲裔美國人和亞裔美國人的照片。無論哪種預(yù)測結(jié)果,被歧視人群都可能無法得到與自己相匹配的產(chǎn)品和服務(wù),失去獲得公平信貸的機會。
(2)算法歧視。算法歧視指在大數(shù)據(jù)技術(shù)下,當機器學習對數(shù)據(jù)做出分析決策時,由于數(shù)據(jù)和算法本身隱含錯誤、不具備中立性或被人為操控等原因,造成對數(shù)據(jù)主體的差別對待并形成歧視后果。
數(shù)據(jù)混亂造成的數(shù)據(jù)失真會導(dǎo)致機器學習產(chǎn)生偏差。在聲譽經(jīng)濟里,聲譽評分或許會因為一次點擊而受到多方面的影響。申請人的賬號被盜、將電腦借予他人操作或者有意制造與“好信譽”有關(guān)的虛假數(shù)據(jù),這些行為都將造成數(shù)據(jù)無法反映借款人真實情況。雖然在機器學習中,少量存在問題的弱特征另類數(shù)據(jù)并不會對結(jié)果產(chǎn)生極大誤差,人們對數(shù)據(jù)錯誤的寬容度因為樣本量的擴大和對算法的信任得到很大提高。但隨著虛假數(shù)據(jù)的增多,數(shù)據(jù)分析師不再有能力判斷數(shù)據(jù)質(zhì)量。機器使用錯誤的數(shù)據(jù)進行學習和分析,終將導(dǎo)致“無用輸入、無用輸出”的結(jié)果。此外,從數(shù)據(jù)更新速度來看,模型中對諸如社交網(wǎng)絡(luò)數(shù)據(jù)等高頻變化數(shù)據(jù)的大量應(yīng)用,是否會隨著申請者在線行為變化對數(shù)據(jù)的穩(wěn)定性造成影響,以及這種影響程度有多大,類似問題也需在未來的實踐中進一步論證。
不具備中立性和人為操控下的另類數(shù)據(jù)征信,使信貸歧視更加隱秘。在數(shù)據(jù)獲取方式上,數(shù)字足跡等非結(jié)構(gòu)數(shù)據(jù)主要通過爬蟲自動獲取,不僅可以避免人力輸入錯誤,提高數(shù)據(jù)實效性,還能避免傳統(tǒng)金融機構(gòu)中由于信貸員自由裁量權(quán)過大,根據(jù)主觀判斷輕易變更條款,使具有少數(shù)族裔等特征的弱勢金融消費者受到不公平的待遇。同時,另類數(shù)據(jù)集的厚度和維度都大幅度增加,理論上也有助于還原借款者的真實信譽。但“另類數(shù)據(jù)”使“歧視數(shù)據(jù)”和“行為數(shù)據(jù)”的邊界更加模糊,歧視因素變得更加隱秘。加之人們對“相關(guān)關(guān)系”的寬容度增加,對數(shù)據(jù)之間潛在聯(lián)系的理解又十分有限,導(dǎo)致難以察覺到看似不關(guān)聯(lián)的數(shù)據(jù)集成分析時顯示出的歧視特征。因此,機器學習技術(shù)背景下的另類數(shù)據(jù)征信,使信貸歧視更加隱秘。
另類數(shù)據(jù)征信只是從僅專注財務(wù)數(shù)據(jù)擴展為關(guān)注個人的整體素質(zhì),而技術(shù)上的突破仍未改變另類數(shù)據(jù)征信與傳統(tǒng)征信類似的“參照系”評分邏輯。既往研究發(fā)現(xiàn),不同階級間的數(shù)字足跡存在差異并且會對個人發(fā)展造成不同影響,因此另類數(shù)據(jù)的過度應(yīng)用可能進一步拉開階級差距。傳統(tǒng)征信中存在的地域歧視、身份歧視通過技術(shù)處理被更隱秘地帶入算法,固有的“地理歧視”和社交網(wǎng)絡(luò)中“朋友圈”信息引發(fā)的種族、宗教歧視等甚至助長了信貸歧視。雖然,實踐中的確存在“戰(zhàn)略性違約”的情況,但因為借款人處于貧困人口較多的地區(qū)或社交關(guān)系中存在較多的少數(shù)族裔等特殊群體,就判定其同樣具有高違約風險,最終仍未改變信貸歧視的現(xiàn)狀。與法理學中的法官中立基本要求類似,各國的法律中都明確指出不能存在歧視性質(zhì)的數(shù)據(jù),也是為了避免由于不客觀的參照導(dǎo)致不公平的“預(yù)判”。但實際上歧視仍然存在,例如Pope和Sydnor(2011)在Prosper的案例中找到明顯基于種族差異的證據(jù),還發(fā)現(xiàn)借貸市場對老年人和超重人士也存在一定程度的歧視。2020年2月,學生借款人保護中心(Student Borrower Protection Center)的一份報告稱,在5年期貸款中著名黑人大學Howard University的學生要比Yale大學的學生多支付3499美元,多名參議員致函Upstart Network和其他貸款機構(gòu),認為學生信貸過程中使用的教育數(shù)據(jù)可能涉及教育歧視。
新技術(shù)的使用初衷是讓貸款機構(gòu)的決策更趨于理性,而在進行信用評估前就將歧視因素納入其中,機器學習則會因為人類的認知偏差而變得更具主觀色彩,這種主觀歧視是增加數(shù)據(jù)厚度和維度都無法消除的。一些P2P平臺還在機器學習中公開或隱秘地設(shè)置以傳統(tǒng)信用分數(shù)為標準的申請門檻。在表1中,雖然P2P平臺要求申請者達到的傳統(tǒng)信用分數(shù)并不高,但是這一限制卻再次將缺少傳統(tǒng)信用評分的申請者排除在外。同時,根據(jù)LendingClub官網(wǎng)提供的借款人特征,截止到2016年3月,借款人的平均FICO分數(shù)達到近700分,且擁有16.4年的信用記錄歷史。也就是說,很多能在LendingClub成功申請借款的用戶也能在傳統(tǒng)金融機構(gòu)獲得借貸服務(wù)??梢?,P2P平臺使用另類數(shù)據(jù)的主要目的是發(fā)現(xiàn)更有信譽、更優(yōu)質(zhì)的消費者,降低不良貸款率,而非耗費大量人力物力重點挖掘弱勢金融消費者中的優(yōu)質(zhì)借款人。
表1 美國P2P借貸平臺的傳統(tǒng)信用評分要求
借款人透露更多個人信息的初衷是證明好信譽以獲得貸款,而P2P平臺使用另類數(shù)據(jù)的目的源于兩個方面:一是為更好地風險控制,識別欺詐;二是為精準營銷,牟取更大利益。P2P網(wǎng)貸平臺具有“公共使命”下的盈利動機,增強金融普惠,負責任地擴大信貸規(guī)模是一種溢出效應(yīng)。這也是目前國內(nèi)外出現(xiàn)算法歧視的“殺熟”行為的主要原因。大數(shù)據(jù)殺熟是經(jīng)濟學完全價格歧視行為的表象,體現(xiàn)的是新制度經(jīng)濟學中買賣雙方對信息產(chǎn)權(quán)的訴求。[10]與傳統(tǒng)商業(yè)銀行的“交叉銷售”(Cross Selling)推廣手段相似,P2P平臺也使用另類數(shù)據(jù)施行“差別對待”策略。這種歧視性的針對行為將加劇信貸不公平,而潛在借款人甚至不知道自己已經(jīng)被差別對待。綜上,在傳統(tǒng)信用分門檻限制和差別營銷的作用下,另類數(shù)據(jù)的使用實際上提高了特定人群(特別是傳統(tǒng)征信體系中的優(yōu)質(zhì)客戶)獲取信貸產(chǎn)品和服務(wù)的能力,進而擠壓處于劣勢的金融消費群體獲得合適且更高質(zhì)量信貸服務(wù)的空間,增加潛在的不公平。在這一點上,另類數(shù)據(jù)對擴大信貸規(guī)模的作用十分有限。
根據(jù)上文分析,另類數(shù)據(jù)在征信領(lǐng)域的應(yīng)用仍然存在諸多弊端,甚至可能使長期被傳統(tǒng)金融機構(gòu)排斥的金融消費者處于更加弱勢的地位。鑒于此,本文將構(gòu)建金融消費者和網(wǎng)貸平臺的完全信息靜態(tài)博弈模型,通過梳理使用另類數(shù)據(jù)進行征信過程中弱勢金融消費者和網(wǎng)貸平臺可能產(chǎn)生的不同策略選擇,分析另類數(shù)據(jù)在征信領(lǐng)域的應(yīng)用是否有助于促進信貸公平。
(1)參與主體。參與主體為金融消費者和網(wǎng)貸平臺。金融消費者特指由于信用記錄缺失或出錯、種族歧視等原因,被傳統(tǒng)金融機構(gòu)不公平排斥的弱勢金融消費者。網(wǎng)貸平臺指具備另類數(shù)據(jù)進行征信的相關(guān)技術(shù),提供網(wǎng)絡(luò)貸款業(yè)務(wù)的平臺。由于實踐中,金融監(jiān)管機構(gòu)對另類數(shù)據(jù)征信仍處于觀察期,監(jiān)管缺失僅僅引發(fā)網(wǎng)貸平臺在信用評估中是否進行信貸歧視的動機,但不會對金融消費者和網(wǎng)貸平臺造成直接影響,因此不予考慮。
(2)策略集合。博弈雙方具有追求自身利益最大化的傾向。金融消費者的目標是以盡可能低的成本得到金融服務(wù);網(wǎng)貸平臺的目標是降低違約風險,擴大盈利率,保持平臺的健康穩(wěn)定發(fā)展。雙方在博弈中都有兩種策略選擇——金融消費者既可以選擇主動配合提供關(guān)于自己的另類數(shù)據(jù)(即“提供信息”),也可以嘗試保護自己的數(shù)據(jù),盡量不提供給網(wǎng)貸平臺(即“不提供信息”),此時將導(dǎo)致網(wǎng)貸平臺掌握數(shù)據(jù)不足;網(wǎng)貸平臺在金融監(jiān)管缺失、法律定位不明的情況下,既可以為了追求短期利益利用技術(shù)優(yōu)勢在對金融消費者的信貸評估中設(shè)置信貸歧視(即“歧視”),也可以選擇出于為自身健康發(fā)展等長遠考慮不設(shè)置信貸歧視(即“不歧視”)。表2即博弈雙方的策略組合:
表2 博弈雙方的策略組合矩陣
(3)參數(shù)設(shè)置及模型。以美國網(wǎng)貸平臺對另類數(shù)據(jù)的應(yīng)用現(xiàn)狀為基礎(chǔ),將對博弈雙方產(chǎn)生重要影響的相關(guān)要素納入模型。
在金融消費者方面:如果金融消費者不提供信息,網(wǎng)貸平臺將依據(jù)傳統(tǒng)征信評分情況進行授信決策,此時無論網(wǎng)貸平臺是否設(shè)置歧視,另類數(shù)據(jù)都不會使金融消費者的信貸結(jié)果產(chǎn)生變化,即金融消費者被拒絕信貸,額外收益為0。如果金融消費者提供信息且網(wǎng)貸平臺不存在信貸歧視,則可能產(chǎn)生兩種結(jié)果——另類數(shù)據(jù)有助于獲得信貸,則額外收益為C1(C1>0),或者是另類數(shù)據(jù)反而對信貸評分產(chǎn)生負面影響,導(dǎo)致借貸失敗,則額外收益為C1(C1=0)。如果金融消費者提供數(shù)據(jù),而網(wǎng)貸平臺存在信貸歧視,則金融消費者不僅難以獲得信貸,還需額外付出數(shù)據(jù)泄露或受到交叉銷售等差別對待的風險S(S>0)。
在網(wǎng)貸平臺方面:如果金融消費者不提供信息,網(wǎng)貸平臺選擇“歧視”,則由于信息不足拒絕信貸,網(wǎng)貸平臺的額外收益為0;如果金融消費者不提供信息,網(wǎng)貸平臺選擇“不歧視”,平臺額外收益也為0。如果金融消費者提供信息真實,網(wǎng)貸平臺選擇“歧視”,不予授信,則網(wǎng)貸平臺獲得另類數(shù)據(jù)帶來的額外收益R和交叉銷售等其他歧視策略帶來的額外收益I;如果金融消費者提供的信息虛假,導(dǎo)致網(wǎng)貸平臺誤判最終授信,則網(wǎng)貸平臺需承擔額外風險W(W可能大于R+I),此時網(wǎng)絡(luò)平臺總收益為R+I-W。如果消費者提供信息真實,網(wǎng)貸平臺“不歧視”,則網(wǎng)貸平臺獲得另類數(shù)據(jù)帶來的額外收益R;如果消費者提供信息虛假,網(wǎng)貸平臺“不歧視”,則承擔額外風險W(W>0)。
(4)分析結(jié)果。由博弈雙方的收益矩陣表3可見,金融消費者在沒有遭到信貸歧視時,選擇提供信息是最優(yōu)策略。雖然金融消費者提供信息可能存在歧視帶來的風險損失,但是現(xiàn)實生活中另類數(shù)據(jù)造成的信貸歧視多為隱形,消費者無法評估提供信息的損失,因此為了獲得服務(wù)一定會選擇犧牲個人信息,獲得收益C1。從網(wǎng)貸平臺角度看,歧視具有額外收益I,是絕對上策。由此可見,金融消費者深知失去一些隱私是參與和享受信息密集型經(jīng)濟帶來好處的代價,因此希望利用更多另類數(shù)據(jù)評估個人信譽,但在監(jiān)管缺失的情況下,這樣做不僅不會換來公平的金融服務(wù),反而會助長信貸歧視現(xiàn)象。
表3 博弈雙方的收益矩陣
本文通過對美國P2P網(wǎng)絡(luò)借貸平臺的另類數(shù)據(jù)應(yīng)用進行梳理,發(fā)現(xiàn)另類數(shù)據(jù)征信可以增加數(shù)據(jù)的維度和厚度,使個人信譽得到更全面的體現(xiàn),能夠在一定程度上幫助缺少信用記錄和長期受到歧視的少數(shù)族裔等人群爭取更多享受金融服務(wù)的機會。然而,金融科技平臺在利用另類數(shù)據(jù)征信、促進金融普惠的同時,也隱含著“大數(shù)據(jù)殺熟”的情況,而且機器學習下的另類數(shù)據(jù)征信使基于數(shù)字歧視和算法歧視的信貸歧視類型更加隱秘。
根據(jù)弱勢金融消費者與網(wǎng)貸平臺的完全信息靜態(tài)博弈分析可以發(fā)現(xiàn),監(jiān)管的不確定性會限制福利的溢出。政府的正確引導(dǎo)和監(jiān)管部門的積極舉措是另類數(shù)據(jù)征信能否真正擴大金融普惠的重要因素之一。美國P2P網(wǎng)絡(luò)借貸發(fā)展是成熟市場下的業(yè)界典范。雖然,美國監(jiān)管機構(gòu)很早就開始關(guān)注使用另類數(shù)據(jù)是否侵犯消費者的公平信貸權(quán)等問題,但目前無論是美國聯(lián)邦銀行監(jiān)管機構(gòu),還是消費者金融保護局(CFPB)仍然未針對另類數(shù)據(jù)的適當使用以及如何監(jiān)管第三方使用另類數(shù)據(jù)和相關(guān)風險等問題發(fā)布具體的指導(dǎo)。監(jiān)管機構(gòu)認為,另類數(shù)據(jù)或?qū)榭床坏叫庞糜涗浕蛉狈ψ銐蛴涗浀南M者更容易獲得信貸服務(wù)提供契機,應(yīng)該為其提供足夠的發(fā)展空間。因此,在監(jiān)管不確定的情況下,CFPB僅采取向使用另類數(shù)據(jù)的公司發(fā)出“不行動信函”(no-action letter)的辦法,推動有利消費者的金融創(chuàng)新。CFPB也將在金融科技機構(gòu)定期提供的報告中進一步觀察另類數(shù)據(jù)的使用如何幫助金融消費者,以及這些新做法是否合規(guī)。然而,從金融科技借貸機構(gòu)的角度,監(jiān)管的不確定性反而成為另類數(shù)據(jù)助力金融服務(wù)可及性的阻礙。在美國問責局(GAO)2019年的調(diào)查中,部分金融科技貸款機構(gòu)指出缺乏明確指引將成為金融創(chuàng)新和潛在信貸擴張的障礙。雖然很多金融科技機構(gòu)已經(jīng)積極通過各類測試考察其對另類數(shù)據(jù)的使用是否帶來潛在歧視,以及是否違反《平等信貸機會法》等相關(guān)法律,但缺少官方指導(dǎo),機構(gòu)內(nèi)部測試結(jié)果的參考價值有限,另類數(shù)據(jù)不規(guī)范使用可能產(chǎn)生的問題仍然會存續(xù),對促進信貸公平的溢出效應(yīng)有限。綜上可見,由于另類數(shù)據(jù)在征信中的應(yīng)用并不成熟,加之缺乏監(jiān)管細則使金融科技公司對另類數(shù)據(jù)應(yīng)用始終持謹慎的態(tài)度,傳統(tǒng)信用評分和大數(shù)據(jù)征信綜合應(yīng)用,甚至傳統(tǒng)財務(wù)數(shù)據(jù)為主另類數(shù)據(jù)為輔的局面將長期存在。這些都將縮減金融科技貸款機構(gòu)對金融普惠的溢出效應(yīng)。
在數(shù)字經(jīng)濟時代,通過機器學習等先進技術(shù)的深入使用仍然是金融業(yè)的發(fā)展方向之一。一方面,金融科技機構(gòu)要審慎使用新興技術(shù),注意可能存在的風險。另一方面,通過政府的正確引導(dǎo)和監(jiān)管的積極舉措,另類數(shù)據(jù)征信仍然有機會更好地惠及“長尾”人群,促進信貸公平。機器學習是另類數(shù)據(jù)征信的工具,核心仍然是數(shù)據(jù)。在數(shù)字經(jīng)濟時代,會產(chǎn)生大量涉及個人敏感、核心的個人信息,且未進行完整的脫敏化(Data Masking)處理,導(dǎo)致個人信息權(quán)和隱私權(quán)受到侵害。[11]缺乏對個人信息權(quán)及隱私權(quán)的保護,是個人信息被“殺熟”,遭遇信貸歧視的源頭。因此,監(jiān)管部門應(yīng)盡快出臺數(shù)據(jù)保護相關(guān)指引和細則,頒布必要的法律法規(guī),規(guī)范金融科技企業(yè)及第三方數(shù)據(jù)提供機構(gòu)的業(yè)務(wù)。加強數(shù)據(jù)共享鏈條中對個人信息的全鏈條保護,保證用戶對個人數(shù)據(jù)的控制能力。同時,作為維護金融行業(yè)有序發(fā)展的金融監(jiān)管部門,亟須加強對金融科技企業(yè)的業(yè)務(wù)規(guī)范,盡早提供相關(guān)指引。金融科技機構(gòu)不僅要嚴格遵守相關(guān)法律,更要提防數(shù)據(jù)集成后可能存在的隱性歧視。只有這樣,才能有效保護金融消費者權(quán)益,擴大信貸公平,使金融科技機構(gòu)合規(guī)經(jīng)營,促進整個金融科技行業(yè)的有序發(fā)展。