張 晨
(中國人民銀行長春中心支行,吉林長春 130051)
近年來,人工智能、云計(jì)算、大數(shù)據(jù)等新興技術(shù)被廣泛應(yīng)用,更多新型門類信息被作為征信數(shù)據(jù)進(jìn)行采集、分析、加工和使用,全社會在享受數(shù)據(jù)紅利的同時,也面臨著信息不對稱、數(shù)據(jù)采集渠道受限、信息安全難以保障等諸多問題。區(qū)塊鏈技術(shù)具有去中心化、去信任、開放性、自治性、數(shù)據(jù)不可篡改、記錄可追溯等特點(diǎn),對于促進(jìn)征信數(shù)據(jù)流通、打破“信息孤島”、保護(hù)隱私安全等有著天然優(yōu)勢。因此,研究構(gòu)建一個基于區(qū)塊鏈技術(shù)的征信數(shù)據(jù)共享機(jī)制,對于推動我國社會信用體系建設(shè)高質(zhì)量發(fā)展具有積極的現(xiàn)實(shí)意義。
征信數(shù)據(jù)形成渠道多樣,數(shù)據(jù)種類也非常復(fù)雜。既有來自政府的公開信息,也有來自機(jī)構(gòu)的商業(yè)信息;既有金融交易數(shù)據(jù)、市場交易數(shù)據(jù),也有不少社交行為數(shù)據(jù)。各單位為強(qiáng)化自身數(shù)據(jù)維度,或通過技術(shù)手段從互聯(lián)網(wǎng)渠道爬取,或以合作方式進(jìn)行信息交換,或以高價從其他渠道進(jìn)行購買,在數(shù)據(jù)采集的過程中耗費(fèi)了大量人力物力,數(shù)據(jù)共享帶來的收益與成本支出不成正比。與此同時,公權(quán)部門各自為政,資源獨(dú)享的權(quán)屬觀念在各部門間普遍存在;市場化機(jī)構(gòu)利益牽絆,逐漸將數(shù)據(jù)源包裝為自身核心競爭力。因此,各單位將自身采集的征信數(shù)據(jù)共享出去的內(nèi)在動力不足。
數(shù)據(jù)本身具有隱私和價值雙重屬性。隨著數(shù)字經(jīng)濟(jì)時代的到來,各領(lǐng)域的用戶信息被泄露、非法采集、倒賣的事件頻發(fā),不僅侵害了信息主體合法權(quán)益,甚至可能威脅用戶生命財(cái)產(chǎn)安全。因征信數(shù)據(jù)分布廣、價值高等特點(diǎn),共享過程中仍面臨較大安全風(fēng)險(xiǎn)。從制度層面看,對于征信數(shù)據(jù)的所有權(quán)、管理權(quán)和使用權(quán)以及共享責(zé)任主體等,我國法律法規(guī)還不夠具體,可共享的數(shù)據(jù)范圍界定還很模糊;從技術(shù)層面看,征信數(shù)據(jù)共享必然需要多種計(jì)算機(jī)技術(shù)作為支撐,過程中很容易遭到黑客攻擊,導(dǎo)致征信數(shù)據(jù)被截取篡改,并且傳統(tǒng)的技術(shù)架構(gòu)也難以保證信息主體對自身信息的控制權(quán)。因此,基于以上考慮,各單位在對外共享征信數(shù)據(jù)時都秉持著“寧不共享也不冒險(xiǎn)”的原則。
我國尚未形成統(tǒng)一的征信數(shù)據(jù)共享平臺和標(biāo)準(zhǔn)體系,對數(shù)據(jù)格式、質(zhì)量標(biāo)準(zhǔn)、數(shù)據(jù)可讀性、可操作性等均未做出明確要求,不同行業(yè)、不同單位、不同部門等都可能專用一套系統(tǒng)、一組網(wǎng)絡(luò)、一種數(shù)據(jù)標(biāo)準(zhǔn),逐步形成了一個個自我封閉、隔絕的“信息孤島”,信息很難做到互通互聯(lián)。同時,不同“孤島”擁有的數(shù)據(jù)雜亂、重復(fù),數(shù)據(jù)質(zhì)量、更新頻率參差不齊,數(shù)據(jù)真實(shí)性、權(quán)威性很難甄別,給數(shù)據(jù)實(shí)際共享應(yīng)用帶來諸多不便。
區(qū)塊鏈系統(tǒng)的開放性體現(xiàn)在兩個方面:一方面是信息開放。鏈上所有節(jié)點(diǎn)共用一套數(shù)據(jù)標(biāo)準(zhǔn),除了交易各方的私有信息被加密外,鏈上數(shù)據(jù)對所有節(jié)點(diǎn)公開,任何節(jié)點(diǎn)都可以通過公開的接口查詢鏈上數(shù)據(jù)和開發(fā)相關(guān)應(yīng)用,省去了現(xiàn)階段數(shù)據(jù)共享過程中統(tǒng)一數(shù)據(jù)規(guī)范、改造系統(tǒng)接口等環(huán)節(jié),大大降低了接入門檻。另一方面是組織結(jié)構(gòu)開放。任何單位都可以作為區(qū)塊鏈上的某一節(jié)點(diǎn),自由加入或退出區(qū)塊鏈網(wǎng)絡(luò),不受第三方機(jī)構(gòu)的控制,掃清了以往因跨地域、跨行業(yè)、跨網(wǎng)絡(luò)、跨系統(tǒng)等帶來的共享阻礙,使得有數(shù)據(jù)共享意愿的單位可以輕松上鏈,為全行業(yè)互聯(lián)互通提供了可能。
一方面,區(qū)塊鏈?zhǔn)褂梅植际胶怂愫痛鎯?,不存在中心化的硬件或管理機(jī)構(gòu),所有節(jié)點(diǎn)的權(quán)利和義務(wù)均等,既可以對外發(fā)布信息,也可以獲取到相同的公開信息,避免了因信息不對稱造成的采集渠道受限的情況,從而弱化了數(shù)據(jù)的稀有屬性。另一方面,區(qū)塊鏈?zhǔn)且揽抗?jié)點(diǎn)間遵從一套公開透明的一致性算法進(jìn)行維護(hù)和管理的,其去信任的特點(diǎn)不是不需要信任,而是將信任的對象從交易參與方變成了底層協(xié)議,實(shí)現(xiàn)所有節(jié)點(diǎn)在互不信任且無需第三方背書的情況下進(jìn)行數(shù)據(jù)共享,避免了第三方介入的中介支出。因此,區(qū)塊鏈去中心化和去信任的特點(diǎn)可以大幅降低數(shù)據(jù)采集成本,不僅能提升各單位數(shù)據(jù)共享的積極性,也能促使其將更多資金投向模型創(chuàng)建、數(shù)據(jù)分析、產(chǎn)品創(chuàng)新等方面。
一是非對稱加密,即使用“密鑰對”來加密解密數(shù)據(jù)。密鑰對包含兩部分,一個公鑰,是對外公開的部分,任何人都可以獲得;另一個私鑰,是非公開的部分,每個節(jié)點(diǎn)專屬。發(fā)送數(shù)據(jù)時,需要使用自身的私鑰和接收節(jié)點(diǎn)的公鑰對數(shù)據(jù)進(jìn)行加密;接收數(shù)據(jù)時,則使用發(fā)送節(jié)點(diǎn)的公鑰和自身的私鑰進(jìn)行解密。整個過程只有交易雙方可以看到數(shù)據(jù),規(guī)避了數(shù)據(jù)泄露風(fēng)險(xiǎn)。二是共識機(jī)制,即區(qū)塊鏈上所有節(jié)點(diǎn)或大部分節(jié)點(diǎn)就某一提案的真實(shí)性和有效性快速達(dá)成一致的機(jī)制。這就意味著,區(qū)塊鏈上任一數(shù)據(jù)的上鏈或修改,必須經(jīng)由大部分節(jié)點(diǎn)授權(quán)同意才能進(jìn)行,不僅保證了數(shù)據(jù)質(zhì)量,也大大增加了數(shù)據(jù)被惡意篡改的成本代價。三是時間戳,是一段能夠表示一份數(shù)據(jù)在某個特定時間點(diǎn)已經(jīng)存在的完整的、可驗(yàn)證的數(shù)據(jù)。區(qū)塊鏈?zhǔn)且环N“塊-鏈?zhǔn)健睌?shù)據(jù)結(jié)構(gòu),所有信息都保存在區(qū)塊中,每一個新區(qū)塊生成時,不僅會保存上一區(qū)塊的相關(guān)信息,同時還會被打上時間戳,區(qū)塊依照生成時間的先后順序連接形成區(qū)塊鏈。這種設(shè)計(jì)使更改一條數(shù)據(jù)的難度按時間的指數(shù)倍增加,越早的數(shù)據(jù)篡改的代價越大;同時,也使得區(qū)塊鏈上任意一條數(shù)據(jù)都可以按時序追溯其本源,可以有效解決節(jié)點(diǎn)間爭議。區(qū)塊鏈的這三項(xiàng)核心技術(shù),從傳輸、存儲、追溯等環(huán)節(jié)共同保障了鏈上數(shù)據(jù)安全,實(shí)現(xiàn)了對信息主體的隱私保護(hù)。
根據(jù)區(qū)塊鏈的去中心化程度,可以將其分為公有鏈、私有鏈、聯(lián)盟鏈三類。公有鏈被認(rèn)為是“完全去中心化”的,任何節(jié)點(diǎn)都有權(quán)利讀取數(shù)據(jù)、參與交易及共識過程;私有鏈則是“完全中心化”的,其公開程度由一個中心組織決定,所有參與到這個區(qū)塊鏈中的節(jié)點(diǎn)都會被嚴(yán)格控制;聯(lián)盟鏈?zhǔn)恰岸嘀行幕钡?,其由多個機(jī)構(gòu)共同參與管理,每個組織或機(jī)構(gòu)管理一個或多個節(jié)點(diǎn),鏈上數(shù)據(jù)只允許系統(tǒng)內(nèi)機(jī)構(gòu)進(jìn)行讀寫和發(fā)送。三者相比,公有鏈的開放程度最高,但因需要大多數(shù)節(jié)點(diǎn)參與共識導(dǎo)致運(yùn)行速度慢、效率低;而私有鏈和聯(lián)盟鏈則削弱了中心化屬性,更加側(cè)重于數(shù)據(jù)安全和維護(hù)效率。
區(qū)塊鏈的三種類型也剛好對應(yīng)征信數(shù)據(jù)共享的三種模式:一是“公有鏈”模式,即構(gòu)建一個龐大的區(qū)塊鏈網(wǎng)絡(luò),所有擁有征信數(shù)據(jù)的單位都可以自由選擇數(shù)據(jù)上鏈或退出。此模式雖然能夠拓寬數(shù)據(jù)采集渠道,解決“征信數(shù)據(jù)孤島”問題,但數(shù)據(jù)共享過程效率較低,且政府職能被完全弱化,不利于監(jiān)管。二是“私有鏈”模式,即構(gòu)建一個以區(qū)塊鏈為底層框架的全國性征信平臺,由某一特定的國家監(jiān)管部門進(jìn)行管理,對節(jié)點(diǎn)接入實(shí)行嚴(yán)格把控。此模式雖然保證了數(shù)據(jù)安全和交易效率,但監(jiān)管職能被過分放大,數(shù)據(jù)擴(kuò)充、整合需要多部門協(xié)調(diào)配合,成本高、見效慢。三是“聯(lián)盟鏈”模式,即運(yùn)用區(qū)塊鏈技術(shù)將現(xiàn)有存儲征信數(shù)據(jù)的數(shù)據(jù)庫相互連接,并選取部分單位作為預(yù)選節(jié)點(diǎn)參與共識過程。此模式相當(dāng)于是前兩種模式的折中方案,在保證數(shù)據(jù)安全與交易效率的同時,盡可能多地?cái)U(kuò)大數(shù)據(jù)來源,并能對鏈上交易行為進(jìn)行有效監(jiān)管?;谡餍艛?shù)據(jù)共享的特殊性,顯然選擇“聯(lián)盟鏈”模式最為恰當(dāng)。
目前,中國人民銀行構(gòu)建的“長三角征信鏈應(yīng)用平臺”和“珠三角征信鏈應(yīng)用平臺”就是“聯(lián)盟鏈”模式下的的實(shí)踐成果。雖然現(xiàn)階段兩個平臺都實(shí)現(xiàn)了區(qū)域內(nèi)企業(yè)征信數(shù)據(jù)共享互通,對區(qū)域經(jīng)濟(jì)發(fā)展起到了推動作用,但隨著征信機(jī)構(gòu)和數(shù)據(jù)源單位的不斷增多,共識節(jié)點(diǎn)的數(shù)量也將不斷攀升,交易效率面臨持續(xù)下降的風(fēng)險(xiǎn),平臺發(fā)展必將受阻。若各地均以此模式構(gòu)建地方性征信平臺,全國形成“百花齊放”的局面,則很有可能因不同區(qū)塊鏈缺乏統(tǒng)一標(biāo)準(zhǔn)而造成新的“數(shù)據(jù)孤島”。
因此,本文提出一種基于“聯(lián)盟鏈”模式的改進(jìn)的征信數(shù)據(jù)共享機(jī)制。即,構(gòu)建一個標(biāo)準(zhǔn)統(tǒng)一的全國性區(qū)塊鏈網(wǎng)絡(luò),信息主體、監(jiān)管部門、數(shù)據(jù)源單位、數(shù)據(jù)需求方等均作為聯(lián)盟鏈條上的參與節(jié)點(diǎn),通過劃分節(jié)點(diǎn)等級來實(shí)現(xiàn)有效監(jiān)管,通過固定共識節(jié)點(diǎn)數(shù)量來保證交易效率,通過社區(qū)投票來保障競爭共識節(jié)點(diǎn)的公平性,通過建設(shè)應(yīng)用平臺實(shí)現(xiàn)資質(zhì)審核、權(quán)限管理、數(shù)據(jù)共享等功能??傮w架構(gòu)如圖1所示。
圖1 區(qū)塊鏈征信數(shù)據(jù)共享總體架構(gòu)
實(shí)用拜占庭容錯(簡稱PBFT)算法是一種解決拜占庭容錯問題的副本復(fù)制算法,其最多能容忍1/3的共識節(jié)點(diǎn)作惡,共識效率高,是目前公認(rèn)的能夠應(yīng)用于聯(lián)盟鏈的一種有效算法。但將PBFT算法直接應(yīng)用在征信數(shù)據(jù)共享機(jī)制中會存在問題:PBFT算法需要節(jié)點(diǎn)之間大量的兩兩交互,對網(wǎng)絡(luò)通信量和網(wǎng)絡(luò)帶寬消耗很大,效率也會隨著共識節(jié)點(diǎn)數(shù)的增多而不斷下降。
委托股權(quán)證明(簡稱DPoS)算法是通過社區(qū)投票的方式,選出一定數(shù)量的節(jié)點(diǎn)作為全部節(jié)點(diǎn)的代表進(jìn)行共識,在公有鏈中可以達(dá)到秒級的共識驗(yàn)證。但此種方式同樣有個缺陷,即很難保證選出的共識節(jié)點(diǎn)真正具有代表性。
本文參考了DPoS算法的工作思路,對PBFT算法進(jìn)行了改進(jìn):
首先,重新定義了節(jié)點(diǎn)類型。將所有節(jié)點(diǎn)分為三類,分別是監(jiān)管共識節(jié)點(diǎn)、交易共識節(jié)點(diǎn)和交易普通節(jié)點(diǎn)。監(jiān)管共識節(jié)點(diǎn)為最高級別節(jié)點(diǎn),在同步賬本數(shù)據(jù)、參與共識的同時,還負(fù)責(zé)對數(shù)據(jù)共享平臺、相關(guān)主體進(jìn)行管理與授權(quán),主要由人民銀行等監(jiān)管部門維護(hù);交易共識節(jié)點(diǎn)為中間級別節(jié)點(diǎn),除可進(jìn)行數(shù)據(jù)交易之外,還需同步賬本數(shù)據(jù)并參與共識過程,主要由少量有影響力的數(shù)據(jù)源單位維護(hù);交易普通節(jié)點(diǎn)為最低級別節(jié)點(diǎn),只可進(jìn)行數(shù)據(jù)交易并同步賬本數(shù)據(jù),主要由數(shù)據(jù)需求方、其他數(shù)據(jù)源單位和信息主體等維護(hù)。
其次,對參與共識的節(jié)點(diǎn)數(shù)量進(jìn)行了限制。共識節(jié)點(diǎn)總量控制在100個以下,每個省份固定分配一個監(jiān)管共識節(jié)點(diǎn)和一個交易共識節(jié)點(diǎn),并視各地發(fā)展情況適當(dāng)擴(kuò)大交易共識節(jié)點(diǎn)范圍。交易普通節(jié)點(diǎn)數(shù)量不做限制。
最后,動態(tài)選取交易共識節(jié)點(diǎn)。在整個區(qū)塊鏈網(wǎng)絡(luò)中,監(jiān)管共識節(jié)點(diǎn)不參加交易過程則無需變動,而交易共識節(jié)點(diǎn)扮演著“裁判員”和“運(yùn)動員”的雙重角色,因此,選取交易共識節(jié)點(diǎn)的公平性至關(guān)重要。在每次交易完成后,交易普通節(jié)點(diǎn)需對數(shù)據(jù)源單位提供的服務(wù)進(jìn)行打分投票,改進(jìn)后的PBFT算法根據(jù)投票分?jǐn)?shù)選取排名靠前的數(shù)據(jù)源單位作為共識節(jié)點(diǎn)。當(dāng)作為交易共識節(jié)點(diǎn)的數(shù)據(jù)源單位出錯時,通過相關(guān)協(xié)議將該共識節(jié)點(diǎn)替換為當(dāng)前排名最靠前的交易普通節(jié)點(diǎn),從而最大程度保障交易效率和服務(wù)質(zhì)量。
本文假定,所有征信數(shù)據(jù)的摘要信息均已上鏈,只討論數(shù)據(jù)共享流程。如圖2所示。具體如下:
圖2 區(qū)塊鏈征信數(shù)據(jù)共享流程
1、數(shù)據(jù)需求方向平臺提出數(shù)據(jù)請求任務(wù),除包括要采集的數(shù)據(jù)內(nèi)容及相應(yīng)格式外,還包括對所屬信息主體的授權(quán)申請;2、平臺將數(shù)據(jù)請求任務(wù)上鏈存證;3、平臺通過對整個區(qū)塊鏈網(wǎng)絡(luò)內(nèi)摘要信息進(jìn)行檢索,找到所有相關(guān)信息主體并轉(zhuǎn)發(fā)授權(quán)申請;4、信息主體授權(quán)后向平臺發(fā)送自己簽名后的授權(quán)信息;5、平臺將授權(quán)信息上鏈存證;6、平臺根據(jù)數(shù)據(jù)需求方提出的請求信息,檢索找到所有相關(guān)數(shù)據(jù)源單位并發(fā)送提數(shù)申請;7、數(shù)據(jù)源單位向平臺發(fā)送定價策略;8、平臺將定價信息上鏈存證;9、平臺向數(shù)據(jù)需求方轉(zhuǎn)發(fā)定價信息;10、數(shù)據(jù)需求方支付后將支付信息及數(shù)據(jù)庫地址發(fā)送至平臺;11、平臺將支付信息上鏈存證;12、平臺向數(shù)據(jù)源單位返回支付信息及數(shù)據(jù)需求方的數(shù)據(jù)庫地址;13、數(shù)據(jù)源單位確認(rèn)收到支付信息后,根據(jù)請求的數(shù)據(jù)內(nèi)容和格式向數(shù)據(jù)需求方發(fā)送相關(guān)數(shù)據(jù);14、數(shù)據(jù)源單位數(shù)據(jù)發(fā)送完成后,向平臺反饋數(shù)據(jù)發(fā)送完成信息;15、平臺將數(shù)據(jù)發(fā)送完成信息上鏈存證;16、平臺將數(shù)據(jù)發(fā)送完成信息返回給數(shù)據(jù)需求方;17、數(shù)據(jù)需求方確認(rèn)收到數(shù)據(jù)后向平臺發(fā)送接收報(bào)告信息;18、平臺將報(bào)告接收信息上鏈存證。
本文提出的共享機(jī)制中,為確保整個區(qū)塊鏈網(wǎng)絡(luò)的交易效率,將監(jiān)管共識節(jié)點(diǎn)設(shè)定為每個省份分配一個,但征信數(shù)據(jù)涉及領(lǐng)域眾多,每個領(lǐng)域都可能有一個或多個部門進(jìn)行監(jiān)管,同一領(lǐng)域的監(jiān)管部門在不同省份也可能不同,同一部門在不同省份話語權(quán)也可能會有差別,因而也就產(chǎn)生一個問題:監(jiān)管共識節(jié)點(diǎn)究竟由誰來維護(hù)?建議前期先由多部門共同維護(hù),待相關(guān)權(quán)責(zé)進(jìn)一步明確或整合后,可由某一部門代為維護(hù),或是重新組建一個新部門進(jìn)行維護(hù)。
區(qū)塊鏈解決的是鏈上信任問題,通過哈希算法、共識機(jī)制、時間戳等技術(shù)確保了鏈上數(shù)據(jù)不可篡改,但若上鏈的數(shù)據(jù)本身就存在質(zhì)量問題,其不可篡改的屬性也就毫無意義。而鏈下數(shù)據(jù)質(zhì)量需各節(jié)點(diǎn)自身依靠相應(yīng)的技術(shù)工具、管理手段、組織體系等予以保障,某一節(jié)點(diǎn)的數(shù)據(jù)治理缺失都可能會對整個區(qū)塊鏈的運(yùn)行效果造成影響。建議成立數(shù)據(jù)質(zhì)量評估聯(lián)盟,通過采用已有的數(shù)據(jù)治理評價模型,對各節(jié)點(diǎn)鏈下數(shù)據(jù)治理情況進(jìn)行考核,從而達(dá)到督促各方提高上鏈的數(shù)據(jù)質(zhì)量的目標(biāo)。
在移動通信發(fā)展初期,1G無線系統(tǒng)因受到網(wǎng)絡(luò)容量的限制只能傳輸語音流量,并存在著很多諸如串號、盜號等問題,將其民用化的典型代表——“大哥大”的公開售價更是高達(dá)2萬元。盡管如此,但人們認(rèn)識到了無線通信的巨大前景,因此堅(jiān)持致力于通過改善基礎(chǔ)設(shè)施和創(chuàng)新通信技術(shù)來提高通信效率、降低應(yīng)用成本。如今,區(qū)塊鏈交易就面臨著當(dāng)年1G剛剛民用時的困境:既慢又貴。隨著我國社會信用體系的不斷完善,將會有越來越多的數(shù)據(jù)源單位、信息主體、數(shù)據(jù)需求方等加入到征信數(shù)據(jù)共享體制當(dāng)中,屆時整個區(qū)塊鏈網(wǎng)絡(luò)的并發(fā)交易量將會大幅提升,到達(dá)極限時勢必造成網(wǎng)絡(luò)擁堵,并導(dǎo)致大量交易的確認(rèn)延遲。針對區(qū)塊鏈交易效率低的問題,相關(guān)科技公司也提出了一些解決方案,比如增加塊大小、脫鏈、委托共識、分片等,但在實(shí)踐中還并不成熟。因此,政府應(yīng)加大政策扶持力度,鼓勵企業(yè)積極開展區(qū)塊鏈應(yīng)用;深化校企交流合作,推動相關(guān)科研項(xiàng)目落實(shí)落地;在重點(diǎn)高校設(shè)立相關(guān)課程,培養(yǎng)區(qū)塊鏈領(lǐng)域的創(chuàng)新型人才,推動區(qū)塊鏈行業(yè)快速健康發(fā)展。