近年來,我國公共數(shù)據(jù)開放在制度建設(shè)、平臺建設(shè)、數(shù)據(jù)供給、生態(tài)應(yīng)用等方面取得了一定的成績,但數(shù)據(jù)開放過程中還存在一些風(fēng)險和問題,使得我國公共數(shù)據(jù)開放明顯不足。公共數(shù)據(jù)開放不足的問題在較大程度上受制于數(shù)據(jù)開放與數(shù)據(jù)安全之間的平衡困境。隱私計算“原始數(shù)據(jù)不出庫、數(shù)據(jù)可用不可見”“數(shù)據(jù)使用可控可計量”“計算分布式、監(jiān)管有中心”的特征,天然契合公共數(shù)據(jù)開放業(yè)務(wù)需求,可幫助數(shù)據(jù)提供方、公共數(shù)據(jù)開放平臺管理方以及數(shù)據(jù)使用方等主體在不同場景中發(fā)揮價值,助推公共數(shù)據(jù)開放邁入新階段。
一、我國公共數(shù)據(jù)開放水平逐步提升
近年來,我國已開始全面部署和推行公共數(shù)據(jù)開放制度,省市地方政府公共數(shù)據(jù)開放平臺數(shù)量逐年增長,全國范圍內(nèi)正加速形成適用于激發(fā)公共數(shù)據(jù)要素價值的基礎(chǔ)環(huán)境。在制度建設(shè)方面,與公共數(shù)據(jù)開放相關(guān)的法律法規(guī)、實施細(xì)則、標(biāo)準(zhǔn)規(guī)范等陸續(xù)出臺,制度體系不斷完善。2022年12月,《中共中央國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》強(qiáng)調(diào),對各級黨政機(jī)關(guān)、企事業(yè)單位依法履職或提供公共服務(wù)過程中產(chǎn)生的公共數(shù)據(jù),加強(qiáng)匯聚共享和開放開發(fā)?!丁皵?shù)據(jù)要素×”三年行動計劃(2024—2026年)》(國數(shù)政策〔2023〕11號)明確指出,打造安全可信流通環(huán)境,深化隱私計算、可信數(shù)據(jù)空間、區(qū)塊鏈等技術(shù)應(yīng)用,充分依托已有設(shè)施,探索建設(shè)重點行業(yè)和領(lǐng)域數(shù)據(jù)流通平臺,促進(jìn)數(shù)據(jù)合規(guī)高效流通使用。2024年10月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)《關(guān)于加快公共數(shù)據(jù)資源開發(fā)利用的意見》,指出要破除公共數(shù)據(jù)流通使用的體制性障礙、機(jī)制性梗阻,激發(fā)共享開放動力,優(yōu)化公共數(shù)據(jù)資源配置,釋放市場創(chuàng)新活力,充分發(fā)揮數(shù)據(jù)要素放大、疊加、倍增效應(yīng),為不斷做強(qiáng)做優(yōu)做大數(shù)字經(jīng)濟(jì)、構(gòu)筑國家競爭新優(yōu)勢提供堅實支撐。在平臺建設(shè)方面,各地公共數(shù)據(jù)開放平臺的功能逐漸擴(kuò)展和優(yōu)化,運(yùn)營維護(hù)能力不斷提升。截至2024年7月,我國已有243個省級和城市的地方政府上線了數(shù)據(jù)開放平臺,開放的有效數(shù)據(jù)集超過了37萬個,最近八年來增長了44倍。在數(shù)據(jù)供給方面,目前全國開放數(shù)據(jù)集數(shù)量從2017年的8000多個增加到2023年的34萬多個,各地平臺無條件開放的可下載數(shù)據(jù)集的容量從2019年的15億增長到2023年超480億,開放數(shù)據(jù)的數(shù)量與質(zhì)量穩(wěn)步提升。在生態(tài)應(yīng)用方面,企業(yè)、公眾等社會主體越來越多地參與利用開放數(shù)據(jù)。目前,全國17個省(市)、10個副省級城市開展了公共數(shù)據(jù)授權(quán)運(yùn)營實踐,形成了一定數(shù)量的應(yīng)用成果。例如廈門市的數(shù)據(jù)安全屋、上海市的安全沙箱、青島市的數(shù)字實驗室等。
與國外對比,我國公共數(shù)據(jù)開放起步較晚,制度體系還需進(jìn)一步完善。2000年,德國通過實施《信息自由法》等系列法律,明確政府?dāng)?shù)據(jù)的公開性和透明化原則,界定個人和政府?dāng)?shù)據(jù)安全有關(guān)問題。2003年11月,歐盟發(fā)布《公共部門的信息再利用指令》,認(rèn)為有必要為公共部門信息再利用構(gòu)建一個總體框架,形成公平、均衡和非歧視性的環(huán)境。2009年,美國奧巴馬政府頒布《開放政府指令》,全球開始掀起政府?dāng)?shù)據(jù)開放浪潮。隨后,美國頒布《透明和開放的政府備忘錄》《開放數(shù)據(jù)政策》《開放政府?dāng)?shù)據(jù)法案》,將政府?dāng)?shù)據(jù)開放逐步合法化;頒布《隱私保護(hù)指令》,強(qiáng)調(diào)開放數(shù)據(jù)過程中要注意對個人隱私權(quán)的保護(hù)。2016年10月,法國頒布《“數(shù)字共和國”法案》,強(qiáng)調(diào)政府?dāng)?shù)據(jù)開放和數(shù)據(jù)安全。
從社會大眾對公共數(shù)據(jù)開放的需求來看,我國各級政府、公共機(jī)構(gòu)對公共數(shù)據(jù)的供給明顯不足,加上尚待完善的制度體系,不愿、不敢、不會開放的情況依然較為普遍,大部分公共數(shù)據(jù)沒有充分發(fā)揮數(shù)據(jù)資源作為“生產(chǎn)要素、無形資產(chǎn)和社會財富”的應(yīng)有作用。
二、我國數(shù)據(jù)開放存在的問題和風(fēng)險
目前,我國公共數(shù)據(jù)開放不足的問題在較大程度上受制于數(shù)據(jù)開放與數(shù)據(jù)安全之間的平衡困境。在開放過程中存在的各類安全隱患增加了數(shù)據(jù)管理平臺所承擔(dān)的風(fēng)險,降低了數(shù)據(jù)提供部門開放數(shù)據(jù)的意愿和動力,導(dǎo)致數(shù)據(jù)供給部門在數(shù)據(jù)數(shù)量、數(shù)據(jù)質(zhì)量、開放范圍等方面較為保守,未能充分滿足社會對公共數(shù)據(jù)開放利用的需求。
(一)數(shù)據(jù)提供方不愿、不敢、不會開放數(shù)據(jù)
第一,不愿開放。一方面是認(rèn)識的問題,一些政府部門和公共機(jī)構(gòu)尚未意識到數(shù)據(jù)開放的價值;另一方面是“衙門”思想的問題,一些政府部門和公共機(jī)構(gòu)把自己掌握和獲取的數(shù)據(jù),作為自己利益和權(quán)力的一部分,造成不同部門之間甚至同一部門不同機(jī)構(gòu)之間都難以實現(xiàn)數(shù)據(jù)開放。第二,不敢開放。主要是由于我國目前尚缺乏嚴(yán)格規(guī)范數(shù)據(jù)開放的法規(guī)制度,相關(guān)人員擔(dān)心政府?dāng)?shù)據(jù)開放會引起信息安全問題,擔(dān)心數(shù)據(jù)泄密和失控,對數(shù)據(jù)開放具有恐懼感。第三,不會開放。公共數(shù)據(jù)開放是一個高度專業(yè)化的工作,需要分級分類、收放結(jié)合、科學(xué)把握。但目前我國尚未出臺相關(guān)法律對數(shù)據(jù)開放的基本原則、數(shù)據(jù)格式、質(zhì)量標(biāo)準(zhǔn)、可用性、操作性等做出規(guī)范要求,導(dǎo)致政府部門和公共機(jī)構(gòu)數(shù)據(jù)開放能力不強(qiáng)、水平不高、質(zhì)量不佳,嚴(yán)重制約了大數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源的開發(fā)應(yīng)用和價值釋放。
(二)數(shù)據(jù)管理平臺風(fēng)險加劇
一方面是數(shù)據(jù)匯聚與存儲的風(fēng)險。當(dāng)前我國公共數(shù)據(jù)開放主要采用“部門數(shù)據(jù)供給—數(shù)據(jù)資源匯集—數(shù)據(jù)平臺開放”的形式,數(shù)據(jù)供給過程中存在數(shù)據(jù)泄露、數(shù)據(jù)篡改、數(shù)據(jù)被重新識別等隱患。數(shù)據(jù)平臺作為數(shù)據(jù)存儲方存在被惡意攻擊、數(shù)據(jù)泄露等安全隱患,平臺的安全防護(hù)面臨較大壓力。另一方面是數(shù)據(jù)流通與利用的風(fēng)險。數(shù)據(jù)提供到數(shù)據(jù)平臺后,平臺對部分?jǐn)?shù)據(jù)缺乏監(jiān)測與控制,無法對數(shù)據(jù)利用過程及結(jié)果進(jìn)行追蹤,難以監(jiān)管數(shù)據(jù)應(yīng)用的合規(guī)性與正當(dāng)性,且現(xiàn)行脫敏技術(shù)手段并不能解決所有的隱私問題,在數(shù)據(jù)利用過程中仍有通過數(shù)據(jù)拼湊還原個體數(shù)據(jù)的可能,使個人信息面臨泄露風(fēng)險。目前我國尚未制定統(tǒng)一的公共數(shù)據(jù)分類分級標(biāo)準(zhǔn),各地方各部門對數(shù)據(jù)安全的管控手段主要還是以嚴(yán)格控制數(shù)據(jù)出域和嚴(yán)格制定數(shù)據(jù)獲取條件為主,因此間接導(dǎo)致了數(shù)據(jù)供給不足和數(shù)據(jù)獲取門檻過高等問題。
(三)數(shù)據(jù)使用方效益不佳
總體來看,市場和社會對公共數(shù)據(jù)的需求尚未得到充分滿足,主要表現(xiàn)為開放數(shù)據(jù)數(shù)量不多、容量較低、質(zhì)量不高。在已開放數(shù)據(jù)中普遍存在字段少、條數(shù)少、顆粒度較粗等問題。此外,在已開放數(shù)據(jù)中還存在高缺失、低容量、碎片化等低質(zhì)量數(shù)據(jù),數(shù)據(jù)利用價值較低。數(shù)據(jù)開放不足造成了利用端的成果數(shù)量不多、質(zhì)量不高等問題。
三、隱私計算推進(jìn)公共數(shù)據(jù)安全開放邁入新階段
隱私計算“原始數(shù)據(jù)不出庫、數(shù)據(jù)可用不可見”“數(shù)據(jù)用法可控可計量”“計算分布式、監(jiān)管有中心”的特征,天然契合公共數(shù)據(jù)開放業(yè)務(wù)需求,可幫助數(shù)據(jù)提供方、公共數(shù)據(jù)開放平臺管理方以及數(shù)據(jù)使用方等主體在不同業(yè)務(wù)場景中發(fā)揮價值,推進(jìn)公共數(shù)據(jù)開放邁入新階段。
(一)特征優(yōu)勢顯著,契合數(shù)據(jù)開放需求
一是原始數(shù)據(jù)不出庫、數(shù)據(jù)可用不可見。目前,國內(nèi)隱私計算廠商的產(chǎn)品多采用聯(lián)邦學(xué)習(xí)和多方安全計算兩種技術(shù)路線的結(jié)合體。聯(lián)邦學(xué)習(xí)可實現(xiàn)多個數(shù)據(jù)持有方主體在其原始數(shù)據(jù)無需出本地數(shù)據(jù)庫的前提下進(jìn)行多方協(xié)作建模,即“原始數(shù)據(jù)不出庫”。多方安全計算通過密碼學(xué)技術(shù)實現(xiàn)原始數(shù)據(jù)對人和機(jī)器的不可見,但原始數(shù)據(jù)的價值被計算獲得,即“數(shù)據(jù)可用不可見”。二是數(shù)據(jù)使用可控可計量。隱私計算是在多方數(shù)據(jù)共同參與協(xié)作下完成,最終的計算結(jié)果(服務(wù))需獲得計算方同意才能使用。數(shù)據(jù)按算法使用,服務(wù)按次數(shù)調(diào)用,可做到“數(shù)據(jù)使用可控可計量”。三是計算分布式、監(jiān)管有中心。從隱私計算產(chǎn)品架構(gòu)設(shè)計來看,實現(xiàn)了“計算分布式、監(jiān)管有中心”。監(jiān)管方可以通過部署一個中心管控節(jié)點(平臺)做到對參與計算各方全局的控制,包括計算方準(zhǔn)入控制和計算規(guī)則及指令下發(fā)等,但監(jiān)管方無需參與計算。
(二)集中資源邏輯,減輕數(shù)據(jù)存儲壓力
在隱私計算技術(shù)“原始數(shù)據(jù)不出庫、數(shù)據(jù)可用不可見”的新型數(shù)據(jù)流通模式下,公共數(shù)據(jù)資源可實現(xiàn)“邏輯集中、物理分散”,即公共數(shù)據(jù)目錄要集中匯集至平臺,而公共數(shù)據(jù)資源可分散存儲在各數(shù)據(jù)提供方本地。通過統(tǒng)一的公共數(shù)據(jù)目錄,數(shù)據(jù)使用方可根據(jù)相關(guān)需求開發(fā)利用有關(guān)數(shù)據(jù)資源,使用時可申請通過隱私計算方式進(jìn)行獲取。這種新型數(shù)據(jù)匯集模式具有三方面的優(yōu)勢:一是可以有效降低公共數(shù)據(jù)安全風(fēng)險;二是可以最大限度匯集全社會可開放數(shù)據(jù);三是可以極大減輕公共數(shù)據(jù)監(jiān)管方的數(shù)據(jù)存儲壓力。
(三)升級平臺功能,保障數(shù)據(jù)安全開放
在《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個人信息保護(hù)法》的驅(qū)動下,公共數(shù)據(jù)開放平臺將進(jìn)行增強(qiáng)數(shù)據(jù)安全能力的功能升級。傳統(tǒng)的數(shù)據(jù)安全技術(shù)多以保障平臺內(nèi)部數(shù)據(jù)靜態(tài)安全為主,即數(shù)據(jù)不被越權(quán)訪問、不被違規(guī)獲取等,重點以數(shù)據(jù)加密、數(shù)據(jù)脫敏、數(shù)據(jù)識別等技術(shù)為主。隱私計算技術(shù)“計算分布式、監(jiān)管有中心”的特征可以有效保障數(shù)據(jù)流通過程中的安全性。
(四)優(yōu)化供給方式,提高數(shù)據(jù)使用效益
供給方式的優(yōu)化重點體現(xiàn)在對有條件開放數(shù)據(jù)的方式上,傳統(tǒng)API接口盡管在一定程度上保障了數(shù)據(jù)的安全性和及時性,但當(dāng)參數(shù)發(fā)生變化時,API接口改造成本較高,而且數(shù)據(jù)提供方對不同API接口的管理和維護(hù)成本也較高。通過隱私計算方式進(jìn)行數(shù)據(jù)供給,可在很大程度上保障公共數(shù)據(jù)的安全性、自主性和靈活性。隱私計算平臺“數(shù)據(jù)用法可控可計量”的特征,可實現(xiàn)對數(shù)據(jù)用法用量的管控授權(quán),即數(shù)據(jù)提供方可對不同權(quán)限的用戶提供字段和顆粒度不同的數(shù)據(jù),而且可以指定數(shù)據(jù)用途、使用時間、使用次數(shù)等。數(shù)據(jù)使用方在獲得數(shù)據(jù)及隱私計算服務(wù)申請授權(quán)后,可直接在隱私計算平臺進(jìn)行開發(fā)利用,有效提升數(shù)據(jù)開發(fā)利用的敏捷性,降低開發(fā)利用成本。
(作者單位:國家信息中心)