国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)探討

2020-09-19 08:02
網(wǎng)絡(luò)安全和信息化 2020年9期
關(guān)鍵詞:原始數(shù)據(jù)數(shù)據(jù)保護(hù)聯(lián)邦

編者按:本文分析了聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的不兼容性和融合契機(jī),梳理了適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù),探討構(gòu)建了基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,提出了面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略,為解決不同數(shù)據(jù)所有方在數(shù)據(jù)湖中共同安全、合規(guī)的使用數(shù)據(jù)資源等提供了具體的技術(shù)建議。

隨著各國的數(shù)據(jù)保護(hù)法律、政策陸續(xù)出臺(tái),如何在合規(guī)使用數(shù)字資產(chǎn)的前提下,共享數(shù)據(jù)價(jià)值、保障經(jīng)濟(jì)效益正在影響新基建所帶來的技術(shù)范式演進(jìn)。從目前的技術(shù)發(fā)展歷程來看,聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖在之前各自的技術(shù)演進(jìn)中是甚少交集的。兩者的不兼容性主要在以下兩方面:

一是用戶需求差異較大。聯(lián)邦學(xué)習(xí)在已有的商業(yè)實(shí)踐中,主要為海量的終端用戶服務(wù)。而數(shù)據(jù)湖的用戶群體源于數(shù)據(jù)倉庫的使用者,屬于企業(yè)級(jí)用戶。不同的用戶群體的需求存在較大差異。

二是聯(lián)邦學(xué)習(xí)的網(wǎng)絡(luò)開銷較高。聯(lián)邦學(xué)習(xí)關(guān)注數(shù)據(jù)的去中心化,但其模型更新過程中始終需要中央服務(wù)器參與。不同的終端用戶在連接中央服務(wù)器時(shí)的網(wǎng)絡(luò)環(huán)境充滿不確定性,因此海量終端用戶在進(jìn)行聯(lián)邦學(xué)習(xí)時(shí)的網(wǎng)絡(luò)開銷較高。而數(shù)據(jù)湖在保證性能與效率的前提下,正在致力于通過分布式架構(gòu)等途徑防止網(wǎng)絡(luò)開銷過高。

聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的融合契機(jī)

隨著聯(lián)邦學(xué)習(xí)的商業(yè)化進(jìn)程加快,企業(yè)級(jí)用戶正在成為聯(lián)邦學(xué)習(xí)的目標(biāo)用戶。這為聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖解決不兼容性問題,實(shí)現(xiàn)技術(shù)融合帶來了可行的應(yīng)用場景——同類型用戶群體、較小的用戶規(guī)模和相對(duì)穩(wěn)定的網(wǎng)絡(luò)環(huán)境。在這一應(yīng)用場景下,聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖具有以下三方面的融合契機(jī):

一是數(shù)據(jù)湖可以成為聯(lián)邦學(xué)習(xí)所需的可信第三方節(jié)點(diǎn)。理論上,聯(lián)邦學(xué)習(xí)不需要第三方節(jié)點(diǎn)可信,但需要滿足不同數(shù)據(jù)所有方彼此誠實(shí)且好奇,嚴(yán)格符合安全多方計(jì)算(MPC)等條件。而這些條件目前尚難以同時(shí)滿足。此外,在聯(lián)邦學(xué)習(xí)的訓(xùn)練過程中,模型更新需要向第三方節(jié)點(diǎn)顯示敏感信息。雖然可以通過安全多方計(jì)算、差分隱私等保護(hù)隱私,但是采用可信第三方節(jié)點(diǎn)可以有效保障模型性能和系統(tǒng)效率,在經(jīng)濟(jì)效益上更為可取。

二是數(shù)據(jù)湖天然適合成為聯(lián)邦學(xué)習(xí)的商業(yè)化載體。數(shù)據(jù)湖的元數(shù)據(jù)可以為聯(lián)邦學(xué)習(xí)在商業(yè)化進(jìn)程中拓展新的數(shù)據(jù)價(jià)值共享模式。數(shù)據(jù)湖的元數(shù)據(jù)可映射為聯(lián)邦學(xué)習(xí)中的所需的標(biāo)簽Y,實(shí)現(xiàn)數(shù)據(jù)與標(biāo)簽Y的分離。這種分離使得擁有海量數(shù)據(jù)但不清楚如何使用的用戶免去協(xié)議制定的困擾,讓聯(lián)邦學(xué)習(xí)的數(shù)據(jù)價(jià)值共享模式不再拘泥于由標(biāo)簽Y的提供方制定協(xié)議。

同時(shí),目前聯(lián)邦學(xué)習(xí)正在探索商業(yè)化推進(jìn)的平臺(tái)和激勵(lì)機(jī)制,考慮通過區(qū)塊鏈等技術(shù)記錄聯(lián)邦學(xué)習(xí)參與者的貢獻(xiàn)評(píng)價(jià)和數(shù)據(jù)價(jià)值分配。而數(shù)據(jù)湖已有一定的商業(yè)實(shí)踐,并且其海量的存儲(chǔ)能力天然適合作為區(qū)塊鏈等技術(shù)的載體。因此,可以通過激勵(lì)機(jī)制在聯(lián)邦學(xué)習(xí)的協(xié)議制定中加入央行數(shù)字貨幣DC/EP,進(jìn)一步推動(dòng)數(shù)據(jù)價(jià)值共享的模式創(chuàng)新。

圖1 基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣

三是聯(lián)邦學(xué)習(xí)可以幫助數(shù)據(jù)湖解決安全性質(zhì)疑。通過聯(lián)邦學(xué)習(xí),數(shù)據(jù)湖可由直接存儲(chǔ)含有用戶隱私的原始數(shù)據(jù)轉(zhuǎn)為存儲(chǔ)加密的模型相關(guān)參數(shù)等原始數(shù)據(jù)。這樣既可以保留存儲(chǔ)原始數(shù)據(jù)的根本特征,又可以解決人們一直以來對(duì)于數(shù)據(jù)湖中原始數(shù)據(jù)安全的質(zhì)疑。解決安全性質(zhì)疑對(duì)數(shù)據(jù)湖實(shí)現(xiàn)從用戶內(nèi)部的信息基礎(chǔ)設(shè)施走向用戶間共建共享的信息基礎(chǔ)設(shè)施的技術(shù)演進(jìn)尤為重要。

適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù)

要實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖的技術(shù)融合,數(shù)據(jù)安全是融合的前提。因此,需要按照等級(jí)保護(hù)的相關(guān)要求配備數(shù)據(jù)保護(hù)技術(shù),具備數(shù)據(jù)保護(hù)能力。根據(jù)數(shù)據(jù)保護(hù)能力的來源,適用的數(shù)據(jù)保護(hù)技術(shù)可以分為兩大類:

第一類是內(nèi)生的安全保護(hù),即聯(lián)邦學(xué)習(xí)本身包含的數(shù)據(jù)保護(hù)技術(shù)。這類技術(shù)包括基于隱私保護(hù)的數(shù)據(jù)建模、不經(jīng)意傳輸、差分隱私以及同態(tài)加密等。

第二類是外部的安全保護(hù),即其他可在數(shù)據(jù)湖中配備的數(shù)據(jù)保護(hù)技術(shù)。包括入侵防護(hù)、追蹤溯源、訪問控制和區(qū)塊鏈等。這些技術(shù)還可以進(jìn)一步的細(xì)分,一種是直接參與聯(lián)邦學(xué)習(xí)的技術(shù),例如,記錄聯(lián)邦學(xué)習(xí)全過程的區(qū)塊鏈;另一種是防止數(shù)據(jù)湖內(nèi)存儲(chǔ)數(shù)據(jù)被惡意獲取、使用等的技術(shù),包括入侵防護(hù)、追蹤溯源和訪問控制等。

面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略

綜合數(shù)據(jù)保護(hù)的對(duì)象和聯(lián)邦學(xué)習(xí)的價(jià)值共享過程,可以對(duì)直接參與聯(lián)邦學(xué)習(xí)的數(shù)據(jù)保護(hù)技術(shù)從數(shù)據(jù)保護(hù)和價(jià)值共享兩個(gè)維度進(jìn)一步細(xì)分,構(gòu)建基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,如圖1 所示。

在數(shù)據(jù)保護(hù)維度,主要考慮需要保護(hù)的數(shù)據(jù)是本體還是附屬(關(guān)于數(shù)據(jù)本體與附屬的概念,可參看筆者拙作《大數(shù)據(jù)監(jiān)管系統(tǒng)建設(shè)研究》)。其中數(shù)據(jù)本體包括標(biāo)簽Y、模型更新的參數(shù)等,數(shù)據(jù)附屬包含聯(lián)邦學(xué)習(xí)的協(xié)議制定、參與用戶及其貢獻(xiàn)等。

在價(jià)值共享維度,通過聯(lián)邦學(xué)習(xí)進(jìn)行價(jià)值共享的過程一般可以分為兩個(gè)階段:第一階段是準(zhǔn)備階段,其中包括確定參與聯(lián)邦學(xué)習(xí)的用戶,制定協(xié)議,建立模型;第二階段是實(shí)現(xiàn)階段,由參與用戶共同訓(xùn)練模型、完成聯(lián)邦學(xué)習(xí)并進(jìn)行價(jià)值共享。

從圖中可以看到,對(duì)于數(shù)據(jù)附屬,主要通過區(qū)塊鏈所使用的零知識(shí)證明、智能合約等在保護(hù)隱私數(shù)據(jù)的同時(shí)如實(shí)記錄聯(lián)邦學(xué)習(xí)的全過程;對(duì)于數(shù)據(jù)本體,在準(zhǔn)備階段采用基于隱私保護(hù)的數(shù)據(jù)建模,防止由于原始數(shù)據(jù)參與參數(shù)傳遞導(dǎo)致的潛在數(shù)據(jù)泄露的情況,在實(shí)現(xiàn)階段采用不經(jīng)意傳輸、差分隱私、同態(tài)加密等,防止在進(jìn)行聯(lián)邦學(xué)習(xí)時(shí)的中間數(shù)據(jù)等被惡意獲取、使用等。

在面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)中,首先需要按照矩陣中的劃分對(duì)數(shù)據(jù)湖進(jìn)行相應(yīng)的配置,從而為聯(lián)邦學(xué)習(xí)的全過程中產(chǎn)生的各類數(shù)據(jù)提供針對(duì)性的保護(hù)。

同時(shí),數(shù)據(jù)湖還需要將入侵防護(hù)、追蹤溯源、訪問控制等技術(shù)作為構(gòu)建數(shù)據(jù)保護(hù)能力的基礎(chǔ),使其成為數(shù)據(jù)湖作為用戶間共建共享的信息基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)配置。

此外,面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)中還需要考慮兩類可預(yù)見的風(fēng)險(xiǎn):

第一類是安全性衰減風(fēng)險(xiǎn)。從技術(shù)發(fā)展的歷程看,不論是直接參與聯(lián)邦學(xué)習(xí)的數(shù)據(jù)保護(hù)技術(shù)如不經(jīng)意傳輸、差分隱私等,還是構(gòu)建共享數(shù)據(jù)湖基礎(chǔ)數(shù)據(jù)保護(hù)能力的入侵防護(hù)、追蹤溯源等技術(shù),都面臨著安全性因技術(shù)進(jìn)步而不斷下降的現(xiàn)實(shí)風(fēng)險(xiǎn)。

第二類是超范圍使用風(fēng)險(xiǎn)。目前聯(lián)邦學(xué)習(xí)的應(yīng)用研究中,正在探索采用聯(lián)邦學(xué)習(xí)進(jìn)行融合金融、醫(yī)療、用戶行為等多方數(shù)據(jù)源的商業(yè)實(shí)踐。在這類商業(yè)實(shí)踐中,用戶隱私有可能隨著關(guān)聯(lián)數(shù)據(jù)超出預(yù)計(jì)范圍而出現(xiàn)意想不到的數(shù)據(jù)泄露風(fēng)險(xiǎn)。

因此,出于合規(guī)與安全的共同需要,面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)還應(yīng)當(dāng)考慮與大數(shù)據(jù)監(jiān)管系統(tǒng)建設(shè)的適配,讓監(jiān)管部門可以實(shí)時(shí)掌握第一手情況,從而最大限度的規(guī)避技術(shù)創(chuàng)新過程中的各類風(fēng)險(xiǎn)。

總結(jié)

本文分析了聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的不兼容性和融合契機(jī),梳理了適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù),探討構(gòu)建了基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,提出了面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略,為解決不同數(shù)據(jù)所有方在數(shù)據(jù)湖中共同安全、合規(guī)的使用數(shù)據(jù)資源等提供了具體的技術(shù)建議。

猜你喜歡
原始數(shù)據(jù)數(shù)據(jù)保護(hù)聯(lián)邦
聯(lián)邦學(xué)習(xí)在金融數(shù)據(jù)安全領(lǐng)域的研究與應(yīng)用
受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
一“炮”而紅 音聯(lián)邦SVSound 2000 Pro品鑒會(huì)完滿舉行
數(shù)據(jù)保護(hù)護(hù)航IT轉(zhuǎn)型
——戴爾易安信數(shù)據(jù)保護(hù)解決方案
歐洲數(shù)據(jù)保護(hù)委員會(huì)通過《一般數(shù)據(jù)保護(hù)條例》相關(guān)準(zhǔn)則
303A深圳市音聯(lián)邦電氣有限公司
歐盟“最嚴(yán)”數(shù)據(jù)保護(hù)條例生效
全新Mentor DRS360 平臺(tái)借助集中式原始數(shù)據(jù)融合及直接實(shí)時(shí)傳感技術(shù)實(shí)現(xiàn)5 級(jí)自動(dòng)駕駛
對(duì)物理實(shí)驗(yàn)測量儀器讀數(shù)的思考
20年后捷克與斯洛伐克各界對(duì)聯(lián)邦解體的反思
德江县| 新乐市| 高安市| 衢州市| 九台市| 剑川县| 大庆市| 丽江市| 宁德市| 鹤庆县| 静海县| 广饶县| 长顺县| 嵩明县| 绵竹市| 儋州市| 英德市| 攀枝花市| 凤翔县| 元阳县| 广南县| 威远县| 西昌市| 东平县| 海安县| 永清县| 贵港市| 汤原县| 兰州市| 威海市| 赤水市| 涞水县| 庐江县| 祁东县| 平凉市| 南澳县| 盐山县| 新安县| 焦作市| 登封市| 桦南县|