孫忠富 馬浚誠 鄭飛翔 杜克明
(中國農(nóng)業(yè)科學院農(nóng)業(yè)環(huán)境與可持續(xù)發(fā)展研究所,北京 100081)
中國既是世界第一人口大國,也是農(nóng)業(yè)大國,有著悠久的發(fā)展歷史。中國以全世界10%的耕地和6%的水資源,養(yǎng)活了世界22%的人口,取得了舉世關(guān)注的奇跡[1‐2]。改革開放40 年以來,國家和政府堅持把解決好“三農(nóng)”問題作為重中之重,全面深化涉農(nóng)工作的各項改革,扎實推進鄉(xiāng)村振興戰(zhàn)略,農(nóng)業(yè)農(nóng)村發(fā)生了歷史性變革。中國徹底告別了長期存在的“農(nóng)業(yè)短缺經(jīng)濟”狀態(tài),結(jié)束了長期在溫飽線上掙扎的歷史。
但與此同時,一些新問題也伴隨而生,諸多挑戰(zhàn)不斷出現(xiàn)。近十幾年來,我國糧食生產(chǎn)持續(xù)增長,其它主要農(nóng)產(chǎn)品也實現(xiàn)同步增長,但我國農(nóng)產(chǎn)品進口量也同時持續(xù)攀升,對外依存度趨于增大。另外,受氣候變化影響,自然災(zāi)害頻繁發(fā)生、生產(chǎn)成本大幅上升、市場環(huán)境異常波動,糧食安全仍然不容盲目樂觀。我國農(nóng)業(yè)依然是勞動力密集型和依賴型的產(chǎn)業(yè),但勞動力老齡化趨勢很嚴重,人口紅利不復(fù)存在,“誰來種地,如何種地,農(nóng)產(chǎn)品賣給誰”,仍是制約農(nóng)業(yè)可持續(xù)發(fā)展的重大緊迫問題。我國雖然有龐大的耕地資源,但總體看生產(chǎn)規(guī)模小、土地碎片化嚴重、勞動效率低下,大產(chǎn)業(yè)、小農(nóng)戶的現(xiàn)象將長期存在。相對落后和粗放的生產(chǎn)方式,導(dǎo)致農(nóng)業(yè)環(huán)境安全矛盾十分突出。我國農(nóng)業(yè)種植業(yè)還存在水資源利用率低下、對化肥和農(nóng)藥依賴性過高的現(xiàn)象,對農(nóng)業(yè)產(chǎn)生的大量污染廢棄物等,仍缺乏有效的處理和再利用,農(nóng)業(yè)發(fā)展與環(huán)境的矛盾依然很突出。另外與發(fā)達國家相比,總體技術(shù)創(chuàng)新能力薄弱、科技貢獻率較低,也是限制農(nóng)業(yè)現(xiàn)代化發(fā)展的突出問題。有關(guān)資料表明,盡管農(nóng)業(yè)科技進步貢獻率已經(jīng)由2012 年的53.5%,提高到2017 年的57.5%、2019 年的59.2%,但相比發(fā)達國家的70%‐80%,依舊有很大的差距[3]。解決上述重大問題,必須要有新的發(fā)展思路和模式,智慧農(nóng)業(yè)的發(fā)展理念和應(yīng)用技術(shù)應(yīng)運而生,正在成為現(xiàn)代農(nóng)業(yè)進程中的優(yōu)先發(fā)展之路。
本文針對智慧農(nóng)業(yè)、大數(shù)據(jù)安全及區(qū)塊鏈(Blockchain)三者之間的關(guān)系進行分析研究,探討區(qū)塊鏈關(guān)鍵技術(shù)、技術(shù)特點、應(yīng)用模式等在數(shù)據(jù)信息安全領(lǐng)域中的應(yīng)用,以期對未來農(nóng)業(yè)大數(shù)據(jù)安全發(fā)展提供一些參考思路,包括理論和技術(shù)依據(jù),推動區(qū)塊鏈助力大數(shù)安全發(fā)展,做好大數(shù)據(jù)安全頂層設(shè)計,更加夯實智慧農(nóng)業(yè)發(fā)展的基礎(chǔ)。
近年來,新一代信息技術(shù)突飛猛進發(fā)展,快速向農(nóng)業(yè)各個領(lǐng)域融合滲透,為解決農(nóng)業(yè)存在的一些瓶頸問題,開創(chuàng)了新的發(fā)展空間。在這一過程中智慧農(nóng)業(yè)發(fā)展模式應(yīng)運而生,其發(fā)展理念和技術(shù)也不斷得到提升和完善。早在上個世界90 年代末,人類開始步入信息技術(shù)時代,其重要標志就是以計算機和互聯(lián)網(wǎng)為代表,從不斷成熟到普及應(yīng)用,推進人類社會從工業(yè)革命時代向信息革命時代的轉(zhuǎn)變。進入21 世紀,新一代信息技術(shù)更是以前所未有的爆發(fā)力,推動人類社會發(fā)展的進程,它以數(shù)字化,網(wǎng)絡(luò)化,智能化為特征,不僅催生了數(shù)字經(jīng)濟,也助推了各領(lǐng)域智慧產(chǎn)業(yè)迅猛發(fā)展,如智慧交通,智慧醫(yī)療,智慧金融,智慧政府等等,這其中當然也包括智慧農(nóng)業(yè)。各種智慧產(chǎn)業(yè)為社會和經(jīng)濟發(fā)展提供了新動能,引導(dǎo)了傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級,培育壯大了新興業(yè)態(tài),推動了市場與消費模式的巨大變革。
要加快發(fā)展數(shù)字經(jīng)濟和智慧產(chǎn)業(yè),離不開信息技術(shù)基礎(chǔ)建設(shè)。近年來國家和政府十分重視信息技術(shù)的基礎(chǔ)建設(shè),并不斷完善形成了“新基建”的發(fā)展理念。早在2018 年12 月中央經(jīng)濟工作會議上,首次提出了“新型基礎(chǔ)設(shè)施建設(shè)”的基本思路。關(guān)于“新基建”的內(nèi)涵有不同的解讀,但其主旨就是為了推動新一代信息技術(shù)基礎(chǔ)設(shè)施建設(shè)、加速促進數(shù)字經(jīng)濟發(fā)展。為了實現(xiàn)這一目標,需要有與之相適應(yīng)的新型數(shù)字基礎(chǔ)設(shè)施,即由新一代信息技術(shù)演化生成的基礎(chǔ)設(shè)施。其重點包含三個層面:一是通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè),以5G、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、衛(wèi)星互聯(lián)網(wǎng)為代表;二是新技術(shù)基礎(chǔ)設(shè)施建設(shè),以人工智能、云計算、大數(shù)據(jù)、區(qū)塊鏈等為代表;三是算力基礎(chǔ)設(shè)施建設(shè),以數(shù)據(jù)中心、智能計算中心為代表。2020年3月以來中央政府連續(xù)發(fā)出加快新基建創(chuàng)新應(yīng)用的政策,新基建再次被提到新高度。通過以“新基建”為牽引,夯實經(jīng)濟社會高質(zhì)量發(fā)展的“底座”和“基石”,將為智慧產(chǎn)業(yè)的發(fā)展帶來前所未有的機遇[4‐5]。由此也可以預(yù)見,作為國家智慧產(chǎn)業(yè)的重要組成,智慧農(nóng)業(yè)也將迎來一個來新的發(fā)展機遇。
從技術(shù)層面看,智慧農(nóng)業(yè)的發(fā)展,得力于新一代信息技術(shù)的支撐,包括物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能等技術(shù)。近幾年隨著區(qū)塊鏈(Blockchain)的興起,添加了新的驅(qū)動要素,進一步增強了創(chuàng)新驅(qū)動力。智慧農(nóng)業(yè)強調(diào)通過信息和知識的挖掘與整合,形成智慧的決策和控制等應(yīng)用。物聯(lián)網(wǎng)為人類嵌入了千里眼和順風耳,人工智能技術(shù),逐步解放人的體力勞動,進一步提高了勞動效率和生產(chǎn)力。尤其是大數(shù)據(jù)被譽為新型礦源和新型石油,對其深度挖掘應(yīng)用,為科學發(fā)現(xiàn)和科學管理提供了智慧大腦。傳統(tǒng)的觀點通常認為人類大腦處于智能思維頂峰位置,但隨著大數(shù)據(jù)挖掘和深度學習技術(shù)的提高,在有些領(lǐng)域?qū)⒖赡茴嵏策@種認識。例如AlphagoZero 的圍棋博弈能力已經(jīng)超越了人類頂級棋手,其背后就是基于棋譜大數(shù)據(jù)的深度學習方式。未來農(nóng)業(yè)領(lǐng)域中各種機器人和智能設(shè)備、決策分析系統(tǒng),通過大數(shù)據(jù)的應(yīng)用和深度學習,就會成為管理決策的智囊、農(nóng)業(yè)生產(chǎn)的專家,市場經(jīng)營的高手。
在大數(shù)據(jù)時代,數(shù)據(jù)就是資源,數(shù)據(jù)創(chuàng)造價值,誰擁有數(shù)據(jù)就意味著孕育產(chǎn)生出智慧成果,創(chuàng)造出巨大財富。大數(shù)據(jù)是信息技術(shù)高速發(fā)展的必然產(chǎn)物,農(nóng)業(yè)大數(shù)據(jù)是大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用和實踐,因此與大數(shù)據(jù)的基本理論和技術(shù)是一致的,但涉及具體應(yīng)用時也有其特殊性,這方面已有很多的探討和研究,不再贅述[6‐8]。
另一方面,對大數(shù)據(jù)的理解不僅僅是限于一項信息技術(shù)的變革,更是一場能為經(jīng)濟發(fā)展帶來新驅(qū)動力的變革。隨著大數(shù)據(jù)的深入發(fā)展和普及應(yīng)用,不僅催生一種新的經(jīng)濟范式“數(shù)字經(jīng)濟”,也推動了數(shù)字經(jīng)濟的成長與繁榮[9‐10]。今后對數(shù)字經(jīng)濟的依賴程度,是衡量一個國家經(jīng)濟實力的最重要指標,也是最具潛力和持續(xù)性的指標。人類對數(shù)據(jù)的認識,也不斷升華,人類社會正在從IT(Information Technology)時代走向DT(Data Technology)時代,這個時代的核心資源已經(jīng)不是石油而是數(shù)據(jù),大數(shù)據(jù)是推動數(shù)字經(jīng)濟發(fā)展的新能源[11]。有學者認為,我們正在進入數(shù)據(jù)資本的時代,并將數(shù)字經(jīng)濟的發(fā)展劃分為四個階段:數(shù)據(jù)的“前天”,即數(shù)據(jù)資料階段;數(shù)據(jù)的“昨天”,數(shù)據(jù)產(chǎn)品階段,當數(shù)據(jù)被用來組成服務(wù)時就成為資源,形成產(chǎn)品;數(shù)據(jù)的“今天”,即數(shù)據(jù)資產(chǎn)階段,數(shù)據(jù)是產(chǎn)生財富的基礎(chǔ),是組成資產(chǎn)的一部分;數(shù)據(jù)的“明天”,即數(shù)據(jù)資本的階段,是使數(shù)據(jù)資產(chǎn)連接其價值的時代,對數(shù)據(jù)資產(chǎn)進行流通和交易以實現(xiàn)其價值,使其轉(zhuǎn)換為資本[12]。數(shù)字農(nóng)業(yè)是數(shù)字經(jīng)濟的理念和技術(shù)在農(nóng)業(yè)上的應(yīng)用和實踐,也是智慧農(nóng)業(yè)的重要內(nèi)容。當前隨著現(xiàn)代農(nóng)業(yè)的發(fā)展,數(shù)字農(nóng)業(yè)這一理念得到了越來越深刻認知,數(shù)字農(nóng)業(yè)是農(nóng)業(yè)發(fā)展的又一次革命,已在全球形成共識,并將成為農(nóng)業(yè)變革的引導(dǎo)力量,數(shù)字農(nóng)業(yè)革命時代已經(jīng)到來[13]。
2015年8月國務(wù)院印發(fā)了《促進大數(shù)據(jù)發(fā)展行動綱要》,在總體上提出了一切讓數(shù)據(jù)發(fā)聲、用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新的發(fā)展理念,另外還專門提出了建設(shè)現(xiàn)代農(nóng)業(yè)大數(shù)據(jù)工程的規(guī)劃。特別是作為三大發(fā)展任務(wù)方向之一,明確提出了“強化安全保障,提高管理水平,促進健康發(fā)展”的總體戰(zhàn)略:一是健全大數(shù)據(jù)安全保障體系,二是強化安全支撐。具體包括加強大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)安全、大數(shù)據(jù)網(wǎng)絡(luò)安全技術(shù),建立健全大數(shù)據(jù)安全保障體系;加強大數(shù)據(jù)環(huán)境下防攻擊、防泄露、防竊取的監(jiān)測、預(yù)警、控制和應(yīng)急處置能力建設(shè),等等[14]。就智慧農(nóng)業(yè)的發(fā)展而言,對大數(shù)據(jù)的需求和應(yīng)用將不斷增加,在大數(shù)據(jù)獲取、數(shù)據(jù)安全、物聯(lián)網(wǎng)安全、數(shù)據(jù)真實性、網(wǎng)絡(luò)誠信、知識產(chǎn)權(quán)歸屬等方面,所面臨諸多問題,也必然不斷深化,其產(chǎn)生的影響將不斷擴大。
2016 年4 月19 日在國家網(wǎng)絡(luò)安全和信息化工作座談會上,國家主席習近平強調(diào)指出,網(wǎng)絡(luò)安全和信息化是相輔相成的,安全是發(fā)展的前提,發(fā)展是安全的保障,安全和發(fā)展要同步推進。安全與發(fā)展是大數(shù)據(jù)面臨的二大主題,如同一體之二翼缺一不可。隨著新一代信息技術(shù)日新月異的發(fā)展,數(shù)據(jù)呈爆炸式增長,甚至超出了人類處理數(shù)據(jù)的能力,總體上看數(shù)據(jù)越大,監(jiān)管與治理的難度也就越大,尤其是在網(wǎng)絡(luò)大環(huán)境下,大數(shù)據(jù)資源的開放,數(shù)據(jù)流通和應(yīng)用共享等,導(dǎo)致更多風險和危機產(chǎn)生。有資料分析顯示,目前大約85%以上的數(shù)據(jù)(主要是非結(jié)構(gòu)化的數(shù)據(jù)),被閑置或無能力開發(fā)使用,數(shù)據(jù)孤島、數(shù)據(jù)鴻溝、數(shù)據(jù)無監(jiān)管、數(shù)據(jù)濫用等現(xiàn)象普遍存在,不僅帶來了對數(shù)據(jù)管理的難度,并產(chǎn)生了很多安全隱患,甚至出現(xiàn)管理空白區(qū)。
隨著大數(shù)據(jù)的深入發(fā)展,還出現(xiàn)了另外一些新的問題。數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源的地位日益凸顯,人們對數(shù)據(jù)的認知更加重視,對數(shù)據(jù)的價值,對數(shù)據(jù)的獲取和保護意識等日益劇增。對數(shù)據(jù)確權(quán)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、隱私保護、流通管控、共享開放等問題更加關(guān)注,對數(shù)據(jù)的主導(dǎo)權(quán)、控制權(quán),以及相關(guān)競爭日趨激烈,安全性挑戰(zhàn)日趨嚴峻。從技術(shù)上看,為了更好地挖掘數(shù)據(jù)中的價值,數(shù)據(jù)交換與共享是必然的選擇,但由此也打破原有的安全邊界,增加了數(shù)據(jù)管理難度,帶來了更多安全風險,這里不僅涉及到網(wǎng)絡(luò)安全,也涉及系統(tǒng)安全等新的問題;另一方面,由于大數(shù)據(jù)資源具有巨大價值吸引力,針對大數(shù)據(jù)資源的竊取、攻擊與濫用等行為也越來越嚴重,對數(shù)據(jù)安全防護能力提出了更高的要求[15‐16]。隨著大數(shù)據(jù)深度應(yīng)用,除了技術(shù)問題,如何強化完善數(shù)據(jù)治理體系建設(shè),甚至解決其出現(xiàn)的一些法律法規(guī)問題,都已經(jīng)成為當前世界各國關(guān)注的焦點。
大數(shù)據(jù)系統(tǒng)的建設(shè)與應(yīng)用,關(guān)鍵是安全與可信,沒有安全和信任就沒有應(yīng)用,沒有應(yīng)用就不可能發(fā)展。當前社會一方面沉浸在大數(shù)據(jù)爆炸的海洋中,享受無處不在的大數(shù)據(jù)服務(wù),但同時又深感大數(shù)據(jù)的缺乏,可以用“人人有數(shù)據(jù),人人缺數(shù)據(jù)”這樣的現(xiàn)狀來形容。尤其在企業(yè)級或具體專業(yè)領(lǐng)域時,此種現(xiàn)象更為突出,大數(shù)據(jù)應(yīng)用中還存在很多尷尬和困境。下面普遍存在的“四不”現(xiàn)象,廣義上講都屬于大數(shù)據(jù)安全的問題。
一是“不知道”:不知道數(shù)據(jù)來自何方,存在何處,不知道、不會找、也找不到,等等;
二是“不情愿”:即使數(shù)據(jù)在我手,但不情愿分享。其原因較復(fù)雜:從客觀上講,數(shù)據(jù)價值無法有效確認,知識權(quán)益也得不到應(yīng)有的保障;從主觀上講,“利己”主義的本能所致,人人都想盡可能使用他人的數(shù)據(jù),但不愿意分享自己的數(shù)據(jù)。俗話說“不用白不用,用了也白用”,就是最好的寫照。
三是“不敢用”,這主要是指數(shù)據(jù)的安全性問題。例如廣泛存在對大數(shù)據(jù)底細不清、系統(tǒng)安全狀況不明等情況,存在數(shù)據(jù)黑箱現(xiàn)象。首先是如何保障開放數(shù)據(jù)后的整體安全性,另一方面使用者如何確認數(shù)據(jù)的真?zhèn)?、確保數(shù)據(jù)的質(zhì)量。在數(shù)據(jù)安全上,不僅要對大數(shù)據(jù)自身進行安全防護,還需要對大數(shù)據(jù)使用進行安全監(jiān)督。在實際情況中,常常因為存在上述問題,導(dǎo)致對大數(shù)據(jù)應(yīng)用的擔憂甚至恐懼。
四是“不可用”:首先是受制于大數(shù)據(jù)技術(shù)的短板,導(dǎo)致大量有價值的數(shù)據(jù)未被激活或進入流通共享;其次在利益藩籬制約方面還存在不少問題,例如涉及侵權(quán)認定、權(quán)益保障、價值激勵等問題得不到解決,必然限制了數(shù)據(jù)的正常開放使用;另外,在涉及大數(shù)據(jù)分析技術(shù)上,如何對多中心大數(shù)據(jù)進行處理,還存在很多挑戰(zhàn)性難題。如果這些得不到解決,必然導(dǎo)致數(shù)據(jù)不可用、不會用[17]。
3.2.1 基本概況分析
大數(shù)據(jù)安全風險主要有三個方面:一是,數(shù)據(jù)開放增加的風險,網(wǎng)絡(luò)時代的優(yōu)勢就是互聯(lián)共享,但這是一把雙刃劍,其中既有善意的應(yīng)用,也有惡意的攻擊和破壞,從國家安全層面看,甚至有網(wǎng)絡(luò)強國為搶占網(wǎng)絡(luò)空間主導(dǎo)權(quán),開展網(wǎng)絡(luò)戰(zhàn)、網(wǎng)絡(luò)間諜戰(zhàn)、構(gòu)建網(wǎng)絡(luò)恐怖組織等;二是,數(shù)據(jù)流通過程產(chǎn)生的風險,這里包括數(shù)據(jù)采集、傳輸和存儲過程中諸多風險;三是,數(shù)據(jù)應(yīng)用產(chǎn)生的風險,既包括大數(shù)應(yīng)用處理不當產(chǎn)生的風險,如決策失誤,信息泄露等,也包括應(yīng)用大數(shù)據(jù)進行網(wǎng)絡(luò)攻擊,利用網(wǎng)絡(luò)漏洞和隱私泄露進行非法活動,導(dǎo)致網(wǎng)絡(luò)應(yīng)用攻擊和漏洞向常態(tài)化、批量化、規(guī)?;较蜣D(zhuǎn)化。從大數(shù)據(jù)應(yīng)用主體來看,個人、企業(yè)、政府、社會、國家等大數(shù)據(jù)應(yīng)用不同層面都存在相應(yīng)的安全問題。
導(dǎo)致大數(shù)據(jù)安全風險的根源,既有技術(shù)自身不成熟的原因,也有法律法規(guī)不健全等因素[18‐19]。
從技術(shù)層面看,首先,大數(shù)據(jù)技術(shù)的本源是現(xiàn)代信息技術(shù)發(fā)展的產(chǎn)物,如計算機、網(wǎng)絡(luò)技術(shù),智能終端等的普及應(yīng)用,產(chǎn)生大量的數(shù)據(jù)。大數(shù)據(jù)促進了數(shù)字經(jīng)濟,推動了社會的發(fā)展和進步,但是現(xiàn)代網(wǎng)絡(luò)信息技術(shù)是一柄雙刃劍,它也帶來了一系列的大數(shù)據(jù)安全問題。例如:天下沒有免費的午餐,你可以方便連接世界,但也可以被世界所連接。當你方便地使用了別人的資源,當然別人也可以使用你的信息資源。其次,大數(shù)據(jù)自身技術(shù)發(fā)展還不完善,例如大數(shù)據(jù)的獲取、存儲與處理等技術(shù),仍需要不斷發(fā)展。大數(shù)據(jù)的安全是多方因素構(gòu)成的,例如存儲應(yīng)用都置身于網(wǎng)絡(luò)環(huán)境中,因此網(wǎng)絡(luò)和系統(tǒng)的安全也決定大數(shù)據(jù)的安全。
從法律法規(guī)上看,我國2017 年6 月開始實施的《網(wǎng)絡(luò)安全法》,對大數(shù)據(jù)發(fā)展涉及的相關(guān)安全問題進行了法律規(guī)范和引導(dǎo),并提出加強個人信息的法律保護。但是,從整體上看,中國在個人隱私安全、國家大數(shù)據(jù)安全、大數(shù)據(jù)安全技術(shù)研發(fā)、大數(shù)據(jù)應(yīng)用安全等方面的法律法規(guī)建設(shè),都亟須進一步發(fā)展和完善。尼葛洛龐帝(Nicholas Negroponte) 認為,世界“大多數(shù)的法律都是為了原子的世界,而不是比特的世界而制定的……電腦空間的法律中,沒有國家法律的容身之處”[20‐21]。
從標準和應(yīng)用層面看,首先,大數(shù)據(jù)應(yīng)用安全標準相對缺失是造成安全威脅的一個重要根源。大數(shù)據(jù)挖掘技術(shù)帶來數(shù)據(jù)濫用的風險,通過深入挖掘和分析,仍然能夠?qū)δ涿[私數(shù)據(jù)進行重新定位識別,引發(fā)隱私信息泄露,等等。其次,大數(shù)據(jù)挖掘技術(shù)還可能帶來數(shù)據(jù)濫用的風險,在商業(yè)上如大數(shù)據(jù)殺熟、價格歧視等。進入大數(shù)據(jù)時代,必須面對兩個重大問題,一是如何從大數(shù)據(jù)中獲取真金白銀,即挖掘大數(shù)據(jù)的真正價值,另一個是要有安全意識和防范部署,充分考慮應(yīng)對各種信息泄露、信息濫用和網(wǎng)絡(luò)攻擊等安全風險,切實做到未雨綢繆、防患于未然。正如Gartner 論斷的那樣:“大數(shù)據(jù)安全是一場必要的斗爭”[22‐23]。
綜上所述,大數(shù)據(jù)安全面臨十分復(fù)雜的挑戰(zhàn),大數(shù)據(jù)產(chǎn)業(yè)發(fā)展與大數(shù)據(jù)安全同步推進,才是大數(shù)據(jù)正確發(fā)展必由之路。為此全國信息安全標準化技術(shù)委員會在2019 年發(fā)布了《大數(shù)據(jù)安全標準化白皮書》,就指出了大數(shù)據(jù)產(chǎn)業(yè)化發(fā)展面臨的安全挑戰(zhàn),重點強調(diào)三個方面:一是,關(guān)于建立法律法規(guī)與相關(guān)標準問題,分析了國家和社會面臨的大數(shù)據(jù)安全挑戰(zhàn),以及相關(guān)的法律法規(guī)和標準尚存在的短板等;二是,關(guān)于數(shù)據(jù)安全和個人信息保護問題,針對個人信息泄露、數(shù)據(jù)真實性保障、數(shù)據(jù)權(quán)益保障等,分析提出了一些安全問題;三是關(guān)于大數(shù)據(jù)技術(shù)和平臺安全的挑戰(zhàn),大數(shù)據(jù)平臺是大數(shù)據(jù)研發(fā)應(yīng)用的基礎(chǔ)平臺,如果缺乏安全機制,意味著應(yīng)用根基不穩(wěn),很難適應(yīng)互聯(lián)網(wǎng)開放環(huán)境下數(shù)據(jù)安全的需求。一些新的技術(shù)如訪問控制、密碼學等也面臨巨大挑戰(zhàn)[24]。
3.2.2 特殊問題分析
數(shù)據(jù)信息安全是網(wǎng)絡(luò)時代的重要問題,而大數(shù)據(jù)因自身的特征而“樹大招風”,一直是網(wǎng)絡(luò)攻擊的重要目標,也是開展數(shù)據(jù)安全保障的重鎮(zhèn)。數(shù)據(jù)信息安全主要涉及大數(shù)據(jù)基礎(chǔ)設(shè)施安全、大數(shù)據(jù)存儲安全、大數(shù)據(jù)隱私泄露、大數(shù)據(jù)持續(xù)性攻擊等。
基礎(chǔ)設(shè)施安全問題是大數(shù)據(jù)安全最核心最基礎(chǔ)的環(huán)節(jié)。如果基礎(chǔ)設(shè)施不安全,就意味著面臨數(shù)據(jù)傳輸受阻、數(shù)據(jù)被截獲或篡改、被竊聽假冒、數(shù)據(jù)完整性遭破壞等風險;還包括通過網(wǎng)絡(luò)傳播病毒,導(dǎo)致拒絕服務(wù)攻擊(DDoS),等等。
非結(jié)構(gòu)化數(shù)據(jù)帶來的安全問題。大數(shù)據(jù)時代,多樣化數(shù)據(jù)大量涌現(xiàn),在數(shù)據(jù)存儲和管理、數(shù)據(jù)屬性及來源認證等方面存在巨大隱患;數(shù)據(jù)結(jié)構(gòu)復(fù)雜化、來源分散、整體性差、共享開放性增加等,導(dǎo)致對數(shù)據(jù)的跟蹤與審核非常困難。
大數(shù)據(jù)存儲的安全問題。大數(shù)據(jù)要涉及到復(fù)雜技術(shù)對存儲設(shè)備進行監(jiān)管、控制和防干擾攻擊等。這里有兩個問題需要注意:一是,將不同類數(shù)據(jù)違規(guī)存放的問題,將造成數(shù)據(jù)管理不合規(guī),導(dǎo)致安全隱患。二是,關(guān)于數(shù)據(jù)存儲過程中需要進行安全掃描和識別問題,常規(guī)的技術(shù)手段效率低下,已經(jīng)遠遠不能適應(yīng)大數(shù)據(jù)的實際需求。另外,大數(shù)據(jù)呈現(xiàn)出快速增長勢態(tài),而常規(guī)安全技術(shù)則經(jīng)常滯后,因此難以承擔為大數(shù)據(jù)安全保駕護航的重任。
大數(shù)據(jù)隱私泄露問題。要進行數(shù)據(jù)挖掘與分析,就不可避免地涉及一些隱私數(shù)據(jù),任何機密數(shù)據(jù)都不可能繞過核心管理人員,所謂的監(jiān)守自盜、家賊難防,在這里都能體現(xiàn)的淋漓盡致。所以管理人員的道德素質(zhì)和自我約束,對管理人員的管理就十分重要。在這個意義上說,任何數(shù)據(jù)都不存在絕對的安全,如何確保數(shù)據(jù)安全和隱私不被泄露,就成為大數(shù)據(jù)時代十分突出的焦點問題。另外,在技術(shù)上層面上看,傳統(tǒng)的數(shù)據(jù)管理依賴結(jié)構(gòu)化的SQL 技術(shù)(SQL‐Structured Query Language,泛指結(jié)構(gòu)化查詢語言),而大數(shù)據(jù)更多采用NoSQL技術(shù)(NoSQL,泛指非結(jié)構(gòu)化的查詢語言),后者內(nèi)在安全機制還不健全,尚需要不斷改進提升,另外在訪問控制和隱私管理機制上缺乏嚴密性,在機密性和完整性上都需要加強研究。
大數(shù)據(jù)技術(shù)本身是中性的,但大數(shù)據(jù)的使用則帶有不同的目的性,在大數(shù)據(jù)環(huán)境中,網(wǎng)絡(luò)攻擊和黑客破壞出現(xiàn)了明顯的三個變化:一是,攻擊變得“更精確”。黑客可以通過大數(shù)據(jù)技術(shù)搜集竊取更多信息,開展網(wǎng)絡(luò)攻擊,比如可以從各種社交網(wǎng)絡(luò)平臺、電子商務(wù)系統(tǒng)、個人微博和郵件、地理位置和聯(lián)系電話等獲得大量有用信息,大數(shù)據(jù)技術(shù)一旦被黑客應(yīng)用,讓攻擊變得“更加精準”;二是,攻擊變得“更隱身”。大數(shù)據(jù)技術(shù)既可作為攻擊手段,也可以將攻擊行為隱藏在茫茫數(shù)據(jù)海洋中,使得傳統(tǒng)監(jiān)測技術(shù)真?zhèn)坞y辨,導(dǎo)致攻擊變得“更隱身”。例如高級可持續(xù)攻擊(APT)技術(shù),就是將代碼隱藏在大數(shù)據(jù)中,很難被發(fā)現(xiàn)。大數(shù)據(jù)的海量和價值低密度特征,分散了安全分析工具對價值點的關(guān)注,給黑客以更多隱身的機會。另外,攻擊者還會通過設(shè)置陷阱,誤導(dǎo)目標信息提取和檢索,引導(dǎo)使用者走向安全監(jiān)測的歧途;三是,攻擊變得“更有力”。僵尸網(wǎng)絡(luò)攻擊(Botnet Attack)是黑客經(jīng)常采用的一種技術(shù),通過這種技術(shù)可以控制數(shù)以萬計甚至更多傀儡機協(xié)同攻擊,實施群體聯(lián)合作戰(zhàn),使攻擊行為變得“更強有力”。
總之,任何涉及數(shù)據(jù)存在與應(yīng)用的地方,數(shù)據(jù)安全問題就必然存在,對數(shù)據(jù)的治理需求就必不可或缺。在大數(shù)據(jù)時代,不可避免地面臨諸多挑戰(zhàn),構(gòu)成了大數(shù)安全問題,包括智能設(shè)備和物聯(lián)網(wǎng)安全可控、大數(shù)據(jù)真實可靠性、網(wǎng)絡(luò)交易誠信、數(shù)據(jù)權(quán)益和知識產(chǎn)權(quán)歸屬等。作為智慧農(nóng)業(yè)的核心基礎(chǔ),上述問題不能有效解決,智慧農(nóng)業(yè)的根基就不穩(wěn)固,更談不上持續(xù)發(fā)展壯大。近幾年以來,隨著區(qū)塊鏈(Blockchain)技術(shù)的興起,使人們在深感數(shù)據(jù)安全更多危機的同時,也看到了未來希望。因區(qū)塊鏈具有的與生俱來的數(shù)據(jù)安全基因,可能為大數(shù)據(jù)安全治理、大數(shù)據(jù)安全可控,提供新的發(fā)展機遇和拓展應(yīng)用空間。
2008 年中本聰首次提出區(qū)塊鏈技術(shù)架構(gòu),創(chuàng)建了比特幣,奠定了區(qū)塊鏈的理論基礎(chǔ)。隨著區(qū)塊鏈的深入發(fā)展,區(qū)塊鏈的內(nèi)涵也不斷發(fā)展。簡單地講,區(qū)塊鏈是一種去中心化的分布式網(wǎng)絡(luò)數(shù)據(jù)庫,也稱分布式總賬本,將數(shù)據(jù)區(qū)塊按時間順序(時間戳),組合成鏈式數(shù)據(jù)結(jié)構(gòu),并以密碼學技術(shù)保證數(shù)據(jù)不可篡改、不可偽造,實現(xiàn)網(wǎng)絡(luò)共建共管,確保了數(shù)據(jù)安全和可信度[25‐26]。
區(qū)塊鏈技術(shù)突破了傳統(tǒng)中心式系統(tǒng)架構(gòu)的缺陷,塑造了完善的安全機制,這種機制并非單一構(gòu)成,而是由多個安全機制的集成組合。共識機制是基于在分布式網(wǎng)絡(luò)條件下,達成各節(jié)點的高效共識,消除數(shù)據(jù)“霸權(quán)”,構(gòu)建一種安全可信的網(wǎng)絡(luò)數(shù)據(jù)環(huán)境。防篡改機制是區(qū)塊鏈安全機制的根本保障,可追溯機制是區(qū)塊鏈安全保障的核心,運用不可篡改的時間戳技術(shù),就可實現(xiàn)數(shù)據(jù)防偽追蹤、安全溯源。區(qū)塊鏈還能夠降低中心化帶來的風險,這主要是通過智能合約機制,并與數(shù)據(jù)安全技術(shù)緊密結(jié)合,依賴分布式計算處理技術(shù)來實現(xiàn)。如果從數(shù)據(jù)安全的基本要求出發(fā),區(qū)塊鏈和數(shù)據(jù)安全的結(jié)合分為兩個層面:一是區(qū)塊鏈自身的數(shù)據(jù)安全問題,俗話說打鐵還需自身硬,區(qū)塊鏈自身安全是前提;二是區(qū)塊鏈如何發(fā)揮其自身技術(shù)優(yōu)勢,應(yīng)用于大數(shù)據(jù)安全領(lǐng)域。如果從技術(shù)研究的角度,區(qū)塊鏈在信息網(wǎng)絡(luò)安全領(lǐng)域的關(guān)鍵技術(shù),主要包括認證技術(shù)、訪問控制技術(shù)、數(shù)據(jù)保護技術(shù)等[27‐28]。
區(qū)塊鏈技術(shù)最早來源于比特幣系統(tǒng),為解決加密數(shù)字貨幣的獲取和支付以及共識問題,成功創(chuàng)新應(yīng)用了密碼學、智能合約、共識算法、分布式計算等多種技術(shù)的組合,使其在去中心化的對等網(wǎng)絡(luò)(P2P)中,保證了交易記錄的真實有效性。其重要的潛在價值還在于,不通過第三方中介機構(gòu),實現(xiàn)數(shù)據(jù)的不易偽造、不可篡改、方便追溯、實現(xiàn)共建共享等功能特性,構(gòu)建了一種低成本高可靠性的數(shù)據(jù)基礎(chǔ)平臺。經(jīng)過近幾年的發(fā)展,區(qū)塊鏈技術(shù)不斷升華,認知度也在不斷深入,甚至被認為是價值互聯(lián)網(wǎng)以及未來進一步構(gòu)建秩序互聯(lián)網(wǎng)的基石。
如果僅僅將區(qū)塊鏈視為是一個純技術(shù)應(yīng)用,那未免有些狹隘,區(qū)塊鏈的博大精深思維和理念應(yīng)有更廣泛的應(yīng)用價值。當前學術(shù)上有一種觀點認為,隨著區(qū)塊鏈的深入發(fā)展和普及,將孕育第二代互聯(lián)網(wǎng)的誕生。在互聯(lián)網(wǎng)發(fā)展史上,基于TCP/IP 協(xié)議的第一代互聯(lián)網(wǎng)解決了信息的自由傳遞、信息的流通,實現(xiàn)了信息互聯(lián)網(wǎng)。隨著區(qū)塊鏈理念與技術(shù)的深入發(fā)展,將推進由信息互聯(lián)網(wǎng)到價值互聯(lián)網(wǎng)的轉(zhuǎn)變,最終實現(xiàn)秩序互聯(lián)網(wǎng),所以區(qū)塊鏈被認為是第二代互聯(lián)網(wǎng),當然這種觀點仍在不斷討論和發(fā)展中。區(qū)塊鏈技術(shù),使數(shù)字資產(chǎn)價值在網(wǎng)絡(luò)環(huán)境中高效流通成為現(xiàn)實,進一步奠定互聯(lián)網(wǎng)信任機制的基礎(chǔ),這就是價值互聯(lián)網(wǎng)的意義所在。當前的互聯(lián)網(wǎng)還存在信息虛假、數(shù)據(jù)濫用、惡意侵權(quán)等無序和不安全等亂象,基于區(qū)塊鏈有望構(gòu)建一個更加和諧有序、安全穩(wěn)定的互聯(lián)網(wǎng)世界。區(qū)塊鏈使得互聯(lián)網(wǎng)從中心化互聯(lián)網(wǎng)走向分布式互聯(lián)網(wǎng),數(shù)據(jù)安全和保護極大提高,維護了互聯(lián)網(wǎng)的安全秩序,建立了互聯(lián)網(wǎng)誠信。安全和信任是區(qū)塊鏈的本質(zhì),信任源于安全,安全強化信任,二者從來都是相輔相成,互為支撐發(fā)展,從這個意義上說,區(qū)塊鏈有望從基礎(chǔ)和架構(gòu)上解決數(shù)據(jù)安全和互聯(lián)網(wǎng)信任問題[29‐31]。
4.2.1 區(qū)塊鏈安全特質(zhì)解析
區(qū)塊鏈因其固有的安全特質(zhì),在涉及數(shù)據(jù)安全領(lǐng)域的融合應(yīng)用一直被廣泛關(guān)注,甚至被認為是一種數(shù)據(jù)安全“不可攻破”的技術(shù)。這種觀點盡管并不嚴謹,甚至沒有得到很好地驗證,但足以說明區(qū)塊鏈的安全價值和技術(shù)優(yōu)勢。當前區(qū)塊鏈在很多領(lǐng)域都有很多探索和應(yīng)用,如金融領(lǐng)域、信息管理領(lǐng)域等,其中在數(shù)據(jù)與信息安全領(lǐng)域融合發(fā)展,是區(qū)塊鏈研究的一個重點。在數(shù)據(jù)信息安全領(lǐng)域,隨著新一代新技術(shù)飛速發(fā)展和普及應(yīng)用,對認證技術(shù)、訪問控制、數(shù)據(jù)保護等信息安全技術(shù)提出了前所未有的更高要求。在具體應(yīng)用中,需要平衡解決一些關(guān)鍵按技術(shù)融合實現(xiàn)問題,區(qū)塊鏈具有的開放共識、去中心化、匿名私密性、可追溯和不可篡改等特點,都是其特有的與生俱來的安全基因,恰與數(shù)據(jù)安全的需求很好相吻合。應(yīng)用區(qū)塊鏈系統(tǒng)自帶防身術(shù)的特征,非常有利于加強數(shù)據(jù)安全基礎(chǔ)的建設(shè),所以區(qū)塊鏈特質(zhì)基因與大數(shù)據(jù)深度融合,將是確保大數(shù)據(jù)安全應(yīng)用的重要發(fā)展趨勢[32‐33]。
在分析區(qū)塊鏈的數(shù)據(jù)安全中,涉及到安全機制、共識機制、數(shù)據(jù)保護等諸多理念和關(guān)鍵技術(shù),對理解和認知區(qū)塊鏈安全特質(zhì),以及如何應(yīng)用于大數(shù)據(jù)安全設(shè)計與管理過程都十分重要。安全機制是最為核心與關(guān)鍵的組成部分,尤其在公有鏈中,存在諸多安全機制與協(xié)議需要研究:如隱私安全和密碼算法、共識機制和智能合約、數(shù)字賬戶(錢包私鑰保護)、離鏈(鏈下)交易控制,以及這些安全與協(xié)議如何升級的機制等。區(qū)塊鏈很好地融合了數(shù)學算法、密碼學、計算機與網(wǎng)絡(luò)科學(對等網(wǎng)絡(luò)、分布式存儲等)等多門學科技術(shù),確保數(shù)據(jù)既可追溯,但又不可篡改和不可偽造,達成民主與共識的統(tǒng)一,這是確保區(qū)塊鏈數(shù)據(jù)安全與信任的關(guān)鍵所在。密碼學保證數(shù)據(jù)真實性和可靠性,其共識機制則實現(xiàn)全網(wǎng)共管共建,使“壞人”無處匿藏、無處下手、“好人”可多勞多得。如何設(shè)計好共識機制,也是區(qū)塊鏈應(yīng)用的重要環(huán)節(jié),它除了影響系統(tǒng)的安全性,還涉及到應(yīng)用的可擴展性和去中心化程度。
數(shù)據(jù)安全涉及的內(nèi)容十分廣泛,目前廣為關(guān)注的可歸結(jié)為三個方面,即機密性、完整性、可用性三個核心方向,也相應(yīng)產(chǎn)生了不少創(chuàng)新性研究成果,而且隨著區(qū)塊鏈技術(shù)的研究與發(fā)展,區(qū)塊鏈在數(shù)據(jù)安全領(lǐng)域的研究已不斷超越擴展[34‐36]。數(shù)據(jù)保護技術(shù)的核心是實現(xiàn)對數(shù)據(jù)機密性和完整性保護,實現(xiàn)數(shù)據(jù)安全和可用性。數(shù)據(jù)的機密性是指在沒有獲得合法授權(quán)的條件下,數(shù)據(jù)不被訪問和解讀的屬性;數(shù)據(jù)完整性是指保證數(shù)據(jù)真實可信、可用有效、未被篡改的屬性。另外,如何考慮將區(qū)塊鏈安全機制融合于大數(shù)據(jù)安全設(shè)計和系統(tǒng)架構(gòu)中,有一個很重要的問題需要關(guān)注。目前區(qū)塊鏈技術(shù)對每個區(qū)塊的容量有一定限制,例如比特幣一個區(qū)塊不超過1M,這對大數(shù)據(jù)的海量數(shù)據(jù)是難以承受的。比較可行的設(shè)計是,針對數(shù)據(jù)規(guī)模的不同可分別采用二種方案,一是針對于小規(guī)模數(shù)據(jù),可直接采取鏈上數(shù)據(jù)保護技術(shù),而對于大規(guī)模數(shù)據(jù),則可采用鏈上與鏈下相結(jié)合的數(shù)據(jù)保護方案,這些技術(shù)有待結(jié)合具體應(yīng)用開展更進一步的深入研究,不在此贅述。
4.2.2 區(qū)塊鏈如何助力數(shù)據(jù)安全
從上面分析中不難看出,區(qū)塊鏈在數(shù)據(jù)安全應(yīng)用中的特殊地位和巨大潛在價值,區(qū)塊鏈如何支撐大數(shù)據(jù)的安全,勢必緊密圍繞區(qū)塊鏈的安全特質(zhì)和關(guān)鍵技術(shù)展開。深入挖掘區(qū)塊鏈的安全基因,與區(qū)塊鏈關(guān)鍵技術(shù)的深度融合,是大數(shù)據(jù)安全發(fā)展的重要趨勢。區(qū)塊鏈的數(shù)據(jù)安全技術(shù)主要集中在以下三個方向:
(1) 區(qū)塊鏈數(shù)據(jù)的機密性
在數(shù)據(jù)安全領(lǐng)域,關(guān)于數(shù)據(jù)機密性的解讀也不盡相同,但基本內(nèi)涵是一致的,即數(shù)據(jù)不能被非授權(quán)者,包括應(yīng)用個體和實體、系統(tǒng)進程利用或泄露的特性。數(shù)據(jù)的機密性程度在很大程度上決定了數(shù)據(jù)安全性和可靠性程度,是數(shù)據(jù)安全的第一道防線。面臨復(fù)雜的分布式網(wǎng)絡(luò)環(huán)境,數(shù)據(jù)機密性設(shè)計是否健壯,直接影響到數(shù)據(jù)安全性,如關(guān)系到數(shù)據(jù)泄露、盜用、濫用的潛在風險,如果數(shù)據(jù)被深層次挖掘和惡意應(yīng)用,可能給個人隱私和企業(yè)利益,甚至國家安全帶來安全災(zāi)難。當前數(shù)據(jù)機密性保護的研究主要圍繞五個方面展開:身份認證、訪問控制、數(shù)據(jù)加密、可信計算和隱蔽通信等技術(shù)。
第一是數(shù)據(jù)加密。密碼技術(shù)與區(qū)塊鏈的結(jié)合已成為重要的研究方向,為滿足區(qū)塊鏈的各種特殊安全需求,如何將新型密碼技術(shù)與區(qū)塊鏈應(yīng)用平臺相結(jié)合,已成為研究聚焦點所在。其中涉及到很多新的密碼學的技術(shù),主要集中在可搜索加密、屬性密碼、安全多方計算(Secure Multi‐Party Computation)、代理重加密(Proxy Re‐encryption)、同態(tài)密碼(Homomorphic Encryption),等等。
第二是身份認證。這是對合法用戶身份進行鑒別的一種信息安全技術(shù),也是計算機及網(wǎng)絡(luò)環(huán)境中的核心安全技術(shù)之一。基于區(qū)塊鏈構(gòu)建的分布式公鑰管理基礎(chǔ)設(shè)施(PKI‐‐Public Key Infrastructure),對用戶身份進行管理起著重要的作用。PKI是集成性技術(shù)體系,包括計算機軟硬件、權(quán)威管理機構(gòu)及應(yīng)用系統(tǒng)的結(jié)合。基本原理是通過可信第三方認證服務(wù)器,實施對用戶特征進行辨識。具體包括用戶所擁有(如身份令牌、數(shù)據(jù)證書)、用戶所認知(如用戶口令、密碼),以及用戶生物信息特質(zhì)(如人臉、虹膜和指紋)來確認用戶身份。身份認證基于公共總賬來建立的PKI,能夠消除PKI的信任,實現(xiàn)真正的分布式PKI建設(shè)。區(qū)塊鏈和身份認證的結(jié)合主要包括兩個方面:一是,應(yīng)用區(qū)塊鏈技術(shù)構(gòu)建去中心化PKI,為各類應(yīng)用系統(tǒng)提供身份認證支撐;二是,應(yīng)用區(qū)塊鏈自身去中心化技術(shù),構(gòu)建類電子身份認證系統(tǒng),對用戶的身份進行辨識管理。后者能夠有效降低PKI建設(shè)的成本,實現(xiàn)用戶身份的輕量級認證(Light weight Authenti‐cation),使管理秘鑰相對簡短、不依賴認證中心、認證效率大幅提高,從應(yīng)用角度更加可行實用。
第三是訪問控制。訪問控制技術(shù)就是通過控制,保護合法用戶對資源的訪問和使用權(quán)(包括對新用戶的授權(quán)),限制非法用戶的侵入和使用(包括剔除違規(guī)用戶使用權(quán)),從而保證信息業(yè)務(wù)服務(wù)順利運轉(zhuǎn)和系統(tǒng)安全。目前主要圍繞兩個方面開展:一是,對交易實施策略和權(quán)限的控制,應(yīng)用區(qū)塊鏈的技術(shù),讓所有鏈上數(shù)據(jù)記錄對所有用戶可見透明,但又不可被篡改,通過實現(xiàn)公開透明的訪問控制,對訪問控制的策略/權(quán)限進行有效管理。這就需要將傳統(tǒng)訪問控制的數(shù)據(jù)信息與區(qū)塊鏈技術(shù)進行結(jié)合,也就是將區(qū)塊鏈中的身份和帳戶驗證、網(wǎng)絡(luò)交易與智能合約等技術(shù)進行充分結(jié)合。二是,關(guān)于智能合約訪問控制。智能合約是存儲嵌入在區(qū)塊鏈上的程序代碼腳本,是一種“能由計算機執(zhí)行合同條款”的交易協(xié)議,其最大特點是,在沒有第三方參與監(jiān)督的情況下,只要滿足預(yù)先設(shè)定的合同條款,程序代碼自動啟動運行,完成交易合同。其具有的客觀公證、隱私保護和高效率是非常明顯的。由于智能合約具有這種自動強制執(zhí)行的特點,如何將其應(yīng)用于實現(xiàn)對資源的訪問控制,也是未來一個很重要的研究方向和發(fā)展趨勢。
(2) 區(qū)塊鏈數(shù)據(jù)的完整性
關(guān)于數(shù)據(jù)保護問題,數(shù)據(jù)機密性和完整性是數(shù)據(jù)保護的二個核心技術(shù)?;趨^(qū)塊鏈數(shù)據(jù)完整性保護技術(shù),有三個重要研究方向:首先是涉及數(shù)據(jù)確權(quán)與溯源問題,包括對數(shù)據(jù)源歸屬的掌控和確認、數(shù)據(jù)應(yīng)用流動去向、數(shù)據(jù)應(yīng)用全程可追溯與可記錄等;其次是如何建立可信日志審計系統(tǒng),通過動態(tài)地采集各種硬件設(shè)備、以及各種軟件系統(tǒng)產(chǎn)生的海量日志信息,實現(xiàn)系統(tǒng)安全運行態(tài)勢的診斷,提供全生命周期的可信日志管理;第三是區(qū)塊鏈如何應(yīng)用到具體行業(yè)領(lǐng)域的問題,這應(yīng)根據(jù)行業(yè)數(shù)據(jù)特點和業(yè)務(wù)需求,有針對性地將區(qū)塊鏈安全基因融合其中,實現(xiàn)數(shù)據(jù)完整性保護功能。區(qū)塊鏈是一種塊式網(wǎng)絡(luò)數(shù)據(jù)存儲架構(gòu),而每一個數(shù)據(jù)區(qū)塊的容量大小都有一定限度,從目前的技術(shù)上看,還難以實現(xiàn)大規(guī)模數(shù)據(jù)的存儲。這實際上涉及二個問題,一是區(qū)塊鏈如何大數(shù)據(jù)化的問題,另一個是大數(shù)據(jù)如何區(qū)塊鏈化的問題,是今后大數(shù)據(jù)與區(qū)塊鏈融合研究的重要內(nèi)容,不在此贅述。為了解決上述問題,目前可根據(jù)數(shù)據(jù)規(guī)模大小,采取二種解決方案:一是數(shù)據(jù)直接鏈上保護,對于小規(guī)模數(shù)據(jù),可基于區(qū)塊鏈不可篡改、時間戳等技術(shù),直接應(yīng)用于鏈上數(shù)據(jù)的保護,確保了數(shù)據(jù)的真實性和完整性。二是采用鏈上與鏈下相結(jié)合的保護技術(shù)。主要采用了一種能夠?qū)崿F(xiàn)二者融合的數(shù)據(jù)保護框架,基本思路是將有關(guān)數(shù)據(jù)管理中的關(guān)鍵敏感數(shù)據(jù)與實體應(yīng)用數(shù)據(jù)存儲分離,依靠區(qū)塊鏈技術(shù)存儲關(guān)鍵敏感信息,如數(shù)據(jù)索引、標識、注釋等重要管理數(shù)據(jù)信息。而將實際應(yīng)用的數(shù)據(jù)信息,包括無需加密的共享數(shù)據(jù)或一些需要加密的隱私數(shù)據(jù),都可存儲在其他鏈下節(jié)點上(如數(shù)據(jù)服務(wù)器)。通過鏈上鏈下互動,實現(xiàn)二者融合應(yīng)用。在這種解決方案中,應(yīng)用區(qū)塊鏈技術(shù)對數(shù)據(jù)索引及操作權(quán)限進行管控,而大量實際數(shù)據(jù)集中存儲于專用的數(shù)據(jù)服務(wù)器中,較好地解決了大數(shù)據(jù)與區(qū)塊鏈融合的問題,是一個很有價值的研究和應(yīng)用方向。
另外,數(shù)據(jù)完整性還體現(xiàn)在多個階段,如數(shù)據(jù)采集傳輸、數(shù)據(jù)存儲和數(shù)據(jù)使用等階段,每個階段出現(xiàn)缺失,都影響到數(shù)據(jù)的安全與可用性,通過整體性分析能夠容易識別出存在的各種損壞和攻擊數(shù)據(jù)的隱患和行為。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)可用性是一個系統(tǒng)性復(fù)雜的問題,數(shù)據(jù)作為智慧產(chǎn)業(yè)和數(shù)字經(jīng)濟的重要基礎(chǔ)性資源,其完整性和可用性將對各方面產(chǎn)生重要影響,包括機器學習、模型構(gòu)建、數(shù)據(jù)挖掘、計算結(jié)果以及構(gòu)建高質(zhì)量大數(shù)據(jù)系統(tǒng)等。其面臨很多挑戰(zhàn),很多技術(shù)都需要不斷開拓和研究創(chuàng)新。
(3) 區(qū)塊鏈數(shù)據(jù)的可用性
數(shù)據(jù)可用性的內(nèi)涵包括五個基本內(nèi)容:一致性、精確性、完整性、時效性和實體同一性。首先必須在數(shù)據(jù)格式、表達、描述上有統(tǒng)一的規(guī)范性,其次,數(shù)據(jù)應(yīng)具有足夠的精確性和代表性。再次,數(shù)據(jù)中的價值大多由其完整性和時效性所決定,數(shù)據(jù)的不斷更新非常重要,即數(shù)據(jù)的動態(tài)性。數(shù)據(jù)可用性還需要解決判定標準問題,如何從理論上判定,如何定量地評估等等。區(qū)塊鏈采用分布式數(shù)據(jù)存儲解決方案,通俗講就是“雞蛋不放在一個籃子里”,自然就避開了單點數(shù)據(jù)失效的風險,拓展增強了數(shù)據(jù)可用性和安全性,為實現(xiàn)更加健壯安全的數(shù)據(jù)管理奠定基礎(chǔ)。另外,區(qū)塊鏈采用的共識協(xié)議一致性算法,如工作量證明(PoW)、權(quán)益證明(PoS)和委托權(quán)益證明(DPoS)等,能為系統(tǒng)節(jié)點數(shù)據(jù)完全一致性提供技術(shù)支撐,可為分布式系統(tǒng)的一致性實現(xiàn)提供一種有效的解決方案。在實際網(wǎng)絡(luò)環(huán)境中,數(shù)據(jù)的可用性常常因網(wǎng)絡(luò)攻擊而遭到破壞。例如常來自于分布式拒絕服務(wù)攻擊(DDoS‐Dis‐tributed denial of service attack),都會帶來很多數(shù)據(jù)安全的風險,區(qū)塊鏈在抗攻擊能力方面的優(yōu)勢也是不言而喻的[37‐40]。
(4) 區(qū)塊鏈與大數(shù)據(jù)差異性分析
區(qū)塊鏈技術(shù)對大數(shù)據(jù)安全的提升是毋庸置疑的,但區(qū)塊鏈與大數(shù)據(jù)二者自身的特質(zhì)還存在很多不同之處,如何解決二者的互補融合,還面臨不少問題和挑戰(zhàn),需要不斷深入研究。一是面對數(shù)據(jù)結(jié)構(gòu)的差異化。大數(shù)據(jù)的主要特征之一就是以非結(jié)構(gòu)化的數(shù)據(jù)為主,所計算處理的多為非結(jié)構(gòu)化數(shù)據(jù),而區(qū)塊鏈處理的數(shù)據(jù)多為嚴格定義的結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu),基于數(shù)據(jù)指針形成區(qū)塊鏈條,其結(jié)構(gòu)化特征十分明顯;二是整合性與獨立性的差異化,大數(shù)據(jù)強調(diào)數(shù)據(jù)信息的整合分析,注重多源數(shù)據(jù)的分析,甚至錯誤的信息也很重要,區(qū)塊鏈系統(tǒng)則強調(diào)信息的安全性,真實可靠性,信息是相對獨立的;三是間接與直接的差異化。大數(shù)據(jù)有著廣泛的內(nèi)涵,是一個綜合技術(shù)體系,包括對數(shù)據(jù)獲取、清洗、存儲和挖掘應(yīng)用等,在某種程度上是一種間接的數(shù)據(jù);而區(qū)塊鏈系統(tǒng)本身就是一個完整的數(shù)據(jù)庫系統(tǒng),強調(diào)數(shù)據(jù)完整性和一致性;四是在數(shù)據(jù)與數(shù)學應(yīng)用上的差異化。大數(shù)據(jù)試圖用數(shù)據(jù)發(fā)聲、用數(shù)據(jù)管理、用數(shù)據(jù)決策;區(qū)塊鏈試圖用數(shù)學算法證明一切,智能合約通過程序代碼執(zhí)行交易,賦予一種“代碼即法律”的地位,其中的密碼學和共識算法,都充分體現(xiàn)出用數(shù)學說話的特質(zhì);五是個性化與匿名化的差異,大數(shù)據(jù)的針對性和專業(yè)性很強,體現(xiàn)出明顯的個性化和專業(yè)化應(yīng)用;區(qū)塊鏈具有隱私匿名性,賬本是公開的,擁有者是匿名的,這與傳統(tǒng)金融管理剛好相反,即賬號是公開的,賬本是保密的。六數(shù)據(jù)存儲容量的差異化,大數(shù)據(jù)存儲只受物理硬件設(shè)備的限制,而區(qū)塊鏈則受到每個區(qū)塊容量大小的限制,如何接納海量數(shù)據(jù)是一項挑戰(zhàn)性的任務(wù)。
綜上所述,如何協(xié)調(diào)平衡眾多的差異性,實現(xiàn)協(xié)調(diào)發(fā)展,是大數(shù)據(jù)與區(qū)塊鏈面對的挑戰(zhàn)性難題。大數(shù)據(jù)以淡化一致性為代價,獲得可用性和分區(qū)容忍性的提升,而區(qū)塊鏈則強化一致性,以降低可用性和容錯性為代價[41]。根據(jù)布魯爾定理,作為一個真正的分布式應(yīng)用系統(tǒng),區(qū)塊鏈本身也存在一個稱為“不可能三角”或“三元悖論”的問題:即“可擴展性”、“去中心化”、以及“安全性”這三個要求無法同時滿足。
通過以上分析可看出,應(yīng)用區(qū)塊安全特質(zhì),能使大數(shù)據(jù)更加安全、可信可用,從中挖掘出更大的價值。但區(qū)塊鏈與大數(shù)據(jù)的結(jié)合不是簡單的堆積和疊加,要通過不斷研究二者之間的特征與差異性,利用彼此的技術(shù)特點,實現(xiàn)優(yōu)勢互補,取長補短,才有可能設(shè)計出真正的基于區(qū)塊鏈技術(shù)的大數(shù)據(jù)安全系統(tǒng)。
當前總體上區(qū)塊鏈在農(nóng)業(yè)領(lǐng)域的應(yīng)用還處于起步階段,在很多具體專業(yè)領(lǐng)域還是空白,真正全面應(yīng)用區(qū)塊鏈技術(shù)、規(guī)模化應(yīng)用的成功案例并不多見。但近年來國內(nèi)一些相關(guān)學術(shù)研究也提出不少設(shè)想,設(shè)計了一些區(qū)塊鏈農(nóng)業(yè)應(yīng)用場景,對發(fā)展農(nóng)業(yè)區(qū)塊鏈具有積極的推動作用[42‐45]。區(qū)塊鏈技術(shù)的研究和應(yīng)用是互相促進的,如何構(gòu)建安全、可靠、高效、可擴展的區(qū)塊鏈系統(tǒng),還存在很多挑戰(zhàn)。將區(qū)塊鏈技術(shù)應(yīng)用于農(nóng)業(yè)大數(shù)據(jù)安全,屬于農(nóng)業(yè)區(qū)塊鏈研究與應(yīng)用的重要方向之一,是一個暫新的課題,值得更多的思考與探索。
我國政府已經(jīng)將區(qū)塊鏈和經(jīng)濟社會融合發(fā)展作為重要目標,其重點是如何推動區(qū)塊鏈核心技術(shù)的突破,為數(shù)字經(jīng)發(fā)展提供安全可控的技術(shù)支撐。目前關(guān)于區(qū)塊鏈的研究很多仍停留在理念和場景設(shè)計階段,但也有一些關(guān)鍵技術(shù)正孕育新的突破。另外,關(guān)于區(qū)塊鏈的發(fā)展和應(yīng)用不僅僅是技術(shù)問題,從更高戰(zhàn)略發(fā)展層面看,甚至涉及到國際話語權(quán)和規(guī)則制定權(quán)的問題。區(qū)塊鏈作為第二代互聯(lián)網(wǎng)或構(gòu)建秩序互聯(lián)網(wǎng)的基石,其具有很強的擴張性,或者叫排他性甚至侵略性,搶占它的規(guī)則制定權(quán)或者話語權(quán)決定了其未來影響范圍。對于每一個區(qū)塊鏈的具體應(yīng)用,其個體或機構(gòu)必須服從區(qū)塊鏈的頂層規(guī)則和標準規(guī)范。而區(qū)塊鏈則有可能確定了產(chǎn)業(yè)治理規(guī)則,區(qū)塊鏈的治理規(guī)則憑借其分布式特征,其影響力可迅速超越國界和地域限制[46]。
隨著數(shù)字農(nóng)業(yè)和智慧農(nóng)業(yè)的不斷發(fā)展,區(qū)塊鏈技術(shù)作為新的支撐要素,將迎來更多發(fā)展機遇。農(nóng)業(yè)部等有關(guān)部門于2019 年12 月底發(fā)布了《數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019—2025)》,其中對區(qū)塊鏈的研發(fā)任務(wù)進行了部署,進一步明確了農(nóng)業(yè)區(qū)塊鏈的發(fā)展方向。該規(guī)劃明確指出要加快推進農(nóng)業(yè)區(qū)塊鏈大規(guī)模組網(wǎng)、實現(xiàn)鏈上鏈下數(shù)據(jù)協(xié)同、加強農(nóng)業(yè)區(qū)塊鏈標準化等基礎(chǔ)性研究,同時推動區(qū)塊鏈技術(shù)的落地應(yīng)用,包括在農(nóng)業(yè)資源監(jiān)測、質(zhì)量安全溯源、農(nóng)村金融保險、透明供應(yīng)鏈等方面的創(chuàng)新應(yīng)用[47]。
針對區(qū)塊鏈和大數(shù)據(jù)安全發(fā)展的問題,提出以下幾點建議。
(1)繼續(xù)提高對區(qū)塊鏈思維和關(guān)鍵技術(shù)的認知能力。關(guān)于對區(qū)塊鏈的認知和解讀,很多學者認為區(qū)塊鏈也是當前信息技術(shù)領(lǐng)域中最復(fù)雜、最難理解的技術(shù)之一。對于大多數(shù)非專業(yè)人員而言,可不必去深究其技術(shù)細節(jié),關(guān)鍵是理解區(qū)塊鏈的基本內(nèi)涵和基本架構(gòu),以及對未來可能產(chǎn)生的影響,尤其是可能對整個農(nóng)業(yè)帶來的廣泛而深遠的影響。
(2)加強區(qū)塊鏈農(nóng)業(yè)應(yīng)用的基礎(chǔ)研究。首先,要深入研究區(qū)塊鏈與大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等融合技術(shù),基于區(qū)塊鏈思維和架構(gòu),加強并做好大數(shù)據(jù)安全的頂層設(shè)計,夯實智慧農(nóng)業(yè)和大數(shù)據(jù)的底層基礎(chǔ)。其次,結(jié)合當前國家關(guān)于新基建的戰(zhàn)略部署,加強農(nóng)業(yè)區(qū)塊鏈基礎(chǔ)設(shè)施建設(shè),包括密碼學、節(jié)點安全、共識協(xié)議和智能合約設(shè)計等等。另外,大數(shù)據(jù)的區(qū)塊鏈化,區(qū)塊鏈的大數(shù)據(jù)化,仍是區(qū)塊鏈與大數(shù)據(jù)融合的兩大挑戰(zhàn)性課題,需要不斷攻關(guān)克難,創(chuàng)新發(fā)展。
(3)加強復(fù)合型人才的培養(yǎng)。從區(qū)塊鏈開發(fā)應(yīng)用角度看,技術(shù)跨入門檻相對較高,技術(shù)人才相對匱乏,既懂農(nóng)業(yè)又具有技術(shù)開發(fā)能力的復(fù)合型人才尤其缺乏。發(fā)展區(qū)塊鏈,人才是第一位的,要從基礎(chǔ)研究、創(chuàng)新應(yīng)用、產(chǎn)業(yè)發(fā)展等方面,前瞻性和系統(tǒng)性地培養(yǎng)建立人才隊伍。
(4)設(shè)計挖掘更多農(nóng)業(yè)應(yīng)用場景,尤其是與大數(shù)據(jù)安全結(jié)合應(yīng)用的場景。要通過銳意創(chuàng)新,開拓進取,積極主動設(shè)計挖掘出更多應(yīng)用場景,并盡快開發(fā)出具有先進性和示范效應(yīng)的應(yīng)用系統(tǒng),是當前面臨的重要任務(wù)。
大數(shù)據(jù)作為智慧農(nóng)業(yè)的核心資源,在任何情況下,確保其安全性、維護可信和可用性都是第一位的。沒有安全保障的數(shù)據(jù),其應(yīng)用價值將大打折扣,甚至將變成貽害無窮的源頭。更不能期望在一個充滿不安全、不可信、不完整的數(shù)據(jù)生態(tài)環(huán)境中,滋生孕育出更多高質(zhì)量的智慧成果,從這個意義上說,沒有數(shù)據(jù)安全,智慧農(nóng)業(yè)也將成為無本之木、無源之水,終將漸失發(fā)展之根基。通過本文深入的綜合分析,可以有理由相信,應(yīng)用區(qū)塊鏈技術(shù)支撐大數(shù)安全發(fā)展,是未來一個重要的研究方向和發(fā)展趨勢,必將推動智慧農(nóng)業(yè)走向發(fā)展速度更快,應(yīng)用領(lǐng)域更寬,滲透力更強的康莊之路。