高垣 侶潔
摘要:伴隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,數(shù)據(jù)在以越來越快的速度增長,社會的各個部門每天都會產(chǎn)生大量的新數(shù)據(jù),為了應(yīng)對這些海量數(shù)據(jù),大數(shù)據(jù)技術(shù)應(yīng)運而生,但是隨著大數(shù)據(jù)技術(shù)帶來的各種改變,數(shù)據(jù)安全問題也不容忽視,安全保障是確保大數(shù)據(jù)合理使用的前提。文章簡要分析了大數(shù)據(jù)治理中面臨的各種安全問題以及應(yīng)對措施。
關(guān)鍵詞:大數(shù)據(jù):治理;安全
國際權(quán)威研究機構(gòu)Gartner對大數(shù)據(jù)的定義是需要處理模式才能具有更強決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的產(chǎn)生和針對大數(shù)據(jù)的研究給科學(xué)和教育事業(yè)的發(fā)展提供了前所未有的機會,目前國內(nèi)大的互聯(lián)網(wǎng)公司也已經(jīng)使用大數(shù)據(jù)方法在公共交通、智慧城市、生物醫(yī)療等方面取得巨大的成績,大數(shù)據(jù)技術(shù)與我們?nèi)粘I畹穆?lián)系也越來越緊密。大數(shù)據(jù)已經(jīng)對科學(xué)和產(chǎn)業(yè)之間的關(guān)系,科學(xué)與社會之間的關(guān)系都帶來大幅度的變革。但是大數(shù)據(jù)在帶來諸多新機會新發(fā)展的同時也帶來前所未有的挑戰(zhàn),在數(shù)據(jù)成為重要資源的今天,既要保證數(shù)據(jù)隱私不被泄露,有效地管理數(shù)據(jù)的安全,又要保證數(shù)據(jù)的正常使用,已經(jīng)成為越來越多數(shù)據(jù)科學(xué)家研究的問題。
大數(shù)據(jù)的數(shù)據(jù)體量非常大,遠遠不止成千上萬行,動輒幾十億行,數(shù)百萬列。數(shù)據(jù)類型和數(shù)據(jù)結(jié)構(gòu)也非常復(fù)雜,有圖像的、視頻的、文本的以及各種各樣的網(wǎng)絡(luò)數(shù)據(jù),大數(shù)據(jù)反映了各種各樣新的數(shù)據(jù)源、數(shù)據(jù)格式和數(shù)據(jù)結(jié)構(gòu)。同時,大數(shù)據(jù)還以非??斓乃俣仍鲩L,這就要求處理數(shù)據(jù)的軟硬件工具不僅能夠快速采集數(shù)據(jù),還要能夠描述數(shù)據(jù)以及近乎實時的分析處理數(shù)據(jù)。這樣傳統(tǒng)的數(shù)據(jù)庫或者對數(shù)據(jù)的分析方法已經(jīng)很難有效地分析大數(shù)據(jù)了,必須要用新的工具和技術(shù)來存儲,管理數(shù)據(jù),最終實現(xiàn)數(shù)據(jù)的價值。這些新的工具和技術(shù)能夠創(chuàng)建、操縱、管理大型的數(shù)據(jù)集并且有用來存儲數(shù)據(jù)集的足夠大的存儲環(huán)境。大數(shù)據(jù)的復(fù)雜數(shù)據(jù)結(jié)構(gòu)特點,以及廣泛的數(shù)據(jù)來源和基于云的計算存儲環(huán)境都有可能涉及個人隱私數(shù)據(jù),國家重點行業(yè)及重要部門的敏感數(shù)據(jù)等等。所以在針對大數(shù)據(jù)應(yīng)用的同時,數(shù)據(jù)的來源安全,數(shù)據(jù)的使用安全和存儲平臺的安全都非常的重要[1]。
1 大數(shù)據(jù)治理
要想分析大數(shù)據(jù)治理中存在的安全問題,首先要理清楚什么是大數(shù)據(jù)治理?大數(shù)據(jù)治理是一項系統(tǒng)的工程.大的方面包括大數(shù)據(jù)技術(shù)平臺的搭建、大數(shù)據(jù)政策的制定、大數(shù)據(jù)組織的變革以及數(shù)據(jù)處理流程的重組,小到元數(shù)據(jù)的管理、主數(shù)據(jù)的整合、各種類型大數(shù)據(jù)的個性化治理和大數(shù)據(jù)行業(yè)的應(yīng)用??偟膩碚f,大數(shù)據(jù)治理是廣義上數(shù)據(jù)治理計劃的一部分內(nèi)容,也就是制定與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護和數(shù)據(jù)變現(xiàn)的政策。構(gòu)建大數(shù)據(jù)治理系統(tǒng)首先要搭建數(shù)據(jù)治理的總體框架,包括組織架構(gòu)、數(shù)據(jù)治理模塊以及數(shù)據(jù)運維3部分[2-3]。
1.1搭建大數(shù)據(jù)組織架構(gòu)
進行大數(shù)據(jù)治理要通過建立組織架構(gòu)制定管理辦法,數(shù)據(jù)處理的工作流程,確定各個角色的具體職責(zé)。大數(shù)據(jù)組織架構(gòu)具體形式一般是由數(shù)據(jù)治理委員會管理和領(lǐng)導(dǎo)數(shù)據(jù)治理工作,制定數(shù)據(jù)治理的政策和流程,協(xié)調(diào)各方面的沖突,保證數(shù)據(jù)的質(zhì)量和隱私安全。建立數(shù)據(jù)治理中心負責(zé)提交數(shù)據(jù)標(biāo)準(zhǔn)的要求即數(shù)據(jù)質(zhì)量的規(guī)則,解釋數(shù)據(jù)的業(yè)務(wù)規(guī)則和含義。數(shù)據(jù)治理中心下面就是各個具體的數(shù)據(jù)業(yè)務(wù)部門,數(shù)據(jù)支撐部門和數(shù)據(jù)使用部門,主要負責(zé)數(shù)據(jù)及相關(guān)系統(tǒng)的開發(fā),執(zhí)行各項數(shù)據(jù)標(biāo)準(zhǔn),從技術(shù)角度解決數(shù)據(jù)的質(zhì)量問題。
1.2搭建大教據(jù)治理模塊
數(shù)據(jù)治理模塊主要包括數(shù)據(jù)標(biāo)準(zhǔn)管理、元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理等,各個模塊要協(xié)作運營,最終確保大數(shù)據(jù)平臺的數(shù)據(jù)一致、安全、有效。依靠數(shù)據(jù)標(biāo)準(zhǔn)管理建立數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,遵循協(xié)商一致的原則,利用標(biāo)準(zhǔn)化的管理流程管理數(shù)據(jù)標(biāo)準(zhǔn)化的整個過程。采用集中管理模式進行元數(shù)據(jù)管理,將元數(shù)據(jù)管理模塊作為數(shù)據(jù)的統(tǒng)一發(fā)布源,集中管理元數(shù)據(jù),定期進行元數(shù)據(jù)的維護。要從數(shù)據(jù)獲取、存儲、維護等整個生命周期各個階段控制數(shù)據(jù)質(zhì)量。做好識別和預(yù)警工作,提高數(shù)據(jù)管理水平使得數(shù)據(jù)的質(zhì)量有所保證。要通過制定數(shù)據(jù)安全政策,做好數(shù)據(jù)平臺訪問的授權(quán)工作,保證數(shù)據(jù)的安全。
1.3做好數(shù)據(jù)的維護
數(shù)據(jù)的運行維護貫穿于整個數(shù)據(jù)治理的體系當(dāng)中,加強數(shù)據(jù)安全及隱私的保護,每個數(shù)據(jù)都需要提供對應(yīng)的數(shù)據(jù)隱私級別信息。維護數(shù)據(jù)安全還要細化數(shù)據(jù)的分類,對每個模塊的元數(shù)據(jù)都要做好標(biāo)記。與此同時要細化元數(shù)據(jù)的權(quán)限,不同的部門、人員僅授予工作所需的最小權(quán)限,保證元數(shù)據(jù)的安全。另外元數(shù)據(jù)的版本也要嚴格控制,每次數(shù)據(jù)變更之后都要詳細記錄變更的原因、時間等關(guān)鍵信息。
2 大數(shù)據(jù)治理中的安全問題
大數(shù)據(jù)的治理是大數(shù)據(jù)應(yīng)用的基礎(chǔ),其重要性不言而喻。從上面的分析可以看出大數(shù)據(jù)治理面臨的情況非常復(fù)雜,面臨更加嚴峻的隱私安全問題和更大的投資回報風(fēng)險。具體來說大數(shù)據(jù)治理在以下幾個方面存在安全隱患[4-5]。
2.1數(shù)據(jù)收集及傳輸過程中的安全問題
大數(shù)據(jù)體量巨大,保羅萬象,里面蘊藏著巨大的研究價值和經(jīng)濟價值,吸引了許多機構(gòu)及黑客的注意力,他們利用爬蟲或者木馬通過各種各樣的方式獲取數(shù)據(jù)。數(shù)據(jù)的研究價值和經(jīng)濟價值使得更多的團體和個人投入到對大數(shù)據(jù)的攻擊當(dāng)中,增大了大數(shù)據(jù)的風(fēng)險。另外當(dāng)前數(shù)據(jù)的傳輸方式多樣化,如果對數(shù)據(jù)的傳輸安全不夠重視,就有可能在傳輸過程中出現(xiàn)數(shù)據(jù)泄露的可能。而因為大數(shù)據(jù)的數(shù)據(jù)體量大,一旦遭受攻擊,造成數(shù)據(jù)的丟失量也是相當(dāng)大,這樣就降低了黑客攻擊的成本,所以要加強數(shù)據(jù)傳輸過程中的安全防護。
2.2數(shù)據(jù)整合及處理過程中的安全問題
由于大數(shù)據(jù)的龐大數(shù)據(jù)量,傳統(tǒng)的處理方法和計算平臺無法正常的運行和處理。為了解決海量數(shù)據(jù)同時計算,提高數(shù)據(jù)處理的速度,數(shù)據(jù)處理機構(gòu)除了配備更高的硬件設(shè)備外,還要部署大量的虛擬技術(shù)。通常對大型數(shù)據(jù)集劃分后,變成易于處理的單個部分,利用Hadoop集群處理,然后再將計算結(jié)果重新組合分析,這個過程中,涉及大量跨集群的機器和機器之間的交互,極其容易出現(xiàn)不安全的因素,比如在數(shù)據(jù)處理計算時有可能受到黑客利用偽裝身份侵入大數(shù)據(jù)平臺對數(shù)據(jù)進行篡改和竊取,存在很大風(fēng)險。所以,在數(shù)據(jù)處理過程當(dāng)中,要對數(shù)據(jù)的使用者進行身份認證,并且設(shè)置相應(yīng)的訪問權(quán)限。保證不同級別的工作人員具有不同的使用權(quán)限,防止基層員工在工作過程中的誤操作或者其他行為篡改數(shù)據(jù),降低數(shù)據(jù)的質(zhì)量。
2.3個人隱私安全問題
大數(shù)據(jù)時代,對機構(gòu)和個人數(shù)據(jù)抓取的爬蟲無處不在。要想阻止數(shù)據(jù)提供商對個人信息的挖掘是不可能的。各個社交網(wǎng)站上,用戶寫入的信息,包括手機顯示的位置等個人隱私數(shù)據(jù)都有可能被數(shù)據(jù)挖掘商們收集,然后用來分析和研究。雖然通過大數(shù)據(jù)的分析方法,對消費者個人信息的收集可以更加精準(zhǔn)地為消費者個性化定制各種消費需求,提高消費的便利和消費者的生活質(zhì)量,但是隨著個人信息的不斷泄露,用戶很難保汪自己的信息被收集使用完之后及時地清除,用戶的個人隱私安全問題也日益突出。另外大數(shù)據(jù)的發(fā)展要求資源共享,數(shù)據(jù)盡量開放,這也與個人的隱私保護存在矛盾。所以,要在大數(shù)據(jù)治理過程中,盡量對用戶信息和涉密信息等敏感的信息進行脫敏,保護個人隱私和涉密數(shù)據(jù)安全。
2.4網(wǎng)絡(luò)技術(shù)安全問題
因為大數(shù)據(jù)的特點要求在數(shù)據(jù)的存儲、計算等關(guān)鍵技術(shù)部分對計算機的軟件和硬件全方位的變革,這樣就導(dǎo)致很多細節(jié)的地方存在未知的漏洞?,F(xiàn)在傳統(tǒng)的網(wǎng)絡(luò)安全防護技術(shù)對于云計算和云存儲等存在的未知漏洞可能無法抵御。另外,傳統(tǒng)的網(wǎng)絡(luò)安全邊界一般都比較清晰,大數(shù)據(jù)計算平臺大多是在Hadoop的基礎(chǔ)上進行二次開發(fā),底層很復(fù)雜,使用的分布式存儲和計算方式導(dǎo)致安全邊界模糊,這種情況下,傳統(tǒng)的網(wǎng)絡(luò)安全防護技術(shù)已經(jīng)失效。所以要根據(jù)大數(shù)據(jù)的特點,建立相匹配的安全防護體系,加強對數(shù)據(jù)攻擊和竊取的防護力度,提高數(shù)據(jù)安全預(yù)警和應(yīng)急處理的能力,構(gòu)建一個適合大數(shù)據(jù)的網(wǎng)絡(luò)安全保障體系,提升數(shù)據(jù)安全保護水平。
2.5數(shù)據(jù)存儲的安全問題
隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,各種形式的數(shù)據(jù)量日益增多。傳統(tǒng)的數(shù)據(jù)庫存儲系統(tǒng)已經(jīng)不能滿足大數(shù)據(jù)的存儲需要。目前通常使用NoSQL存儲技術(shù)來對大量的非結(jié)構(gòu)化數(shù)據(jù)進行抓取、管理和處理。雖然這種存儲技術(shù)容易擴展,性能也比較好,適合大數(shù)據(jù),但是仍然存在一定的問題。比如這種技術(shù)的使用時間畢竟有限,不是特別成熟,有可能存在技術(shù)漏洞,所以要在大數(shù)據(jù)治理過程中加強對于數(shù)據(jù)的使用權(quán)限的授權(quán)與驗證,定期對數(shù)據(jù)安全進行監(jiān)督和檢查,發(fā)現(xiàn)問題要及時整改,以保證數(shù)據(jù)的安全。
2.6數(shù)據(jù)信任的安全問題
數(shù)據(jù)的準(zhǔn)確性影響人們對于大數(shù)據(jù)分析結(jié)果的信任度。近年來,一些統(tǒng)計數(shù)據(jù)結(jié)果與人們的切身感受不符,導(dǎo)致人們對于數(shù)據(jù)準(zhǔn)確性產(chǎn)生了質(zhì)疑。比如工資的“被增長”、房價的“被降低”等。所以要保證數(shù)據(jù)的準(zhǔn)確性,讓人們相信大數(shù)據(jù),相信通過大數(shù)據(jù)分析產(chǎn)生的結(jié)果。這就要求構(gòu)建一個使大數(shù)據(jù)值得信任的安全環(huán)境,需要政府機構(gòu)、各級單位和個人的共同努力,共同維護好大數(shù)據(jù)的準(zhǔn)確性,讓大數(shù)據(jù)值得信任。
3結(jié)語
總之,在大數(shù)據(jù)的治理過程中和大數(shù)據(jù)的整個生命周期里,都存在著各種各樣的安全挑戰(zhàn),所以從大數(shù)據(jù)的收集到分析處理都要嚴格遵守各項安全標(biāo)準(zhǔn)和保密規(guī)定,保汪數(shù)據(jù)的安全性和隱私性。只有確保大數(shù)據(jù)技術(shù)和大數(shù)據(jù)安全同時發(fā)展,大數(shù)據(jù)的巨大價值才可以真正得到體現(xiàn),在未來的技術(shù)發(fā)展中發(fā)揮更大的作用,更好地服務(wù)于人們的生活。
[參考文獻]
[1]李冬,萬磊,費建章大數(shù)據(jù)治理中的安全問題研究[J]信息與電腦(理論版),2017 (6):192-193
[2]常春光,王雪龍,張瑜.大數(shù)據(jù)時代下城鎮(zhèn)安全治理問題研究[J].遼寧經(jīng)濟,2017 (7):28-29.
[3]莊國波,陸曉燕大數(shù)據(jù)時代精細化社會治理中安全問題研究[J]理論探討,2017 (6):163-167
[4]王萌萌地方政府治理中的大數(shù)據(jù)技術(shù)運用研究[D]重慶:中共重慶市委黨校,2017
[5]王雪麗城市公共安全治理中的“府際關(guān)系”問題研究[J]云南行政學(xué)院學(xué)報,2013 (2):52-55