李洪波
摘要:目的:對(duì)大數(shù)據(jù)應(yīng)用模式進(jìn)行分析,并對(duì)其存在的安全風(fēng)險(xiǎn)進(jìn)行研究。方法:采用文獻(xiàn)查閱法和案例分析法來(lái)對(duì)大數(shù)據(jù)應(yīng)用模式中的安全風(fēng)險(xiǎn)進(jìn)行分析。結(jié)果:Hadoop在云計(jì)算的應(yīng)用中有不同的形式,同時(shí)也存在許多安全風(fēng)險(xiǎn),要應(yīng)對(duì)這些風(fēng)險(xiǎn),可以對(duì)用戶、平臺(tái)、行為請(qǐng)求進(jìn)行監(jiān)控。
關(guān)鍵詞:大數(shù)據(jù);應(yīng)用模式;安全風(fēng)險(xiǎn);研究分析
中圖分類號(hào):TP309? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
現(xiàn)階段,我國(guó)各個(gè)領(lǐng)域的數(shù)據(jù)生成都非常迅速,要處理的數(shù)據(jù)量也在急劇增多。這些數(shù)據(jù)除了具有數(shù)量大的特點(diǎn)外,還具有多樣化的符號(hào),這就對(duì)數(shù)據(jù)處理器的性能提出了更高的要求。如今,數(shù)據(jù)的處理已經(jīng)不再是簡(jiǎn)單地要求生成統(tǒng)計(jì)報(bào)告,而是利用分析模型對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析。依賴云計(jì)算平臺(tái)搭建而成的Hadoop計(jì)算框架由此產(chǎn)生。但由于其自身的特點(diǎn)和安全機(jī)制的薄弱,該計(jì)算框架也存在著巨大的安全風(fēng)險(xiǎn)[1]。
1? 大數(shù)據(jù)的應(yīng)用模式
大數(shù)據(jù)應(yīng)用模式本身就是信息技術(shù)發(fā)展的新興產(chǎn)物,其具有數(shù)據(jù)的海量?jī)?chǔ)存性,能夠通過(guò)數(shù)據(jù)運(yùn)算對(duì)海量的信息進(jìn)行準(zhǔn)確的處理。該模式通常會(huì)被運(yùn)用于企業(yè)的會(huì)計(jì)信息處理中,也就是說(shuō)當(dāng)下的會(huì)計(jì)信息化,其本質(zhì)是將會(huì)計(jì)知識(shí)與大數(shù)據(jù)處理進(jìn)行結(jié)合,進(jìn)而形成有利于企業(yè)會(huì)計(jì)資源處理的一種新型模式。在該模式下,企業(yè)能夠利用云計(jì)算對(duì)每天發(fā)生的業(yè)務(wù)進(jìn)行相應(yīng)的處理,包括因?yàn)闃I(yè)務(wù)而產(chǎn)生的憑證、資金流動(dòng)等數(shù)據(jù),最重要的是企業(yè)可以通過(guò)云計(jì)算來(lái)將企業(yè)的每一筆資金流動(dòng)進(jìn)行計(jì)算,為企業(yè)財(cái)務(wù)部門提供更為準(zhǔn)確有效且具有時(shí)效性的數(shù)據(jù),對(duì)于企業(yè)的生產(chǎn)銷售、產(chǎn)品定位等也能帶來(lái)極大的幫助。比如可以通過(guò)云計(jì)算來(lái)整合市場(chǎng)數(shù)據(jù),為企業(yè)下一步的發(fā)展做出相應(yīng)的戰(zhàn)略分析。云計(jì)算將傳統(tǒng)的個(gè)人電腦和有私人數(shù)據(jù)中心的任務(wù)執(zhí)行方式轉(zhuǎn)變?yōu)榫哂袑I(yè)計(jì)算存儲(chǔ)功能的大型專業(yè)計(jì)算中心。這樣一來(lái),也就強(qiáng)有力地實(shí)現(xiàn)了計(jì)算機(jī)軟件、硬件等計(jì)算資源的充分整合以及共享,使計(jì)算機(jī)軟、硬件之間的資源高度共享成為一種可能,為企業(yè)的發(fā)展提供便利,讓計(jì)算機(jī)中的私人數(shù)據(jù)與網(wǎng)絡(luò)中的共享數(shù)據(jù)進(jìn)行有效的整合,使這些數(shù)據(jù)充分發(fā)揮其作用,更好地為企業(yè)生產(chǎn)、銷售等提供支撐力,為更好地服務(wù)企業(yè)提供了便利。
但是,大數(shù)據(jù)應(yīng)用模式需要建立在企業(yè)擁有科學(xué)合理的數(shù)據(jù)以及企業(yè)財(cái)務(wù)人員懂得相應(yīng)的計(jì)算機(jī)知識(shí),能夠利用財(cái)務(wù)軟件進(jìn)行數(shù)據(jù)處理這一基礎(chǔ)之上,要求財(cái)務(wù)人員逐步提升自身的綜合素質(zhì)水平,將自身培養(yǎng)成綜合性的人才。而大數(shù)據(jù)應(yīng)用模式也并非只針對(duì)財(cái)務(wù)方面的運(yùn)用,還體現(xiàn)在企業(yè)的整體發(fā)展中,大數(shù)據(jù)應(yīng)用模式能夠充分整合市場(chǎng)資源,對(duì)某一產(chǎn)品的銷售量、市場(chǎng)潛力進(jìn)行合理的分析,幫助企業(yè)對(duì)下一季度的產(chǎn)品生產(chǎn)做出最精準(zhǔn)的預(yù)測(cè),進(jìn)而幫助企業(yè)盈利。大數(shù)據(jù)建立在科學(xué)的分析基礎(chǔ)之上,其對(duì)于企業(yè)的發(fā)展具有重要的意義。由此,其應(yīng)用范圍也極為廣泛。當(dāng)下,大數(shù)據(jù)應(yīng)用模式主要有以下幾種模式:(1)數(shù)據(jù)的出售模式。對(duì)一些時(shí)效性較強(qiáng)的數(shù)據(jù)進(jìn)行保留,定期為各行各業(yè)提供相關(guān)的數(shù)據(jù)服務(wù),這種應(yīng)用模式需要建立在龐大的數(shù)據(jù)庫(kù)基礎(chǔ)之上。(2)信息的租售模式。這種模式通常集中在某一行業(yè)或領(lǐng)域,在大數(shù)據(jù)龐大的處理能力支持下,對(duì)信息進(jìn)行廣泛的收集和有效的整合,將一些有價(jià)值的信息整理并向相應(yīng)行業(yè)出售,以此來(lái)獲得回報(bào)。(3)數(shù)字媒體的模式。這一模式近年來(lái)也應(yīng)用得越來(lái)越多,主要是指利用網(wǎng)絡(luò)媒體能夠進(jìn)行快速?gòu)V泛的傳播和及時(shí)互動(dòng)的能力,實(shí)時(shí)、快速、準(zhǔn)確地捕捉到客戶群體,為客戶提供準(zhǔn)確的數(shù)據(jù)信息服務(wù),并獲得有效的反饋信息。(4)空間的運(yùn)營(yíng)方式。這個(gè)方式主要用于獲取更多的數(shù)據(jù)資源,以及對(duì)數(shù)據(jù)資源的獨(dú)占訪問(wèn)。(5)云計(jì)算服務(wù)模式。其優(yōu)勢(shì)是針對(duì)客戶可以定制個(gè)性化的服務(wù),通常面向企業(yè),是基于互聯(lián)網(wǎng)的動(dòng)態(tài)虛擬化而提供的信息資源服務(wù)。這種模式下,企業(yè)無(wú)需花費(fèi)大量的資金來(lái)購(gòu)買基礎(chǔ)設(shè)備,更不需要對(duì)設(shè)備進(jìn)行維護(hù)與安裝,這些專業(yè)的服務(wù)都將由云計(jì)算服務(wù)商來(lái)提供,只需要按照一定的方式來(lái)支付相應(yīng)的租賃費(fèi)用就可以對(duì)數(shù)據(jù)進(jìn)行處理。這一方式不僅為企業(yè)節(jié)約了大量的資金,也為企業(yè)節(jié)省了更多的時(shí)間與人力。
通常情況下,數(shù)據(jù)應(yīng)用需要與云計(jì)算相結(jié)合。Hadoop是目前大數(shù)據(jù)領(lǐng)域最為通用的技術(shù)平臺(tái),也是Google云計(jì)算GFS的開(kāi)源實(shí)現(xiàn)。這為數(shù)據(jù)的計(jì)算提供了一種計(jì)算框架,而此框架更是為現(xiàn)代企業(yè)云計(jì)算和數(shù)據(jù)處理模式的實(shí)際運(yùn)用提供了新的可能性,能夠有效促進(jìn)企業(yè)的發(fā)展,幫助企業(yè)朝現(xiàn)代化企業(yè)發(fā)展模式轉(zhuǎn)型,進(jìn)而提升企業(yè)的綜合競(jìng)爭(zhēng)力,讓企業(yè)以有效、及時(shí)、精準(zhǔn)的數(shù)據(jù)來(lái)應(yīng)對(duì)企業(yè)發(fā)展中可能會(huì)存在的各種風(fēng)險(xiǎn)。而其中最為核心的技術(shù)就是HDFS(Hadoop Distributed File System)以及MapReduce,企業(yè)在實(shí)際運(yùn)用大數(shù)據(jù)應(yīng)用模式時(shí),需要明確這兩種核心技術(shù)的基本理論,然后將其落實(shí)于企業(yè)發(fā)展進(jìn)程中。前者為大數(shù)據(jù)分析提供了高吞吐量的分析,而后者則是一種大型的數(shù)據(jù)分布式處理模型,由此可見(jiàn),Hadoop為大數(shù)據(jù)的分析與處理提供了一個(gè)非常有效且可靠的信息存儲(chǔ)與分析系統(tǒng),其是企業(yè)真正將大數(shù)據(jù)應(yīng)用模式融入于企業(yè)生產(chǎn)、銷售的各個(gè)環(huán)節(jié)中的基礎(chǔ)條件,能夠助力于企業(yè)的現(xiàn)代化發(fā)展。當(dāng)下,企業(yè)發(fā)展中運(yùn)用大數(shù)據(jù)處理模式已經(jīng)成為一種必然選擇,是企業(yè)在現(xiàn)代化發(fā)展過(guò)程中想要取得更高的利潤(rùn)和拓展市場(chǎng)份額的必備條件,而在大數(shù)據(jù)的分析和處理中,將云計(jì)算與Hadoop相結(jié)合已經(jīng)是一種必然的趨勢(shì),當(dāng)下的企業(yè)發(fā)展已經(jīng)與云計(jì)算、Hadoop的實(shí)際運(yùn)用產(chǎn)生了必然的聯(lián)系[2]。
2? 對(duì)大數(shù)據(jù)應(yīng)用模式安全風(fēng)險(xiǎn)的分析
云計(jì)算將數(shù)據(jù)外包給云服務(wù)提供商并提供服務(wù),該服務(wù)標(biāo)準(zhǔn)也允許數(shù)據(jù)所有權(quán)歸屬于CSP,在對(duì)物理資源的控制中,用戶失去了直接控制的主動(dòng)權(quán)。通常,存儲(chǔ)在云端中的數(shù)據(jù)以合法的文本形式存在,而CSP有權(quán)控制底層數(shù)據(jù),因此,惡意的CSP很可能會(huì)在用戶不知情的情況下竊取并篡改用戶的數(shù)據(jù),使云計(jì)算平臺(tái)受到非法數(shù)據(jù)的控制,導(dǎo)致數(shù)據(jù)被非法讀取,這讓用戶和平臺(tái)的信息安全受到了威脅。這是大數(shù)據(jù)應(yīng)用模式存在的安全風(fēng)險(xiǎn)之一[3]。
最初,在對(duì)Hadoop進(jìn)行設(shè)計(jì)時(shí),設(shè)計(jì)者并未考慮到相應(yīng)的安全問(wèn)題,在進(jìn)行了多個(gè)版本的改進(jìn)之后,Hadoop才有了基于ACL的訪問(wèn)控制機(jī)制。但是,該實(shí)施方案仍然存在很大的安全問(wèn)題,盡管已經(jīng)增加了訪問(wèn)控制策略,但安全形勢(shì)依然非常薄弱。因?yàn)樵诨诖瞬呗缘腁CL控制被激活之后,才可以對(duì)ACL執(zhí)行訪問(wèn)控制,對(duì)其中相應(yīng)的屬性進(jìn)行匹配,其中包括限制用戶與組成員對(duì)資料進(jìn)行訪問(wèn)的節(jié)點(diǎn)通信。由此可以看出,這種過(guò)于依賴管理員的傳統(tǒng)控制機(jī)制很容易被篡改并且不易被察覺(jué)。由于ACL的訪問(wèn)控制策略粒度過(guò)粗,很難對(duì)用戶的隱私字段進(jìn)行保護(hù),并且針對(duì)不同的用戶與不同的應(yīng)用模式,訪問(wèn)控制機(jī)制也需要定時(shí)修改,這種操作過(guò)于煩瑣且不利于維護(hù)。所以,Hadoop自帶的安全機(jī)制非常不完善。
2.1? 在不同應(yīng)用模式下CAP和Uers帶來(lái)的安全風(fēng)險(xiǎn)
企業(yè)自身應(yīng)用的Hadoop中,由于使用者為企業(yè)的各個(gè)員工,因此,企業(yè)外部人員無(wú)權(quán)訪問(wèn)和使用這些數(shù)據(jù)與資料。而在非企業(yè)自身應(yīng)用的Hadoop中,CSP被分為兩級(jí),一組需要負(fù)責(zé)提供相應(yīng)的基礎(chǔ)設(shè)施,另一組負(fù)責(zé)對(duì)Hadoop進(jìn)行搭建與管理。當(dāng)CSP存在權(quán)限過(guò)大的情況時(shí),在用戶不知道的情況下,CSP就能獲取到用戶的數(shù)據(jù),這就是CSP對(duì)用戶數(shù)據(jù)造成的威脅;當(dāng)偽造用戶獲取到合法用戶的數(shù)據(jù)或惡意用戶對(duì)CSP提出非法請(qǐng)求時(shí),也可以獲取用戶隱私數(shù)據(jù),這便是用戶對(duì)CSP造成的威脅[4]。以Hadoop在不同的應(yīng)用模式中數(shù)據(jù)可能受到的威脅點(diǎn)為例,如圖1所示,位置1和位置5處于相同的風(fēng)險(xiǎn)中。CSP可以通過(guò)位置1、3、4、5獲取數(shù)據(jù),Hadoop文件格式也有多種類型,有些文件格式是二進(jìn)制,所以這些文件可以被讀取。由于CSP對(duì)數(shù)據(jù)有絕對(duì)的控制權(quán),所以很容易獲得物理磁盤的所需內(nèi)容,以便進(jìn)行讀取和分析。此外,CSP還可以使用超級(jí)用戶的身份特權(quán),在用戶不知情的情況下對(duì)文件進(jìn)行修改,并且可以通過(guò)位置1、2、5竊取所需的數(shù)據(jù)。非法用戶也可以相應(yīng)地獲取和讀取數(shù)據(jù),非法用戶一旦獲得合法身份,就會(huì)與合法用戶享有同等權(quán)利。它們可以在位置1和位置5發(fā)出請(qǐng)求,從datan-ODE獲取相應(yīng)的數(shù)據(jù),并在位置2輸出它們想要分析的數(shù)據(jù)。
2.2? 威脅模型
假設(shè)數(shù)據(jù)庫(kù)中所有的數(shù)據(jù)均是以客戶訂單日期等形式存在于數(shù)據(jù)庫(kù)中,且每個(gè)客戶都擁有一份相應(yīng)的交易記錄,如果客戶想要得到某一個(gè)特殊日子里的訂單數(shù)目,客戶就可以通過(guò)Mapper來(lái)對(duì)數(shù)據(jù)進(jìn)行讀取。比如記錄日期為D,那么對(duì)應(yīng)的輸出鍵/值就是
3? 安全策略
在當(dāng)今大數(shù)據(jù)時(shí)代下,數(shù)據(jù)的價(jià)值變得越來(lái)越重要,數(shù)據(jù)的安全問(wèn)題也變得越來(lái)越嚴(yán)重。由于大數(shù)據(jù)具有規(guī)模大,數(shù)據(jù)類型多,數(shù)據(jù)結(jié)構(gòu)非常復(fù)雜的特點(diǎn),因此,維護(hù)數(shù)據(jù)所需的資金成本也越來(lái)越高。在大數(shù)據(jù)應(yīng)用模式下,如何以低成本來(lái)保護(hù)數(shù)據(jù)的安全變得尤為重要。對(duì)文件和系統(tǒng)的保護(hù)通常稱為數(shù)據(jù)服務(wù)安全保護(hù),而對(duì)密鑰值和結(jié)果存儲(chǔ)內(nèi)容的保護(hù)則稱為隱私保護(hù)。根據(jù)上文中提到的一些大數(shù)據(jù)應(yīng)用安全風(fēng)險(xiǎn),提出了以下解決策略。
3.1? 對(duì)CSP以及用戶的身份進(jìn)行驗(yàn)證
驗(yàn)證CSP及用戶身份的完整性,Kerberos的雙向驗(yàn)證功能可以保證使用雙方身份的安全性,這是一項(xiàng)在請(qǐng)求發(fā)起時(shí)的驗(yàn)證。
3.2? 驗(yàn)證平臺(tái)的安全性
除了要保障使用雙方的身份安全外,還需要對(duì)平臺(tái)的安全性進(jìn)行驗(yàn)證,平臺(tái)驗(yàn)證可以通過(guò)使用可靠的計(jì)算技術(shù)方式進(jìn)行,使用TPM技術(shù)創(chuàng)建一個(gè)可信任的云計(jì)算環(huán)境,并通過(guò)對(duì)平臺(tái)云計(jì)算環(huán)境的測(cè)量,建立從物理層延伸的信任鏈于虛擬化層,這樣就能夠最大限度地保證云計(jì)算的安全性。
3.3? 對(duì)行為請(qǐng)求進(jìn)行監(jiān)控
為了降低行為請(qǐng)求當(dāng)中的安全風(fēng)險(xiǎn),在數(shù)據(jù)使用過(guò)程中還需要對(duì)操作的請(qǐng)求進(jìn)行實(shí)時(shí)監(jiān)視。建立相應(yīng)的非法操作監(jiān)控機(jī)制可以確保監(jiān)控這些非法操作的數(shù)據(jù),降低數(shù)據(jù)的運(yùn)算及輸出的安全風(fēng)險(xiǎn)。另外,LSM還可以建立相應(yīng)的訪問(wèn)控制策略,利用book函數(shù)監(jiān)控內(nèi)核調(diào)用,允許訪問(wèn)合法數(shù)據(jù),拒絕非法數(shù)據(jù)和不可靠行為,保證數(shù)據(jù)流與應(yīng)用程序的主體一致。
4? 結(jié)語(yǔ)
文章對(duì)大數(shù)據(jù)的應(yīng)用模式進(jìn)行了闡述,分析了對(duì)云計(jì)算環(huán)境中使用Hadoop進(jìn)行數(shù)據(jù)的存儲(chǔ),也對(duì)云計(jì)算中Hadoop的不同應(yīng)用環(huán)境進(jìn)行了分析,在Hadoop的操作過(guò)程中,對(duì)不可信主體造成的安全威脅給予了相應(yīng)的威脅模型,并且判斷風(fēng)險(xiǎn)主要來(lái)自于CSP以及數(shù)據(jù)的計(jì)算者。再加上通過(guò)CSP可以在用戶不知情的情況下盜取和篡改數(shù)據(jù),這并不能夠保護(hù)客戶的隱私和數(shù)據(jù)的安全,所以,針對(duì)這些問(wèn)題,也對(duì)CSP、用戶身份、平臺(tái)的安全進(jìn)行驗(yàn)證和對(duì)行為請(qǐng)求進(jìn)行監(jiān)控等提出了解決策略。
(責(zé)任編輯:侯辛鋒)
參考文獻(xiàn):
[1]孫海勇,李青.大數(shù)據(jù)信息安全風(fēng)險(xiǎn)框架及應(yīng)對(duì)策略研究[J].信息與電腦(理論版),2017(5):209-210.
[2]王帥,金華敏,沈軍,等.大數(shù)據(jù)應(yīng)用安全方案及對(duì)策研究[J].廣東通信技術(shù),2017(8):2-5.
[3]李依函,高寅生.大數(shù)據(jù)信息安全風(fēng)險(xiǎn)框架及應(yīng)對(duì)方式探析[J].現(xiàn)代經(jīng)濟(jì)信息,2018(21):320.
[4]楊子建,倪嬌嬌.大數(shù)據(jù)面臨的安全風(fēng)險(xiǎn)和對(duì)策研究[J].數(shù)字化用戶,2018(50):104.
[5]謝琦.大數(shù)據(jù)背景下個(gè)人信息安全風(fēng)險(xiǎn)及保護(hù)措施研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2018(3):57+76.