徐國蘭
〔摘 要〕提出了云存儲的概念,總結(jié)了云存儲在數(shù)字圖書館信息資源存儲中的優(yōu)勢。通過研究和分析云存儲在數(shù)字圖書館應(yīng)用中存在的安全問題,主要有數(shù)據(jù)傳輸安全、存儲安全、訪問安全等。提出了改進技術(shù)、建立行業(yè)標準和規(guī)范、引入第三方審計等防范措施。改進了云存儲在數(shù)字圖書館信息資源存儲中數(shù)據(jù)的安全與穩(wěn)定性。
〔關(guān)鍵詞〕云存儲;數(shù)字圖書館;數(shù)據(jù);數(shù)據(jù)安全;防范
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)04-0057-03
目前數(shù)字圖書館廣泛采用的存儲方案主要有DAS(Direct Attached Storage,直接附加存儲)、NAS(Network Attached Storage,網(wǎng)絡(luò)附加存儲)、SAN(Storage Area Network,存儲區(qū)域網(wǎng)絡(luò))、ISCSI(Internet Small Computer System Interface,互聯(lián)網(wǎng)小型計算機系統(tǒng)接口)和網(wǎng)格存儲等[1]。這5種存儲方案各有其優(yōu)勢,但單獨采用其中任何一種方案,都無法全面解決數(shù)字圖書館資源存儲面臨的眾多問題。針對這些現(xiàn)存問題,現(xiàn)代數(shù)字圖書館正在探索使用云存儲方案。
1 云存儲的概念及在數(shù)字圖書館數(shù)據(jù)存儲應(yīng)用中的優(yōu)勢1.1 云存儲的概念
云計算至今沒有一個統(tǒng)一的定義,每個定義都是從自身理解的角度來定義的,但主流的定義主要有技術(shù)層面和服務(wù)層面的定義。云存儲是在云計算(cloud computing)概念上延伸和發(fā)展出來的一個概念。在這里筆者也根據(jù)自己的理解來定義云存儲。云存儲是指通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng),將網(wǎng)絡(luò)中分散的、不同類型的存儲設(shè)備統(tǒng)一到一個或幾個大的存儲池下,形成一個統(tǒng)一的整體,作為一個動態(tài)的存儲資源實體向用戶提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能。由于云計算系統(tǒng)運算和處理的核心是大量數(shù)據(jù)的存儲和管理,云計算系統(tǒng)中配置有大量的存儲設(shè)備,所以云存儲是一個以數(shù)據(jù)存儲和管理為核心的云計算系統(tǒng)。
在數(shù)字圖書館信息資源存儲中應(yīng)用云存儲可以低成本的實現(xiàn)海量數(shù)字資源的存儲,提高存儲資源的利用率,并能提高數(shù)字圖書館之間信息資源的共享。與前面提到的存儲方案相比,數(shù)字圖書館采用云存儲方案具有較強的優(yōu)勢。
1.2 云存儲在數(shù)字圖書館應(yīng)用中的優(yōu)勢
1.2.1 節(jié)約成本
云存儲向圖書館用戶提供以網(wǎng)絡(luò)為基礎(chǔ)的在線存儲服務(wù),把云存儲集群的一部分提供給圖書館用戶。對于圖書館用戶來說就是通過網(wǎng)絡(luò)和一定的應(yīng)用軟件或應(yīng)用接口得到一定類型的存儲服務(wù)和訪問服務(wù),不需要配置基礎(chǔ)設(shè)施,并對這些基礎(chǔ)設(shè)施進行安裝、升級和維護,以及數(shù)據(jù)完整性保護和容災(zāi)備份。云存儲通過多租戶模式使得使用成本和管理成本大幅度降低。
1.2.2 安全和穩(wěn)定
云計算采用分布式存儲的方式來存儲數(shù)據(jù),采用冗余存儲的方式來保證存儲數(shù)據(jù)的可靠性(為同一份數(shù)據(jù)存儲多個副本),采用數(shù)據(jù)加密技術(shù)保證云存儲中的數(shù)據(jù)不會被未授權(quán)的用戶所訪問。同時,通過各種容災(zāi)技術(shù)和措施可以保證云存儲中的數(shù)據(jù)不會丟失,保證云存儲自身的安全和穩(wěn)定。數(shù)字圖書館采用云存儲,當(dāng)用戶突然增多、訪問量突然加大時,通過云存儲系統(tǒng),利用其自身的分布式系統(tǒng)、集群系統(tǒng),能合理分擔(dān)存儲和訪問的壓力,有效地防止數(shù)字圖書館系統(tǒng)癱瘓,提高數(shù)字圖書館的信息資源存儲系統(tǒng)的穩(wěn)定性。
1.2.3 實現(xiàn)資源共享
在云存儲系統(tǒng)中,各個數(shù)字圖書館的信息資源保存在“云”中,所有符合權(quán)限的讀者只要通過互聯(lián)網(wǎng)連接到“云”,就可以不受物理地址和時間限制的訪問所有資源,實現(xiàn)了數(shù)字圖書館之間的資源共享。
2 云存儲數(shù)字圖書館數(shù)據(jù)存儲應(yīng)用中的安全問題
云計算的吸引力在于其經(jīng)濟上的可擴展性、資源復(fù)用、低成本和高效率。為了支撐這種低成本高效率,云供應(yīng)商提供的服務(wù)必須足夠靈活,但這種靈活性會降低其對安全控制的能力[2]。根據(jù)2009年CSA(Cloud Security Aliance,云安全聯(lián)盟)發(fā)布的一份云計算安全風(fēng)險簡明報告總結(jié)了7條最常見的風(fēng)險:濫用和惡意使用云計算;不安全的接口;內(nèi)部員工的濫用;基礎(chǔ)設(shè)施共享問題;數(shù)據(jù)丟失或泄漏;賬號或服務(wù)劫持;未知的風(fēng)險。云存儲在數(shù)字圖書館信息資源的存儲應(yīng)用中主要存在以下安全問題:
2.1 數(shù)據(jù)傳輸過程安全
數(shù)字圖書館采用云存儲模式,原來局限在私有網(wǎng)絡(luò)的資源和數(shù)據(jù)現(xiàn)在暴露在互聯(lián)網(wǎng)上,并且這些資源和數(shù)據(jù)放到了第三方云計算提供商所有的共享公共網(wǎng)絡(luò)上。圖書館在將信息資源數(shù)據(jù)通過網(wǎng)絡(luò)傳遞到云計算服務(wù)器進行處理時,會存在這樣的問題:數(shù)據(jù)在網(wǎng)絡(luò)傳輸過程中是否進行了嚴格加密,保證數(shù)據(jù)不被中途偵聽,即使被偵聽了也無法還原;能否保證數(shù)據(jù)的完整性;在傳輸過程中能否不被被莫名其妙的修改。
2.2 數(shù)據(jù)存儲安全
數(shù)字圖書館信息資源數(shù)據(jù)存儲在云存儲系統(tǒng)中,他所使用的基礎(chǔ)設(shè)施是共享的,非隔離的,當(dāng)一個攻擊者得逞時,全部服務(wù)器都將成為攻擊者的攻擊對象。所以數(shù)據(jù)存儲是否安全要看云計算服務(wù)商是否有強大的分區(qū)和防御策略;是否有強大的實時監(jiān)控系統(tǒng)防止有未經(jīng)授權(quán)的修改和活動;對所托管數(shù)據(jù)是否進行備份,備份使用的是單服務(wù)器多硬盤方式還是多服務(wù)多硬盤方式,是否實現(xiàn)異地備份。
2.3 數(shù)據(jù)訪問控制安全
數(shù)字圖書館信息資源數(shù)據(jù)在云計算提供商公共云存儲時,惡意軟件和木馬將會在云中變得更強大,垃圾郵件發(fā)送者和惡意代碼作者可以利用云服務(wù)中的匿名注冊和云服務(wù)模式進行網(wǎng)絡(luò)犯罪。在云環(huán)境中,如果攻擊者能夠獲得你的憑據(jù),他們可以看到你的活動,處理你的數(shù)據(jù),并給云計算服務(wù)提供商客戶端導(dǎo)致問題。另外,當(dāng)用戶不再需要已分配的IP地址時,云計算提供商會再分配給其他用戶使用。IP地址再分配使用就會帶來問題。用戶無法確信他們對資源的網(wǎng)絡(luò)訪問能隨著IP地址的釋放一并終止,因為從DNS中的IP地址改變到DNS緩存清理,這之間存在一段時間延遲。因此在老的地址被清楚之前,還會一直存在于ARP緩存中。這意味著即使地址可能已經(jīng)變化,原先的地址在緩存中依舊有效,因此用戶還是可以訪問到那些理應(yīng)不存在的資源。最后,雖然資源可能無法通過互聯(lián)網(wǎng)直接獲得,但出于管理的目的,這些資源必須可通過專用地址在提供商網(wǎng)絡(luò)上進行訪問。圖書館的云計算提供商的其他用戶有可能從內(nèi)部通過云計算提供商的網(wǎng)絡(luò)獲得圖書館資源。
2.4 云存儲服務(wù)商信用
由于數(shù)字圖書館的信息資源數(shù)據(jù)存儲在公共云,我們不能保證云服務(wù)商在得到數(shù)據(jù)時不將保密數(shù)據(jù)泄漏出去。有些云服務(wù)商的服務(wù)合同中規(guī)定:我們對于任何未經(jīng)授權(quán)的訪問或使用、破壞、刪除、銷毀或弄丟任何你的內(nèi)容或應(yīng)用的程序不負有責(zé)任。像這種在合同中不承諾對任何數(shù)據(jù)泄密事件以及被破壞行為承擔(dān)法律責(zé)任或義務(wù)的服務(wù)商很難保證數(shù)據(jù)的安全。
2.5 知識產(chǎn)權(quán)保護
數(shù)字圖書館的知識產(chǎn)權(quán)問題在云時代有了新變化。圖書館購買云存儲服務(wù)后,將自己的數(shù)據(jù)交給云,由云托管這些數(shù)據(jù)。從理論上講,圖書館應(yīng)該完全擁有被托管數(shù)據(jù)的知識產(chǎn)權(quán)。但是在現(xiàn)實中,云存儲商會千方百計利用這些數(shù)據(jù),并以數(shù)據(jù)整合、數(shù)據(jù)挖掘、知識服務(wù)的名義使圖書館數(shù)據(jù)利用合法化。使得他們利用館藏數(shù)據(jù)開發(fā)出來的一些產(chǎn)品很難界定知識產(chǎn)權(quán)的歸屬,這成為一個新問題。
以上數(shù)據(jù)安全問題主要是由云服務(wù)商來保證,而數(shù)據(jù)備份是最基本的安全保障措施。
3 防范措施
為了解決數(shù)字圖書館云存儲存在的安全問題,下面主要采取安全技術(shù)措施和法律規(guī)范措施兩方面進行討論。
3.1 技術(shù)措施
目前有關(guān)云計算的安全性問題主要集中在訪問控制(基于層次密鑰生成與分配策略實施訪問控制的方法);利用基于屬性的加密算法(如密鑰規(guī)則的基于屬性加密方案(KP-ABE));虛擬安全技術(shù)(Santhanam等人提出了基于虛擬機技術(shù)實現(xiàn)的Grid環(huán)境下的隔離執(zhí)行機);數(shù)據(jù)保護(Mowbray等人提出了一種基于客戶端的隱私管理工具,提供以用戶為中心的信任模型,幫助用戶控制自己的敏感信息在云端的存儲和使用)等方面[3]。
3.1.1 訪問控制
圖書館的云存儲服務(wù)訪問控制認證和授權(quán)兩個方面。身份鑒別就是圖書館讀者向云存儲服務(wù)提交操作請求時,云存儲服務(wù)在接收到讀者的請求后,要鑒別讀者的身份。為了有效地鑒別讀者的身份,云存儲服務(wù)事先就要為每個讀者用戶分配一個秘密訪問密鑰和一個用戶標識;讀者訪問云存儲服務(wù)時,首先要生成請求報文,然后利用密鑰采用某種HMAC對請求報文進行簽名,并將該簽名和訪問密鑰惟一標識一起附加到請求報文中;云存儲服務(wù)在處理請求前,會對該簽名進行驗證。權(quán)限判定就是圖書館云存儲服務(wù)完成對讀者用戶的驗證后進一步驗證該讀者是否有進行所請求操作的權(quán)限,只有有權(quán)限的圖書館讀者才能進行相應(yīng)的操作,否則操作請求將被拒絕。圖書館云存儲服務(wù)還可以通過對讀者用戶進行授權(quán),并進行授權(quán)控制,對大量用戶進行管理[4]。
3.1.2 數(shù)據(jù)加密
數(shù)字圖書館的信息資源中有很多涉及圖書館的絕密數(shù)據(jù),有時會在傳輸過程稱遭到偵聽,給圖書館造成巨大的損失,所以數(shù)字圖書館的重要數(shù)據(jù)需要進行加密,以防被盜取或破壞。圖書館數(shù)據(jù)在云計算存儲時由誰來加密,是圖書館自己加密還是云計算服務(wù)提供商加密,采用什么加密算法和什么強度的密鑰,這取決于所選擇的云計算服務(wù)提供商。圖書館數(shù)據(jù)在圖書館與云計算提供商之間進行傳輸,對于那些靜態(tài)數(shù)據(jù)如果使用簡單存儲可以進行加密,但有些數(shù)據(jù)在云計算中處理時,絕對是不加密的。這種未加密狀態(tài)的數(shù)據(jù)很容易遭到破壞。目前關(guān)于數(shù)據(jù)加密的手段很多,普通的加密方案如需對加密文件進行操作,必須將加密數(shù)據(jù)回傳,解密操作后再加密回傳云端,效率低下。在2009年6月,IBM宣布其研究人員與斯坦福大學(xué)的研究生合作,開發(fā)出一種完全同態(tài)加密方案,這種方案允許在不解密的狀態(tài)下處理數(shù)據(jù)[5]。利用全同態(tài)加密技術(shù)對數(shù)字圖書館的數(shù)據(jù)進行加密,就是將數(shù)據(jù)加密后存儲在云端,從而提高數(shù)據(jù)的安全性,即使這些數(shù)據(jù)被竊取,沒有相應(yīng)的密鑰也無法還原,而密鑰只有用戶才知道,云端不知道該密鑰[3]。由于同態(tài)加密的特性,云端可以直接對加密文件進行操作,從而提高了對加密數(shù)據(jù)進行操作的效率。利用全同態(tài)加密技術(shù)對數(shù)字圖書館的數(shù)據(jù)進行加密既能確保用戶數(shù)據(jù)安全,又能避免傳統(tǒng)加密方案的弊端的新的云計算數(shù)據(jù)安全方案。
3.2 制定相關(guān)的行業(yè)標準、規(guī)范、法規(guī)
不同云服務(wù)商對數(shù)據(jù)的技術(shù)管理能力不同,在對用戶數(shù)據(jù)管理執(zhí)行標準上有較大差異,為云計算服務(wù)提供商提供了規(guī)避大部分安全風(fēng)險,而將風(fēng)險轉(zhuǎn)嫁給用戶的可能,導(dǎo)致用戶權(quán)利難以保證。所以,建立國際行業(yè)標準,規(guī)范服務(wù),確保有國家級的監(jiān)管來保障云服務(wù)質(zhì)量和安全標準迫在眉睫。OASIS標準組織在SOA安全方面的現(xiàn)有標準,如IAM、IDM。強化的認證標準,數(shù)據(jù)加密標準,密鑰管理標準以及VM安全配置標準等,都可以被應(yīng)用到云安全領(lǐng)域。在云安全領(lǐng)域,不是要制定或發(fā)明新標準的問題,而是要研究如何把現(xiàn)有的安全技術(shù)很好的和云計算對接,最好地發(fā)揮作用。Cloud Security Aliance(CSA,云計算安全聯(lián)盟)的定位和目標是制定關(guān)于云計算安全問題的一些“最佳實踐”和指南[6]。此外,還應(yīng)對“云”管理服務(wù)提供商(MSP)在開放性、共享性、標準化、安全性能、保密級別、企業(yè)的誠信與可持續(xù)發(fā)展制定不同行業(yè)等級,依據(jù)行業(yè)級別運營相應(yīng)安全級別的數(shù)字圖書館“云”業(yè)務(wù)[7]。
一些數(shù)據(jù)泄漏事件出自云計算提供商內(nèi)部員工,所以加強對云計算提供商雇員的管理,在聘用合同上明確雇員的法律責(zé)任,在違反安全規(guī)定造成安全事故時有權(quán)送交司法機關(guān)。
3.3 引入第三方的認證機構(gòu)進行數(shù)據(jù)審計
無論圖書館放在云計算中的數(shù)據(jù)有無加密,了解云計算中的數(shù)據(jù)專門存儲的地點和時刻是非常有用的,甚至有時候是必須的。數(shù)據(jù)沿襲(對數(shù)據(jù)路徑的跟蹤)對審計有很重要的作用。云計算提供商確保既能提供有效地數(shù)據(jù),又不損害其他已有客戶的利益,又在審計過程中保證審計機構(gòu)不泄露相關(guān)客戶的敏感數(shù)據(jù)的情況下,協(xié)助第三方機構(gòu)對數(shù)據(jù)的產(chǎn)生進行安全性和準確性的審計。
4 結(jié)束語
云存儲模式的出現(xiàn),給互聯(lián)網(wǎng)環(huán)境下數(shù)字圖書館信息資源中心作用的發(fā)揮帶來了機遇。數(shù)字圖書館云服務(wù)平臺具有動態(tài)的、自適應(yīng)的系統(tǒng)組成能力與集成機制,能實現(xiàn)分布式數(shù)字圖書館服務(wù)的虛擬化,能實現(xiàn)更大程度的資源共享與協(xié)作。同時,云存儲的應(yīng)用還處在探索階段,在發(fā)展過程中還存在著安全問題和風(fēng)險。隨著圖書館對云計算技術(shù)的關(guān)注和安全技術(shù)的廣泛應(yīng)用,以及云安全標準的進一步完善,我國數(shù)字圖書館的發(fā)展將進入一個嶄新的階段。
參考文獻
[1]劉文云,鮑凌云.“云”下的數(shù)字圖書館資源存儲研究[J].情報資料工作,2011,(2):51-54.
[2]丁秋峰.云計算環(huán)境下取證技術(shù)研究[J].信息網(wǎng)絡(luò)安全,2011,(11):36-38.
[3]吳旭東.云計算數(shù)據(jù)安全研究[J].信息網(wǎng)路安全,2011,(9):38-40.
[4]王平建.云存儲中的訪問控制技術(shù)研究[J].信息網(wǎng)路安全,2011,(9):41-43.
[5](美)Tim Mather,Subra Kumaraswamy,Shahed Latif.云計算安全與隱私[M].北京:機械工業(yè)出版社,2011:64.
[6]周洪波.云計算技術(shù)、應(yīng)用、標準和商業(yè)模式[M].北京:電子工業(yè)出版社,2011:332-333.
[7]馬曉亭.云計算環(huán)境下數(shù)字圖書館信息資源安全威脅與對策研究[J].情報資料工作,2011,(2):55-59.
(本文責(zé)任編輯:孫國雷)