趙旭
摘要:云存儲:一種大數(shù)據(jù)時代下的產物,為海量數(shù)據(jù)提供了有效存儲和計算能力。隨著云存儲技術的不斷發(fā)展和成熟,在校園內部部署云存儲成為各高校的一項建設任務。從實際需求出發(fā),針對私有云的特點,從硬件規(guī)劃部署到軟件平臺開發(fā)層進行整體規(guī)劃,提供一個開放、安全、高效、穩(wěn)定和界面新穎美觀的數(shù)字化教學資源管理平臺。同時,對所涉及的相關應用技術進行介紹和研究。
關鍵詞:云存儲;云內部通信;雙機熱備;教學資源管理
中圖分類號:TP333 文獻標識碼:A 文章編號:1007-9416(2017)09-0032-03
1 緒論
近些年隨著云計算技術的興起,部分高校率先進行了云計算方面的建設嘗試,提出在云計算項目上將云主機部署、云操作桌面平臺開發(fā)以及云存儲架構設計三種技術結合,力求解決學校在傳統(tǒng)的集中式管理與集中式存儲的資源組織模式下信息基礎設施建設滯后、優(yōu)質數(shù)字化資源短缺、服務器資源短缺等問題。
1.1 背景與意義
隨著高等院校教學信息化與數(shù)字化建設的完善與發(fā)展,高等院校的信息化與數(shù)字化建設一般以數(shù)字化的資源管理為主要目的,而信息化的服務保障為輔助手段,同時,由于數(shù)字化和信息化建設是需要不斷的管理與完善,其建設周期較為漫長,只有通過長時間的積累與沉淀,才能逐漸形成一個具有數(shù)據(jù)資源量大、內容豐富的教學資源庫。
目前,高等院校數(shù)字化教學資源的種類與來源較為繁瑣與復雜,其資源文件類型包括文本、圖形圖像、動畫、聲音和視頻等類型;而資源內容更為繁雜,有學生的學習資料和教師的教學資料,還有校管理和行政人員的辦公資料等,還涉及到社會所需要的一些公眾資源以及大量的圖書館藏書所轉換而成的數(shù)字化圖書資源等。如何能有效的將這些數(shù)字化教學資源收集、存儲、管理并應用,實現(xiàn)教學資源的共享,提高精品課程、示范特色專業(yè)等優(yōu)秀教學成果的輻射作用,這是在學校內部信息化建設中首要且又艱巨的任務。 因此,需要架設一個開放式共享、數(shù)字化教學資源管理清晰易用且安全等級高;同時,還能提高數(shù)字化教學資源的錄用量和使用率。
1.2 國內外研究現(xiàn)狀
云計算(Cloud Computing)作為一個全新的概念被明確提出,而云存儲則是在云計算發(fā)展的過程成中所必須解決的一個核心問題——存儲問題,可以說云存儲是在云計算的基礎上發(fā)展而來的。
云存儲技術得到飛速發(fā)展,目前在國外有一些較為成熟的云存儲產品為用戶開放,如: Dropbox作為一家創(chuàng)業(yè)公司,在2007年就開始提供網絡云存儲同步服務,到目前已經有1.75億用戶;Google Drive是谷歌公司推出的一項在線云存儲服務,Google Drive目前的活躍用戶已經達到了2.5億人;較為典型的還有:Amazon 公司的 Amazon Cloud Drive,提供廉價且大容量的存儲空間,還具備有很強的安全性及可靠性。
國外云存儲成功的同時也帶動了國內網絡公司對云存儲的關注以及建設,華為云服務作為中國網絡公司領路人,雄厚的資金實力和完備的硬件支持是其挺近云存儲領域的根本,在云存儲技術領域中華為具備先天優(yōu)勢;360云盤以“安全”和“免費”為核心,市場占有量不斷在提升;還有在國內比較知名的百度云盤,百度雖然做云存儲時間較短,但是其憑借著強大的經濟實力也在不斷的完善和改進。阿里云存儲服務對外提供的海量的云存儲服務。
但是,對于在高等院校在教育領域中運用云計算和云存儲的案例還非常有限,目前,國內高等院校運用云計算和云存儲建設的項目中較為典型的案例:
(1)中國科技大學的“瀚海星云”校園云服務平臺:由4臺2路PC服務器和48TB存儲服務器組成,主要用于定制科學計算平臺和平行計算等。同時,也在逐步對校內師生提供云存儲等相關服務。
(2)臺灣大學的臺大“筋斗云”:整個平臺由大型計算機和高級網絡基礎設施組成,以 IBM BladerCenter服務器為基礎運作平臺,以普樺科技的容錯磁盤陣列產品為存儲服務節(jié)點,到目前為止項目已經完成第一期的基礎環(huán)境建設與部署,后期會逐步對校內師生提供桌面服務、存儲資源共享平臺等。
經過調查和分析,高等院校在教育領域中運用云計算和云存儲的案例比較有限,相關文獻資料占據(jù)比例也比較少,說明教育領域運用云計算和云存儲還處于起步和探索階段。
1.3 研究的主要內容
具體的研究工作主要有以下幾方面內容:
(1)從云計算技術到云存儲架構的領域入手,通過對國內外關于云計算技術以及云存儲技術的相關文獻和書籍進行詳細的調查和研究,分析在國內外高等院校中采用云存儲技術架設數(shù)字化教學資源管理平臺的應用現(xiàn)狀和取得的成果;總結出云計算技術與云存儲系統(tǒng)的特性與特征,同時,還對課題所涉及到的一些相關技術進行研究。
(2)針對校園內部用戶的實際需求,設計出了數(shù)字化教學資源平臺的主要功能模塊,為校內用戶提供個人存儲、應用和管理空間,同時,對群組共享和管理空間的權限功能進行設計和完善,使各功能間的邏輯更加合理。
(3)對校園內部私有云存儲的架構進行詳細的分析與設計,從技術上結合并利用云內部通信簡單安全通信模型(SSCMIC)、雙機熱備全冗余技術等相關技術對云系統(tǒng)架構進行改造,形成一種具有特色的云通信安全模型和級聯(lián)與備用雙向復制模式,解決資源管理平臺底層云存儲系統(tǒng)的可靠性、可擴展性以及并發(fā)性等架構問題,從架構的角度解決大規(guī)模數(shù)據(jù)的彈性存儲、海量多元數(shù)據(jù)的高效管理以及云存儲系統(tǒng)的安全等問題,提高云存儲系統(tǒng)的可靠性與安全性,建立一個高性能HDFS云存儲系統(tǒng),為數(shù)字化教學資源管理平臺的基礎設施提供服務。
(4)結合PHP、jQuery、HTML5等技術開發(fā)和實現(xiàn)數(shù)字化教學資源管理平臺的界面操作系統(tǒng)桌面化,提供一個在網頁上實現(xiàn)類似操作系統(tǒng)桌面和資源管理器界面的數(shù)字化教學資源管理平臺的WEB門戶網站。endprint
2 相關理論及技術
2.1 云計算與云存儲
(1)云計算:一種大數(shù)據(jù)時代下的產物,為海量數(shù)據(jù)提供了有效存儲和計算能力。云的特征主要有超大規(guī)模、虛擬化、提高設備計算能力、高可靠性、減少設備依賴性、高可擴展性、彈性服務和極其廉價等特性?!霸啤本哂邢喈?shù)囊?guī)模,理論上可無限延伸與擴展,這些設備可以是高級的服務器,也可以是廉價的計算機,甚至可以是性能早已經過時被淘汰的計算機或服務器,當這些大量的服務器、計算機等計算設備被集中在一個虛擬資源池中,用戶可以在不同時間和地點隨時隨地就可以接入云端。
(2)云存儲:是在云計算基礎上延伸和發(fā)展出來的分布式文件存儲系統(tǒng), 云存儲某種角度上來說與云計算是有共性的,云存儲也具備“云”的超大規(guī)模、虛擬化、提高設備計算能力、高可靠性、減少設備依賴性、高可擴展性、彈性服務和極其廉價等特性;在規(guī)模劃分上也依然使用云計算相同的劃分方式;就連標準定義也和云計算一樣,到目前為止依然也沒有明確的標準定義。有人認為云存儲是云計算的一個分支,但云存儲與云計算依然還是有所差異的,云存儲的服務模式改變了云計算服務模式對各層的單獨定義,而是將PaaS、IaaS和IaaS融合成一個有機的整體,形成一種新型的服務模式。同時,云計算側重計算處理,而云存儲則側重存儲,某種角度上來說,云存儲的發(fā)展將更好的為云計算提供服務,云存儲幫助云計算解決了一個重要的核心問題——大容量資源存儲和處理的問題。
2.2 分布式文件系統(tǒng)
分布式文件系統(tǒng)是支撐云計算海量存儲環(huán)境的重要技術之一,分布式文件系統(tǒng)從20 世紀70 年代發(fā)展至今,其技術依然還在不斷被改進與完善。分布式文件系統(tǒng)通過協(xié)同多個節(jié)點消除單點故障和性能瓶頸,并在設計上滿足高可用、高性能、高負載等基本特性。
通過服務端搭建根目錄、分支節(jié)點等,客戶端依據(jù)約定的存取協(xié)議,獲取相對應的操作權限,對相對應的文件和目錄進行操作,其操作模式就像操作本地磁盤上文件和目錄一樣。
HDFS(Hadoop Distributed File System),是Hadoop的核心子項目,是整個Hadoop平臺數(shù)據(jù)存儲與訪問的基礎。
HDFS架構采用主從模式,由名字節(jié)點(Namenode)和數(shù)據(jù)節(jié)點(Datanode)組成。名字節(jié)點為主點(Master),數(shù)據(jù)節(jié)點為從節(jié)點(Slave),在架構上,名字節(jié)點是整個HDFS的核心,為了安全考慮通常名字節(jié)點有兩個,一個主名字節(jié)點和一個備用名字節(jié)點組成。而數(shù)據(jù)節(jié)點的規(guī)模理論上可無限擴展,并無特殊限制。
通過研究分布式文件云存儲系統(tǒng),以全面整合校內數(shù)字化建設中整合的多種應用服務器與計算機上的軟件與硬件資源,實現(xiàn)各應用服務器與計算機上的優(yōu)質資源共享為目標,將分布式文件系統(tǒng)儲存中的HDFS架構進行修改,使其更適用于高等院校內部云存儲資源管理平臺的建設,為確立云存儲架構和數(shù)字化教學資源管理平臺的建設與實現(xiàn)提供可靠且完善的架構設計思路。由于數(shù)字化教學資源平臺的建設需要考慮較為長期建設周期,因此,數(shù)字化教學資源管理平臺擬采用HDFS作為底層系統(tǒng)架構。
2.3 云內部簡單安全通信模型(SSCMIC)
云內部通信簡單安全通信模型(SSCMIC)是一種簡單而又輕型云內部通信安全協(xié)議,部署在中小型云存儲系統(tǒng)上,無需特殊硬件支持,只需要將云內部通信協(xié)議分別安裝在云存儲內部的元數(shù)據(jù)服務器、應用服務器和服務/存儲節(jié)點上就能實現(xiàn)云存儲內部的安全通信。目前,國內外對云內部通信安全問題的解決方案走入兩個極端化,大型云存儲系統(tǒng)對云內部的通信安全一般十分重視,其中,安全協(xié)議種類也異常繁雜,安全協(xié)議內部構造也較為復雜;而中小型云存儲則一般直接忽略了云內部通信安全,因為中小型云存儲的安全協(xié)議無法使用大型云存儲的安全協(xié)議,但重新開發(fā)一種輕型的安全協(xié)議又是一個很大的課題,所以,目前中小型云存儲內部通信安全還較為薄弱。
通過研究云內部簡單安全通信模型(SSCMIC),并將其應用和部署在云存儲系統(tǒng)上的各個云存儲節(jié)點與云存儲應用服務器上,并與數(shù)字證書認證技術相結合,從而保護用戶敏感信息和其他數(shù)據(jù),保障和提高數(shù)字化教學資源管理平臺的信息安全。
2.4 開發(fā)工具及語言
HTML5的本地存儲特性是讓基于HTML5開發(fā)的網頁APP擁有更短的啟動時間,更快的聯(lián)網速度。PHP(超文本預處理器)是一種通用開源腳本語言,源代碼完全公開,促進了PHP的快速發(fā)展。JQuery是繼Prototype之后又一個優(yōu)秀的JavaScript庫,jQuery也是開放源代碼并免費提供服務的, JQuery的語法設計可以使開發(fā)更加便捷。ExtJs開發(fā)工具最開始基于YUI技術,并為開發(fā)者屏蔽了大量跨瀏覽器方面的處理, 是一個前端AJAX框架并與后臺技術無關的開發(fā)工具軟件。
通過研究將HTML5、PHP、JQuery等技術并與ExtJs開發(fā)工具結合使用,利用這些技術使數(shù)字化教學資源管理平臺的界面實現(xiàn)操作系統(tǒng)化(類似Windows、Linux的桌面和資源管理器界面)成為可能。實現(xiàn)數(shù)字化教學資源管理平臺的各種操作(包括文檔的存儲,編輯,媒體播放等)能夠像操作系統(tǒng)一樣簡潔方便,打造一個簡潔且美觀的WEB操作平臺界面。
2.5 雙機熱備全冗余技術
受早期技術和理念的影響,還無法實現(xiàn)存儲的計劃性停機與非計劃性宕機帶來的服務器停機,后來,隨著科學技術的不斷進步,特別是云計算和云存儲技術的發(fā)展,為了解決單服務器有計劃或非計劃停機的問題,提出了全冗余方式就是雙機雙存儲,存儲設備之間使用重復數(shù)據(jù)刪除技術,完成增量同步工作,就是雙機熱備全冗余技術。
通過研究雙機熱備全冗余技術,并對雙機熱備全冗余技術進行改造,形成一種新型的級聯(lián)與備用雙向復制技術,并在云存儲架構底層利用級聯(lián)與備用雙向復制技術來解決HDFS架構中的伸縮性差以及單點依賴等缺陷。利用首尾相連并成部分對等關系的多個數(shù)據(jù)服務器改變了集中式架構中的單點依賴,克服了HDFS中當數(shù)據(jù)服務器失效時,整個系統(tǒng)將陷入癱瘓狀態(tài)的情況。
本文的研究內容在資源管理平臺設計與實現(xiàn)過程中屬于前期的準備工作,后續(xù)還將對資源管理平臺進行系統(tǒng)需求分析、系統(tǒng)架構設計、系統(tǒng)功能性設計、系統(tǒng)測試與總結等工作,最終實現(xiàn)對基于云存儲的數(shù)字化教學資源管理平臺的設計及部署。
參考文獻
[1]蔡斌,陳湘萍.Hadoop技術內幕[M].北京:機械工業(yè)出版社,2013.
[2]劉麗,米振強,熊曾剛.深入理解云計算[M].北京:機械工業(yè)出版社,2015.
[3]王鵬.云計算的關鍵技術與應用實例[M].北京:人民郵電出版社,2010.
[4]The Age of Big Data. The New York Times,2012.
[5]Kapil Bakshi.Considerations for Big Data:Architecture and Approach. 2012IEEE Aerospace Conference,2012.endprint