文/四川大學(xué)檔案館 嚴(yán)忠 肖虹 陳濤
隨著大數(shù)據(jù)時(shí)代的即將到來,物聯(lián)網(wǎng)與云計(jì)算等新一代互聯(lián)網(wǎng)技術(shù)的即將成熟。人類歷史上第三次重要的技術(shù)變革正在發(fā)生,而我國(guó)目前又處于新舊產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型的時(shí)期。因此,我國(guó)已經(jīng)把戰(zhàn)略新興產(chǎn)業(yè)的促進(jìn)作為國(guó)家戰(zhàn)略,在這個(gè)大環(huán)境下,高校建設(shè)數(shù)字檔案館的工作已經(jīng)陸續(xù)展開。但由于前期高校各單位對(duì)檔案數(shù)字化建設(shè)重視不夠,造成了高校檔案部門的檔案數(shù)字化工作起點(diǎn)低、人才缺乏,使檔案數(shù)字化還停留在案卷、文件級(jí)目錄檢索自動(dòng)與人工查詢混合的現(xiàn)狀,還遠(yuǎn)遠(yuǎn)沒有達(dá)到全文、圖文、視頻、音頻全自動(dòng)檢索的階段。促進(jìn)高校檔案云平臺(tái)建設(shè),進(jìn)一步完善檔案數(shù)字化技術(shù)手段的綜合應(yīng)用就能夠讓檔案工作適應(yīng)新時(shí)代發(fā)展的需要,更好地服務(wù)于高校師生員工。
通過對(duì)國(guó)內(nèi)外新數(shù)字技術(shù)的調(diào)查,發(fā)現(xiàn)檔案數(shù)字化技術(shù)由數(shù)據(jù)庫(kù)技術(shù)、網(wǎng)絡(luò)技術(shù)、掃描及圖像技術(shù)等組成,由于數(shù)字檔案館建設(shè)的前期投入不可能一步到位,計(jì)算機(jī)硬件、軟件條件依然有限的條件下,檔案數(shù)字化技術(shù)中的云計(jì)算技術(shù)還未得到充分的重視。
中國(guó)電子學(xué)會(huì)云計(jì)算專家委員會(huì)委員趙文銀認(rèn)為,云計(jì)算是以應(yīng)用為目的,通過互聯(lián)網(wǎng)將大量必要的硬件和軟件按照一定的組織形式連接起來,并隨應(yīng)用需求的變化動(dòng)態(tài)調(diào)整組織形式所創(chuàng)建的一個(gè)內(nèi)耗最小、功效最大的虛擬資源服務(wù)集合。依托基礎(chǔ)設(shè)施和服務(wù)的虛擬化管理,透過互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng),數(shù)字檔案云平臺(tái)中設(shè)置了與OA、計(jì)劃建設(shè)、財(cái)務(wù)等外部系統(tǒng)的“接口”,解決異構(gòu)數(shù)據(jù)的交換問題?!敖涌凇笨梢允蛊渌到y(tǒng)使用人員只要經(jīng)檔案管理人員授權(quán)后,即可直接把需要數(shù)據(jù)歸檔的資料按照一定格式提交給檔案管理系統(tǒng),系統(tǒng)自動(dòng)數(shù)據(jù)歸檔,保存到統(tǒng)一的數(shù)據(jù)庫(kù)平臺(tái)上,轉(zhuǎn)換后的數(shù)據(jù)可以通過檔案系統(tǒng)提供的單一入口或者原有平臺(tái)進(jìn)行訪問和利用,實(shí)現(xiàn)整個(gè)高校信息化建設(shè)系統(tǒng)的統(tǒng)一和充分的資源共享。數(shù)字檔案云平臺(tái)是一個(gè)服務(wù)系統(tǒng),具備快速的業(yè)務(wù)接入與應(yīng)用交付能力。此平臺(tái)可以在應(yīng)用層支持多終端、多方式的接入模式,如:通過多接入方式PC、智能手機(jī)、平板電腦聯(lián)結(jié)WiFi等,而且后端云存儲(chǔ)系統(tǒng)也可支持基于標(biāo)準(zhǔn)網(wǎng)絡(luò)架構(gòu),采用開放協(xié)議進(jìn)行快速接入與數(shù)據(jù)存取,從而滿足大量客戶端甚至是異構(gòu)平臺(tái)的共享訪問需求。
在當(dāng)前數(shù)字檔案館建設(shè)大力開展的形勢(shì)下,檔案館原有的應(yīng)用系統(tǒng)建設(shè)得到了進(jìn)一步的加強(qiáng),比如包括館藏檔案管理系統(tǒng)、電子閱覽室以及服務(wù)器、交換機(jī)、磁盤陣列等基礎(chǔ)設(shè)施建設(shè)和館內(nèi)局域網(wǎng)的建設(shè)得以進(jìn)一步加強(qiáng)。但以國(guó)家檔案局局長(zhǎng)楊冬權(quán)提出的建設(shè)檔案工作三大體系:包括檔案資源體系、檔案利用體系、檔案安全體系的思想為指導(dǎo),目前數(shù)字檔案館的建設(shè)尚處于初期階段。從云計(jì)算思維來看,目前各單位的檔案資源建設(shè)尚處于構(gòu)筑私有云階段。而檔案資源建設(shè)目前各高校檔案還是將大多數(shù)人才資源投入到傳統(tǒng)載體檔案的收集與整理上,檔案資源建設(shè)的另外一個(gè)重心數(shù)字檔案建設(shè),包括電子文件的接收、歷史檔案與其它紙質(zhì)檔案的數(shù)字化、互聯(lián)網(wǎng)數(shù)據(jù)的采集、各類專題多媒體數(shù)據(jù)庫(kù)的建立等工作有部分工作已經(jīng)開展,但還未全部開展。
檔案利用體系的建設(shè)的著力點(diǎn)是依托于檔案資源建設(shè)為基礎(chǔ),檔案應(yīng)用系統(tǒng)的建設(shè)為重心的一項(xiàng)關(guān)鍵工作,也是本文的探討的重心。而檔案云平臺(tái)的建設(shè)必須依托于高校OA系統(tǒng),根據(jù)國(guó)家檔案局、中央檔案館建設(shè)“五位一體”即國(guó)家各級(jí)綜合檔案館的功能定位。即國(guó)家檔案館的功能:1.愛國(guó)主義教育基地,2.檔案安全保管基地,3.檔案利用服務(wù)中心,4.政府信息公開中心,5.電子文件管理中心。這個(gè)階段是云計(jì)算思維的公有云階段;建設(shè)虛擬化網(wǎng)絡(luò)檔案館和檔案安全保密體系的建設(shè)是檔案云平臺(tái)發(fā)展的最后成果。這個(gè)階段按云計(jì)算思維來看,處于混合云階段。
如何建設(shè)檔案云平臺(tái)及網(wǎng)絡(luò)虛擬檔案館?從技術(shù)上看目前建設(shè)條件已經(jīng)具備,基于開放檔案信息系統(tǒng)(OAIS)參考模型,實(shí)現(xiàn)各類檔案資料的收集、存儲(chǔ)、管理和利用;基于J2EE標(biāo)準(zhǔn)規(guī)范,支持Oracle、Db2、MSSqlserver等大中型數(shù)據(jù)庫(kù),兼容 TomCat、Weblogic、WebSphere、TongWeb、金蝶等中間件,兼容 Windows、Linux、IBMAlX5、Sun Solaris等操作系統(tǒng);基于平臺(tái)化設(shè)計(jì)理念,使該系統(tǒng)具有極強(qiáng)的通用化、擴(kuò)展性和靈活性。為用戶提供了從數(shù)據(jù)庫(kù)建立、結(jié)構(gòu)定義到生成錄入界面等一系列定制工具,用戶可以根據(jù)對(duì)單位檔案管理的理解,利用軟件提供的定制工具,在不需要開發(fā)人員介入的情況下探索新的檔案管理方式。系統(tǒng)還具備強(qiáng)大的工作流引擎定制功能,用戶可根據(jù)管理控制流程的需要進(jìn)行定制,提供串行、并行、分支、合流的自定義工作流引擎,實(shí)現(xiàn)檔案信息的接收、移交、利用、銷毀等環(huán)節(jié)的工作流程審批,輔以多種方式的信息提醒,大幅提高協(xié)同辦公效率。
基于Web Service的檔案前端控制技術(shù):將歸檔的范圍、元數(shù)據(jù)、格式標(biāo)準(zhǔn)前置于前端信息生成系統(tǒng),形成完整、符合標(biāo)準(zhǔn)的SIP(提交信息包),調(diào)用Web Service服務(wù),啟動(dòng)歸檔信息合法性校驗(yàn)、電子文件格式轉(zhuǎn)換及歸檔審批流程,確保歸檔信息符合檔案標(biāo)準(zhǔn),實(shí)現(xiàn)真正意義的前端控制與文檔一體化管理?;谠獢?shù)據(jù)的檔案信息包引擎技術(shù):可建立SIP(提交信息包)、AIP(存檔信息包)、DIP(分發(fā)信息包),將元數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)、內(nèi)容、規(guī)則信息組合形成檔案信息包,幫助您實(shí)現(xiàn)數(shù)據(jù)交換、統(tǒng)一檢索與長(zhǎng)期保存。系統(tǒng)提供全文檢索技術(shù),提供類似Google、百度的檢索模式,可對(duì)各種格式的文檔、數(shù)據(jù)庫(kù)等異質(zhì)海量信息實(shí)現(xiàn)統(tǒng)一檢索,提供關(guān)聯(lián)檢索、容錯(cuò)檢索、信息摘要、逐層檢索功能,百萬數(shù)據(jù)亞秒級(jí)返回。
系統(tǒng)還提供在線編研技術(shù),提供強(qiáng)大的文字編輯及插入圖像、音視頻、Flash技術(shù),結(jié)合全文檢索在線提取素材,在線編研發(fā)布,減少專題信息整合的時(shí)間和難度,提高主動(dòng)、定向服務(wù)的能力。同時(shí)系統(tǒng)還具備Flash3D技術(shù),可實(shí)現(xiàn)遠(yuǎn)程動(dòng)態(tài)展示檔案實(shí)體庫(kù)房、檔案位置、排架空間、批量上架、數(shù)量統(tǒng)計(jì)、立體瀏覽等功能,系統(tǒng)充分利用元數(shù)據(jù)技術(shù),使得異構(gòu)數(shù)據(jù)的交換、檢索和展現(xiàn)易如反掌,同時(shí)也是實(shí)現(xiàn)電子文件長(zhǎng)期保存的重要手段。
從云計(jì)算概念的提出到真正實(shí)現(xiàn)大規(guī)模企業(yè)部署,整個(gè)市場(chǎng)如云一樣瞬息萬變。面對(duì)不斷發(fā)生的市場(chǎng)變化和繁雜多樣的云部署方案以及基于用戶類型的不同服務(wù)形式和使用方式,如何為高校檔案館自身的業(yè)務(wù)需求選擇最佳的解決方案,如何找到最適合的云戰(zhàn)略,成為所有進(jìn)行云過渡或云升級(jí)的高校檔案館不得不面對(duì)的問題。
從某種角度而言,云服務(wù)提升了應(yīng)用和數(shù)據(jù)交付的靈活性。利用云計(jì)算技術(shù)配置應(yīng)用和服務(wù)可讓高校檔案館獲得直接的社會(huì)與經(jīng)濟(jì)效益,無須為維護(hù)現(xiàn)有環(huán)境而額外花費(fèi)。由于高校檔案館越來越趨向于以按需和在途中方式提供內(nèi)容和服務(wù),IT部門對(duì)服務(wù)交付也變得更為關(guān)注。高校檔案館能夠獲得的好處顯而易見,包括能夠:針對(duì)不同的設(shè)備提供一致的云服務(wù);確保始終獲取最新的云應(yīng)用版本;支持自主采購(gòu)模式;支持快速規(guī)?;渴?將IT花費(fèi)由成本轉(zhuǎn)為運(yùn)營(yíng)開支;在適當(dāng)情況下,關(guān)注“核心”和“環(huán)境”。
目前,云計(jì)算的發(fā)展已經(jīng)走過了概念普及期,進(jìn)入了實(shí)踐應(yīng)用的重要階段。在這一階段,無論是開源還是封閉,公有還是私有,獨(dú)立還是聯(lián)合,IaaS、PaaS還是SaaS,以硬件為主還是以軟件甚至商業(yè)模式為主,我們已經(jīng)能看到國(guó)內(nèi)外諸多 IT和互聯(lián)網(wǎng)公司提供的云計(jì)算解決方案。這些方案有些已經(jīng)獲得了巨大成功,如亞馬遜的AWS;有些還剛剛涉足這個(gè)領(lǐng)域。與此同時(shí),國(guó)內(nèi)廠商在云計(jì)算領(lǐng)域也在奮起直追,但仍有好多路要走。
僅從技術(shù)方案、成功案例、核心競(jìng)爭(zhēng)力等企業(yè)關(guān)心的角度對(duì)當(dāng)前主流云計(jì)算解決方案進(jìn)行介紹,首先是亞馬遜、IBM、微軟、谷歌這四家在云計(jì)算戰(zhàn)略和市場(chǎng)層面占據(jù)領(lǐng)先地位的巨頭;其次,在云計(jì)算制造業(yè)(包括基礎(chǔ)軟件、中間件和應(yīng)用軟件的軟件提供商,以及包含網(wǎng)絡(luò)設(shè)備、終端設(shè)備、存儲(chǔ)設(shè)備、元器件、服務(wù)器等的硬件制造商)里,我們選取了兩家頗具實(shí)力且提出獨(dú)具特色云計(jì)算解決方案的廠商——華為和思科。
比如:思科致力于提供極具吸引力的用戶體驗(yàn),其中各項(xiàng)云計(jì)算服務(wù)都是以云技術(shù)為基礎(chǔ)提供的。這些云計(jì)算服務(wù)可以隨時(shí)隨地在任何設(shè)備上提供,所具有的安全性、可靠性及其他性能過去只能在傳統(tǒng)的按現(xiàn)有情況部署中表現(xiàn)出來。特定優(yōu)勢(shì)包括:
互操作性:保護(hù)現(xiàn)有的IT投資。如果像許多公司一樣,您的企業(yè)依賴于Microsoft桌面生產(chǎn)力應(yīng)用程序,思科云協(xié)作可以直接通過MicrosoftOffice應(yīng)用程序提供用戶可用性信息(即時(shí)狀態(tài))。
集成:將思科云協(xié)作提供的新功能與現(xiàn)有業(yè)務(wù)應(yīng)用相集成。這并不是要求您丟棄并替換現(xiàn)有的所有應(yīng)用,而只需對(duì)一些增強(qiáng)功能加以利用,以改進(jìn)業(yè)務(wù)流程。
維護(hù):云應(yīng)用無需將設(shè)備更新為按現(xiàn)有情況部署,可幫助您最大限度地節(jié)省部署新的云應(yīng)用和升級(jí)的云應(yīng)用所需的時(shí)間和精力,同時(shí)降低技術(shù)過時(shí)的風(fēng)險(xiǎn)。
華為推出的彈性計(jì)算云產(chǎn)品(ECC—Elastic Computing Cloud)是整合了計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)資源,按需使用、按需付費(fèi)的一站式IT計(jì)算資源租用服務(wù),以幫助開發(fā)者和 IT管理員在不需要一次性投資的情況下,快速部署和管理大規(guī)??蓴U(kuò)展的IT基礎(chǔ)設(shè)施資源。
彈性計(jì)算云通過嚴(yán)格的設(shè)備選型、可靠的網(wǎng)絡(luò)設(shè)計(jì)、周到的運(yùn)營(yíng)能力,提供高性價(jià)比的彈性IT計(jì)算資源和服務(wù)。高校檔案館可以通過基于瀏覽器的、圖形化界面的云計(jì)算管理平臺(tái),足不出戶實(shí)現(xiàn)按需自助地開通、部署、控制和管理大規(guī)模的IT基礎(chǔ)設(shè)施資源,并擁有對(duì)這些基礎(chǔ)設(shè)施資源的完全控制權(quán)限。這些IT基礎(chǔ)設(shè)施資源可以在10分鐘內(nèi)快速交付,高校檔案館還可以隨時(shí)調(diào)整計(jì)算需求,比如即時(shí)增加新的計(jì)算能力,滿足業(yè)務(wù)快速發(fā)展的需求,也可以即時(shí)停機(jī)甚至減少在IT基礎(chǔ)設(shè)施方面的投入,與傳統(tǒng)物理服務(wù)器、存儲(chǔ)等IT設(shè)備相比,大大提高了高校檔案館業(yè)務(wù)擴(kuò)展的效率和運(yùn)營(yíng)能力。
由于各云平臺(tái)服務(wù)廠商的資源處理的程序的不同,因此該類的檔案云平臺(tái)必須依托于現(xiàn)有的云服務(wù)廠商,同時(shí)由于各類檔案應(yīng)用系統(tǒng)的業(yè)務(wù)邏輯的不一致,各云服務(wù)廠商會(huì)提供不同的云服務(wù)接口平臺(tái)。該類“檔案云平臺(tái)”將業(yè)務(wù)與應(yīng)用支撐進(jìn)行清晰的劃分,檔案專業(yè)人員只需要做好自身業(yè)務(wù)工作即可,其他的全部交由云平臺(tái)的服務(wù)廠商,數(shù)據(jù)的存儲(chǔ)、安全、邏輯組織關(guān)系完全交由云服務(wù)廠商完成。該類“檔案云平臺(tái)”會(huì)與特定的云服務(wù)廠商進(jìn)行綁定。
云計(jì)算的一個(gè)重要特征就是用戶的數(shù)據(jù)存放在云端,并將計(jì)算結(jié)果通過網(wǎng)絡(luò)返回客戶端。而作為全新的服務(wù)模式,所面臨的安全威脅也是前所未有的。由于云計(jì)算是分布式的,用戶之間可能共用計(jì)算或存儲(chǔ)資源,如果用戶之間安全隔離不夠或受到惡意攻擊技術(shù)的打擊,則將使數(shù)據(jù)安全受到威脅,只利用傳統(tǒng)的保護(hù)方式很難保證用戶數(shù)據(jù)的安全。
高校檔案云平臺(tái)主要面臨的數(shù)據(jù)安全風(fēng)險(xiǎn)有三個(gè)方面:
在云計(jì)算模式下,高校檔案館將數(shù)據(jù)通過網(wǎng)絡(luò)傳遞到云服務(wù)商進(jìn)行處理時(shí),面臨幾個(gè)問題:一是要確保高校檔案館的數(shù)據(jù)在網(wǎng)絡(luò)傳輸過程中嚴(yán)格加密,保證數(shù)據(jù)即使被竊取也無法還原;二是云服務(wù)商要保證不將高校檔案館的數(shù)據(jù)泄露;三是保證數(shù)據(jù)儲(chǔ)存時(shí)的訪問用戶通過嚴(yán)格的權(quán)限認(rèn)證并且是合法的數(shù)據(jù)訪問,同時(shí)保證高校檔案館任何時(shí)候都可以安全訪問到自己的數(shù)據(jù)。
高校檔案館的數(shù)據(jù)存儲(chǔ)是非常重要的環(huán)節(jié),其中包括數(shù)據(jù)的存儲(chǔ)位置,數(shù)據(jù)的相互隔離,數(shù)據(jù)的災(zāi)難恢復(fù)等。在云計(jì)算模式下,云服務(wù)商在高度整合的大容量存儲(chǔ)空間上開辟出部分空間給高校檔案館使用,但用戶對(duì)其儲(chǔ)存的位置需要詳細(xì)了解,在云服務(wù)商使用加密方式的前提下保證數(shù)據(jù)之間的有限隔離,高校檔案館也必須要求云服務(wù)商對(duì)所托管的數(shù)據(jù)進(jìn)行備份,以便重大事故產(chǎn)生后的數(shù)據(jù)拯救。
為了保證數(shù)據(jù)的準(zhǔn)確性和有效性往往會(huì)引入第三方的認(rèn)證機(jī)構(gòu)進(jìn)行數(shù)據(jù)審計(jì)。在云計(jì)算環(huán)境下,云服務(wù)商必須保證對(duì)高校檔案館的數(shù)據(jù)安全并提供必要的信息支持,協(xié)助第三方機(jī)構(gòu)對(duì)數(shù)據(jù)進(jìn)行安全性和準(zhǔn)確性的審計(jì),實(shí)現(xiàn)高校檔案館的合規(guī)性要求;在實(shí)施審計(jì)的過程中,確保審計(jì)機(jī)構(gòu)也不泄漏相關(guān)敏感數(shù)據(jù)。
結(jié)合密碼學(xué)的最新進(jìn)展,利用全同態(tài)加密對(duì)數(shù)據(jù)進(jìn)行加密,可以保證云計(jì)算的數(shù)據(jù)安全。全同態(tài)加密算法是IBM公司的克雷格·金特里提出來的,由于同態(tài)加密的特征,數(shù)據(jù)加密后存儲(chǔ)在云端,即使數(shù)據(jù)被竊取,沒有相應(yīng)的密鑰也無法還原,因?yàn)槊荑€是用戶知道,云端并不知道;云端還可以對(duì)密文進(jìn)行直接操作或相關(guān)運(yùn)算,再將結(jié)果返回到終端用戶。利用該方案在客戶端使用硬件如智能卡生成密鑰,并將該密鑰與硬件綁定,加密后的密鑰保存在云端,只有用戶才能解密該密鑰,同時(shí)利用數(shù)字簽名技術(shù)保證數(shù)據(jù)的安全性、完整性和不可抵賴性。
建設(shè)高校檔案云平臺(tái)的創(chuàng)新之處主要體現(xiàn)在這是一種獨(dú)立的“檔案云平臺(tái)”:這里所說的也是目前可以在檔案領(lǐng)域落地執(zhí)行的一種檔案云平臺(tái)。該平臺(tái)是一個(gè)完整的管理體系,同時(shí)也將檔案管理與云計(jì)算優(yōu)勢(shì)進(jìn)行明確的區(qū)別,應(yīng)用層負(fù)責(zé)業(yè)務(wù)邏輯的處理,控制層服務(wù)資源的監(jiān)控及智能調(diào)配,基礎(chǔ)層是云平臺(tái)提供的基礎(chǔ)資源平臺(tái),可以按照控制臺(tái)指令進(jìn)行靈活的資源調(diào)配,也可和云平臺(tái)的標(biāo)準(zhǔn) SDK接口進(jìn)行整合。該平臺(tái)與任何的云服務(wù)廠商進(jìn)行綁定用、控制、資源完全有自身平臺(tái)進(jìn)行完成。同時(shí)在檔案云平臺(tái)運(yùn)行的高校各部門用戶的數(shù)據(jù)資源,也可真正實(shí)現(xiàn)權(quán)限層面的控制,構(gòu)建高校的信息化資源池。
[1]吳旭東.第26次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集,2011(9).