李強,劉曉峰
1.太原理工大學,山西 太原 030024
2.山西省財政稅務??茖W校 信息學院,山西 太原 030024
伴隨著云計算技術(shù)的國內(nèi)發(fā)展,在未來15年的國家信息發(fā)展戰(zhàn)略中,將政務云平臺的建設(shè)作為實現(xiàn)資源整合的一個重要任務[1]。在此政策的鼓勵下,政務云的建設(shè)如雨后春筍般蓬勃發(fā)展,先后在幾個重點示范城市建立完成。同時,國家工信部和其它部委聯(lián)合頒布了《國家電子政務“十二五規(guī)劃”》和《基于云計算的電子政務公共平臺頂層設(shè)計指南》,以及中央網(wǎng)絡安全和信息化領(lǐng)導小組制定了《電子政務云平臺服務考核評估方法》和《電子政務云平臺計費參考標準》,為我國的政務云的建設(shè)指明了方向[2]。
隨著我國信息化技術(shù)的提高,為了更好地為科研工作提供基礎(chǔ)條件,科技部已經(jīng)陸續(xù)完成覆蓋實驗基地和大型科學儀器設(shè)備、自然科技資源、科學數(shù)據(jù)、科技文獻等六大領(lǐng)域的科研基礎(chǔ)條件平臺的建設(shè)[3-5]。
隨著山西經(jīng)濟發(fā)展方向的轉(zhuǎn)型,山西省政府在2013年提出了《山西科技創(chuàng)新城建設(shè)總體方案》,為山西新的發(fā)展戰(zhàn)略方向指明方向,也為山西科技創(chuàng)新城提供規(guī)劃藍圖[6]。為了山西科技發(fā)展,山西省科技廳積極組織各方力量,逐步建設(shè)完成了山西省自然科技資源平臺、大型科學儀器協(xié)作共享平臺、技術(shù)轉(zhuǎn)讓服務平臺等[7],完善了山西科技創(chuàng)新城的內(nèi)容,推動了太原市智慧城市建設(shè)的發(fā)展。
本文正是在全國云計算的推廣和山西省科技創(chuàng)新城的發(fā)展階段,提出一種云計算架構(gòu)方案來解決當前科技系統(tǒng)存在的共享問題。該方案不僅可以解決科研數(shù)據(jù)的海量存儲,而且可以規(guī)范整個平臺的發(fā)展,使科研系統(tǒng)的開發(fā)更加合理、更加科學。
科技信息系統(tǒng)主要包括數(shù)據(jù)、文獻、應用軟件等軟資源。其使用對象主要包括高等院校、研究所、科技管理部門和高新技術(shù)企業(yè)和其它中介機構(gòu)。
現(xiàn)有的科技系統(tǒng)的主要特點主要有:一、數(shù)據(jù)量龐大,數(shù)據(jù)的生產(chǎn)很快,數(shù)據(jù)背后隱藏的價值很高。二、異構(gòu)應用很多,并且要求互聯(lián)。如農(nóng)業(yè)科技應用系統(tǒng)需要調(diào)用氣象或水利系統(tǒng)。三、專業(yè)化程度高,維護成本大。四、缺乏統(tǒng)一的開發(fā)框架,設(shè)計需要規(guī)范指導。
當前仍然存在一些問題于我省的科技資源共享平臺,雖然科技資源共享問題在一定程度上通過科技共享網(wǎng)絡可以實現(xiàn),但是各個平臺之間仍然是孤立的,仍然處于“信息孤島”狀態(tài)。也就是說,傳統(tǒng)技術(shù)下無法徹底實現(xiàn)跨專業(yè)、跨學科的協(xié)同和共享,科技資源更廣范圍內(nèi)的共享仍然困難。云成為新技術(shù)發(fā)展出來的一種服務模式,具有突破傳統(tǒng)技術(shù)限制的優(yōu)勢,更準確地說,該技術(shù)將給科技資源共享帶來新的突破[8]。通過分析,當前的科技系統(tǒng)的限制問題可以按以下四點概括:
(1) 海量大數(shù)據(jù)如何存放和管理
隨著我省科技的不斷發(fā)展,不同部門、行業(yè)和研究院所將產(chǎn)生大量的數(shù)據(jù),現(xiàn)有的存儲方式已經(jīng)不能滿足科技資源信息的存儲的需要。以湖北省科技信息研究院擁有的文獻資源為例,清華同方在湖北的機構(gòu)數(shù)字圖書館擁有原文38T,維普10T,并以每年3~5T的速度增長。
最直接的辦法是給服務器增加硬盤,但是經(jīng)驗告訴我們會有以下問題出現(xiàn):①配套的硬盤可能已經(jīng)停產(chǎn),不易購買;②有限的硬盤槽數(shù)并不能隨意擴展;③如果硬盤數(shù)量過多對主機的壓力會增大,影響系統(tǒng)的穩(wěn)定運行;④對原有的磁盤陣列會產(chǎn)生丟數(shù)據(jù)的風險[9]。
為了適應大數(shù)據(jù)存儲需喲啊滿足兩個條件:一個是對原有的設(shè)備不會產(chǎn)生影響;另一個是增加的存儲可以被系統(tǒng)能夠管理。這就需要存儲設(shè)備具備管理自己空間的能力,如磁盤陣列技術(shù)的兼容、磁盤的劃分等技術(shù)的支持。從原有的設(shè)備角度看,新的存儲空間應與原有的管理空間保持一致[9]。
(2) 在海量數(shù)據(jù)中快速檢索數(shù)據(jù)
海量數(shù)據(jù)如何存儲問題解決后,緊跟的問題是如何在這些數(shù)據(jù)中快速并準確檢索出需要的數(shù)據(jù)將是一個新的挑戰(zhàn)。
(3) 實現(xiàn)不同現(xiàn)有系統(tǒng)的信息共享
建立科技資源共享平臺的主旨是要實現(xiàn)各個現(xiàn)有系統(tǒng)的數(shù)據(jù)共享,并保護現(xiàn)有的IT資產(chǎn),最大的實現(xiàn)重復利用。實現(xiàn)現(xiàn)有系統(tǒng)的之間的互聯(lián)互通,信息共享是實現(xiàn)該平臺的最終目標,也是該平臺技術(shù)實現(xiàn)的難點。
(4) 設(shè)計總體架構(gòu)和方案
信息孤島,重復建設(shè),資源利用率不高,科技資源配置“碎片化”的形成是由于各個地區(qū)、部門之間科技資源發(fā)展不平衡,沒有具體統(tǒng)一的規(guī)劃方案和系統(tǒng)架構(gòu)所導致,避免該問題的再次發(fā)生,就需要從整體和全局的角度上進行一次徹底的規(guī)劃。
海量數(shù)據(jù)的存儲不僅僅是存儲設(shè)施的改變,更是技術(shù)整體方面的革新,它可以關(guān)系到整個系統(tǒng)的上層建設(shè),所以必須變革系統(tǒng)的整體架構(gòu),重新設(shè)計一套支持整體建設(shè)的技術(shù)方案是勢在必行的。
科技云平臺的實現(xiàn)將具有以下特點:(1) 海量數(shù)據(jù)的存儲,并滿足科技數(shù)據(jù)快速增長的需求,存儲能力具備彈性。(2) 支持異構(gòu)系統(tǒng),可以實現(xiàn)跨平臺的訪問。(3) 統(tǒng)一的維護、廉價設(shè)備的兼容將極大的降低建設(shè)期和維護期的費用和成本。(4) 通過虛擬化管理,實現(xiàn)統(tǒng)一的訪問接口,影藏了底層的異構(gòu)性,方便用戶使用。(5) 存儲算法使用副本冗余技術(shù),提高了系統(tǒng)在宕機時的恢復能力。(6) 具備不斷改進的存儲算法和檢索算法,極大的提高了檢索海量數(shù)據(jù)的能力。(7) 使用池化技術(shù),將同類同構(gòu)廉價設(shè)備虛擬成整體,提高了系統(tǒng)的整體新,統(tǒng)一的使用方式,透明了設(shè)備差異。
科技云平臺建設(shè)的必要性可以從兩方面來分析:第一方面,面向日益數(shù)據(jù)海量增長的科技數(shù)據(jù)需要云存儲技術(shù)來解決。另一方面,大數(shù)據(jù)時代給科技資源的共享帶來新的問題,需要云計算技術(shù)的支持。當前,我國科技資源各個平臺獨立運行、部門各自成塊,在此條件環(huán)境下科技資源的共享仍然存在一些問題。云存儲技術(shù)在解決海量數(shù)據(jù)的存儲和共享方面具有的技術(shù)優(yōu)勢給科技資源共享帶來了機遇。結(jié)合科技資源具有的大數(shù)據(jù)特征和大數(shù)據(jù)帶來的機遇玉挑戰(zhàn),以及大數(shù)據(jù)需要云技術(shù)支持的關(guān)系,可以得出當代的科技資源共享平臺必須由云計算技術(shù)來實現(xiàn),所以科技云平臺的建設(shè)是非常有必要的,是時代發(fā)展的要求[8]。
科技云平臺建設(shè)的意義主要有以下三點: (1) 科技云平臺為科技系統(tǒng)的建設(shè)提供整體框架,可以通過該框架將現(xiàn)有的數(shù)據(jù)和應用整合起來,規(guī)范應用開發(fā)的接口。(2) 科技云平臺為海量科技數(shù)據(jù)的存儲提供支持。(3) 科技云平臺為跨應用的使用提供統(tǒng)一的接入規(guī)范。
依據(jù)國建電子政務開發(fā)指南,將系統(tǒng)的開發(fā)分層設(shè)計以滿足不同應用的設(shè)計要求和用戶的使用,同時滿足系統(tǒng)設(shè)計的靈活性[10-11]。如圖1所示,科技云平臺的架構(gòu)將規(guī)范化為多個層次,主要包括物理層、虛擬層、應用支持層、應用層和用戶層。
以上平臺架構(gòu)中,物理層存在于最底層,包括整個平臺建設(shè)和運行中必須的硬件設(shè)施,包括硬件服務器、網(wǎng)絡設(shè)施和存儲設(shè)施。物理層上的虛擬層,主要通過池化技術(shù)將底層的異構(gòu)同類設(shè)備整合成整體,為上層屏蔽底層細節(jié)差異。中間的應用支撐層主要為應用層提供獨立的功能,實現(xiàn)設(shè)計上靈活性。應用層是直接為不同用戶需求量身定做的應用,是整個平臺開發(fā)的核心。
圖 1 中的用戶層里,企業(yè)、高等學校和科研機構(gòu)是該云平臺的主要使用對象,科研管理機構(gòu)不僅負責指導和規(guī)范該科技平臺的建設(shè),而且負責系統(tǒng)的管理和維護工作。此外,中介機構(gòu)也是使用該系統(tǒng)一類的用戶,負責技術(shù)和產(chǎn)品的推廣和轉(zhuǎn)化工作。
根據(jù)系統(tǒng)需求分析,科技云系統(tǒng)中的服務應用可以分為五類,主要有:
第一類是通用應用,為平臺提供一般的通用應用,其目的在于方便用戶使用該平臺,主要有全文檢索、通知公告等。
第二類實現(xiàn)知識應用,為科研用戶提供基礎(chǔ)條件服務,提供智力支持,主要包括文獻檢索和專家咨詢服務。用戶可以通過關(guān)鍵字、主題、題名等主要特征查詢研究過程中的重要文獻。專家咨詢提供一種互動平臺,實現(xiàn)用戶和專家溝通交流,為用戶提供專業(yè)上的指導和啟發(fā),其形式可以是留言板或“專家網(wǎng)上咨詢”的互動方式。
第三類是行政管理類應用,主要是輔助科研管理機構(gòu)實現(xiàn)科技部門的行政審批業(yè)務,完成科研用戶的項目或獎項的申報、審批、評審等流程。專家服務是科研機構(gòu)為組織和管理專家的而設(shè)立的輔助軟件,可以完成專家的申報、單位的核實和科研管理機構(gòu)的審批。
圖1 系統(tǒng)的總體架構(gòu)Fig.1 Overall architecture of the system
圖2 平臺應用Fig.2 Platform application
圖3 系統(tǒng)的虛擬化Fig.3 System virtualization
第四類完成了科研資源管理,為科研活動提供基礎(chǔ)條件支持,設(shè)計科研數(shù)據(jù)的共享、設(shè)備信息的公開等。其中數(shù)據(jù)共享涉及自然科學數(shù)據(jù)、社會科學數(shù)據(jù)以及衍生數(shù)據(jù),是為完成科學活動的前提條件。設(shè)備公開,為全社會實現(xiàn)設(shè)備共享使用提供信息先導,實現(xiàn)了全社會的資源分配,降低了重復投資的成本。此外,科研資源管理還包括科研條件的六大條件基礎(chǔ)服務,實現(xiàn)全面的科研支持。
第五類是為中介機構(gòu)開發(fā)的具體應用,主要包括技術(shù)推廣服務和產(chǎn)品專利成果轉(zhuǎn)化服務。技術(shù)推廣為專家技術(shù)和科研用戶之間建立了橋梁,為科研活動中的難題提供了支持。產(chǎn)品專利的轉(zhuǎn)化也為科研的成果市場化提供了平臺,實現(xiàn)了科研壽命提供了資金支持。
科研活動是一個涉及研發(fā)、推廣、使用和轉(zhuǎn)化等一系列的活動構(gòu)成,也是智力、資金和人力等資源組合過程,其資源的配置往往決定了該科研的進程甚至命運,所以可以科技云平臺將實現(xiàn)資源的科學快速配置,為科研的社會化提供支持。
虛擬化技術(shù)是云計算中的一項關(guān)鍵技術(shù),其平臺在虛擬層中將存儲集群、網(wǎng)絡設(shè)施、服務器和其它同類設(shè)施通過虛擬化技術(shù),將同類設(shè)施實現(xiàn)池化,即形成對用戶的透明的整體。如下圖3中描述,存儲1和存儲2集群通過池化技術(shù)形成一致化統(tǒng)一整體,同時屏蔽了廉價設(shè)備的差異。
本文首先通過云計算特點的歸納和當前科技信息共享系統(tǒng)中存在的問題,然后提出一種基于云計算的架構(gòu)方案實現(xiàn)規(guī)范化科技共享平臺的開發(fā),不僅解決了海量科研數(shù)據(jù)的存儲問題,而且統(tǒng)一了系統(tǒng)未來的發(fā)展方向。
此外,云計算平臺上存在的問題還有很多,例如信息安全問題,新舊系統(tǒng)的信息共享等。如何實現(xiàn)現(xiàn)有系統(tǒng)的互聯(lián)互通,將是我們下一個研究問題。