摘要:本文首先介紹了網(wǎng)格的特點(diǎn)和優(yōu)勢(shì),針對(duì)目前我國(guó)檔案信息開發(fā)利用中存在的問題,指出建立檔案信息網(wǎng)格是我國(guó)檔案信息開發(fā)利用的突破方向。最后通過對(duì)檔案信息網(wǎng)格完整體系架構(gòu)的設(shè)計(jì),為其建設(shè)提供了實(shí)踐指導(dǎo)。
關(guān)鍵詞:檔案信息網(wǎng)格開發(fā)利用
檔案信息的開發(fā)利用是推動(dòng)經(jīng)濟(jì)社會(huì)全面發(fā)展的重要途徑,然而受種種原因所限,我國(guó)的檔案信息開發(fā)利用工作尚處于瓶頸之中。為此,應(yīng)用先進(jìn)的網(wǎng)格技術(shù),尋求突破,促進(jìn)檔案參與社會(huì)活動(dòng),激發(fā)并實(shí)現(xiàn)檔案價(jià)值,具有重大而深遠(yuǎn)的意義。
一、網(wǎng)格的特點(diǎn)與優(yōu)勢(shì)
網(wǎng)格(Grid)的理念萌生于1969年Klein? rock所表述的“像使用電力和電話設(shè)施一樣來使用計(jì)算機(jī)”的構(gòu)想。[1]目前普遍為科研工作者所接受的概念,是Ian Foster表達(dá)的:“網(wǎng)格是建構(gòu)在互聯(lián)網(wǎng)上的一組新興技術(shù),它融高速互聯(lián)網(wǎng)、高性能計(jì)算機(jī)、大型數(shù)據(jù)庫、傳感器、遠(yuǎn)程設(shè)備等為一體,為科研工作者和普通公眾提供多于普通互聯(lián)網(wǎng)的資源、功能與交互?!盵2]由其含義可知,網(wǎng)格是互聯(lián)網(wǎng)的延伸和發(fā)展,是下一代的互聯(lián)網(wǎng),與現(xiàn)有的網(wǎng)絡(luò)相比,具有如下特點(diǎn)(見表1):
可見,雖然傳統(tǒng)互聯(lián)網(wǎng)與網(wǎng)格在基本目標(biāo)上是一致的,但網(wǎng)格在結(jié)構(gòu)體系與共享的范圍、模式和效率上有著更出色的表現(xiàn)。互聯(lián)網(wǎng)解決了跨時(shí)空通訊的問題,網(wǎng)格則將整個(gè)互聯(lián)網(wǎng)整合為一個(gè)超級(jí)計(jì)算機(jī)和海量資源池,面向用戶提供電力網(wǎng)般“即插即用”式的資源利用方式,能夠消除資源孤島,提升人們利用全球范圍內(nèi)各類資源的能力,使互聯(lián)網(wǎng)資源得到充分的利用。
正是這些特點(diǎn)決定了其獨(dú)特的優(yōu)勢(shì)(見表2):
二、我國(guó)檔案信息開發(fā)利用瓶頸剖析
(一)信息資源分散
檔案信息分散于為數(shù)眾多的檔案保管部門,它們相對(duì)獨(dú)立,形成了分散、異構(gòu)的孤島。這些資源具有各自的組織方式,并以不同的檢索方式提供利用,這就要求用戶掌握每一個(gè)數(shù)據(jù)庫的檢索技術(shù),從而為檔案信息檢索獲取造成了不便。
(二)信息開發(fā)深度不足
傳統(tǒng)檔案管理體制和保密意識(shí)的制約、開發(fā)手段和人員的不足以及檔案館資金及軟硬件條件的缺乏等原因共同導(dǎo)致了目前我國(guó)檔案信息開發(fā)難以深入的現(xiàn)狀。大多數(shù)未經(jīng)增值開發(fā)的檔案信息資源難以實(shí)現(xiàn)其價(jià)值,也增加了用戶利用的難度。
(三)服務(wù)方式與理念滯后
長(zhǎng)期以來,檔案館被動(dòng)等待用戶上門的服務(wù)方式、千人一面的程式化服務(wù)手段、局限于本館資源的服務(wù)內(nèi)容,⑤均與差異化、個(gè)性化、知識(shí)化、智能化的現(xiàn)代信息服務(wù)理念相違背。不但難以滿足用戶需求,更造成了其不愿利用檔案信息的心理障礙。
網(wǎng)格技術(shù)能夠以其強(qiáng)大的共享與虛擬集成能力完成廣泛分布的檔案信息資源的整合,并提供統(tǒng)一的發(fā)現(xiàn)與獲取方式;能夠以靈活性和容涵性在最大化節(jié)約成本的條件下引入高性能計(jì)算機(jī)的計(jì)算能力和數(shù)據(jù)處理能力、引入先進(jìn)的信息開發(fā)工具和人力資源,向用戶輸出高效的開發(fā)手段,對(duì)檔案信息加以深度開發(fā);能夠以自調(diào)整、自適應(yīng)和容錯(cuò)性聯(lián)合多種應(yīng)用服務(wù),提供良好的應(yīng)用環(huán)境,根據(jù)用戶需求提供多種服務(wù)方式和內(nèi)容。
可見,檔案信息資源開發(fā)利用問題的解決與網(wǎng)格的優(yōu)勢(shì)特點(diǎn)具有高度的契合性。構(gòu)建檔案信息網(wǎng)格能夠幫助檔案信息開發(fā)利用在新環(huán)境下取得突破。
三、檔案信息網(wǎng)格體系架構(gòu)設(shè)計(jì)
(一)總體結(jié)構(gòu)
1.檔案資源組塊
該組塊是用戶利用檔案信息網(wǎng)格資源的基礎(chǔ)保障,由用戶能夠?qū)嶋H利用的分布于各處的各類檔案資源組成。不僅包括檔案信息資源還包括大型計(jì)算機(jī)、實(shí)驗(yàn)室、應(yīng)用程序等實(shí)體資源,構(gòu)成整個(gè)檔案信息網(wǎng)格的基礎(chǔ)。
2.虛擬抽象組塊
該組塊負(fù)責(zé)對(duì)檔案資源組塊提供的異構(gòu)資源進(jìn)行虛擬化,其目的是屏蔽底層資源的異構(gòu)性,為其他組塊提供統(tǒng)一的資源形式,并將資源進(jìn)一步抽象為各類服務(wù)以為用戶利用提供支持。
3.業(yè)務(wù)處理組塊
該組塊是檔案信息網(wǎng)格重要的核心管理工具,提供包括服務(wù)創(chuàng)建、維護(hù)、生命周期管理等業(yè)務(wù)功能。
4.交互溝通組塊
該組塊允許用戶在進(jìn)行一次身份認(rèn)證之后便建立代理證書,隨后代理證書可被程序應(yīng)用于任何遠(yuǎn)程服務(wù)的身份驗(yàn)證,保障用戶利用網(wǎng)格資源的便捷性。
5.用戶服務(wù)組塊
該組塊主要提供用戶利用的界面,負(fù)責(zé)屏蔽網(wǎng)格技術(shù)的復(fù)雜性和網(wǎng)格資源的多樣性。用戶通過定制的界面透明、集中、一站式地訪問網(wǎng)格。
(二)拓?fù)浣Y(jié)構(gòu)
以各組塊間的聯(lián)動(dòng)式拓?fù)潢P(guān)系保證檔案信息網(wǎng)格的整體性:
1.用戶—交互拓?fù)?/p>
用戶進(jìn)行登錄/注冊(cè)后,交由用戶管理器審查身份并賦予用戶權(quán)限,再由服務(wù)代理根據(jù)用戶的訪問權(quán)限處理用戶請(qǐng)求,調(diào)配適當(dāng)?shù)膽?yīng)用或服務(wù)滿足用戶需求。最后無論用戶獲取了何種格式、何種類型的檔案信息或服務(wù),都由視圖分配器做統(tǒng)一響應(yīng),集中反饋給用戶。
2.交互—業(yè)務(wù)拓?fù)?/p>
用戶管理器通過用戶認(rèn)證中心和權(quán)限管理器獲取用戶權(quán)限。服務(wù)代理把用戶需求傳遞給服務(wù)工廠來獲取用戶所需服務(wù)。服務(wù)工廠既可以組配與調(diào)度現(xiàn)有的檔案信息服務(wù),也可以通過任務(wù)管理器對(duì)下層資源進(jìn)行進(jìn)一步抽象來形成新服務(wù)。網(wǎng)格服務(wù)的創(chuàng)建、維護(hù)與刪除由服務(wù)工廠中的服務(wù)管理器負(fù)責(zé)。
3.業(yè)務(wù)—虛擬抽象拓?fù)?/p>
虛擬抽象組塊通過動(dòng)態(tài)資源目錄、資源組配器和資源管理器三者之間的聯(lián)動(dòng)實(shí)現(xiàn)對(duì)抽象資源的整合與調(diào)配。然后根據(jù)業(yè)務(wù)要求將整合后的資源提供給網(wǎng)格服務(wù)或其他任務(wù)。
4.虛擬抽象—資源拓?fù)?/p>
由數(shù)據(jù)提供者利用元數(shù)據(jù)整合各類資源,并通過OAI協(xié)議與服務(wù)提供者交互,同時(shí)注冊(cè)資源。再由服務(wù)提供者結(jié)合資源注冊(cè)建立索引分類,通過各類通信協(xié)議供虛擬抽象組塊利用。
(三)節(jié)點(diǎn)組織結(jié)構(gòu)
檔案信息網(wǎng)格由若干節(jié)點(diǎn)聯(lián)接而成。其中底層的檔案資源提供者構(gòu)成一個(gè)個(gè)信息節(jié)點(diǎn),其內(nèi)容包括但不限于檔案資源,也可涵蓋網(wǎng)絡(luò)文檔等。由網(wǎng)格管理中間件擱置它們內(nèi)部結(jié)構(gòu)的差異,對(duì)其進(jìn)行一一封裝后納入網(wǎng)格環(huán)境之中。為了維護(hù)網(wǎng)格的正常運(yùn)行,除信息節(jié)點(diǎn)外,還需要若干功能節(jié)點(diǎn),包括元數(shù)據(jù)采集節(jié)點(diǎn)、元數(shù)據(jù)目錄節(jié)點(diǎn)、統(tǒng)一入口節(jié)點(diǎn)及注冊(cè)與認(rèn)證節(jié)點(diǎn)等。
這些節(jié)點(diǎn)不能以一盤散沙的形態(tài)存在,而必須按照一定的結(jié)構(gòu)加以組織,形成高效的網(wǎng)絡(luò)。
1.縱向樹形結(jié)構(gòu)
依據(jù)上文設(shè)計(jì),由檔案信息網(wǎng)格下設(shè)功能節(jié)點(diǎn)與信息節(jié)點(diǎn)兩個(gè)根節(jié)點(diǎn)。以信息節(jié)點(diǎn)為例,采取元數(shù)據(jù)與文獻(xiàn)資源實(shí)體一一對(duì)應(yīng)的形式按樹形結(jié)構(gòu)組織檔案資源,即每個(gè)數(shù)字化檔案實(shí)體都有相應(yīng)的元數(shù)據(jù)對(duì)其加以描述,而每個(gè)信息節(jié)點(diǎn)都利用多個(gè)樹狀的目錄將元數(shù)據(jù)組織起來,構(gòu)成節(jié)點(diǎn)的樹形結(jié)構(gòu)。
2.橫向網(wǎng)狀結(jié)構(gòu)
為了避免節(jié)點(diǎn)的孤立,在檔案信息網(wǎng)格樹形結(jié)構(gòu)的基礎(chǔ)上,還需要在其中各同級(jí)節(jié)點(diǎn)之間建立聯(lián)系。這些聯(lián)系能夠以橫向的網(wǎng)狀結(jié)構(gòu)來表達(dá)。
該結(jié)構(gòu)也代表著檔案資源的虛擬集中過程。即由各個(gè)信息節(jié)點(diǎn)構(gòu)成樹形結(jié)構(gòu)的末端,由就近的服務(wù)器對(duì)它們采用收割元數(shù)據(jù)的方式加以整合,再匯總到根節(jié)點(diǎn)提供統(tǒng)一利用。根節(jié)點(diǎn)通過調(diào)用各個(gè)節(jié)點(diǎn)上的信息資源,實(shí)現(xiàn)各葉子節(jié)點(diǎn)的整合。
彼此相鄰的兩個(gè)節(jié)點(diǎn)間的關(guān)系比較密切,可以形成對(duì)等節(jié)點(diǎn)或關(guān)聯(lián)節(jié)點(diǎn)。對(duì)等節(jié)點(diǎn)可以為相同的信息資源提供不同的獲取途徑,一方面突破了單服務(wù)器在性能上的限制,擴(kuò)大服務(wù)可及性;另一方面能夠?qū)崿F(xiàn)故障的快速轉(zhuǎn)移,確保整個(gè)檔案信息網(wǎng)格系統(tǒng)的穩(wěn)定性。關(guān)聯(lián)節(jié)點(diǎn)是指二者具有一定的共性特點(diǎn),所涵蓋的資源內(nèi)容可能有所交叉的節(jié)點(diǎn),它們能夠共同為用戶進(jìn)行跨領(lǐng)域研究提供條件。
四、結(jié)語
綜上所述,通過檔案信息網(wǎng)格的構(gòu)建,實(shí)現(xiàn)其信息集成、統(tǒng)一檢索獲取、計(jì)算與分析資源共享、用戶分級(jí)管理和服務(wù)拓展等功能。從而為目前檔案信息開發(fā)利用中突出問題的解決構(gòu)筑了基礎(chǔ)平臺(tái),也提供了取得進(jìn)一步突破的方向。
*本文是遼寧大學(xué)青年科研基金項(xiàng)目:“網(wǎng)格環(huán)境下檔案信息開發(fā)利用研究”的部分研究成果。
注釋:
[1]Smarr L,Catlett C. Metacomputing[J]. Com? munications of the ACM,1992(6):124-135
Ian Foster. WHAT IS THE GRID? A THREE POINT CHECKLIST[EB/OL]. [2013-04-16]. http:// www.it.jcu.edu.au/Subjects/cp5170/2006-2/Tsv/re? sources/session1/What_is_the_Grid.pdf
[2]朱蘭蘭.檔案信息資源開發(fā)利用對(duì)經(jīng)濟(jì)社會(huì)發(fā)展影響力測(cè)度問題初探[J].檔案學(xué)通訊,2011(3):79-83.
[3]吳珺,趙廣輝,王春麗.網(wǎng)格技術(shù)及其應(yīng)用分析[J].武漢理工大學(xué)學(xué)報(bào),2008(5):143-147.
[4]王萍,趙丹陽,王玉超.基于網(wǎng)格技術(shù)的科學(xué)數(shù)據(jù)存儲(chǔ)與共享[J].圖書情報(bào)工作,2011(13):63-66.