趙順梅
(天水電氣傳動研究所有限責任公司,甘肅天水741020)
隨著互聯網技術的飛躍發(fā)展,其每一次的進步都對社會、生活各個方面產生著巨大的影響。檔案工作是國家信息資源建設的一個重要部分,已經從不同層面、多方位地利用互聯網技術為自身建設服務,期望實現國家檔案資源的有機整合和充分利用。如今,一種新的互聯網技術-網格的出現,在網格技術發(fā)展的影響和推動下,網格技術越來越逼近實際生活,檔案工作也不可避免地受到碰撞和沖擊。如何利用網格技術的優(yōu)勢管理檔案信息資源將是檔案信息化管理的一個重要課題,它必將引起檔案工作的時代變遷。
計算機和Internet發(fā)展到今天,對社會發(fā)展產生了巨大的影響,從根本上改變了人們的工作方式、生產方式和生活方式,使整個社會進入了“信息時代”。信息的產生、加工、傳播和獲取隨著計算機技術和網絡技術的應用逐漸朝著數字化、信息化、自動化和網絡化方向發(fā)展,信息的種類、形式、范圍大大拓展,從傳統的印刷型文獻過渡到數字化信息,純文本信息逐漸被文本、圖像、聲頻、視頻等多種媒體數字信息所取代,信息共享正在逐步實現。
在信息時代,Internet使得信息共享成為可能,但由于人們對信息的渴求程度大大提高,不再滿足于現有的網絡和共享模式,而要尋求更加廣泛的資源共享,于是一種可以將地理上分散的資源集成起來的基礎設施-網格(Grid)被提了出來。關于網格,美國科學家伊安·福斯特(Ian Foster)曾這樣描述:“網格是構筑在互聯網上的一組新興技術,它將高速互聯網、計算機、大型數據庫、傳感器、遠程設備融為一體,為科技人員和普通老百姓提供更多的資源、功能和服務。互聯網主要為人們提供電子郵件、網頁瀏覽等通信功能,而網格的功能則更多更強,它能讓人們透明地使用計算、存儲等其他資源”。網格是一個一致、開放、標準的計算環(huán)境的信息基礎設施,支持聚合地理上廣泛分布的高性能計算資源、大容量數據和信息存儲資源、軟件和應用系統、高速測試和獲取系統、以及人力等各種資源的合作問題求解系統的構造。網格的出現讓人們看到資源無縫共享的前景,因此人們常常用“下一代因特網”、“國際互聯網2”、“下一代萬維網”等詞語來描述網格。
網格是借鑒電力網的概念提出來的,也稱網格計算或網格技術,它是伴隨互聯網的發(fā)展而發(fā)展起來的新型科學計算模式。這種計算模式利用互聯網把分散在不同地理位置的電腦組織成一個“虛擬的超級計算機”,其中每一臺參與計算的計算機都是一個“節(jié)點”,整個計算系統是由成千上萬個“節(jié)點”組成的“一張網格”,這種計算方式數據處理能力超強,能充分利用網上的閑置處理能力,并像電力一樣隨處可得。
網格所連接的資源相當廣泛,可以是計算機的軟硬件,也可以是其他的儀器設備,甚至是操作計算機的人。網格的目的就是將這些可用資源連結起來,實現計算資源、存儲資源、數據資源、信息資源、軟件資源、通信資源、知識資源、專家資源等的全面共享。
網格是因特網應用的新發(fā)展,因特網實現了計算機硬件、網頁等的連接,而網格具有比因特網更強的功能。首先,網格比因特網具有更大的帶寬,歐美的網格計劃都使用更高速度的主干網;第二,網格能將更多高性能計算機資源連接共享,它的計算速度、數據處理速度可以大幅度提高;第三,網格的體系結構將比因特網更能有效地利用網絡信息資源。網格采用廣域緩存技術,能夠自動把用戶最需要的信息放在離用戶最近的服務器上;第四,網格將促進更多、更大規(guī)模的網絡社區(qū)的出現,這些相互聯結的社區(qū)最終構成一個龐大的網格社區(qū)。
網格是一個在地理位置上廣泛分布的基礎設施,用戶數量巨大,資源千差萬別,需求種類繁多,應用功能各異,要給用戶提供安全、高效、高質量的服務,網格技術應具有如下基本特點:
(1)網格具有分布與異構性。網格系統由分布在Internet上的各類資源組成,包括各類大型機、工作站和個人計算機,它們是異構的,可運行在UNIX、Windows、Linux等各種操作系統下,也可以是上述機型的機群系統、大型存儲設備、數據庫或其他設備。
(2)網格具有集成與共享性。網格把地理位置上分布的各種資源集成在一起,成為一個有機的整體,協調分散在不同地理位置的資源使用者。同時,解決異構機器之間資源與任務的分配與調度、安全通信與互操作、實時性等問題,實現對各種資源的充分共享,從計算資源、設備資源到服務資源,多個用戶不僅可以共同使用網格總的一個資源,網格中的一個用戶也可以同時使用多個網格資源,從而實現在非集中控制的網絡環(huán)境中協同使用資源。
(3)網格具有動態(tài)性。組成網格系統的資源不是一成不變的,而是動態(tài)變化的。隨著時間的推移,原先不在網格上的資源有可能連接到網格上,原先在網格上的資源由于故障或者其他原因有可能不再可用。針對網格資源的動態(tài)變化性,資源管理必須能動態(tài)監(jiān)視,實現任務的動態(tài)遷移,從可利用資源中選取最佳資源服務。
(4)網格具有自治性與多重管理性。網格上的資源是屬于不同的組織或個人的,資源的擁有者應該擁有對資源的自主管理能力,可以隨時允許其資源進入或退出網格而不影響整個網格的使用。但網格資源也必須接受網格的統一管理,否則不同組織的資源就無法建立聯系,無法實現共享和互操作,消滅不了信息資源的“孤島效應”。
(5)網格具有開放性與標準性。網格系統面向所有的設備開放,只要遵守網格規(guī)則,任何設備都可加入網格。網格提供的接口是標準的,不依賴于接入的具體設備和管理系統,設備接入閾值低。
網格技術作為新一代的網絡技術,具有分布性與異構性、集成性與共享性、動態(tài)性、自治性和多重管理性、開放性與標準性等特點,有利于檔案的信息化建設和檔案信息資源的管理,能進一步推動檔案工作的發(fā)展。
(1)在資源建設方面,網格可以實現數字檔案信息資源的全面共享。
檔案部門在檔案信息資源建設時,需要處理大量的數據,由于現有技術條件、經濟條件的限制和檔案信息安全的制約,現有網絡無法對各個數據庫之間的數據進行連通和數據交換,各個檔案館之間的檔案信息資源還處于分散和孤立狀態(tài),沒有能夠實現全面關聯,“信息孤島”、“信息煙囪”現象嚴重,在很多情況下用戶并不知道檔案信息資源存儲位置,不利于檔案信息資源跨地區(qū)、跨部門之間的利用,極大地影響用戶的利用需求。這些檔案信息資源各自為政、互不相通,造成了十分嚴重的人力、物力、財力浪費。
網格的本質特征是共享利用,與目前的計算機網絡不同,實現資源全面共享是網格的出發(fā)點和目的。網格能實現應用層面的連通,它主要關注的是如何消除“信息孤島”,為用戶提供“一站式跨庫”檢索,實現信息資源的智能共享。檔案是一種十分重要的信息資源,利用網格的共享性,可將分布在不同地域、不同部門異構檔案信息資源集成起來,不僅能在各檔案館、各檔案部門之間實現檔案信息資源共享,還能為用戶提供統一的訪問接口,選擇適當的訪問協議來實現用戶提出的服務請求。網格技術在檔案信息資源管理中的應用,可以提高檔案部門的管理水平和服務質量,提高數字檔案信息資源的利用效率,有助于國家綜合信息系統的組建。“衡量一個國家信息產業(yè)發(fā)展程度的一項重要指標,就是這個國家所組建的信息系統的完善程度和綜合程度。而國家信息系統主要涉及全部學科領域的文獻、圖書館和檔案服務。由此可見,完善的國家信息系統,也依賴于檔案信息系統的建立和完善?!本W格技術的應用必將極大地增強整個檔案信息系統的功能和與其他信息系統的聯網能力,從而有利于構建完善的國家綜合信息系統。
網格技術的優(yōu)勢在于不僅能實現檔案信息資源的共享,還能實現計算機硬件及其他電子設備的共享,利用網格中其它檔案館閑置計算機的計算能力為用戶查詢和數據處理服務;也可以利用存儲虛擬化技術進行網絡存儲,整合閑置的存儲資源?!按鎯μ摂M化是指將物理的存儲設備以邏輯的形式呈現,將網絡中的存儲設備視為一個或多個存儲池進行數據存取,而不用考慮信息具體存放在哪臺設備上。利用虛擬化技術來改善數據管理所帶來的好處是簡化管理,降低管理的復雜性,提高存儲設備的利用率,提高數據的高可用性。
(2)在資源管理方面,網格能為數字檔案信息資源構造統一的管理平臺。
數字化檔案信息異構現象嚴重,信息有文本、圖形、圖像、影像等形式,存儲工具千差萬別,數據庫類型各不相同,檔案管理軟件品種繁多,不同計算機使用的操作系統也不相同。如何整合這些異構的載體、軟件和管理系統等問題成為檔案信息化建設的重要內容。
在分布式的異構環(huán)境中,網格技術能夠精確定位所需的數據集,并且能對分布在廣域網環(huán)境中的信息資源進行抽象描述,支持網格應用對資源訪問的透明性,為用戶提供一體化的智能信息平臺。在這個平臺上,信息處理是分布式、協作和智能化的,用戶可以通過單一入口訪問所有信息。而不像目前的因特網那樣,需要用戶自己在大量的、凌亂的、不統一的網頁信息中尋找自己所需的信息。
網格技術可以提供一個統一的、可以相互訪問的接口或者協議標準。網格的許多平臺和資源只要滿足這些標準,就可以將分布在各地的計算機、知識、數字檔案信息等組成一個邏輯整體,在此基礎上運行各自的應用網格,為數字檔案信息資源管理提供軟硬件基礎設施,使網格中的檔案資源被統一管理和使用。
(3)在數據處理方面,網格有利于數字檔案信息資源的海量數據處理。
隨著檔案信息化進程的加快,檔案館中需要處理的檔案數據越來越多,如果為了處理這些數據而添置大量的計算機或其他電子設備,顯然會加重檔案館的經濟負擔。而網格能夠充分利用現有資源,更好地解決海量數據的計算處理和分析問題;它能將分布在不同地域的計算機連接在一起,用戶只需通過客戶端發(fā)出要求計算的指令,網格就能把這些任務調配給各個計算機執(zhí)行,然后將各個計算機計算出來的結果匯總反饋給用戶,連接的計算機規(guī)模越大,計算能力就越高。此外,網格用戶還可以在較短時間內把需要的數據從不同的數據庫中找出來,綜合在一起實現“一站式檢索”,這種檢索方式向用戶提供了統一的檢索接口,將用戶的檢索要求轉化為不同數據源的檢索表達式,并發(fā)的檢索本地和互聯網上的多個分布式異構數據庫,并對檢索結果加以整合,在經過去重和排序以后,以統一格式將結果呈現給用戶,而且這一過程用戶只需要以單一身份、單次登錄和單一的檢索方式就可以實現。省去了用戶多次訪問不同數據庫的麻煩,可直接調用網格中的算法和程序等資源,避免了許多重復性的工作。
網格可以智能地分配和優(yōu)化計算資源,更快地解決檔案館數字檔案信息資源的數據處理和檢索利用問題,能將應用程序的每個部分調整到最適合它的系統中去;從而以更短的時間、更低的成本實現海量數字檔案信息資源的數據處理。
(4)在資源利用方面,網格可為檔案用戶提供知識服務。
目前用戶查閱數字檔案信息大多是采用Web方式,由于Web在技術方面的不足,未能解決當前存在的信息泛濫但知識貧乏的困境。雖然Web上采用了不少對信息進行學習與挖掘的嘗試,如智能搜索引擎、知識發(fā)現等,但是這些努力并沒有從根本上解決知識利用率低的難題。因此,人們開始尋找一種新的技術平臺,希望從根源上打破這種瓶頸,此時網格出現在人們的視野中。
網格不僅能將各種資源連接起來,還能根據用戶的要求自動生產知識。在知識生產的過程中,高性能計算機將起到關鍵的作用,能將從數據源中得到的各種原始數據運行特定的程序加工成信息和知識。網格技術可根據用戶需求,利用高性能計算機自動地尋找有關的數據源進行綜合分析和知識發(fā)現,形成新的知識,傳送給需要的用戶。這種量體裁衣的模式與知識管理系統管理知識是不謀而合的。由此可見,隨著網格技術在檔案信息資源管理中的應用,將會增強數字檔案信息資源的知識服務能力,全面提升數字檔案信息資源的作用,從而使數字檔案信息的服務功能更加完善。
(5)在資源安全方面,網格能保障檔案信息資源的安全。
目前Internet的安全保障主要提供兩個方面的服務:訪問控制服務,用來保護各種資源不被非授權使用;通信安全服務,用來提供認證,數據保密性與完整性和各通信端的不可否認性服務。這兩方面的安全服務不能完全解決網絡環(huán)境中的安全問題。網格環(huán)境中,各種資源都動態(tài)連接到Internet上,不同網格節(jié)點之間的通信是通過Internet連接的,用戶向網格計算環(huán)境提交任務和監(jiān)控管理任務也是通過Internet來完成的,并且所有主體都是可以動態(tài)加入或撤離網格中的虛擬組織。因此,網格對安全的要求要高于Internet。
網格通過網格安全基礎設施保障網格計算環(huán)境的安全。這種安全基礎設施支持網格環(huán)境中主體之間的安全通信,防止主體假冒和數據泄漏;支持跨虛擬組織的安全;支持網格環(huán)境中用戶的單點登陸,包括跨多個資源和地點的信任委托和信任轉移等。網格安全基礎設施為網格計算環(huán)境提供了一系列的安全協議、安全服務、安全SDK和命令行程序,如安全應用編程接口、相互安全身份鑒別技術、單點登錄(single sign-on)技術等。通過使用這些安全技術,可有效地保證網絡計算環(huán)境的安全性和方便性。這樣就能保證網格中檔案信息資源的安全存取和通信,保證不同用戶對檔案信息資源的不同訪問權限,滿足檔案信息資源的特殊安全要求。
網格技術是一種新興的互聯網技術,它有著傳統Internet所沒有的優(yōu)勢,將給世界帶來前所未有的改變,是一次深刻的互聯網革命。雖然目前網格技術還處在試驗和初步應用階段,但很有發(fā)展前景。對于大量產生的電子文件和數字化檔案信息資源,目前無法解決的技術難題,如異構環(huán)境的管理、海量數據的處理、共享和協作等,網格技術將在這些方面有著巨大的優(yōu)勢。因此,應該關注網格技術的發(fā)展和應用,使之成為檔案信息化管理的重要手段。
[1]Ian Foster,Carl Kesselman,editors.The Grid:Blueprint for a New Computing Infrastructure.CA.Morgan Kaufmann Publishers,1999.
[2]黃曉斌,鄧愛貞.網格技術的發(fā)展與數字圖書館建設[J].情報資料工作,2003(5).
[3]都志輝,陳 渝,劉 鵬.網格計算[M].北京:清華大學出版社,2002.
[4]傅榮校.從技術革命本質看電子文件的兩面性[J].檔案學通訊,2000(3).
[5]卞昭玲.基于網格應用的企業(yè)信息管理模式之創(chuàng)新[J].檔案學通訊,2006(6).
[6]高 丹.知識網格資源管理研究.中國優(yōu)秀博碩士學位論文全文數據庫,2005.
[7]都志輝,陳 渝,劉 鵬.網格計算[M].北京:清華大學出版社,2002,61-62.