劉衛(wèi)利 易峰
〔摘 要〕將網絡環(huán)境、軟硬件設備建設集成于區(qū)域數(shù)字圖書館框架搭建中,以資源建設、資源管理、資源服務為主線來調理數(shù)字圖書館平臺建設的思路,對區(qū)域數(shù)字圖書館門戶建設中的若干問題作了探討。
〔關鍵詞〕區(qū)域數(shù)字圖書館;框架搭建;平臺建設
DOI:10.3969/j.issn.1008-0821.2012.06.014
〔中圖分類號〕G250保罰 〔文獻標識碼〕B 〔文章編號〕1008-0821(2012)06-0055-03
區(qū)域數(shù)字圖書館是數(shù)字圖書館聯(lián)盟的高級形式,是由一大批共同遵循某種協(xié)議的計算機網絡互聯(lián)而成的龐大網絡。它的基本目標是提供一個良好的基于數(shù)字化的信息環(huán)境,提供對分布式存儲的信息的知識化組織、智能化服務。其體系結構包括基礎設施建設、平臺門戶建設(含文獻資源建設)兩大部分。其中基礎設施建設包括網絡環(huán)境、各類硬軟件系統(tǒng)建設,是區(qū)域數(shù)字圖書館建設的基礎;平臺門戶是圖書館資源與服務的集成,是區(qū)域數(shù)字圖書館全部資源和服務的訪問接入點,它使得用戶通過一個接口友好地訪問圖書館所有的資源和服務[1],是快速構建各種信息服務的核心工具。此外,建設區(qū)域數(shù)字圖書館還需要通過信息安全體系和標準規(guī)范體系來協(xié)調維護區(qū)域數(shù)字圖書館各分中心與中心的互操作等。
1 系統(tǒng)架構與基礎設施
1.1 系統(tǒng)硬件架構
系統(tǒng)硬件架構主要包括集群服務器架構和海量存儲器架構。集群服務器架構考慮采用兩臺多層交換機作為主干交換機,它們之間采用Fast EtherChannel或Gigabit EtherChannel連接,保證負載均衡及線路備份,當兩個交換機之間的一條線路出現(xiàn)故障,傳輸?shù)臄?shù)據(jù)會快速自動切換到另外一條線路上進行傳輸,不影響網絡系統(tǒng)的正常工作,無需人工干預。主機及備機分別接到兩個主干交換機上,當主機出現(xiàn)故障、主機的兩塊網卡出現(xiàn)故障或主機所連接的交換機兩個端口甚至交換機整個出現(xiàn)故障,系統(tǒng)會快速自動切換到備機及另一個交換機進行工作,從而保證整個系統(tǒng)安全有效的運行。
海量存儲器架構考慮采用以存儲區(qū)域網絡SAN構架為基礎,通過核心的光通道交換機作為SAN的連接核心設備,將多個主機和多個存儲設備連接起來的方案。SAN架構可以實現(xiàn)系統(tǒng)中的任何服務器、陣列子系統(tǒng)、磁帶系統(tǒng)之間的互連。SAN建造存儲池,使多個服務器共享一個陣列子系統(tǒng)、共享一個自動帶庫,實現(xiàn)數(shù)據(jù)的共享和集中的管理。它有效地改善了存儲資源的共享特性,非常適合管理動態(tài)數(shù)據(jù)。它獨立于應用服務器網絡系統(tǒng)之外,擁有幾乎無限的可擴展性。開放性和可擴展性是系統(tǒng)硬件架構的設計原則。
1.2 系統(tǒng)軟件架構
平臺軟件系統(tǒng)應通過國際工業(yè)標準JSR168來實現(xiàn)應用集成,門戶支持XML/XSL、ODL、HTML、JSP、WEBSERVICES等整合模式[2]。整個系統(tǒng)可考慮采用業(yè)界領先的TRS數(shù)字圖書館解決方案,包含表現(xiàn)層、邏輯處理層和數(shù)據(jù)層等3個層次。
表現(xiàn)層是整個資源平臺與用戶的接口,負責用戶界面以及用戶的接入。表現(xiàn)層的最終表現(xiàn)形式是整個數(shù)字圖書館的門戶。該層采用TRS內容管理協(xié)作平臺(TRS WCM),它是一套完全基于Java技術和瀏覽器技術的網絡內容管理軟件,集瀏覽器內容創(chuàng)建和寫作、內容交付、基于模板的內容發(fā)布、強大的站點管理于一身,并提供企業(yè)級的團隊協(xié)作能力,使信息發(fā)布簡單化、自動化、智能化;邏輯處理層是整個資源平臺的應用服務邏輯事務層,負責完成應用系統(tǒng)所要完成的功能。它提供對資源發(fā)現(xiàn)的通用檢索、對象代理發(fā)布以及其它用戶服務(如個性化定制)等,同時負責在應用層上對資源進行存取。該層使用TRS內容分發(fā)平臺(TRS CDS),該平臺是TRS內容管理平臺中的一個重要組成部分,其主要功能就是實現(xiàn)內容的分發(fā)及后續(xù)階段的評估反饋,以實現(xiàn)整合多種數(shù)據(jù)源,為表現(xiàn)層提供多種異構數(shù)據(jù)源的內容,即實現(xiàn)靈活、無縫、透明的數(shù)據(jù)整合;數(shù)據(jù)層負責存儲與管理各種信息數(shù)據(jù)資源,通過相應的存取協(xié)議來進行訪問。由于數(shù)字圖書館的數(shù)據(jù)庫需求和其它系統(tǒng)的差異性,需要提供在海量非結構化信息中快速、準確獲得用戶所需信息的全文檢索功能。
1.3 網絡傳輸環(huán)境
網絡出口帶寬主要依據(jù)在線用戶數(shù)來配置,可建立Chinanet和Cernet雙通道出口。為使公網用戶訪問更為順暢,前者帶寬應大于后者。
橫向上IP網可分為核心層、邊緣層、接入層。核心層是由核心路由器或異步轉移模式骨干交換機以及承載這些設備的光纖傳輸網組成;邊緣層由邊緣路由器或ATM交換機組成,邊緣層設備可以通過光纖直接與核心設備連接;接入層包括局域網、公眾電信網、綜合業(yè)務數(shù)字網、移動網直接面向用戶連接或訪問的部分,由無線網卡、AP和L2Switch組成,主要功能是完成用戶流量的接入和隔離。
湖北高校數(shù)字圖書館建立了一個公共網數(shù)據(jù)中心和一個教育科研網數(shù)據(jù)中心,采用分布式架構在數(shù)據(jù)中心建立數(shù)據(jù)資源存儲與服務系統(tǒng),并以專線方式在兩個中心之間實現(xiàn)光纖直聯(lián),實現(xiàn)了兩個中心的硬件及數(shù)據(jù)互為冗余備份,解決了異構設備及網絡互聯(lián)、城域光纜連接、負載均衡與切換數(shù)據(jù)同步等技術難點[3],這種雙數(shù)據(jù)中心架構的方式,為區(qū)域數(shù)字圖書館網絡建設提供了有益的思考。
2 平臺建設的邏輯結構
2.1 信息資源建設層(數(shù)據(jù)層)
資源建設包括各類電子圖書庫、期刊庫、報紙庫、文獻庫、光盤庫、素材庫、課件庫、試題庫、案例庫、答疑庫及圖書館內部管理信息系統(tǒng)、館藏資源的數(shù)字制作、格式轉換等等,是數(shù)字圖書館的核心;從來源上可分為商業(yè)數(shù)據(jù)庫、免費數(shù)據(jù)庫、自建數(shù)據(jù)庫等類型,它處于整個平臺架構的底層,包括了信息資源交換的體系和規(guī)則,是區(qū)域資源共享的基礎。在實踐中,應考慮以下幾個方面:①為體現(xiàn)資源的學科特性,應加強各學科文獻資源中心建設;②各分中心根據(jù)本館特點進行分工協(xié)調,購買安裝相關數(shù)據(jù)庫并負責買斷該數(shù)據(jù)庫的區(qū)域內使用權,實體文獻建設保持現(xiàn)有機制,以館際互借和文獻傳遞方式來解決共享問題[4];③要堅持引進和自建相結合的原則。
2.2 信息資源管理層(應用層及應用支撐層)
應用層包括為了實現(xiàn)共享平臺的諸多功能而開發(fā)的應用程序模塊,如統(tǒng)一認證、統(tǒng)一檢索、文獻傳遞、推送服務、資源導航、個人圖書館、專題圖書館、信息交流、創(chuàng)作出版、區(qū)域流通、聯(lián)合咨詢、產業(yè)資訊等應用功能[5]。數(shù)字圖書館的最終服務主要體現(xiàn)在資源的整合和重組上,整合的概念體現(xiàn)在兩個方面,即數(shù)據(jù)與應用。數(shù)據(jù)級的整合需要將可抽取的元數(shù)據(jù)按照一定的標準和規(guī)范集中存放以實現(xiàn)統(tǒng)一檢索和全文檢索;應用層的整合主要涉及讀者的認證、系統(tǒng)檢索出口數(shù)據(jù)的分析與整理,然后再統(tǒng)一數(shù)據(jù)顯示格式。整合層是數(shù)字圖書館實施中的重點和難點,需要針對不同的數(shù)據(jù)資源進行定制[6]。
聯(lián)合目錄檢索與基于元數(shù)據(jù)的統(tǒng)一檢索是針對各種異構數(shù)字資源進行應用檢索整合。強調基于元數(shù)據(jù)的統(tǒng)一檢索,可通過先進的組織體系和語義檢索獲取信息,為用戶提供統(tǒng)一的檢索界面和檢索語言,實現(xiàn)對匯總資源元數(shù)據(jù)聯(lián)合倉庫的跨庫檢索,同時提供異構數(shù)據(jù)庫統(tǒng)一檢索功能,使發(fā)布分散的數(shù)字圖書館資源充分發(fā)揮整體效益,進一步用于增值性的應用。資源調度模塊能夠自動更新知識庫,允許自定義本地調度規(guī)則并定制個性化調度服務,向第三方提供資源注冊標準和接口,方便數(shù)據(jù)商批量更新資源注冊信息。
參考咨詢與文獻傳遞模塊集成了OPAC系統(tǒng)、中外文期刊、中外文數(shù)據(jù)庫及電子書系統(tǒng),用戶在網上提交館際互借申請,通過所在館獲取文獻傳遞網成員館的文獻資源。如何使整合后的各種數(shù)據(jù)資源發(fā)揮作用并進行高效的知識管理以及增值性服務,是信息服務的主要目的。數(shù)據(jù)資源服務系統(tǒng)將各種數(shù)據(jù)資源通過多種數(shù)據(jù)服務方式提供給服務團體或個人用戶,包括:虛擬參考咨詢服務,館際互借服務,個性化服務等。
應用支撐層指工作流、內容管理、通用表單、知識管理、統(tǒng)一交換平臺、統(tǒng)一消息平臺認證和權限管理。支撐層是基于靈活的目錄服務體系和標準規(guī)范的信息交換格式構建應用集成、信息管理和共性服務系統(tǒng),包括工作流引擎和中間件。中間件支持跨平臺的分布式異構數(shù)據(jù)的訪問,從而向應用業(yè)務層提供統(tǒng)一的數(shù)據(jù)服務。工作流系統(tǒng)通過工作流引擎驅動數(shù)據(jù)在應用業(yè)務層的各種應用之間流轉,以便根據(jù)分工合理高效和完整的分配信息。應用支撐層采用面向對象、組件式設計等多項技術,提供的構建系統(tǒng)是跨領域、與具體業(yè)務無關、通用的基礎服務,能隨著電子政務系統(tǒng)的發(fā)展而擴展伸縮,應用系統(tǒng)一般通過應用開發(fā)接口或聲明性的描述來使用這些構件服務[7]。
2.3 信息資源服務層
現(xiàn)代技術條件下圖書館工作效果的一個衡量標準可能是:大部分的服務是否都可以通過門戶網站來完成?我們可以大膽推測:假如某實體館一天不開放,會有N位讀者感覺不適的話,那么其平臺門戶癱瘓一天,應該有2N位讀者抱怨。公共服務平臺就是要搭建一個面向全區(qū)域用戶的網絡服務系統(tǒng),擁有裝載各類型文獻數(shù)據(jù)庫的服務器群,連接各個圖書館的自動化管理系統(tǒng)。構建統(tǒng)一的網絡檢索及異構數(shù)據(jù)庫檢索共享網絡平臺是現(xiàn)代圖書館聯(lián)盟的必要技術支持。數(shù)字圖書館聯(lián)盟服務平臺建立的目的是要打破館際界限和信息分割,集成各類數(shù)字信息資源,協(xié)同各成員館間的業(yè)務處理,為用戶提供一站式的信息服務。其工作重點是面向分布式和異構化的數(shù)字信息資源,通過服務集成構造統(tǒng)一的信息服務平臺,實現(xiàn)信息服務的集成與數(shù)字信息資源的共建共享[8]。
門戶的核心要素包括認證、檢索、導航、鏈接、咨詢、個性服務等等,其建設應處處以用戶使用為主導,強調資源和服務的集成,突出資源的學科性,同時還要注意系統(tǒng)架構的開放性和與傳統(tǒng)服務的平滑過渡問題[9]。應從兩個方面來評價門戶建設的滿意度,即用戶界面和服務功能。用戶界面包括屏幕布局、幫助和容錯能力、可學習和可記憶能力等指標,服務功能則包括資源檢索、資源導航、個性化服務、用戶認證等指標[10]。門戶建設的最終目標是要把圖書館的資源和服務做到無縫連接,使讀者通過門戶可以享受幾乎所有的服務項目。
3 問題與思考
文化部打造的數(shù)字圖書館推廣工程,是區(qū)域數(shù)字圖書館建設的重要實踐。它將構建以國家數(shù)字圖書館為中心、以各級數(shù)字圖書館為節(jié)點、覆蓋全國的數(shù)字圖書館虛擬網,借助網絡及各式新興媒體,向公眾提供數(shù)字圖書館服務,在全國范圍內形成有效的數(shù)字資源保障體系。全國省級數(shù)字圖書館平臺搭建工作預計2012年完成,屆時全國所有省級數(shù)字圖書館和部分市級數(shù)字圖書館的硬件平臺搭建工作將完成,2013-2015年則進入全面推廣階段[11]。如此眾多的分中心的加盟,在擴大資源共享范圍的同時,必然帶來一些問題引發(fā)一些思考,這些問題和思考對區(qū)域數(shù)字圖書館建設有著積極的意義。
3.1 IP地址限制的弊端
以高校系統(tǒng)建設的數(shù)字圖書館為例,幾乎都是受IP地址限制的圍墻式封閉館模式,它并非為技術所限制,而是數(shù)據(jù)供應商保護自身經濟利益的一種不成文的行規(guī)。而讀者訪問數(shù)字資源恰恰有隨時隨地的需求,無疑這種限制是致命的。打破這種禁錮,開放資源,是建設者必須面對的現(xiàn)實?,F(xiàn)時通常采取兩種方式實現(xiàn)IP地址限制的突破:對自身用戶采用免費注冊授權,實行系統(tǒng)統(tǒng)一身份認證;對公眾用戶,另作用戶編碼,通過售卡與供應商共享利益。但是,長久看這并不符合資源共享的本意,這種狀況降低了數(shù)字資源的傳播擴散優(yōu)勢。在更大范圍內解除IP限制才可以使區(qū)域數(shù)字圖書館使用走上正途。
3.2 數(shù)據(jù)存儲方式的弱點
無論是中心還是分中心,都存在存儲方式的選擇問題。資源的本地鏡像存在知識產權問題,也會帶來存儲設備的持久壓力;而遠程訪問又面臨受制于人的尷尬。所以,在區(qū)域內對各種資源的存儲使用方式的協(xié)調統(tǒng)籌,應該多體現(xiàn)“計劃”的色彩,確定好各種資源的保存級別,分清輕重緩急,做到“有取有舍”。
3.3 技術條件復雜引發(fā)的被動
計算機技術、網絡技術牽引著數(shù)字圖書館建設的方向,它們走到哪一步,數(shù)字圖書館跟進到哪一步,“技術推進”原理體現(xiàn)得非常充分。但技術環(huán)境復雜也導致資源組織、資源管理、資源發(fā)布工作運行成本高企,也引發(fā)人文與技術的對抗。商業(yè)數(shù)據(jù)庫由于開發(fā)商不同,往往使用不同的硬件系統(tǒng)和軟件平臺,技術規(guī)范、數(shù)據(jù)標準不一。而自建數(shù)據(jù)庫的質量差異較大,除少數(shù)建設質量較高外,大多存在功能單一或不夠完善,資源收錄不全,后續(xù)管理難以到位等問題。由于商業(yè)數(shù)據(jù)庫的技術異構和自建數(shù)據(jù)庫的質量差異,致使圖書館聯(lián)盟電子資源的共享環(huán)境復雜,資源整合、多館協(xié)作和服務共享等方面存在一定困難,自建特色數(shù)據(jù)庫整合、資源開發(fā)利用、服務評估困難。
3.4 門戶建設的隨意性
門戶建設規(guī)范性不夠,指標分散雜亂,對圖書館工作內容體現(xiàn)的充分程度差異很大,折射出圖書館建設者、管理者對圖書館工作認識上的較大差別。這種認識上的差別對區(qū)域數(shù)字圖書館建設起到了反作用。門戶為用戶提供的服務種類呈現(xiàn)出五花八門、繁簡無序、參差不齊、良莠不分的狀態(tài)。所以,有必要對圖書館工作的服務項目制定一個規(guī)范性的指標,以此引領門戶建設,從而規(guī)范并提升圖書館服務水平。
參考文獻
[1]林芳.數(shù)字圖書館門戶可用性評估指標體系[J].圖書情報工作,2008,(4):25-28.
[2]顏務林 李亞芬.寧波數(shù)字圖書館建設模式與運行機制研究[J].圖書館,2009,(3):84-85.
[3]燕今偉.湖北省高等學校數(shù)字圖書館建設方案及其實施.陜西:PPT,2009-05-21.
[4]徐力文.湖北數(shù)字圖書館區(qū)域合作發(fā)展模式探討[J].圖書館論壇,2003,(5):57-59.
[5]何繼紅.區(qū)域數(shù)字圖書館平臺建設的研究[J].蘇州大學學報,2011,(4):23-27.
[6]白廣思.數(shù)字圖書館平臺建設研究[J].情報理論與實踐,2010,(4):102-105.
[7]電子政務PPT教案[EB].http:∥www.doc88.com/p-968199123979.html
[8]易菲,龍朝陽.基于SOA的數(shù)字圖書館聯(lián)盟信息服務平臺構建[J].圖書館工作與研究,2011,(6):4-7.
[9]肖瓏,等.數(shù)字圖書館門戶的構建與服務[J].大學圖書館學報,2007,(4):41-48.
[10]林芳.數(shù)字圖書館門戶可用性評估指標體系[J].圖書情報工作,2008,(4):25-28.
[11]游雪晴.科技日報[N].2011-09-13.
(本文責任編輯:張麗娟)