黃紅
〔摘 要〕數(shù)字資源建設(shè)成為當(dāng)今圖書(shū)館業(yè)務(wù)建設(shè)工作的重中之重。數(shù)字資源建設(shè)應(yīng)包括數(shù)字資源應(yīng)用和數(shù)字資源存儲(chǔ)2個(gè)方面,滿足這兩方面應(yīng)用需求,是圖書(shū)館能否為社會(huì)大眾提供優(yōu)良的數(shù)字資源服務(wù)的關(guān)鍵。本文結(jié)合圖書(shū)館具體業(yè)務(wù)實(shí)際情況,分析了作為公共圖書(shū)館依托先進(jìn)的“云計(jì)算”“云存儲(chǔ)”架構(gòu),更好地為社會(huì)大眾提供圖書(shū)館數(shù)字資源服務(wù)的思路。
〔關(guān)鍵詞〕“云存儲(chǔ)”;數(shù)字資源建設(shè) ;數(shù)字資源服務(wù);圖書(shū)館
1 公共圖書(shū)館數(shù)字資源建設(shè)背景
信息化社會(huì),數(shù)據(jù)以驚人的速度增長(zhǎng)。每過(guò)18個(gè)月就會(huì)把有史以來(lái)到今天的數(shù)據(jù)總量翻一番,人們對(duì)信息資源的依賴程度已越來(lái)越高。另一項(xiàng)統(tǒng)計(jì),在信息爆炸的今天,互聯(lián)網(wǎng)信息的平均壽命只有42天,也就是說(shuō)在大量信息產(chǎn)生的同時(shí),也有大量的信息消失,其中有許多有價(jià)值的信息因未被有效組織、整序、管理,很容易就失存了。作為公共數(shù)字資源服務(wù)中心的圖書(shū)館,收集、組織、收藏有價(jià)值的信息資源,為廣大讀者提供免費(fèi)的信息服務(wù),減小信息鴻溝,構(gòu)建和諧社會(huì),是公共圖書(shū)館的一項(xiàng)重要職能。
公共圖書(shū)館的數(shù)字資源主要包括如下幾部分:(1)自建數(shù)據(jù)庫(kù)資源;(2)購(gòu)買(mǎi)數(shù)據(jù)庫(kù)資源;(3)按專題收集組織整理的網(wǎng)絡(luò)信息資源。這些資源的類型主要包括:文本、圖片、音視頻等。分析公共圖書(shū)館的資源數(shù)據(jù)性質(zhì),大部分為非結(jié)構(gòu)性數(shù)據(jù),一般占到該館總數(shù)據(jù)量的98%以上。由于互聯(lián)網(wǎng)信息量的急劇膨脹,信息技術(shù)的快速發(fā)展及各館文獻(xiàn)資源數(shù)字化工作力度的加大,筆者對(duì)多家公共圖書(shū)館進(jìn)行了調(diào)研,幾乎每家的存儲(chǔ)空間都不夠用。新建存儲(chǔ),擴(kuò)大存儲(chǔ)容量成為當(dāng)前共公圖書(shū)館的當(dāng)務(wù)之急。結(jié)合圖書(shū)館數(shù)字資源特性,認(rèn)為在圖書(shū)館存儲(chǔ)建設(shè)中,需要考慮以下幾方面因素:(1)要確保數(shù)字資源的安全性;(2)提供資源使用的共享性;(3)要能夠?yàn)閺V大讀者高效快速使用資源提供強(qiáng)大的存儲(chǔ)計(jì)算動(dòng)力;(4)要具有良好的擴(kuò)展功能,根據(jù)圖書(shū)館的資源增加的速度,方便快捷擴(kuò)容的同時(shí)增加計(jì)算能力。所以選擇先進(jìn)的存儲(chǔ)架構(gòu),是圖書(shū)館數(shù)字資源館藏建設(shè)之物理基礎(chǔ)——存儲(chǔ)建設(shè)的關(guān)鍵。
2 數(shù)字資源服務(wù)的物理基礎(chǔ)——“云存儲(chǔ)”
2.1 “云存儲(chǔ)”的概念
“云”存儲(chǔ)是在“云”計(jì)算(Cloud Computing)基礎(chǔ)上延伸和發(fā)展出來(lái)的一個(gè)新概念。它通過(guò)集群應(yīng)用、網(wǎng)格技術(shù)、分布式管理系統(tǒng)、虛擬存儲(chǔ)等技術(shù),將互聯(lián)網(wǎng)“云”中大量各種不同類型的存儲(chǔ)設(shè)備通過(guò)軟件集合起來(lái)協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問(wèn)功能。本文介紹的圖書(shū)館“云存儲(chǔ)”系統(tǒng)是指采用先進(jìn)的云計(jì)算技術(shù)、網(wǎng)絡(luò)通信技術(shù)以及分布式文件系統(tǒng)技術(shù),將廉價(jià)的、性能低下的硬件存儲(chǔ)節(jié)點(diǎn)組織管理起來(lái),提供高性能、高可靠的存儲(chǔ)系統(tǒng)。系統(tǒng)中采用大容量存儲(chǔ)服務(wù)節(jié)點(diǎn),通過(guò)”云存儲(chǔ)”系統(tǒng)軟件實(shí)現(xiàn)統(tǒng)一管理和容錯(cuò),提供高效、穩(wěn)定服務(wù)。
2.2 傳統(tǒng)存儲(chǔ)與“云存儲(chǔ)”之間的區(qū)別
隨著IT技術(shù)的發(fā)展,存儲(chǔ)技術(shù)也有了很大的發(fā)展。目前,按其計(jì)算架構(gòu)的不同我們把存儲(chǔ)分為兩類,一類是傳統(tǒng)存儲(chǔ),另一類是”云存儲(chǔ)”。傳統(tǒng)存儲(chǔ)與”云存儲(chǔ)”的區(qū)別主要表現(xiàn)在4個(gè)方面:(1)網(wǎng)格計(jì)算;(2)分布式文件系統(tǒng);(3)并行計(jì)算擴(kuò)展模式;(4)虛擬資源池。
2.2.1 網(wǎng)格計(jì)算(節(jié)點(diǎn)服務(wù)器驅(qū)動(dòng)模式)
傳統(tǒng)存儲(chǔ)如傳統(tǒng)火車(chē)一樣,動(dòng)力集中在火車(chē)頭上,由兩個(gè)強(qiáng)大的控制器(一主一備),帶動(dòng)一個(gè)大的磁盤(pán)體(火車(chē)車(chē)廂體),當(dāng)廂體數(shù)量多(負(fù)載大)的時(shí)候,相應(yīng)的性能(速度)就會(huì)減弱,達(dá)到一定程度就運(yùn)行不了。所以傳統(tǒng)存儲(chǔ)都有最大容量的限制?!霸拼鎯?chǔ)”架構(gòu)如動(dòng)車(chē),動(dòng)力分散在每一個(gè)節(jié)點(diǎn)服務(wù)器上(如動(dòng)車(chē)的每節(jié)車(chē)廂都有動(dòng)力一樣),一個(gè)節(jié)點(diǎn)服務(wù)器包括一定的磁盤(pán)容量并且?guī)в邢鄳?yīng)的動(dòng)力(CPU、內(nèi)存、網(wǎng)絡(luò)數(shù)據(jù)傳輸卡)。增加磁盤(pán)容量即增加相應(yīng)的動(dòng)力,所以不會(huì)降低運(yùn)行速度和性能,確保了存儲(chǔ)對(duì)外服務(wù)的能力。
采用傳統(tǒng)的存儲(chǔ)設(shè)備進(jìn)行數(shù)字資源存儲(chǔ),其容量是有限的。因?yàn)閭鹘y(tǒng)的存儲(chǔ)方式采用串行擴(kuò)容,擴(kuò)容只增加磁盤(pán)空間不增加動(dòng)力源。所以最大擴(kuò)容值是有限的,擴(kuò)容后整個(gè)存儲(chǔ)的性能必定會(huì)下降。不管它接多少擴(kuò)展箱,總是有個(gè)極限有,并且過(guò)了兩、三年后就找不到與原磁盤(pán)品牌、接口、型號(hào)等完全相同的磁盤(pán),只有新購(gòu)存儲(chǔ)。但是”云存儲(chǔ)”可以為用戶提供無(wú)限的存儲(chǔ)空間。因?yàn)椤痹拼鎯?chǔ)”采取的架構(gòu)是并行擴(kuò)容,可以允許存儲(chǔ)服務(wù)器和存儲(chǔ)節(jié)點(diǎn)同時(shí)增加,容量不夠了,只要采購(gòu)新的存儲(chǔ)節(jié)點(diǎn)服務(wù)器即可,容量立即增加,增加相應(yīng)磁盤(pán)容量時(shí),相應(yīng)的計(jì)算動(dòng)力(CPU、內(nèi)存)、網(wǎng)絡(luò)傳輸能力都同時(shí)配套增加,不影響服務(wù)性能,理論上可擴(kuò)到極大空間。更重要的是“云”還可提供動(dòng)態(tài)的可擴(kuò)展性,實(shí)現(xiàn)非破壞性的增長(zhǎng)和升級(jí)。也即是說(shuō)存儲(chǔ)的容量隨著節(jié)點(diǎn)的增加而無(wú)縫增長(zhǎng)。這有利于維護(hù)數(shù)字資源的連續(xù)性和完整性,同時(shí)也有利于降低用戶成本,保護(hù)了用戶投資。
2.2.3 分布式文件系統(tǒng)
“云存儲(chǔ)”采用的是分布式文件系統(tǒng)。分布式文件系統(tǒng)是指文件系統(tǒng)管理的物理存儲(chǔ)資源不一定直接連接在本地節(jié)點(diǎn)上,而是通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)與節(jié)點(diǎn)相連?!霸拼鎯?chǔ)”系統(tǒng)的文件復(fù)本按算法隨機(jī)地存放到其它節(jié)點(diǎn)服務(wù)器上,一個(gè)節(jié)點(diǎn)服務(wù)器(十多塊磁盤(pán))全都?jí)牧?,也不影響?shù)據(jù)的安全和使用。安全性極高。傳統(tǒng)存儲(chǔ)按RAID組進(jìn)行劃分,一組盤(pán)中最多只能壞兩塊盤(pán)。壞掉的盤(pán)需要有熱備盤(pán)頂上,否則就會(huì)影響數(shù)據(jù)安全。
2.2.4 共享虛擬存儲(chǔ)池
“存儲(chǔ)虛擬化”是一種邏輯存儲(chǔ)形式,將分散的存儲(chǔ)資源整合抽象成一個(gè)單一的邏輯資源,使得管理員僅對(duì)一個(gè)單一的存儲(chǔ)資源進(jìn)行智能化有效地管理存儲(chǔ)數(shù)據(jù)。虛擬化將存儲(chǔ)資源的物理特性掩蓋起來(lái),用戶感覺(jué)到的存儲(chǔ)資源是巨大的,可以自由調(diào)配的。這樣用戶不再關(guān)心存儲(chǔ)資源的物理結(jié)構(gòu),簡(jiǎn)化了管理過(guò)程。并且可以根據(jù)使用需求和實(shí)際情況,擴(kuò)大或減小存儲(chǔ)空間。傳統(tǒng)存儲(chǔ)按RAID進(jìn)行組劃分,各組的空間量也不能隨意增加減少,即使一組容量不夠,另一組有多余,也不能根據(jù)需求調(diào)配,管理使用都不方便?!按鎯?chǔ)虛擬化”克服了傳統(tǒng)數(shù)據(jù)存儲(chǔ)過(guò)程的局限性,能夠更加充分地利用異構(gòu)平臺(tái)的海量存儲(chǔ)空間和高效的數(shù)據(jù)傳輸能力,從而為用戶提供一個(gè)容量大、數(shù)據(jù)傳輸性能高的存儲(chǔ)系統(tǒng),較好地實(shí)現(xiàn)數(shù)字資源的共享目的。
3 “云存儲(chǔ)”在圖書(shū)館數(shù)字資源服務(wù)中的應(yīng)用
3.1 “云存儲(chǔ)”與圖書(shū)館數(shù)字資源門(mén)戶的關(guān)系
圖書(shū)館數(shù)字門(mén)戶通過(guò)已有的數(shù)字資源服務(wù),業(yè)務(wù)服務(wù),展現(xiàn)層組件,借助界面建模和規(guī)則引擎實(shí)現(xiàn)靈活的應(yīng)用組裝,而不僅僅是簡(jiǎn)單的服務(wù)集成。其重點(diǎn)包括兩個(gè)內(nèi)容,一個(gè)是“找到服務(wù)”,一個(gè)是“編排服務(wù)”?!罢业椒?wù)”重點(diǎn)是服務(wù)分析識(shí)別方法,同時(shí)保證服務(wù)的自治性,粗粒度和可重用性等;“編排服務(wù)”重點(diǎn)是服務(wù)通過(guò)編排能夠滿足業(yè)務(wù)和流程的需要。如圖1所示。
服務(wù)本身是一種能力,圖書(shū)館數(shù)字資源服務(wù)門(mén)戶是一個(gè)集成平臺(tái),其本身并不產(chǎn)生能力,數(shù)字資源服務(wù)門(mén)戶本身不存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù),它的主要作用是消息協(xié)議轉(zhuǎn)化,路由和數(shù)據(jù)的傳輸。圖書(shū)館數(shù)字門(mén)戶服務(wù)目錄庫(kù)能力來(lái)源于業(yè)務(wù)系統(tǒng),業(yè)務(wù)系統(tǒng)提供服務(wù)注冊(cè)到圖書(shū)館數(shù)字門(mén)戶的服務(wù)目錄庫(kù)中,因此圖書(shū)館數(shù)字門(mén)戶更多是能力集成平臺(tái)??梢詫I(yè)務(wù)系統(tǒng)各個(gè)層面的能力轉(zhuǎn)化為數(shù)據(jù)服務(wù),業(yè)務(wù)服務(wù)和展現(xiàn)層服務(wù)。通過(guò)圖書(shū)館數(shù)字門(mén)戶來(lái)集成這些服務(wù),提供統(tǒng)一的服務(wù)目錄庫(kù)來(lái)屏蔽底層數(shù)字資源系統(tǒng)。
對(duì)于“云存儲(chǔ)”則根據(jù)強(qiáng)調(diào)能力的集中化,特別是原有數(shù)字資源系統(tǒng),原有數(shù)據(jù)庫(kù)資源具備的能力要全部遷移到“云存儲(chǔ)”中,然后由“云存儲(chǔ)”平臺(tái)提供這種能力,調(diào)配這種能力。將每個(gè)數(shù)據(jù)應(yīng)用系統(tǒng)(服務(wù))集中到“云存儲(chǔ)”來(lái)統(tǒng)一建設(shè)和管理。建設(shè)完成后再通過(guò)服務(wù)化方式提供出去。如果說(shuō)傳統(tǒng)備份存儲(chǔ)主要是用犧牲性能換取安全,“云存儲(chǔ)”則是在可預(yù)見(jiàn)的安全策略下,在保持原有數(shù)據(jù)庫(kù)系統(tǒng)功能的基礎(chǔ)上,增強(qiáng)了數(shù)據(jù)讀取能力,從呈現(xiàn)對(duì)外服務(wù)的角度上,增強(qiáng)了數(shù)據(jù)服務(wù)能力。圖1 “云存儲(chǔ)”與圖書(shū)館數(shù)字資源門(mén)戶的關(guān)系
3.2 “云存儲(chǔ)”對(duì)圖書(shū)館數(shù)字資源建設(shè)的影響
3.2.1 有利于增強(qiáng)數(shù)字資源信息的安全性
“云存儲(chǔ)”把信息和數(shù)據(jù)存儲(chǔ)在不同的節(jié)點(diǎn)服務(wù)器上,自動(dòng)生成數(shù)據(jù)備份,一旦磁盤(pán)損壞,系統(tǒng)會(huì)自動(dòng)再生成數(shù)據(jù)備份在不同的節(jié)點(diǎn)服務(wù)器上,確保了數(shù)據(jù)安全?!霸拼鎯?chǔ)”易于實(shí)現(xiàn)數(shù)據(jù)備份或遷移,使數(shù)據(jù)能及時(shí)得到恢復(fù)。
3.2.2 有利于數(shù)字資源中心進(jìn)行數(shù)據(jù)處理
“云存儲(chǔ)”則能很好解決海量數(shù)據(jù)的計(jì)算處理和分析。因?yàn)椤霸拼鎯?chǔ)”能將分布在各個(gè)地方的聯(lián)網(wǎng)計(jì)算機(jī)連接在一起,用戶所需要做的只是通過(guò)客戶端發(fā)出要求計(jì)算的指令,“云存儲(chǔ)”中所應(yīng)用的網(wǎng)格技術(shù)就把這些任務(wù)調(diào)配給各個(gè)計(jì)算機(jī)執(zhí)行,接著將各個(gè)計(jì)算機(jī)計(jì)算出來(lái)的結(jié)果匯總反饋給用戶,而且連接的計(jì)算機(jī)規(guī)模越大,其計(jì)算能力就越高。
3.2.3 有利于數(shù)字資源利用實(shí)現(xiàn)信息共享
開(kāi)放性是“云存儲(chǔ)”系統(tǒng)的一個(gè)重要特征,“云存儲(chǔ)“通過(guò)開(kāi)放融合,具備異構(gòu)平臺(tái)數(shù)據(jù)共享、多種協(xié)議支持、多種接口支持以及靈活的存取控制等特性。在“云存儲(chǔ)”中,信息被統(tǒng)一管理和使用,利用現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)設(shè)施為用戶提供一體化的智能信息平臺(tái),雖然信息被存儲(chǔ)在不同的位置,但是對(duì)于訪問(wèn)者來(lái)說(shuō),可以不必理會(huì)這些信息的存儲(chǔ)位置,用戶可以通過(guò)網(wǎng)格操作系統(tǒng)透明地使用整個(gè)數(shù)字資源中心的網(wǎng)絡(luò)信息資源,從而很好地解決了異構(gòu)信息的共享互連和互操作問(wèn)題,提高數(shù)字資源信息資源共享的程度。
4 總 結(jié)
“云計(jì)算”“云存儲(chǔ)”是一種很成熟的技術(shù)架構(gòu),是大規(guī)模數(shù)據(jù)應(yīng)用的必然選擇,GOOGLE、360、亞馬遜、阿里巴巴都有成功案例。它安全、可靠、節(jié)能、大大降底管理成本,這種科學(xué)架構(gòu)的宗旨是保護(hù)前期投資,兼容以往的投資環(huán)境,發(fā)揮集約的功效,產(chǎn)生“1+1>2”能效,目前在世界范圍內(nèi)形成一種應(yīng)用趨勢(shì),也是今后計(jì)算機(jī)存儲(chǔ)應(yīng)用的必由之路。
建立在“云存儲(chǔ)”技術(shù)架構(gòu)上的圖書(shū)館數(shù)字資源服務(wù),不僅解決了當(dāng)前公共圖書(shū)館面臨的數(shù)字資源存儲(chǔ)空間的不足,并行的擴(kuò)展方式保護(hù)了圖書(shū)館前期投資,使資源能夠長(zhǎng)期保存下去,同時(shí)也是對(duì)圖書(shū)館服務(wù)形式和方法上的升級(jí),拓展了公共圖書(shū)館數(shù)字門(mén)戶的服務(wù)能力,也是在圖書(shū)館學(xué)領(lǐng)域,信息傳播學(xué)領(lǐng)域理論和實(shí)踐的具體踐行,是未來(lái)發(fā)展的必由之路。
參考文獻(xiàn)
[1]范并思.云計(jì)算與圖書(shū)館:為云計(jì)算研究辯護(hù)[J].圖書(shū)情報(bào)工作,2009,53(11):5-8.
[2]劉鵬.云計(jì)算(第2版)[M].北京:電子工業(yè)出版社,2011.5.
[3]黃燕.云存儲(chǔ)在圖書(shū)館數(shù)字資源存儲(chǔ)中的應(yīng)用[J].現(xiàn)代情報(bào), 2011,31(4):68-70.
[4]袁建娟.存儲(chǔ)架構(gòu)的演變與數(shù)字圖書(shū)館的發(fā)展[J].情報(bào)探索,2008,124(2):54-55.
[5]高海峰,任樹(shù)懷.Web20技術(shù)在高校圖書(shū)館學(xué)科建設(shè)中的應(yīng)用[J].圖書(shū)情報(bào)工作,2007,51(4):115-118.
[6]梁曉歡.CloudArrayTwinStrata云存儲(chǔ)技術(shù)分析[J].全球IT新浪潮,2012,(5):5-7.
(本文責(zé)任編輯:馬 卓)