譚畔 袁慧
[摘? ? 要] 隨著時(shí)代的發(fā)展,傳統(tǒng)圖書(shū)館的數(shù)據(jù)存儲(chǔ)與處理模式無(wú)法滿足人們?nèi)找嬖鲩L(zhǎng)的快捷化需求,將云計(jì)算技術(shù)引入圖書(shū)館的數(shù)據(jù)管理技術(shù)中,會(huì)大幅提高圖書(shū)館的運(yùn)行效率,這也是將來(lái)圖書(shū)館數(shù)據(jù)管理技術(shù)的發(fā)展方向,文章在如何將云計(jì)算技術(shù)引入圖書(shū)館數(shù)據(jù)管理途徑方面進(jìn)行了初步研究。
[關(guān)鍵詞] 云計(jì)算;圖書(shū)館;數(shù)據(jù)存儲(chǔ);技術(shù)
0? ? ? 引? ? 言
隨著網(wǎng)絡(luò)信息服務(wù)的發(fā)展和數(shù)字信息資源的增長(zhǎng),人們?cè)谧非笮畔⒋鎯?chǔ)容量擴(kuò)增的同時(shí),也越來(lái)越關(guān)注信息存儲(chǔ)的有效性、安全性和便捷性等問(wèn)題。圖書(shū)館作為信息資源的匯集中心,每天要存貯處理大量的數(shù)據(jù),若將云計(jì)算技術(shù)引入圖書(shū)館的數(shù)據(jù)管理技術(shù)中,與互聯(lián)網(wǎng)技術(shù)相結(jié)合,可有效實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)、使用、共享,滿足用戶日益增長(zhǎng)的服務(wù)需求。
1? ? ? 云計(jì)算技術(shù)概述
云計(jì)算(Cloud Computing)是分布式計(jì)算的一種,是指通過(guò)網(wǎng)絡(luò)“云”將巨大的數(shù)據(jù)計(jì)算處理程序分解成無(wú)數(shù)個(gè)小程序,然后,通過(guò)多部服務(wù)器組成的系統(tǒng)進(jìn)行處理和分析這些小程序,得到結(jié)果并返回給用戶。云計(jì)算早期,簡(jiǎn)單地說(shuō),就是簡(jiǎn)單的分布式計(jì)算,解決任務(wù)分發(fā),并進(jìn)行計(jì)算結(jié)果的合并。因而,云計(jì)算又稱(chēng)為網(wǎng)格計(jì)算。通過(guò)這項(xiàng)技術(shù),可以在很短的時(shí)間(幾秒鐘)內(nèi)完成對(duì)數(shù)以萬(wàn)計(jì)的數(shù)據(jù)的處理,從而達(dá)到強(qiáng)大的網(wǎng)絡(luò)服務(wù)。
現(xiàn)階段所說(shuō)的云服務(wù)已經(jīng)不單單是一種分布式計(jì)算,而是分布式計(jì)算、效用計(jì)算、負(fù)載均衡、并行計(jì)算、網(wǎng)絡(luò)存儲(chǔ)、熱備份冗雜和虛擬化等計(jì)算機(jī)技術(shù)混合演進(jìn)并躍升的結(jié)果。
與傳統(tǒng)網(wǎng)絡(luò)應(yīng)用模式相比,云計(jì)算技術(shù)具有可虛擬化、可動(dòng)態(tài)擴(kuò)展、按需部署、靈活性高、可靠性高、性價(jià)比高等優(yōu)勢(shì)與特點(diǎn)。
2? ? ? 傳統(tǒng)圖書(shū)館數(shù)據(jù)存儲(chǔ)中的問(wèn)題
傳統(tǒng)圖書(shū)館數(shù)據(jù)存儲(chǔ)常存在以下四個(gè)方面問(wèn)題:
(1)空間要求高。傳統(tǒng)圖書(shū)館是存儲(chǔ)實(shí)體圖書(shū),占地面積大,如果要保證圖書(shū)數(shù)量就要保證圖書(shū)館有十分龐大的空間。同時(shí),圖書(shū)館藏書(shū)量由于受到資金和建筑物空間格局限制,不得不減緩新書(shū)上架,或是加快老圖書(shū)下架,這兩種情況都會(huì)給使用者造成不便。
(2)維護(hù)成本高。圖書(shū)館里的圖書(shū)種類(lèi)數(shù)量龐大,不管是新增書(shū)籍、下架書(shū)籍還是在架書(shū)籍,它們的日常維護(hù)都是十分煩瑣的事情,而這正是圖書(shū)館日常進(jìn)行的事務(wù),因此會(huì)消耗大量的人力、物力、財(cái)力。
(3)搜索查閱困難。雖然在圖書(shū)館內(nèi)不同的書(shū)籍都有不同的分區(qū),但是每個(gè)讀者能按照分區(qū),快速瀏覽查閱到想要的圖書(shū)并不是件容易的事情。這需要對(duì)圖書(shū)分區(qū)比較熟悉,而且找到了相似書(shū)籍后,從中選擇也很麻煩,需要一本本翻閱書(shū)中內(nèi)容。
(4)圖書(shū)保護(hù)不易。傳統(tǒng)圖書(shū)館存儲(chǔ)和借閱的都是實(shí)體書(shū)籍,在保管、借閱過(guò)程中難免會(huì)造成圖書(shū)的破損、毀壞、丟失等問(wèn)題,給圖書(shū)館帶來(lái)?yè)p失,存儲(chǔ)的安全性不高。
3? ? ? 云計(jì)算引入圖書(shū)館信息管理的優(yōu)勢(shì)
(1)成本低。傳統(tǒng)的圖書(shū)館需要對(duì)實(shí)體圖書(shū)進(jìn)行存儲(chǔ)、排放、維護(hù),而使用云計(jì)算技術(shù),一切過(guò)程都可電子化。首先,圖書(shū)資源都電子化,節(jié)省了空間;其次,查閱都網(wǎng)絡(luò)、可視化,只要網(wǎng)絡(luò)技術(shù)達(dá)到,就可快速地檢索、閱讀、下載,都是電子資源,不需要紙質(zhì)形式,大大節(jié)約了人力、物力成本。
(2)容量大。在當(dāng)前互聯(lián)網(wǎng)環(huán)境下,應(yīng)用云計(jì)算技術(shù),圖書(shū)館的信息容量可以進(jìn)一步擴(kuò)展,不僅包含現(xiàn)有的專(zhuān)業(yè)技術(shù)領(lǐng)域的圖書(shū)資源,也可快速鏈接到相關(guān)應(yīng)用領(lǐng)域,如社會(huì)文化、教育培訓(xùn)、傳媒、咨詢、電子政務(wù)等,它具備一種信息中轉(zhuǎn)站的職能。這正是云計(jì)算海量存儲(chǔ)技術(shù)所起的作用。
(3)容錯(cuò)能力強(qiáng)。在存儲(chǔ)過(guò)程中,圖書(shū)館海量的存儲(chǔ)數(shù)據(jù)難免有數(shù)據(jù)丟失、轉(zhuǎn)移失敗、響應(yīng)異常等故障發(fā)生,只要在云存儲(chǔ)軟件層中,增強(qiáng)計(jì)算數(shù)據(jù)的存儲(chǔ)容錯(cuò)能力,就能使系統(tǒng)繼續(xù)執(zhí)行海量的存儲(chǔ)指令,保障系統(tǒng)發(fā)揮最大效能。
(4)存儲(chǔ)性能穩(wěn)定。云計(jì)算的圖書(shū)數(shù)據(jù)是以數(shù)據(jù)化的形式存儲(chǔ)在網(wǎng)絡(luò)平臺(tái)或其他服務(wù)器中。云存儲(chǔ)指的不是一個(gè)特定的存儲(chǔ)設(shè)備,它是多個(gè)存儲(chǔ)設(shè)備與服務(wù)器的集合。正是由于云計(jì)算的不依賴于任何一個(gè)物質(zhì)實(shí)體,不會(huì)因?yàn)橐粋€(gè)存儲(chǔ)設(shè)備出故障而停止運(yùn)行的獨(dú)特的存儲(chǔ)方式,所以,它的穩(wěn)定性相對(duì)來(lái)講更為良好。
4? ? ? 云計(jì)算應(yīng)用于圖書(shū)館數(shù)據(jù)管理的技術(shù)途徑
基于云計(jì)算獨(dú)特優(yōu)良的數(shù)據(jù)存儲(chǔ)技術(shù),將云計(jì)算引入圖書(shū)館的數(shù)據(jù)存儲(chǔ)管理,可大大提高圖書(shū)館的運(yùn)行效能,可從以下幾個(gè)技術(shù)途徑實(shí)施。
4.1? ?分布式和冗余存儲(chǔ)技術(shù)
分布式存儲(chǔ)是云計(jì)算中針對(duì)大量數(shù)據(jù)采用的主流存儲(chǔ)技術(shù),它根據(jù)數(shù)據(jù)類(lèi)型,通常分為塊存儲(chǔ)、對(duì)象存儲(chǔ)和文件存儲(chǔ),例如HDFS/GPFS/GFS技術(shù)屬于文件存儲(chǔ),Swift技術(shù)屬于對(duì)象存儲(chǔ),Ceph支持以上三種存儲(chǔ)方式,稱(chēng)為統(tǒng)一存儲(chǔ)。這些存儲(chǔ)技術(shù),能夠?qū)?shù)據(jù)采用大規(guī)模集群算法,實(shí)現(xiàn)數(shù)據(jù)的快速、準(zhǔn)確存放,同時(shí)能夠在硬件故障或擴(kuò)展硬件設(shè)備時(shí),做到盡可能小的數(shù)據(jù)遷移。例如Ceph技術(shù),采用crush算法,將每個(gè)object得到的pgid進(jìn)行篩選找出符合要求的OSD,將數(shù)據(jù)分布的查詢變成計(jì)算操作,使系統(tǒng)能夠平均分布數(shù)據(jù)和負(fù)載,解決了中心服務(wù)器性能上的技術(shù)瓶頸。再如Swift技術(shù)采用完全對(duì)稱(chēng)、面向資源系統(tǒng)的架構(gòu)設(shè)計(jì),所有組件都可擴(kuò)展,避免因單點(diǎn)失效而影響整個(gè)系統(tǒng)的可用性。
冗余存儲(chǔ)技術(shù)是使用一組或多組附加驅(qū)動(dòng)器存儲(chǔ)數(shù)據(jù)的副本,比如鏡像就是一種數(shù)據(jù)冗余技術(shù)。分布式存儲(chǔ)系統(tǒng)中的冗余機(jī)制可以調(diào)高數(shù)據(jù)的可用性和系統(tǒng)的可靠性。數(shù)據(jù)的可用性是指把同一數(shù)據(jù)存儲(chǔ)在多個(gè)不同節(jié)點(diǎn)上,即使個(gè)別節(jié)點(diǎn)數(shù)據(jù)丟失,剩余其他節(jié)點(diǎn)數(shù)據(jù)也可實(shí)現(xiàn)數(shù)據(jù)重構(gòu)。系統(tǒng)的可靠性是通過(guò)數(shù)據(jù)的冗余和存儲(chǔ)節(jié)點(diǎn)的協(xié)作來(lái)保證。
因此,分布式存儲(chǔ)可提高圖書(shū)館海量存儲(chǔ)數(shù)據(jù)的有序,冗余式存儲(chǔ)可提高存儲(chǔ)的可靠性。通過(guò)云計(jì)算,將圖書(shū)館所有數(shù)字資源存儲(chǔ)在“云”中,并由“云”來(lái)管理和調(diào)度,能夠快速有效地獲取資源。
4.2? ?動(dòng)態(tài)資源調(diào)度共享技術(shù)
雖然云計(jì)算是在傳統(tǒng)分布式計(jì)算、并行式計(jì)算等基礎(chǔ)上發(fā)展起來(lái)的,但它比傳統(tǒng)計(jì)算更復(fù)雜、更綜合,呈現(xiàn)動(dòng)態(tài)、智能化特征。
由于云計(jì)算中業(yè)務(wù)眾多,任務(wù)類(lèi)型眾多,如果將所有用戶應(yīng)用程序的調(diào)度都置于相同框架下,所產(chǎn)生的調(diào)度結(jié)果對(duì)于用戶來(lái)說(shuō)通常并不是最優(yōu)的。因此,需要從任務(wù)類(lèi)型角度出發(fā),選擇不同的調(diào)度策略。在調(diào)度過(guò)程中,由于任務(wù)的執(zhí)行,會(huì)改變資源的消耗類(lèi)型,因而任務(wù)類(lèi)型也會(huì)隨之發(fā)生變化。比如用戶向圖書(shū)館系統(tǒng)請(qǐng)求圖書(shū)資源,系統(tǒng)會(huì)調(diào)度請(qǐng)求讀取磁盤(pán)分區(qū)的圖書(shū)資源,當(dāng)圖書(shū)資源引用的有網(wǎng)絡(luò)資源,則會(huì)產(chǎn)生網(wǎng)絡(luò)資源調(diào)度請(qǐng)求。如果靜態(tài)進(jìn)行資源分配和調(diào)度,往往會(huì)造成資源的不足或浪費(fèi);如果進(jìn)行人工動(dòng)態(tài)資源調(diào)整,又會(huì)有著明顯的滯后性。因此圖書(shū)館系統(tǒng)需要不斷地實(shí)時(shí)監(jiān)控任務(wù)執(zhí)行狀態(tài),通過(guò)任務(wù)資源的消耗類(lèi)型,動(dòng)態(tài)地調(diào)整任務(wù)類(lèi)型,合理配置虛擬機(jī),均衡使用各種資源(CPU、內(nèi)存、磁盤(pán)、I/O、網(wǎng)絡(luò)),避免出現(xiàn)單一資源瓶頸,提升虛擬機(jī)密度,消除熱點(diǎn),提高業(yè)務(wù)處理能力,實(shí)現(xiàn)硬件資源最大化共享,最大化提升調(diào)度效率。
云計(jì)算環(huán)境下,圖書(shū)館的各種資源借由一朵“云”結(jié)合起來(lái),通過(guò)虛擬機(jī)內(nèi)部的計(jì)算,實(shí)現(xiàn)調(diào)度內(nèi)容的融合、信息共享,通過(guò)模糊匹配、分析計(jì)算,根據(jù)用戶指令輸出所需內(nèi)容。它是云計(jì)算的核心技術(shù),是動(dòng)態(tài)的、智能化的。
4.3? ?多用戶資源訪問(wèn)技術(shù)
多用戶簡(jiǎn)單來(lái)說(shuō)是指一個(gè)單獨(dú)的資源可以為多個(gè)用戶服務(wù)。多用戶技術(shù)是指,在共用的數(shù)據(jù)中心內(nèi),以一個(gè)單一的系統(tǒng)架構(gòu)為多個(gè)客戶端提供服務(wù),甚至是定制化的服務(wù),同時(shí)仍然保障用戶數(shù)據(jù)的隔離。圖書(shū)館資源往往需要滿足多用戶訪問(wèn),因此采用多用戶技術(shù),對(duì)系統(tǒng)的數(shù)據(jù)和配置進(jìn)行合理虛擬分區(qū),使系統(tǒng)的每個(gè)用戶或者組織都能夠使用一個(gè)共同的系統(tǒng)資源,實(shí)現(xiàn)多用戶在同時(shí)訪問(wèn)相同圖書(shū)資源時(shí),保證圖書(shū)系統(tǒng)共性的部分被共享,個(gè)性的部分被單獨(dú)隔離,確保多用戶在同時(shí)訪問(wèn)、閱讀或者同時(shí)下載時(shí),系統(tǒng)的安全性與穩(wěn)定性。通過(guò)在多個(gè)用戶之間的資源復(fù)用,運(yùn)營(yíng)管理維護(hù)資源,有效節(jié)省云計(jì)算圖書(shū)館開(kāi)發(fā)應(yīng)用的成本。而且,在用戶之間共享應(yīng)用程序資源,可以實(shí)現(xiàn)當(dāng)應(yīng)用程序升級(jí)時(shí),所有用戶同時(shí)升級(jí)。同時(shí),因?yàn)槎鄠€(gè)用戶共享一份系統(tǒng)的核心代碼,當(dāng)系統(tǒng)升級(jí)時(shí),只需升級(jí)相同的核心代碼,簡(jiǎn)捷省力。
為了滿足多用戶對(duì)數(shù)據(jù)的操作,云計(jì)算的數(shù)據(jù)存儲(chǔ)必須具備高吞吐率和高傳輸率;同時(shí)云計(jì)算要求硬件資源與軟件資源能夠很好地被共享,需具備良好的伸縮性,因此多用戶技術(shù)在云計(jì)算圖書(shū)館的數(shù)據(jù)存儲(chǔ)系統(tǒng)開(kāi)發(fā)中必不可少。
5? ? ? 結(jié)? ? 語(yǔ)
云計(jì)算技術(shù)是構(gòu)建現(xiàn)代數(shù)字圖書(shū)館資源的重要技術(shù)支撐,也是網(wǎng)絡(luò)信息時(shí)代社會(huì)發(fā)展的新思路。在圖書(shū)館管理的各項(xiàng)環(huán)節(jié)中,應(yīng)用云計(jì)算存儲(chǔ)技術(shù)可以有效提高管理能效,解決圖書(shū)館大部分功能難題。將大量圖書(shū)資源在云存儲(chǔ)環(huán)境中充分利用,會(huì)讓新型數(shù)字圖書(shū)館體系更符合現(xiàn)代人們對(duì)于文化知識(shí)、社會(huì)資訊、網(wǎng)絡(luò)信息等社會(huì)公共服務(wù)項(xiàng)目的需求,改變?nèi)藗兊纳罘绞健?/p>
主要參考文獻(xiàn)
[1]黎春蘭,鄧仲華.論云計(jì)算的價(jià)值COD[J].圖書(shū)與情報(bào),2009(4):42-46.
[2]許子明,田楊鋒.云計(jì)算的發(fā)展歷史及其應(yīng)用[J].信息記錄材料,2018,19(8):66-67.
[3]徐小龍,吳家興,楊庚,等.基于大規(guī)模廉價(jià)計(jì)算平臺(tái)的海量數(shù)據(jù)處理系統(tǒng)的研究[J].計(jì)算機(jī)應(yīng)用研究,2012,10(20):119-121.
[4]趙宏偉,宋寶燕,邵一川.云計(jì)算環(huán)境下的一種高效的資源管理策略[J].計(jì)算機(jī)科學(xué),2012,6(12):1-6.
[5]李文軍.計(jì)算機(jī)云計(jì)算及其實(shí)現(xiàn)技術(shù)分析[J].軍民兩用技術(shù)與產(chǎn)品,2018(22):57-58.
[6]晉征.云計(jì)算技術(shù)在圖書(shū)館中的應(yīng)用探討[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2015(4):63-64.