李 琳
(湖南環(huán)境生物職業(yè)技術(shù)學(xué)院,湖南 衡陽 421005)
目前,國內(nèi)圖書館的數(shù)字化管理系統(tǒng)依然處于初級嘗試階段,很多圖書館的管理系統(tǒng)就是設(shè)計了一系列的查找與相關(guān)文獻(xiàn)資料的電子版就對外統(tǒng)稱為數(shù)字化管理系統(tǒng),該操作既顯得不專業(yè)又并非真正意義上的數(shù)字化圖書管理系統(tǒng),數(shù)字化圖書管理系統(tǒng)(如圖1 所示)應(yīng)該是一款集精確查找、文獻(xiàn)聯(lián)想、相關(guān)查詢、模糊查詢、資料統(tǒng)計、大數(shù)據(jù)分析、同步文獻(xiàn)上傳以及分布式存儲等多種功能于一體的管理系統(tǒng),并不是簡簡單單的查詢系統(tǒng)就可以代表數(shù)字化圖書館管理系統(tǒng)[1]。
圖1 數(shù)字化圖書館的技術(shù)應(yīng)用
該文研究的數(shù)字化圖書管理系統(tǒng)結(jié)合大數(shù)據(jù)與云存儲的相關(guān)技術(shù),實(shí)現(xiàn)了6 個優(yōu)勢功能,包括智能查詢功能、文獻(xiàn)聯(lián)想功能、資料統(tǒng)計功能、大數(shù)據(jù)用戶分析、文獻(xiàn)同步上傳以及云端進(jìn)度功能等多種系統(tǒng)架構(gòu),完成了對數(shù)字化圖書管理系統(tǒng)的一次革新。同時該系統(tǒng)將主要解決目前圖書館管理中存在的諸多問題,例如館藏管理混亂、圖書遺失補(bǔ)充、館藏追索困難、館藏圖書分類、孤本善本管理保存以及電子版出借等多種疑難問題。
數(shù)字化圖書管理系統(tǒng)研究設(shè)計的系統(tǒng)架構(gòu)可以利用大數(shù)據(jù)進(jìn)行整理與分類歸納,實(shí)現(xiàn)主動上傳圖書館館藏掃描結(jié)果的功能,并可以同步并網(wǎng)吸納相關(guān)數(shù)據(jù)文獻(xiàn);同時嵌入云計算相應(yīng)的甄別與計算功能,完善圖書館分類與聯(lián)想推送功能,為用戶提供定制的閱讀管理時間表與閱讀相關(guān)推薦。此外,外部展示頁面由雙端口組成,管理端口直接對接數(shù)字化圖書管理系統(tǒng)管理員及相關(guān)負(fù)責(zé)人,而用戶端口則對接圖書館相應(yīng)會籍人員。
該文研究的數(shù)字化圖書管理系統(tǒng)總共分為以下5 個模塊:圖書館藏管理模塊、基于區(qū)塊鏈的會籍管理模塊、云端文獻(xiàn)資料存儲模塊、大數(shù)據(jù)分析模塊以及智能查詢模塊;這5 個模塊的一體化應(yīng)用整體構(gòu)建成了數(shù)字化圖書管理系統(tǒng),下面將一一列舉數(shù)字化圖書管理系統(tǒng)的5 個模塊。
數(shù)字化圖書館管理系統(tǒng)最重要的模塊就是館藏管理模塊,但是在建設(shè)系統(tǒng)之初,很多數(shù)字化圖書館都容易走入誤區(qū),片面地強(qiáng)調(diào)館藏管理或者單一打造數(shù)字化館藏管理是不正確的,但是不可否認(rèn),該模塊是數(shù)字化圖書館管理系統(tǒng)的核心組成模塊,該模塊的館藏管理分為2 個方面,一方面是針對館藏實(shí)體書籍的管理,包括了館藏書籍的位置擺放、書籍的精準(zhǔn)定位、書籍的出借等級、書籍的價格、書籍遺失或損壞后的新增以及修復(fù)等各個方面。另一方面是館藏圖書的數(shù)據(jù)化環(huán)節(jié),主要包括書籍資料的電子化、其他類型文獻(xiàn)的數(shù)據(jù)化,特別是針對孤本、善本以及具有紀(jì)念價值或者收藏價值的書籍,館藏管理模塊在保存電子文獻(xiàn)資料的同時,還會生成實(shí)體書籍的特別保管方式,根據(jù)環(huán)境和周邊氣候的變化,例如過于干燥、潮濕以及南方梅雨季節(jié)等都需要及時對書籍的保存管理方式作出更改[2]。
例如該模塊建立的天氣抓取技術(shù),主要依托在線信息模塊在Linux(Linux,全稱GNU/Linux,是一種免費(fèi)使用和自由傳播的類UNIX 操作系統(tǒng))系統(tǒng)下,利用Wireshark(Wireshark(前稱Ethereal)是一個網(wǎng)絡(luò)封包分析軟件)抓包工具抓取天氣信息并對數(shù)據(jù)進(jìn)行解析處理,得到真正有用的關(guān)鍵信息并顯示出來。該模塊下的天氣組件主要分為3 個小模塊:1)實(shí)時天氣信息。對時下天氣進(jìn)行整理整合。2)未來天氣信息預(yù)警。針對南方梅雨季節(jié)以及北方暴雨季等問題進(jìn)行防范。3)歷史天氣信息。綜合考量時間段內(nèi)的天氣預(yù)防措施,前端屏幕顯示部分主要生成的是相關(guān)解決方案并直接由代碼推送到前端顯示。以未來天氣信息預(yù)判抓取為例,首先,創(chuàng)建一個用來通信的套接字文件描述符;其次,可以發(fā)送三次握手鏈接請求(TCP 協(xié)議);最終,發(fā)送請求報文,先在Linux 系統(tǒng)下打開抓包工具,等待抓取,再用火狐打開要查找信息的網(wǎng)址,找到相應(yīng)報文并復(fù)制,一般發(fā)送6 種信息,利用sprintf(sprintf 指的是字符串格式化命令)將其拼接起來再發(fā)送,并從接收端獲取相應(yīng)的數(shù)據(jù),因?yàn)楹竺孢€需要對數(shù)據(jù)進(jìn)行處理,所以將數(shù)據(jù)存放到申請的堆區(qū)空間里。
在出借文獻(xiàn)資料時,通過會籍人員的加入與共同參與,將建立圖書館區(qū)塊鏈社區(qū),屆時建立的社區(qū)將會使用通行的通證模式,在會籍人員享受包括出借、文獻(xiàn)保管、電子文獻(xiàn)注釋、文獻(xiàn)捐贈以及時歸還等多種服務(wù)后,該服務(wù)將產(chǎn)生運(yùn)算,獲取通證(或積分)可以為會籍獲取更高權(quán)限等級和身份識別,并在社區(qū)內(nèi)為高等級會籍開放更稀有書籍的閱覽權(quán)限或者學(xué)識分享權(quán)限,同時社區(qū)內(nèi)頁將直接引入網(wǎng)上書城的模式,部分書籍可以在網(wǎng)上商城出售,靈活地為圖書館產(chǎn)生部分利潤。
每一次的會籍貢獻(xiàn)就是一次區(qū)塊鏈的運(yùn)算,運(yùn)算后產(chǎn)生的積分就會成為會籍在圖書館區(qū)塊鏈社區(qū)內(nèi)的“現(xiàn)金”,可以實(shí)現(xiàn)購買書籍、積分租用會議室、開設(shè)講座以及積分換取課時等多種功能和應(yīng)用場景,讓圖書館會籍在圖書館中除了有更好的閱讀環(huán)境之外,還可以獲得更加豐富的應(yīng)用。
該文的數(shù)字化圖書館管理系統(tǒng)提出構(gòu)建或者引入云端文獻(xiàn)資料庫的存儲模塊,該模塊并不僅是某一個圖書館所獨(dú)有的,而應(yīng)該是加入云端文獻(xiàn)資料庫的所有圖書館都共同享有它的使用權(quán)利,引入該模塊可以更加全面地豐富館藏,同時該模塊在使用端支持上傳多種模式的文獻(xiàn)資料,包括書籍掃描、書籍電子版、有聲書籍、視頻文獻(xiàn)資料以及紀(jì)錄片等多種形式,在通過線上人工智能的審核后,還要通過人工篩選,確保無有毒害性質(zhì)的資料上載融入云端數(shù)據(jù)庫[3]。
此外,由于云端文獻(xiàn)庫存在運(yùn)營、維護(hù)以及擴(kuò)容增量的成本,使用該資料庫應(yīng)該有2 種收費(fèi)模式,一種是圖書館的使用費(fèi),一種是并入?yún)^(qū)塊鏈會籍管理模式時,書籍作者或者出版社的廣告費(fèi)用。存儲模塊的最大優(yōu)勢就是吸引讀者,將讀者直接轉(zhuǎn)化為圖書館會籍,并成為圖書館的忠實(shí)用戶,借此提升圖書館會籍的用戶黏性。數(shù)字化圖書館手機(jī)登錄界面如圖2 所示。
圖2 數(shù)字化圖書館手機(jī)登錄界面
大數(shù)據(jù)分析模塊是數(shù)字化圖書管理系統(tǒng)五大模塊中最具有圖書館館藏特色的模塊組成,它就是通過用戶閱讀數(shù)據(jù)來為用戶解決閱讀困境,使用電子文獻(xiàn)借閱時,大數(shù)據(jù)系統(tǒng)會自動為用戶提供生僻字解釋、冷門事件回顧以及特殊歷史事件詮釋等,用戶在閱讀時候,不用刻意查詢資料,所有的問題都可以使用用戶界面端口圈定后直接給予相應(yīng)的“聯(lián)想型”解釋,如果用戶還希望通過進(jìn)一步文獻(xiàn)查詢解決當(dāng)下疑問,大數(shù)據(jù)會根據(jù)過往同類型閱讀疑問、閱讀用戶后續(xù)相關(guān)閱讀以及閱讀用戶的點(diǎn)評進(jìn)行綜合分析、評定,快速提供相應(yīng)電子文獻(xiàn)資料快速借閱通道、實(shí)體文獻(xiàn)館藏位置以及相關(guān)簡介。
另外,大數(shù)據(jù)在累積用戶的相關(guān)資料以及閱讀習(xí)慣后,會在固定時間段提醒用戶閱讀,保持閱讀是非常優(yōu)秀的生活習(xí)慣,例如在世界讀書日等具有紀(jì)念意義的日期,系統(tǒng)會根據(jù)史實(shí)資料推薦相關(guān)閱讀書籍,同時用戶使用界面也會通過篩選給予例如“歷史上的今天”等多種方式的閱讀引導(dǎo)推薦[4]。根據(jù)網(wǎng)絡(luò)統(tǒng)計數(shù)據(jù)顯示,通過關(guān)鍵詞引導(dǎo)人類自我閱讀行為的發(fā)生概率是沒有關(guān)鍵詞引導(dǎo)閱讀的1.3 倍。同時系統(tǒng)在用戶自行閱讀時也會將用戶的閱讀習(xí)慣、閱讀速度等數(shù)據(jù)上傳至云端,系統(tǒng)會根據(jù)每個人不同的閱讀方式,為用戶量身定制閱讀方案和閱讀推薦。基于該功能的需求,筆者將嘗試使用Lambda(Lambda 架構(gòu)是由Storm 的作者Nathan Marz 提出的一個實(shí)時大數(shù)據(jù)處理框架)架構(gòu)作為該模塊的基本數(shù)據(jù)架構(gòu)模型,該架構(gòu)是大數(shù)據(jù)系統(tǒng)里面非常重要的架構(gòu),大多數(shù)的架構(gòu)都是基于Lambda 架構(gòu)或者基于它的變種架構(gòu)。它通過批量 MapReduce(MapReduce 是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算)作業(yè)提供了雖然有些延遲但是結(jié)果準(zhǔn)確的計算,同時通過Storm 初步展示最新數(shù)據(jù)的計算結(jié)果。主要將數(shù)據(jù)分析分成了2 個分支:實(shí)時流和離線,實(shí)時地依照了流式架構(gòu),保障了時效性。而批量處理則對數(shù)據(jù)進(jìn)行全量運(yùn)算,保證其最終的一致性。該架構(gòu)相比于其他傳統(tǒng)架構(gòu)不僅具有實(shí)時功能,而且還具有實(shí)現(xiàn)離線的功能,對于數(shù)據(jù)分析下各種應(yīng)用場景的涵蓋將做到非常全面,而由于該系統(tǒng)在設(shè)計應(yīng)用之初就是為了實(shí)現(xiàn)規(guī)?;?,因此將大大降低實(shí)施構(gòu)建的成本,也增加了整體系統(tǒng)的實(shí)用性。
數(shù)字化圖書館最重要的功能就是查詢功能,現(xiàn)有的書名搜索已經(jīng)不能滿足用戶對文獻(xiàn)資料搜索的需求,智能查詢才是圖書館未來的發(fā)展前景,智能查詢包括以下4 個方面。
2.5.1 關(guān)鍵詞句搜索
不知道書名,卻因?yàn)槟骋欢卧捇蚰骋粋€詞語,想要查看文獻(xiàn)資料的人非常多,面對茫茫的數(shù)據(jù)汪洋,僅使用書名查找已經(jīng)完全不能滿足目前用戶對圖書搜索的需求,通過關(guān)鍵詞句搜索就能滿足用戶查詢文獻(xiàn)資料的需求。
2.5.2 語音搜索
基于當(dāng)下系統(tǒng)架構(gòu)的呈現(xiàn)方式還是依靠手機(jī)App,通過語音搜索相關(guān)文獻(xiàn)就是非常符合需求,也是非常必要的[5]。
2.5.3 多文獻(xiàn)篩選
某一份文獻(xiàn)資料很可能存在多種版本和多種解釋,在未來大數(shù)據(jù)的應(yīng)用方案中,用戶在檢索文獻(xiàn)資料的時候,系統(tǒng)可以根據(jù)用戶的需求或者關(guān)鍵因素,為用戶提供多文獻(xiàn)篩查,確保用戶精準(zhǔn)獲取資料,避免出現(xiàn)重復(fù)查詢以及反復(fù)核對驗(yàn)證等問題,如果用戶在查詢文獻(xiàn)時產(chǎn)生重復(fù)推送多種同類型文獻(xiàn)的現(xiàn)象,也會自動依據(jù)文獻(xiàn)產(chǎn)生的時間以及相關(guān)作者生成注釋、解析,為用戶呈現(xiàn)關(guān)于多版本文獻(xiàn)的精確的不同之處。
2.5.4 智能查詢推介
用戶在查詢相關(guān)文獻(xiàn)資料時,用戶使用端口在為用戶提供主文獻(xiàn)資料的同時,還會同步推送其他相關(guān)文獻(xiàn),以歷史書籍為例,用戶在搜索《三國志》這本書籍時,那么將會同步在主書籍資料推送的下端同步推薦同為二十四史的其他相關(guān)書籍,名人注解的《易中天品三國》,歷史類四大名著《三國演義》等,這樣方便讀者在探究和了解某一領(lǐng)域知識的同時,能夠更輕易地獲取其他相關(guān)知識,并制定接下來的閱讀計劃。
數(shù)字化圖書館已經(jīng)成為現(xiàn)有圖書館未來的發(fā)展趨勢,這是不可更改的,數(shù)字化圖書館具有館藏保有量大、永久保存等多種優(yōu)勢,但是不得不提的是現(xiàn)有的實(shí)體圖書館依然是不可以完全被數(shù)字化線上圖書館所替代的,閱讀是一種技能也是一種生活方式,它從精神層面給人類帶來享受和進(jìn)步,在數(shù)字化圖書館未來的發(fā)展趨勢中,主要需要優(yōu)化的3 個方面即流量變現(xiàn)、館藏追索以及社群管理[6]。
流量變現(xiàn)其實(shí)不難理解,在數(shù)字化、互聯(lián)網(wǎng)化以及物聯(lián)網(wǎng)化瞬息萬變的今天,紙質(zhì)書籍雖然不至于消失,但是已經(jīng)難以產(chǎn)生可觀的經(jīng)濟(jì)效益,而圖書館的存續(xù)不可以一味的指望國家資金的扶持,如何將流量變現(xiàn)就成了一個非常值得探討的問題,技術(shù)是流量變現(xiàn)的重要因素,合理地利用大數(shù)據(jù)算法留存、提升用戶黏性,用戶就會愿意為圖書館提供的各種便捷服務(wù)買單,例如一鍵上門送書或者歸還;用戶喜歡私密安靜的閱讀,圖書館提供絕對安靜的個人閱讀室;用戶喜歡集中討論,圖書館就可以提供大眾型閱讀室等。用戶都可以提前在端口預(yù)約下單,圖書館依靠大數(shù)據(jù)計算合理安排用戶與圖書館之間的互動。
依靠大數(shù)據(jù)以及時下社會的征信系統(tǒng)建立圖書借閱征信系統(tǒng),一旦用戶借閱不予歸還、損壞不予賠償都將產(chǎn)生比較嚴(yán)重的惡劣影響,圖書館依據(jù)用戶信用等級出借相應(yīng)書籍,同時系統(tǒng)也將自動推送通知給違反圖書出借條例的用戶給予提示和通知,如果出借資料比較重要或者出借的書籍價值非常高,還會定期為用戶提示和核查。
閱讀是一種共同愛好,基于該愛好建立的社群是具有高效黏性的,特別是知識講座的傳播效率都非常高,時下“樊登讀書會”的案例已經(jīng)說明,做好社群管理就是一件非常明智的舉措,甚至可以為圖書館帶來完全不一樣的變革,前文中曾提過,建立區(qū)塊鏈會籍管理社區(qū)模塊還應(yīng)該設(shè)立用戶之間的溝通窗口,用戶可以使用積分產(chǎn)生積分交易或者書籍交換等行為,建立用戶知識分享窗口。
數(shù)字化圖書館可以使用戶足不出戶即可充分地獲取所需的信息。從地域范圍的角度來說,用戶所查詢或獲取的信息并不僅僅局限于一個圖書館,而是沒有地域界限的,可能是全地區(qū)或全國的,甚至是全世界的。在數(shù)字圖書館時代,信息資源能得到充分的共享;此外,以前許多不能被借閱的珍本、善本等較為珍貴的資料也能以數(shù)字信息的形態(tài)出現(xiàn)在用戶面前?;诖髷?shù)據(jù)分析模塊下的數(shù)字化圖書館并不是日暮西山的行業(yè),而是人類生活必不可缺的精神家園,已經(jīng)很多人在嘗試探索圖書館未來發(fā)展的新出路,例如行業(yè)領(lǐng)頭的新華書店、結(jié)合咖啡會籍制度的西西弗書店等都是行業(yè)翹楚,學(xué)會有效地利用技術(shù),特別是云計算、大數(shù)據(jù)分析以及區(qū)塊鏈等技術(shù)會很容易將圖書館領(lǐng)向全新的領(lǐng)域,與此同時,技術(shù)的發(fā)展也是日新月異,AI 技術(shù)、生物識別技術(shù)也可以與數(shù)字化圖書館結(jié)合,未來數(shù)字化圖書館的發(fā)展應(yīng)該是多樣的,合理使用該數(shù)字化圖書館管理系統(tǒng)將為圖書館的數(shù)字化發(fā)展帶來不可估量的動力。