唐妮 王文麗 易曉燕
摘要:針對高校數(shù)字圖書館之建設(shè)現(xiàn)狀,分析大數(shù)據(jù)時代外部環(huán)境、用戶需求、信息技術(shù)等方面的變化對數(shù)字圖書館的資源組織、個性化的深度信息服務(wù)帶來的挑戰(zhàn),并就如何構(gòu)建互聯(lián)網(wǎng)+時代的數(shù)字圖書館,實現(xiàn)個性化的深度服務(wù)提出合理性建議:進行資源整合、扁平化管理;發(fā)展新型個性化服務(wù)。
關(guān)鍵詞:數(shù)字圖書館;大數(shù)據(jù);個性化深度服務(wù);資源整合
中圖分類號:TP311
文獻標(biāo)識碼:A
文章編號:1009-3044(2017)10-0216-02
伴隨云計算與大數(shù)據(jù)技術(shù)以及高校信息化水平的迅猛發(fā)展,將大數(shù)據(jù)技術(shù)應(yīng)用于高校圖書館,適時推出個性化信息服務(wù),將極大促進高校信息化水平。
1.高校數(shù)字圖書館所面臨的挑戰(zhàn)
1.1個性化服務(wù)中不足部分分析
在大數(shù)據(jù)與云計算技術(shù)的影響下,數(shù)字化的高校圖書館的讀者需求差異化明顯增大。原有的服務(wù)范圍與對象對應(yīng)現(xiàn)階段的服務(wù)與功能相對遠遠不夠。要解決這個問題,最好的方法就是個性化信息服務(wù)的構(gòu)建。它從讀者的知識結(jié)構(gòu)、需求等出發(fā),研究其行為習(xí)慣,因地制宜地為其創(chuàng)建契合需求的服務(wù)環(huán)境,更好地為讀者提供合適資源。而高校數(shù)字圖書館的個性化服務(wù)沒有特定概念,就是按照每個高校圖書館讀者的專業(yè)、愛好、職業(yè)、年齡、特殊要求等開展的信息服務(wù)。
高校圖書館個性化服務(wù)有別于一般的個性化服務(wù),是因其用戶為學(xué)生和教師而決定的。它使用戶在網(wǎng)絡(luò)環(huán)境下,借助系統(tǒng)來構(gòu)建個人館藏和提高檢索效率,以滿足用戶的特定需求。其實,個性化就是依據(jù)個體需求并針對性的提供信息服務(wù)。數(shù)字圖書館如何根據(jù)每個用戶興趣,主動及時把信息推送到用戶手中,是高校圖書館面臨的一大難題。
1.2高校急需構(gòu)建成熟的數(shù)字化平臺。打造數(shù)字化校園及數(shù)字圖書館
當(dāng)前高校的校園一卡通系統(tǒng)中大部分是在都結(jié)合每個學(xué)校自有網(wǎng)絡(luò)來促成全校面積的數(shù)字信息化空間及師生共享空間,成為數(shù)字化校園中重要的組成部分,給師生提供高效到位服務(wù)。而高校的數(shù)字圖書館建設(shè),在現(xiàn)有的解決方案中,尚無法構(gòu)建成熟的平臺,如何實現(xiàn)圖書館的數(shù)字化,真正做到高校的數(shù)字化校園。高校的數(shù)據(jù)中心,是否能有夠的云存儲設(shè)備來支撐大數(shù)據(jù)平臺的搭建,為高校的圖書館數(shù)字化服務(wù)? 2.大數(shù)據(jù)環(huán)境下高校數(shù)字圖書館的建設(shè)與深度服務(wù)提升
2.1圖書館的資源整合將是高校信息資源建設(shè)的基本要求
1)大數(shù)據(jù)環(huán)境下,圖書館無需將所有的館藏資源數(shù)字化,可以針對某一方面形或某一原生資源,進行系統(tǒng)整理開發(fā),以便讓其發(fā)揮在高校數(shù)字圖書館的作用。2)支持多媒體文檔的存儲、保管、檢索和管理,支持多種異質(zhì)文檔及其元數(shù)據(jù)的管理,建成最全最新的資源集成平臺。在大數(shù)據(jù)時代云計算等技術(shù)的支持下進行數(shù)字資源的深層次開發(fā),以實施對原始數(shù)據(jù)中的新型數(shù)據(jù)服務(wù)功能拓展、數(shù)據(jù)轉(zhuǎn)換、挖掘技術(shù)、組織形態(tài)方面,面向海量數(shù)據(jù)進行篩選。 2.2深度信息服務(wù)能力的提升是高校數(shù)字圖書館的發(fā)展方向
數(shù)字圖書館深度服務(wù)的實現(xiàn)應(yīng)具有層次性、專業(yè)性、特色性。首先,根據(jù)服務(wù)的讀者身份來決定了其信息需求的層次性。其次,高校師生都屬于不同的專業(yè)類別,為類型用戶對信息的需求一般是與自己研究或?qū)W習(xí)的學(xué)科及相關(guān)學(xué)科上。高校圖書館應(yīng)在特色資源與服務(wù),才有更好的生存與發(fā)展,獲得競爭優(yōu)勢。因此,圖書館在提供服務(wù)時,應(yīng)注意信息需求的層次性、專業(yè)性、特色性,區(qū)別對待,這樣才能保障服務(wù)的效果,提升高校圖書館形象。
2.3如何構(gòu)建高校數(shù)字圖書館個性化的深度信息服務(wù)系統(tǒng)新構(gòu)架
高校數(shù)字圖書館個性化的深度信息服務(wù)系統(tǒng)新構(gòu)架,主要包括讀者個性化興趣模塊、個性化推薦模塊、圖書使用模塊和信息推送模塊。數(shù)字圖書館深度信息服務(wù)系統(tǒng)新構(gòu)架一般包括:
1)個性化興趣模塊將會按類別為讀者在信息庫中檢索相關(guān)圖書信息,分析并提煉用戶讀者的瀏覽記錄,形成關(guān)鍵字,在圖書館信息庫中進行全面檢索,對檢索結(jié)果進行分析比對后形成個性化的檢索結(jié)果集。根據(jù)檢索結(jié)果集與讀者興趣特征相對比,最后把相似度高的記錄推薦給讀者。
2)圖書館系統(tǒng)在讀者使用一段時間后,會自動記錄一些和其關(guān)鍵字搜索、到館狀態(tài)等信息。通過對信息的分析、挖掘,形成書籍閑置與時間的對應(yīng)關(guān)系序列。那么,圖書館系統(tǒng)就可以在不同的時間段內(nèi),將這些閑置的書籍重新推送給相關(guān)的讀者,從而提高圖書利用的效率和信息的個性化。
3)信息推送模塊信息推送是提取對優(yōu)化后的結(jié)果數(shù)據(jù)的元數(shù)據(jù),使用設(shè)計后的對象類,將讀者需要的信息轉(zhuǎn)化為信息的RSS格式。讀者可以使用RSS閱讀器,新的有用信息資源就會不斷的推送,從而節(jié)省了讀者獲取信息的精力和時間。
3.高校數(shù)字圖書館深度信息服務(wù)能力提升的相關(guān)技術(shù)研究與實現(xiàn)
3.1實現(xiàn)深度信息服務(wù)的相關(guān)技術(shù)
如何實現(xiàn)高校數(shù)字圖書館深度信息服務(wù),我們可以從以下幾個方面開展:
1)圖書采購方式基于數(shù)據(jù)挖掘
在大數(shù)據(jù)環(huán)境下,我們對讀者需求進行深入分析也成為可能。在對圖書館OPAC系統(tǒng)中的讀者搜索記錄,讀者薦購記錄、讀者借閱記錄等數(shù)據(jù)進行深入的挖掘和分析后,我們可以準(zhǔn)確地定位讀者的需求傾向,從而為圖書資源的采購做出支持和參考。
2)圖書借閱基于移動物聯(lián)技術(shù)
目前,國內(nèi)部分高校圖書館通過RFID設(shè)備來實現(xiàn)書籍的自助借還,智能分揀,自助辦證以及安全監(jiān)測等一系列智能服務(wù)功能。
不但能夠節(jié)約大量的人力成本,最重要的是給讀者帶來了非常方便的體驗,服務(wù)的質(zhì)量和效率也得到了提升。
3)推出手機移動圖書館
隨著新一代無線通信技術(shù)以及智能手機的普及,讓讀者更好地利用生活中的“零碎時間”,隨時可以通過手機移動圖書館來滿足自己隨時查閱、咨詢、個性化推送以及資源下載等各方面的要求。
3.2數(shù)據(jù)挖掘在深度信息服務(wù)能力的提升中的應(yīng)用
如何具體實現(xiàn)深度服務(wù)呢,數(shù)據(jù)挖掘尤為關(guān)鍵。經(jīng)過數(shù)次基于兩次聚類的“離群數(shù)據(jù)挖掘算法”的應(yīng)用,對所在高校學(xué)生進行了實際的研究。
1)原始數(shù)據(jù)采集
為了將前面提及的算法用到實際中去,同時也驗證該算法是否有效且可行。我選取了本學(xué)院圖書個性化服務(wù)系統(tǒng)注冊用戶的各個屬性作為離群挖掘的對象。目前注冊用戶為5378,都是本校大一大二的學(xué)生及部分專業(yè)教師,他們在校的時候較長,對這些用戶的屬性進行離群挖掘,有一定的意義。
2)數(shù)據(jù)預(yù)處理
針對這5378名注冊用戶,我們感興趣的特征包括四個:借閱頻率,借閱數(shù)量,所屬專業(yè),借閱時長,閱書評價,積分。我們的計量規(guī)則:借閱頻率每次計1,如過高一月超過4次則自動清零;借閱數(shù)量每本計1,借閱時長每天計1,閱書評價則為好評2,中評1,差評-1。在用算法進行試驗之前,對大量原始數(shù)據(jù)進行進一步處理:
①將沒有激活的讀者去掉,最后余下4438;
②將借閱次數(shù)不正常的讀者去掉(該部分參與無意義),還留下3896;
③去除閱書評價沒有的讀者,還留下3675,我們在這些讀者里面進行離群挖掘。將屬性值轉(zhuǎn)化成,其中,是標(biāo)準(zhǔn)偏差,是此屬性的平均值,使所有的屬性都具有相同權(quán)重。
3)挖掘過程及結(jié)果
對已經(jīng)進行轉(zhuǎn)化和處理過的數(shù)據(jù)使用基于兩次聚類的離群挖掘算法。進行數(shù)據(jù)挖掘。令k=30,找出前6個離群點。計算如下:首先選擇合適的閾值,不能太大,也不能過小,來進行第一次聚類。接下使用RAM算法對每個類進行第二次聚類,聚類個數(shù)選擇n/(k/5).n.n為子集的數(shù)據(jù)量,再為每個類計算邊界與候選劃分,在候選劃分里計算點的第K個最小相鄰距離。最后在第一步聚類后的子集計算好第K個最小相鄰距離后,挑出前6個最大的,也就是離群點。
根據(jù)兩次聚類的離群數(shù)據(jù)挖掘,得出了不同年級讀者借閱圖書頻率及時長都有變化的規(guī)律。大一文學(xué)類居多,借閱的次數(shù)較多,借閱周期過短,數(shù)量較少,給予好評及中評較多;大二偏專業(yè)類多,借閱次數(shù)少,周期長,數(shù)量多,給予中評較多。部分學(xué)生對于歷史藝術(shù)等類型,借閱次數(shù)不多不少,周期短,數(shù)量一般,給予好評及差評較多。專業(yè)教師,專業(yè)實用類偏多,最近最新的借閱次數(shù)多,周期長,數(shù)量少,給予中評居多。這些都為今后數(shù)字化圖書館的發(fā)展,如何選購所需圖書,及根據(jù)讀者不同年級專業(yè)進行推送符合讀者興趣的圖書奠定基礎(chǔ)。
4.小結(jié):展望高校未來數(shù)字化圖書館的發(fā)展趨勢
未來高校數(shù)字化圖書館的發(fā)展,將會以讀者為中心,為讀者提供以人為本的具有針對性、靈活性、智能性的個性需求服務(wù),提高讀者(用戶)滿意率。綜上所述,本文通過對高校數(shù)字圖書館部分讀者個性需求調(diào)研,分析大數(shù)據(jù)背景下高校數(shù)字圖書館深度服務(wù)宗旨、構(gòu)成要素和實現(xiàn)方法,研究構(gòu)建高校圖書情報需求、個性化服務(wù)等模型,設(shè)計基于數(shù)據(jù)挖掘的、主動的和智能化的深度服務(wù)信息服務(wù)系統(tǒng)原型,提升高校數(shù)字圖書館的創(chuàng)新服務(wù)能力和水平。