国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)驅(qū)動時代新一代數(shù)字圖書館系統(tǒng)優(yōu)化研究

2019-11-04 07:05:08趙強(qiáng)
河南圖書館學(xué)刊 2019年9期
關(guān)鍵詞:數(shù)字圖書館大數(shù)據(jù)優(yōu)化

趙強(qiáng)

關(guān)鍵詞:大數(shù)據(jù);數(shù)字圖書館;系統(tǒng);優(yōu)化

摘 要:文章從資源價值密度、數(shù)據(jù)檢索難度兩個方面介紹了大數(shù)據(jù)驅(qū)動時代數(shù)字圖書館面臨的挑戰(zhàn),分析了數(shù)字圖書館系統(tǒng)涉及的數(shù)據(jù)獲取、數(shù)據(jù)建模、數(shù)據(jù)分析等關(guān)鍵環(huán)節(jié)以及相應(yīng)的系統(tǒng)優(yōu)化技術(shù),分析了基于靜態(tài)優(yōu)化、緩存優(yōu)化、引擎優(yōu)化技術(shù)的數(shù)字圖書館系統(tǒng)優(yōu)化技術(shù),并提出了新一代數(shù)字圖書館系統(tǒng)的優(yōu)化策略,以期提升大數(shù)據(jù)時代背景下新一代數(shù)字圖書館系統(tǒng)的服務(wù)質(zhì)量。

中圖分類號:G250.76文獻(xiàn)標(biāo)識碼:A文章編號:1003-1588(2019)09-0065-03

1 大數(shù)據(jù)驅(qū)動時代數(shù)字圖書館服務(wù)面臨的挑戰(zhàn)

1.1 提高數(shù)據(jù)資源價值密度的要求

大數(shù)據(jù)驅(qū)動時代數(shù)據(jù)的作用日益凸顯,全球數(shù)據(jù)容量持續(xù)增加。大數(shù)據(jù)本身是異構(gòu)分布的,海量數(shù)據(jù)資源的傳播加大了用戶獲取有價值信息的難度,多樣化的數(shù)據(jù)標(biāo)準(zhǔn)也容易產(chǎn)生“數(shù)據(jù)孤島”,影響數(shù)字圖書館對可用信息的篩選和挖掘。同時,很多數(shù)字圖書館僅關(guān)注對靜態(tài)資源的使用,缺乏開發(fā)動態(tài)數(shù)據(jù)流的有效方法,難以適應(yīng)大數(shù)據(jù)驅(qū)動的智慧服務(wù)需求[1]。此外,大數(shù)據(jù)環(huán)境下用戶需求激增,使數(shù)字圖書館的數(shù)據(jù)存儲成本增大,面臨能耗控制、質(zhì)量保障等挑戰(zhàn)。因此,數(shù)字圖書館要想滿足用戶需求,就必須對碎片化數(shù)據(jù)進(jìn)行處理,從中挖掘更多可用的信息,提升數(shù)據(jù)的價值密度和可用性。

1.2 海量數(shù)據(jù)增加檢索難度

大數(shù)據(jù)驅(qū)動時代數(shù)字化資源呈幾何級增長,數(shù)字圖書館所采集的數(shù)據(jù)資源主要包括用戶個人信息、閱讀行為數(shù)據(jù)、物聯(lián)網(wǎng)應(yīng)用數(shù)據(jù)等,尤其是智能設(shè)備和社交媒體的應(yīng)用更是產(chǎn)生了大量碎片化信息,對這些資源進(jìn)行整合需借助可靠的技術(shù)工具。大數(shù)據(jù)紛繁復(fù)雜,大多存儲在信息服務(wù)商的數(shù)據(jù)庫中,數(shù)字圖書館未與這些機(jī)構(gòu)建立數(shù)據(jù)共享機(jī)制,因此不能對這些數(shù)據(jù)進(jìn)行價值挖掘、編目及維護(hù)。同時,由于數(shù)字圖書館缺乏對網(wǎng)絡(luò)資源進(jìn)行智能化處理的能力,也增加了大數(shù)據(jù)檢索的時間與復(fù)雜程度。因此,海量數(shù)據(jù)處理要求數(shù)字圖書館改進(jìn)存儲設(shè)備和方式,在降低存儲成本的基礎(chǔ)上逐步提高數(shù)據(jù)存儲和管理的有效性[2]。

1.3 數(shù)字圖書館系統(tǒng)優(yōu)化升級的要求

數(shù)字圖書館是存儲和傳播信息的場所,也是開展社會教育、提升公眾素養(yǎng)的平臺。隨著移動信息技術(shù)的發(fā)展,各種新型數(shù)據(jù)傳播載體大量涌現(xiàn),數(shù)字化資源逐漸占據(jù)主導(dǎo)地位,虛擬化空間成為社交的主要場所。人們獲取知識的渠道日益增多,信息服務(wù)的智能化也成為大勢所趨。作為存儲和傳播文獻(xiàn)資源的數(shù)字圖書館,全新的信息服務(wù)環(huán)境對其服務(wù)的專業(yè)化要求越來越高。因此,數(shù)字圖書館優(yōu)化服務(wù)系統(tǒng)、深化數(shù)據(jù)應(yīng)用服務(wù)、促進(jìn)信息共享成為必然[3]。數(shù)字圖書館要強(qiáng)化數(shù)據(jù)存儲和處理意識,提高大數(shù)據(jù)處理能力,從整體上提高自身的服務(wù)水平和質(zhì)量,為更多的用戶提供優(yōu)質(zhì)的服務(wù)。

2 大數(shù)據(jù)驅(qū)動時代數(shù)字圖書館系統(tǒng)涉及的關(guān)鍵環(huán)節(jié)

2.1 數(shù)據(jù)獲取

數(shù)字圖書館系統(tǒng)對數(shù)據(jù)資源進(jìn)行處理,先要采集用戶行為信息和館內(nèi)流通日志,然后從各大社交論壇或網(wǎng)頁抓取用戶訪問數(shù)據(jù),也可與企業(yè)、網(wǎng)絡(luò)公司合作獲取其內(nèi)部數(shù)據(jù),以保障數(shù)據(jù)的完整性。由于不同的數(shù)據(jù)庫服務(wù)商和網(wǎng)絡(luò)運(yùn)營機(jī)構(gòu)所提供的數(shù)據(jù)應(yīng)用與訪問程序存在差異,因此,為了避免系統(tǒng)不兼容的問題,數(shù)字圖書館應(yīng)使用網(wǎng)絡(luò)爬蟲技術(shù)針對不同的網(wǎng)頁與資源特點,自動從互聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)搜索與攫取,并傳輸至本地服務(wù)器進(jìn)行分析。對于涉密文件或重要資源,數(shù)字圖書館可以使用專用的系統(tǒng)接口,將其直接傳輸至本地服務(wù)器進(jìn)行存儲,避免多向傳輸引發(fā)數(shù)據(jù)丟失的風(fēng)險。

2.2 數(shù)據(jù)建模

數(shù)字圖書館在獲取大規(guī)模數(shù)據(jù)資源后,需對這些數(shù)據(jù)進(jìn)行預(yù)處理,并根據(jù)數(shù)據(jù)特點建立合適的模型進(jìn)行計算、分析與深入挖掘。由于采集的數(shù)據(jù)多是異構(gòu)及碎片化的,因此數(shù)字圖書館只有通過預(yù)處理清洗不必要的數(shù)據(jù),留下符合要求的數(shù)據(jù),并將這些數(shù)據(jù)轉(zhuǎn)化為系統(tǒng)可以理解的格式,才能進(jìn)行分析。經(jīng)過預(yù)處理后,數(shù)字圖書館需將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),將其存儲在關(guān)系型數(shù)據(jù)庫中,并做好數(shù)據(jù)分類整理工作[4]。由于數(shù)據(jù)類型的差異,預(yù)處理方式也有所不同,部分?jǐn)?shù)據(jù)需要進(jìn)行解析與格式轉(zhuǎn)化,而對于規(guī)模較大的非結(jié)構(gòu)化數(shù)據(jù)資源,數(shù)字圖書館則需要采用非關(guān)系型數(shù)據(jù)庫進(jìn)行存儲,避免出現(xiàn)數(shù)據(jù)的無序化。

2.3 數(shù)據(jù)分析

數(shù)字圖書館系統(tǒng)獲取數(shù)據(jù)的方式主要是利用設(shè)備安裝管理程序,針對不同數(shù)據(jù)庫的管理權(quán)限實現(xiàn)對數(shù)據(jù)的自動采集分析。對于沒有管理權(quán)限的數(shù)據(jù)庫或網(wǎng)絡(luò)系統(tǒng),數(shù)字圖書館可采用模擬訪問的方式掌握遠(yuǎn)程系統(tǒng)的訪問狀態(tài);對于大規(guī)模異常數(shù)據(jù)的處理,如系統(tǒng)日志、硬件狀態(tài)信息等,數(shù)字圖書館可借助預(yù)警監(jiān)控、內(nèi)部監(jiān)控程序等對獲取的數(shù)據(jù)資源進(jìn)行實時跟蹤,若發(fā)現(xiàn)不良情況就及時通過內(nèi)部郵件和系統(tǒng)提示等方式告知圖書館管理者。根據(jù)不同類型數(shù)據(jù)的特點,數(shù)字圖書館系統(tǒng)可以通過批量處理、流處理和交叉分析等方式進(jìn)行處理,并將處理結(jié)果以折線圖、分析報告等形式發(fā)送至客戶端,方便用戶瀏覽與理解。

3 大數(shù)據(jù)驅(qū)動時代數(shù)字圖書館系統(tǒng)優(yōu)化技術(shù)研究

3.1 靜態(tài)優(yōu)化技術(shù)

數(shù)字圖書館系統(tǒng)在大數(shù)據(jù)處理過程中通常需要讀取大量的動態(tài)頁面,并將其轉(zhuǎn)化為靜態(tài)數(shù)據(jù)加以處理。這樣的操作方式有利于數(shù)字圖書館實現(xiàn)對靜態(tài)數(shù)據(jù)的分類與索引,減少訪問數(shù)據(jù)庫的步驟,縮短采集時間,提高系統(tǒng)的數(shù)據(jù)處理效率[5]。為了更好地發(fā)揮系統(tǒng)的靜態(tài)數(shù)據(jù)處理性能,數(shù)字圖書館需做好首頁靜態(tài)化處理,對不同的靜態(tài)模塊進(jìn)行整合,并在后臺進(jìn)行分類配置。其中,Velocity技術(shù)具有較強(qiáng)的靜態(tài)處理能力,數(shù)字圖書館可以利用該技術(shù)自動生成與數(shù)據(jù)對象相關(guān)的靜態(tài)化頁面,并以對應(yīng)的ID進(jìn)行命名,省去后臺數(shù)據(jù)存儲的步驟,實現(xiàn)對查詢信息的實時定位。

3.2 緩存優(yōu)化技術(shù)

數(shù)字圖書館系統(tǒng)中存在大量緩存數(shù)據(jù),包括內(nèi)存數(shù)據(jù)、文件類數(shù)據(jù)等,引入緩存優(yōu)化技術(shù)可以實現(xiàn)對這些系統(tǒng)數(shù)據(jù)的直接讀取,減少對數(shù)據(jù)庫的訪問頻率,提高數(shù)據(jù)訪問速度。數(shù)字圖書館系統(tǒng)訪問動態(tài)網(wǎng)頁時數(shù)據(jù)資源繁雜多變,涉及多種查詢參數(shù)。這就需要數(shù)字圖書館依托文件緩存優(yōu)化技術(shù)對原始數(shù)據(jù)進(jìn)行復(fù)制,并賦予連續(xù)的內(nèi)部文件存儲空間,方便在數(shù)據(jù)查詢時直接指向緩存數(shù)據(jù),以減少中間處理環(huán)節(jié),當(dāng)緩存資源較多時可以先將其存儲于硬盤,然后導(dǎo)入內(nèi)部存儲器,這樣可以縮短應(yīng)用程序訪問內(nèi)存的時間。

3.3 引擎優(yōu)化技術(shù)

大數(shù)據(jù)驅(qū)動時代,數(shù)字圖書館本身擁有結(jié)構(gòu)復(fù)雜、規(guī)模大、檢索要求高的數(shù)據(jù)服務(wù)環(huán)境。為了更好地滿足用戶需求,數(shù)字圖書館可以引入引擎優(yōu)化技術(shù),提高服務(wù)系統(tǒng)檢索模塊的響應(yīng)速度和分析能力,強(qiáng)化系統(tǒng)的兼容性和拓展性,支持不同的數(shù)據(jù)平臺結(jié)構(gòu),更好地為大數(shù)據(jù)處理與服務(wù)奠定基礎(chǔ)。數(shù)字圖書館可將搜索管理平臺、網(wǎng)頁爬蟲技術(shù)與查詢索引器等相結(jié)合,設(shè)計出能夠滿足讀者個性化需求的大數(shù)據(jù)檢索引擎。在該檢索引擎中,網(wǎng)頁爬蟲技術(shù)對動態(tài)網(wǎng)頁內(nèi)容進(jìn)行周期性自動獲取,建立不同數(shù)據(jù)的導(dǎo)航索引,自動存儲、調(diào)取和推送各類數(shù)據(jù)信息;搜索管理平臺負(fù)責(zé)收集用戶信息,分析他們的實際需求;查詢索引器則用于檢索用戶查詢關(guān)鍵詞,自動調(diào)取用戶所需資源。

4 大數(shù)據(jù)驅(qū)動時代新一代數(shù)字圖書館系統(tǒng)優(yōu)化策略

4.1 建立大數(shù)據(jù)資源整合平臺

大數(shù)據(jù)資源整合是將來自于不同網(wǎng)頁、不同系統(tǒng)和不同機(jī)構(gòu)的數(shù)據(jù)集成在統(tǒng)一的數(shù)據(jù)平臺,創(chuàng)建具有多種服務(wù)功能的應(yīng)用系統(tǒng)的過程。數(shù)字圖書館建立大數(shù)據(jù)資源整合平臺,需采用多層次的系統(tǒng)架構(gòu),結(jié)合大數(shù)據(jù)服務(wù)需求設(shè)置對應(yīng)的功能模塊,使平臺具有較強(qiáng)的耦合度和拓展能力,有助于為用戶提供多元化服務(wù)。其中,數(shù)據(jù)管理層對大數(shù)據(jù)資源進(jìn)行管理、維護(hù)與控制,并為用戶提供數(shù)據(jù)獲取接口[6];數(shù)據(jù)處理層依據(jù)數(shù)據(jù)清洗和過濾規(guī)則,保障大數(shù)據(jù)資源的完整可用性,進(jìn)一步提升數(shù)據(jù)的價值密度;數(shù)據(jù)整合層對經(jīng)過處理的數(shù)據(jù)進(jìn)行規(guī)則解析、讀取和整合,并將經(jīng)過轉(zhuǎn)換的數(shù)據(jù)存入數(shù)據(jù)庫;數(shù)據(jù)資源層由多種數(shù)據(jù)存儲設(shè)備、數(shù)據(jù)應(yīng)用系統(tǒng)和數(shù)據(jù)庫構(gòu)成,是數(shù)字圖書館大數(shù)據(jù)的主要來源。

4.2 實現(xiàn)對數(shù)據(jù)資源的統(tǒng)一語義管理

數(shù)字圖書館存儲的海量數(shù)據(jù)并非孤立存儲于各個數(shù)據(jù)庫,而是要實現(xiàn)語義融合,促進(jìn)跨學(xué)科、跨系統(tǒng)的交流合作,提高數(shù)據(jù)的使用價值。數(shù)字圖書館可利用語義網(wǎng)技術(shù)對數(shù)據(jù)資源進(jìn)行語義標(biāo)注,通過語義鏈接和語義分析將其轉(zhuǎn)化為系統(tǒng)可以理解的語義對象,揭示不同數(shù)據(jù)之間的關(guān)系,形成龐大的語義知識網(wǎng)絡(luò),這不僅可以消除“數(shù)據(jù)孤島”,還可使大數(shù)據(jù)的價值倍增。例如,數(shù)字圖書館可將文獻(xiàn)資源與讀者、出版社、會議、研究項目等結(jié)合起來,利用語義技術(shù)發(fā)現(xiàn)不同數(shù)據(jù)間的關(guān)聯(lián),通過語義識別、描述、標(biāo)注和分析,形成多種類型知識交叉融合的知識圖譜,為數(shù)字圖書館的細(xì)粒度智能信息檢索提供支持。

4.3 重視收集處理用戶反饋信息

數(shù)字圖書館對系統(tǒng)進(jìn)行優(yōu)化升級,目的在于更好地滿足用戶需求。因此,數(shù)字圖書館只有重視用戶對系統(tǒng)的反饋建議,及時與用戶交流互動,掌握用戶在系統(tǒng)應(yīng)用過程中的體驗,分析他們提出的問題,才能有針對性地進(jìn)行改進(jìn)。數(shù)字圖書館可在系統(tǒng)服務(wù)界面設(shè)置用戶反饋專區(qū),方便用戶提出評價和建議,也可根據(jù)用戶數(shù)據(jù)發(fā)現(xiàn)其不滿意的地方,有針對性地對系統(tǒng)進(jìn)行改進(jìn)或再造。例如,華盛頓大學(xué)圖書館在服務(wù)系統(tǒng)運(yùn)行過程中,對本校師生利用系統(tǒng)獲取信息的情況進(jìn)行綜合評估,并根據(jù)用戶反饋信息對發(fā)現(xiàn)的問題進(jìn)行技術(shù)討論,最終有效完成了系統(tǒng)的優(yōu)化升級工作。

5 結(jié)語

綜上所述,數(shù)字圖書館應(yīng)分析現(xiàn)有不足,全方位整合用戶行為數(shù)據(jù),積極聯(lián)合網(wǎng)絡(luò)運(yùn)營商等引入適宜的系統(tǒng)優(yōu)化技術(shù),逐步深化大數(shù)據(jù)挖掘工作,進(jìn)一步拓展服務(wù)內(nèi)容和服務(wù)范圍,更好地滿足廣大用戶的需求。大數(shù)據(jù)驅(qū)動時代數(shù)字圖書館面臨機(jī)遇和挑戰(zhàn),應(yīng)充分利用各類新技術(shù)優(yōu)化服務(wù)系統(tǒng),制定合理的系統(tǒng)優(yōu)化策略,形成符合大數(shù)據(jù)環(huán)境的新一代數(shù)字圖書館服務(wù)體系,促使數(shù)字圖書館得到更好的發(fā)展。

參考文獻(xiàn):

[1] 夏立新,白陽,張心怡.融合與重構(gòu):智慧圖書館發(fā)展新形態(tài)[J].中國圖書館學(xué)報,2018(1):35-49.

[2] 柳益君,何勝,熊太純,等.大數(shù)據(jù)挖掘視角下的圖書館智慧服務(wù):模型、技術(shù)和服務(wù)[J].現(xiàn)代情報,2017(11):81-86.

[3] 馬捷,趙天緣,王思.高校智慧圖書館功能結(jié)構(gòu)模型構(gòu)建[J].情報科學(xué),2017(8):56-61.

[4] 馬曉亭.基于大數(shù)據(jù)決策分析需求的圖書館大數(shù)據(jù)清洗系統(tǒng)設(shè)計[J].現(xiàn)代情報,2016(9):107-111.

[5] 劉桂鋒,盧章平,化慧.圖書館大數(shù)據(jù)知識服務(wù)生態(tài)體系及其動力機(jī)制研究[J].國家圖書館學(xué)刊,2016(3):52-60.

[6] 劉成山,李玉,王潔良.大數(shù)據(jù)在圖書情報領(lǐng)域的研究現(xiàn)狀及趨勢分析[J].情報理論與實踐,2016(4):20-26.

(編校:徐黎娟)

猜你喜歡
數(shù)字圖書館大數(shù)據(jù)優(yōu)化
超限高層建筑結(jié)構(gòu)設(shè)計與優(yōu)化思考
民用建筑防煙排煙設(shè)計優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
高校數(shù)字圖書館資源整合的初探
商情(2016年39期)2016-11-21 09:27:10
基于云計算的數(shù)字圖書館建設(shè)與服務(wù)模式研究
從谷歌案析數(shù)字圖書館對作品的使用行為
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
芻議數(shù)字圖書館計算機(jī)網(wǎng)絡(luò)的安全技術(shù)及其防護(hù)策略
陈巴尔虎旗| 井研县| 东安县| 滦南县| 稷山县| 丹东市| 新源县| 崇信县| 南召县| 九台市| 奇台县| 霍邱县| 若羌县| 三门县| 边坝县| 九台市| 鄢陵县| 承德市| 莱芜市| 扎囊县| 竹北市| 库尔勒市| 永泰县| 永春县| 依兰县| 甘洛县| 威远县| 武汉市| 永州市| 兖州市| 海盐县| 扬州市| 象山县| 出国| 泸溪县| 长治县| 竹溪县| 玛沁县| 杭州市| 嘉兴市| 富锦市|