張春友 閆偉 吳曉強 郝瑞參
摘 要: 數(shù)字資源服務(wù)是現(xiàn)代化圖書館提供的重要服務(wù),數(shù)字資源服務(wù)績效評價是圖書館改善數(shù)字資源的基礎(chǔ)。針對現(xiàn)有數(shù)字資源服務(wù)績效評價方法存在的不足,提出一種新的基于區(qū)間數(shù)支持向量回歸機的圖書館數(shù)字資源服務(wù)績效評價方法。在構(gòu)建數(shù)字資源服務(wù)績效評價指標體系的基礎(chǔ)上,建立了基于區(qū)間數(shù)支持向量回歸機的圖書館數(shù)字資源服務(wù)績效評價模型。仿真結(jié)果表明, 所建立的評價模型是合理有效的,并且具有較強的泛化能力。
關(guān)鍵詞: 圖書館; 數(shù)字資源; 服務(wù)績效; 區(qū)間數(shù); 支持向量回歸機; 泛化能力
中圖分類號: TN919?34; TP301.6 文獻標識碼: A 文章編號: 1004?373X(2018)22?0021?04
Abstract: Digital resource service is an important service provided by modern library. The performance evaluation of digital resource service is a foundation for improving digital resources of the library. In allusion to the shortcomings of the existing digital resource service performance evaluation methods, a new performance evaluation method based on interval numbers and support vector regression is proposed for the digital resource service of the library. On the basis of constructing the performance evaluation index system for the digital resource service, a performance evaluation model based on interval numbers and support vector regression is established for the digital resource service of the library. The simulation results show that the established evaluation model is reasonable, effective, and has a strong generalization capability.
Keywords: library; digital resource; service performance; interval number; support vector regression; generalization capability
在計算機、網(wǎng)絡(luò)技術(shù)飛速發(fā)展的大背景下,具有種類繁多、信息量大、存儲便捷等諸多優(yōu)勢的數(shù)字資源逐漸成為人們獲取信息的重要渠道。圖書館數(shù)字資源建設(shè)的優(yōu)劣直接影響圖書館的服務(wù)水平和層次,已成為圖書館建設(shè)的關(guān)鍵問題之一。如何客觀評價數(shù)字資源的建設(shè)情況,如何科學(xué)衡量數(shù)字資源服務(wù)的優(yōu)劣,如何解決數(shù)字資源種類繁多與經(jīng)費有限的矛盾,都需開展數(shù)字資源服務(wù)績效評價問題的研究。目前,數(shù)字資源服務(wù)績效評價問題已成為圖書館界的研究熱點。很多學(xué)者在評價指標體系、評價方法、評價模型等方面開展了深入的研究。文獻[1]采用改進的層次分析法對數(shù)字資源服務(wù)績效評價指標體系進行了研究;文獻[2]提出基于擬熵權(quán)模糊綜合評價的數(shù)字資源服務(wù)績效評價方法;文獻[3]采用模糊多屬性決策方法對高校圖書館電子資源服務(wù)績效評價問題進行了研究;文獻[4]基于模糊語義法研究了電子資源服務(wù)績效評價問題;文獻[5]采用模糊神經(jīng)網(wǎng)絡(luò)方法構(gòu)建了數(shù)字資源服務(wù)績效的智能評價模型。現(xiàn)有研究方法中均需計算指標權(quán)重,但數(shù)字資源服務(wù)績效評價指標繁多,指標權(quán)重計算復(fù)雜且主觀性較大。雖然文獻[5]提出了智能評價模型,取得了較好的預(yù)測效果,但神經(jīng)網(wǎng)絡(luò)方法存在收斂速度慢、學(xué)習(xí)效率低、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜和泛化能力弱等問題。支持向量回歸機(Support Vector Regression,SVR)是SVM在解決回歸問題方面的具體應(yīng)用,在各種預(yù)測領(lǐng)域表現(xiàn)出了較好的能力,支持向量機基于結(jié)構(gòu)風險最小化理論,普遍認為其泛化能力要比神經(jīng)網(wǎng)絡(luò)的強。此外,數(shù)字資源服務(wù)績效評價問題具有確定性評價,而用區(qū)間數(shù)表示不確定性更加符合思維習(xí)慣。鑒于此,本文擬采用區(qū)間數(shù)和SVR理論相結(jié)合的方法對數(shù)字資源服務(wù)績效評價問題進行研究,以期為數(shù)字資源服務(wù)績效評價問題提供一種新的智能評價方法。
構(gòu)建一個科學(xué)有效的圖書館數(shù)字資源服務(wù)績效評價指標體系,是優(yōu)化發(fā)展圖書館數(shù)字資源、提高數(shù)字資源服務(wù)質(zhì)量效益的關(guān)鍵。和媛媛等人基于用戶滿意度,建立了以數(shù)據(jù)庫內(nèi)容、檢索系統(tǒng)及功能和數(shù)據(jù)庫利用情況為一級指標的電子資源服務(wù)績效評價指標體系[3];隸屬于美國研究圖書館協(xié)會(ARL)的統(tǒng)計和測度委員會于2000年開始啟動的數(shù)字資源評估項目中,將指標體系分為網(wǎng)絡(luò)統(tǒng)計和績效統(tǒng)計兩部分,其中網(wǎng)絡(luò)統(tǒng)計指標包含用戶可使用的數(shù)字資源、網(wǎng)絡(luò)資源的使用、網(wǎng)絡(luò)資源與相關(guān)設(shè)施的花費和圖書館數(shù)字化工作四類一級指標;梁冬瑩等人參照美國研究圖書協(xié)會ARL E?Metrics項目推薦的高校圖書館數(shù)字資源統(tǒng)計和測評數(shù)據(jù)指標的體系結(jié)構(gòu)的基礎(chǔ)上,結(jié)合我國數(shù)字資源使用的實際情況和相關(guān)研究成果,構(gòu)建了我國高校圖書館數(shù)字資源服務(wù)績效評價指標體系[1];周慶梅以文獻[1]構(gòu)建的指標體系為基礎(chǔ),利用模糊神經(jīng)網(wǎng)絡(luò)方法開展了圖書館數(shù)字資源服務(wù)績效評價研究,取得了較好的效果。綜合上述研究成果中的評價指標體系,本文構(gòu)建多層次的數(shù)字資源服務(wù)績效評價指標體系,如圖1所示。
近年來,區(qū)間數(shù)理論在不確定數(shù)學(xué)規(guī)劃和不確定多屬性決策等領(lǐng)域得到了廣泛的應(yīng)用。區(qū)間數(shù)是指用區(qū)間表示的數(shù),具有不確定性,實際上是一個閉區(qū)間上所有實數(shù)所組成的集合。假設(shè)[a]是實數(shù)[x]的集合,[a=[a1,a2]={a1≤x≤a2,a1,a2∈R}],[a1]和[a2]是區(qū)間的下界和上界,則[a]定義為區(qū)間數(shù)。如果[a1≥0],那么[a]為正區(qū)間數(shù)。區(qū)間數(shù)的運算法則一般與集合的運算法則類似,設(shè)[a=[a1,a2]]和[b=[b1,b2]]為兩個區(qū)間數(shù),[k≥0],則區(qū)間數(shù)的運算法則為[6]:
核函數(shù)[K(x,y)]的形式有多種,常用的有徑向基核函數(shù)、多項式核函數(shù)、Sigmoid感知核函數(shù)和多二次曲面核函數(shù)等。
通過數(shù)字資源服務(wù)績效評價指標體系的建立以及對區(qū)間數(shù)和支持向量回歸機模型原理的介紹,構(gòu)建基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績效評價模型,模型的具體實現(xiàn)步驟如下:
1) 建立圖書館數(shù)字資源服務(wù)績效評價指標體系,確定支持向量回歸機的輸入和輸出參數(shù)。依據(jù)前面的分析,本文選用評價指標體系中數(shù)字資源內(nèi)容、供應(yīng)商提供服務(wù)、用戶使用情況、檢索系統(tǒng)和資源成本5個一級指標下的29個二級指標作為數(shù)字資源服務(wù)績效評價模型的輸入?yún)?shù),數(shù)字資源服務(wù)績效評價等級作為評價模型的輸出參數(shù)。
2) 為提高預(yù)測的準確性,對實驗樣本數(shù)據(jù)進行規(guī)范化處理,使各指標值均處于[0,1]區(qū)間內(nèi)。將“優(yōu)”“良”“一般”“較差”和“差”作為數(shù)字資源服務(wù)績效評價等級,各等級對應(yīng)的規(guī)范化區(qū)間數(shù)分別為[0.8,1.0],[0.6,0.8],[0.4,0.6],[0.2,0.4]和[0,0.2]。
3) 確定最佳的支持向量回歸機核函數(shù)。通過比較分析和測試,最終選擇應(yīng)用最為廣泛的徑向基核函數(shù),其表達式為:[K(x,y)=exp-x-y22σ2]。
4) 利用基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績效評價模型對訓(xùn)練樣本進行訓(xùn)練,在訓(xùn)練過程中不斷調(diào)整徑向基核函數(shù)的寬度參數(shù)[σ],以及支持向量回歸機的正則化參數(shù)C和不敏感值[ε],直到訓(xùn)練誤差達到相應(yīng)的精度要求為止。
5) 通過校驗樣本檢驗預(yù)測模型的泛化能力。利用基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績效評價模型對校驗樣本進行評價研究。
為了驗證基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績效評價模型的合理性和有效性,現(xiàn)以文獻[5]中的樣本數(shù)據(jù)為例進行仿真實驗驗證。樣本數(shù)據(jù)中共有11個樣本,各指標數(shù)值通過邀請多位專家進行打分后取平均值獲得,打分過程中,評價等級為{“優(yōu)”,“良”,“一般”,“較差”,“差”},對應(yīng)的取值范圍為{[4,5],[3,4],[2,3],[1,2],[0,1]},具體的打分情況見表1。這里以前8個樣本為訓(xùn)練樣本,后3個樣本為校驗樣本進行仿真驗證。文獻[5]采用模糊神經(jīng)網(wǎng)絡(luò)方法對這11個樣本進行仿真分析,所得的前8個樣本的模糊綜合評價結(jié)果如表2所示。
利用Matlab 7.0編寫基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績效評價模型的仿真程序。通過多次仿真測試,得到SVR最優(yōu)的仿真參數(shù):[ε]=0.001,懲罰參數(shù)[C]=800,參數(shù)[σ=]10。在仿真過程中,首先將各指標值進行歸一化處理,然后將歸一化的29個指標值作為SVR的輸入?yún)?shù),分別將區(qū)間數(shù)評價值的下界和上界作為輸出參數(shù)對8個訓(xùn)練樣本進行訓(xùn)練仿真,訓(xùn)練效果較好,相對誤差均小于0.36%。為了驗證評價模型的推廣能力,對后3組樣本進行校驗預(yù)測,可得預(yù)測的區(qū)間數(shù)評價值分別為[0.564,0.764],[0.482,0.694]和[0.226,0.426],相應(yīng)的區(qū)間評價中值分別為0.652,0.588和0.326,分別對應(yīng)評價等級“好”“一般”和“較差”。該評價結(jié)果與文獻[5]所得的結(jié)論完全一致。由校驗樣本的預(yù)測結(jié)果可知,本文所建立的評價模型預(yù)測效果較好,具有較強的推廣能力。文獻[5]采用模糊神經(jīng)網(wǎng)絡(luò)方法得到的評價結(jié)果為模糊數(shù)形式,難以對處于同一評價等級的樣本進行有效排序,而利用本文所提出的評價模型所得到的區(qū)間數(shù)形式的評價結(jié)果,可以依據(jù)區(qū)間數(shù)的排序法則或區(qū)間數(shù)取中間值的方法對各個樣本進行評價排序,評價結(jié)果更加科學(xué)合理。
科學(xué)合理地評價圖書館數(shù)字資源服務(wù)績效水平,可以為圖書館提高數(shù)字資源服務(wù)能力和優(yōu)化數(shù)字資源建設(shè)策略提供理論依據(jù)和參考。本文基于構(gòu)建的數(shù)字資源服務(wù)績效評價指標體系,采用區(qū)間數(shù)理論和支持向量回歸機相結(jié)合的方法建立了數(shù)字資源服務(wù)績效評價模型。在此基礎(chǔ)上利用Matlab 7.0工具箱編寫了評價模型的仿真程序。在將模糊評價結(jié)果轉(zhuǎn)化為區(qū)間數(shù)的基礎(chǔ)上,利用區(qū)間數(shù)的下界和上界分別對樣本進行預(yù)測,進一步對得到的區(qū)間數(shù)形式的評價結(jié)果進行分析。通過與文獻[5]的評價結(jié)果進行對比分析,說明本文提出的智能評價方法是合理有效的,為數(shù)字資源服務(wù)績效智能評價提供了新的思路,有助于圖書館提高數(shù)字資源服務(wù)質(zhì)量和水平。
參考文獻
[1] 梁冬瑩,周慶梅,王克奇.基于層次分析法的數(shù)字資源服務(wù)績效評價體系構(gòu)建[J].情報科學(xué),2013,31(1):78?81.
LIANG Dongying, ZHOU Qingmei, WANG Keqi. An improved AHP?based performance evaluation system of digital resources service [J]. Information science, 2013, 31(1): 78?81.
[2] 李迎迎,王煥景,鄭春厚.高校圖書館數(shù)字資源服務(wù)的擬熵權(quán)糊綜合評價[J].圖書館論壇,2014,34(5):71?78.
LI Yingying, WANG Huanjing, ZHENG Chunhou. The quasi?entropy weight fuzzy comprehensive evaluation of digital resources service in university library [J]. Library tribune, 2014, 34(5): 71?78.
[3] 和媛媛,鞏在武.基于模糊多屬性決策的高校圖書館電子資源服務(wù)績效評價研究[J].情報科學(xué),2011,29(3):412?415.
HE Yuanyuan, GONG Zaiwu. Study on the service evaluation of academic library electronic resources based on multi?attribute decision making [J]. Information science, 2011, 29(3): 412?415.
[4] 賀秀英,王曉文,呼翠俠.基于模糊語義法的高校圖書館電子資源績效評價研究[J].情報理論與實踐,2016,39(2):113?115.
HE Xiuying, WANG Xiaowen, HU Cuixia. Research on the performance evaluation of university library electronic resources based on fuzzy semantic method [J]. Information studies: theory & application, 2016, 39(2): 113?115.
[5] 周慶梅,王克奇.圖書館數(shù)字資源服務(wù)績效模糊神經(jīng)網(wǎng)絡(luò)評價研究[J].情報科學(xué),2015,33(2):41?45.
ZHOU Qingmei, WANG Keqi. FBP based evaluation on performance of digital resource service of library [J]. Information science, 2015, 33(2): 41?45.
[6] 王根霞,王祖和,段德宏,等.基于區(qū)間數(shù)層次分析法的民用建筑太陽能熱水系統(tǒng)評價[J].沈陽建筑大學(xué)學(xué)報(自然科學(xué)版),2012,28(5):897?903.
WANG Genxia, WANG Zuhe, DUAN Dehong, et al. Evaluation based on interval number analytic hierarchy process for solar water heating system of civil buildings [J]. Journal of Shenyang Jianzhu University (Natural science), 2012, 28(5): 897?903.
[7] 關(guān)山,聶鵬.L?M優(yōu)化算法BP網(wǎng)絡(luò)在刀具磨損量預(yù)測中的應(yīng)用[J].機床與液壓,2012,40(15):22?26.
GUAN Shan, NIE Peng. Application of improved L?M optimization algorithm BP neural network in tool wear prediction [J]. Machine tool & hydraulics, 2012, 40(15): 22?26.
[8] 侍紅巖,吳曉強,張春友.基于支持向量回歸機的刀具壽命預(yù)測[J].工具技術(shù),2015,49(11):47?50.
SHI Hongyan, WU Xiaoqiang, ZHANG Chunyou. Prediction of cutting tool life based on support vector regression [J]. Tool engineering, 2015, 49(11): 47?50.
[9] 安文森,孫彥廣.一種新的支持向量回歸核函數(shù)構(gòu)建方法[J].信息與控制,2006,35(3):378?381.
AN Wensen, SUN Yanguang. A new method for constructing kernel function of support vector regression [J]. Information and control, 2006, 35(3): 378?381.
[10] 沈曉安.基于支持向量回歸機的反卷積技術(shù)[J].機床與液壓,2009,37(3):105?107.
SHEN Xiaoan. Study on deconvolution technique based on support vector regression [J]. Machine tool & hydraulics, 2009, 37(3): 105?107.