朱世偉,鞠鎂隆,于俊鳳,魏墨濟(jì),王蕾
(山東省科學(xué)院情報研究所,山東 濟(jì)南 250014)
數(shù)字資源(電子資源)是被設(shè)計用來存儲海量的結(jié)構(gòu)化或者半結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù)倉儲。近年來,隨著對數(shù)字圖書館和電子資源投入日漸加大,進(jìn)行數(shù)字資源績效評估的需求也更加迫切[1]。需要開發(fā)相關(guān)的績效評價模型來對電子資源的使用績效進(jìn)行評估。
美國圖書館界在20世紀(jì)60年代后期把在企業(yè)管理界應(yīng)用廣泛的績效評價方法引入到圖書館的服務(wù)績效評價中[2]。經(jīng)過近半個世紀(jì)的發(fā)展,相關(guān)專家學(xué)者對圖書館服務(wù)績效評價的概念和內(nèi)涵已經(jīng)達(dá)成了部分共識:圖書館的績效評價,就是按照給定的標(biāo)準(zhǔn)和要求,設(shè)定一定的指標(biāo),利用科學(xué)評價方法和模型,對一定資金和其它資源投入的圖書館在一定時間內(nèi)的產(chǎn)出和服務(wù)進(jìn)行評價和測試[3],也就是說,對圖書館在一定投入資本下的產(chǎn)出效益進(jìn)行評估和比較。
20世紀(jì)90年代中后期,以英美發(fā)達(dá)國家為首的部分國家和地區(qū)發(fā)起了一些針對數(shù)字圖書館服務(wù)績效進(jìn)行評估的項目,并由此建立了一些績效評價的標(biāo)準(zhǔn)和指南。主要有:(1)美國圖書館研究協(xié)會發(fā)起的“ARL電子圖書館服務(wù)評價(E-METRICS)”項目[4-5]對數(shù)字圖書館數(shù)字資源的服務(wù)績效的評估進(jìn)行了研究和分析,提出了一套數(shù)字資源績效評價的指標(biāo)體系,該體系共包含14個數(shù)字資源績效評價指標(biāo);(2)網(wǎng)絡(luò)電子資源在線使用統(tǒng)計(COUNTER)項目[6]設(shè)定了4大類數(shù)字資源使用的規(guī)范和準(zhǔn)則。截至目前,COUNTER已經(jīng)成為了數(shù)字圖書館績效評估方面的國際通用標(biāo)準(zhǔn)和規(guī)范;(3)歐洲圖書館績效評價和質(zhì)量管理系統(tǒng)EQUINOX項目從5個方面設(shè)定了14個指標(biāo)對數(shù)字資源服務(wù)績效進(jìn)行評價[7];(4)網(wǎng)絡(luò)環(huán)境中國家公共圖書館統(tǒng)計和績效測度項目出版了《公共圖書館網(wǎng)絡(luò)化服務(wù)統(tǒng)計和績效測度》手冊,提出了一整套對公共圖書館數(shù)字資源和服務(wù)進(jìn)行評價的統(tǒng)計指標(biāo)體系[7]。
國內(nèi)的相關(guān)研究多數(shù)都是獨立進(jìn)行的,幾乎沒有相關(guān)的學(xué)術(shù)團(tuán)體或者部門對該類項目的開展進(jìn)行任何形式的資助。索傳軍等[3]對電子資源在線使用統(tǒng)計進(jìn)行了分析,指出數(shù)字資源績效評價的主要目標(biāo)是為了促進(jìn)電子資源的標(biāo)準(zhǔn)化和易用性。黃穎[8]以用戶感知為中心的圖書館績效評價模型LibQUAL+TM為理論基礎(chǔ),進(jìn)一步剖析了學(xué)術(shù)環(huán)境下的滿意程度與服務(wù)質(zhì)量的辨證關(guān)系,構(gòu)建了一個以內(nèi)部圖書館專家群體確定和外部終端用戶群體感知為核心的、融合滿意程度和服務(wù)質(zhì)量的大學(xué)圖書館電子資源績效評價理論模型。史繼紅[9]比較了EQUINOX項目和ARL E-Metrics項目的評價結(jié)果,提出了包括不同方法優(yōu)缺點、指標(biāo)選取原則等在內(nèi)的一系列相關(guān)問題。
上述研究為數(shù)字資源建設(shè)做出了貢獻(xiàn),然而,當(dāng)前國內(nèi)的研究還存在兩個弊端:一是國內(nèi)學(xué)者開展的研究大多采用在國外廣為使用的方法和模型,對國內(nèi)高?;蛘吖D書館的數(shù)字資源提供的服務(wù)進(jìn)行績效評價,卻忽視了尋找符合我國實際情況的評價模型和指標(biāo)體系的工作;二是部分學(xué)者雖然提出了自己獨創(chuàng)的評價模型和方法,但是卻沒有進(jìn)行實驗分析和驗證。本文提出了模糊神經(jīng)網(wǎng)絡(luò)(fuzzy neural network,F(xiàn)NN)評價模型,對高校和公立圖書館數(shù)字資源的使用績效進(jìn)行評價,并選取數(shù)據(jù)進(jìn)行了實驗驗證。
模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示。為了簡單說明,我們假定本文考慮的模糊神經(jīng)網(wǎng)絡(luò)具有多個輸入和一個輸出。模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為5層結(jié)構(gòu),推理規(guī)則采用Takagi-Sugeno模糊推理邏輯,推理規(guī)則為[10]:
其中,Rk是第k個規(guī)則(1≤k≤L),L是規(guī)則的長度,x={xi},i=1,…,n為輸入向量,ωk是第 k個網(wǎng)絡(luò)的連接參數(shù)[11]。是Gaussian核函數(shù)定義的模糊集合:
圖1 模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Structure illustration of fuzzy neural network
其中 i=1,2,…,n,k=1,2,…,L,μik是 xi的成員函數(shù),cik和σik分別是Gaussian核函數(shù)的中心和寬度,n是輸入向量的數(shù)量,L是每個輸入變量成員函數(shù)的數(shù)量[12-13]。
模糊神經(jīng)網(wǎng)絡(luò)各層實現(xiàn)的主要功能如下:
第一層:輸入層,該層每一個節(jié)點代表一個輸入向量;
第二層:模糊化層,該層的每一個節(jié)點被劃分成L個組,每個組代表一個模糊規(guī)則的IF推理部分[14]。每一個節(jié)點都參與成員函數(shù)μik(xi)值的計算;
第三層:模糊推理層,該層的節(jié)點數(shù)目和模糊規(guī)則的數(shù)目相等,每個節(jié)點都參與計算第k個模糊規(guī)則Rk,其輸出為:
第四層:歸一化層,實現(xiàn)歸一化計算。節(jié)點的數(shù)目與第三層節(jié)點數(shù)目相等[15]。Nk節(jié)點的輸出為:
第五層:輸出層,輸出層只有一個節(jié)點,其輸出y為:
其中,ωk是規(guī)則k的連接參數(shù)(連接權(quán)值)。
傳統(tǒng)FNN輸入變量的成員函數(shù)數(shù)量需要根據(jù)專家知識來確定。然而,不同的模糊系統(tǒng)之間的差別是顯而易見的,因此,對于網(wǎng)絡(luò)設(shè)計者來說,針對特定系統(tǒng)選擇恰當(dāng)?shù)哪:?guī)則數(shù)不是一件容易的事情。此外,固定結(jié)構(gòu)的模糊神經(jīng)網(wǎng)絡(luò)在面對不同的數(shù)據(jù)集時的適應(yīng)性也是一個不可回避的問題。模糊規(guī)則過多或者過少都將會對系統(tǒng)的分析造成難以避免的錯誤和問題[16]。本文中模糊規(guī)則數(shù)的確定采用了由Qiao[17]提出的一種自組織的算法來執(zhí)行,該方法能夠自動地按照實際問題的需求確定模糊規(guī)則數(shù)。
模糊神經(jīng)網(wǎng)絡(luò)的自組織算法主要分為網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計和參數(shù)的優(yōu)化訓(xùn)練兩個步驟進(jìn)行。每個階段都假設(shè)數(shù)據(jù)集是由p個輸入-輸出對組成:
為給FNN選擇合適的模糊規(guī)則數(shù),我們在輸入輸出空間的劃分中采用了聚類算法,利用改進(jìn)的RPCL(Rival penalized competitive learning)[18]算法來獲得緊湊的網(wǎng)絡(luò)結(jié)構(gòu)。聚類的數(shù)量在訓(xùn)練的過程中自動的獲得,以此來獲得可伸縮性的輸入輸出空間劃分方法和優(yōu)化的模糊規(guī)則數(shù)。然后,刪除部分冗余節(jié)點和連接,產(chǎn)生最終優(yōu)化的模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
網(wǎng)絡(luò)結(jié)構(gòu)確定以后,便進(jìn)入優(yōu)化學(xué)習(xí)階段,該階段將采用自組織學(xué)習(xí)階段獲得的參數(shù)初始化網(wǎng)絡(luò)。參數(shù)的優(yōu)化在相同的數(shù)據(jù)集合S上利用改進(jìn)的反向傳播算法(Back propagation algorithm)執(zhí)行,以獲得最終的最優(yōu)網(wǎng)絡(luò)模型[19]。
給定集合S中任意的輸入xp,根據(jù)公式(1)~(4),可以得到網(wǎng)絡(luò)的輸出為:
假設(shè)網(wǎng)絡(luò)誤差函數(shù)為:
其中,yp和是p維的網(wǎng)絡(luò)輸出值和期望輸出值,可以得到:
從公式(8)可以計算得到:
同樣的我們可以分別得到方差σik和權(quán)值ωk,計算公式分別如式(10)、(11)所示:
數(shù)字資源服務(wù)績效評價系統(tǒng)是一個結(jié)構(gòu)復(fù)雜的系統(tǒng),包含特定的使用環(huán)境、服務(wù)條件和數(shù)字資源服務(wù)效益等諸多影響因素,因此,需要通過對數(shù)字資源的服務(wù)績效在縱向和橫向上進(jìn)行比較,以此來確定最佳的評價指標(biāo),如此一來,便無形中提高了評價指標(biāo)選取的難度。本文在評價指標(biāo)的選取時,考慮借鑒美國國家信息標(biāo)準(zhǔn)化組織(NISO)頒布的《信息服務(wù)和使用:圖書館和信息服務(wù)機(jī)構(gòu)統(tǒng)計指標(biāo)——數(shù)據(jù)字典(ANSI/NISO Z39.7-2004)》標(biāo)準(zhǔn),同時結(jié)合我國數(shù)字圖書館建設(shè)的實際狀況,依據(jù)科學(xué)性與全面性、定量指標(biāo)與定性指標(biāo)、可比性與可操作性等原則相結(jié)合,構(gòu)建了一套數(shù)字資源服務(wù)績效評價的指標(biāo)體系框架[3,6]。
綜上所述,本文選取的數(shù)字資源服務(wù)績效評價指標(biāo)如表1所示。
表1 績效評價指標(biāo)Table 1 Performance evaluation index
本文主要目標(biāo)是為了驗證所提出的評價模型和方法的可行性與準(zhǔn)確性,為了便于說明,我們以山東省內(nèi)高校、科研院所的數(shù)字圖書館提供的數(shù)字資源為例,采集其2005—2010年的統(tǒng)計數(shù)據(jù)為研究對象。對樣本數(shù)據(jù)進(jìn)行初步的分析,剔除難以獲取的數(shù)據(jù)和上述指標(biāo)數(shù)據(jù)不完整的數(shù)字資源樣本,得到的研究樣本共計120家,其中訓(xùn)練樣本和檢驗樣本數(shù)量分別為80和40。
隨著輸入維數(shù)的增加,F(xiàn)NN的模糊規(guī)則數(shù)量將按照指數(shù)級增加,因此,當(dāng)輸入節(jié)點的數(shù)量過多時,就必然會增加模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜度,進(jìn)而增加網(wǎng)絡(luò)訓(xùn)練的時間。為有效地克服上述問題,同時在最大程度上減少主觀因素對于網(wǎng)絡(luò)評價結(jié)果的影響,本文所采用的神經(jīng)網(wǎng)絡(luò)將利用分層次的遞接評價方法。該方法首先利用BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本數(shù)據(jù),對定性評價指標(biāo)則采用模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和學(xué)習(xí),對經(jīng)過BP網(wǎng)絡(luò)和FNN網(wǎng)絡(luò)訓(xùn)練得到的結(jié)果再利用FNN進(jìn)行模糊評價,最終得到數(shù)字資源績效評價的結(jié)果。我們假設(shè)最終的評價結(jié)果集合為F:Y→Z={優(yōu)、良、中、差}。其中,Y為模糊神經(jīng)網(wǎng)絡(luò)的最后輸出結(jié)果,Z為數(shù)字資源對應(yīng)的績效評價等級。
本文構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)為3層結(jié)構(gòu),其中輸入層神經(jīng)元數(shù)個是20,輸出層神經(jīng)元個數(shù)為1(輸出結(jié)果為數(shù)字資源服務(wù)績效的等級)。利用逐次對比和試用的方法,最終確定當(dāng)隱含層神經(jīng)元數(shù)為15時,BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差最小,訓(xùn)練時間最短。BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的誤差曲線如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線Fig.2 Training error curve of BP neural network
圖3 FNN均方誤差變化曲線Fig.3 Mean square error curve of FNN
圖4 FNN的實際輸出與期望輸出Fig.4 Practical output and expected output of FNN
由定性評價指標(biāo)構(gòu)建的模糊神經(jīng)網(wǎng)絡(luò)FNN,由6個輸入指標(biāo)、1個模糊輸出和由16個神經(jīng)元組成的模糊化層組成,該網(wǎng)絡(luò)的模糊規(guī)則數(shù)量為256(實驗分析得出)。
最終構(gòu)造的FNN包含2個輸入節(jié)點(定量評價指標(biāo)等級結(jié)果和定性評價指標(biāo)等級結(jié)果)、1個輸出節(jié)點(數(shù)字資源服務(wù)績效評價結(jié)果),其中的模糊化層包含12個神經(jīng)元,模糊規(guī)則數(shù)為24條。網(wǎng)絡(luò)訓(xùn)練過程中產(chǎn)生的均方誤差曲線如圖3所示。
從圖3中可以得到,樣本數(shù)據(jù)訓(xùn)練的均方誤差曲線相對平穩(wěn),當(dāng)均方誤差達(dá)到1.7843×10-5時,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效果為最好。
最后把檢驗樣本數(shù)據(jù)輸入到訓(xùn)練完成的模糊神經(jīng)網(wǎng)絡(luò)中,進(jìn)行數(shù)字資源服務(wù)績效評價。我們得到網(wǎng)絡(luò)的期望輸出(用戶主觀評價結(jié)果)與網(wǎng)絡(luò)實際輸出如圖4所示,其中平均誤差為0.0019。
從圖4我們可以得到,本研究提出的模糊神經(jīng)網(wǎng)絡(luò)評價模型能夠較好地完成電子資源績效評價的任務(wù),績效評價的時間效率和準(zhǔn)確率都比較理想。通過對實驗結(jié)果的分析,我們發(fā)現(xiàn)模糊神經(jīng)網(wǎng)絡(luò)電子資源績效評價的準(zhǔn)確率達(dá)到了83.7%,表明基于模糊神經(jīng)網(wǎng)絡(luò)的電子資源績效評價模型和方法是切實可行的。
本研究提出的模糊神經(jīng)網(wǎng)絡(luò)電子資源績效評價模型方法,較好地完成了電子資源績效評價的任務(wù),并且由于有效地克服了傳統(tǒng)的基于統(tǒng)計的評價模型與方法的不足,減少了主觀因素對評價結(jié)果的影響,提高了評價結(jié)果的客觀性和準(zhǔn)確率。
[1]曾照云,張永杰,楊蘭芝.數(shù)字資源服務(wù)績效評估研究綜述[J].圖書館和信息服務(wù),2008,52(8):54-57.
[2]余勝.關(guān)于圖書館績效評估的研究與實踐[J].中國圖書館學(xué)報,2006(4):101104.
[3]索傳軍,王建朋.國外電子資源在線使用統(tǒng)計研究述評[J].圖書館,2006(6):43-46.
[4]BLIXRUD J C.Measures for electronic use:The ARL E-metrics project[J].Statistics in Practice-Measuring& Managing,2002,9:73-84.
[5]MILLER R,SCHMID S.E-metrics:Measures for electronic resources[J].The Journal for the Serial Community,2002,15(1):19-25.
[6]索傳軍.論電子資源在線使用統(tǒng)計數(shù)據(jù)的收集與分析[J].中國圖書館學(xué)報,2006,32(3):65-68.
[7]張秀華,楊洪勇,宋艷梅.基于灰色關(guān)聯(lián)分析和BP神經(jīng)網(wǎng)絡(luò)的數(shù)字資源服務(wù)績效評價研究[J].情報學(xué)報,2010,29(3):468-473.
[8]黃穎.圖書館電子資源績效評價模型構(gòu)建分析[J].現(xiàn)代情報,2009,29(8):106-107.
[9]史繼紅.兩個重要的電子資源使用績效評價體系的比較:歐洲的EQUINOX項目與美國的ARL E-metrics項目[J].數(shù)字圖書館論壇,2007,38(7):53-57.
[10]ZHANG Y.Application of T-S fuzzy neural network based on declination compensation in soft sensing[J].Mathematics and Computers in Simulation,2011,32(12):1 -8.
[11]BARBOUNIS T G,THEOCHARIS J B.A locally recurrent fuzzy neural network with application to the wind speed prediction using spatial correlation[J].Neurocomputing,2007,70(10):1525 -1542.
[12]KHAYAT O,EBADZADEH M M,SHAHDOOSTI H R,et al.A novel hybrid algorithm for creating self-organizing fuzzy neural networks[J].Neurocomputing,2009,73(1):517 -524.
[13]DENG X S,WANG X Z.Incremental learning of dynamic fuzzy neural networks for accurate system modeling[J].Fuzzy Sets and Systems,2009,160(5):972 -987.
[14]LENG G,McCINNITY T M,G Prasad,et al.An approach for on-line extraction of fuzzy rules using a self-organizing fuzzy neural network[J].Fuzzy Sets and Systems,2005,150(10):211 -243.
[15]YE B,YU Z,PAVLIKOVSKAYA E,et al.The neo-fuzzy neural network structure optimization using the GMDH for the solving forecasting and classification problems[C]//IWIM,2009.Krynica,Poland:IEEE computer society,2009:77 -89.
[16]LIN C T,YEH C M,CHUNG J F,et al.Suppoet-vector-based fuzzy neural networks[J].International Journal of Computational Intelligence Research,2005,1(2):138-150.
[17]QIAO J F,WANG H D.A self-organizing fuzzy neural network and its applications to function approximation and forecast modeling[J].Nurocomputing,2008,71(2):564-569.
[18]ALIEV R A,GUIRIMOV B G,F(xiàn)AZLOLLAHI B,et al.Evolutionary algorithm-based learning of fuzzy neural networks:Recurrent fuzzy neural networks[J].Fuzzy Sets and Systems,2009,160(8):2553 -2566.
[19]NAIR T M,ZHENG C L,F(xiàn)INK J L,et al.Rival penalized competitive learning(RPCL):A topology-determining algorithm for analyzing gene expression data[J].Compute Biol Chem,2003,27(6):565-574.