田 禹
(黑龍江東方學(xué)院,哈爾濱 150086)
OPAC是圖書館提供館藏信息的窗口,也是讀者自助式查詢圖書館館藏文獻信息的主要途徑[1],OPAC查詢?nèi)罩臼亲x者向圖書館提交信息需求請求的客觀真實反映,是分析讀者需求及館藏覆蓋情況的有力依據(jù)。
當(dāng)今,網(wǎng)絡(luò)文獻檢索最常用的方法就是關(guān)鍵詞匹配檢索和內(nèi)容分類檢索,它們都是直接使用自然語言的方法。機檢中,自然語言對表征文獻的主題內(nèi)容具有實質(zhì)意義[2]。所以,讀者通過向檢索入口輸入檢索語言來獲得文獻的同時,其實也是向圖書館直接表達自己的信息需求,而且,這種需求的迫切程度要遠高于圖書館向讀者征詢時所得到的反饋情況。
OPAC檢索框是讀者向圖書館提交信息需求最直接最便捷的入口,讀者點擊檢索按鈕實際上就是向圖書館提交了那時那刻他最明確最迫切的想法,就是直接告訴了我們他最想要的是什么。遺憾的是,對于如此明確的信息要求,圖書館卻沒有給予足夠的重視。現(xiàn)在多數(shù)圖書館對讀者自主檢索的做法并不關(guān)注,若檢索沒有命中也仿佛不干我事,若讀者強烈需要的一些文獻還需單獨向資源建設(shè)部門薦購。
OPAC系統(tǒng)是以Web方式發(fā)布的,Web服務(wù)器上都存有結(jié)構(gòu)性較好的訪問日志(Weblog),每當(dāng)有獲取資源的請求時,Web服務(wù)器都將記錄和積累這些數(shù)據(jù),包括所請求的URL、發(fā)出請求的用戶地址和時間戳等。不同的Web日志格式不盡相同,但內(nèi)容上都大同小異。
匯文OPAC系統(tǒng)以Apache作為Web服務(wù)器,Apache的訪問日志以文本形式存放于access.log文件中,每一行為一個訪問記錄,記錄內(nèi)容由7項構(gòu)成,第一項是遠程主機的地址;第二項用于記錄瀏覽者的E-mail地址,目前這項幾乎已是形同虛設(shè);第三項是當(dāng)網(wǎng)站的某些內(nèi)容要求用戶進行身份驗證時,用于記錄瀏覽者身份驗證時提供的名字;第四項是請求的時間;第五項是反應(yīng)服務(wù)器收到的是個什么樣的請求,包括方法、資源、協(xié)議;第六項是狀態(tài)代碼,它告訴我們請求是否成功;第七項表示發(fā)送給客戶端的總字節(jié)數(shù)[3]。盡管日志文件中包含著大量有用的信息,但這些信息是以文本方式存放在文件中的,并以流水賬的方式呈現(xiàn),所以我們不能馬上從中得出結(jié)論。只有經(jīng)過重新組織成結(jié)構(gòu)化數(shù)據(jù)并深入挖掘之后才能夠最大限度地發(fā)揮作用。在實際工作中,真正對OPAC查詢?nèi)罩居蟹治龊徒y(tǒng)計需求的資源建設(shè)人員出于技術(shù)上和權(quán)限上的限制,其實很難對以文本形式存放于文件中的流水帳進行數(shù)據(jù)挖掘和分析,導(dǎo)致我們一邊任由OPAC查詢記錄流失,一邊又在另花功夫聯(lián)系讀者,希望他們提供文獻需求信息。
(1)檢索詞是反映讀者信息需求的第一緊要素材,這是檢索行為本質(zhì)決定的,不再贅述。
(2)檢索語言的使用頻次反應(yīng)讀者對該內(nèi)容的需求程度。毋庸置疑,同一檢索詞使用一次和一萬次意義是不同的。統(tǒng)計分析之后,對采訪人員有很大的指導(dǎo)意義。
(3)某一時間段內(nèi)的檢索頻次反應(yīng)讀者的關(guān)注程度,可以和熱門借閱、熱門搜索配合分析。
(4)檢索詞命中與否可反映館藏覆蓋率,為完善館藏結(jié)構(gòu)提供參考。
(5)檢索命中記錄與借閱記錄配合分析可以看出同類文獻的文獻質(zhì)量與讀者偏好,如果某類文獻較高的檢索命中率與借閱次數(shù)無法匹配,則需分析這類文獻是屬于簡單瀏覽沒必要借閱還是因為文獻質(zhì)量與讀者預(yù)期有較大差距。這里提到的文獻質(zhì)量包括文獻適用水平、難易程度、開本大小、文獻時效性、發(fā)行單位等等。
(6)查詢記錄與借閱記錄配合分析可以為確定館藏復(fù)本數(shù)是否合理提供依據(jù),例如檢索頻次和借閱次數(shù)都很高的文獻應(yīng)該適當(dāng)考慮增加復(fù)本。
(7)檢索頻次高低的周期性可用于確定文獻的保障周期。例如讀者對考試類參考書的需求具有很強的周期性,參考查詢記錄中檢索詞頻次高低的周期性,可以擬定此類文獻的最遲流通時間。
(8)具體借閱室內(nèi)終端機的查詢記錄可用于分析館藏文獻布局是否合理。例如可探討考研類圖書是依分類法按學(xué)科分散排架還是入某一大類統(tǒng)一排架。
(9)可分析MARC規(guī)范語言與讀者檢索使用的自然語言之間的偏離程度,增強標(biāo)引的規(guī)范性和全面度,同時也可以看出是否需加強讀者培訓(xùn),引導(dǎo)其規(guī)范檢索行為,以提高其信息獲取能力。
(10)有讀者信息的查詢記錄反映出其獨特明確的興趣與偏好,可為圖書館開展個性化服務(wù)提供依據(jù)。讀者的檢索歷史中包含有豐富的個性化信息,通過追蹤和分析這些查詢記錄,可以從中挖掘出許多隱含的個性化信息。
筆者認(rèn)為,當(dāng)前主流圖書管理系統(tǒng)對于查詢記錄的重要性有一定的認(rèn)識,這一點體現(xiàn)在軟件開發(fā)時對查詢記錄的統(tǒng)計功能有所考慮,但是功能的開發(fā)程度還不夠,在應(yīng)用中還沒有形成成熟的分析利用方法。下面以國內(nèi)圖書館應(yīng)用比較廣泛的匯文、金盤、ILASIII為例,分析圖書管理系統(tǒng)的查詢記錄統(tǒng)計功能。
OPAC部分,館藏書目檢索界面的簡單檢索中,有熱門檢索詞列表,如圖1:
點擊“more”后,結(jié)果如圖2:
圖1
圖2
可以查看與某一具體檢索詞匹配的所有館藏,例如查看曾國藩(7),顯示如圖3:
匯文系統(tǒng)能查看一個月以內(nèi)的熱門檢索詞,除此之外,用戶登錄后還可以查看自己所有的查詢記錄。
同樣是OPAC部分,金盤系統(tǒng)書目查詢界面如圖4:
點擊“更多”可以看到以下界面:
圖3
圖4
由此界面可以看到的是檢索詞和使用次數(shù),系統(tǒng)并沒有告訴我們檢索詞使用的起止時間,無法統(tǒng)計檢索頻次的周期性,也沒有實現(xiàn)檢索詞和館藏的鏈接,不能直接查看館藏,如果想看與某一檢索詞匹配的館藏信息,還需要重新進入書目查詢界面查詢。
ILASIII沒有熱門檢索詞的記憶統(tǒng)計功能,但無需用戶登錄,即可查看單機的檢索歷史,退出該界面后,檢索歷史記錄消失,沒有IP記憶功能。
綜合以上國內(nèi)幾個主流圖書館自動化集成系統(tǒng)查詢記錄的顯見統(tǒng)計功能,它們都是在書目查詢?nèi)肟谶M入;只限定在紙質(zhì)文獻的檢索詞統(tǒng)計,電子資源沒有考慮在內(nèi);都有熱門借閱、熱門評價、熱門收藏的推介欄目,是對讀者檢索的一種指引和展示,告訴他們近期什么比較熱門,類似于一種推薦,而非圖書館工作人員的統(tǒng)計和分析,不是對讀者需求全面、科學(xué)的量化反應(yīng),很難形成理性的思考和判斷。
目前,國內(nèi)知名的網(wǎng)上書店亞馬遜和當(dāng)當(dāng)在顧客管理與需求分析上的做法有些是值得借鑒到圖書館查詢記錄統(tǒng)計功能的設(shè)計中的。信息時代,讀者期望通過一個檢索入口或者一次檢索行為就能得到所需求的廣泛信息,即通過統(tǒng)一的檢索平臺,不僅可以獲取本館館藏書目記錄,還可以獲得本館購買的電子資源、自建資源、光盤、多媒體資源并指向全文和鏈接[4],基于這個愿望的查詢記錄的統(tǒng)計和分析將更加有價值。
很多文獻資源的需求是有其特定的周期的,那么,反應(yīng)讀者需求的檢索頻次是體現(xiàn)這個周期的有力證明。故筆者借鑒當(dāng)當(dāng)網(wǎng)的熱搜詞匯時間區(qū)間趨勢圖(圖5),綜合匯文和金盤系統(tǒng)熱門檢索詞的統(tǒng)計功能,對圖書館在館藏資源(印刷型資源和數(shù)字資源)整合之后的查詢記錄統(tǒng)計工作提出新的設(shè)想。
查看一年內(nèi)該詞的搜索趨勢圖,如圖5所示:
圖5 當(dāng)當(dāng)網(wǎng)熱搜詞匯的排名表
上圖的箭頭表示當(dāng)前該搜索詞使用頻次的變化情況,以“連衣裙”的搜索趨勢為例,點擊查看,可以看到半年內(nèi)該詞的搜索趨勢圖,如圖6所示:
圖6和圖7說明不同的時間范圍內(nèi)同一檢索詞的使用頻次是不同的。同樣圖書館檢索詞使用的周期性也應(yīng)該在統(tǒng)計中有所反應(yīng),出于筆者所在高校圖書館假期時間安排情況的考慮,特將統(tǒng)計的時間區(qū)間設(shè)定為1-2月、3-6月、7-8月、9-12月和全年,以“身份”這一檢索詞為例,結(jié)果見表1:
圖6
圖7
與檢索詞匹配的命中結(jié)果可直接鏈接到館藏信息,可顯示包括命中記錄的借閱情況、文獻類型、分類、館藏地點等等。例如點擊命中結(jié)果數(shù)“印刷型9”,見圖 8。
查看一年內(nèi)該詞的搜索趨勢圖,如圖5所示:
圖8是尚未實現(xiàn)印刷型資源和數(shù)字資源整合的檢索結(jié)果,僅以此說明命中結(jié)果與館藏信息的鏈接情況。
表1
圖8
從圖8中可以清晰地反映某一時間段內(nèi)與檢索頻率為3的檢索詞“身份”相匹配的館藏資源有9條記錄,其中9條都是印刷型,以及文獻類型、借閱情況、館藏地點等信息。
OPAC查詢記錄是讀者信息需求的客觀反映。目前,國內(nèi)圖書館對于查詢記錄的統(tǒng)計分析尚處在起步探索階段,圖書管理系統(tǒng)也沒有為此功能的開展給予足夠的支持。我們不能停止探索此領(lǐng)域的步伐,也應(yīng)該明確,查詢記錄只是分析讀者信息需求的依據(jù)之一。在我們統(tǒng)計分析OPAC查詢記錄的同時,也應(yīng)該考慮讀者利用館藏資源的習(xí)慣不同、讀者信息素養(yǎng)的千差萬別以及讀者檢索時使用的自然語言與標(biāo)引規(guī)范語言的偏離等因素對檢索詞使用的影響,讓OPAC查詢記錄的統(tǒng)計和分析結(jié)果更好地為資源建設(shè)和信息服務(wù)所用。
[1]朱 茗.基于OPAC的書目信息推拉服務(wù)[J].圖書館學(xué)刊,2010,(8):70 -72.
[2]孔 莉,馬莎莎.關(guān)鍵詞檢索特性的計量學(xué)分析[J].現(xiàn)代情報,2010,(3):19 -21.
[3]林綺屏.基于OPAC日志的讀者需求分析[J].農(nóng)業(yè)圖書情報學(xué)刊,2006,(1):46 -49.
[4]曹 霞.OPAC基本功能研究概述[J].農(nóng)業(yè)圖書情報學(xué)刊,2008,(10):58 -60.