文 / 邱爽
服務(wù)主導(dǎo)型數(shù)字圖書館用戶檔案的分類挖掘
文 / 邱爽
數(shù)字圖書館是圖書館發(fā)展歷史上一次技術(shù)革新和形式革新。數(shù)字圖書館對用戶檔案進(jìn)行分類分析和挖掘的必要性在于:是建立服務(wù)主導(dǎo)型數(shù)字圖書館的客觀要求;充分發(fā)揮圖書館內(nèi)用戶檔案信息資源作用的內(nèi)在需要。服務(wù)主導(dǎo)型數(shù)字圖書館用戶檔案采用分類挖掘的方法主要有:建立用戶檔案分類體系;建立用戶檔案分類體系的方式;重視挖掘與分析用戶檔案;打造用戶檔案數(shù)字服務(wù)平臺。
服務(wù)主導(dǎo)型;數(shù)字圖書館;用戶檔案;分類;挖掘
數(shù)字圖書館是圖書館發(fā)展史上一次技術(shù)革新和形式革新。其特征是用圖書數(shù)字資源的分布存儲和管理、檢索與分享來進(jìn)行圖書館服務(wù)。數(shù)字圖書館強(qiáng)調(diào)信息的開放。當(dāng)前各國數(shù)字圖書館的建設(shè)有一個明顯的趨勢,就是建立服務(wù)主導(dǎo)型的數(shù)字圖書館。為了更好地為讀者服務(wù),對圖書館用戶進(jìn)行數(shù)字檔案的研究就顯得特別重要[1]。檔案作為一種特殊的信息來源,有著巨大的經(jīng)濟(jì)與社會價(jià)值。而圖書館作為文化的交流中心,更要重視對用戶檔案進(jìn)行研究。
數(shù)字圖書館必須重視對用戶檔案進(jìn)行分類分析和挖掘,其必要性主要體現(xiàn)在兩個方面。
在網(wǎng)絡(luò)環(huán)境下,數(shù)字化圖書館是通過對館藏資源進(jìn)行加工和整理,并建立起數(shù)據(jù)庫,供用戶使用。因此,數(shù)字圖書館的建設(shè)必須強(qiáng)調(diào)為用戶服務(wù)。無論是資源的數(shù)字化還是數(shù)據(jù)庫的使用,都是為了便利讀者獲取信息、借閱到相關(guān)的資源。在這種背景下,建立用戶檔案并進(jìn)行分類就顯得特別重要。通過對用戶檔案進(jìn)行分類和挖掘,可以有效梳理讀者的興趣、愛好、借閱習(xí)慣,從而讓圖書館更好地為讀者服務(wù)。
對于圖書館來說,讀者是一個非常重要的資源。沒有讀者的圖書館只能稱之為圖書倉庫,沒有存在的價(jià)值。當(dāng)前,我國圖書館的用戶檔案資源并沒有得到充分的利用,大部分圖書館對用戶檔案只是簡單登記,或者僅僅根據(jù)一些基本的性別、年齡等進(jìn)行分類,缺乏從用戶需求等方面來進(jìn)行有效的分類。其實(shí),現(xiàn)在數(shù)字圖書館的建設(shè)離不開網(wǎng)絡(luò)環(huán)境,網(wǎng)絡(luò)環(huán)境下圖書館的學(xué)術(shù)研究和服務(wù)工作都需要依托用戶在使用圖書館過程中所產(chǎn)生的用戶檔案,有效利用這些用戶檔案信息是數(shù)字圖書館發(fā)展的前提[2]。因此,為用戶建立起一個具有豐富信息的檔案數(shù)據(jù)庫,并充分地挖掘其內(nèi)在的價(jià)值,分析用戶真正的需求,辨別普遍性需求和特殊需求,對于數(shù)字圖書館充分發(fā)揮價(jià)值,更好地服務(wù)用戶具有重要的意義。因此,加強(qiáng)對用戶檔案信息的分類和挖掘是充分發(fā)揮圖書館內(nèi)用戶檔案信息資源作用的內(nèi)在需要。
在建設(shè)服務(wù)主導(dǎo)型的數(shù)字圖書館時,對用戶檔案的分類與挖掘工作可以采用以下幾種方法。
服務(wù)主導(dǎo)型數(shù)字圖書館如果要順利地挖掘用戶檔案,必須先把檔案的管理體系搭建好。為了更好地實(shí)施管理,必須要建立起一個行之有效、科學(xué)合理的用戶檔案分類體系。下面以一所數(shù)字圖書館的用戶檔案分類體系為例,來說明數(shù)字圖書館如何構(gòu)建用戶檔案分類體系。用戶檔案分類體系的一級目錄有三塊,分別是“用戶信息檔案”、“ 讀者服務(wù)檔案”、“用戶各類統(tǒng)計(jì)檔案”。一級目錄下還有二級目錄、三級目錄。一級目錄“用戶信息檔案”下面,就細(xì)分為四個二級子目錄,分別是“用戶基本信息檔案”、“用戶專業(yè)信息檔案”、“用戶特征信息檔案”、“特殊用戶信息檔案”。 一級目錄“讀者服務(wù)檔案”下面,細(xì)分為四個二級子目錄,分別是“基本服務(wù)檔案”、“信息咨詢服務(wù)檔案”、“信息素質(zhì)教育”、“讀者評價(jià)”。四個二級子目錄下面又分別設(shè)“借閱服務(wù)檔案”、“網(wǎng)上服務(wù)檔案”、“館際互借檔案”、“其他服務(wù)檔案”、“信息咨詢”、“學(xué)科導(dǎo)航”、“文獻(xiàn)傳送”、“信息編譯報(bào)道”、“揭示報(bào)道”、“讀者入門教育”、“文獻(xiàn)檢索教育”和“其他”。而一級目錄“用戶各類統(tǒng)計(jì)檔案”下面,又分設(shè)二級子目錄“用戶借閱統(tǒng)計(jì)檔案”、“用戶閱讀統(tǒng)計(jì)檔案”、“館際互借統(tǒng)計(jì)檔案”[3]。這一用戶檔案分類體系從服務(wù)的角度出發(fā),將整個用戶檔案分為信息、讀者服務(wù)、各類統(tǒng)計(jì)三大類目,而對于用戶信息檔案又細(xì)分為基本信息、專業(yè)信息、特征信息、特殊用戶信息等,這構(gòu)成了圖書館用戶檔案的主體。服務(wù)檔案又細(xì)分為基本服務(wù)、信息咨詢、素質(zhì)教育、讀者評價(jià),這構(gòu)成了用戶檔案的重點(diǎn)。各類統(tǒng)計(jì)檔案細(xì)分為用戶借閱統(tǒng)計(jì)檔案、用戶閱讀統(tǒng)計(jì)檔案和館際互借統(tǒng)計(jì)檔案,這是對讀者服務(wù)的一種延伸。以上是某個數(shù)字圖書館用戶檔案分類體系的模板。在實(shí)際操作中,每個數(shù)字化圖書館可以根據(jù)這個模板并結(jié)合自己所提供的服務(wù)特點(diǎn)來制定特色的用戶檔案分類體系。
當(dāng)前,大部分?jǐn)?shù)字圖書館都建立起了專屬的網(wǎng)站,但在用戶訪問網(wǎng)站時,一些數(shù)字圖書館只用網(wǎng)站計(jì)數(shù)器插件來進(jìn)行用戶訪問的簡單統(tǒng)計(jì)。這種記錄方式只能記錄用戶瀏覽網(wǎng)站的次數(shù),而對用戶在網(wǎng)站上搜索與查看的過程缺少記錄與分析,無法呈現(xiàn)出讀者的個性化信息需求,也無法記錄讀者信息活動真正有價(jià)值的部分。究其原因,主要是因?yàn)檫@種記錄方式?jīng)]有將讀者在圖書館網(wǎng)站上的信息行為與閱讀行為、檢索行為聯(lián)系在一起,形成一種與閱讀有關(guān)的個人信息,也就無法對用戶檔案進(jìn)行整合,無法提供信息化個性服務(wù)。每個數(shù)字化圖書館的特點(diǎn)都不同,應(yīng)依據(jù)自身的特點(diǎn),找到適合自己所提供服務(wù)的方式方法。
許多數(shù)字圖書館都會在官方網(wǎng)站上開設(shè)個性化服務(wù)的注冊入口,一般都要注冊成網(wǎng)站會員。當(dāng)用戶進(jìn)入注冊頁面時,大部分網(wǎng)站只要求填寫基本的信息。如果想得到個性化服務(wù)或訂制服務(wù),就需要輸入一些更加詳細(xì)的信息。例如,用戶受教育的經(jīng)歷、專業(yè)知識結(jié)構(gòu)、感興趣的知識類型、閱讀傾向、獲取信息的習(xí)慣方式、借閱的時間段、詳細(xì)的聯(lián)系方式等。圖書館根據(jù)用戶在注冊時提供的信息,可以進(jìn)行信息的分析與挖掘,利用這些信息為用戶提供具有針對性的服務(wù)[4]。還有的數(shù)字圖書館網(wǎng)站采用讓用戶定制信息的方式來建立用戶檔案,在專門的網(wǎng)頁上搜集用戶的信息。網(wǎng)頁上提供頁面定制、檢索定制、資源定制等多種服務(wù)選項(xiàng),讓用戶自主進(jìn)行選擇,而網(wǎng)站服務(wù)器會在后臺根據(jù)用戶的選擇情況進(jìn)行在線分析,梳理出用戶的閱讀特征,找到用戶的信息需求點(diǎn),從而更加有效地開展推送服務(wù)[5]。有些數(shù)字圖書館網(wǎng)站采用了更直接的用戶檔案記錄方式,即從用戶登陸網(wǎng)站開始,就對用戶的信息行為進(jìn)行全程的記錄與跟蹤。通過這種網(wǎng)站記錄方式,產(chǎn)生用戶專屬的日志檔案。通過對這種日志檔案的動態(tài)分析,深入了解用戶的信息查找行為,可以分析出用戶在使用數(shù)字圖書館時的目的和內(nèi)在的信息需求。[6]
再好的數(shù)據(jù)與檔案,沒有科學(xué)的挖掘與分析,也只能稱之為數(shù)據(jù)垃圾。在數(shù)字圖書館用戶檔案建立好之后,要重視對其進(jìn)行挖掘與分析。這是最重要的一項(xiàng)工作。對于數(shù)字圖書館來說,對用戶檔案的挖掘與分析可以從三個方面依次進(jìn)行。首先,對用戶行為進(jìn)行分析。這主要是指用戶通過互聯(lián)網(wǎng)對數(shù)字圖書館的資源進(jìn)行訪問時會留下痕跡,如果對這種行為痕跡進(jìn)行分析就可以得到有用的信息。通過這種分析,可以得到用戶的興趣點(diǎn)和愛好傾向。[7]例如,有的數(shù)字圖書館對用戶訪問內(nèi)容進(jìn)行分析,找到用戶最喜歡的瀏覽方式,從而為網(wǎng)上圖書資源中最熱門的資源制定更為方便的訪問路徑,以便用戶能更快捷地查找或應(yīng)用相關(guān)資源。其次,收集用戶所需要的信息。在對用戶行為進(jìn)行分析的基礎(chǔ)上,可以利用網(wǎng)絡(luò)確定用戶的需求,知道哪些資源是用戶急需的,哪些資源是用戶需求較少的,并據(jù)此來整合館內(nèi)全部資源。這尤其強(qiáng)調(diào)信息的準(zhǔn)確可靠。為了保證這一點(diǎn),還要對收集整理的信息進(jìn)行相關(guān)性分析。例如,根據(jù)用戶在網(wǎng)上搜索時所輸入的關(guān)鍵詞,來檢查搜索到的信息和這些關(guān)鍵詞的相關(guān)度。現(xiàn)在最為常見的相關(guān)度分析,是通過限制域或詞頻進(jìn)行控制。再次,為用戶推送信息或?qū)τ脩暨M(jìn)行信息反饋。在前期工作的基礎(chǔ)上,數(shù)字圖書館可以為用戶提供個性化的資源服務(wù),可以通過信息推送技術(shù)將用戶感興趣的信息提供在用戶面前。有些數(shù)字圖書館為了進(jìn)一步提高服務(wù)質(zhì)量,提升用戶的使用體驗(yàn),還在用戶使用后提供了反饋環(huán)節(jié),請求用戶對提供的信息有效度進(jìn)行反饋。在收到用戶反饋后,他們還會再次對反饋來的信息進(jìn)行分析,以進(jìn)一步完善用戶檔案信息庫。
在對服務(wù)主導(dǎo)型數(shù)字圖書館用戶檔案進(jìn)行分類挖掘的過程中,建立一個高質(zhì)量的數(shù)字服務(wù)平臺就顯得格外重要。這個服務(wù)平臺要能夠集成信息、提供信息服務(wù);要以用戶檔案為中心,把信息資源保障體系化,將各個環(huán)節(jié)鏈接成一個有機(jī)的整體,讓用戶的檔案信息真正成為用戶信息的關(guān)鍵。這個信息服務(wù)平臺還應(yīng)包括統(tǒng)一的訪問平臺和咨詢平臺[8]。這主要是為了解決異構(gòu)平臺的信息資源檢索問題,讓用戶可以在一個界面上完成多種信息檢索的功能。各個數(shù)字圖書館還應(yīng)相互聯(lián)系、相互協(xié)調(diào)、相互開放資源;甚至可以讓同一個用戶產(chǎn)生的檔案,在各個數(shù)字圖書館共享,這樣不同的數(shù)字圖書館能夠?yàn)橥挥脩籼峁﹤€性化服務(wù),甚至可以讓一個讀者在一次搜索中,就可以搜得不同數(shù)據(jù)庫里的資源,而不必一個一個數(shù)據(jù)庫檢索。這不但提高了讀者的資源查找效率,也更加有效地利用各個數(shù)字圖書館的資源。從這個角度來看,只有建立統(tǒng)一的信息訪問平臺,讓用戶檔案的資源共享,才能更好地為讀者提供服務(wù)。隨著數(shù)字圖書館和電子文獻(xiàn)的檢索服務(wù)越來越普及,讀者的需求也越來越大。建立一個用戶檔案數(shù)字服務(wù)平臺,是發(fā)揮數(shù)字圖書館服務(wù)作用的重要一環(huán),必須加大研究與開發(fā)的力度。
從整體上來看,目前我國數(shù)字圖書館還沒有足夠地重視用戶服務(wù),能夠?yàn)樽x者提供個性化服務(wù)的圖書館少之又少。在服務(wù)型數(shù)字圖書館建設(shè)的大背景下,圖書館用戶檔案問題已成為研究的一個熱點(diǎn)。網(wǎng)絡(luò)環(huán)境下圖書館用戶檔案分類和挖掘問題受到越來越多的重視?,F(xiàn)階段,我國各大圖書館的用戶檔案會保持以實(shí)物檔案為主的現(xiàn)狀。但隨著技術(shù)的發(fā)展與網(wǎng)絡(luò)應(yīng)用程度的加深,傳統(tǒng)的紙質(zhì)用戶檔案終究會被電子檔案所取代,而對用戶檔案進(jìn)行的分類也會進(jìn)一步細(xì)化,挖掘會不斷加深。依據(jù)對用戶檔案進(jìn)行挖掘來為用戶提供個性化服務(wù)將成為新一代服務(wù)型數(shù)字圖書館的基本特征。
[1]程大帥.“互聯(lián)網(wǎng)+”時代城鎮(zhèn)圖書檔案數(shù)字化建設(shè)研究[J].山西檔案,2017,(1).
[2]李鳳強(qiáng).圖書檔案信息資源共建模式研究[J].山西檔案,2017,(1).
[3]余敏.歐美過刊數(shù)字化途徑研究及對我國的啟示[J].出版廣角,2014,(Z3).
[4]王為.公共文化視角下檔案、圖書及出版的數(shù)字化融合[J].出版廣角,2015,(8).
[5]何曉林.圖書館用戶評議數(shù)字檔案研究[J].圖書館,2015,(4).
[6]李慧.用戶檔案信息在高校數(shù)字圖書館服務(wù)中的價(jià)值[J].大學(xué)圖書情報(bào)學(xué)刊,2014,(5).
[7]杜成軍.域下知識管理視域下的數(shù)字圖書館用戶檔案視究[J].電子測試,2013,(12).
[8]張正.數(shù)字圖書館用戶研究[J].圖書館,2004,(1).
G251
A
1005-9652(2017)03-0110-03
(責(zé)任編輯:虞志堅(jiān))
邱爽(1982-),女,河北唐山人,碩士,唐山學(xué)院圖書館館員,研究方向:讀者服務(wù)。