熊培松
摘 要:面對用戶日益增多的個(gè)性化知識(shí)推薦需求,圖書館開展基于知識(shí)挖掘的個(gè)性化推薦服務(wù),不僅是提高用戶滿意度的要求,還是圖書館創(chuàng)新工作的研究重點(diǎn)。文章分析了圖書館知識(shí)挖掘的應(yīng)用情況及基于知識(shí)挖掘的圖書館個(gè)性化推薦服務(wù)需求,研究了圖書館個(gè)性化推薦服務(wù)模式中知識(shí)挖掘的實(shí)現(xiàn)方法,構(gòu)建了基于知識(shí)挖掘的圖書館個(gè)性化推薦服務(wù)模式。
關(guān)鍵詞:知識(shí)挖掘;圖書館;個(gè)性化推薦;服務(wù)
中圖分類號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2019)03-0093-03
信息時(shí)代,人們對知識(shí)的需求呈現(xiàn)出多元化、個(gè)性化的趨勢,傳統(tǒng)的信息服務(wù)模式逐漸失去競爭力。圖書館作為信息存儲(chǔ)與知識(shí)傳播中心,不僅應(yīng)發(fā)揮信息傳播功能,還應(yīng)扮演好信息梳理和整合者的角色,以滿足用戶更高層次的知識(shí)需求。圖書館的個(gè)性化服務(wù)包括個(gè)性化推薦、個(gè)性化定制等,能夠改變圖書館被動(dòng)服務(wù)的局面,全面提升用戶使用信息的效率。
1 圖書館個(gè)性化服務(wù)中的知識(shí)挖掘分析
1.1 知識(shí)挖掘的概念
知識(shí)挖掘是對數(shù)據(jù)挖掘的延伸,完全沿用了傳統(tǒng)的數(shù)據(jù)挖掘方法。國外學(xué)者率先將數(shù)據(jù)挖掘引入知識(shí)服務(wù)領(lǐng)域,從技術(shù)層面分析知識(shí)管理方法,借助可視化數(shù)據(jù)處理工具和數(shù)據(jù)挖掘技術(shù)構(gòu)建可行的知識(shí)挖掘系統(tǒng),對已有的知識(shí)進(jìn)行深入挖掘。數(shù)據(jù)挖掘轉(zhuǎn)變?yōu)橹R(shí)挖掘的目的在于發(fā)現(xiàn)知識(shí)的分布特征,提高知識(shí)的創(chuàng)新能動(dòng)性,是知識(shí)學(xué)習(xí)的核心內(nèi)容[1]。將知識(shí)挖掘看作是對大數(shù)據(jù)的深入探索,可以從中揭示隱含的規(guī)律,并使之進(jìn)一步模型化。知識(shí)挖掘概念的提出為圖書館處理非結(jié)構(gòu)化數(shù)據(jù)提供了便利,使大數(shù)據(jù)的層次更加清晰,聚合更加有序,并轉(zhuǎn)化為可供用戶參考的知識(shí)。
1.2 知識(shí)挖掘的內(nèi)容
知識(shí)是高于數(shù)據(jù)的,是包括數(shù)據(jù)、關(guān)聯(lián)信息、經(jīng)驗(yàn)見解等多種要素的動(dòng)態(tài)集。知識(shí)挖掘包含隱性知識(shí)、顯性知識(shí)、數(shù)據(jù)處理三個(gè)層面,三者之間的關(guān)系見圖1。圖書館引入知識(shí)挖掘技術(shù),可以從煩雜的用戶數(shù)據(jù)中推斷用戶尚未表達(dá)的隱含信息,并據(jù)此判斷用戶的行為變化,進(jìn)而實(shí)現(xiàn)用戶知識(shí)的深入分析。獲取用戶知識(shí)是個(gè)性化服務(wù)的關(guān)鍵內(nèi)容,也是圖書館提供滿足用戶需求資源及提高自身競爭優(yōu)勢的必要條件。知識(shí)挖掘還可以應(yīng)用于學(xué)科資源整合,圖書館利用知識(shí)挖掘技術(shù)對學(xué)科資源進(jìn)行科學(xué)分類與定量分析,可以發(fā)現(xiàn)其中的隱性知識(shí),從而掌握知識(shí)之間的聯(lián)系。
1.3 知識(shí)挖掘與個(gè)性化服務(wù)
圖書館引入知識(shí)挖掘的根本目的是為了通過資源管理的變革促進(jìn)知識(shí)創(chuàng)新[2],利用知識(shí)管理技術(shù)保障圖書館的館藏資源能夠真正被用戶使用。知識(shí)挖掘的過程就是實(shí)現(xiàn)知識(shí)傳遞、加工及創(chuàng)新的過程,這一過程實(shí)現(xiàn)了多種知識(shí)的融合,能夠更好地滿足圖書館開展個(gè)性化服務(wù)的需求。知識(shí)挖掘與圖書館的個(gè)性化服務(wù)目標(biāo)是一致的,二者的結(jié)合可以更好地體現(xiàn)知識(shí)服務(wù)的價(jià)值[3]。圖書館構(gòu)建個(gè)性化服務(wù)體系是一個(gè)漫長且持續(xù)的過程,在不斷探索與實(shí)踐的過程中需要先進(jìn)的資源管理技術(shù)給予支撐。而知識(shí)挖掘可以為圖書館的個(gè)性化服務(wù)及個(gè)性化資源的挖掘和利用提供支持,能夠更好地提升圖書館的服務(wù)水平。
2 基于知識(shí)挖掘的圖書館個(gè)性化推薦服務(wù)需求
2.1 用戶需求
圖書館用戶由于知識(shí)結(jié)構(gòu)和觀念認(rèn)知的差異,存在個(gè)性化知識(shí)需求,同時(shí)對圖書館的服務(wù)要求也存在差異[4]。從圖書館服務(wù)現(xiàn)狀看,由于部分館員的專業(yè)素養(yǎng)不高,無法準(zhǔn)確掌握用戶的需求,對用戶的行為與心理分析得不準(zhǔn)確,因此無法提供精準(zhǔn)的服務(wù),弱化了館員與用戶之間的關(guān)系。同時(shí),由于部分用戶過于強(qiáng)調(diào)自我,沒有認(rèn)真了解圖書館的相關(guān)規(guī)章制度,或者語言表達(dá)能力不強(qiáng),也難以獲得滿意的知識(shí)服務(wù),甚至對圖書館的服務(wù)產(chǎn)生排斥。圖書館只有認(rèn)識(shí)到不同用戶對圖書館知識(shí)服務(wù)存在不同的期待,并且尊重他們的個(gè)性化差異,才能最大限度地滿足他們的個(gè)性化需求。
2.2 技術(shù)需求
圖書館的館藏資源豐富,有些文獻(xiàn)資源的借閱率較高,有些文獻(xiàn)資源的借閱率較低,也有一些文獻(xiàn)資源從未被借閱過。對館藏資源借閱量進(jìn)行綜合分析,是圖書館實(shí)現(xiàn)個(gè)性化推薦的途徑之一。圖書館應(yīng)根據(jù)不同用戶群體的特征分析他們感興趣的資源類型,并利用聚類方法進(jìn)行資源聚類,找到與相關(guān)用戶群體相對應(yīng)的資源。關(guān)聯(lián)規(guī)則可以幫助圖書館分析用戶的信息行為,把握不同用戶群體和不同資源之間的聯(lián)系,主動(dòng)為用戶提供其感興趣的信息[5]。圖書館可以通過知識(shí)資源的整合排序,按照文獻(xiàn)的瀏覽量、關(guān)鍵詞、出版時(shí)間等呈現(xiàn)檢索結(jié)果,方便用戶根據(jù)需要選擇其所需的資源。同時(shí),圖書館還應(yīng)依據(jù)用戶的反饋意見,不斷優(yōu)化館藏資源,剔除使用率及參考價(jià)值不高的館藏資源,以此提高用戶的檢索效率,并節(jié)省他們的時(shí)間。
2.3 人才需求
不同層次、不同背景的用戶在思維理念、性格特征等方面存在差異,這對圖書館開展個(gè)性化服務(wù)提出了更高的要求。圖書館應(yīng)合理設(shè)置館員的工作崗位,加強(qiáng)專業(yè)技能培訓(xùn),提高他們的綜合素質(zhì),使館員建立完善的知識(shí)體系,以便更好地為用戶提供優(yōu)質(zhì)的個(gè)性化服務(wù)。此外,圖書館還應(yīng)做好用戶的行為引導(dǎo)工作,提升用戶對圖書館服務(wù)的認(rèn)同感,增進(jìn)館員與用戶之間的交互,進(jìn)而保障服務(wù)效率與服務(wù)質(zhì)量。
3 圖書館個(gè)性化推薦服務(wù)模式中知識(shí)挖掘的實(shí)現(xiàn)
在圖書館個(gè)性化推薦服務(wù)模式中,知識(shí)挖掘需由知識(shí)提供者、用戶等要素共同構(gòu)成聯(lián)動(dòng)的結(jié)構(gòu)體系才能實(shí)現(xiàn)。當(dāng)用戶提出知識(shí)需求后,圖書館可應(yīng)用信息系統(tǒng)進(jìn)行數(shù)據(jù)整合獲取知識(shí),為用戶提供個(gè)性化內(nèi)容(見圖2)。
3.1 數(shù)據(jù)預(yù)處理
圖書館的管理系統(tǒng)每天都會(huì)產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)不僅包括圖書館的常規(guī)業(yè)務(wù)數(shù)據(jù),還隱含了其他有價(jià)值的信息。圖書館通過知識(shí)挖掘?qū)@些數(shù)據(jù)進(jìn)行整合分析,可以掌握館藏資源的流通量及用戶的行為變化,進(jìn)而為個(gè)性化服務(wù)提供決策性指導(dǎo)[6]。圖書館從管理系統(tǒng)中導(dǎo)出各項(xiàng)數(shù)據(jù),選擇合適的數(shù)據(jù)分析工具對其進(jìn)行整合、分類和排序,并依據(jù)關(guān)聯(lián)規(guī)則、相似度計(jì)算法等方法發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系,為資源建設(shè)和個(gè)性化服務(wù)提供支持。圖書館對數(shù)據(jù)進(jìn)行預(yù)處理,應(yīng)刪除冗余數(shù)據(jù),保留有用的數(shù)據(jù),保障數(shù)據(jù)的主要屬性不缺失,同時(shí)可將與挖掘算法無關(guān)的屬性刪除,不僅可以減少數(shù)據(jù)處理的工作量,還能保障最終挖掘結(jié)果的有效性。
3.2 用戶聚類分析
圖書館根據(jù)用戶的借閱數(shù)據(jù)、注冊信息等對其進(jìn)行聚合分析,可以了解不同用戶對不同資源的感興趣程度及用戶對資源的動(dòng)態(tài)需求。圖書館對用戶群體進(jìn)行精細(xì)分類,可從用戶的偏好及行為特點(diǎn)入手,采用聚類算法進(jìn)行統(tǒng)計(jì)分析,然后依據(jù)聚類分析結(jié)果提供有針對性的服務(wù)。圖書館只需提取用戶偏好、瀏覽行為等重要屬性數(shù)據(jù)[7],并對這些數(shù)據(jù)進(jìn)行聚類,即可獲得直觀的聚類圖形,以此分析不同用戶群體的基本借閱特征,利用推薦算法找出與其興趣相對應(yīng)的資源,使個(gè)性化推薦更加貼近用戶的需求。
3.3 關(guān)聯(lián)規(guī)則挖掘
關(guān)聯(lián)規(guī)則挖掘,即通過知識(shí)挖掘技術(shù)對不同類型的數(shù)據(jù)進(jìn)行深入分析,通過不同用戶群體的信息聚類,發(fā)現(xiàn)圖書館資源與用戶需求之間的關(guān)系,并總結(jié)隱含的規(guī)則,為個(gè)性化推薦提供依據(jù)。常規(guī)的關(guān)聯(lián)規(guī)則推薦方法是將所有信息作為獲取隱含規(guī)則的來源,或根據(jù)用戶屬性特征進(jìn)行歸納分析,以用戶行為數(shù)據(jù)作為規(guī)則源頭,了解與規(guī)則相關(guān)的置信度,并建立對應(yīng)的規(guī)則模型,最終實(shí)現(xiàn)隱性知識(shí)的顯性化。關(guān)聯(lián)規(guī)則使圖書館的知識(shí)分布更加直觀,便于館員迅速定位個(gè)性化資源[8]。用戶提出信息需求后,圖書館系統(tǒng)會(huì)分析并確定其所需信息資源的范圍,并借助關(guān)聯(lián)規(guī)則選擇合適的知識(shí)類目,在與用戶需求進(jìn)行對比后推送給用戶,從而實(shí)現(xiàn)知識(shí)的發(fā)掘和及時(shí)交互。
4 基于知識(shí)挖掘的圖書館個(gè)性化推薦服務(wù)模式
4.1 個(gè)性化推送模式
個(gè)性化推送服務(wù)模式指圖書館根據(jù)用戶的習(xí)慣與行為特征,在知識(shí)挖掘的基礎(chǔ)上利用信息推送技術(shù)為他們提供感興趣的內(nèi)容。目前,圖書館的個(gè)性化推薦服務(wù)可以借助電子郵件定時(shí)為用戶推送知識(shí)資源,還可以利用智能軟件對服務(wù)全過程進(jìn)行有效控制。圖書館利用個(gè)性化推薦服務(wù)方式實(shí)現(xiàn)了從用戶主動(dòng)檢索到信息自動(dòng)匹配的轉(zhuǎn)變。在個(gè)性化推薦模式下,用戶不需要進(jìn)行任何信息檢索行為,就可以獲得所需的信息資源,具體流程為:用戶注冊并登錄圖書館信息系統(tǒng),信息系統(tǒng)會(huì)根據(jù)用戶的基礎(chǔ)信息和在線瀏覽記錄等對用戶需求進(jìn)行分析,并主動(dòng)向他們提供所需的信息。同時(shí),圖書館的信息系統(tǒng)還會(huì)根據(jù)用戶的需求變化實(shí)時(shí)更新知識(shí)庫,這極大地提高了圖書館個(gè)性化服務(wù)的準(zhǔn)確度。
4.2 協(xié)同過濾推薦模式
協(xié)同過濾推薦模式指圖書館根據(jù)用戶對館藏資源的訪問記錄,計(jì)算不同數(shù)據(jù)資源之間的相似性,發(fā)現(xiàn)不同資源之間的聯(lián)系,篩選與用戶需求相匹配的內(nèi)容并推送給用戶。為保障個(gè)性化推薦服務(wù)的質(zhì)量,圖書館可以針對用戶特征進(jìn)行用戶分組,分析相似用戶的群組特征,在推薦信息的基礎(chǔ)上實(shí)現(xiàn)知識(shí)拓展。如:若用戶A與用戶B存在相似的偏好,圖書館就可以將用戶A喜好的資源推薦給用戶B,使用戶B有更多的選擇。需要注意的是,由于圖書館的數(shù)據(jù)資源種類繁多,基于相似度計(jì)算的協(xié)同過濾推薦模式難以保障大規(guī)模數(shù)據(jù)的推薦精準(zhǔn)度。因此,圖書館只有建立用戶興趣偏好模型,預(yù)測用戶的需求變化,才能根據(jù)用戶興趣和資源匹配度開展推薦服務(wù)。
4.3 分類定制推薦模式
分類定制推薦模式指圖書館用戶根據(jù)自身知識(shí)需求,在特定的信息服務(wù)系統(tǒng)中按照自己設(shè)定的類型與方式獲取知識(shí)服務(wù)。該服務(wù)模式建立在細(xì)分用戶群體基礎(chǔ)上,體現(xiàn)了用戶的個(gè)性化特征,要求圖書館對館藏資源進(jìn)行深入挖掘、合理分類,發(fā)現(xiàn)不同資源之間隱含的規(guī)律,進(jìn)而提高資源推薦的準(zhǔn)確度。圖書館的信息系統(tǒng)可以通過用戶的注冊信息、瀏覽數(shù)據(jù)等提取用戶的興趣信息,然后生成與用戶偏好相對應(yīng)的關(guān)鍵詞,這些關(guān)鍵詞可在線檢索并與圖書館的分類法相匹配。此外,圖書館還可以將用戶分為多個(gè)信息需求群體,設(shè)計(jì)不同的信息分類定制模板,便于他們根據(jù)自身需求選擇對應(yīng)的服務(wù)類別,并獲取所需的信息資源。
5 結(jié)語
信息環(huán)境下的圖書館資源日益增多,提供符合用戶需求的個(gè)性化服務(wù)已成為圖書館未來的發(fā)展趨勢。圖書館應(yīng)利用知識(shí)挖掘技術(shù)對館藏資源和數(shù)據(jù)進(jìn)行深入挖掘,根據(jù)用戶聚類與關(guān)聯(lián)挖掘結(jié)果發(fā)現(xiàn)不同數(shù)據(jù)資源之間隱含的規(guī)律,從而為個(gè)性化服務(wù)和管理決策提供科學(xué)依據(jù)。
參考文獻(xiàn):
[1] 高麗,王麗偉.數(shù)據(jù)挖掘技術(shù)在國內(nèi)圖書館應(yīng)用領(lǐng)域的研究[J].數(shù)字技術(shù)與應(yīng)用,2015(12):94.
[2] 王潔.書目推薦與高校圖書館閱讀服務(wù)創(chuàng)新:以天津某高校圖書館為例[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2015(22):1-3.
[3] 王蕾.數(shù)據(jù)挖掘技術(shù)在高校圖書館個(gè)性化書目推薦服務(wù)中的應(yīng)用[J].圖書館學(xué)刊,2015(9):113-116.
[4] 蘇新寧.大數(shù)據(jù)時(shí)代數(shù)字圖書館面臨的機(jī)遇和挑戰(zhàn)[J].中國圖書館學(xué)報(bào),2015(6):4-12.
[5] 周欣,陸康.基于圖書館數(shù)字資源訪問系統(tǒng)的讀者行為數(shù)據(jù)挖掘研究[J].現(xiàn)代情報(bào),2016(1):51-56.
[6] 張宏偉,史惠媛.數(shù)據(jù)挖掘在高校圖書館文獻(xiàn)采購決策中的應(yīng)用:以黑龍江中醫(yī)藥大學(xué)圖書館為例[J].中國中醫(yī)藥圖書情報(bào)雜志,2016(2):22-24.
[7] 胡慕海,夏火松,吳金紅,等.面向異構(gòu)情境化推薦服務(wù)的關(guān)鍵情境特征識(shí)別[J].情報(bào)理論與實(shí)踐,2015(1):104-109.
[8] 張紹軍.談圖書館個(gè)性化信息推薦服務(wù)[J].圖書館工作與研究,2016(9):84-86.
(編校:徐黎娟)