国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

相關(guān)關(guān)鍵詞與相關(guān)圖書標(biāo)簽云

2013-09-12 02:23:44黎邦群惠州學(xué)院圖書館廣東惠州516000
圖書館建設(shè) 2013年8期
關(guān)鍵詞:字段數(shù)據(jù)表檢索

黎邦群 (惠州學(xué)院圖書館 廣東 惠州 516000)

自從照片共享網(wǎng)站Flickr應(yīng)用標(biāo)簽云以來,Del、Technorati等網(wǎng)站紛紛跟進(jìn)。標(biāo)簽云使得網(wǎng)站內(nèi)容之間的相關(guān)性和網(wǎng)站的互動性大為增強,深受用戶歡迎。隨著Web 2.0的興起和發(fā)展,標(biāo)簽云逐漸在各行業(yè)網(wǎng)站得以應(yīng)用,包括眾多的電子商務(wù)網(wǎng)站、網(wǎng)絡(luò)搜索引擎網(wǎng)站及數(shù)據(jù)庫公司網(wǎng)站等。國外圖書館亦進(jìn)行了標(biāo)簽云應(yīng)用的相關(guān)嘗試,如美國密歇根州安阿伯圖書館的SOPAC (Social Online Public Access Catalog,社會化聯(lián)機公共目錄查詢系統(tǒng))應(yīng)用了編目標(biāo)簽云,納什維爾公共圖書館應(yīng)用了青少年網(wǎng)絡(luò)標(biāo)簽云等。這是圖書館為主動適應(yīng)Web 2.0環(huán)境而做出的積極選擇,為日漸式微的OPAC(Online Public Access Cataloge,聯(lián)機公共目錄查詢系統(tǒng))注入了新的活力。同時,相關(guān)的理論研究也層出不窮,如排序的算法[1-2]、個性化推薦[3-4]及可視化布局[5-6]等。這些實踐與研究有力地推動了標(biāo)簽云應(yīng)用與理論的發(fā)展,對本研究具有一定的參考價值。

然而,由于標(biāo)簽固有不受控、無等級結(jié)構(gòu)、拼寫易錯等缺點,標(biāo)簽云這一新興的檢索推薦技術(shù)還沒有在國內(nèi)圖書館得到深入研究與廣泛應(yīng)用?,F(xiàn)有的標(biāo)簽云多是基于用戶自由定義的,標(biāo)簽由用戶輸入,甚至直接由書目編目數(shù)據(jù)中的主題詞組成 ;現(xiàn)有的圖書推薦多是基于用戶興趣的,圖書館將最符合閱讀習(xí)慣的圖書推薦給特定的已知用戶;圖書館缺少對檢索數(shù)據(jù)的深入分析和挖掘整理以及對未知用戶的檢索詞與圖書的推薦。本文試圖對檢索詞、檢索行為的特征以及它們之間隱含的關(guān)聯(lián)規(guī)則進(jìn)行知識分析,并對相關(guān)數(shù)據(jù)進(jìn)行收集、利用、挖掘和整理,擬從知識的相關(guān)性角度來設(shè)計和實現(xiàn)非個性化的OPAC相關(guān)關(guān)鍵詞或圖書的動態(tài)標(biāo)簽云。

1 現(xiàn)狀及需求

1.1 相關(guān)概念

標(biāo)簽(Tag)與標(biāo)簽云(Tag Cloud)的應(yīng)用均屬于Web 2.0的典型特征。標(biāo)簽是用戶對網(wǎng)站內(nèi)容的描述詞方式,借此實現(xiàn)對信息的個性化分類和關(guān)鍵詞檢索。標(biāo)簽云由標(biāo)簽演變而來,是對一組擁有不同字號和顏色的超鏈接及相應(yīng)權(quán)重的標(biāo)簽的可視化組織和表現(xiàn)形式。標(biāo)簽云以標(biāo)簽的使用頻率或被關(guān)注度等指標(biāo)為權(quán)重,定量地計算每個標(biāo)簽的權(quán)值,并使用不同的顏色或字體大小定性地表示,形象、直觀地在網(wǎng)頁上展現(xiàn)給每位用戶。相關(guān)關(guān)鍵詞或圖書的標(biāo)簽云是OPAC根據(jù)用戶行為數(shù)據(jù)來判斷檢索需求與查詢意圖,在網(wǎng)頁上展示一組領(lǐng)域相同、主題相近及內(nèi)容相似的檢索詞或圖書,根據(jù)相關(guān)度或相似性賦予不同的權(quán)重,并采用一種類似云圖的可視化形式呈現(xiàn)出來的推薦功能,屬于一種圖書館大數(shù)據(jù)的信息挖掘技術(shù)與云計算的資源組織模式有效結(jié)合的新型應(yīng)用服務(wù)。

1.2 應(yīng)用現(xiàn)狀

為了認(rèn)清應(yīng)用現(xiàn)狀,筆者對國內(nèi)部分高校圖書館OPAC進(jìn)行了抽樣調(diào)查。調(diào)查時間:2013年3月20日;調(diào)查對象:教育部最近公布的112個“211工程”高校圖書館OPAC;調(diào)查內(nèi)容:相關(guān)關(guān)鍵詞或圖書的推薦功能以及其標(biāo)簽云的應(yīng)用;調(diào)查方法:訪問各圖書館OPAC,輸入常見關(guān)鍵詞進(jìn)行檢索,查看是否返回相關(guān)關(guān)鍵詞,并瀏覽任一圖書詳細(xì)信息頁面,查看是否推薦了相關(guān)圖書,檢查標(biāo)簽云應(yīng)用狀況;調(diào)查結(jié)果:除了4個圖書館OPAC因故無法訪問,沒有發(fā)現(xiàn)任一OPAC的檢索結(jié)果或最終信息頁設(shè)置了相關(guān)的推薦功能與標(biāo)簽云應(yīng)用。

為了進(jìn)一步認(rèn)清現(xiàn)狀,筆者又隨機調(diào)查了部分其他圖書館OPAC,依然一無所獲。結(jié)果表明,標(biāo)簽云的相關(guān)功能與應(yīng)用尚未在圖書館廣泛實踐。于是筆者又查詢了中國知網(wǎng)等數(shù)據(jù)庫,沒有找到專門針對檢索行為的相關(guān)性而進(jìn)行的非個性化推薦及以標(biāo)簽云的形式向OPAC用戶進(jìn)行展示的研究。然而,對用戶進(jìn)行相關(guān)信息的推薦是符合一定的用戶需求的。

1.3 需求分析

缺乏對網(wǎng)站信息進(jìn)行多元化地揭示、辨識與引導(dǎo),內(nèi)容表現(xiàn)形式過于專業(yè)與僵化,是傳統(tǒng)OPAC固有的缺陷。如何讓用戶從浩如煙海的信息中找出自己感興趣的信息,同時讓有價值的信息被需要的用戶享用,一直是業(yè)界關(guān)注的熱點問題[7]。OPAC存在的根本目的就是為了盡力幫助用戶找到需要的館藏資源。以用戶為中心的服務(wù)宗旨要求圖書館為了用戶更便捷地尋找資源而不斷改進(jìn)OPAC,提升其可用性和使用體驗。相關(guān)關(guān)鍵詞標(biāo)簽云能夠在書目檢索時給予用戶可能比檢索詞更合理、更科學(xué)的關(guān)鍵詞推薦,符合用戶檢索時的最省力法則,并在檢索失敗時,可以引導(dǎo)用戶點擊標(biāo)簽鏈接,輕松地選擇新的關(guān)鍵詞重新進(jìn)行檢索,而不至于不知所措。相關(guān)圖書標(biāo)簽云能夠讓用戶在對檢索結(jié)果不滿意時重新找到需要的圖書,或向用戶推薦隱藏的相關(guān)圖書,將用戶的隱性知識顯性化,讓用戶感到意外的驚喜。這種具有知識性與互動性的OPAC,無疑對用戶更具誘惑力。

2 設(shè)計與實現(xiàn)

相關(guān)關(guān)鍵詞或圖書標(biāo)簽云的設(shè)計與實現(xiàn),需要利用數(shù)據(jù)挖掘技術(shù)對檢索詞及檢索行為數(shù)據(jù)進(jìn)行隱性知識分析與整理。相關(guān)標(biāo)簽云的設(shè)計與實現(xiàn)實際上是一種未知知識的發(fā)現(xiàn)過程,與數(shù)據(jù)挖掘(Data Mining)過程密不可分。數(shù)據(jù)挖掘是指通過分析每個用戶數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要包括數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示3個步驟。

2.1 方案設(shè)計

用戶需求促使筆者采用一定的技術(shù)方案來進(jìn)行設(shè)計。兩種標(biāo)簽云設(shè)計的關(guān)鍵在于如何獲取標(biāo)簽及計算權(quán)值,依據(jù)其差異性存在如下兩種設(shè)計方案:

(1)分割設(shè)計 將相關(guān)關(guān)鍵詞與相關(guān)圖書加以區(qū)分,分別獨立設(shè)計兩種標(biāo)簽云:以歷史檢索詞為目標(biāo),與關(guān)鍵詞進(jìn)行對比,選擇相似詞語作為標(biāo)簽組成相關(guān)關(guān)鍵詞標(biāo)簽云;采用用戶添加的圖書標(biāo)簽或主題詞等書目元數(shù)據(jù)作為標(biāo)簽組成相關(guān)圖書標(biāo)簽云。

(2)關(guān)聯(lián)設(shè)計 對用戶輸入的檢索詞及檢索行為數(shù)據(jù)進(jìn)行深入挖掘,找出其中存在的知識關(guān)聯(lián),并以此確定相關(guān)關(guān)鍵詞或圖書標(biāo)簽云,綜合設(shè)計兩種標(biāo)簽云。這兩種標(biāo)簽云的標(biāo)簽雖然不是用戶或圖書館編目員顯性添加的,但是更能反映用戶的直接需求。

對兩種方案進(jìn)行對比發(fā)現(xiàn),前者設(shè)計思想簡單,但標(biāo)簽的相關(guān)度低;后者設(shè)計原理復(fù)雜,但標(biāo)簽之間的相關(guān)度更高,用戶體驗更好,因而筆者決定采用方案(2)即關(guān)聯(lián)設(shè)計方案。

2.2 技術(shù)思路

根據(jù)方案(2)的設(shè)計,相關(guān)關(guān)鍵詞與相關(guān)圖書的技術(shù)思路如下:系統(tǒng)存儲用戶多次的檢索行為及數(shù)據(jù),分析第n次與第n-1次行為之間的內(nèi)在聯(lián)系,并以此確定相關(guān)的關(guān)鍵詞或圖書,利用它們之間的關(guān)聯(lián)數(shù)據(jù)設(shè)計相關(guān)標(biāo)簽云。用戶檢索行為大致分為7個部分,如圖1所示。

圖1 相關(guān)關(guān)鍵詞與相關(guān)圖書技術(shù)思路圖

技術(shù)思路的關(guān)鍵在于假設(shè)用戶在短時間內(nèi)連續(xù)執(zhí)行了多次檢索,并且先后瀏覽了相關(guān)的多種圖書。技術(shù)難點在于跟蹤與分析用戶的檢索過程,判斷與甄別檢索的意圖與結(jié)果。

2.3 相關(guān)原理

在Web 2.0時代,用戶應(yīng)該既是標(biāo)簽的創(chuàng)造者,也是標(biāo)簽的使用者。因此標(biāo)簽云的設(shè)計離不開標(biāo)簽的創(chuàng)建與顯示。根據(jù)相關(guān)技術(shù)思路,用戶對第n-1(n大于1)個關(guān)鍵詞及第n-1次的檢索結(jié)果不滿意,再輸入第n個關(guān)鍵詞,產(chǎn)生第n次檢索結(jié)果,那么第n-1次的檢索行為是第n次檢索的相關(guān)檢索行為;第n-1個關(guān)鍵詞是第n個關(guān)鍵詞的相關(guān)關(guān)鍵詞;第n-1次瀏覽的圖書是第n次瀏覽的圖書的相關(guān)圖書,即根據(jù)用戶每次及前一次的檢索行為來確定相關(guān)的關(guān)鍵詞或圖書。系統(tǒng)再把所有用戶的這些相關(guān)關(guān)鍵詞或圖書的數(shù)據(jù)進(jìn)行累積,按照它們被用戶關(guān)注的程度標(biāo)注相應(yīng)的頻率或權(quán)重,存儲在相關(guān)數(shù)據(jù)表中,作為用戶貢獻(xiàn)的標(biāo)簽,組成相關(guān)關(guān)鍵詞或圖書的標(biāo)簽云。

2.4 數(shù)據(jù)結(jié)構(gòu)

在采用了一定的設(shè)計方案,分析了技術(shù)思路及相關(guān)原理之后,即可進(jìn)行標(biāo)簽云的數(shù)據(jù)結(jié)構(gòu)設(shè)計,包括數(shù)據(jù)表構(gòu)建及數(shù)據(jù)存儲等標(biāo)簽云實現(xiàn)前的準(zhǔn)備工作。

(1)數(shù)據(jù)表結(jié)構(gòu) 為了存儲關(guān)鍵詞與檢索行為以及相關(guān)性,需要在服務(wù)端數(shù)據(jù)庫中設(shè)計相關(guān)關(guān)鍵詞x_ keyword數(shù)據(jù)表與相關(guān)圖書x_book數(shù)據(jù)表等二維表,表結(jié)構(gòu)分別如表1、表2所示。

表1 相關(guān)關(guān)鍵詞x_ keyword數(shù)據(jù)表結(jié)構(gòu)

表2 相關(guān)圖書x_book數(shù)據(jù)表結(jié)構(gòu)

表1、表2還包括Fre1(關(guān)鍵詞被檢索頻率或相關(guān)圖書被流通的頻次)、Fre2(相關(guān)關(guān)鍵詞被檢索頻率或圖書被認(rèn)為相關(guān)的頻率)、Fre3(被認(rèn)為相關(guān)的頻率)、Ftime(被認(rèn)為相關(guān)的時間)及h(點擊次數(shù))等字段。字段keyword1與keyword2僅存儲“2≤字符長度≤30”的有效關(guān)鍵詞信息,部分字段間存在關(guān)聯(lián)。

(2)數(shù)據(jù)存儲 當(dāng)用戶連續(xù)兩次以上檢索時,系統(tǒng)即開始啟動相關(guān)數(shù)據(jù)的分析與存儲程序。例如,用戶首次使用的檢索詞為“紅樓夢”,其在檢索結(jié)果中瀏覽了圖書《紅樓夢》的詳細(xì)信息,但對該結(jié)果不滿意或尚需查找更豐富的類似圖書,便再次輸入“石頭記”,瀏覽了圖書《脂本匯校石頭記》的詳細(xì)信息。此時,系統(tǒng)將認(rèn)為第1個與第2個檢索詞為相關(guān)關(guān)鍵詞與關(guān)鍵詞,第1種圖書為第2種圖書的相關(guān)圖書。系統(tǒng)首先使用字符串連接數(shù)據(jù)庫,再使用“Select”等Sql語句在相關(guān)數(shù)據(jù)表中進(jìn)行查重,如果有重,則使用“Update”等Sql語句更新Fre(n)(1≤n≤3)等相關(guān)頻率字段值,否則使用“InSert”等Sql語句在數(shù)據(jù)表中插入新記錄。經(jīng)過一段時間的實踐積累,隨著檢索行為與用戶關(guān)注度的增加,數(shù)據(jù)表記錄會不斷豐富,從而為標(biāo)簽云的實現(xiàn)提供了足夠的相關(guān)標(biāo)簽及權(quán)重選擇。

2.5 功能實現(xiàn)

圖書檢索是一種認(rèn)知過程,從用戶產(chǎn)生圖書查找的需求開始,通過輸入關(guān)鍵詞、檢索和評價而完成。用戶選擇檢索結(jié)果的行為實際上就是一種對系統(tǒng)性能、檢索質(zhì)量及所選圖書的評價行為。有了前面的設(shè)計基礎(chǔ),即可開始實現(xiàn)標(biāo)簽云的功能,具體步驟如下:

(1)分析檢索詞及檢索行為 系統(tǒng)首先接受用戶在客戶端輸入的檢索詞,并對數(shù)據(jù)特征及用戶的其他檢索行為進(jìn)行關(guān)聯(lián)分析,以便通過用戶的多次檢索行為來判斷關(guān)鍵詞及圖書的相關(guān)性。如果用戶僅進(jìn)行了1次關(guān)鍵詞檢索及圖書瀏覽等檢索行為,則不產(chǎn)生相關(guān)數(shù)據(jù);如果用戶進(jìn)行了兩次以上的檢索,則還需要分析檢索詞的數(shù)據(jù)特征,過濾“!"#$%&'()*+,.-_/:;<=>?@[]^`{|}~”等特殊符號與無效字符、過長與過短的詞語等無意義或相關(guān)度不高的關(guān)鍵詞,保留正常的關(guān)鍵詞。依據(jù)用戶所瀏覽圖書的題名、主題詞、分類號、責(zé)任者和出版社等編目元數(shù)據(jù)以及發(fā)送檢索請求的時間間隔與先后次序,將其作為輔助手段來判斷用戶連續(xù)多次檢索過程中的意圖是否相近,以甄別用戶連續(xù)輸入的檢索詞及先后瀏覽的圖書是否具有相關(guān)性。

(2)查詢相關(guān)數(shù)據(jù)表 當(dāng)用戶輸入關(guān)鍵詞“key”進(jìn)行書目檢索時,系統(tǒng)除了檢索書目表外,還需要同時查詢x_ keyword數(shù)據(jù)表的keyword1字段,獲取所有匹配記錄的keyword2及Fre3等字段值;當(dāng)用戶瀏覽圖書“F200”的詳細(xì)信息時,系統(tǒng)應(yīng)查詢x_book數(shù)據(jù)表的F200a1字段,獲取所有匹配記錄的F200a2及Fre2等字段值。關(guān)鍵詞“key”的查詢語句如下:

Set RowCount 120 Select keyword2, Fre1, Fre2, Fre3,Ftime From x_ keyword Where keyword1 Like '"& key &"'Order By Fre2 Desc

(3)客戶端效果展示 即功能實現(xiàn)。標(biāo)簽云通常使用XHTML元素來表現(xiàn),依照字典順序、隨機順序及熱門程度等準(zhǔn)則來確定標(biāo)簽的排列順序,一個標(biāo)簽云一般擁有多個內(nèi)容相似的標(biāo)簽,以更方便地組織數(shù)據(jù)、匯總檢索結(jié)果及輔助二次檢索。查詢數(shù)據(jù)表獲取相關(guān)關(guān)鍵詞或圖書后,按照x_ keyword數(shù)據(jù)表的Fre1、Fre2、Fre3字段及Ftime值的區(qū)別,或按x_book數(shù)據(jù)表的Fre1、Fre2字段及Ftime值的不同,分別賦予keyword2或F200a2差異化的字體和漸變的過渡效果來展現(xiàn)標(biāo)簽的受歡迎程度,還可以通過字體粗細(xì)、顏色及標(biāo)簽的位置等標(biāo)示來表現(xiàn)標(biāo)簽的使用頻率或受關(guān)注程度,并輸出到客戶端展示給每位訪問者,把用戶的關(guān)注點吸引到特定區(qū)域,如圖2、圖3所示。

圖2 相關(guān)關(guān)鍵詞標(biāo)簽云圖

圖3 相關(guān)圖書標(biāo)簽云圖

圖2和圖3可以分別放置于檢索結(jié)果頁和圖書詳細(xì)信息頁的右側(cè)顯眼處,供用戶選擇。點擊“顯示更多”鏈接,最多可顯示150個標(biāo)簽。點擊圖2中的標(biāo)簽鏈接,訪問關(guān)鍵詞的檢索結(jié)果頁;點擊圖3中的標(biāo)簽鏈接,直接返回圖書詳細(xì)信息頁。還可以在鏈接目標(biāo)頁鼓勵用戶對被推薦的圖書投票,如用戶認(rèn)為某圖書具有準(zhǔn)確的相關(guān)度或相似性,確實值得向其他用戶推薦,即可以投其一票。用戶的評價將被系統(tǒng)作為推薦的重要依據(jù)。

2.6 實現(xiàn)效果

從惠州學(xué)院圖書館OPAC的相關(guān)關(guān)鍵詞與相關(guān)圖書標(biāo)簽云試用情況來看,其功能運行性能及用戶反映不錯,在單位時間內(nèi)初步取得了較好的用戶反饋與實踐效果(見表3)。

表3 2013年1—3月惠州學(xué)院圖書館OPAC的相關(guān)關(guān)鍵詞與相關(guān)圖書標(biāo)簽云應(yīng)用統(tǒng)計

分析表3得知,OPAC用戶具有一定的推薦需求與反饋興趣,標(biāo)簽云的應(yīng)用已成為圖書館拓展服務(wù)內(nèi)容與形式的新渠道。經(jīng)過一定時間的累積,相同、相關(guān)或相似的關(guān)鍵詞與圖書數(shù)據(jù)會更豐富,使用的用戶也會逐漸增多,服務(wù)功能將日臻成熟。

2.7 用戶體驗的提升

OPAC作為圖書館的資源門戶,已經(jīng)從Web 1.0、Web 2.0發(fā)展到了Web 3.0,其用戶已從早期的被動接受,到被動參與,再到主動參與,到自我創(chuàng)造內(nèi)容,再到注重體驗[8]。任何新技術(shù)的應(yīng)用都可能受到廣泛的歡迎或部分的質(zhì)疑,標(biāo)簽云的應(yīng)用亦不會例外。例如,部分用戶可能對放大的字體或異常的標(biāo)簽顏色不習(xí)慣,感覺視覺不舒服,認(rèn)為網(wǎng)頁制作得“很糟糕”或“不專業(yè)”;也有可能并非字體越大,就越容易被用戶所接受和選擇。這不是簡單的品味或?qū)徝绬栴},而是標(biāo)簽云在圖書館應(yīng)用緩慢的原因之一。對標(biāo)簽云的顯示效果與用戶評價圖書館應(yīng)予以高度重視,從各方面加以改善、提升體驗,具體策略包括:

(1)數(shù)據(jù)異常處理 查詢x_ keyword與x_book數(shù)據(jù)表時,完全有可能返回的記錄數(shù)太少,甚至結(jié)果為0,從而導(dǎo)致顯示的標(biāo)簽數(shù)量過少或完全沒有。數(shù)據(jù)異常將造成標(biāo)簽云顯示效果不美觀,影響用戶的使用體驗,甚至給其帶來不小的困惑。時間因素導(dǎo)致檢索行為數(shù)據(jù)積累不夠,相關(guān)數(shù)據(jù)過少或不存在,從而造成數(shù)據(jù)異常。圖書館可以將檢索詞“key”進(jìn)行中文分詞,使用x_ keyword數(shù)據(jù)表的keyword2字段替代原keyword1字段作為查詢對象,對keyword2執(zhí)行Sql模糊查詢,以擴大查詢范圍。還可以將圖書題名、主題詞、分類號、責(zé)任者或出版社等信息作為查詢詞,并以圖書的點擊次數(shù)或流通頻率作為衡量標(biāo)簽權(quán)重的依據(jù)。

(2)優(yōu)化顯示效果 標(biāo)簽云的顯示效果與標(biāo)簽的字體大小、類型、顏色、粗細(xì)、字符數(shù)量、擺放位置、疊詞效果、筆畫繁簡程度、標(biāo)簽區(qū)域及寬度、強度和像素數(shù)等屬性的設(shè)置有關(guān)。圖書館可以利用JavaScript、Flex、Flash及Css等網(wǎng)頁顯示技術(shù)將標(biāo)簽云設(shè)計成動態(tài)或3D特效,克服文字尤其是漢字標(biāo)簽顯示效果不佳的弊端,最大程度地優(yōu)化顯示效果,以更好地吸引眼球。例如,雅虎研究院設(shè)計的Flash版TagLines[9],不僅可以按時間線形顯示文字,還可以顯示動畫,可視化效果震撼(見圖4)。

圖4 Tag Lines演示圖

(3)改進(jìn)標(biāo)簽的排序方法 按字順排序,不能很好地體現(xiàn)標(biāo)簽的被關(guān)注程度;按使用頻次、熱門程度或流行程度排序,會讓關(guān)注度高的標(biāo)簽一直排在前面,形成人為地從高到低排列的視覺效果,不僅不美觀,而且無法體現(xiàn)標(biāo)簽之間的相關(guān)度。另外,歷史關(guān)鍵詞可以通過時間的累積而累加頻次,部分新的關(guān)鍵詞固然重要,但因使用頻次低而無法“曝光”。為了消除時間累積效應(yīng),在不同時段內(nèi)分別計算標(biāo)簽的權(quán)重[10],即應(yīng)用帶時間軸的標(biāo)簽云是比較科學(xué)的排序方法。設(shè)計者通常需要憑實際情況來決定如何組織與顯示標(biāo)簽,以達(dá)到最佳效果。

3 擴展應(yīng)用

圖書館要秉承一切為了用戶的服務(wù)理念,不斷優(yōu)化、改進(jìn)各項OPAC功能,使書目檢索向更便捷、更符合人類思維的方向發(fā)展,向用戶提供更人性化、個性化的服務(wù),從而更好地發(fā)揮檢索功能,提升服務(wù)水平。通過對相關(guān)關(guān)鍵詞或圖書的標(biāo)簽云進(jìn)行擴展應(yīng)用,能夠增強OPAC與用戶的互動性與檢索功能,提升其服務(wù)效果。

3.1 相關(guān)思路擴展應(yīng)用

依據(jù)相關(guān)思路與原理,將相關(guān)關(guān)鍵詞的實現(xiàn)方法按照需要進(jìn)行相應(yīng)修改,即可實現(xiàn)如下3種功能:

(1)利用x_ keyword數(shù)據(jù)表的keyword1與keyword2字段的相關(guān)性,實現(xiàn)類似網(wǎng)絡(luò)搜索引擎搜索結(jié)果頁面底部的“相關(guān)搜索”功能[11]。

(2)利用x_ keyword數(shù)據(jù)表的keyword1字段及其拼音,實現(xiàn)基于Ajax的檢索輸入框連續(xù)輸入提示與“拼音搜索”功能[12]。

(3)利用x_ keyword數(shù)據(jù)表的keyword1字段,構(gòu)建基于關(guān)鍵詞的拼寫詞匯數(shù)據(jù)庫字典,實現(xiàn)檢查用戶檢索詞輸入正確與否的“拼寫檢查”功能[13]。

上述功能將提高書目檢索的查全率與查準(zhǔn)率,為用戶提供豐富的檢索建議與提示。

3.2 標(biāo)簽云擴展應(yīng)用

按照圖書標(biāo)簽云的設(shè)計思路與原理,很容易聯(lián)想并實現(xiàn)主題詞或責(zé)任者、熱門圖書或主題詞以及圖書分類等多種標(biāo)簽云,其中有些已在部分圖書館應(yīng)用,如廈門大學(xué)圖書館OPAC[14]應(yīng)用了熱門檢索詞標(biāo)簽云,中國社會科學(xué)院圖書館[15]和中山大學(xué)圖書館[16]等Ex Libris用戶的OPAC系統(tǒng)應(yīng)用了主題詞標(biāo)簽云等。

4 結(jié) 語

本文就相關(guān)關(guān)鍵詞與圖書標(biāo)簽云的背景、現(xiàn)狀及需求、設(shè)計與實現(xiàn)以及擴展應(yīng)用進(jìn)行詳盡的研究,是對普通標(biāo)簽云的延伸和擴展。本文所研究的相關(guān)關(guān)鍵詞與相關(guān)圖書標(biāo)簽云,除了具備一般標(biāo)簽云的交互性、開放性及扁平化等Web 2.0的典型特征外,還具有如下個性特色:標(biāo)簽并非用戶直接標(biāo)注,而是基于檢索行為分析的結(jié)果;每個標(biāo)簽之間具有高度的相關(guān)性,對用戶更有吸引力;兩種標(biāo)簽云之間的數(shù)據(jù)存在因果關(guān)系或其他知識關(guān)聯(lián),更能改善用戶檢索體驗。相關(guān)關(guān)鍵詞與相關(guān)圖書標(biāo)簽云作為OPAC的一項附加功能,體現(xiàn)了“群體智慧”,承載的數(shù)據(jù)量大,信息投放精準(zhǔn),能給檢索行為帶來一種全新的體驗,達(dá)到了用戶貢獻(xiàn)知識以共享和交流的目的。

[1]Park J ,Choi B, Kim K, et al.A Vector Space Approach to Tag Cloud Similarity Ranking[J].Information Processing Letters,2010(12):489-496.

[2]夏秀峰,張 姝,李曉明.一種個性化標(biāo)簽云中的標(biāo)簽排序算法[J].沈陽航空航天大學(xué)學(xué)報,2011(1):46-50.

[3]Naureen N,Carolyn W.A Comparative Study of Navigation Using Single VS.Community Driven Tag Clouds on Websites[J].Proceedings of the American Society for Information Science and Technology,2012(1):1-4.

[4]曾子明,張 振.社會化標(biāo)注系統(tǒng)中基于社區(qū)標(biāo)簽云的個性化推薦研究[J].情報雜志,2011(10):128-133.

[5]Daisuke Y,Tomoki M,Shigeki O,et al.Collaborative Video Annotation by Sharing Tag Clouds[J].Transactions of the Japanese Society for Artificial Intelligence,2010(2):243-251.

[6]張 媛,趙藝超.基于用戶體驗的標(biāo)簽云可視化布局研究[J].計算機與數(shù)字工程,2011(10):16-17.

[7]黎邦群.用戶參與書目建設(shè)研究[J].圖書館雜志,2012(12):20-23.

[8]李 賓,沈曉梅.從用戶接受到用戶體驗:談圖書館用戶角色變化[J].圖書館論壇,2010(2):17-19.

[9]雅虎研究院Taglines演示[EB/OL].[2013-02-20].http://www.research.yahoo.com/taglines.

[10]廖 鳳,張建勇.Keyword Cloud在文獻(xiàn)檢索中的應(yīng)用研究[J].圖書館雜志,2010(9):57-61.

[11]黎邦群.OPAC相關(guān)搜索功能的設(shè)計與實現(xiàn)[J].圖書館學(xué)研究,2011(12):56-59.

[12]黎邦群.OPAC拼音搜索功能的設(shè)計與實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2011(9):88-93.

[13]黎邦群.OPAC拼寫檢查功能的設(shè)計與實現(xiàn)[J].圖書館學(xué)研究,2012(4):73-79.

[14]廈門大學(xué)圖書館書目檢索系統(tǒng)[EB/OL].[2013-02-20].http://210.34.4.28/opac.

[15]中國社會科學(xué)院圖書館[EB/OL].[2013-02-20].http://www.lib.cass.org.cn.

[16]中山大學(xué)圖書館[EB/OL].[2013-02-20].http://library.sysu.edu.cn.

猜你喜歡
字段數(shù)據(jù)表檢索
圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
湖北省新冠肺炎疫情數(shù)據(jù)表
黨員生活(2020年2期)2020-04-17 09:56:30
2019年第4-6期便捷檢索目錄
基于列控工程數(shù)據(jù)表建立線路拓?fù)潢P(guān)系的研究
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
CNMARC304字段和314字段責(zé)任附注方式解析
圖表
無正題名文獻(xiàn)著錄方法評述
基于VSL的動態(tài)數(shù)據(jù)表應(yīng)用研究
河南科技(2014年24期)2014-02-27 14:19:25
關(guān)于CNMARC的3--字段改革的必要性與可行性研究
高要市| 衡阳县| 西乌| 阿图什市| 德保县| 潢川县| 临猗县| 库尔勒市| 罗城| 华安县| 嵩明县| 原平市| 额济纳旗| 卢湾区| 常德市| 巴东县| 资溪县| 温州市| 阜宁县| 玉龙| 浦县| 闽侯县| 根河市| 吴堡县| 广丰县| 东城区| 攀枝花市| 长岛县| 山东| 福州市| 白河县| 诸暨市| 福泉市| 德清县| 宜阳县| 苗栗县| 临汾市| 伊春市| 三都| 望谟县| 西畴县|