范憶慧
(廣東海洋大學(xué)圖書館,廣東湛江 524088)
網(wǎng)絡(luò)標簽是一種互聯(lián)網(wǎng)內(nèi)容組織方式,它幫助人們輕松地描述和分類內(nèi)容,以便于檢索和分享。標簽(Tag)是自由分類法Folksonomy的具體表現(xiàn)形式,是用戶賦予特定信息資源的標識,用于描述資源的主題、類型、功能等多種特征,代表用戶對資源的理解和偏好,是實現(xiàn)信息資源組織和共享的基礎(chǔ)[1]。標簽以人為信息傳遞和交換為核心,實現(xiàn)了由機器與人到人與人的傳播方式的改變,開創(chuàng)了互聯(lián)網(wǎng)信息傳播的新階段。目前,標簽已成為網(wǎng)絡(luò)常見的應(yīng)用方式,提供標簽的網(wǎng)站越來越受歡迎。
因特網(wǎng)上的海量信息資源存在2種不同的使用模式[2]:一種是傳統(tǒng)的由信息資源、元數(shù)據(jù)、用戶三元素組成的元數(shù)據(jù)使用模式;另一種是由信息資源、網(wǎng)絡(luò)標簽、用戶三元素組成的網(wǎng)絡(luò)標簽使用模式。元數(shù)據(jù)、標簽都是對網(wǎng)絡(luò)信息資源進行描述,以便于管理和方便用戶對數(shù)字資源的使用。
1)來源不同。元數(shù)據(jù)來源于專業(yè)人員,網(wǎng)絡(luò)標簽來源于用戶。
2)原理不同。元數(shù)據(jù)按著嚴格的專業(yè)條件給予,有預(yù)設(shè)的結(jié)構(gòu)模式,不能隨意更改。網(wǎng)絡(luò)標簽則是用戶根據(jù)個人喜好自由給予,沒有預(yù)設(shè)的結(jié)構(gòu)模式,在應(yīng)用中不斷進行優(yōu)化。
3)用戶性質(zhì)不同。元數(shù)據(jù)中的用戶僅僅是使用者而非建設(shè)匯聚者,操作和維修成本高。標簽的用戶既是建設(shè)者又是使用者,用戶在應(yīng)用與建設(shè)“數(shù)字資源”與“Tag標簽”的過程中,相互之間能不斷建立社會聯(lián)系。
Folksonomy是因Web2.0而流行起來的信息組織方式,它是一個創(chuàng)造詞,由folk和tax onomy組合而來,稱為“自由分類法”,也叫“大眾分類法”、“社會分類法”、“草根分類法”等[3]。網(wǎng)絡(luò)標簽是Folksonomy形成和使用的基礎(chǔ),也是 Folksonomy詞匯體系的基本構(gòu)成單元。用戶按個體需求對信息資源自由添加標簽,該行為是在一個社會化的環(huán)境中進行,這個環(huán)境是開放和共享的。“自由分類法”最早提出者、美國互聯(lián)網(wǎng)專家Thomas Vander Wal認為,F(xiàn)olksonomy的形成受2方面因素的影響:用戶個人的網(wǎng)絡(luò)信息組織需求與網(wǎng)絡(luò)環(huán)境的社會化。
將豆瓣圖書標簽中熱門標簽截取2行(局部),如圖1所示。
圖1 截取標簽實例
由圖1可以看出,標簽之間用空格隔開,由大小不同的標題詞構(gòu)成。標簽的語法構(gòu)成可以是單詞,也可以是單個漢字、短語和句子等。標簽字號有大小之分,字體越大說明這個標簽的使用頻率越高。在圖1中,“村上春樹”等是使用頻率最高的標簽。
用戶根據(jù)個人喜好、認知和需求將書名劃分為不同粒度的標簽。例如:書名《魔卡少女櫻》就可以切分為“魔卡”、“少女櫻”、“魔卡少女櫻”等不同的標簽,可以是名詞、形容詞、動詞、介詞等,詞性不限。還可以從圖書隱含的意義、類型特征給予標簽。如《魔卡少女櫻》豆瓣成員常用的標簽(共181個)中用戶標簽頻率高的前8個是:“CLAMP”(953)、“漫畫”(712)、“魔卡少女櫻”(459)、“日本漫畫”(332)、“少女漫畫”(223)、“日本”(199)、“經(jīng)典”(120)、“小櫻”(108)。
網(wǎng)絡(luò)標簽服務(wù)Delicious的創(chuàng)始人、谷歌工程師Joshua Schachter在1998年提出了網(wǎng)絡(luò)標簽概念,對各種網(wǎng)絡(luò)信息資源進行標注,它包括存在于互聯(lián)網(wǎng)中的各種類型的信息資源,如圖書、文章、網(wǎng)頁、文獻、博客、圖片、視頻、音頻等信息資源。
個人用戶通過為網(wǎng)絡(luò)資源添加標簽,可以方便日后的查看、檢索和使用,從而實現(xiàn)個人信息資源的組織和管理。每個公眾用戶都可以看到其他人組織和管理的信息資源,從而實現(xiàn)了資源的共享。標簽就是由用戶在這類系統(tǒng)中以協(xié)作標注的方式共建信息共享空間的概念表述。
網(wǎng)絡(luò)標簽具有的特性:① 隨意性。標簽是人的一種隨心所欲的行為,只要能方便地找到它,用戶就可以隨意地用任何詞來標記它。②多樣性。Tag和關(guān)鍵詞不一樣,與目錄、主題詞也不相同。Tag是一種私人標注,是建立在用戶對內(nèi)容的自身理解之上的,不一定專指主題,可以是內(nèi)容和時間或者同文章主題沒有聯(lián)系的詞匯,能從多個維度來揭示網(wǎng)絡(luò)信息資源內(nèi)容。③自由性??呻S遇隨存,組織自由,收藏自由,創(chuàng)建組群自由。④ 動態(tài)性。任何人在應(yīng)用網(wǎng)絡(luò)標簽后,他人立刻可以看到這些標簽,還可以增加或修改,是網(wǎng)絡(luò)用戶相互作用的結(jié)果。常用標簽按字順形成標簽總圖(Tag cloud),標簽處于動態(tài)變化中。標簽的動態(tài)性表現(xiàn)為生命周期和生命活力。生命周期是標簽進入到退出系統(tǒng)之間的過程。生命活力的大小與標簽所承載信息的質(zhì)量和價值相關(guān)。通過標簽總圖反映出網(wǎng)絡(luò)資源和用戶需求的變化情況。⑤實效性。用戶通過少量標簽就能很好地聚合某一時間、某些人關(guān)注的某些“焦點”和“熱點”問題。⑥ 社會性。其核心價值在于“共享”。Tag可實現(xiàn)朋友間、家人間、共同興趣群組間的網(wǎng)絡(luò)收藏與分享,用RSS方式訂閱感興趣對應(yīng)的資料,發(fā)現(xiàn)志同道合者及他們的標簽。⑦平行性。各標簽之間是一種平行關(guān)系,屬于扁平化的組織,但可根據(jù)相關(guān)性,將經(jīng)常一起出現(xiàn)的標簽關(guān)聯(lián)起來。⑧模糊性。標簽提供多個分類揭示途徑。由個別的介詞、助詞等組成的不常用的標簽、大量的同意義標簽都不具有明顯的意義,對信息資源的有效標引和檢索不清晰。即使點擊率高的可以突出顯示,但也難免被浩如煙海的信息所淹沒。⑨垃圾標簽。一些使用頻率特別高等標簽中會出現(xiàn)一些毫無關(guān)系的垃圾資源條目,影響整個資源服務(wù)系統(tǒng)的運作[4]。
網(wǎng)絡(luò)標簽的優(yōu)點:①不受地域限制,將資料存放在網(wǎng)絡(luò)而非本地電腦上。② 可進行標識,以方便查找;③可在索引中指代原件;④ 可以提供關(guān)聯(lián)度;⑤ 可進行分面標引;⑥ 可體現(xiàn)集體智慧。標簽已成為注解和組織包括博客在內(nèi)的各類網(wǎng)絡(luò)信息資源的重要工具。標簽信息自由創(chuàng)建使用是其最大的優(yōu)點,但無形中又導(dǎo)致標準的質(zhì)量下降。
網(wǎng)絡(luò)標簽的主要缺點是歧義多、同義多、單復(fù)數(shù)濫用以及專指度不夠。
國外網(wǎng)絡(luò)標簽應(yīng)用較著名的網(wǎng)站有“Delicious Bibsonom Flickr Simpy”;國內(nèi)較著名的有“天天網(wǎng)摘”(www.365key.com)、“新浪博客”、“書簽”(www.younote.com)、“博采中國”(blogmark.blogchina.com)、“碧海銀沙書簽”(bookmark.yinsha.com)等。國內(nèi)的網(wǎng)絡(luò)標簽服務(wù)多出現(xiàn)在博客上。新浪、搜狐等為主流博客服務(wù)商,允許用戶以網(wǎng)絡(luò)標簽形式來組織自己發(fā)表的文章,并且利用這些標簽提供網(wǎng)站導(dǎo)航服務(wù)。
國外幾乎所有提供博客服務(wù)的圖書館都在博客中嵌入了Tag技術(shù)。如美國普林斯頓大學(xué)圖書館、美國威斯康辛大學(xué)、NewRegent University Library、美國密歇根州大學(xué)圖書館等。中國大陸前100名高校圖書館中絕大多數(shù)都應(yīng)用了一種圖書館2.0技術(shù)和服務(wù),只有廈門大學(xué)圖書館和上海大學(xué)圖書館在多項技術(shù)和服務(wù)上有所嘗試。標簽依附于網(wǎng)站的靈活運用,不僅可發(fā)揮標簽揭示隱含內(nèi)容或信息、分類的作用,還將實現(xiàn)對資源聚合、協(xié)同與推薦等功能的充分利用[5]。
個性化信息服務(wù)是指針對不同用戶的不同特點制定不同策略、不同內(nèi)容和模式的服務(wù)。① 滿足用戶的個體信息需求,根據(jù)用戶要求提供服務(wù);②分析不同用戶使用習(xí)慣、個性需求,為其提供可能需要的信息服務(wù);③為用戶提供展示自我、宣傳個性的窗口;④針對不同用戶提供不同的服務(wù)形式和內(nèi)容。
網(wǎng)絡(luò)標簽是新時代網(wǎng)絡(luò)用戶的便捷工具,更為服務(wù)者和研究者提供了寶貴的數(shù)字資源 。①對信息使用者來說網(wǎng)絡(luò)標簽?zāi)軌驇椭脩舴奖?、低成本地管理文檔,降低學(xué)習(xí)和遷移的成本。②對提供信息服務(wù)的網(wǎng)站來說可吸引更多的用戶,便于瀏覽檢索、了解用戶的興趣和視角以及增加個性化的服務(wù)。③對網(wǎng)絡(luò)數(shù)據(jù)挖掘者來說網(wǎng)絡(luò)標簽數(shù)據(jù)集是重要的研究資源,多數(shù)通過人工取得,其成本低,數(shù)量龐大,內(nèi)容緊跟時代潮流??梢杂脕碛嬎阄臋n之間的相似度來提高檢索的效果,通過分析用戶需求發(fā)現(xiàn)用戶興趣,從而提供快捷有效的信息資源推薦服務(wù)。
梅葛是楚雄地區(qū)說中部方言的彝族(主要是羅羅頗、里頗支系)民歌,上世紀50年代云南掀起民族民間文學(xué)整理熱潮時,梅葛就曾多次被整理,并在1959年正式出版。這次整理,與60多年前不同,不僅工作深入程度有很大差別,而且時代語境和學(xué)術(shù)范式也有很大不同。這次整理,完成的是“非遺”時代一個堪稱典范的“唱本”,而不再只是對“史詩”文本的一次模仿。
網(wǎng)絡(luò)標簽主要有2種標注方法:①手工標注,廣泛應(yīng)用于網(wǎng)頁、博客、圖像資源的標注;② 自動標注,用于語義網(wǎng)中資源和資源關(guān)系的標注。用戶完成文章的撰寫時,往往被要求自由選擇一些簡短的詞對文章進行標注。自由標注會產(chǎn)生一義多詞或者一詞多義等問題。如允許用戶不依賴于某個受控的詞匯表,根據(jù)喜好自由對網(wǎng)絡(luò)信息資源進行標注,則可能使信息呈現(xiàn)發(fā)散性而不利于其組織和檢索。為此可為用戶推薦標簽,以提供標注的準確性和收斂性。標簽推薦是網(wǎng)絡(luò)標簽服務(wù)的重要部分。標簽推薦系統(tǒng)的出現(xiàn)進一步減少了用戶負擔(dān)。根據(jù)用戶之前的標簽自動給出標簽建議,用戶可簡單選擇或直接使用,減少了標注的時間和動作,幫助吸引其他用戶使用標簽。圖書館可以利用Tag技術(shù)深度發(fā)現(xiàn)和發(fā)掘圖書館的信息資源,有針對性地進行個性化信息服務(wù)。
個性化信息服務(wù)按對象可分為科技用戶的 、企業(yè)用戶的、政府機構(gòu)的、公眾用戶的、領(lǐng)導(dǎo)決策參考用戶的個性化信息服務(wù);按信息資源定制類型可分為我的數(shù)據(jù)庫(my databases)、我的參考書架(my reference shelves)、我的網(wǎng)絡(luò)連接(my internet links)、我的搜索引擎(my internet search)等。按推送方式可分為頻道的、網(wǎng)頁的、郵件的個性化信息服務(wù)。按用戶描述文件存放的位置可分為基于服務(wù)器端的、基于代理的、基于客戶端的個性化信息服務(wù)。按服務(wù)模式可分為個性化定制的、特色增值的、個性化推薦的服務(wù)模式[6-9]。
個性化信息推介服務(wù)是指信息檢索或網(wǎng)站系統(tǒng)動態(tài)地為用戶提供觀看內(nèi)容或瀏覽建議,概括和分析用戶上網(wǎng)瀏覽、檢索、訪問行為,從而產(chǎn)生用戶興趣表達、用戶聚類、頻繁項集、生產(chǎn)關(guān)聯(lián)規(guī)則等信息,將無序文檔進行個性化排序、語義排序、推薦列表排序等有序化組織,向用戶推薦有組織的檢索結(jié)果、相關(guān)內(nèi)容或用戶感興趣的頁面,主動為用戶導(dǎo)航[10-13]。
1)用戶興趣搜集。分顯性和隱性收集2種方式。顯性收集方式包括相關(guān)反饋技術(shù)中的興趣學(xué)習(xí)、預(yù)測算法以及用戶交互和示例的信息抽取技術(shù)。隱性收集方式主要包括基于內(nèi)容的用戶興趣提取和基于用戶查詢行為的數(shù)據(jù)挖掘,包括鏈接點擊次數(shù)、用戶在線瀏覽時間、用戶復(fù)制和下載內(nèi)容行為等。
2)用戶興趣模型表示。任何人使用網(wǎng)絡(luò)標簽后,其他人立刻可看到這些標簽,還可增加或修改標簽。常用標簽按順序形成標簽總圖,即為標簽云(Tag cloud)。每個標簽云的面積代表熱門程度,面積越大表示該標簽越熱門,使用頻率越高。標簽云圖反映了標簽的權(quán)重。用戶使用Tag的共現(xiàn)頻次建立用戶Tag網(wǎng)絡(luò),然后依據(jù)社會網(wǎng)絡(luò)中的凝聚子群分析,對標簽進行聚類,進而映射到相應(yīng)的知識集合,完成對單個用戶的知識聚類。對所有用戶的知識子類進行聚類時,依據(jù)知識子類與標簽云之間的相似性,可使聚類結(jié)果形成不同的相似主題。標簽使用量呈“冪律分布”特征:排序在前的使用量大,大量的標簽處于“長尾”區(qū)域。
3)根據(jù)用戶興趣的自適應(yīng)推薦。推薦的基本思想是將用戶的查詢結(jié)果作為用戶的初始特征描述,然后根據(jù)這個特征描述利用標準信息檢索找出一組最相關(guān)的Web頁面,并將這些頁面推薦給用戶。用戶瀏覽評分后反饋到系統(tǒng)中,系統(tǒng)對用戶特征描述進行自動更新。推薦的目的主要包括:①簡化標注程序,方便用戶使用,從而增加社會標簽系統(tǒng)的可用性和黏性。② 提高標簽的質(zhì)量,減少錯拼、歧義等情況,提高標簽在信息資源組織、檢索、利用和發(fā)現(xiàn)方面的作用。③改變標簽空間的結(jié)構(gòu),使得標簽空間更快地穩(wěn)定和收斂,進而涌現(xiàn)語義。根據(jù)不同的技術(shù)和內(nèi)容推薦可分為基于內(nèi)容的推薦、基于協(xié)同過濾的推薦、基于關(guān)聯(lián)規(guī)則的推薦、基于用戶統(tǒng)計信息的推薦、基于效率的推薦、基于知識的推薦等。
圖書館可利用Tag技術(shù)深度挖掘讀者在使用電子資源和紙質(zhì)資源中的需求趨向,為圖書館資源建設(shè)提供重要的參考。傳統(tǒng)的學(xué)科導(dǎo)航在很多高校都有應(yīng)用,但不同程度地存在學(xué)科覆蓋率低、更新慢、錯誤多、學(xué)科導(dǎo)航數(shù)據(jù)庫深度不夠等問題。學(xué)科館員可根據(jù)本校的重點學(xué)科信息,分類創(chuàng)建初始標簽信息,然后由被授權(quán)的、對學(xué)科知識有較深了解的讀者(教師、科研人員、研究生等)利用他們的相關(guān)學(xué)科知識進一步開發(fā)標簽信息,也可自行創(chuàng)建新的標簽,進而實現(xiàn)重點學(xué)科信息分類整合和共建共享,對學(xué)科知識庫進行良好導(dǎo)航。建立可覆蓋國內(nèi)外本學(xué)科領(lǐng)域權(quán)威的專業(yè)信息資源的導(dǎo)航系統(tǒng),通過互聯(lián)網(wǎng)這個信息共享平臺實現(xiàn)學(xué)科信息資源的共建、共享。為滿足大規(guī)模標注網(wǎng)絡(luò)資源的需要,圖書館可定期向用戶推送其感興趣的相關(guān)資源,在系統(tǒng)后臺自動或者半自動標注網(wǎng)絡(luò)資源,在前臺對用戶進行社會標注的推薦,從而提高標注普及率,解決數(shù)據(jù)的稀疏性。相對于用戶的探究與學(xué)習(xí),標簽系統(tǒng)起到促進作用,而用戶可以發(fā)現(xiàn)一些新的平時難以檢索到的資源,這就是網(wǎng)絡(luò)標簽的價值所在。
[1]孫紅鶯,次仁拉珍,葉鷹.基于標簽的數(shù)字圖書館個性化信息檢索[J].杭州師范大學(xué)學(xué)報:自然科學(xué)版,2008,7(5):387-391.
[2]莊秀麗.”tag標簽”互聯(lián)應(yīng)用[EB/OL].[2011-05-24].http://www:docin.com/search.do2007-5-13.
[3]李靜.Folksonomy的網(wǎng)絡(luò)性質(zhì)研究與應(yīng)用[J].情報科學(xué),2009,27(10):1483-1486.
[4]郭健峰.Tag在圖書館知識管理中的應(yīng)用研究[J].價值工程,2011(7):321-322.
[5]劉磊,劉嘉,穆麗娜.國內(nèi)外高校圖書館2.0應(yīng)用調(diào)查對比分析[J].圖書館理論與實踐,2009(11):25-27.
[6]潘梅.用戶信息空間自構(gòu)建——網(wǎng)絡(luò)書簽[J].圖書館學(xué)刊,2006(6):123-125.
[7]查先進,呂彬.知識共享視角下的大眾標注行為研究[J].圖書館論壇,2010(12):76-80.
[8]司憲策.基于內(nèi)容的社會標簽推介與分析研究[D].北京:清華大學(xué),2009.
[9]王松林.網(wǎng)絡(luò)資源知識組織的工具[J].山東圖書館學(xué)刊,2011(4):9-13.
[10]蔡志宏.Folksonomy在企業(yè)知識管理中的應(yīng)用研究[D].上海:華東師范大學(xué),2009.
[11]易明,曹高輝.基于Tag的知識主題網(wǎng)構(gòu)建與Web知識推送研究[J].中國圖書館學(xué)報,2011(4):4-12.
[12]顏端武,王日芬.信息獲取與用戶服務(wù)[J].北京:科學(xué)出版社,2010:219-225.
[13]靳延安,李瑞軒,文坤梅.社會標注及其在信息檢索中的應(yīng)用研究綜述[J].中文信息學(xué)報,2010,24(4):52-62.