余 春 (深圳大學(xué)圖書館 廣東 深圳 518060)
標(biāo)簽是Web2.0時代信息揭示、組織的新應(yīng)用。其類似于關(guān)鍵詞,可以用來描述信息資源(尤其是網(wǎng)絡(luò)信息資源)的性質(zhì)、范圍、對象類型、用途、類別等特征,以達(dá)到分類、檢索和共享信息資源的目的。標(biāo)注則是對用戶添加標(biāo)簽的行為的描述[1]。當(dāng)多個用戶個體的標(biāo)注行為被匯集在一起,標(biāo)注即具有了社會性,可稱之為社會標(biāo)注。
社會標(biāo)注在網(wǎng)絡(luò)中的應(yīng)用越來越廣泛,它為信息資源的標(biāo)引、組織、檢索提供了一種全新的自由、開放、共享的模式。近幾年,社會標(biāo)注與信息標(biāo)引、檢索成為學(xué)術(shù)界研究的熱點(diǎn)。本文將從基于社會標(biāo)注的信息標(biāo)引及基于社會標(biāo)注的信息檢索等方面綜述國外相關(guān)研究的進(jìn)展。
標(biāo)簽是社會標(biāo)注的直接產(chǎn)物,它能對信息資源的內(nèi)容、形式特征等進(jìn)行標(biāo)記、揭示,并且能根據(jù)這些標(biāo)記提供信息查詢,因此社會標(biāo)注具備標(biāo)引功能。Macgregor等學(xué)者通過傳統(tǒng)的受控詞表評價社會標(biāo)注的信息標(biāo)引效能發(fā)現(xiàn),社會標(biāo)注系統(tǒng)具有優(yōu)秀的交互性與社會性,能成功地吸引用戶參與信息管理,基于社會標(biāo)注的信息標(biāo)引方式將與傳統(tǒng)的以受控詞表標(biāo)引的方式并存,各自適用于不同的信息環(huán)境:非正式的和正式的[2]。
Thomas等人分別從圖書館的OPAC(Online Public Access Catalogue,聯(lián)機(jī)公共查詢目錄)和LibraryThing中抽取相同的10本圖書,通過將圖書的標(biāo)簽與它們對應(yīng)的LCSH(Library of Congress Subject Headings,美國國會圖書館主題詞表)中的主題詞進(jìn)行比較,定量分析了標(biāo)簽與LCSH主題詞的相似程度,證明社會標(biāo)注確實(shí)成功地補(bǔ)充了編目員提供的主題詞,為資源標(biāo)引提供了另一種途徑[3]。他們指出,結(jié)合了LCSH與標(biāo)簽的復(fù)合型目錄能產(chǎn)生更豐富的元數(shù)據(jù),圖書館應(yīng)盡力將其提供給用戶[3]。
社會標(biāo)注的信息標(biāo)引功能是通過標(biāo)簽實(shí)現(xiàn)的。標(biāo)簽是信息用戶表達(dá)其對信息資源的理解、概括、評論而采用的自然詞語。因此,研究標(biāo)簽的語言學(xué)特征有助于對基于社會標(biāo)注的信息標(biāo)引方式的理解,進(jìn)而有利于信息的組織、查詢、管理。目前對標(biāo)簽的語言學(xué)特征的研究主要包括詞匯分析及語義分析兩方面。
1.2.1 從詞匯學(xué)角度分析社會標(biāo)注
Spiteri利用統(tǒng)計學(xué)的方法分析標(biāo)簽的詞性、使用頻率及分布等特征發(fā)現(xiàn),標(biāo)簽中居于主導(dǎo)地位的用詞是名詞,并且是單個的術(shù)語,大都使用公認(rèn)的拼寫形式[4]。對大多數(shù)資源來說,標(biāo)簽的使用頻率分布與冪律分布趨于相同,少數(shù)高頻詞占據(jù)了標(biāo)簽總頻次的大部分比例[5]。此外,用戶的標(biāo)注中還存在著名詞的單復(fù)數(shù)形式不一致,縮寫詞、縮略語濫用,單詞拼寫錯誤等現(xiàn)象[4],影響了社會標(biāo)注的信息標(biāo)引效用。
1.2.2 從語義學(xué)角度研究社會標(biāo)注
社會標(biāo)注允許用戶利用自然語言自由創(chuàng)建、自由使用標(biāo)簽來描述、概括信息資源,致使社會標(biāo)注中存在著無法克服的同義、歧義標(biāo)簽的現(xiàn)象,導(dǎo)致標(biāo)簽呈發(fā)散性且缺乏等級層次,不利于信息的揭示、組織、檢索及共享。針對這一問題,目前主要是從語義學(xué)的角度研究如何確定標(biāo)簽的數(shù)據(jù)結(jié)構(gòu)與語義策略,以減少社會標(biāo)注混亂的現(xiàn)象。Passant和Laublet提出,利用MOAT(Meaning of a Tag,標(biāo)簽的含義)這一語義網(wǎng)架構(gòu),使Web2.0的內(nèi)容生產(chǎn)者以機(jī)器可讀的方式賦予標(biāo)簽內(nèi)容含義[6]。Meo等人通過研究利用兩個分等級的結(jié)構(gòu)及相關(guān)算法將語義相關(guān)的標(biāo)簽組層級化[7]。Kim HL等人提出語義標(biāo)簽?zāi)P蚚8],用來明確地顯示標(biāo)簽的數(shù)據(jù)結(jié)構(gòu)、語義及標(biāo)簽之間的相互關(guān)系。Alba等人運(yùn)用經(jīng)典的遺傳算法、CHC(Cross generation Heterogeneous recombination Cataclysmic mutation,跨世代異物種重組大變異)算法和模擬退火算法(Simulated Annealing),根據(jù)文本中語詞使用的語境來消除標(biāo)注中自然語言的歧義[9]。
此外,不少研究者還致力于應(yīng)用本體來研究社會標(biāo)注的語義。例如,Gruber分析了本體與標(biāo)簽的截然不同的角色,提出了標(biāo)簽本體的模型,以此完善標(biāo)簽的語義匹配,實(shí)現(xiàn)知識共享[10]。此外,SCOT(Social Semantic Cloud of Tags,標(biāo)簽社會語義)本體[11]、UTO(Upper Tag Ontology,頂層標(biāo)簽本體)[12]對社會標(biāo)注數(shù)據(jù)的結(jié)構(gòu)、語義的描述功能也進(jìn)入學(xué)者的研究視野。Kim H L等學(xué)者則為現(xiàn)有標(biāo)簽本體的比較提出了評判標(biāo)準(zhǔn),并據(jù)此討論了標(biāo)簽本體的優(yōu)劣之處[13]。
1.3.1 自動標(biāo)注
社會標(biāo)注已成為網(wǎng)絡(luò)資源組織的主要方式,但是海量的信息資源要全靠手工標(biāo)注是不可能的。為了提高社會標(biāo)注的覆蓋率,使之更好地標(biāo)引、組織信息資源,研究者們將目光投向自動標(biāo)注。Yang Yang等人提出先找到與當(dāng)前圖像數(shù)據(jù)集相似的文檔,依據(jù)這些文檔的標(biāo)簽設(shè)定當(dāng)前圖像的候選標(biāo)簽,然后運(yùn)用加權(quán)關(guān)聯(lián)規(guī)則挖掘法從候選標(biāo)簽中篩選出最終的標(biāo)簽集[14]。Yang Hsin Chang提出運(yùn)用自組織映射算法將網(wǎng)頁聚類,即可利用這些類之間的關(guān)系和每一類的主題來自動標(biāo)注網(wǎng)頁[15]。Kim J W通過對博客的內(nèi)容分析提出,利用CDIP(a collection-driven,yet individualitypreserving tagging system,集體驅(qū)動但又保持了個性的標(biāo)注系統(tǒng))為博客自動標(biāo)注[16]。
1.3.2 標(biāo)簽推薦
在用戶進(jìn)行標(biāo)注時,系統(tǒng)自動向其推薦標(biāo)簽是提高社會標(biāo)注的一致性、覆蓋率的有效方式。研究者主要從提高推薦精確度的方法和推薦自動化的方式這兩方面展開研究。標(biāo)簽推薦是將其他用戶對于同一資源所使用過的標(biāo)簽,經(jīng)過運(yùn)算處理后推薦給用戶。為了提高推薦的精確度,研究者提出了協(xié)作過濾法[17],即針對個體用戶的偏好建立排序模型[18],結(jié)合視覺相似性與標(biāo)簽共現(xiàn)統(tǒng)計的方式[19],使用潛在語義分析和張量維數(shù)約簡方法[20]。
系統(tǒng)自動推薦標(biāo)簽是提高標(biāo)注效率的有力途徑。Yang Song等人從機(jī)器學(xué)習(xí)的視角,提出了以文檔為中心、基于圖像的方式和基于原型的方式自動推薦標(biāo)簽[21]。Song Yong等人建立了實(shí)時自動推薦標(biāo)簽的技術(shù)架構(gòu)[22]。 Sevil等人提出在用戶上傳相片時,系統(tǒng)利用視覺相似度比較候選標(biāo)簽的權(quán)重,然后篩選出權(quán)重高的標(biāo)簽推薦給用戶[23]。
社會標(biāo)注的主體是標(biāo)注者,通過他們的標(biāo)注活動才能完成對信息資源的標(biāo)引。因此,對標(biāo)注者的標(biāo)注動機(jī)、標(biāo)簽的選擇、標(biāo)注習(xí)慣等特征進(jìn)行研究,有助于研究者發(fā)現(xiàn)基于社會標(biāo)注的信息標(biāo)引規(guī)律,從而更好地設(shè)計標(biāo)注系統(tǒng),更有效地組織、管理信息。Angus等人通過研究Flickr中的大學(xué)群組的成員使用標(biāo)簽的一般形式發(fā)現(xiàn),群組的成員傾向于選擇有利于系統(tǒng)的所有使用者的方式,而不是僅僅選擇有利于創(chuàng)建者個人的方式進(jìn)行標(biāo)注[24]。Fu等人探討了標(biāo)簽選擇中的社會影響作用[25],Bar-Ilan等人分析了在對圖像進(jìn)行標(biāo)注時,標(biāo)注對象的背景信息及他人的相互影響所產(chǎn)生的效用[26]。這些研究都得出了相似的結(jié)論:社會影響可能導(dǎo)致標(biāo)注結(jié)果的集中、一致,“集體的智慧”可以幫助標(biāo)注對象理解要標(biāo)注的信息資源。
社會標(biāo)注的信息標(biāo)引的目的是使用戶能檢索、發(fā)現(xiàn)和共享信息資源。如何提高基于社會標(biāo)注的信息檢索的性能已成為研究熱點(diǎn)。
McDonnell等人探討了在網(wǎng)絡(luò)搜索中社會標(biāo)注這一“集體智慧”的價值與力量,提出了“社會搜索”的新概念及其分類體系[27]。Morrison將社會書簽網(wǎng)站的標(biāo)簽與搜索引擎和主題目錄進(jìn)行信息檢索性能的比較發(fā)現(xiàn),利用社會書簽網(wǎng)站的標(biāo)簽進(jìn)行檢索的效果令人驚訝,如果能運(yùn)用更好的查詢處理方式,則可以進(jìn)一步提高它的信息檢索性能[28]。
2.2.1 利用語義技術(shù)加強(qiáng)基于社會標(biāo)注的信息檢索
社會標(biāo)注是用戶對信息資源內(nèi)容、形式等的描述、概括,帶有很強(qiáng)的語義性,用戶可以從社會標(biāo)注中挖掘出語義信息,利用它理解內(nèi)容的語義,實(shí)現(xiàn)更高效率的檢索。
Abel等人介紹了利用TagMe!系統(tǒng)、通過上下文認(rèn)知語義的途徑來改進(jìn)標(biāo)注系統(tǒng)中的個性化信息檢索[29]。Kim H H探討了運(yùn)用同義的和詞匯共現(xiàn)的標(biāo)簽查詢擴(kuò)展方式進(jìn)行視頻搜索[30]。Ungrangsi等人介紹了SemFlickr,它可以加強(qiáng)Flickr中的檢索[31]。SemFlickr的檢索原理是從語義網(wǎng)中檢索得到相關(guān)的本體,從那些本體中獲取檢索詞,并且提取檢索詞之間的本體關(guān)系以確定檢索到的標(biāo)簽的權(quán)重,以此進(jìn)行檢索結(jié)果排序。
2.2.2 標(biāo)簽與LCSH相結(jié)合,促進(jìn)信息檢索。
社會標(biāo)注的自由性、開放性造成了標(biāo)簽用詞的不規(guī)范(如縮寫詞濫用、名詞的單復(fù)數(shù)形式不一致、同義詞和歧義詞多、概念模糊),降低了基于社會標(biāo)注的信息檢索的效率。于是業(yè)界考慮將標(biāo)簽與受控詞表相結(jié)合,以提高標(biāo)簽的規(guī)范性、集中性。目前的研究多是從標(biāo)簽與LCSH相結(jié)合的角度進(jìn)行的。例如,Yi探討了以語義相似的方式為社會標(biāo)簽推算相關(guān)的LCSH主題詞[32];Yi和Chan以單詞匹配法為基礎(chǔ),討論了標(biāo)簽與LCSH的映射方法及用LCSH給標(biāo)簽排序帶來的優(yōu)勢[33];Steele則觀察了社會標(biāo)注及其在圖書館在線目錄中的使用情況,分析了諸如LCSH的受控詞表的優(yōu)缺點(diǎn)及社會標(biāo)注如何幫助LCSH進(jìn)行信息檢索等方面的問題[34]。
2.2.3 檢索相似度排序
社會標(biāo)簽是用戶對信息資源具有語義的描述,可以作為檢索相似度排序的依據(jù)。通過衡量標(biāo)簽的相似度并對其排序,可實(shí)現(xiàn)資源的相關(guān)度排序,從而提高信息檢索的質(zhì)量。學(xué)術(shù)界已經(jīng)提出了多種計算方法和模型來評價標(biāo)簽相似性。Li Xirong等人提出,通過對視覺相似的鄰域累積投票的算法可得到標(biāo)簽相似性,從而實(shí)現(xiàn)社會圖像檢索[35]。隨機(jī)游走的方法[36]、概率技術(shù)[7]都被用于判斷標(biāo)簽的相似度。
2.2.4 檢索詞的選擇與確定
檢索詞是表達(dá)用戶信息需求和檢索課題內(nèi)容的基本單元,也是與有關(guān)數(shù)據(jù)庫、有關(guān)網(wǎng)絡(luò)資源進(jìn)行匹配運(yùn)算的基本單元,檢索詞選擇恰當(dāng)與否直接影響檢索的效果。社會標(biāo)注是“集體智慧”的自由凝聚,對同一資源有大量不同的標(biāo)簽加以描述,而即使同樣的標(biāo)簽所表達(dá)的語義也并不相同,指向的資源也各異。因此,以標(biāo)簽作為檢索詞時,對它的選擇和確定是影響檢索效率的重要因素。Peters 和Stock提出去掉某一具體文檔中分布于長尾的所有標(biāo)簽,利用在標(biāo)簽分布中位于長尾起始部分的權(quán)力標(biāo)簽(power tags)來形成檢索詞[37]。Clements等人研究了個性化和平滑技術(shù)對增加檢索詞長度的作用[38],結(jié)果顯示,與采用TFIDF(Term Frequency-Inverse Document Frequency,詞頻-反文檔頻率)權(quán)重這些基于使用頻率的內(nèi)容排序方式相比,個性化和平滑的技術(shù)讓用戶使用更少的檢索詞就能發(fā)現(xiàn)同等相關(guān)的內(nèi)容。
2.2.5 標(biāo)簽云對信息檢索的影響
標(biāo)簽云是對標(biāo)簽的集成及可視化描述。在標(biāo)簽云中,標(biāo)簽一般是獨(dú)立的詞匯,通常按字母順序排列,其重要程度(使用量)通過改變字體大小或顏色來表示。利用標(biāo)簽云可靈活地依照字序或熱門程度來檢索標(biāo)簽,而大多數(shù)標(biāo)簽本身就是直接指向一系列相關(guān)資源條目的超級鏈接,因此標(biāo)簽云對信息檢索及資源的重要性評估具有積極的作用。Park等人提出,標(biāo)簽云是標(biāo)簽的集合,它在多媒體信息檢索中具有很大的應(yīng)用潛力,他們提出了通過合并標(biāo)簽相似性的信息來計算標(biāo)簽云之間的相似度的方法[39]。Sinclair 與Cardew-Hall通過對關(guān)于用戶在什么情況下選擇標(biāo)簽云或傳統(tǒng)的檢索界面來查詢信息的實(shí)驗發(fā)現(xiàn),在查找特定的專門信息時,用戶多選擇傳統(tǒng)的檢索界面,而當(dāng)查詢?nèi)蝿?wù)是較普通的信息時,用戶則愿意選擇使用標(biāo)簽云[40]。Bateman等人研究了標(biāo)簽云的何種視覺屬性能吸引用戶的注意,以影響用戶發(fā)現(xiàn)標(biāo)簽的便利性[41]。
自出現(xiàn)伊始,社會標(biāo)注最吸引用戶的便是其自由的特性:自由參與、自由使用、自由表達(dá)。但也由此造成了社會標(biāo)注固有的一些缺陷:標(biāo)簽拼寫不規(guī)范甚至錯誤,同義、歧義、語法關(guān)系糊涂,權(quán)重表達(dá)缺失等[42],這些缺陷都影響了社會標(biāo)注的信息標(biāo)引、檢索功能的發(fā)揮。于是業(yè)界開始探尋對社會標(biāo)注的規(guī)范化、自動化,例如,規(guī)范標(biāo)簽的拼寫;按本體的思想規(guī)范標(biāo)簽,將標(biāo)簽結(jié)構(gòu)化、組合化;自動為資源添加標(biāo)簽。這些研究在一定程度上加強(qiáng)了社會標(biāo)注對信息資源的標(biāo)引、檢索,但是值得注意的是,規(guī)范化的同時也意味著自由樂趣的減少,在社會標(biāo)注規(guī)范化、自動化的研究中,要注意保護(hù)社會標(biāo)注自由的特性,尋求自由與規(guī)范的和諧,既要提高社會標(biāo)注的信息標(biāo)引、檢索的質(zhì)量,又要讓用戶充分享受自由標(biāo)注的樂趣。
社會標(biāo)注中的語義、語法表達(dá)及拼寫的不規(guī)范等缺陷都會給標(biāo)簽制造一些噪聲,這就需要研究降低、去除標(biāo)簽噪聲的方法,以提高社會標(biāo)注的信息標(biāo)引、檢索的準(zhǔn)確性、全面性。目前的研究對語法關(guān)系模糊、權(quán)重表達(dá)缺失的關(guān)注較少,未來應(yīng)該予以積極探討。當(dāng)前消除標(biāo)簽歧義的方法主要有數(shù)據(jù)挖掘、統(tǒng)計分析以及采用知識組織工具、控制機(jī)制和可視化組件等,其中前兩種方法屬于單純的定量方法,不需要用戶參與判斷,因此具有較好的應(yīng)用前景,研究者需要探索更有效的挖掘方法和數(shù)學(xué)模型,擴(kuò)大實(shí)驗規(guī)模,以提高通過數(shù)據(jù)挖掘、統(tǒng)計分析消除標(biāo)簽歧義的準(zhǔn)確性及效率[43]。
另外,在目前的社會標(biāo)注系統(tǒng)中,存在大量惡意、無用的垃圾標(biāo)簽,干擾了其對信息資源的揭示、檢索和共享。目前的研究對此涉及尚少,而且不少社會標(biāo)注系統(tǒng)是采用手工方式識別、刪除垃圾標(biāo)簽。因此,對垃圾標(biāo)簽的表現(xiàn)形式、制造者的心理與行為研究以及對其自動識別與自動刪除的研究應(yīng)是未來發(fā)展方向之一。
由于社會標(biāo)注具有自由性,用戶使用的標(biāo)簽可能是雜亂無章、無序的。社會標(biāo)注對資源進(jìn)行的自下而上、由用戶主導(dǎo)的分類,呈現(xiàn)出一種平面式的結(jié)構(gòu),標(biāo)簽之間是平等的關(guān)系,無上下位類的層次關(guān)系。標(biāo)簽的無序性、層次缺乏性將導(dǎo)致社會標(biāo)注無法很好地揭示標(biāo)簽之間復(fù)雜的關(guān)系,不能很好地組織知識信息,阻礙其信息檢索功能的發(fā)揮。雖然針對這些問題,研究者都已展開探索,提出利用標(biāo)簽云、標(biāo)簽概念空間等方法解決標(biāo)簽序化問題[44],利用與受控詞表的關(guān)聯(lián)、映射獲得標(biāo)簽層級[33],利用標(biāo)簽隱含的概念為標(biāo)簽建立層次[45],但是這些方法都存在局限性,難以與社會標(biāo)注的標(biāo)引、檢索有效地融合。因此,如何為社會標(biāo)注建立合適的層級結(jié)構(gòu)、如何使標(biāo)簽有序化,也是未來研究的發(fā)展方向。
語義檢索是指檢索工作不再拘泥于用戶所輸入的檢索詞與信息資源的字面本身,而是通過提取其中的語義信息并對其進(jìn)行推理、匹配等處理,更準(zhǔn)確地向用戶返回最符合其信息需求的檢索結(jié)果。這是近年來得到迅速發(fā)展的一種高級檢索方式。社會標(biāo)注是用戶對資源的描述、概括,帶有很強(qiáng)的語義性。應(yīng)用本體的思想構(gòu)建標(biāo)簽本體,從中提取語義信息,實(shí)現(xiàn)基于社會標(biāo)注的語義檢索將是未來研究的前沿及熱點(diǎn)問題。
社會標(biāo)注出現(xiàn)的時間并不長,但它卻以獨(dú)特的自由性吸引用戶參與其中,織就了一個聯(lián)系用戶、資源、標(biāo)簽的信息網(wǎng)絡(luò),為信息資源的標(biāo)引、組織、檢索提供了全新的自由、開放、共享的模式。不少研究者對基于社會標(biāo)注的信息標(biāo)引、檢索進(jìn)行研究,取得了一系列成果。但總的來說,這些研究還處于探索階段,研究對象往往局限于個別社會標(biāo)注系統(tǒng),研究成果多為試驗性的,要將其產(chǎn)業(yè)化應(yīng)用,仍需要大量的后續(xù)研究。
[1]魏建良,朱慶華.社會化標(biāo)注理論研究綜述[J].中國圖書館學(xué)報,2009(6):88-96.
[2]Macgregor G, McCulloch E.Collaborative Tagging as a Knowledge Organisation and Resource Discovery Tool[J].Library Review,2006(5):291-300.
[3]Thomas M, Caudle D M, Schmitz C M.To Tag or Not to Tag?[J].Library Hi-Tech, 2009 (3):411-434.
[4]Spiteri L F.The Structure and Form of Folksonomy Tags: The Road to the Public Library Catalog[J].Information Technology and Libraries,2007 (3):13-25.
[5]Robu V, Halpin H, Shepherd H.Emergence of Consensus and Shared Vocabularies in Collaborative Tagging Systems[EB/OL].[2011-10-10].http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.161.7359.
[6]Passant A, Laublet P.Meaning of a Tag: A Collaborative Approach to Bridge the Gap Between Tagging and Linked Data[EB/OL].[2011-03-25].http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.142.6915&rep=rep1&type=pdf.
[7]Meo P D, Quattrone G, Ursino D.Exploitation of Semantic Relationships and Hierarchical Data Structures to Support a User in His Annotation and Browsing Activities in Folksonomies[J].Information Systems, 2009(6):511-535.
[8]Kim H L, Decker S, Breslin J G.Representing and Sharing Folksonomies with Semantics[J].Journal of Information Science,2010 (1):57-72.
[9]Alba E, Luque G, Araujo L.Natural Language Tagging with Genetic Algorithms[J].Information Processing Letters, 2006 (5):173-182.
[10]Gruber T.Ontology of Folksonomy: A Mash-up of Apples and Oranges[J].International Journal on Semantic Web and Information Systems,2007 (1):1-11.
[11]Kim H L, Yang S-K, Song S-J, et al.Tag Mediated Society with SCOT Ontology[EB/OL].[2011-03-24].http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.142.7977&rep=rep1&type=pdf.
[12]Ding Ying, Jacob E K, Fried M, et al.Upper Tag Ontology for Integrating Social Tagging Data[J].Journal of the American Society for Information Science and Technology, 2010 (3):505-521.
[13]Kim H L, Scerri S, Breslin J G, et al.The State of the Art in Tag Ontologies: A Semantic Model for Tagging and Folksonomies[EB/OL].[2011-03-28].http://dl.acm.org/citation.cfm?id=1503431.
[14]Yang Yang, Huang Zi, Shen Hengtao, et al.Mining Multi-Tag Association for Image Tagging[J].World Wide Web-Internet and Web Information Systems, 2011 (2):133-156.
[15]Yang H C.Automatic Generation of Semantically Enriched Web Pages by a Text Mining Approach[J].Expert Systems with Applications, 2009 (6):9709-9718.
[16]Kim J W, Candan K S, Tatemura J.Organization and Tagging of Blog and News Entries Based on Content Reuse[J].Journal of Signal Processing Systems for Signal Image and Video Technology, 2010(3): 407-421.
[17]Kim H N, Ji A T, Ha I, et al.Collaborative Filtering Based on Collaborative Tagging for Enhancing the Quality of Recommendation[J].Electronic Commerce Research and Applications, 2010 (1):73-83.
[18]Wang Jun, Clements M, Yang Jie, et al.Personalization of Tagging Systems[J].Information Processing & Management, 2010(1):58-70.
[19]Lee S H, Neve W D, Ro Y M.Tag Refinement in an Image Folksonomy Using Visual Similarity and Tag Co-Occurrence[J].Signal Processing-Image Communication, 2010 (10):761-773.
[20]Symeonidis P, Nanopoulos A, Manolopoulos Y.A Unified Framework for Providing Recommendations in Social Tagging Systems Based on Ternary Semantic Snalysis[J].IEEE Transactions on Knowledge and Data Engineering, 2010 (2):179-192.
[21]Yang Song, Zhang Lu, Giles C L.Automatic Tag Recommendation Algorithms for Social Recommender Systems[EB/OL].[2011-10-10].http://research.microsoft.com/apps/pubs/default.aspx?id=79896.
[22]Song Yong, Zhuang Ziming, Li Huajing, et al.Real-Time Automatic Tag Recommendation[EB/OL].[2011-03-26].http://www.cse.psu.edu/~huali/pdf/sigir.pdf.
[23]Sevil S G, Kucuktunc O, Duygulu P, et al.Automatic Tag Expansion Using Visual Similarity for Photo Sharing Websites[J].Multimedia Tools and Applications, 2010 (1):81-99.
[24]Angus E, Thelwall M, Stuart D.General Patterns of Tag Usage Among University Groups in Flickr[J].Online Information Review, 2008(1):89-101.
[25]Fu W T, Kannampallil T, Kang R, et al.Semantic Imitation in Social Tagging[J].ACM Transactions on Computer-Human Interaction,2010(3):1-37.
[26]Bar-Ilan J, Zhitomirsky-Geffet M, Miller Y, et al.The Effects of Background Information and Social Interaction on Image Tagging[J].Journal of the American Society for Information Science and Technology, 2010 (5):940-951.
[27]McDonnell M, Shiri A.Social Search: a Taxonomy of, and a User-Centred Approach to, Social Web Search[J].Program-Electronic Library and Information Systems, 2011 (1):6-28.
[28]Morrison P J.Tagging of and Searching: Search Retrieval Effectiveness Folksonomies on the World Wide Web[J].Information Processing & Management, 2008 (4):1562-1579.
[29]Abel F, Baldoni M, Baroglio C, et al.Leveraging Search and Content Exploration by Exploiting Context in Folksonomy Systems[J].New Review of Hypermedia and Multimedia, 2010(1-2):33-70.
[30]Kim H H.Toward Video Semantic Search Based on a Structured Folksonomy[J].Journal of the American Society for Information Science and Technology, 2011 (3): 478-492.
[31]Ungrangsi R, Anutariya C, Wuwongse V.Enhancing Folksonomy:Based Content Retrieval with Semantic Web Technology[J].International Journal on Semantic Web and Information Systems,2010(1):19-38.
[32]Yi K.A Semantic Similarity Approach to Predicting Library of Congress Subject Headings for Social Tags[J].Journal of the American Society for Information Science and Technology, 2010(8): 1658-1672.
[33]Yi K, Chan L M.Linking Folksonomy to Library of Congress Subject Headings: an Exploratory Study[J].Journal of Documentation, 2009(6):872-900.
[34]Steele T.The New Cooperative Cataloging[J].Library Hi-Tech, 2009(1):68-77.
[35]Li Xirong, Snoek G M, Marcel W.Learning Tag Relevance by Neighbor Voting for Social Image Retrieval[EB/OL].[2011-03-26].http:// staff.science.uva.nl/~xirong/pub/MIR08.pdf.
[36]Cui Jianwei, Liu Hongyan, He Jun, et al.TagClus: A Random Walk:Based Method for Tag Clustering[J].Knowledge and Information Systems, 2011(2):193-225.
[37]Peters I, Stock W G.''Power Tags'' in Information Retrieval[J].Library Hi-Tech, 2010(1):81-93.
[38]Clements M, De Vries A P, Reinders M J T.The Influence of Personalization on Tag Query Length in Social Media Search[J].Information Processing & Management, 2010(4):403-412.
[39]Park J H, Choi B C, Kim K.A Vector Space Approach to Tag Cloud Similarity Ranking[J].Information Processing Letters, 2010(12-13):489-496.
[40]Sinclair J, Cardew-Hall M.The Folksonomy Tag Cloud: When Is It Useful?[J].Journal of Information Science, 2008(1):15-29.
[41]Bateman S, Gutwin C, Nacenta M.Seeing Things in the Clouds:The Effect of Visual Features on Tag Cloud Selections [EB/OL].[2011-03-27].http://dl.acm.org/citation.cfm?id=1379130.
[42]靳延安, 李瑞軒, 文坤梅,等.社會標(biāo)注及其在信息檢索中的應(yīng)用研究綜述[J].中文信息學(xué)報,2010 (4):52-62.
[43]竇玉萌.基于網(wǎng)絡(luò)協(xié)作標(biāo)注的標(biāo)簽消歧方法述評[J].現(xiàn)代圖書情報技術(shù),2010(3): 27-32.
[44]易 明, 鄧衛(wèi)華.基于標(biāo)簽的個性化信息推薦研究綜述[J].情報理論與實(shí)踐,2011 (3):126 -128.
[45]Hak L K, Suk H H, Hong G K.FCA:Based Approach for Mining Contextualized Folkso-Nomy[G]// ACM Symposium on Applied Computing (SAC 2007).New York: ACM, 2007:1340-1345.