国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于相關(guān)反饋的特征融合圖像檢索優(yōu)化策略初探*

2018-02-26 07:42:39黃鶯
數(shù)字圖書館論壇 2018年2期
關(guān)鍵詞:檢索語義權(quán)重

黃鶯

(西南民族大學(xué)計算機科學(xué)與技術(shù)學(xué)院,成都 610041)

隨著計算機技術(shù)和互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,數(shù)字資源數(shù)量呈指數(shù)增長。其中,圖像資源由于包含的信息量大、特征類型多樣、語義豐富、對硬件平臺要求高,一直是數(shù)字資源組織和檢索的難點。圖像資源檢索由最初基于文本檢索、基于內(nèi)容特征檢索,發(fā)展至今備受關(guān)注的是基于語義特征檢索,推動其發(fā)展的內(nèi)在動力在于對圖像屬性特征的不同獲取方法和對用戶真實需求的獲取表達能力。學(xué)者對圖像屬性特征獲取的研究主要集中在對顏色、紋理、形狀等內(nèi)容特征的提取表達以及對內(nèi)容特征和語義特征的整合,對用戶需求特征的獲取主要集中在用戶建模,以實現(xiàn)個性化、智能化的主動服務(wù)。大數(shù)據(jù)時代用戶擁有更加便捷的圖像檢索系統(tǒng)使用途徑,擁有更多支持隨時隨地檢索圖像信息的設(shè)備和平臺,在生活上也越來越依賴檢索系統(tǒng),對檢索系統(tǒng)也提出更高要求,在“準(zhǔn)、全、新”的基礎(chǔ)上增加“迅速、便捷、易用”的要求,即要實現(xiàn)好的用戶體驗,這實際上體現(xiàn)圖像信息檢索系統(tǒng)非技術(shù)性的屬性面,所以真正適用的圖像檢索系統(tǒng)在擁有優(yōu)良的特征表達方法和匹配算法外,還應(yīng)幫助用戶實現(xiàn)信息需求的準(zhǔn)確認(rèn)知、提供舒適的用戶體驗。已有的研究表明基于相關(guān)反饋實現(xiàn)內(nèi)容特征與語義特征融合檢索的方法具有良好的查全率和查準(zhǔn)率,卻在用戶體驗方面關(guān)注不夠。所以本文擬從用戶體驗角度出發(fā),對實現(xiàn)圖像多特征融合檢索方法的原理進行梳理、歸納其局限,提出以不同一性結(jié)果排序為核心的策略,旨在提升該方法的用戶體驗,緩解其局限。

1 圖像特征獲取方法研究現(xiàn)狀

任何類型的信息檢索都包含待檢信息特征的獲取及表達、用戶需求特征的提取和表達以及兩種特征的相似度計算三個核心環(huán)節(jié)。

圖像信息特征的獲取,最初采用人工標(biāo)引的方法。該方法由于標(biāo)引的一致性、準(zhǔn)確性差、效率低下而逐漸被舍棄,取而代之的是半自動/自動標(biāo)引,即借助計算機的強大處理能力實現(xiàn)對圖像的分割和顯著特征區(qū)域識別,自動獲取圖像顏色、紋理、輪廓等內(nèi)容特征。隨著圖像檢索“語義鴻溝”問題的提出,研究者關(guān)注的重點轉(zhuǎn)移到圖像語義特征的獲取,并提出多種由內(nèi)容特征向語義特征映射的算法[1-3],基于本體技術(shù)與語義網(wǎng)絡(luò)的方法、圖像標(biāo)注的語義特征[4-5]獲取方法。

與圖像特征的獲取和表達方法對應(yīng),檢索匹配時的特征相似度計算可歸為三類。一是采用傳統(tǒng)文獻檢索的原理來處理圖像。先提取圖像文本描述信息,然后與用戶需求進行基于文本相似度的匹配運算。二是融合圖像不同種類內(nèi)容特征的相關(guān)度計算方法。采用這種方法的系統(tǒng)是Content-Based Image Retrieval(CBIR),如何對圖像的多種內(nèi)容特征進行融合以取得更好的檢索效果是此類方法的研究焦點[6-8]。三是相關(guān)度計算方法。該方法以語義特征為主,輔以內(nèi)容特征[9-11],主要研究如何融合語義和內(nèi)容兩類特征,緩解圖像檢索的根源性問題“語義鴻溝”。

2 基于相關(guān)反饋實現(xiàn)多特征融合檢索方法

圖像檢索除特征獲取外,用戶需求表達是難點。早在1962年,學(xué)者就意識到用戶需求表達的復(fù)雜性。Taylor[12]提出用戶在構(gòu)造檢索式時要經(jīng)歷內(nèi)隱需求、意識需求、表達需求、妥協(xié)需求四個階段。而用戶對圖像的內(nèi)隱需求與表達需求之間存在比文獻信息檢索更大的差異,即使是同一用戶對一幅圖像的語義認(rèn)識在不同環(huán)境下也可能不同,不同用戶更是如此。相關(guān)反饋是得到普遍認(rèn)同的,能緩解上述差異的最佳方法。這種交互式的機器學(xué)習(xí)技術(shù)將用戶對檢索結(jié)果的主觀判斷作為表達圖像特征和獲取用戶真實需求特征的重要渠道。

圖1 基于相關(guān)反饋實現(xiàn)多特征融合檢索的原理圖

事實上,相關(guān)反饋技術(shù)的反復(fù)性、收斂性特點,有助于對用戶需求特征的準(zhǔn)確表達,其交互性特點還可調(diào)動用戶參與圖像的特征標(biāo)注。近年來,學(xué)者對基于語義網(wǎng)絡(luò)、支持向量機、聚類分析等多種方法構(gòu)建的相關(guān)反饋檢索模型進行了深入細(xì)致的研究。Lu等[10]對采用相關(guān)反饋的主要圖像檢索模型進行對比,結(jié)論是結(jié)合語義特征和內(nèi)容特征的相關(guān)反饋檢索模型能在較大規(guī)模圖像數(shù)據(jù)庫中通過8次反饋達到95%的查全率和查準(zhǔn)率,是模型中查全率、查準(zhǔn)率最高的,也是本文研究的對象。

2.1 基于相關(guān)反饋的多特征融合檢索原理

由朱興全[9]、Lu[10]等開發(fā)的基于Web平臺的ifind圖像檢索引擎,是最早通過相關(guān)反饋實現(xiàn)語義特征的自動標(biāo)注、多特征融合檢索系統(tǒng)。該系統(tǒng)利用用戶對檢索結(jié)果的相關(guān)性判斷來構(gòu)建與圖像數(shù)據(jù)庫映射的語義網(wǎng)絡(luò),語義網(wǎng)絡(luò)存放有語義特征詞和特征詞與圖像數(shù)據(jù)庫中特定圖像間關(guān)聯(lián)度的權(quán)重,基于此實現(xiàn)對圖像的語義標(biāo)注。本文提出基于相關(guān)反饋對用戶查詢的內(nèi)容特征和語義特征間的相互擴展方法,通過改進Rocchio公式,實現(xiàn)相似度計算中對圖像內(nèi)容特征與語義特征的線性融合,利用正負(fù)反饋判斷修正查詢點,使檢索輸出不斷靠近最佳結(jié)果。

本文根據(jù)相關(guān)反饋原理以及ifind系統(tǒng)運作流程,繪制基于相關(guān)反饋實現(xiàn)圖像多特征融合檢索的原理圖(見圖1)。圖中的三條粗線箭頭分別對應(yīng)相關(guān)性判斷與反饋被應(yīng)用到信息檢索的三個環(huán)節(jié):圖像多層特征的獲取、查詢特征的獲取、特征融合的相似度計算與排序。

語義網(wǎng)絡(luò)結(jié)構(gòu)[9]如圖2所示,權(quán)值wij為給定關(guān)鍵詞i表達圖像j的語義特征準(zhǔn)確程度。圖1的檢索模型通過用戶的相關(guān)性判斷來不斷完善語義網(wǎng)絡(luò),實現(xiàn)對圖像語義特征的自動標(biāo)注。隨著系統(tǒng)不斷收集用戶反饋信息,wij逐漸被修正。經(jīng)過若干用戶的相關(guān)性判斷后就可得到符合大多數(shù)用戶認(rèn)知的圖像特征語義網(wǎng)絡(luò)。

圖2 表達圖像語義特征的語義網(wǎng)絡(luò)結(jié)構(gòu)

2.2 基于相關(guān)反饋的多特征融合檢索方法進展

ifind系統(tǒng)的實驗數(shù)據(jù)充分展示了基于相關(guān)反饋的多特征融合檢索方法的顯著優(yōu)勢。圖像語義特征標(biāo)注工作成本低、準(zhǔn)確度高,查詢效率顯著提高。ifind推出后,不斷有研究者對該方法加以完善。如侯銘[11]提出一種語義網(wǎng)絡(luò)權(quán)值在(-1,1)的非線性指數(shù)更新算法,該算法能有效屏蔽不相關(guān)的圖像,并能在(-1,1)范圍內(nèi)將關(guān)鍵詞和圖像的相關(guān)程度進行等級劃分,以提高檢索準(zhǔn)確性;Chan等[13]將語義網(wǎng)絡(luò)的構(gòu)建分成離線和在線兩個環(huán)節(jié),離線部分對訓(xùn)練樣本進行人工語義標(biāo)注,自動提取視覺特征,在線部分會動態(tài)更新語義網(wǎng)絡(luò),進一步提高語義網(wǎng)絡(luò)的準(zhǔn)確性;何儒漢[14]將語義網(wǎng)絡(luò)結(jié)構(gòu)由兩層擴展為三層,使關(guān)鍵詞通過特定圖像與特定圖像類別相關(guān)聯(lián),圖像類別可通過內(nèi)容特征矩陣來定義,從而實現(xiàn)語義和內(nèi)容特征的無縫融合;王南等[15]針對該方法的“過反饋”問題將語義網(wǎng)絡(luò)轉(zhuǎn)變?yōu)檎Z義矩陣,提出基于“投票理論”的反饋噪聲抑制算法。

3 基于相關(guān)反饋實現(xiàn)特征融合檢索方法的不足

在上述方法的推動下,基于相關(guān)反饋多類型特征融合的圖像檢索方法得到進一步發(fā)展。但這種方法在原理和算法細(xì)節(jié)上仍存在局限,制約其廣泛應(yīng)用,為此,本文歸納這些局限的具體表現(xiàn),并試圖從用戶的角度追溯局限的解決途徑。

3.1 忽略用戶查詢關(guān)鍵詞的權(quán)重

圖像語義特征關(guān)鍵詞與查詢式Q中關(guān)鍵詞的語義相關(guān)性算法較多,如基于兩類關(guān)鍵詞間共生關(guān)系的算法[5,16]、基于WordNet的算法[17]等,最常見是根據(jù)關(guān)鍵詞的權(quán)重進行計算。歸納這些算法發(fā)現(xiàn),用戶輸入的查詢關(guān)鍵詞權(quán)重常被忽略。

以已有研究提出的算法為例,任意圖像j表示為向量(W1j,W2j,W3j,…,Wij),Wij為圖像j在在語義網(wǎng)絡(luò)中的關(guān)鍵詞權(quán)重;用戶查詢Qk表示為向量(QW1k,QW2k,QW3k,…,QWik),QWik為第i個關(guān)鍵詞在查詢式Qk中的權(quán)重。圖像j與查詢Qk之間的語義相關(guān)度由三項值來決定一是j的關(guān)鍵詞個數(shù),二是Q和j的共現(xiàn)詞個數(shù),三是這些共現(xiàn)詞在語義網(wǎng)絡(luò)中的權(quán)重之和與j所有關(guān)鍵詞在語義網(wǎng)絡(luò)中的權(quán)重之和∑1iwij的百分比[9-10]。

這類算法不合理之處在于,在進行語義相關(guān)度計算時考慮的僅是關(guān)鍵詞在語義網(wǎng)絡(luò)中的權(quán)重,而沒有考慮該詞在某個特定查詢Qk中的權(quán)重QWik。在其他條件一致的情況下,含有一個在用戶查詢Qk中權(quán)重QWik低但在語義網(wǎng)絡(luò)有較高W值的關(guān)鍵詞的圖像j就會排在含有一個在用戶查詢Qk中權(quán)重QWik高但在語義網(wǎng)絡(luò)中有較低W值的關(guān)鍵詞的圖像l之后。

因此,這種算法忽略了同一關(guān)鍵詞在不同用戶查詢中的權(quán)重以及同一查詢式中不同關(guān)鍵詞的權(quán)重。

3.2 “過反饋”問題

在語義網(wǎng)絡(luò)構(gòu)建中,由于每個用戶對圖像和關(guān)鍵詞的相關(guān)性判斷不一樣,尤其是相差甚遠(yuǎn)的判斷會產(chǎn)生偏離大眾思維的反饋信息,這樣的反饋信息在用戶群體不夠龐大時,會對語義網(wǎng)絡(luò)的質(zhì)量、后續(xù)相似度計算有顯著影響,即存在“過反饋”問題。

以圖1所示方法為例,每次檢索需創(chuàng)建兩個列表L+和L-,分別存放圖像正負(fù)反饋的所有關(guān)鍵詞,這些關(guān)鍵詞在各列表中的權(quán)值(不是語義網(wǎng)絡(luò)中的權(quán)值)隨用戶進行的相關(guān)性判斷變化而不斷變化。L+中有兩類詞,一類是出現(xiàn)在用戶初始查詢式Q中的詞,另一類是利用相關(guān)性判斷擴展而來的詞。若不將這兩類詞在列表L+中的權(quán)值更新方法區(qū)別對待,很容易因過度擴展而導(dǎo)致“過反饋”問題,影響用戶滿意度。換而言之,每次正反饋后,L+中用戶初始查詢式Q中有的詞在L+中的權(quán)值變化,應(yīng)該比相關(guān)性判斷擴展而來的詞的權(quán)值變化更大,才能避免由于對用戶查詢的過度擴展而提供許多無關(guān)圖像給用戶的問題。

3.3 偏重舊圖像

相關(guān)反饋方法將圖像的語義標(biāo)注工作分散到大多數(shù)用戶,極大地降低圖像語義標(biāo)注成本,這與PageRank技術(shù)中基于“投票理論”借助網(wǎng)絡(luò)的強大民主性來計算網(wǎng)頁重要程度的方法有相同之處,即具有偏重舊信息的缺點[18]。由于存在Web環(huán)境下的“懶惰用戶”問題,對結(jié)果集中每個圖像均進行判斷會加重用戶負(fù)擔(dān),降低用戶對系統(tǒng)的滿意度,所以對用戶只展現(xiàn)前N個(10~20個)檢索結(jié)果[14]。這樣,與具有相同語義的舊圖像相比,新添加的圖像由于在語義網(wǎng)絡(luò)初始Wij值低而被排在N列外,無法根據(jù)用戶的正反饋來更快地提高Wij值,而下一輪反饋中這樣的新圖像依舊會排列在具有相同語義的舊圖像之后,造成偏重舊圖像的局限。

3.4 訓(xùn)練樣本的非對稱性

正反饋圖像集能很大程度地反映用戶的需求特征,負(fù)反饋的圖像特征很難代表數(shù)據(jù)庫中所有圖像。用戶相關(guān)性判斷的對象是上一輪檢索的結(jié)果集,而非全體圖像,體現(xiàn)訓(xùn)練樣本的非對稱性,導(dǎo)致被查詢次數(shù)越多的圖像,其語義網(wǎng)絡(luò)中的權(quán)值Wij就越能準(zhǔn)確地反映關(guān)鍵詞與圖像語義的關(guān)聯(lián)程度,反之就更不準(zhǔn)確。盡管可通過設(shè)置參數(shù)、構(gòu)造算法等方式來控制負(fù)反饋圖像集對后續(xù)檢索的影響,但目前已有研究并未對此局限提出有效且廣泛認(rèn)可的方法。

4 基于相關(guān)反饋的多特征融合檢索方法優(yōu)化策略

圖1所示的方法通過幾輪反饋,可迅速提高查全率和檢準(zhǔn)率。但面對數(shù)字環(huán)境中的海量圖像信息,查全率和查準(zhǔn)率對傳統(tǒng)評價指標(biāo)的參考意義顯著降低,眾多檢索系統(tǒng)將改善系統(tǒng)效率的關(guān)鍵點聚焦到結(jié)果排序的優(yōu)化上,再輔以用戶的個性化、參與互動來提升用戶體驗。

從前文對基于相關(guān)反饋的多類型特征融合檢索方法不足的分析可以看出,這些不足的根源在于對用戶體驗的重視程度不夠。成功的用戶體驗必須做到在不騷擾、不使用戶厭煩的情況下滿足用戶的信息需求[19]。多輪反饋的相關(guān)性判斷增加用戶負(fù)擔(dān),存在騷擾用戶的潛在風(fēng)險;前輪檢索結(jié)果中出現(xiàn)的圖像再次出現(xiàn)在后續(xù)檢索結(jié)果中,甚至出現(xiàn)在更靠前的位置,并不能使用戶更快獲取滿足需求的圖像,導(dǎo)致用戶厭煩;排序輸出的方式?jīng)]有考慮圖像質(zhì)量、時效性等網(wǎng)絡(luò)用戶較看重的結(jié)果排序特征。因此,本文以用戶體驗為出發(fā)點,以緩解前文所述的不足為目標(biāo),提出如下策略。

4.1 基于圖像不同一性的結(jié)果集排序策略

數(shù)字環(huán)境下,用戶更注重檢索結(jié)果中TOP-N的準(zhǔn)確率,即提高用戶滿意度的難點在于找到并將最相關(guān)的結(jié)果放在最前面提供給用戶[14]。在多輪反饋中,這意味著每次結(jié)果集中排在前面的結(jié)果是既與查詢式Q相關(guān)又與前n輪正反饋集差異性大的圖像。這樣才能使用戶每輪反饋都能更快地獲取不同的相關(guān)結(jié)果,對更多的結(jié)果進行判斷,使得新加入的圖像能更快地在語義網(wǎng)絡(luò)中獲得準(zhǔn)確表達其語義的權(quán)重Wij。

4.1.1 基于圖像不同一性的結(jié)果排序原理

信息資源的不同一性特征指既定信息資源必定是不同內(nèi)容信息的集合,集合中的任意信息都具有區(qū)別于集合內(nèi)其他信息的獨特性質(zhì)[20]。用戶每輪檢索都希望獲得更多與前n輪結(jié)果集差異性大且與需求相關(guān)的結(jié)果,此需求特征根源在于信息資源的不同一性。根據(jù)不同一性需求特點,本文將圖1的相關(guān)性判斷與反饋模塊進行改進,增加兩個組件(一是基于不同一性的結(jié)果重排序,二是用戶行為圖像集合),二者與相關(guān)性判斷組件一起,構(gòu)成優(yōu)化策略的關(guān)鍵(見圖3)。

用戶行為圖像集合存放用戶行為信息圖像,用戶行為包括相關(guān)性判斷、下載、收藏及停留時間等。用Sn表示第n次用戶相關(guān)性判斷行為后的圖像集合。結(jié)果重排序組件對第n次檢索結(jié)果集Rn根據(jù)與{S1,S2,…,Sn-1}中圖像的不同一性進行重新排序,將每輪檢索結(jié)果中既與用戶需求密切相關(guān)又與前輪結(jié)果集不同的圖像放在TOP-N供用戶判斷。該組件的核心是對不同一性的量化計算。

4.1.2 不同一性的量化計算

圖3 基于不同一性排序的相關(guān)性判斷與反饋模塊示意

根據(jù)不同一性的涵義,兩張圖像的不同一性(用Non表示),可以用二者的相似度來衡量,即相似度大的圖像間不同一性低。已有研究成果中有大量用來計算圖像間相似度的方法,其中基于文本和內(nèi)容的相似度計算方法研究已較成熟?;谖谋镜膱D像相似度(用St表示)可借鑒文獻信息檢索的向量空間模型計算方法,任意圖像j表示為向量(W1j,W2j,W3j,…,Wij),Wij為圖像j在在語義網(wǎng)絡(luò)中的關(guān)鍵詞權(quán)重,經(jīng)過歸一化處理,便可計算出Rn中每個圖像與{S1,S2,…,Sn-1}中每個圖像文本相似度平均值St。基于內(nèi)容的相似度(用Sc表示)計算可采用歐式距離、直方圖等多種方法。

Rn中任意圖像i的Nonni可用公式計算得到。其中,Nonni為Rn中第i個圖像的不同一性值,Sti為圖像i與{S1,S2,…,Sn-1}中每個圖像文本相似度的平均值,Sci為圖像i與{S1,S2,…,Sn-1}中每個圖像內(nèi)容相似度的平均值,引入?yún)?shù)α、β來區(qū)別兩種相似度的不同作用;將Rn中的圖像按照Non值從高到低排序輸出TOP-N個結(jié)果供用戶進行相關(guān)性判斷,得到Sn和部分滿意的檢索結(jié)果;用Sn優(yōu)化用戶查詢特征和數(shù)據(jù)庫中的圖像特征,進入下一輪檢索Rn+1,直到用戶獲得全部滿意結(jié)果。

4.1.3 基于不同一性對檢索結(jié)果排序的優(yōu)勢

按相關(guān)反饋用戶參與與否來分,基于不同一性對每輪檢索結(jié)果進行重排序是一種偽相關(guān)反饋,這類反饋方法更能降低用戶負(fù)擔(dān)[21]。這種不需要用戶真正參與判斷的自動反饋技術(shù)主要通過記錄用戶在檢索過程中的各種行為信息來反饋修正檢索結(jié)果。一種便捷的方法就是在圖3的相關(guān)性判斷模塊內(nèi)羅列出用戶常見的具體行為,包括“用戶下載時間”“停留時間”“收藏”等,這些行為原本就記錄在檢索服務(wù)器日志,并不增加系統(tǒng)的額外開銷。這些行為原本記錄在檢索服務(wù)器日志中,并不增加系統(tǒng)的額外開銷。只需對用戶的不同行為賦予不同權(quán)值來反映其對擴展檢索及語義網(wǎng)絡(luò)構(gòu)建的影響,即可實現(xiàn)無須用戶參與的自動相關(guān)反饋和語義特征標(biāo)注。

因此,基于不同一性對每輪檢索輸出結(jié)果進行重新排序,可降低用戶負(fù)擔(dān),節(jié)省用戶時間,更快獲得更多不同的相關(guān)結(jié)果。這樣的排序必然會讓更多差異性大的圖像進入用戶視野,讓用戶進行相關(guān)性反饋。一方面,在這些差異性大的圖像中會包含更多新圖像,從而讓這些新圖像更快地獲得準(zhǔn)確表達其語義的權(quán)值Wij,語義網(wǎng)絡(luò)質(zhì)量和構(gòu)建速度也得到提高,偏重舊圖像的問題被適當(dāng)抑制;另一方面,這些用戶對更多不同的圖像進行相關(guān)性判斷,在一定程度上緩解了樣本的非對稱性問題和“過反饋”問題。

4.2 區(qū)別對待查詢式關(guān)鍵詞和擴展關(guān)鍵詞的權(quán)重更新

基于Rocchio公式的相似度計算公式通常包括特定圖像j與查詢式Q的相關(guān)度、正反饋集與用戶查詢的相關(guān)度、負(fù)反饋集與用戶查詢間的相關(guān)度。正負(fù)反饋集合的作用通過參數(shù)來控制,所以本文僅以正反饋集為例。正反饋集中既有Q中的詞,也有經(jīng)過相關(guān)性判斷擴展而來的詞,擴展詞在何種程度才能準(zhǔn)確反映用戶的需求尚不明確,因此需要將兩類詞的權(quán)重更新方法進行區(qū)別。如每經(jīng)過一次正反饋,擴展查詢詞權(quán)重的增加為查詢式中查詢詞權(quán)重增加的1/4,謹(jǐn)慎處理這些擴展詞,降低“過反饋”帶來的噪聲問題。

4.3 相似度計算中融入用戶查詢詞權(quán)重

對用戶需求的準(zhǔn)確把握是提高檢索效率的重要策略,用戶建模、加權(quán)檢索、個性化檢索等都是具體的途徑。然而,已有的圖像檢索常忽略用戶提供的不同特征詞在描述需求時的不同權(quán)重。這與圖像檢索對軟硬件要求高有關(guān),增加用戶需求權(quán)重將加重固有局限的考慮。但隨著軟硬件技術(shù)的飛速發(fā)展,圖像檢索的這一局限將不再困擾其發(fā)展。因此,在相似度計算中考慮用戶提供的不同特征詞對查詢的權(quán)重,以提高查詢對需求表達的一致性;如果將這一權(quán)重再采用合適的方法融入查詢擴展,還能起到抑制“過反饋”的作用。

上述這些策略,尤其是基于不同一性的排序策略,使得基于相關(guān)反饋的多類型特征融合檢索方法在前文所述的信息檢索的三個階段都充分利用了用戶需求特征,很大程度緩解了方法本身的局限?;趥€體用戶而非所有用戶的需求考慮,充分有效地利用用戶自身的歷史瀏覽信息,更好地自動挖掘和分析用戶的興趣和需求特征,實現(xiàn)個性化檢索和語義檢索。

5 結(jié)語

本文基于相關(guān)反饋構(gòu)建語義網(wǎng)絡(luò),自動標(biāo)注圖像語義,實現(xiàn)對多特征融合的圖像檢索方法原理及后續(xù)發(fā)展進行梳理,指出該方法存在的局限,包括檢索算法未考慮用戶查詢詞的不同權(quán)重、語義網(wǎng)絡(luò)對新加圖像的不合理處理、“過反饋”以及訓(xùn)練樣本的非對稱性。其中,“過反饋”和訓(xùn)練樣本的非對稱性問題是該方法的局限所在,只能通過優(yōu)化方法加以改善。因此,考慮到當(dāng)前網(wǎng)絡(luò)用戶需求的巨大變化,本文以良好的用戶體驗為切入點,初步探索一套優(yōu)化策略,重點介紹基于信息資源不同一性重新排序、輸出結(jié)果的方法,這種重新排序檢索結(jié)果的方法基于單個用戶,而非全體用戶的需求特征來呈現(xiàn)檢索結(jié)果,最大程度地利用用戶相關(guān)反饋提供的個性化需求信息,不僅能改善用戶體驗,減輕用戶負(fù)擔(dān),還能提高標(biāo)注圖像特征的語義網(wǎng)絡(luò)的構(gòu)建效率和準(zhǔn)確度,緩解多特征融合檢索在處理新加入新圖像、用戶查詢權(quán)重和樣本的非對稱性等多方面的不足。

上述策略的出發(fā)點是用戶體驗,而非傳統(tǒng)的查全率和查準(zhǔn)率,根本原因在于海量數(shù)字環(huán)境下,檢索結(jié)果呈現(xiàn)方式的重要性取代傳統(tǒng)的查全率和查準(zhǔn)率,成為影響用戶選擇和使用檢索系統(tǒng)更重要的因素。本文提出的基于相關(guān)反饋實現(xiàn)多特征融合檢索方法的優(yōu)化策略尚處于初步探索階段,還需要通過一系列后續(xù)研究來進一步驗證其效用價值,包括選取合適的樣本圖像集、如Corel標(biāo)準(zhǔn)庫中的幾類圖像,編寫源程序?qū)崿F(xiàn)基于相關(guān)反饋的多特征融合檢索系統(tǒng),并選擇合適的用戶群體對該方法在采用優(yōu)化策略前后進行使用評價,通過對評價數(shù)據(jù)的分析歸納來驗證優(yōu)化策略在提高用戶滿意度方面的效用。

[1] 曹建芳,陳俊杰,趙青杉. 基于多語義特征融合的圖像檢索[J].計算機技術(shù)與發(fā)展,2014(5):134-137,141.

[2] 沈玉利,任建峰,郭雷. 一種由低層視覺特征獲取高層語義的圖像檢索方法[J]. 計算機工程,2005(1):172-173,178.

[3] 毛彥妮,何超,周磊. 基于組合特征和SVM相關(guān)反饋的圖像語義檢索模型研究[J]. 情報科學(xué),2013(4):129-133.

[4] 張志武. 基于本體的Web圖像語義標(biāo)注與檢索模型[J]. 情報科學(xué),2015(4):121-131.

[5] 何寧. 圖像檢索中跨模語義信息獲取方法研究[D]. 武漢:武漢大學(xué),2013.

[6] 張貝貝. 基于內(nèi)容的圖像檢索若干關(guān)鍵問題研究[D]. 大連:遼寧師范大學(xué),2013.

[7] 朱凌云,朱征宇,齊新勇. 融合多種內(nèi)容特征的圖像檢索算法[J].計算機與現(xiàn)代化,2015(9):17-21.

[8] 張永庫,李云峰,孫勁光. 基于多特征融合的圖像檢索[J]. 計算機應(yīng)用,2015,35(2):495-498.

[9] 朱興全,張宏江,劉文印,等. iFind:一個結(jié)合語義和視覺特征的圖像相關(guān)反饋檢索系統(tǒng)[J]. 計算機學(xué)報,2002,25(7):681-688.

[10] LU Y,ZHANG H J,LIU W,et al. Jointsemantics features based image retrieval using relevance feedback[J]. IEEE Transactions on Multimedia,2003,5(3):339-347.

[11] 侯銘. 基于語義和視覺特征相結(jié)合的相關(guān)反饋圖像檢索技術(shù)研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2006.

[12] TAYLOR R S. The process of asking questions[J]. American Documen-tation,1962(4):391-396.

[13] CHAN P P K,HUANG Z C,NG W WY,et al. Dynamichierarchical semantic network based image retrieval using relevance feedback[C]// International Conference on Machine Learning and Cybernitics.Guilin:[s.n.],2011(4):1746-1751.

[14] 何儒漢. Web圖像的多模融合檢索研究[D]. 武漢:華中科技大學(xué),2007.

[15] 王南,趙捧未,竇永香,等. 圖像語義檢索中的反饋噪聲及其抑制算法研究[J]. 現(xiàn)代圖書情報技術(shù),2007(10):42-46.

[16] 朱松豪,鄒黎明,梁志偉,等. 一種融合視覺特征和語義標(biāo)注的圖像檢索方法[C]// 第三十一屆中國控制會議論文集C卷合肥. 2012:3964-3968.

[17] 車?yán)蚱? 融合文本和語義的Web圖像檢索[D]. 西安:西北大學(xué),2014.

[18] 李稚楹,楊武,謝治軍. PageRank算法研究綜述[J]. 計算機科學(xué),2011(10):185-188.

[19] 丁一,郭伏,胡名彩,等. 用戶體驗國內(nèi)外研究綜述[J]. 工業(yè)工程與管理,2014(4):92.

[20] 馬費成. 信息資源管理[M]. 武漢:武漢大學(xué)出版社,2001:19-20.

[21] 黃鶯. 基于信息資源不同一性的檢索結(jié)果優(yōu)化排序方法[J]. 情報科學(xué),2014(9):77-80,117.

猜你喜歡
檢索語義權(quán)重
權(quán)重常思“浮名輕”
語言與語義
2019年第4-6期便捷檢索目錄
為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
基于公約式權(quán)重的截短線性分組碼盲識別方法
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
認(rèn)知范疇模糊與語義模糊
層次分析法權(quán)重的計算:基于Lingo的數(shù)學(xué)模型
河南科技(2014年15期)2014-02-27 14:12:51
語義分析與漢俄副名組合
柳林县| 达日县| 海盐县| 孝昌县| 廊坊市| 福贡县| 德化县| 姚安县| 南京市| 策勒县| 屯留县| 新乡县| 合山市| 盈江县| 禄丰县| 眉山市| 肇庆市| 贡嘎县| 营山县| 长岛县| 郧西县| 桐乡市| 且末县| 河源市| 定兴县| 大理市| 灵石县| 临武县| 东安县| 洛扎县| 灌云县| 丹寨县| 白城市| 荆门市| 化隆| 淄博市| 乌鲁木齐市| 沂水县| 高淳县| 虎林市| 昌黎县|