宋衛(wèi)華 (黃山學(xué)院機(jī)電與信息工程學(xué)院,安徽 黃山 245021)
基于特征融合和相關(guān)反饋技術(shù)的圖像檢索研究
宋衛(wèi)華 (黃山學(xué)院機(jī)電與信息工程學(xué)院,安徽 黃山 245021)
為提高圖像檢索精度,在研究單一特征檢索算法基礎(chǔ)上,提出了基于底層-底層和底層-高層2種級(jí)別的特征融合檢索方法,利用相關(guān)反饋技術(shù)逐步求精以提高檢索性能,并用VC#和SQL server2005實(shí)現(xiàn)了一個(gè)圖像檢索原型系統(tǒng)。研究表明,利用該研究方法能夠提高圖像檢索精度,因而具有可行性。
圖像檢索;特征融合;相關(guān)反饋
基于內(nèi)容的圖像檢索在對(duì)圖像進(jìn)行描述時(shí),一般首先提取圖像自身的顏色、紋理、形狀、空間關(guān)系等特征,再進(jìn)行基于向量空間模型的匹配[1]。但僅僅利用單一特征是不夠的,因而如何有效集成圖像的多種特征是目前的研究熱點(diǎn)[2]。為此,筆者了基于特征融合算法和相關(guān)反饋技術(shù)對(duì)圖像檢索進(jìn)行了研究。
1.1基于模糊C均值聚類的顏色相關(guān)圖特征提取
在模糊C均值聚類基礎(chǔ)上提取顏色相關(guān)圖特征,通過(guò)對(duì)目標(biāo)函數(shù)的迭代優(yōu)化以實(shí)現(xiàn)集合的模糊劃分[3],將n個(gè)數(shù)據(jù)點(diǎn)分為c個(gè)模糊組,對(duì)每個(gè)數(shù)據(jù)點(diǎn)用值在[0,1]來(lái)確定其屬于各個(gè)組的程度,并求每組的聚類中心,最終使得非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。隸屬矩陣U如下:
(1)
模糊C均值聚類時(shí)的價(jià)值函數(shù)J如下:
(2)
式中,uij∈[0,1];ci為模糊組i的聚類中心;dij為第i個(gè)聚類中心與第j個(gè)數(shù)據(jù)點(diǎn)的歐式距離;m∈[1,∞]是一個(gè)加權(quán)指數(shù)。
構(gòu)造以下新的目標(biāo)函數(shù),使得式(2)達(dá)到最小值的必要條件為:
(3)
式中,λj(j=1,…,n)是約束式的拉格朗日乘子。
對(duì)所有輸入?yún)⒘壳髮?dǎo),使式(3)達(dá)到最小值的必要條件為:
(4)
進(jìn)行FCM聚類的具體步驟如下[4]:①設(shè)定N個(gè)聚類中心的初始值;②求每個(gè)像素值與所有聚類中心的Dhsv距離,并確定隸屬函數(shù)矩陣,在此基礎(chǔ)上,計(jì)算總的價(jià)值函數(shù)和確定聚類中心。③根據(jù)確定的聚類中心計(jì)算總價(jià)值函數(shù)并與②中的總價(jià)值函數(shù)相比,若趨于穩(wěn)定(價(jià)值函數(shù)值相對(duì)比較小)則停止迭代,否則返回②繼續(xù)進(jìn)行。
1.2紋理特征的分析與提取
小波變換提供了一種將能量有限信號(hào)分解成一系列對(duì)數(shù)帶寬相同的頻道的方法,通過(guò)將圖像信息分解到尺度與空間域的聯(lián)合分布之中,形成對(duì)圖像信號(hào)的聯(lián)合表征。紋理分析常采用2種結(jié)構(gòu)的小波變換:金字塔結(jié)構(gòu)的小波變換和樹結(jié)構(gòu)小波變換。就性能來(lái)說(shuō),不同的小波變換在對(duì)紋理分析方面沒(méi)有很顯著的差別。筆者采用了金字塔結(jié)構(gòu)的哈爾小波變換[5],通過(guò)對(duì)基函數(shù)分解來(lái)表示圖像信號(hào),其中基函數(shù)ψmn(x)由母函數(shù)ψ(x)伸縮和平移得到:
(5)
ψmn(x)=2-m/2ψ(2-m/2x-n)
(6)
式中,m表示伸縮因子;n表示平移因子。
則圖像經(jīng)過(guò)小波變換后的變換系數(shù)f(x)可表示為:
(7)
式中,cmn為圖像相鄰像素的均值和方差組成的系數(shù)。
整個(gè)小波變換化的過(guò)程需要遞歸的過(guò)濾和采樣,為此將圖像進(jìn)行3層分解,得到圖像信息的簡(jiǎn)單分層理論框架。在每個(gè)層次上,信號(hào)被分解為4個(gè)波段,用每個(gè)分解層次上的每個(gè)波段的能量分布均值(ENG)和方差(DEV)來(lái)表示圖像的紋理特征:
(8)
(9)
式中,M×N是小波子帶大小;μ(x)是小波系數(shù)均值。
1.3圖像檢索過(guò)程
首先對(duì)多個(gè)特征設(shè)置不同的權(quán)重,然后將其進(jìn)行線性組合來(lái)實(shí)現(xiàn)特征融合算法。由于不同特征間相似度不具可比性,為此進(jìn)行特征間歸一化[6]:
(1)計(jì)算查詢圖像q與庫(kù)中每幅圖像的基于單一顏色相關(guān)圖特征的相似距離d(1,q),d(2,q),…,d(n,q),(n為庫(kù)圖像總數(shù)),并計(jì)算其均值md和方差σd。
(2)對(duì)d(1,q),d(2,q),…,d(n,q)按下式進(jìn)行高斯歸一化,使相似度的值落在區(qū)間[0,1]上:
(10)
(3)重復(fù)步驟(1)、(2),可得到歸一化后的基于單一紋理的相似距離。
(4)為單一特征分配權(quán)重wi,進(jìn)行特征融合,則基于特征融合的相似距離Dfus可表示為:
(11)
相關(guān)反饋技術(shù)主要是通過(guò)修正系統(tǒng)的檢索策略,進(jìn)行多次檢索,得到與用戶實(shí)際需求盡可能相符合的檢索結(jié)果[1]。對(duì)于采用向量空間模型的系統(tǒng),相關(guān)反饋技術(shù)一般采取如下2種策略,即移動(dòng)查詢向量和調(diào)整距離測(cè)度策略。其中移動(dòng)查詢向量的過(guò)程如下:按照最初的查詢條件(向量),查詢系統(tǒng)返回查詢結(jié)果,然后人為介入(或自動(dòng))來(lái)選擇幾個(gè)最符合查詢意圖的返回結(jié)果(正反饋集合),也可以選擇最不符合查詢意圖的幾個(gè)返回結(jié)果(負(fù)反饋集合)。上述反饋信息被送入系統(tǒng)用來(lái)更新查詢條件,以便重新進(jìn)行查詢,從而讓隨后的搜索更符合查詢者的真實(shí)意圖。筆者采用Rocchio算法[7]來(lái)移動(dòng)查詢點(diǎn),該過(guò)程是一個(gè)迭代過(guò)程:
(12)
式中,Qi+1和Qi分別對(duì)應(yīng)第i+1次和第i次的查詢向量;DR′和DN′分別為正反饋集合和負(fù)反饋集合;NR′和NN′分別為正反饋集合和負(fù)反饋集合的數(shù)目,α、β、γ分別為加權(quán)常數(shù)。因此,通過(guò)移動(dòng)小波變換后各波段能量分布的特征向量的查詢點(diǎn)和調(diào)整顏色相關(guān)圖特征與紋理特征的權(quán)重,可實(shí)現(xiàn)檢索時(shí)的相關(guān)反饋。
針對(duì)采集的內(nèi)窺鏡圖像1361幅(其中169幅為有癌圖像,其余為無(wú)癌圖像),基于上述分析,運(yùn)用VC#和SQL Server2005實(shí)現(xiàn)一個(gè)圖像檢索原型系統(tǒng),在此基礎(chǔ)上設(shè)計(jì)如下試驗(yàn):①基于模糊C均值聚類的顏色相關(guān)圖特征檢索;②基于小波變換的紋理特征的檢索;③在試驗(yàn)①的基礎(chǔ)上融入基于小波變換的紋理特征,進(jìn)行特征融合檢索;④在試驗(yàn)③的基礎(chǔ)上加入相關(guān)反饋進(jìn)行多次檢索。判斷2幅圖像相似(相關(guān))的依據(jù)是它們是否具有相同的病理特征。
對(duì)于檢索性能的評(píng)價(jià),采用了基于排序值的Rank方法[8],一般地,排序值越靠前(小),說(shuō)明圖像間相似度越高。除此之外,還應(yīng)計(jì)算查準(zhǔn)率,查準(zhǔn)率定義為檢索到的相關(guān)圖像數(shù)占檢索到的圖像數(shù)的比例,查準(zhǔn)率越高,表明該檢索算法檢索精度越高。為此,隨機(jī)選取10幅圖像并計(jì)算其檢索的平均排序值和平均查準(zhǔn)率(見表1)。
表1 基于不同檢索算法的檢索結(jié)果比較表
從表1可以看出,基于特征融合和相關(guān)反饋技術(shù)的檢索算法獲得的檢索結(jié)果,其平均排序值最低,而平均查準(zhǔn)率最高,因而利用該算法可以獲得很好的檢索精度。
在分析單一特征檢索算法的基礎(chǔ)上,提出了基于特征融合和相關(guān)反饋的圖像檢索算法。實(shí)例分析表明,該算法具有較高的查準(zhǔn)率和較小的排序值,說(shuō)明其檢索性能較好,可用應(yīng)用在精度要求較高的圖像(如內(nèi)窺鏡圖像)檢索中。
[1]錢晶瑩,高月松.圖像檢索系統(tǒng)中的CBIR技術(shù)研究[J].電腦知識(shí)與技術(shù),2011,7(2):415-417.
[2]陸麗珍,劉仁義,劉南.一種融合顏色和紋理特征的遙感圖像檢索方法[J].中國(guó)圖象圖形學(xué)報(bào),2004,9(3):328-332.
[3]Song Weihua,Tai Xiaoying.Medical image retrieval based on FCM using feature fusion[J].Journal of Computational Information System,2007,3(4):1635-1642.
[4]Brecheisen S,Kriegel H P,Pfeifle M. Multi-step density-based clustering[J].Knowledge and Information Systems April,2006,9(3):284-308.
[5]韋娜.基于內(nèi)容圖像檢索關(guān)鍵技術(shù)研究[D].西安:西北大學(xué),2006.
[6]邰曉英,北研二.信息檢索技術(shù)導(dǎo)論[M].北京:科學(xué)出版社,2006.
[7]芳野純潔, 濱田.內(nèi)鏡診斷與鑒別診斷圖譜[M].沈陽(yáng):遼寧科學(xué)技術(shù)出版社,2003.
2013-05-22
宋衛(wèi)華(1982-),女,碩士,助教,現(xiàn)主要從事圖形圖像和數(shù)據(jù)庫(kù)方面的教學(xué)和研究工作。。
TP391
A
1673-1409(2013)28-0026-03
[編輯] 李啟棟