郭曉娟,成繼福
(河南科技學(xué)院,河南新鄉(xiāng) 453003)
在基于內(nèi)容的圖像檢索中,形狀檢索是一個(gè)重要的方面.所以,形狀的提取和描述在基于內(nèi)容的圖像檢索系統(tǒng)中占有重要的地位.對(duì)于自然界的物體,形狀可能比顏色和紋理包含更多的語(yǔ)義信息,所傳遞的語(yǔ)義往往更具體、更準(zhǔn)確[1],但是,形狀的描述僅僅是在一定的程度上體現(xiàn)人們對(duì)形狀的感知,給人感覺(jué)完全不同的形狀可能有相同的特征量.
物體和區(qū)域的形狀是圖像表達(dá)和圖像檢索中的重要特征,但不同于顏色或紋理等特征,形狀特征的表達(dá)必須以對(duì)圖像中物體或區(qū)域的劃分為基礎(chǔ).由于當(dāng)前的技術(shù)無(wú)法做到準(zhǔn)確而魯棒的自動(dòng)圖像分割,圖像檢索中的形狀特征只能用于某些特殊應(yīng)用,在這些應(yīng)用中圖像包含的物體或區(qū)域可以直接獲得.另一方面,由于人們對(duì)物體形狀的變換、旋轉(zhuǎn)和縮放主觀上不太敏感,合適的形狀特征必須滿足對(duì)變換、旋轉(zhuǎn)和縮放無(wú)關(guān),對(duì)形狀相似度的計(jì)算也帶來(lái)了難度[2].
通常來(lái)說(shuō),形狀特征有兩種表示方法:一種是輪廓特征,一種是區(qū)域特征.前者只用到物體的外邊界,而后者則關(guān)系到整個(gè)形狀區(qū)域.下面將詳細(xì)分析一種典型的形狀特征提取法——Hu不變矩算法.
形狀不變矩(Moment Invariants)是基于區(qū)域的物體形狀表示方法.基于區(qū)域形狀的中心矩和歸一化中心矩原理,Hu提出了一系列具有旋轉(zhuǎn)、縮放和平移無(wú)關(guān)的七個(gè)矩特征[3].計(jì)算方法如下:
一幅數(shù)字圖像 f(x, y)的二維(p+q)階矩定義為
通過(guò)公式(4)~(10),可以計(jì)算得到圖像的Hu不變矩.Hu不變矩具有對(duì)平移、旋轉(zhuǎn)及縮放的不變性,易于實(shí)現(xiàn).而且其適用面較廣,對(duì)輸入圖像質(zhì)量要求不是很高,一般不需要對(duì)圖像進(jìn)行預(yù)處理,可以降低整個(gè)算法的時(shí)間復(fù)雜度.除了上述幾種方法之外,近年來(lái)在形狀的表示和匹配方面的工作有很多進(jìn)展,但設(shè)計(jì)一種符合人們主觀判斷的形狀相似度量算法還是一個(gè)有待解決的難題.
距離相似性度量方法就是利用相關(guān)距離計(jì)算函數(shù),計(jì)算被檢對(duì)象和目標(biāo)對(duì)象的特征序列之間的結(jié)果,用該計(jì)算值來(lái)判別對(duì)象之間的相似性程度.一般情況下圖像都是多維特征矢量表示的,通過(guò)計(jì)算特征矢量在特征空間的距離可以得到兩個(gè)圖像的相似度[4].以下分別對(duì)目前在基于內(nèi)容圖像檢索系統(tǒng)中常用到的幾種距離度量算法[5]進(jìn)行分析.
歐幾里德距離是簡(jiǎn)單的距離公式,也是在CBIR中應(yīng)用較廣的距離公式,它可以單獨(dú)用于顏色直方圖和紋理特性的匹配.但歐幾里德公式完全不考慮向量各維之間的關(guān)系,而且各維必須是同等重要的,這就大大影響其使用范圍和有效性,故又引入加權(quán)歐幾里德距離.加權(quán)歐幾里德距離
式(14)中的wi是各分量的加權(quán)系數(shù).加權(quán)歐幾里德距離考慮不同維之間的不同重要性,由于CBIR系統(tǒng)通常抽取了大量的特征,不同特征的重要性都是不同的,因此加權(quán)歐幾里德距離在CBIR系統(tǒng)中應(yīng)用很廣,可單獨(dú)用于顏色直方圖、紋理、形狀或它們的聯(lián)合向量.
本實(shí)驗(yàn)實(shí)現(xiàn)了經(jīng)典算法Hu不變矩來(lái)提取形狀特征的檢索方法,所采用的相似性度量方法為歐氏距離,實(shí)驗(yàn)所用到的數(shù)據(jù)分別來(lái)自UIUC圖庫(kù)中的鳥類的egret(共97幅),蝴蝶類的zebra(共91幅)和Caltech101圖像庫(kù)中chair(共60幅),strawberry(共30幅)等4類圖庫(kù).所采用示例圖像分別為egret類中的egr002.jpg,chair類中的image_0001.jpg,zebra類的中zeb001.jpg,strawberry類中的image_0001.jpg.
不同測(cè)試圖例的結(jié)果如表1所示.
表1 不同圖例基于形狀的檢索結(jié)果比較
在表1中,相關(guān)圖像數(shù),是測(cè)試圖庫(kù)中與示例圖像相關(guān)的圖像數(shù);檢索結(jié)果總數(shù),是對(duì)不同測(cè)試圖庫(kù)使用共生矩陣進(jìn)行紋理檢索得到的數(shù)目,檢索的閾值默認(rèn)為0.4,檢索的最大值默認(rèn)為100,本次實(shí)驗(yàn)中閾值的設(shè)置為0.3,檢索的最大值采用默認(rèn)值.這兩個(gè)參數(shù)用戶可以自己設(shè)置,不同的參數(shù)設(shè)置可以得到不同的檢索結(jié)果數(shù).檢索結(jié)果相關(guān)圖數(shù)是檢索結(jié)果集中與示例圖像相關(guān)的圖像數(shù),檢索結(jié)果相關(guān)圖像數(shù)同時(shí)影響著查準(zhǔn)率和查全率.本實(shí)驗(yàn)中,隨著所選取的測(cè)試圖例的不同、參數(shù)不同而得到不同的檢索結(jié)果數(shù)目;查準(zhǔn)率和查全率是一組相互影響的評(píng)價(jià)標(biāo)準(zhǔn),兩者共同決定了檢索效果.
Hu不變矩具有較好的旋轉(zhuǎn)、平移和尺度不變性,適用于對(duì)具有放置平移和尺度變化、旋轉(zhuǎn)變化的圖像進(jìn)行檢索.在同樣條件下,綜合考慮到查準(zhǔn)率和查全率后,由表1可以看出,對(duì)于背景單一而對(duì)象形狀突出的圖像如strawberry類、chair類的檢索效果較好;對(duì)背景相對(duì)簡(jiǎn)單,對(duì)象的形態(tài)各異的圖像檢索如egret類和zebra類也能得到較好的檢索效果.當(dāng)然表中的數(shù)據(jù)也會(huì)隨著測(cè)試圖例與圖庫(kù)的變化而變化,但是從總體來(lái)看,四類測(cè)試圖例的平均查準(zhǔn)率與查全率分別為60.675%和68.9%,所以利用Hu不變矩進(jìn)行檢索也可得到較好的檢索效果.
本文在研究與分析了紋理特征提取算法Hu不變矩以及相似性度時(shí)算法的基礎(chǔ)上,利用UIUC和Caltech101圖像數(shù)據(jù)庫(kù),驗(yàn)證了采用Hu不變矩的形狀特征提取算法的有效性,最后對(duì)不同圖像數(shù)據(jù)庫(kù)采用同一種特征提取方法的檢索結(jié)果進(jìn)行比較.可以看出,對(duì)背景相對(duì)簡(jiǎn)單,對(duì)象的形態(tài)各異的圖像還是具有較好的檢索性能,可以得到較好的檢索效果.但由于文中所用的圖像數(shù)據(jù)庫(kù)種類比較單一且數(shù)量也不是很多,檢索的速度比較快,如果使用種類繁雜的大量網(wǎng)絡(luò)數(shù)據(jù)庫(kù)圖像進(jìn)行檢索時(shí),該實(shí)驗(yàn)系統(tǒng)的檢索速度會(huì)比較慢,這也是下一步需要解決的問(wèn)題.同時(shí)對(duì)圖像進(jìn)行單一特征檢索不能很好地描述圖像的特征,以后的研究會(huì)趨向于多特征以及相關(guān)反饋等方面的研究.
[1]呂娜,孫楊民,黃國(guó)豐.對(duì)圖像檢索應(yīng)用概況的研究[J].情報(bào)科學(xué),2002,(20):3-5.
[2]樊亞春,耿國(guó)華,周明全.用不變矩和邊界方向進(jìn)行形狀檢索[J].小型微型計(jì)算機(jī)系統(tǒng),2004,25(4):652-659.
[3]岡薩雷斯.數(shù)字圖像處理(第二版) [M].阮秋琦,阮宇智,譯.北京:電子工業(yè)出版社,2002:224-272.
[4]Sameer A,Rangachar K,Ramesh J.A survey on the use of pattern recognition methods for abstraction, indexing and retrieval of images and video[J].Pattern Recognition,2002,(35):945-965.
[5]李瑜,李磊.基于內(nèi)容的圖像檢索的方法研究[J].計(jì)算機(jī)科學(xué),1999,(26):8-10.