圖像序列的顯著性目標(biāo)區(qū)域檢測(cè)方法
柯洪昌,孫宏彬
摘要:目的:視覺注意機(jī)制可以快速定位到當(dāng)前圖像中的一些顯著性區(qū)域。視覺注意計(jì)算機(jī)模型可以不用人工參與快速查找到圖像中感興趣區(qū)域,對(duì)圖像處理和圖像復(fù)原等技術(shù)提供支持。提出多通道參數(shù)估計(jì)方法,計(jì)算圖像感興趣區(qū)域與眼動(dòng)感興趣區(qū)域的相似度,從而能準(zhǔn)確定位目標(biāo)在圖像上的位置。方法:設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)融入運(yùn)動(dòng)特征的視覺顯著性模型,基于這個(gè)模型,提出一種基于多尺度差分的運(yùn)動(dòng)特征提取方法,在指導(dǎo)全局顯著圖的生成時(shí),基于多通道參數(shù)估計(jì)方法計(jì)算各通道在整合時(shí)的權(quán)重,從而能準(zhǔn)確定位目標(biāo)在圖像上的位置。結(jié)果:用Matlab 進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證算法的有效性。針對(duì)20 組視頻圖像序列(每組50 幀)進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)選取所有測(cè)試視頻圖像序列來(lái)自CDNET2012 和CVPapers 庫(kù)。為體現(xiàn)根據(jù)任務(wù)情境實(shí)現(xiàn)的自頂向下的指導(dǎo)作用,所選取的圖像序列中大多含有單個(gè)或多個(gè)突出目標(biāo)。提出的融入動(dòng)態(tài)特征視覺顯著性模型生成的多通道顯著圖。從圖像中分別提取各通道的顯著性特征,經(jīng)過差分并歸一化后得到各通道的顯著圖。在場(chǎng)景中,靜態(tài)特征被有效抑制,圖像中具有運(yùn)動(dòng)特征的汽車和人得到了加強(qiáng),從而驗(yàn)證了提出的模型對(duì)于具有運(yùn)動(dòng)特征的目標(biāo)區(qū)域檢測(cè)的有效性。通過分析比較顯著圖ROI 和眼動(dòng)圖ROI 的相似度來(lái)評(píng)價(jià)提出算法的準(zhǔn)確性和有效性。將全局顯著圖S 歸一化為0~255,提取出注意焦點(diǎn),即ROI。其中3 組圖像序列(每組50 幀圖像)的4 個(gè)底層特征的權(quán)重值為每組圖像的平均值。給出了眼動(dòng)ROI 和本文提出算法提取到的ROI 之間滿足最大相似度的各個(gè)特征通道的權(quán)值平均值。不同底層特征對(duì)ROI 的影響不同,同一底層特征對(duì)不同類型圖像的影響程度也不同,由于前兩組圖像中的汽車都有明顯的顏色特征和運(yùn)動(dòng)特征,所以顏色和運(yùn)動(dòng)特征的權(quán)重較大,由于第3 組圖像的3 個(gè)人相對(duì)其他目標(biāo)運(yùn)動(dòng)特征較明顯,所以運(yùn)動(dòng)特征的權(quán)重較大,其他3 個(gè)特征權(quán)重較小,通過運(yùn)動(dòng)特征可以描述圖像的ROI,從而減少計(jì)算量。給出20 組視頻圖像序列中每組圖像最終計(jì)算的ROI 與眼動(dòng)ROI的相似度平均值,可以看出本文算法的大部分圖像序列的平均相似度要大于Itti 算法的平均相似度,說明文本算法提取的ROI 更準(zhǔn)確,從而可有效提高目標(biāo)搜索的效率。結(jié)論:設(shè)計(jì)并實(shí)現(xiàn)了融入運(yùn)動(dòng)特征的視覺顯著性模型,并在此模型基礎(chǔ)上,利用基于多尺度差分的運(yùn)動(dòng)特征提取方法提取運(yùn)動(dòng)特征,然后生成運(yùn)動(dòng)顯著圖。在生成全局顯著圖時(shí),提出了一種基于多通道參數(shù)估計(jì)算法,算法通過計(jì)算圖像感興趣區(qū)域(ROI)與眼動(dòng)感興趣區(qū)域的相似度來(lái)估計(jì)多通道參數(shù),為目標(biāo)在圖像上的準(zhǔn)確定位提供計(jì)算機(jī)制。針對(duì)20 組視頻圖像序列(每組50 幀)進(jìn)行了實(shí)驗(yàn),結(jié)果表明本文算法提取注意焦點(diǎn)即目標(biāo)區(qū)域的平均相似度為0.87,能更高效準(zhǔn)確地定位目標(biāo)可能存在的區(qū)域。
來(lái)源出版物:中國(guó)光學(xué), 2015, 8(5): 768-774
入選年份:2017