尹 輝,谷 峰,岳劍飛,張洪順
(1.空軍航空大學(xué),長(zhǎng)春 130022;2.解放軍66347部隊(duì),保定 071000)
針對(duì)遙感圖像目標(biāo)檢測(cè)任務(wù),圖像分辨率的提高一方面可以分辨出地物目標(biāo)內(nèi)部更為精細(xì)的結(jié)構(gòu),清楚地描述地物目標(biāo)的特征分布及相互之間的空間關(guān)聯(lián);另一方面目標(biāo)內(nèi)部一致性減弱、差異性增強(qiáng)以及復(fù)雜背景干擾等也給目標(biāo)檢測(cè)任務(wù)提出了新的挑戰(zhàn)。如何提高高分辨率圖像信息處理的時(shí)效性和準(zhǔn)確性,突破圖像數(shù)據(jù)向有價(jià)值信息轉(zhuǎn)化的瓶頸成為遙感圖像理解、機(jī)器視覺、人工智能等領(lǐng)域研究的熱點(diǎn)。飛機(jī)作為一類重要的、典型的人造目標(biāo)檢測(cè)對(duì)象,受到廣泛關(guān)注。
本質(zhì)上,對(duì)飛機(jī)目標(biāo)的檢測(cè),都是基于這樣一種假設(shè),即飛機(jī)目標(biāo)與背景的反差較大。這種反差表現(xiàn)為以下2個(gè)方面:
第一,飛機(jī)的形狀。與背景中的建筑物、草地、停機(jī)坪、道路相比,飛機(jī)在機(jī)身與機(jī)翼、機(jī)身與尾翼的交接處存在一定的凹陷,對(duì)于這種結(jié)構(gòu)可以考慮用目標(biāo)外接矩形充滿程度的緊湊度來描述,結(jié)合目標(biāo)的面積、周長(zhǎng)、長(zhǎng)寬比等特征進(jìn)行目標(biāo)分析[1]。此外,針對(duì)飛機(jī)這種凹凸形狀,角點(diǎn)特征是一種很有效的描述子。文獻(xiàn)[2]利用Harris角點(diǎn)來檢測(cè)飛機(jī)這種形狀的差異,然后通過核聚類方法將角點(diǎn)進(jìn)行合并,角點(diǎn)之間滿足一定規(guī)則即為目標(biāo)。這類方法的拓展大都是對(duì)角點(diǎn)描述字的選取。如為了增加角點(diǎn)的放射、尺度不變性,提取Harris-Affine、最小核值相似區(qū)(SUSAN)角點(diǎn),但無論哪種角點(diǎn)都對(duì)噪聲比較敏感,最后飛機(jī)目標(biāo)檢測(cè)結(jié)果受角點(diǎn)之間聚類規(guī)則限制,而通常聚類后的誤檢不容易剔除。
第二,飛機(jī)與背景對(duì)光的反射率不同,表現(xiàn)在圖像上為不同的紋理區(qū)域。不少學(xué)者提出了利用區(qū)域特征來檢測(cè)飛機(jī)目標(biāo)。典型的算法有高效斑點(diǎn)檢測(cè)、區(qū)域檢測(cè)等。其中,高效斑點(diǎn)檢測(cè)利用圖像中目標(biāo)的局部不變性特征,如:尺度不變特征變換(SIFT),主成分分析(PCA)-SIFT,快速魯棒性尺度不變特征提?。⊿URF),梯度位置方向直方圖(GLOH)通過匹配技術(shù)來完成目標(biāo)檢測(cè),其中Lowe提出的SIFT特征是現(xiàn)在公認(rèn)的最好的特征描述字。
然而,該方法計(jì)算復(fù)雜度高,只適用于幾何形狀單一的目標(biāo)檢測(cè),飛機(jī)目標(biāo)的多樣性使得其應(yīng)用受到了限制。此外,區(qū)域檢測(cè)方法中最穩(wěn)定極值區(qū)域(MSER)檢測(cè)器在視角變換下結(jié)構(gòu)型圖像和紋理型圖像均能展現(xiàn)十分明顯的優(yōu)越性。實(shí)際上,以上基于這種假設(shè)的飛機(jī)目標(biāo)檢測(cè)與通用的目標(biāo)檢測(cè)方法相類似,不同的是要建立針對(duì)飛機(jī)目標(biāo)的規(guī)則與模型。而飛機(jī)的種類多種多樣,形狀也各不相同,加上遙感圖像中各類背景噪聲的干擾,很難通過建立一種規(guī)則或者一個(gè)模型來枚舉所有的目標(biāo)。
為了解決這一難題,借鑒計(jì)算機(jī)視覺領(lǐng)域的機(jī)器學(xué)習(xí)理論,現(xiàn)有的遙感目標(biāo)自動(dòng)檢測(cè)系統(tǒng)都是基于大量的樣本學(xué)習(xí)[3-4]實(shí)現(xiàn)的,這樣可以充分利用樣本學(xué)習(xí)的優(yōu)勢(shì),較好地?cái)[脫了受遙感圖像數(shù)據(jù)量大、目標(biāo)特性多變、背景復(fù)雜等因素的制約。
然而,不同于普通自然場(chǎng)景下的目標(biāo)檢測(cè)問題,在對(duì)大幅高分辨率遙感圖像進(jìn)行精細(xì)化目標(biāo)檢測(cè)時(shí),還應(yīng)重點(diǎn)考慮2個(gè)方面:一是如何降低錯(cuò)檢、漏檢的概率,提高檢測(cè)效果的問題;二是檢測(cè)過程中的效率問題,這也是文本撰寫的出發(fā)點(diǎn)。
本文的主要?jiǎng)?chuàng)新工作是將基于視覺顯著計(jì)算模型與基于AdaBoost級(jí)聯(lián)學(xué)習(xí)分類的目標(biāo)檢測(cè)方法相結(jié)合,提出一種基于視覺顯著計(jì)算的搜索策略。一方面,該方法利用機(jī)器學(xué)習(xí)方法,提高目標(biāo)檢測(cè)的準(zhǔn)確性;另一方面,利用視覺注意模型去除冗余搜索,減少檢測(cè)時(shí)的計(jì)算量,快速搜索目標(biāo)的潛在區(qū)域,盡早排除明顯不存在目標(biāo)的區(qū)域,這樣在保證檢測(cè)效果的同時(shí)兼顧了檢測(cè)效率,使得檢測(cè)器在檢測(cè)速度和檢測(cè)性能方面得到了很好的平衡。
AdaBoost級(jí)聯(lián)分類器最成功的應(yīng)用是Viola和Jones[5]提出的利用Haar特征和AdaBoost分類器實(shí)時(shí)人臉檢測(cè)方法,這是實(shí)時(shí)人臉檢測(cè)技術(shù)的分水嶺。AdaBoost算法同時(shí)也是Boosting家族中最具代表性的算法,其他的擴(kuò)展模型還包括Real Ada-Boost、Gentle AdaBoost、Modest AdaBoost等。
在構(gòu)建AdaBoost分類器時(shí)并沒有規(guī)定弱分類器的種類,較為常用的是Haar特征。除此之外常用的弱分類器特征還有聯(lián)合類Haar、PCA、局部二進(jìn)制模式(LBP)、Gabor特征等。
一般情況下,類Haar特征判別能力一般,但計(jì)算速度快;PCA特征判別能力強(qiáng),但計(jì)算速度較慢??紤]到飛機(jī)通常在圖像中表現(xiàn)為小尺度目標(biāo),而Haar特征的優(yōu)勢(shì)在于可以捕捉大范圍的空間對(duì)比度特征,并能通過積分圖像快速進(jìn)行計(jì)算,非常適用于大尺寸遙感圖像中的小尺度目標(biāo)檢測(cè),因而本文采用的是Haar特征。
如圖1(a)所示,應(yīng)用Haar弱分類器對(duì)圖像中的一個(gè)區(qū)域進(jìn)行特征判別,白色矩形中的像素與減去黑色矩形中的像素和即為Haar特征,所得結(jié)果與設(shè)定閾值進(jìn)行比較:
式中:1表示該區(qū)域?yàn)槟繕?biāo);0為非目標(biāo)。
為減小區(qū)域圖像對(duì)亮度變化的敏感,按公式(2)對(duì)其進(jìn)行歸一化處理:
式中:gj為特征函數(shù);M為子圖像中像素個(gè)數(shù);msi為子圖像均值;σ2為子圖像方差。
每個(gè)弱分類器(由圖1(b)所示的典型Haar特征算子組成)按照上述處理訓(xùn)練正、負(fù)樣本集,并從正確分類的所有弱分類器中選取錯(cuò)分率最小的一個(gè)。
上述弱分類器的性能僅僅優(yōu)于隨機(jī)猜測(cè)的結(jié)果,但這可以通過訓(xùn)練多個(gè)弱分類器得到1個(gè)強(qiáng)分類器來提升算法性能。AdaBoost算法是通過將每個(gè)樣本的權(quán)重調(diào)整作為其在每個(gè)階段是否被正確分類的函數(shù),然后用每個(gè)階段的平均分類錯(cuò)誤率在弱分類器中間決定最終權(quán)重值。算法描述如下:
圖1 典型Haar特征算子示例
(1)輸入訓(xùn)練的正樣本和負(fù)樣本以及它們的標(biāo)簽{(xi,yi)},其中yi=1表示正樣本(飛機(jī)),yi=-1是負(fù)樣本。
(2)初始化樣本權(quán)重w=1/N,其中N是訓(xùn)練樣本的數(shù)目。
(3)對(duì)訓(xùn)練的每一步j(luò)=1,…,M,進(jìn)行如下4個(gè)步驟更改權(quán)重:
(a)重新歸一化權(quán)重,使其加起來為1。
(b)通過找到最小化加權(quán)分類錯(cuò)誤率來選擇最好的分類器:
(c)計(jì)算修正誤差率βj和分類器的權(quán)重αj:
(d)根據(jù)分類錯(cuò)誤率ei,j更新權(quán)重:
(4)最終的分類器設(shè)置為:
為進(jìn)一步提高檢測(cè)器的速度,可以建立一個(gè)級(jí)聯(lián)結(jié)構(gòu),構(gòu)成級(jí)聯(lián)強(qiáng)分類器。重復(fù)采用AdaBoost算法訓(xùn)練強(qiáng)分類器,采用這種策略對(duì)每個(gè)子窗口圖像都使用一系列的弱分類器計(jì)算,在級(jí)聯(lián)分類器的第1級(jí)使用很少的弱分類數(shù)目就可以去除大量的非目標(biāo)子窗口,后面采用相對(duì)較多的弱分類器進(jìn)一步去除背景。
隨著級(jí)聯(lián)分類器層數(shù)的深入,候選飛機(jī)子窗口的數(shù)量急劇減少,當(dāng)子窗口圖像通過了所有的強(qiáng)分類器才被認(rèn)為是目標(biāo)。這樣使得大部分非目標(biāo)圖像在經(jīng)過開始的幾級(jí)分類器后就被拒絕,從而大大提高了檢測(cè)效率。級(jí)聯(lián)分類器的性能通過如下2個(gè)指標(biāo)衡量。
(1)檢測(cè)率,即:
式中:ri為第i級(jí)強(qiáng)分類器的檢測(cè)率;K為總級(jí)聯(lián)數(shù)。
因此,對(duì)于一個(gè)10級(jí)的級(jí)聯(lián)強(qiáng)分類器,為了達(dá)到0.9的總檢測(cè)率,每級(jí)強(qiáng)分類器的檢測(cè)率要求為0.99左右。
(2)誤檢率,即:
式中:fi為第i級(jí)的誤檢率;K為級(jí)聯(lián)數(shù)。
為了獲得盡可能低的總誤檢率,要求級(jí)聯(lián)強(qiáng)分類器的每級(jí)誤檢率為0.401 0,顯然級(jí)聯(lián)強(qiáng)分類器的總誤檢率遠(yuǎn)遠(yuǎn)低于單個(gè)強(qiáng)分類器。
訓(xùn)練好分類器后,就進(jìn)入到檢測(cè)階段,經(jīng)典的搜索策略是檢測(cè)窗自左向右、自上而下地掃描整幅圖像,通常圖像中的目標(biāo)尺度并不一致,一般戰(zhàn)斗機(jī)的尺寸比較小,長(zhǎng)度和翼展在十幾米左右,面積約為幾十個(gè)像素;運(yùn)輸機(jī)的尺寸比較大,長(zhǎng)度和翼展為30~40m,面積約為幾百個(gè)像素。
為實(shí)現(xiàn)多尺度檢測(cè),檢測(cè)器在每個(gè)位置將在不同的尺度上進(jìn)行縮放。整個(gè)搜索過程受縮放因子和平移步長(zhǎng)的影響。
傳統(tǒng)的搜索策略是一種貪心的遍歷。假設(shè)一副1 000×1 000的遙感圖像,從20×20像素大小窗口開始,以1.25倍為尺度步進(jìn),平移步長(zhǎng)取1.5倍的尺度因子大小,直至檢測(cè)窗口超出原始圖像大小。經(jīng)計(jì)算需要產(chǎn)生約110萬個(gè)子窗口,而每個(gè)子窗口提取的Haar特征數(shù)目也是非常巨大的,顯然這種搜索不僅給分類器增加負(fù)擔(dān),也使檢測(cè)效率大幅下降,是不可取的。
針對(duì)如何消除遍歷搜索中的冗余計(jì)算問題,文獻(xiàn)[6]提出通過迭代來簡(jiǎn)化計(jì)算,使運(yùn)算速度有了很大提高。文獻(xiàn)[7]提出了基于視差梯度的可變搜索策略,算法工作量減少了28%,算法速度提高了3.5倍。
針對(duì)這種情況,本文通過詳細(xì)分析基于視覺顯著性的目標(biāo)檢測(cè)方法與搜索范圍的聯(lián)系,提出了基于視覺顯著計(jì)算的搜索策略,根據(jù)飛機(jī)目標(biāo)在圖像中表現(xiàn)的顯著特征,將大幅遙感圖像分為幾個(gè)小的飛機(jī)目標(biāo)潛在區(qū)域,從而快速去除冗余搜索區(qū)域,提高了檢測(cè)效率。
利用視覺顯著性來輔助目標(biāo)檢測(cè)實(shí)際上就是讓計(jì)算機(jī)模仿人的判讀作業(yè)過程,當(dāng)觀察一副圖像時(shí),人眼總是優(yōu)先關(guān)注那些“不同”的區(qū)域,比如高亮度區(qū)域,顏色、形狀與周圍環(huán)境反差較大的區(qū)域。而這種特性正是在前面引言提到的飛機(jī)目標(biāo)檢測(cè)的基礎(chǔ)假設(shè)。本文選取亮度、顏色作為提取飛機(jī)顯著區(qū)域的特征。除此之外,擴(kuò)展算法還有其它更復(fù)雜的改進(jìn)模型如基于梯度特征[8],基于普殘差[9]的方法等,本文主要是驗(yàn)證方法的可行性,所以選擇一種最具代表性的計(jì)算模型,利用文獻(xiàn)[10]中的方法來生成視覺顯著圖。
如圖2所示,本文方法分為兩部分:一部分是級(jí)聯(lián)分類器的設(shè)計(jì),另一部分是目標(biāo)顯著區(qū)域提取。重點(diǎn)在飛機(jī)目標(biāo)顯著區(qū)域的提取,首先對(duì)輸入的待檢測(cè)圖像進(jìn)行直方圖均衡化,去除光照的影響,提取顏色、亮度特征生成視覺顯著圖;再利用視覺注意的全局競(jìng)爭(zhēng)機(jī)制和返回抑制策略來快速搜索顯著圖,生成目標(biāo)的待檢測(cè)區(qū)域,送入設(shè)計(jì)好的分類器中。
其中值得說明的是,在分類器設(shè)計(jì)階段,本文訓(xùn)練樣本進(jìn)行了直方圖均衡化預(yù)處理,并將樣本歸一化到128×128大小。本文采用的學(xué)習(xí)特征是計(jì)算簡(jiǎn)單、速度快的Haar特征,為減輕分類器的負(fù)擔(dān),本文采用PCA方法對(duì)特征進(jìn)一步壓縮。
實(shí)驗(yàn)數(shù)據(jù)來自公開的Google earth衛(wèi)星圖像,內(nèi)容為美軍25個(gè)主要的空軍基地,共80幅遙感圖像,涉及目前美軍主要作戰(zhàn)飛機(jī)。其中,訓(xùn)練樣本60幅,測(cè)試樣本20幅。為了更好適應(yīng)實(shí)際檢測(cè)時(shí)非目標(biāo)本體引起的多樣性,訓(xùn)練集中正樣本的采集為手工裁剪的2 000個(gè)不同光照條件(有陰影/無陰影)、不同旋轉(zhuǎn)角度(60幅原始圖像中以45°步進(jìn)旋轉(zhuǎn)8個(gè)方向)、不同尺度大小的飛機(jī)目標(biāo)切片,部分正樣本如圖3所示。
圖2 本文算法流程
圖3 部分飛機(jī)目標(biāo)正樣本切片
負(fù)樣本包括了4 500個(gè)非飛機(jī)目標(biāo)樣本,需要特別說明的是,訓(xùn)練集中負(fù)樣本的選取并非任意非飛機(jī)目標(biāo)區(qū)域,主要是基于飛機(jī)機(jī)場(chǎng)內(nèi)的典型負(fù)樣本,如跑道、停機(jī)坪、草地、房屋等,這樣才能真正體現(xiàn)正負(fù)樣本之間的差異,提高級(jí)聯(lián)分類器的檢測(cè)率,降低誤檢率。
為了將本文方法與傳統(tǒng)的遍歷搜索目標(biāo)檢測(cè)方法相比,選取了3幅機(jī)場(chǎng)圖像進(jìn)行驗(yàn)證,如圖4(a)所示,從左至右,第1幅大小為590×661像素,后2幅大小為988×659像素。從圖4(b)后2幅圖中可以清楚地看到,飛機(jī)目標(biāo)區(qū)域被準(zhǔn)確地提取出來,將顯著圖中非目標(biāo)區(qū)域剔除,計(jì)算剩下的區(qū)域面積與原始圖像的比值,發(fā)現(xiàn)本文方法搜索區(qū)域是原圖像的1/3左右,而且目標(biāo)全部包含在搜索區(qū)域當(dāng)中,這說明該方法是可行的,減少了60%的工作量。但該方法也存在一些弊端,當(dāng)背景過于復(fù)雜時(shí),如圖4(b)第1幅圖像所示,基于視覺顯著圖模型的方法沒有將全部的飛機(jī)目標(biāo)定位出來。圖中黑色方框標(biāo)注區(qū)域?yàn)槁z目標(biāo),白色方框?yàn)檎`檢目標(biāo)。分析漏檢的原因在于:第一,當(dāng)目標(biāo)與周圍背景反差不大時(shí)(本文是基于亮度、顏色),本算法的第1步將目標(biāo)區(qū)域當(dāng)作背景剔除掉;第二,受機(jī)場(chǎng)停機(jī)坪及周圍房屋、道路影響,本算法沒有很好地將目標(biāo)鎖定在停機(jī)坪內(nèi),導(dǎo)致基于視覺顯著搜索的方法只排除掉很少的部分。同時(shí),對(duì)于存在的誤檢是因?yàn)楸尘爸杏胁糠纸ㄖ锎嬖谂c飛機(jī)機(jī)翼相似的結(jié)構(gòu),而這種情況是需要進(jìn)一步增加規(guī)則來排除的。
圖4 實(shí)驗(yàn)結(jié)果圖
綜上所述,本文提出的方法在一定程度上依賴于圖像的內(nèi)容,這主要受顯著模型的限制。但基于這樣的搜索策略加上基于統(tǒng)計(jì)學(xué)習(xí)的方法,還是可以保證實(shí)際的需要,由顯著區(qū)域搜索的大小可以判定本文提出的方法平均可以提高50%的檢測(cè)效率。
隨著成像分辨率的提高,自然場(chǎng)景圖像和遙感場(chǎng)景圖像原本存在的尺度差異正在逐漸縮小,這為將機(jī)器視覺方法引入到高分辨率遙感圖像目標(biāo)檢測(cè)任務(wù)中提供了良好的可行性。
針對(duì)如何權(quán)衡檢測(cè)效果與檢測(cè)率的問題,本文提出了基于視覺顯著搜索的方法完成了飛機(jī)圖像粗定位,去除了圖像中大部分明顯不存在目標(biāo)的區(qū)域,減少了不必要的目標(biāo)搜索空間,與高檢測(cè)率的Ada-Boost級(jí)聯(lián)分類器相結(jié)合,在保證高檢測(cè)率的同時(shí),提高了檢測(cè)效率,降低了誤檢率。
但基于統(tǒng)計(jì)學(xué)習(xí)的方法,檢測(cè)效果受學(xué)習(xí)樣本的影響較大,不同樣本集合對(duì)算法的性能也有一定的影響,本文主要適用于目標(biāo)受少量光照、陰影的影響,對(duì)于目標(biāo)存在放射變換、視點(diǎn)變換的情況沒有考慮。下一步工作是結(jié)合特征縮放和平移算法來進(jìn)一步提高目標(biāo)的檢測(cè)率。
[1] 王樹國(guó),黃勇杰,張生.可見光圖像中飛機(jī)目標(biāo)的特征選取及提取[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2010(7):1056-1059.
[2] 王鵬偉,吳秀清,余珊.基于角點(diǎn)特征和自適應(yīng)核聚類算法 的 目 標(biāo) 識(shí) 別 [J].計(jì) 算 機(jī) 工 程,2007,33(6):179-181.
[3] 張正,王宏琦,孫顯,等.基于部件的自動(dòng)目標(biāo)檢測(cè)方法研究[J].電子與信息學(xué)報(bào),2010(5):1017-1022.
[4] 孫顯.基于對(duì)象的Boosting方法自動(dòng)提取高分辨率遙感圖像中建筑物目標(biāo)[J].電子與信息學(xué)報(bào),2009,31(1):177-181.
[5] Viola P,Jones M.Rapid object detection using a boosted cascade of simple features[A].IEEE Vision and Pattern[C],2001:511-518.
[6] 張國(guó)云,張兢.基于Gabor小波的多尺度PCA支持向量機(jī)人臉識(shí)別方法[J].數(shù)據(jù)采集與處理,2009,24(4):437-442.
[7] 郭龍?jiān)?,盧阿麗,楊靜宇.基于視差梯度的快速區(qū)域匹配方法[J].計(jì)算機(jī)科學(xué),2007,4(4):239-240.
[8] Liu T,Sun J,Lowe D G.Learning to detect a salient object[A].IEEE Conference on Computer Vision and Pattern Recognition[C],2007:466-474.
[9] 周偉,關(guān)鍵,張國(guó)華.高分辨率遙感圖像感興趣目標(biāo)的提取算法[J].光電工程,2011(2):115-121.
[10]Achanta R,Hemami S,Estrada F,et al.Frequencytuned salient region detection[A].IEEE International Conference on Computer Vision and Pattern Recognition[C],2009:1597-1604.