倪先鋒
摘 要:針對(duì)水下機(jī)器人采集的聲納圖像檢測(cè)范圍較小的問(wèn)題,文章提出了一種基于SURF的聲納圖像拼接算法。首先,對(duì)采集的聲納圖像進(jìn)行一定的預(yù)處理,去除噪聲并調(diào)整聲納圖像的對(duì)比度;其次,對(duì)處理后的圖像提取SURF特征點(diǎn);然后,利用得到的特征點(diǎn)對(duì)求解單應(yīng)矩陣并進(jìn)行坐標(biāo)映射;最后,對(duì)拼接圖像進(jìn)行圖像融合。實(shí)驗(yàn)表明:該算法在含有較多特征點(diǎn)的聲納圖像中具有較好的精度,實(shí)時(shí)性也較好。
關(guān)鍵詞:機(jī)器人;聲納;圖像
1 引言
圖像配準(zhǔn)和圖像融合是圖像拼接的2個(gè)關(guān)鍵技術(shù),圖像配準(zhǔn)是圖像融合的基礎(chǔ),而且圖像配準(zhǔn)算法的計(jì)算量一般非常大,因此圖像拼接技術(shù)的發(fā)展很大程度上取決于圖像配準(zhǔn)技術(shù)的創(chuàng)新[1]。本文針對(duì)聲納圖像拼接應(yīng)滿足實(shí)時(shí)性要求這一條件,提出了一種基于SURF[3]的聲納序列圖像拼接方法,圖1為該算法的基本流程。
圖1 基于SURF算法的聲納序列圖像拼接流程
2 圖像預(yù)處理
圖像預(yù)處理是特征提取的基礎(chǔ),預(yù)處理結(jié)果的好壞將影響特征提取的效果,因此為了完成水下聲納圖像目標(biāo)特征的提取任務(wù),要對(duì)圖像進(jìn)行必要的預(yù)處理。
基于聲納圖像具有較強(qiáng)的高斯噪聲,信噪比較低的特點(diǎn),應(yīng)對(duì)聲納圖形進(jìn)行圖像去噪。本文采取高斯平滑算法,高斯平滑能較好的去除高斯噪聲[2]。
針對(duì)聲納圖像分辨率比較低的問(wèn)題,本文采用灰度拉伸算法改善圖像的對(duì)比度。通過(guò)對(duì)比度拉伸可增強(qiáng)圖像中監(jiān)測(cè)目標(biāo)的特征信息。
3 基于SURF的特征點(diǎn)檢測(cè)與描述
本文結(jié)合聲納圖像的特點(diǎn),將SURF特征檢測(cè)算法引入到聲納圖像拼接過(guò)程中,實(shí)現(xiàn)特征點(diǎn)的自動(dòng)提取。該算法是由Herbert Bay、Tinne Tuytelaars和Luc Van Gool所提出來(lái)的一種特征檢測(cè)算法。
基于SURF的特征提取算法具體實(shí)現(xiàn)步驟如下:
(1)將聲納圖像轉(zhuǎn)換成積分圖像。對(duì)于積分圖像中某點(diǎn)X,X=X(x,y),該點(diǎn)的值用I?撞(X)表示計(jì)算如公式(1)所示。
(1)
(2)利用Hessian矩陣計(jì)算圖像的興趣點(diǎn)。計(jì)算圖像中一點(diǎn)在不同尺度下的Hessian矩陣行列式的局部最大值。圖像中任意一點(diǎn)X(x,y),該點(diǎn)在尺度?滓下的Hessian矩陣定義為
(2)
式中:Lxy(X,?滓)表示高斯二階偏導(dǎo)在X處的卷積。Lxy(X,?滓)、Lxy(X,?滓)具有相似的含義。
(3)構(gòu)建尺度空間。采用不斷增大盒子濾波模板的尺寸建立圖像金字塔。
(4)特征點(diǎn)的確定。通過(guò)篩選濾波響應(yīng)并對(duì)篩選的點(diǎn)進(jìn)行處理,將每一個(gè)篩選的點(diǎn)與同尺度的8個(gè)像素點(diǎn)和上下相鄰尺度各9個(gè)點(diǎn)一共26個(gè)點(diǎn)進(jìn)行比較,求得局部極大值點(diǎn)即為特征點(diǎn)。
(5)特征點(diǎn)的描述。分別求出特征點(diǎn)在x、y方向上的梯度,以這兩個(gè)方向?yàn)樽鴺?biāo)軸建立坐標(biāo)系,將個(gè)點(diǎn)的響應(yīng)映射到坐標(biāo)系中,累加在各方向一定范圍內(nèi)的小波響應(yīng),將獲得最大響應(yīng)的方向確定為梯度的主方向,并且在主方向上建立特征點(diǎn)的描述向量。最終得到每個(gè)特征點(diǎn)的64維特征向量。
4 特征點(diǎn)匹配
當(dāng)兩幅圖像的SURF特征向量生成后,本文采用特征向量間歐式距離(3)作為兩幅圖像中特征點(diǎn)的相似性判定度量。
(3)
其中,d(X,Y)表示特征向量間的歐式距離;X=(x1,x2,x3,…xN)表示圖像X中任意一點(diǎn);Y=(y1,y2,y3,…yN)表示圖像Y中任意一點(diǎn);i表示描述子向量中第i個(gè)分量;xi、yi分別表示圖像X、Y描述子向量的第i個(gè)分量;N為特征向量的維數(shù),這里N=64。首先取參考圖像的某個(gè)特征點(diǎn)并在待匹配圖像中找出與該點(diǎn)歐式距離最近和次近的兩個(gè)特征點(diǎn),如果最近距離的平方與次近距離平方的比例小于75%,則認(rèn)為最近的這一對(duì)特征點(diǎn)為對(duì)應(yīng)的匹配對(duì)。遍歷參考圖像中的特征點(diǎn),找出所有潛在的匹配點(diǎn)對(duì)。
5 單應(yīng)矩陣求解以及坐標(biāo)映射
5.1 圖像單應(yīng)矩陣的求解
在聲納DIDSON實(shí)際拍攝過(guò)程中,近似滿足透視變換模型。兩幅圖像之間的對(duì)應(yīng)關(guān)系可以由一個(gè)3×3的平面透視變換矩陣來(lái)表示: X1=H21X2 (4)
式中,X1可以表示為(x1,y1,1)T,X2可以表示為(x2,y2,1)T,(x1,y1)和(x2,y2)是一對(duì)匹配點(diǎn);單應(yīng)矩陣H是一個(gè)3×3的滿秩矩陣,可以表示為:
(5)
通過(guò)前面提到的特征點(diǎn)匹配方法,已經(jīng)得到了N個(gè)匹配點(diǎn)對(duì),注意這里的N?叟4才可以計(jì)算單應(yīng)矩陣H,計(jì)算單應(yīng)矩陣最少需要4個(gè)匹配點(diǎn)對(duì)就可以,但是僅用4個(gè)匹配點(diǎn)對(duì)所計(jì)算出的結(jié)果是無(wú)法保證精度的。
5.2 坐標(biāo)映射
利用求得的H矩陣,可以將待匹配的圖像映射到基準(zhǔn)圖像中。為避免圖像映射過(guò)去出現(xiàn)較多黑洞的情況,本文選用逆映射的方法。
此外,在坐標(biāo)映射的過(guò)程中,會(huì)導(dǎo)致一種必然出現(xiàn)的情況:原來(lái)在整數(shù)網(wǎng)格上的點(diǎn)(x、y坐標(biāo)都是整數(shù)),在映射之后沒(méi)有落在網(wǎng)格點(diǎn)上,本文通過(guò)雙線性插值算法[6]將計(jì)算對(duì)應(yīng)的值。
6 圖像融合
如果直接對(duì)這樣的圖像進(jìn)行簡(jiǎn)單的疊加拼合,得到的拼接圖在拼接位置上就會(huì)存在明顯的接縫以及重疊區(qū)域模糊和失真現(xiàn)象[3]。為了得到無(wú)縫的高清晰圖像,就要對(duì)匹配后的聲納圖像進(jìn)行融合處理。本文中采用的融合策略為:通過(guò)融合算法使圖像重疊部分融合,消除融合圖像之間的拼接接縫,實(shí)現(xiàn)聲納圖像的無(wú)縫拼接。
本文選用加權(quán)平滑算法[7]來(lái)實(shí)現(xiàn)圖像重疊部分的融合。
如圖2所示,相鄰兩幀圖像f1、f2在區(qū)間[x1,x2]上重疊,W1(x)、W2(x)為加權(quán)函數(shù),一個(gè)常用的加權(quán)函數(shù)如式,其中0?燮i?燮W,W為重疊區(qū)域的寬度。
(6)
那么融合后圖像f在區(qū)間(x,y)上點(diǎn)的像素值如式。
(7)
圖2 加權(quán)平滑算法示意圖
7 實(shí)驗(yàn)結(jié)果
為確保本算法的精度,本文進(jìn)行對(duì)應(yīng)的實(shí)驗(yàn)。圖3 (a)、(b)為原始聲納圖像。圖3(c)為經(jīng)本算法的拼接結(jié)果。
(a)原始圖像 (b)原始圖像 (c)拼接圖像
圖3 算法實(shí)驗(yàn)結(jié)果
圖3 (b)和(a)的特征點(diǎn)對(duì)數(shù)量分別為17和15,大于4,說(shuō)明特征較為明顯(圖中的孔狀信息可能為SURF特征)。圖3 (b)和(a)中的紅色矩形框區(qū)域?yàn)樵悸暭{圖像的公有特征物。圖(c)為其的拼接結(jié)果,該圖中的紅色矩形框區(qū)域融合較好,此外在各個(gè)方向上都有一定程度的擴(kuò)展。
8 結(jié)束語(yǔ)
本研究實(shí)現(xiàn)了一種基于SURF的聲納序列圖像拼接算法,通過(guò)實(shí)驗(yàn)驗(yàn)證了其有效性,有一定的實(shí)用性。本算法針對(duì)聲納圖像分辨率低的特點(diǎn),對(duì)特征點(diǎn)的提取以及特征點(diǎn)對(duì)的匹配都經(jīng)過(guò)了雙重校驗(yàn),保證了一定的精確度。但是本算法對(duì)于含有特征點(diǎn)比較少的聲納圖像的精確度無(wú)法保證,這也是下一步要研究的方向。
參考文獻(xiàn)
[1]K. Kim,N. Neretti,and N. Intrator,Mosaicing of acoustic camera images,IEE Proceedings on Radar,Sonar and Navigation,pp. 263-270,2005.
[2]邱敦國(guó),李勇.計(jì)算機(jī)圖像分析處理技術(shù)在理化檢測(cè)中的應(yīng)用[J].工具技術(shù),2003(5):46-48.
[3]陳金波,李恒宇,龔振邦,等.基于仿生機(jī)械云臺(tái)的聲納圖像拼接[J].應(yīng)用科學(xué)學(xué)報(bào),2012(2):158-164.endprint
摘 要:針對(duì)水下機(jī)器人采集的聲納圖像檢測(cè)范圍較小的問(wèn)題,文章提出了一種基于SURF的聲納圖像拼接算法。首先,對(duì)采集的聲納圖像進(jìn)行一定的預(yù)處理,去除噪聲并調(diào)整聲納圖像的對(duì)比度;其次,對(duì)處理后的圖像提取SURF特征點(diǎn);然后,利用得到的特征點(diǎn)對(duì)求解單應(yīng)矩陣并進(jìn)行坐標(biāo)映射;最后,對(duì)拼接圖像進(jìn)行圖像融合。實(shí)驗(yàn)表明:該算法在含有較多特征點(diǎn)的聲納圖像中具有較好的精度,實(shí)時(shí)性也較好。
關(guān)鍵詞:機(jī)器人;聲納;圖像
1 引言
圖像配準(zhǔn)和圖像融合是圖像拼接的2個(gè)關(guān)鍵技術(shù),圖像配準(zhǔn)是圖像融合的基礎(chǔ),而且圖像配準(zhǔn)算法的計(jì)算量一般非常大,因此圖像拼接技術(shù)的發(fā)展很大程度上取決于圖像配準(zhǔn)技術(shù)的創(chuàng)新[1]。本文針對(duì)聲納圖像拼接應(yīng)滿足實(shí)時(shí)性要求這一條件,提出了一種基于SURF[3]的聲納序列圖像拼接方法,圖1為該算法的基本流程。
圖1 基于SURF算法的聲納序列圖像拼接流程
2 圖像預(yù)處理
圖像預(yù)處理是特征提取的基礎(chǔ),預(yù)處理結(jié)果的好壞將影響特征提取的效果,因此為了完成水下聲納圖像目標(biāo)特征的提取任務(wù),要對(duì)圖像進(jìn)行必要的預(yù)處理。
基于聲納圖像具有較強(qiáng)的高斯噪聲,信噪比較低的特點(diǎn),應(yīng)對(duì)聲納圖形進(jìn)行圖像去噪。本文采取高斯平滑算法,高斯平滑能較好的去除高斯噪聲[2]。
針對(duì)聲納圖像分辨率比較低的問(wèn)題,本文采用灰度拉伸算法改善圖像的對(duì)比度。通過(guò)對(duì)比度拉伸可增強(qiáng)圖像中監(jiān)測(cè)目標(biāo)的特征信息。
3 基于SURF的特征點(diǎn)檢測(cè)與描述
本文結(jié)合聲納圖像的特點(diǎn),將SURF特征檢測(cè)算法引入到聲納圖像拼接過(guò)程中,實(shí)現(xiàn)特征點(diǎn)的自動(dòng)提取。該算法是由Herbert Bay、Tinne Tuytelaars和Luc Van Gool所提出來(lái)的一種特征檢測(cè)算法。
基于SURF的特征提取算法具體實(shí)現(xiàn)步驟如下:
(1)將聲納圖像轉(zhuǎn)換成積分圖像。對(duì)于積分圖像中某點(diǎn)X,X=X(x,y),該點(diǎn)的值用I?撞(X)表示計(jì)算如公式(1)所示。
(1)
(2)利用Hessian矩陣計(jì)算圖像的興趣點(diǎn)。計(jì)算圖像中一點(diǎn)在不同尺度下的Hessian矩陣行列式的局部最大值。圖像中任意一點(diǎn)X(x,y),該點(diǎn)在尺度?滓下的Hessian矩陣定義為
(2)
式中:Lxy(X,?滓)表示高斯二階偏導(dǎo)在X處的卷積。Lxy(X,?滓)、Lxy(X,?滓)具有相似的含義。
(3)構(gòu)建尺度空間。采用不斷增大盒子濾波模板的尺寸建立圖像金字塔。
(4)特征點(diǎn)的確定。通過(guò)篩選濾波響應(yīng)并對(duì)篩選的點(diǎn)進(jìn)行處理,將每一個(gè)篩選的點(diǎn)與同尺度的8個(gè)像素點(diǎn)和上下相鄰尺度各9個(gè)點(diǎn)一共26個(gè)點(diǎn)進(jìn)行比較,求得局部極大值點(diǎn)即為特征點(diǎn)。
(5)特征點(diǎn)的描述。分別求出特征點(diǎn)在x、y方向上的梯度,以這兩個(gè)方向?yàn)樽鴺?biāo)軸建立坐標(biāo)系,將個(gè)點(diǎn)的響應(yīng)映射到坐標(biāo)系中,累加在各方向一定范圍內(nèi)的小波響應(yīng),將獲得最大響應(yīng)的方向確定為梯度的主方向,并且在主方向上建立特征點(diǎn)的描述向量。最終得到每個(gè)特征點(diǎn)的64維特征向量。
4 特征點(diǎn)匹配
當(dāng)兩幅圖像的SURF特征向量生成后,本文采用特征向量間歐式距離(3)作為兩幅圖像中特征點(diǎn)的相似性判定度量。
(3)
其中,d(X,Y)表示特征向量間的歐式距離;X=(x1,x2,x3,…xN)表示圖像X中任意一點(diǎn);Y=(y1,y2,y3,…yN)表示圖像Y中任意一點(diǎn);i表示描述子向量中第i個(gè)分量;xi、yi分別表示圖像X、Y描述子向量的第i個(gè)分量;N為特征向量的維數(shù),這里N=64。首先取參考圖像的某個(gè)特征點(diǎn)并在待匹配圖像中找出與該點(diǎn)歐式距離最近和次近的兩個(gè)特征點(diǎn),如果最近距離的平方與次近距離平方的比例小于75%,則認(rèn)為最近的這一對(duì)特征點(diǎn)為對(duì)應(yīng)的匹配對(duì)。遍歷參考圖像中的特征點(diǎn),找出所有潛在的匹配點(diǎn)對(duì)。
5 單應(yīng)矩陣求解以及坐標(biāo)映射
5.1 圖像單應(yīng)矩陣的求解
在聲納DIDSON實(shí)際拍攝過(guò)程中,近似滿足透視變換模型。兩幅圖像之間的對(duì)應(yīng)關(guān)系可以由一個(gè)3×3的平面透視變換矩陣來(lái)表示: X1=H21X2 (4)
式中,X1可以表示為(x1,y1,1)T,X2可以表示為(x2,y2,1)T,(x1,y1)和(x2,y2)是一對(duì)匹配點(diǎn);單應(yīng)矩陣H是一個(gè)3×3的滿秩矩陣,可以表示為:
(5)
通過(guò)前面提到的特征點(diǎn)匹配方法,已經(jīng)得到了N個(gè)匹配點(diǎn)對(duì),注意這里的N?叟4才可以計(jì)算單應(yīng)矩陣H,計(jì)算單應(yīng)矩陣最少需要4個(gè)匹配點(diǎn)對(duì)就可以,但是僅用4個(gè)匹配點(diǎn)對(duì)所計(jì)算出的結(jié)果是無(wú)法保證精度的。
5.2 坐標(biāo)映射
利用求得的H矩陣,可以將待匹配的圖像映射到基準(zhǔn)圖像中。為避免圖像映射過(guò)去出現(xiàn)較多黑洞的情況,本文選用逆映射的方法。
此外,在坐標(biāo)映射的過(guò)程中,會(huì)導(dǎo)致一種必然出現(xiàn)的情況:原來(lái)在整數(shù)網(wǎng)格上的點(diǎn)(x、y坐標(biāo)都是整數(shù)),在映射之后沒(méi)有落在網(wǎng)格點(diǎn)上,本文通過(guò)雙線性插值算法[6]將計(jì)算對(duì)應(yīng)的值。
6 圖像融合
如果直接對(duì)這樣的圖像進(jìn)行簡(jiǎn)單的疊加拼合,得到的拼接圖在拼接位置上就會(huì)存在明顯的接縫以及重疊區(qū)域模糊和失真現(xiàn)象[3]。為了得到無(wú)縫的高清晰圖像,就要對(duì)匹配后的聲納圖像進(jìn)行融合處理。本文中采用的融合策略為:通過(guò)融合算法使圖像重疊部分融合,消除融合圖像之間的拼接接縫,實(shí)現(xiàn)聲納圖像的無(wú)縫拼接。
本文選用加權(quán)平滑算法[7]來(lái)實(shí)現(xiàn)圖像重疊部分的融合。
如圖2所示,相鄰兩幀圖像f1、f2在區(qū)間[x1,x2]上重疊,W1(x)、W2(x)為加權(quán)函數(shù),一個(gè)常用的加權(quán)函數(shù)如式,其中0?燮i?燮W,W為重疊區(qū)域的寬度。
(6)
那么融合后圖像f在區(qū)間(x,y)上點(diǎn)的像素值如式。
(7)
圖2 加權(quán)平滑算法示意圖
7 實(shí)驗(yàn)結(jié)果
為確保本算法的精度,本文進(jìn)行對(duì)應(yīng)的實(shí)驗(yàn)。圖3 (a)、(b)為原始聲納圖像。圖3(c)為經(jīng)本算法的拼接結(jié)果。
(a)原始圖像 (b)原始圖像 (c)拼接圖像
圖3 算法實(shí)驗(yàn)結(jié)果
圖3 (b)和(a)的特征點(diǎn)對(duì)數(shù)量分別為17和15,大于4,說(shuō)明特征較為明顯(圖中的孔狀信息可能為SURF特征)。圖3 (b)和(a)中的紅色矩形框區(qū)域?yàn)樵悸暭{圖像的公有特征物。圖(c)為其的拼接結(jié)果,該圖中的紅色矩形框區(qū)域融合較好,此外在各個(gè)方向上都有一定程度的擴(kuò)展。
8 結(jié)束語(yǔ)
本研究實(shí)現(xiàn)了一種基于SURF的聲納序列圖像拼接算法,通過(guò)實(shí)驗(yàn)驗(yàn)證了其有效性,有一定的實(shí)用性。本算法針對(duì)聲納圖像分辨率低的特點(diǎn),對(duì)特征點(diǎn)的提取以及特征點(diǎn)對(duì)的匹配都經(jīng)過(guò)了雙重校驗(yàn),保證了一定的精確度。但是本算法對(duì)于含有特征點(diǎn)比較少的聲納圖像的精確度無(wú)法保證,這也是下一步要研究的方向。
參考文獻(xiàn)
[1]K. Kim,N. Neretti,and N. Intrator,Mosaicing of acoustic camera images,IEE Proceedings on Radar,Sonar and Navigation,pp. 263-270,2005.
[2]邱敦國(guó),李勇.計(jì)算機(jī)圖像分析處理技術(shù)在理化檢測(cè)中的應(yīng)用[J].工具技術(shù),2003(5):46-48.
[3]陳金波,李恒宇,龔振邦,等.基于仿生機(jī)械云臺(tái)的聲納圖像拼接[J].應(yīng)用科學(xué)學(xué)報(bào),2012(2):158-164.endprint
摘 要:針對(duì)水下機(jī)器人采集的聲納圖像檢測(cè)范圍較小的問(wèn)題,文章提出了一種基于SURF的聲納圖像拼接算法。首先,對(duì)采集的聲納圖像進(jìn)行一定的預(yù)處理,去除噪聲并調(diào)整聲納圖像的對(duì)比度;其次,對(duì)處理后的圖像提取SURF特征點(diǎn);然后,利用得到的特征點(diǎn)對(duì)求解單應(yīng)矩陣并進(jìn)行坐標(biāo)映射;最后,對(duì)拼接圖像進(jìn)行圖像融合。實(shí)驗(yàn)表明:該算法在含有較多特征點(diǎn)的聲納圖像中具有較好的精度,實(shí)時(shí)性也較好。
關(guān)鍵詞:機(jī)器人;聲納;圖像
1 引言
圖像配準(zhǔn)和圖像融合是圖像拼接的2個(gè)關(guān)鍵技術(shù),圖像配準(zhǔn)是圖像融合的基礎(chǔ),而且圖像配準(zhǔn)算法的計(jì)算量一般非常大,因此圖像拼接技術(shù)的發(fā)展很大程度上取決于圖像配準(zhǔn)技術(shù)的創(chuàng)新[1]。本文針對(duì)聲納圖像拼接應(yīng)滿足實(shí)時(shí)性要求這一條件,提出了一種基于SURF[3]的聲納序列圖像拼接方法,圖1為該算法的基本流程。
圖1 基于SURF算法的聲納序列圖像拼接流程
2 圖像預(yù)處理
圖像預(yù)處理是特征提取的基礎(chǔ),預(yù)處理結(jié)果的好壞將影響特征提取的效果,因此為了完成水下聲納圖像目標(biāo)特征的提取任務(wù),要對(duì)圖像進(jìn)行必要的預(yù)處理。
基于聲納圖像具有較強(qiáng)的高斯噪聲,信噪比較低的特點(diǎn),應(yīng)對(duì)聲納圖形進(jìn)行圖像去噪。本文采取高斯平滑算法,高斯平滑能較好的去除高斯噪聲[2]。
針對(duì)聲納圖像分辨率比較低的問(wèn)題,本文采用灰度拉伸算法改善圖像的對(duì)比度。通過(guò)對(duì)比度拉伸可增強(qiáng)圖像中監(jiān)測(cè)目標(biāo)的特征信息。
3 基于SURF的特征點(diǎn)檢測(cè)與描述
本文結(jié)合聲納圖像的特點(diǎn),將SURF特征檢測(cè)算法引入到聲納圖像拼接過(guò)程中,實(shí)現(xiàn)特征點(diǎn)的自動(dòng)提取。該算法是由Herbert Bay、Tinne Tuytelaars和Luc Van Gool所提出來(lái)的一種特征檢測(cè)算法。
基于SURF的特征提取算法具體實(shí)現(xiàn)步驟如下:
(1)將聲納圖像轉(zhuǎn)換成積分圖像。對(duì)于積分圖像中某點(diǎn)X,X=X(x,y),該點(diǎn)的值用I?撞(X)表示計(jì)算如公式(1)所示。
(1)
(2)利用Hessian矩陣計(jì)算圖像的興趣點(diǎn)。計(jì)算圖像中一點(diǎn)在不同尺度下的Hessian矩陣行列式的局部最大值。圖像中任意一點(diǎn)X(x,y),該點(diǎn)在尺度?滓下的Hessian矩陣定義為
(2)
式中:Lxy(X,?滓)表示高斯二階偏導(dǎo)在X處的卷積。Lxy(X,?滓)、Lxy(X,?滓)具有相似的含義。
(3)構(gòu)建尺度空間。采用不斷增大盒子濾波模板的尺寸建立圖像金字塔。
(4)特征點(diǎn)的確定。通過(guò)篩選濾波響應(yīng)并對(duì)篩選的點(diǎn)進(jìn)行處理,將每一個(gè)篩選的點(diǎn)與同尺度的8個(gè)像素點(diǎn)和上下相鄰尺度各9個(gè)點(diǎn)一共26個(gè)點(diǎn)進(jìn)行比較,求得局部極大值點(diǎn)即為特征點(diǎn)。
(5)特征點(diǎn)的描述。分別求出特征點(diǎn)在x、y方向上的梯度,以這兩個(gè)方向?yàn)樽鴺?biāo)軸建立坐標(biāo)系,將個(gè)點(diǎn)的響應(yīng)映射到坐標(biāo)系中,累加在各方向一定范圍內(nèi)的小波響應(yīng),將獲得最大響應(yīng)的方向確定為梯度的主方向,并且在主方向上建立特征點(diǎn)的描述向量。最終得到每個(gè)特征點(diǎn)的64維特征向量。
4 特征點(diǎn)匹配
當(dāng)兩幅圖像的SURF特征向量生成后,本文采用特征向量間歐式距離(3)作為兩幅圖像中特征點(diǎn)的相似性判定度量。
(3)
其中,d(X,Y)表示特征向量間的歐式距離;X=(x1,x2,x3,…xN)表示圖像X中任意一點(diǎn);Y=(y1,y2,y3,…yN)表示圖像Y中任意一點(diǎn);i表示描述子向量中第i個(gè)分量;xi、yi分別表示圖像X、Y描述子向量的第i個(gè)分量;N為特征向量的維數(shù),這里N=64。首先取參考圖像的某個(gè)特征點(diǎn)并在待匹配圖像中找出與該點(diǎn)歐式距離最近和次近的兩個(gè)特征點(diǎn),如果最近距離的平方與次近距離平方的比例小于75%,則認(rèn)為最近的這一對(duì)特征點(diǎn)為對(duì)應(yīng)的匹配對(duì)。遍歷參考圖像中的特征點(diǎn),找出所有潛在的匹配點(diǎn)對(duì)。
5 單應(yīng)矩陣求解以及坐標(biāo)映射
5.1 圖像單應(yīng)矩陣的求解
在聲納DIDSON實(shí)際拍攝過(guò)程中,近似滿足透視變換模型。兩幅圖像之間的對(duì)應(yīng)關(guān)系可以由一個(gè)3×3的平面透視變換矩陣來(lái)表示: X1=H21X2 (4)
式中,X1可以表示為(x1,y1,1)T,X2可以表示為(x2,y2,1)T,(x1,y1)和(x2,y2)是一對(duì)匹配點(diǎn);單應(yīng)矩陣H是一個(gè)3×3的滿秩矩陣,可以表示為:
(5)
通過(guò)前面提到的特征點(diǎn)匹配方法,已經(jīng)得到了N個(gè)匹配點(diǎn)對(duì),注意這里的N?叟4才可以計(jì)算單應(yīng)矩陣H,計(jì)算單應(yīng)矩陣最少需要4個(gè)匹配點(diǎn)對(duì)就可以,但是僅用4個(gè)匹配點(diǎn)對(duì)所計(jì)算出的結(jié)果是無(wú)法保證精度的。
5.2 坐標(biāo)映射
利用求得的H矩陣,可以將待匹配的圖像映射到基準(zhǔn)圖像中。為避免圖像映射過(guò)去出現(xiàn)較多黑洞的情況,本文選用逆映射的方法。
此外,在坐標(biāo)映射的過(guò)程中,會(huì)導(dǎo)致一種必然出現(xiàn)的情況:原來(lái)在整數(shù)網(wǎng)格上的點(diǎn)(x、y坐標(biāo)都是整數(shù)),在映射之后沒(méi)有落在網(wǎng)格點(diǎn)上,本文通過(guò)雙線性插值算法[6]將計(jì)算對(duì)應(yīng)的值。
6 圖像融合
如果直接對(duì)這樣的圖像進(jìn)行簡(jiǎn)單的疊加拼合,得到的拼接圖在拼接位置上就會(huì)存在明顯的接縫以及重疊區(qū)域模糊和失真現(xiàn)象[3]。為了得到無(wú)縫的高清晰圖像,就要對(duì)匹配后的聲納圖像進(jìn)行融合處理。本文中采用的融合策略為:通過(guò)融合算法使圖像重疊部分融合,消除融合圖像之間的拼接接縫,實(shí)現(xiàn)聲納圖像的無(wú)縫拼接。
本文選用加權(quán)平滑算法[7]來(lái)實(shí)現(xiàn)圖像重疊部分的融合。
如圖2所示,相鄰兩幀圖像f1、f2在區(qū)間[x1,x2]上重疊,W1(x)、W2(x)為加權(quán)函數(shù),一個(gè)常用的加權(quán)函數(shù)如式,其中0?燮i?燮W,W為重疊區(qū)域的寬度。
(6)
那么融合后圖像f在區(qū)間(x,y)上點(diǎn)的像素值如式。
(7)
圖2 加權(quán)平滑算法示意圖
7 實(shí)驗(yàn)結(jié)果
為確保本算法的精度,本文進(jìn)行對(duì)應(yīng)的實(shí)驗(yàn)。圖3 (a)、(b)為原始聲納圖像。圖3(c)為經(jīng)本算法的拼接結(jié)果。
(a)原始圖像 (b)原始圖像 (c)拼接圖像
圖3 算法實(shí)驗(yàn)結(jié)果
圖3 (b)和(a)的特征點(diǎn)對(duì)數(shù)量分別為17和15,大于4,說(shuō)明特征較為明顯(圖中的孔狀信息可能為SURF特征)。圖3 (b)和(a)中的紅色矩形框區(qū)域?yàn)樵悸暭{圖像的公有特征物。圖(c)為其的拼接結(jié)果,該圖中的紅色矩形框區(qū)域融合較好,此外在各個(gè)方向上都有一定程度的擴(kuò)展。
8 結(jié)束語(yǔ)
本研究實(shí)現(xiàn)了一種基于SURF的聲納序列圖像拼接算法,通過(guò)實(shí)驗(yàn)驗(yàn)證了其有效性,有一定的實(shí)用性。本算法針對(duì)聲納圖像分辨率低的特點(diǎn),對(duì)特征點(diǎn)的提取以及特征點(diǎn)對(duì)的匹配都經(jīng)過(guò)了雙重校驗(yàn),保證了一定的精確度。但是本算法對(duì)于含有特征點(diǎn)比較少的聲納圖像的精確度無(wú)法保證,這也是下一步要研究的方向。
參考文獻(xiàn)
[1]K. Kim,N. Neretti,and N. Intrator,Mosaicing of acoustic camera images,IEE Proceedings on Radar,Sonar and Navigation,pp. 263-270,2005.
[2]邱敦國(guó),李勇.計(jì)算機(jī)圖像分析處理技術(shù)在理化檢測(cè)中的應(yīng)用[J].工具技術(shù),2003(5):46-48.
[3]陳金波,李恒宇,龔振邦,等.基于仿生機(jī)械云臺(tái)的聲納圖像拼接[J].應(yīng)用科學(xué)學(xué)報(bào),2012(2):158-164.endprint