楊真真,匡 楠,楊永鵬,許鵬飛
(1.南京郵電大學 通信與網(wǎng)絡技術國家工程研究中心,江蘇 南京 210003 2.南京信息職業(yè)技術學院 網(wǎng)絡與通信學院,江蘇 南京 210023)
圖像配準[1]是指同一目標的兩幅或者兩幅以上的圖像在空間位置的對準。目前,圖像配準作為圖像處理的基本步驟,已被廣泛應用于醫(yī)學圖像拼接與融合[2]、目標檢測 與定位[3]、圖像分割[4]等領域。
主流的圖像配準方法分為兩類,基于待配準圖像全像素信息[5-7]的配準方法以及基于待配準圖像特征信息[8-10]的配準方法。其中,基于待配準圖像像素信息的配準方法以圖像全體像素信息為依據(jù),建立待配準圖像和參考圖像之間的相似性度量準則,利用某種搜索算法,尋找出使得相似度量達到最優(yōu)值的變換模型參數(shù);基于待配準圖像特征信息的配準方法只需要提取待配準圖像中的點、線、邊緣等特征信息,不需要其他輔助信息,在減少計算量、提高效率的同時,能夠對圖像灰度的變化有一定的魯棒性。根據(jù)選擇的特征信息不同,把基于特征的圖像配準方法分為三類:(1)基于特征點的配準[11-12]:一般所選取的特征點是相對于其鄰域表現(xiàn)出來具有某種奇異性的像素點。特征點往往很容易被提取到,但是特征點所包含的信息相對較少,只能反映出其在圖像中的位置坐標信息,所以在兩幅圖像中尋找匹配的特征點是關鍵所在;(2)基于特征區(qū)域的配準[13-14]:在圖像中尋找某些明顯的區(qū)域信息作為特征區(qū)域,然而在實際應用中尋找到特征區(qū)域后,采用最多的還是區(qū)域的形心點,所以這類算法要求特征區(qū)域提取的精度要非常高;(3)基于特征邊緣的配準[15-16]:圖像中最明顯的特征就是邊緣,而邊緣特征也是最好提取的特征之一。因此給予邊緣的匹配方法魯棒性較強,適用范圍很廣,但這類方法對特征邊緣的提取要求很高,并且要求邊緣信息全部用數(shù)學語言予以表述也較為困難。
總的來說,基于待配準圖像整體像素信息的配準方法精度更高,但計算復雜度高,對圖像的灰度變化敏感,抗噪性能較差;基于待配準圖像特征信息的配準方法計算復雜度相對較低,但配準性能的好壞很大程度依賴于特征匹配的精度。
本文所采用的配準方法是基于特征點描述子的配準方法,該方法通常需要以下四個步驟:(1)提取圖像中的特征點:特征點從總體上說是在圖像領域或視覺領域中一些有別于其周圍的地方,具有很高的區(qū)分度,應當具有可重復性、可區(qū)分性、準確性、有效性(特征的數(shù)量、特征提取的效率)、魯棒性(穩(wěn)定性、不變性)。常見的特征點提取方法有尺度不變特 征 變 換 (Scale-Invariant Feature Transform,SIFT)[17]、加速分割檢測特征(Features from Accelerated Segment Test,F(xiàn)AST)[18]和 加 速 魯 棒 性 特 征(Speeded Up Robust Features,SURF)[19]等。(2)計算特征描述子:該步驟旨在對上述檢測的特征點進行描述,通常對每個特征點采用一維向量進行特征描述,描述子的選取直接決定了圖像匹配及配準的性能。(3)根據(jù)特征描述子,進行點對點匹配:根據(jù)某種搜索算法,確定點與點之間的最優(yōu)匹配。常見的匹配算法有基于閾值[20]、基于最近鄰[21]、基于距離比例最近鄰[22]等。(4)根據(jù)匹配點對估計圖像的變換矩陣:由于可能存在大量誤匹配對,故在進行估計圖像變換矩陣之前,有必要根據(jù)某種準則進行誤匹配點對刪除。譬如,使用基于隨機采樣一致性(Random Sample Consensus,RANSAC)[23]算法來去除誤匹配特征點對往往效果較好。此外,良好的估計算法一定程度上也對圖像配準精度產(chǎn)生一定影響。
為了解決基于特征點描述子配準方法的精度及魯棒性差等問題,從特征描述子入手,以期改善其性能。
特征描述子的核心問題是不變性和可區(qū)分性。在配準中使用圖像特征描述子時,通常是為了魯棒地處理各種圖像變換的情況。因此,在構建描述子時需考慮尺度不變性、旋轉不變性、平移不變性以及對噪聲的不變性。此外,對于除了特定任務中特征描述子需考慮的不變性外,其他性質需盡可能有區(qū)分性。譬如,在圖像配準中,需要對參考圖像及浮動圖像中特征點進行匹配,此時不對應特征點描述內(nèi)容需盡可能不一致,同時保證對應特征點描述內(nèi)容一致。然而,特征描述子的可區(qū)分性的強弱往往和其不變性是矛盾的,一個優(yōu)秀的特征描述子,需保證在特定任務中要求的特征描述不變性,同時具有很強的區(qū)分度。SURF[19]統(tǒng)計特征點圓形鄰域的haar小波[24]特征,該描述子通過構建尺度空間及確定特征主方向來保證描述子的旋轉不變性和尺度不變性,是一種性能優(yōu)異的描述子。蜘蛛網(wǎng)局部圖像特征(Spider Local Image Feature,SLIF)[25]是一種根據(jù)仿生學原理提出的描述子,該描述子在不增加計算量的同時,采樣面積更大,且其采樣范圍和采樣點數(shù)(密度)根據(jù)實際情況可調(diào),其采樣模型十分具有借鑒意義。
本文充分考慮了SLIF描述子采樣模型的優(yōu)勢,將其用于所提方法的采樣模型結構。同時,由于圖像配準要求其特征點匹配的精度更高,對其描述子從鄰域結構及描述方式兩個方向進行改進,以期獲得更好的特征點匹配及圖像配準效果。在使用SLIF采樣結構基礎之上,增加了方形、環(huán)形、徑向鄰域信息的描述,對圖像空間結構信息的捕捉能力大大增強;此外,不同于SLIF描述子構建方法,本文利用局部區(qū)域內(nèi)物體灰度值具有自相似性的特征構建描述方法,并引入局部圖像鄰域的標準差作為判斷自相似性的自適應閾值。
蜘蛛網(wǎng)局部圖像特征(SLIF)描述子是一種具有尺度和旋轉不變性的描述子,該方法的提出者根據(jù)仿生學原理提出了一種新型鄰域采樣結構,在特征點匹配的精度上卓有成效。
SLIF采樣模型如圖1所示,圖示坐標點以(n,m)表示,其中n代表采樣模型的螺旋線狀坐標位置,m代表采樣模型的徑向坐標位置。
其節(jié)點在笛卡爾坐標系下的表示如下
其中,M和N分別為最大徑向采樣點數(shù)和最大螺旋線上采樣點數(shù),需人工指定;坐標向量的第一維為橫坐標,第二維為縱坐標。
其中,xi和yi分別為特征點(描述子中心)橫坐標和縱坐標,即檢測出的特征點位置;σi為特征點尺度因子,該因子由特征點檢測算法提供;θi為特征點方向因子,該因子可由特征點檢測算法提供,亦可根據(jù)文獻[25]所提供方法獲得;K>0為一個可調(diào)自由變量,該變量決定了特征描述子的作用范圍。
SLIF采用一種新型的鄰域采樣模型構建了一種具有旋轉和尺度不變性的描述子,在圖像匹配領域性能優(yōu)良,但是由于其描述子從局部來講為8鄰域的LBP描述子,存在對噪聲敏感、無法捕捉宏觀信息等問題,故將其用于圖像配準領域仍存在一定缺陷。本文從描述子構建方法對其做了相應改進,能夠同時整合宏觀信息和微觀信息,使其在相同配準框架下配準精度顯著提高。
為了能夠捕捉采樣模型的整體采樣節(jié)點信息,首先構建一個基于全局標準差的鄰域描述方法,其公式如下所示
為了能夠捕捉采樣模型的徑向采樣節(jié)點信息,構建一個基于徑向標準差的徑向鄰域描述方法,其公式如下
為了能夠捕捉采樣模型的環(huán)形采樣節(jié)點信息,構建一個基于環(huán)形標準差的環(huán)形鄰域描述方法,其格式如下
首先,說明SLIF描述子構建方法存在的缺陷,圖2闡述了式(3)的描述子構建方法。
該描述方法試圖利用中心點與鄰域像素點大小關系構建中心點特征值,能夠很好地捕捉區(qū)域內(nèi)與中心點像素值差異較大的像素點信息。但是,大多數(shù)圖像的鄰域像素值往往與中心點像素值差異不大,具有區(qū)域塊的自相似性。此時,若采用中心點與鄰域像素點大小關系構建中心點特征值,其描述方法顯得十分不合理。其次,該描述方法很大程度依賴于中心點像素值,若中心點像素值受噪聲干擾或其描述領域有光照不均勻等環(huán)境噪聲,其偏差較大,此時若有一個自適應的誤差調(diào)整項顯得十分必要。
因此,結合如上描述方法的優(yōu)缺點,采用基于全局標準差的鄰域描述、基于徑向標準差的徑向鄰域描述和基于環(huán)形標準差的環(huán)形鄰域描述方法重構采樣點描述方法,下面分別以圖示的方式闡述式(5)、式(7)和式(9)的描述子構建方法。
圖3~5分別直觀展示了式(5)、式(7)和式(9)所示方法。圖3(a)為鄰域范圍內(nèi)原始圖像像素大??;圖3(b)為鄰域像素與其中心像素的絕對值之差;圖3(c)為根據(jù)閾值最終形成的二值化序列。圖3(b)→圖3(c)的閾值為圖3(a)中全體像素點計算而得的標準差。圖3(c)的二值化序列由中心點鄰域范圍內(nèi)左上角按順時針方向組成,記pw()為25((00011001)2→(25)10);圖4(c)的二值化序列自底向上組成,記pr(xin,m)為152((10011000)2→(152)10);圖5(c)的二值化序列由中心點逆時針方向第5個點起按順時針方向形成,記pc(xin,m)為145((10010001)2→(145)10)。最終一個特征點在圓蛛網(wǎng)狀采樣模型下從三種不同結構狀態(tài)得以描述。
提出的描述子相較于SLIF描述子具有如下優(yōu)勢:(1)在圓蛛網(wǎng)狀采樣模型下,從三種不同鄰域采樣模型對采樣點周圍像素信息加以描述。相較于SLIF僅從采樣點周圍8鄰域范圍內(nèi)像素信息進行編碼描述,提出的描述子還從采樣點在圓蛛網(wǎng)狀模型范圍內(nèi)環(huán)形像素點及徑向像素點加以描述,其描述內(nèi)容更加豐富;(2)使用中心采樣點與其周圍采樣點差分像素值的一致性對其鄰域進行描述。相較于SLIF描述子僅僅考慮周圍采樣點與中心采樣點的大小關系來構建描述,提出的方法更多地考慮了區(qū)域范圍內(nèi)像素信息的一致性與不一致性的區(qū)分度,即自相似性。該性質符合大多數(shù)圖像存在的一致性,即圖像中同一物體往往具有相似甚至相同的像素值;(3)使用標準差做自適應閾值作為二值化編碼描述子的判斷條件。相較于SLIF描述子僅僅依照中心采樣點與其周圍采樣點差分像素值是否大于或者小于0作為二值化編碼描述子的判斷條件,提出利用參與編碼的采樣點標準差作為判斷鄰域采樣點是否與中心采樣點滿足自相似性來構建描述子。該閾值的設計根據(jù)周圍像素點一致性情況(標準差能很好地反映樣本的一致性信息)來自適應調(diào)節(jié)一致性標準。若樣本范圍內(nèi)標準差過大,則適當放寬一致性標準。該設計也是符合視覺直覺的,雖然圖像中物體的像素信息較為相似,但很少完全一致,即使完全一致,由于光照不均勻等環(huán)境噪聲的存在,其拍攝的圖像也會存在局部色差。故該設計增強了描述子的魯棒性。
此外,在設計過程中也汲取了SLIF描述子的優(yōu)點,在采樣點數(shù)相同的情況下,其圓蛛網(wǎng)狀采樣模型采樣鄰域更廣;其次,該采樣模型的采樣范圍、采樣點數(shù)都是可調(diào)的,以適應不同場景的要求(式(2)的參數(shù)K調(diào)節(jié)采樣范圍,M、N調(diào)節(jié)采樣點的個數(shù))。
為了測試提出的描述子在特征提取及配準方面有較好的性能,設計了如下實驗來證明其有效性。
為了證明所提描述方法在基于特征提取配準方法中有更好的精度,將本文提出的描述方法與SLIF描述子和SURF描述子作對比。不同描述子所采用的特征提取方法及特征匹配準則有差異??紤]到實驗的公平性,均采用SURF特征點提取方法及最近鄰匹配準則且不采用誤匹配點消除策略。其中,本文方法所采用的參數(shù)為:K=10,M=0,N=9,SLIF及SURF描述子均采用默認參數(shù)。
特征描述及配準圖像來自于RIRE[26]中patient-001 CT大腦切片圖像,對圖像分別進行了旋轉及平移變換。其中,表1為旋轉圖像描述子性能比較,其測試的旋轉的范圍為[-30°,30°](旋轉中心為圖像中心點)。表2為平移圖像描述子性能比較,其測試的水平方向及垂直方向位移范圍均為[-20,20]像素。表1、表2所示評估指標均為選取12組隨機值進行測試的平均值。
表1測試了本文提出的描述子在旋轉圖像上特征描述及配準的性能。從表1可發(fā)現(xiàn),本文算法的平均召回率為0.492,比SLIF高0.017;與此同時,其平均錯誤率為0.022,遠低于其他算法。由于根據(jù)本文提出的描述子得到的匹配特征點誤差較小,故得到的配準圖像角度偏差也優(yōu)于SLIF??梢?,本文提出的描述子在旋轉圖像上的性能優(yōu)于SLIF及SURF。
表1 旋轉圖像描述子性能比較
表2測試了本文提出的描述子在平移圖像上特征描述及配準的性能。從表2可發(fā)現(xiàn),三種算法的召回率相似,但本文算法的特征點匹配的平均錯誤率最低,為0.022。與此同時,經(jīng)本文提出的描述子配準的水平方向及垂直方向誤差均為最低??梢?,本文提出的描述子在平移圖像上的性能也優(yōu)于SLIF和SURF。
表2 平移圖像描述子性能比較
為了證明所提出的描述方法對噪聲具有良好的魯棒性,且其具有媲美全像素配準方法的精度,選取了基于全像素誤差平方和(Sum of Squared Differences,SSD)配準方法[27-28]以及基于全像素互相關(Cross Correlation,CC)配準方法[29-30]作為對比實驗。由于基于SLIF特征點描述符配準算法在抗噪聲實驗方面性能較差[25,31],所以不把該算法作為對比算法。選取CT大腦圖像作為測試數(shù)據(jù)集,其參考圖像均無噪聲,浮動圖像分別加入高斯、椒鹽和泊松噪聲。如圖6所示,圖6(a)為干凈的參考圖像,圖6(b)至圖6(d)為經(jīng)平移的浮動圖像,其相對于參考圖像的水平偏移量均為24像素,垂直偏移量均為22像素。其中圖6(b)加入了均值為0、方差為0.01的高斯噪聲,圖6(c)加入了椒鹽噪聲,圖6(d)圖加入了泊松噪聲。
為了使基于本文提出的描述子特征配準算法具有更優(yōu)越的性能,在使用最近鄰算法完成特征匹配后,利用RANSAC算法[23]剔除誤匹配特征點,以此提高精度。
下面以圖6中參考圖像(a)及浮動圖像(b)(含高斯噪聲)為例,展示本文描述子的特征點匹配及配準效果,圖6(e)為特征點匹配效果示意圖,經(jīng)過本文提出的描述子及誤匹配點消除算法后,其特征點匹配效果良好。經(jīng)空間變換矩陣估計的旋轉平移變換矩陣得到的配準效果圖如圖6(f)所示。
本文提出的算法在高斯噪聲、泊松噪聲及椒鹽噪聲圖像配準的性能指標分別如表3和表4所示。其中表3為僅進行平移的配準實驗,表4為僅進行旋轉的配準實驗,其旋轉角度為順時針方向15°。
表3 不同噪聲下平移圖像配準性能比較
表4 不同噪聲下旋轉圖像配準性能比較
由表3和表4可以看出,本文算法得到的精度和配準時間均遠遠好于SSD及CC配準算法。其中,含有椒鹽噪聲的圖像使用基于全像素的SSD算法并不能完成配準。對比表3和表4中各種不同噪聲的配準實驗,可以發(fā)現(xiàn)相對于高斯噪聲和泊松噪聲,椒鹽噪聲圖像配準精度相對較低,其精確配準難度相對較大。
針對SLIF描述子鄰域結構選擇過于單一,描述方法過于簡單,本文提出了一種改進的SLIF描述子用于圖像配準。提出的描述子的描述鄰域由原本單一的方形鄰域擴展為方形鄰域、環(huán)形鄰域及徑向鄰域,其描述能力大大增強。此外,利用圖像區(qū)域內(nèi)像素點存在相似性的特點,構建了基于像素差分信息的描述方法,并利用鄰域范圍內(nèi)的標準差作為自適應閾值來衡量相似度,很好地增強了描述的魯棒性。實驗表明,基于本文提出的描述子的配準方法對比其他基于特征描述的配準方法和基于全像素信息的配準方法,其性能更加優(yōu)異。