袁慶升,靳國(guó)慶,張冬明,包秀國(guó)
(1. 國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心,北京 100029;2. 中國(guó)科學(xué)院計(jì)算技術(shù)研究所,北京 100190;3. 中國(guó)科學(xué)院大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,北京 100049;4. 中國(guó)科學(xué)院信息工程研究所,北京 100193)
隨著互聯(lián)網(wǎng)圖像數(shù)量迅速增長(zhǎng),對(duì)海量圖像進(jìn)行內(nèi)容分析與檢測(cè)的需求越來(lái)越大,基于內(nèi)容的圖像檢索技術(shù)成為研究熱點(diǎn)。這些技術(shù)通常使用局部特征作為圖像內(nèi)容的描述,這是由于局部特征具有良好的區(qū)分性,對(duì)圖像的多種變換,如遮擋、模糊、噪聲、剪切等,具有較高的穩(wěn)定性。局部特征的提取主要分為2個(gè)步驟:1) 特征點(diǎn)的提取,提取的信息包括特征點(diǎn)位置、特征點(diǎn)主方向、特征點(diǎn)尺度信息等;2) 局部特征點(diǎn)描述子的計(jì)算,即依據(jù)特征點(diǎn)周圍的像素信息,計(jì)算其對(duì)旋轉(zhuǎn)、光照、尺度等變化頑健的特征,提取到的特征通常以向量表示,能有效描述特征點(diǎn)。
常見(jiàn)的局部特征點(diǎn)描述子主要分為2種:實(shí)數(shù)描述子和二進(jìn)制描述子。實(shí)數(shù)描述子提取復(fù)雜,在內(nèi)存和磁盤上以浮點(diǎn)數(shù)的形式存儲(chǔ),對(duì)存儲(chǔ)要求高且不能滿足實(shí)時(shí)性需求。二進(jìn)制特征描述子使用二進(jìn)制位進(jìn)行編碼,計(jì)算簡(jiǎn)單且占用的存儲(chǔ)空間小,適合實(shí)時(shí)性要求高的應(yīng)用場(chǎng)景。常用的二進(jìn)制描述子主要有BRIEF(binary robust independent elementary features)[1]、ORB(oriented FAST and rotated BRIEF)[2]、BRISK(binary robust invariant scalable keypoint)[3]、FREAK(fast retina keypoint)[4]等。
BRIEF通過(guò)隨機(jī)選擇點(diǎn)對(duì)而得到二進(jìn)制描述子,計(jì)算速度快[1],但是其對(duì)旋轉(zhuǎn)和尺度變化敏感,在不同數(shù)據(jù)集下檢索性能差異大。BRISK拋棄了隨機(jī)采樣模式,提出類似 Daisy[5]的采樣方式,以特征點(diǎn)為圓心,在半徑依次增大的同心圓上均勻采樣候選點(diǎn),同心圓上候選點(diǎn)采樣密度從中心開始均勻下降,這在一定程度上增強(qiáng)了對(duì)噪聲的頑健性。FREAK則模仿視網(wǎng)膜特性在BRISK技術(shù)上進(jìn)一步引入了多尺度平滑[4]。李兵等對(duì)BRIEF進(jìn)行改進(jìn),不同于ORB特征使用區(qū)域質(zhì)心計(jì)算主方向,該方法通過(guò)在特征點(diǎn)鄰域內(nèi)均勻采樣8對(duì)對(duì)稱子區(qū)域,然后累加各子區(qū)域以其像素均值加權(quán)的梯度方向作為主方向,從而實(shí)現(xiàn)了描述子對(duì)旋轉(zhuǎn)的不變性[6]。朱英宏等通過(guò)提取特征點(diǎn)鄰域內(nèi)33個(gè)像素點(diǎn)的二進(jìn)制紋理特征,得到一個(gè)132 bit的二進(jìn)制描述子[7]。盧鴻波等在特征點(diǎn)鄰域內(nèi)選取R個(gè)同心圓,每個(gè)圓上采樣N個(gè)像素點(diǎn),然后使用同心圓層內(nèi)編碼和層間編碼的方式得到一個(gè)2RN bit的二進(jìn)制描述子[8]?;輫?guó)保等研究了不同采樣模式和不同高斯平滑半徑對(duì)二進(jìn)制描述子的影響,提出了一種內(nèi)密外疏的采樣模式[9]。
此外,近年來(lái)研究者們還提出了很多基于有監(jiān)督學(xué)習(xí)的二進(jìn)制特征生成方法。RFD(receptive fields selection)特征[10]對(duì)多個(gè)子區(qū)域的實(shí)值特征進(jìn)行量化構(gòu)建二進(jìn)制特征,子區(qū)域的選擇和量化閾值通過(guò)學(xué)習(xí)得到。BinBOOST[11]特征則是通過(guò)學(xué)習(xí)多個(gè)弱分類器組合成一個(gè)強(qiáng)分類器,用分類器來(lái)判斷二進(jìn)制位取值為0或1,采用的弱分類器形式是量化函數(shù)。RFD特征和BinBOOST特征在本質(zhì)上都是通過(guò)有監(jiān)督學(xué)習(xí)的方式對(duì)實(shí)值特征進(jìn)行量化來(lái)得到二進(jìn)制描述子。隨著深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolution neural network)[12]在圖像分類上快速發(fā)展,也出現(xiàn)了許多基于深度學(xué)習(xí)提取二進(jìn)制描述子的算法[13-15],這類方法不同于上述局部的二進(jìn)制描述子,獲得的是圖像的全局二進(jìn)制描述,缺少描述圖像底層細(xì)節(jié)的有用信息,且計(jì)算復(fù)雜度高,提取描述子時(shí)需要占用大量?jī)?nèi)存,效率低。
本文綜合考慮采樣點(diǎn)選擇和描述子生成,基于視網(wǎng)膜的視神經(jīng)細(xì)胞分布和感知特性,研究二進(jìn)制描述子生成方法。特別地,針對(duì)特征點(diǎn)對(duì)頑健性低的問(wèn)題,提出了模仿視網(wǎng)膜特性的采樣模式。對(duì)比同樣模仿視網(wǎng)膜特性的 FREAK[4]描述子,本文方法二進(jìn)制描述子的生成過(guò)程不同。本文所提出的采樣模式混合使用多尺度光滑、視野重疊等模仿視網(wǎng)膜特性,且通過(guò)數(shù)據(jù)實(shí)驗(yàn)對(duì)關(guān)鍵參數(shù)進(jìn)行優(yōu)化,同時(shí)還提出了基于學(xué)習(xí)的方法,在典型數(shù)據(jù)集上對(duì)最終采樣點(diǎn)對(duì)進(jìn)行選擇。所提方法具有計(jì)算快速、占用內(nèi)存少、頑健性高的優(yōu)點(diǎn),且匹配正確率有明顯提高。
圖像局部二進(jìn)制特征提取包括特征點(diǎn)檢測(cè)和描述子提取。特征點(diǎn)檢測(cè)往往需要在多個(gè)尺度空間上進(jìn)行極值點(diǎn)檢測(cè),以應(yīng)對(duì)圖像的尺度變化,保證特征點(diǎn)的可重復(fù)性。描述子提取是在特征點(diǎn)檢測(cè)的基礎(chǔ)上進(jìn)行的,通常依據(jù)特征點(diǎn)周圍的像素分布按照預(yù)設(shè)計(jì)算模型生成一串特征數(shù)值,而二進(jìn)制描述子一般通過(guò)比較像素點(diǎn)之間亮度的大小來(lái)確定描述子取值,如式(1)所示。
其中,l為比較點(diǎn)對(duì)的數(shù)目,它決定二進(jìn)制描述子的最終長(zhǎng)度;點(diǎn)對(duì) Pi由 2個(gè)像素點(diǎn)和定義;T(Pi)表示點(diǎn)對(duì) 的比較結(jié)果,定義如式(2)所示。
其中,I(?)表示對(duì)應(yīng)點(diǎn)的灰度值。
由式(1)可以看出,二進(jìn)制描述子完全取決于點(diǎn)對(duì)的選擇,相應(yīng)地,描述子的區(qū)分能力和頑健性完全依賴特征點(diǎn)周圍的點(diǎn)對(duì)采樣模式。選擇好的采樣模式,一方面可以減少描述子長(zhǎng)度,即降低的取值,進(jìn)而降低計(jì)算量和內(nèi)存開銷;另一方面由此產(chǎn)生的二進(jìn)制描述子對(duì)各種常見(jiàn)的變化具有很好的頑健性,即不隨圖片尺度、方向及視角等變化而改變。本文根據(jù)視網(wǎng)膜的細(xì)胞分布特性,設(shè)計(jì)了相應(yīng)的候選點(diǎn)選取方式和點(diǎn)對(duì)采樣模式,從而獲得高性能的RBS(retina-imitation based sampling)特征。下面詳細(xì)介紹候選點(diǎn)選取方式、點(diǎn)對(duì)采樣模式以及RBS特征的生成方式。
候選點(diǎn)選擇方面,ORB和BRIEF采用隨機(jī)采樣,BRISK采用均勻采樣,F(xiàn)REAK使用類視網(wǎng)膜采樣,均取得了較大的性能提升。視網(wǎng)膜由3層神經(jīng)元組成。第一層神經(jīng)元是視細(xì)胞層,包括錐細(xì)胞和柱細(xì)胞,負(fù)責(zé)感光。第二層是雙節(jié)細(xì)胞,數(shù)量為十至數(shù)百個(gè),負(fù)責(zé)聯(lián)絡(luò)作用,視細(xì)胞通過(guò)雙節(jié)細(xì)胞與一個(gè)神經(jīng)節(jié)細(xì)胞相聯(lián)系。第三層是神經(jīng)節(jié)細(xì)胞層,將光信號(hào)轉(zhuǎn)化為視覺(jué)信號(hào),是實(shí)際的視覺(jué)神經(jīng),所以也稱為視神經(jīng)層。神經(jīng)科學(xué)的最近研究結(jié)果表明視覺(jué)神經(jīng)細(xì)胞的分布并非均勻分布,在視網(wǎng)膜中心視覺(jué)神經(jīng)細(xì)胞密度并不是很高,而在中心周圍密度急劇上升,再往外密度則快速下降,如圖 1所示[16]。視網(wǎng)膜中心位置叫做視網(wǎng)膜小凹,其中只有很少的細(xì)胞,但在這個(gè)凹槽周圍分布有大量的細(xì)胞,細(xì)胞數(shù)量與其到中心小凹的距離成反比。此外,視神經(jīng)層還具有類似高斯差分機(jī)制的感知特性,抽取信息的神經(jīng)節(jié)細(xì)胞位于視網(wǎng)膜外圍,而形成高層視覺(jué)信息的細(xì)胞位于視網(wǎng)膜中心。
圖1 人眼視網(wǎng)膜視神經(jīng)細(xì)胞分布
本文模仿視網(wǎng)膜視神經(jīng)層細(xì)胞的分布特性,設(shè)計(jì)了一種新型的候選點(diǎn)采樣模式。模擬視神經(jīng)層的細(xì)胞具有“低-高-低”的密度分布特性,通過(guò)實(shí)驗(yàn)選擇,確定對(duì)特征點(diǎn)采用5層采樣。具體地,以特征點(diǎn)為候選點(diǎn)中心,在中心外圍第一層候選點(diǎn)的密度比較低,在第二層候選點(diǎn)的密度最高,第三層~第五層候選點(diǎn)的密度呈指數(shù)下降。如圖2所示,中間點(diǎn)為特征點(diǎn),從內(nèi)向外每層采樣點(diǎn)數(shù)分別為 4、24、12、8、4。本文將這種采樣模式稱為 RBS。FREAK采樣點(diǎn)設(shè)置為6:6:6:6:6:6:6,共7層42個(gè)采樣點(diǎn);RBS采樣點(diǎn)設(shè)置為4:24:12:8:4,共5層52個(gè)采樣點(diǎn)。通過(guò)比較可知,RBS的特點(diǎn)如下:一方面采樣點(diǎn)數(shù)增加了10個(gè),增長(zhǎng)率為23.8%;另一方面突出特征點(diǎn)周圍像素點(diǎn)對(duì)描述子的作用,分布更貼合視網(wǎng)膜的細(xì)胞“低-高-低”的密度分布。
圖2 候選點(diǎn)分布
由于二進(jìn)制描述子是基于像素點(diǎn)之間的亮度比較,所以對(duì)噪聲較為敏感,為了降低噪聲的影響,對(duì)候選點(diǎn)進(jìn)行高斯模糊已成為通行做法。對(duì)于不同候選點(diǎn),BRIEF和ORB使用相同的高斯模糊半徑;而BRISK和FREAK使用不同的模糊半徑,更符合人眼視覺(jué)特性。本文模仿視神經(jīng)的感知特性,采用不同大小的高斯模糊半徑,中心模糊半徑最小,外圍候選點(diǎn)模糊半徑逐漸增大。通過(guò)匹配正確率實(shí)驗(yàn)對(duì)比,本文設(shè)定初始模糊半徑為2,層間相差為2。此外,本文還設(shè)計(jì)特殊的模糊范圍來(lái)改善模糊效果,同一層的模糊范圍保證一定的重疊,第二層和第三層的重疊面積最大,各層的重疊面積滿足“少-多-少”的規(guī)律。經(jīng)實(shí)驗(yàn),選定比例為1:4:3:2:1,進(jìn)一步提高平滑效果,多級(jí)高斯模糊如圖3所示。
圖3 多級(jí)高斯模糊示意
接下來(lái)研究如何從潛在的大量候選點(diǎn)對(duì)中選出最佳的比較點(diǎn)對(duì)。假設(shè)有n個(gè)候選點(diǎn),兩兩組合一共有個(gè)候選點(diǎn)對(duì)。為了提高特征頑健性,同時(shí)降低特征維數(shù),必須進(jìn)一步篩選以去除噪聲影響,同時(shí)消除強(qiáng)相關(guān)的點(diǎn)對(duì)。為此,本文提出從訓(xùn)練集中學(xué)習(xí)篩選比較點(diǎn)對(duì),從而確定最后的采樣模式,具體方法如下。
1) 在訓(xùn)練集上提取r個(gè)特征點(diǎn),每個(gè)特征點(diǎn)計(jì)算長(zhǎng)度為的描述子。這樣組成一個(gè)r行列的二進(jìn)制矩陣。在本文的實(shí)驗(yàn)中取n=53,則這個(gè)矩陣一共有1 378列。
2) 在上述矩陣中,每一行表示一個(gè)特征點(diǎn)描述子,每一列表示一個(gè)候選點(diǎn)對(duì)的所有計(jì)算結(jié)果,點(diǎn)對(duì)之間可能存在較強(qiáng)的相關(guān)性,導(dǎo)致某些列可能全為0或全為1。而如果某個(gè)候選點(diǎn)對(duì)的區(qū)分性高,則該列的按位均值應(yīng)接近 0.5。所以本文選取均值最接近 0.5的那一列記為c,把其所對(duì)應(yīng)的候選點(diǎn)對(duì)加入最終的比較點(diǎn)對(duì)集合。
3) 對(duì)剩下的所有列按照其均值與0.5的接近程度排序,計(jì)算各列與列c的余弦距離,選擇余弦距離大的列,把對(duì)應(yīng)點(diǎn)對(duì)加入最終點(diǎn)對(duì)集合。重復(fù)此步驟,直到選出M組點(diǎn)對(duì)。
通過(guò)上述方法選出的M組點(diǎn)對(duì)區(qū)分性較強(qiáng)、相關(guān)性低??梢钥闯觯疚姆椒ê虵REAK中方法類似,均采用構(gòu)建特征矩陣、降維方式,來(lái)獲取點(diǎn)對(duì)中對(duì)提升描述子區(qū)分力作用最顯著的點(diǎn)對(duì),本質(zhì)上是一種統(tǒng)計(jì)學(xué)習(xí)方法。但RBS得益于本文設(shè)計(jì)的采樣模式,可以消除更多的冗余點(diǎn)對(duì),構(gòu)建更短的二進(jìn)制描述子,并構(gòu)建了32、64、128、160 bit的描述子以適應(yīng)不同應(yīng)用場(chǎng)景,分別記為 RBS-32、RBS-64、RBS-128、RBS-160。圖4中列出了當(dāng)M設(shè)置為 32時(shí)選擇的部分點(diǎn)對(duì)。結(jié)果顯示點(diǎn)對(duì)選擇并沒(méi)有像FREAK那樣呈現(xiàn)明顯的對(duì)稱規(guī)律,這一方面是由于 32組點(diǎn)對(duì)數(shù)量偏少,另一方面也表明FREAK的點(diǎn)對(duì)中可能存在較大冗余。
為了使生成的二進(jìn)制描述子具有旋轉(zhuǎn)不變性,在提取特征點(diǎn)的二進(jìn)制描述子之前,首先將特征點(diǎn)鄰域旋轉(zhuǎn)至特征點(diǎn)主方向上,這里使用特征點(diǎn)鄰域的亮度質(zhì)心來(lái)計(jì)算特征點(diǎn)主方向。特征點(diǎn)鄰域的亮度質(zhì)心C的具體計(jì)算如式(3)~式(6)所示,其中I(x,y)表示點(diǎn)(x,y)上像素亮度值。
圖4 比較點(diǎn)對(duì)示意
特征點(diǎn)中心O與質(zhì)心C的連線方向即是特征點(diǎn)的主方向。
傳統(tǒng)的描述子計(jì)算按照式(1)和式(2)進(jìn)行計(jì)算,由于只是像素點(diǎn)灰度的比較,所以噪聲對(duì)其影響比較大,為了提高頑健性,本文使用像素點(diǎn)及其周圍8個(gè)鄰域像素的信息作為比較信息量,即
其中,AI(?)表示9個(gè)像素點(diǎn)(8個(gè)鄰域像素點(diǎn)以及自身)灰度的均值。按照2.2節(jié)中介紹的點(diǎn)對(duì)采樣模式進(jìn)行采樣后,按照式(7)進(jìn)行描述子計(jì)算,獲取該像素點(diǎn)的二進(jìn)制描述子,通過(guò)該方法可以進(jìn)一步提高描述子對(duì)噪聲的頑健性。
對(duì)比同樣基于視網(wǎng)膜特性的 FREAK,本文方法取得兩方面改進(jìn):1) 通過(guò)設(shè)計(jì)更符合視網(wǎng)膜特性的采集模式和典型數(shù)據(jù)的學(xué)習(xí)進(jìn)行點(diǎn)對(duì)選擇,大幅降低了點(diǎn)對(duì)數(shù)目,提高了二進(jìn)制描述子的緊致性;2) 對(duì)模糊半徑、模糊范圍等關(guān)鍵參數(shù)進(jìn)行優(yōu)化,設(shè)計(jì)了更符合視網(wǎng)膜特性的參數(shù)模型,在生成二進(jìn)制描述子時(shí),使用區(qū)塊均值代替單個(gè)像素點(diǎn),頑健性更高。
為了測(cè)試描述子RBS的頑健性,本文使用專用描述子測(cè)試集進(jìn)行評(píng)測(cè),該測(cè)試集由 Mikolajczyk等[17]提出。這個(gè)數(shù)據(jù)集由8張圖片組成,每張圖片有 5張變體,覆蓋了視角變化(wall和 graffiti)、壓縮退化(ubc)、光照變化(leuven)、旋轉(zhuǎn)和焦距變化(boat和bark)、圖像模糊(tree和bike)這些常見(jiàn)的圖像變化,第一張變體變化最小,第五張變化最大。另外,這個(gè)數(shù)據(jù)集還提供了變體與原圖之間的單應(yīng)變化矩陣,方便計(jì)算匹配正確率。
進(jìn)行測(cè)試的硬件平臺(tái)為Dell臺(tái)式機(jī),其指標(biāo)如下:CPU 為 Intel(R) Core(TM) i7-4770 @ 3.40 GHz,內(nèi)存為8 GB,操作系統(tǒng)為Ubuntu 14.04。
實(shí)驗(yàn)中,提取二進(jìn)制描述子前需要進(jìn)行特征點(diǎn)檢測(cè)。Rostenand等通過(guò)制定特征點(diǎn)規(guī)則并進(jìn)行機(jī)器學(xué)習(xí)的方式得到了 FAST(feature from accelerated segment test)特征檢測(cè)子[18],使用極大值抑止的方法篩選特征點(diǎn)。針對(duì)檢測(cè)速度慢的問(wèn)題,Mair等[19]提出了AGAST(adaptive and generic corner detection based on the accelerated segment test)檢測(cè)子,BRISK進(jìn)一步提出了一個(gè)多尺度的AGAST檢測(cè)子,他們以fast得分為衡量指標(biāo)在不同的尺度空間中尋找極大值,從而找到頑健的特征點(diǎn)。本文綜合考慮穩(wěn)定性和檢測(cè)速度因素,使用AGAST檢測(cè)子進(jìn)行測(cè)試。
本文使用2個(gè)指標(biāo)來(lái)衡量不同方法的性能,即描述子平均計(jì)算時(shí)間和描述子正確匹配率。描述子平均計(jì)算時(shí)間是多次計(jì)算時(shí)長(zhǎng)的平均。描述子正確匹配率按以下步驟計(jì)算。
1) 分別計(jì)算原圖和變體的特征點(diǎn)和描述子。
2) 判斷原圖和變體的描述子是否匹配,得到總匹配數(shù)N。
3) 判斷每個(gè)匹配是否正確,得到正確匹配數(shù)Nc。
首先,測(cè)試了RBS描述子的距離分布,即匹配描述子之間的距離和不匹配描述子之間的距離分布。對(duì)數(shù)據(jù)集內(nèi)每張圖片及其變體圖片使用 AGAST檢測(cè)子提取1 000個(gè)特征點(diǎn),并計(jì)算對(duì)應(yīng)的RBS-128描述子,進(jìn)而計(jì)算特征點(diǎn)之間的海明距離,圖5列出了wall圖與其他3個(gè)變體的特征點(diǎn)對(duì)的距離分布情況,其中,海明距離單位為bit,頻率是指對(duì)應(yīng)距離點(diǎn)所占比例??梢钥闯?,匹配點(diǎn)的方差和均值都在不斷增大。
圖5 wall圖片與其不同變體特征點(diǎn)距離分布情況
如圖5可知,不匹配點(diǎn)之間的距離大致呈正態(tài)分布,均值約為64 bit。匹配點(diǎn)的距離分布也呈正態(tài)分布,對(duì)于不同的變體圖片,匹配點(diǎn)的距離均值不同,第一張圖變化和距離均值最小,最后一張圖變化和距離均值最大。隨著變化程度加劇,匹配點(diǎn)之間的海明距離變化范圍逐漸增大,這符合實(shí)際情況。
接下來(lái),對(duì)不同描述子匹配正確率進(jìn)行比較,對(duì)比對(duì)象包括 SIFT(scale-invariant feature transform)[20]、ORB、BRISK、BRIEF、FREAK 這 4種描述子,其中SIFT是最流行的實(shí)數(shù)描述子,其余3個(gè)是主流的二進(jìn)制描述子。程序采用了 OPENCV中的開源代碼或者作者提供的代碼,均使用默認(rèn)參數(shù)。對(duì)數(shù)據(jù)集中 wall、graffiti、ubc、boat、tree、leuven的匹配正確率對(duì)比結(jié)果如圖6所示,具體數(shù)據(jù)如表1所示。
圖6 不同描述子正確率對(duì)比
表1 不同描述子的正確率對(duì)比
通過(guò)分析結(jié)果可以發(fā)現(xiàn),SIFT平均正確率最高,尤其在有大視角變化和焦距變化的圖片(graffiti和boat)下。4種二進(jìn)制描述子中,隨機(jī)采樣模式(BRIEF和 ORB)性能低于特定模式采樣(BRISK、FREAK 和 RBS)。RBS-128分別超過(guò)BRIEF和ORB 約8.6%和4.1%,RBS-64則分別超過(guò)約4.8%和1.3%,RBS-32優(yōu)于BRIEF約0.7%,但比ORB低約2.7%。RBS優(yōu)于512 bit的BRISK,與FREAK性能接近,RBS-32、RBS-64和RBS-128性能隨著長(zhǎng)度增加匹配正確率不斷上升,RBS-128性能最高,其平均正確率超過(guò)FREAK約8.4%,超過(guò)BRISK約1.9%,正確率提升比例分別達(dá)到16.4%和5.3%。二進(jìn)制描述子BRISK性能高于FREAK,分析可能是由于FREAK并沒(méi)有很好地模擬視網(wǎng)膜分布,而被使用均勻采樣的 BRISK超出。實(shí)驗(yàn)還顯示,160 bit時(shí)匹配正確率相對(duì)128 bit已經(jīng)開始下降,這表明隨著點(diǎn)對(duì)選擇方法能夠有效地篩選出穩(wěn)定點(diǎn)對(duì),隨著排序靠后點(diǎn)對(duì)數(shù)量的增加,描述子開始受到噪聲點(diǎn)的負(fù)面影響。
最后,使用leuven原圖對(duì)不同描述子的計(jì)算速度進(jìn)行對(duì)比,結(jié)果如表2所示。
表2 描述子提取算法速度對(duì)比
由表2可以看出,RBS描述子在速度上有很大的優(yōu)勢(shì),比SIFT快了近2個(gè)數(shù)量級(jí),與其他二進(jìn)制描述子(ORB、BRISK、BRIEF)相比,也有一定優(yōu)勢(shì),RBS-32和RBS-64均快于其他二進(jìn)制描述子,而 RBS-128僅慢于對(duì)比描述子中最快的FREAK。
本文模仿人眼視網(wǎng)膜細(xì)胞分布特性,實(shí)現(xiàn)了一種仿視網(wǎng)膜視神經(jīng)分布和感知特性的采樣學(xué)習(xí)方法,以生成更頑健、更緊致的二進(jìn)制描述子。實(shí)驗(yàn)表明,描述子對(duì)光照、旋轉(zhuǎn)、退化、模糊具有較高的頑健性,RBS-128匹配正確率超過(guò)512bitFREAK和BRISK二進(jìn)制描述子,計(jì)算性能比SIFT描述子提高了近2個(gè)數(shù)量級(jí),相比其他二進(jìn)制描述子也有一定的優(yōu)勢(shì)。但是,由于本文的方法仍舊是像素點(diǎn)對(duì)之間的比較,對(duì)于大角度的視角變化頑健性較低,如圖 6中 boat和graffiti,需要進(jìn)一步研究如何提高二進(jìn)制描述子對(duì)視角變化的頑健性。