史天予 孫家民 袁德鵬
摘要:受生物視覺信息處理機制啟發(fā)的目標識別是計算機視覺領(lǐng)域研究的熱點之一,主要思想是對大腦視覺皮層中視覺信息的層次性處理過程進行模擬來實現(xiàn)目標識別。本文以具備稀疏連接思想和自我學習機制的卷積神經(jīng)網(wǎng)絡(luò)為框架,融入分層和仿生的思想,提出增強層次的CNN模型。實驗結(jié)果表明該模型的目標識別準確率高達88%。
關(guān)鍵詞:側(cè)抑制機制 目標識別 Caltech-101 卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP391.14 文獻標識碼:A 文章編號:1007-9416(2016)09-0070-01
1 引言
經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)(CNN)并沒有很好的對視皮層中視覺信息的層次性處理過程進行模擬, 本文結(jié)合生物視覺特點,構(gòu)建具有分層感知不變性特征和具有學習、識別能力的計算模型,提出AH-CNN算法,在同樣目標條件下進行分類識別,并與其他識別模型進行比較。
2 基于隨機策略的池化層
本文基于隨機池化策略構(gòu)建隨機池化層, 替代傳統(tǒng)池化層, 在保留最大池化優(yōu)勢的基礎(chǔ)上添加隨機特性, 可以更好地防止模型訓練時出現(xiàn)過擬合.其公式如下:
(1)
其中為多項式分布位置采樣概率,為i位置的激活值,是特征映射圖第j個池化區(qū)域。隨機池化介于最大值池化和均值池化之間,相當于在池化區(qū)域上進行不同的形變再進行最大池化操作,在平均意義上,同均值池化類似;在局部區(qū)域中,服從最大池化策略。
3 基于側(cè)抑制機制的歸一化層
側(cè)抑制機制是普遍存在于視覺系統(tǒng)多層次中的一種神經(jīng)交互作用,這種機制在參與初級視覺感知的同時還參與類似注意機制的高層作用。本文將引入模擬側(cè)抑制機制的局部響應(yīng)值歸一化層(LRN),并部署于每個隨機池化層之后,通過對輸入特征數(shù)據(jù)的局部歸一化操作將局部化的輸入分散到更大范圍的輸出神經(jīng)元中,抑制激勵量并調(diào)整感知信息編碼,以此將映射特征顯著化,提高CNN模型泛化能力。其公式如下:
(2)
其中為點處的神經(jīng)元活躍程度,為歸一化活性,a為每個神經(jīng)元的激活值,b為歸一化權(quán)重生成的新的激活值,n為求和覆蓋的相鄰的位于相同空間位置的核映射數(shù)量,N是該層中的核總數(shù)。常數(shù)k,n,α和β為需要在驗證集上選擇最優(yōu)值的超參數(shù)。
4 基于視覺神經(jīng)層次結(jié)構(gòu)的AH-CNN模型
基于上述隨機池化層和LRN層的構(gòu)建,本文結(jié)合CNN的層次結(jié)構(gòu),仿照基于視覺信息處理系統(tǒng)的三級分析模型,提出基于視覺神經(jīng)層次結(jié)構(gòu)的AH-CNN模型。該模型采用卷積層、隨機池化層和LRN層交替組成視覺神經(jīng)系統(tǒng)的初、中級層次結(jié)構(gòu),并采用全連接層和分類器模擬視覺神經(jīng)系統(tǒng)的高級層次結(jié)構(gòu)對目標圖像進行決策識別。
5 實驗結(jié)果與分析
本文采用深度學習開發(fā)框架Caffe,并選擇Caltech-101數(shù)據(jù)集進行訓練和測試,結(jié)果如圖1所示。實驗證明AH-CNN模型能夠有效的提高圖像目標識別的準確度,對比經(jīng)典CNN,在準確率上有所提高。
參考文獻
[1]Y. LeCun, B. Boser, J, “Backpropagation applied to handwritten zip code recognition,” Neural computation,1989.
[2]J.Deng,W.Dong,R.Socher, L.-J.Li, K.Li,and L.FeiFei,“Imagenet:A large-scale hierarchical image database,”in CVPR,2009.
[3]A.Krizhevsky,I.Sutskever,and G.Hinton,“Imagenet classification with deep convolutional neural networks,” in NIPS,2012.