李 鳳,呂 裕,張海曦,何貴青
(1 西北工業(yè)大學(xué)電子信息學(xué)院, 西安 710072;2 西北農(nóng)林科技大學(xué)信息工程學(xué)院,陜西 咸陽(yáng) 712199)
圖像分類學(xué)是研究圖像種類和物種形成的科學(xué),是控制和轉(zhuǎn)化圖像的基礎(chǔ)知識(shí)。近年來(lái),隨著深度卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)和發(fā)展,計(jì)算機(jī)視覺領(lǐng)域正經(jīng)歷著飛快的、具有歷史性的改變。通過(guò)使用深度卷積神經(jīng)網(wǎng)絡(luò),可以處理大規(guī)模的圖像數(shù)據(jù),能夠在圖像分類、目標(biāo)檢測(cè)、圖像分割等識(shí)別領(lǐng)域有效提高模型性能。
在深度卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算過(guò)程中,卷積層輸出的特征矩陣中每一個(gè)通道輸出的特征矩陣都代表著某種具體特征,各個(gè)特征矩陣對(duì)網(wǎng)絡(luò)性能的影響是不同的。每一個(gè)特征矩陣上元素值的大小反映了對(duì)某種特征的響應(yīng)強(qiáng)度。由于網(wǎng)絡(luò)訓(xùn)練是一個(gè)不斷更新參數(shù)的過(guò)程,因此無(wú)論特征矩陣上響應(yīng)值大或小,都會(huì)參與到接下來(lái)的前向傳播和反向傳播的計(jì)算中,然而響應(yīng)值很小的特征矩陣可能不具有對(duì)應(yīng)卷積核所描述的特征。這種特征矩陣在參與后續(xù)計(jì)算時(shí)會(huì)對(duì)分類的結(jié)果產(chǎn)生不利的影響。從這個(gè)角度出發(fā),把輸出這種類型的特征矩陣的通道定義為“壞通道”,并通過(guò)有效的特征篩選方法篩選掉這些通道。
作為一種特征選擇方法的有效手段,1范數(shù)和2范數(shù)能夠反映矩陣元素的大小。文中針對(duì)“壞通道”的特征矩陣響應(yīng)值很小的特點(diǎn),結(jié)合單變量特征選擇高效且易于操作的特點(diǎn),分別使用1范數(shù)和2范數(shù)進(jìn)行判定篩選,對(duì)特征矩陣進(jìn)行計(jì)算,并根據(jù)值的大小進(jìn)行排序,將排在末位的通道視作“壞通道”,并對(duì)其進(jìn)行處理;另外設(shè)置判別項(xiàng)以限制對(duì)特征矩陣過(guò)激地操作對(duì)網(wǎng)絡(luò)性能帶來(lái)的不利影響;調(diào)整處理通道的數(shù)目,找到“壞通道”數(shù)目與卷積核數(shù)目的規(guī)律;最后將1范數(shù)和2范數(shù)結(jié)合,提出了更加有效的特征選擇方法。通過(guò)在多個(gè)數(shù)據(jù)集上與基礎(chǔ)網(wǎng)絡(luò)進(jìn)行比較,并在此基礎(chǔ)上與其他的特征選擇方法進(jìn)行橫向?qū)Ρ?,結(jié)果證明了方法的有效性。
圖像識(shí)別算法最初是通過(guò)手工設(shè)計(jì)的方式來(lái)進(jìn)行的,人們根據(jù)需要辨別的類別進(jìn)行相應(yīng)的特征設(shè)計(jì),并用其對(duì)樣本圖像進(jìn)行全局的運(yùn)算以得到響應(yīng)值,最后根據(jù)響應(yīng)值通過(guò)分類器進(jìn)行類別的判定。常用的特征提取方法有Haar-like、SIFT、HOG等。由于早期的圖像分類技術(shù)是通過(guò)手工設(shè)計(jì)的方法來(lái)提取想要辨別的特征,因此實(shí)際上只是利用了樣本圖像的低維淺層信息,無(wú)法提取到高維全局特征。
卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)巧妙的解決了這個(gè)問題,所利用的深度卷積模型可以從訓(xùn)練數(shù)據(jù)中逐步學(xué)習(xí)樣本的層級(jí)特征,由顏色輪廓到具有圖形高級(jí)語(yǔ)義的抽象特征,因此其性能表現(xiàn)要優(yōu)于手工設(shè)計(jì)特征的方法,而且提升了網(wǎng)絡(luò)的泛化性,降低了識(shí)別工作的難度。
在圖像識(shí)別領(lǐng)域中特征提取對(duì)于圖像識(shí)別十分重要,但提取得到的冗余無(wú)效特征不僅會(huì)降低網(wǎng)絡(luò)的性能,還會(huì)帶來(lái)額外的計(jì)算量,因此有效的特征選擇方法對(duì)于網(wǎng)絡(luò)性能的提升同樣至關(guān)重要。良好的特征選擇有助于提高模型性能,目前常用的特征選擇方法有:去掉取值變化小的特征、單變量特征選擇、線性模型和正則化。去掉取值變化小的特征通過(guò)初步篩選去掉絕大多數(shù)樣本都具有的特征;單變量特征選擇能夠?qū)γ恳粋€(gè)特征進(jìn)行測(cè)試,衡量該特征和響應(yīng)變量之間的關(guān)系,根據(jù)得分扔掉不好的特征,這對(duì)理解數(shù)據(jù)有較好的作用;線性模型和正則化是使是重要的特征在模型中對(duì)應(yīng)的系數(shù)越大,而跟輸出變量無(wú)關(guān)的特征對(duì)應(yīng)的系數(shù)就會(huì)接近零,其中的正則化是把額外的約束或者懲罰項(xiàng)加到已有模型上,以防止過(guò)擬合并提高泛化能力,正則化主要包括1范數(shù)和2范數(shù)。
文中提出了一種基于通道篩選的特征選擇方法,該方法結(jié)合了單變量特征選擇的易操作性和有效性的特點(diǎn),以及線性模型和正則化方法的1范數(shù)和2范數(shù)約束思想,是一種將1和2范數(shù)作為判斷依據(jù)進(jìn)行單變量特征選擇的特征選擇算法。
基于卷積通道篩選的特征選擇算法流程如圖1所示。網(wǎng)絡(luò)由卷積層,最大池化層,激活層以及全連接層或平均池化層構(gòu)成。樣本圖片首先經(jīng)過(guò)卷積層部分,經(jīng)過(guò)前面若干卷積層(藍(lán)色所示)直到尾部的卷積層(灰色所示),尾部卷積層輸出的特征圖被送入到卷積通道篩選模塊。算法首先計(jì)算分別計(jì)算輸入的特征圖中每一個(gè)矩陣的1及2范數(shù),并依據(jù)1范數(shù)值和2范數(shù)值分別由大至小排序,將其隊(duì)尾的通道視作“壞通道”,即無(wú)用通道,對(duì)這些通道進(jìn)行處理,并將處理后的特征矩陣送入后續(xù)的全連接層或平均池化層中,進(jìn)行最后的分類計(jì)算。
圖1 基于卷積通道篩選的算法流程圖
尾部的卷積層的具體位置,是根據(jù)最后一部分的具體結(jié)構(gòu)(平均池化層或全連接層)來(lái)決定的,為了緩和由于通道篩選所導(dǎo)致的特征信息劇烈變化的問題,處理后的特征圖還需要幾層運(yùn)算進(jìn)行過(guò)渡。當(dāng)最后一部分的結(jié)構(gòu)是平均池化層結(jié)構(gòu)時(shí),將這個(gè)卷積層設(shè)在平均池化層前第3層,即倒數(shù)第4層;當(dāng)最后一部分是全連接層時(shí),將這個(gè)卷積層設(shè)在卷積層部分的最后一層。
由于1范數(shù)具有較好的篩選特征信息的作用,2范數(shù)具有避免網(wǎng)絡(luò)過(guò)擬合的作用,因此選擇方法是將1范數(shù)和2范數(shù)相結(jié)合,共同指導(dǎo)卷積通道篩選的過(guò)程。將需要處理的卷積層輸出的特征圖提取出來(lái),對(duì)特征圖上的每一個(gè)非零矩陣,分別求1范數(shù)和2范數(shù),并根據(jù)1范數(shù)和2范數(shù)的值分別進(jìn)行由大至小排序。由于同一個(gè)特征矩陣的1范數(shù)和2范數(shù)在排序上具有一定的相關(guān)性,所以在1范數(shù)排序列表中排序靠后的通道中與2范數(shù)排序列表中排序靠后的通道中有很多是相同的。因待處理的通道可以被分為4種,將1獨(dú)有的通道設(shè)為;2獨(dú)有的通道設(shè)為;1、2共有的通道設(shè)為;既不在1范數(shù)排序靠后的通道也不在2范數(shù)排序靠后的通道設(shè)為,如式(1)所示:
(1)
式中:∈[0,特征通道的數(shù)量];和是對(duì)應(yīng)的處理系數(shù);為第特征矩陣。處理規(guī)則為:當(dāng)屬于時(shí),對(duì)特征矩陣上的每一個(gè)元素都乘以系數(shù);當(dāng)屬于時(shí),對(duì)特征矩陣上的每一個(gè)元素都乘以系數(shù);當(dāng)屬于時(shí),對(duì)特征矩陣上的每一個(gè)元素都乘以系數(shù)0;當(dāng)屬于時(shí),不對(duì)特征矩陣進(jìn)行任何操作。當(dāng)=0且=0時(shí),則是將1篩選的通道與2篩選的通道取并集共同進(jìn)行處理;當(dāng)=0且=1時(shí)或=1且=0時(shí),是按照1范數(shù)或2范數(shù)單獨(dú)進(jìn)行排序進(jìn)行特征選擇;其他情況則是1范數(shù)和2范數(shù)共同進(jìn)行篩選。
將步長(zhǎng)設(shè)為8通道,每次試驗(yàn)處理排序在后8個(gè)、16個(gè)、24個(gè)、32個(gè)、……通道,并將實(shí)驗(yàn)結(jié)果與傳統(tǒng)的深度卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行比對(duì)。
在網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,樣本圖片的全部特征矩陣經(jīng)過(guò)通道篩選后,未被視作“壞通道”的特征矩陣?yán)^續(xù)正常進(jìn)行前向轉(zhuǎn)播。隨后在反向傳播根據(jù)損失函數(shù)計(jì)算誤差并更新參數(shù)。而被視作“壞通道”的特征矩陣,在隨后的過(guò)程有兩種情況,當(dāng)式(1)中的==0時(shí)與dropout類似,正向傳播過(guò)程進(jìn)行到該卷積核時(shí),傳播停止,其對(duì)應(yīng)的卷積核的參數(shù)更新也隨之停止,同時(shí)中斷由該卷積核向前的所有系數(shù)更新操作,即由該卷積核進(jìn)行的所有經(jīng)過(guò)鏈?zhǔn)角髮?dǎo)法則更新的參數(shù)保持不變;當(dāng)式(1)中的與不同時(shí)為0時(shí),將對(duì)應(yīng)通道矩陣乘以對(duì)應(yīng)系數(shù)進(jìn)行后續(xù)的運(yùn)算。
1)數(shù)據(jù)庫(kù):Orchid flower的子集,包含250個(gè)圖像類別;PLANTCELF 2014,包含500個(gè)圖像類別。
2)實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)配置為Inter Xeon E5-2678 v3的CPU處理器,32 GB內(nèi)存和一張NVIDIA RTX 2080的顯卡,初始學(xué)習(xí)率均為0.01,根據(jù)網(wǎng)絡(luò)和數(shù)據(jù)集的不同設(shè)置不同的學(xué)習(xí)率調(diào)節(jié)方法。
3)基準(zhǔn)網(wǎng)絡(luò):使用AlexNet、VGG-11、MobileNetv1和ResNet-18作為基礎(chǔ)網(wǎng)絡(luò),首先在含有全連接層結(jié)構(gòu)的AlexNet和含有跳躍連接和平均池化層的ResNet-18上進(jìn)行有效性的驗(yàn)證,隨后拓展到VGG11和MobileNetv1上。
4)對(duì)比網(wǎng)絡(luò):使用了一些具有相同基準(zhǔn)網(wǎng)絡(luò)AlexNet的對(duì)比網(wǎng)絡(luò)模型來(lái)證明文中提出方法的有效性。將文中提出的卷積通道篩選方法與基于AlexNet的多個(gè)網(wǎng)絡(luò)模型進(jìn)行比較,其中包括三元組損失、中心損失和收縮激勵(lì)模塊。
5)探究實(shí)驗(yàn):以不同的排序處理規(guī)則進(jìn)行實(shí)驗(yàn),共分為5組:1范數(shù)單獨(dú)排序、2范數(shù)單獨(dú)排序、2單獨(dú)排序并增加判定條件、取1和2分別排序后的公共通道、1和2取公共通道并分別處理各自的獨(dú)有通道。每次實(shí)驗(yàn)的設(shè)置的“壞通道”的步長(zhǎng)為8。
6)驗(yàn)證實(shí)驗(yàn):一部分是在Orchid flower(250類)上進(jìn)行實(shí)驗(yàn),以VGG11和Mobilenetv1作為基礎(chǔ)網(wǎng)絡(luò),分別使用在AlexNet和ResNet-18上的調(diào)節(jié)參數(shù)所獲得的最優(yōu)參數(shù)和1最優(yōu)參數(shù)兩種改進(jìn)方法,與原始的深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比;另一部分是將4種網(wǎng)絡(luò)中效果最好的特征選擇改進(jìn)模型與原始模型在PLANTCLEF 2014上的對(duì)比實(shí)驗(yàn)。
AlexNet的批數(shù)量設(shè)為256,初始學(xué)習(xí)率為0.01,在Orchid flower和PLANTCLEF 2014上分別訓(xùn)練60輪,每20輪學(xué)習(xí)率乘以0.1;MobileNetv1的批數(shù)量設(shè)為256,初始學(xué)習(xí)率為0.01,在Orchid flower和PLANTCLEF 2014上分別訓(xùn)練60輪,每20輪學(xué)習(xí)率乘以0.1;VGG11的批數(shù)量設(shè)為64,初始學(xué)習(xí)率為0.01,在Orchid flower和PLANTCLEF 2014上分別訓(xùn)練90輪,每30輪學(xué)習(xí)率乘以0.1;ResNet-18的批數(shù)量設(shè)為128,初始學(xué)習(xí)率為0.01,在Orchid flower和PLANTCLEF 2014上分別訓(xùn)練30輪,每10輪學(xué)習(xí)率乘以0.1。
文中分別在AlexNet和ResNet-18上用提出的基于卷積通道篩選的特征選擇方法,在含有250個(gè)圖像種類的Orchid flower子集上進(jìn)行了實(shí)驗(yàn)。在AlexNet上首先分別用1范數(shù)和2范數(shù)單獨(dú)進(jìn)行通道篩選,探究?jī)煞N規(guī)則分別對(duì)網(wǎng)絡(luò)性能的影響。最后將1范數(shù)和2范數(shù)的分別排序結(jié)果中排在末位的共有通道作為特征篩選的依據(jù),驗(yàn)證了取并集處理和分別處理的效果;在ResNet-18上首先分別探究用1范數(shù)和2范數(shù)單獨(dú)篩選特征信息時(shí)對(duì)網(wǎng)絡(luò)性能的影響,隨后將1范數(shù)和2范數(shù)的排序結(jié)果共同作為特征篩選的依據(jù),驗(yàn)證了取并集處理的效果。
在AlexNet上進(jìn)行實(shí)驗(yàn),只以特征矩陣的1范數(shù)作為排序的標(biāo)準(zhǔn),由于AlexNet含有5個(gè)卷積層,且在卷積層與輸出層中間擁有全連接層結(jié)構(gòu),因此對(duì)第5個(gè)卷積層的輸出進(jìn)行特征通道的篩選。第5卷積層含有256個(gè)卷積核,故有256個(gè)特征矩陣,以8個(gè)通道為步長(zhǎng),未被處理的有效通道從248到200,結(jié)果如圖2所示。
圖2 AlexNet上依據(jù)L1范數(shù)進(jìn)行排序下的準(zhǔn)確率
以1范數(shù)作為排序規(guī)則,其正確率與處理通道數(shù)目呈現(xiàn)明顯的相關(guān)性,隨著處理通道數(shù)的增多,正確率整體先上升后降低。在有效通道數(shù)為208時(shí)達(dá)到最大值。當(dāng)有效通道數(shù)大于208時(shí),由于處理的通道數(shù)有限,且排在末尾的通道其元素值過(guò)小,因此只對(duì)末尾的小部分通道進(jìn)行處理時(shí),網(wǎng)絡(luò)的正確率上升非常有限,隨著處理通道數(shù)的增多,正確率整體先上升;當(dāng)有效通道數(shù)小于208時(shí),正確率快速下降,這表明此時(shí)已經(jīng)處理了一部分有用特征,導(dǎo)致樣本特征信息缺失,網(wǎng)絡(luò)識(shí)別性能下降。因此,在AlexNet上,如果只以1范數(shù)作為篩選規(guī)則,那么有效通道數(shù)為208時(shí)效果最好。
接著在ResNet-18上進(jìn)行實(shí)驗(yàn)。首先,只以特征圖的1范數(shù)作為排序的標(biāo)準(zhǔn),由于ResNet-18含有8個(gè)殘差塊,且最后一部分是平均池化層,為了將經(jīng)過(guò)通道篩選模塊選擇后的特征矩陣攜帶的信息能夠平滑的過(guò)渡,在第6個(gè)殘差塊后進(jìn)行通道篩選。第6個(gè)殘差塊輸出維度是256×14×14的特征矩陣,仍以8個(gè)通道為步長(zhǎng),未被處理有效通道從248到200,結(jié)果如圖3所示。
圖3 ResNet-18上依據(jù)L1范數(shù)進(jìn)行排序下的準(zhǔn)確率
以1范數(shù)作為排序規(guī)則,其正確率與有效通道數(shù)目呈現(xiàn)明顯的相關(guān)性,隨著“壞通道”數(shù)目的增多,正確率整體先上升后降低。在有效通道為232時(shí)準(zhǔn)確率達(dá)到最大值。有效通道數(shù)目大于232時(shí),由于處理的通道數(shù)有限,且排在末尾的通道其元素值過(guò)小,因此只對(duì)末尾的小部分通道進(jìn)行處理時(shí)正確率的提升有限,隨著處理通道數(shù)的增多,正確率整體先上升;有效通道數(shù)目小于232時(shí),正確率快速下降,表明此時(shí)已經(jīng)處理了一部分有效特征,導(dǎo)致樣本圖片的特征信息缺失,網(wǎng)絡(luò)性能下降。因此,在ResNet-18上,如果只以1范數(shù)作為篩選規(guī)則,有效通道數(shù)設(shè)為232時(shí)效果最好。
綜合在以上兩個(gè)網(wǎng)絡(luò)上的實(shí)驗(yàn)結(jié)果,依據(jù)1范數(shù)排序進(jìn)行通道篩選時(shí),網(wǎng)絡(luò)性能與篩選的通道的數(shù)目呈現(xiàn)出很強(qiáng)的相關(guān)性,識(shí)別正確率均為先逐漸上升,后逐漸下降,說(shuō)明使用1范數(shù)能夠有效地篩選出與識(shí)別無(wú)關(guān)的一些特征矩陣,提高網(wǎng)絡(luò)正確率;同時(shí)也說(shuō)明網(wǎng)絡(luò)中確實(shí)存在“壞通道”,通過(guò)消除掉這些“壞通道”的輸出對(duì)網(wǎng)絡(luò)產(chǎn)生的不利影響,能夠增加網(wǎng)絡(luò)的性能。
把篩選規(guī)則改為只以特征矩陣的2范數(shù)作為排序的標(biāo)準(zhǔn),基礎(chǔ)網(wǎng)絡(luò)為AlexNet和ResNet-18,數(shù)據(jù)集為Orchid flower。在AlexNet上使用2范數(shù)排序進(jìn)行通道篩選的實(shí)驗(yàn)結(jié)果如圖4所示,2范數(shù)作為排序規(guī)則,其正確率與處理通道數(shù)目有一定的相關(guān)性,隨著處理通道數(shù)目的增多,正確率整體先上升后趨于平穩(wěn),最后降低。將256作為基準(zhǔn)線,有效通道數(shù)在232~216時(shí)正確率趨于不變,在232時(shí)達(dá)到最大值。由于1范數(shù)和2范數(shù)對(duì)元素值較小的矩陣在排序時(shí)有一定的相關(guān)性,因此其整體規(guī)律與1范數(shù)相似,準(zhǔn)確率平緩的部分體現(xiàn)了與1范數(shù)的差異性,雖然有效通道數(shù)目與識(shí)別準(zhǔn)確率的規(guī)律性不如1范數(shù)強(qiáng),但是相對(duì)于1范數(shù),2范數(shù)只處理很少的一部分通道就達(dá)到了最大值。因此以2范數(shù)排序,一方面相較于1范數(shù)排序效率較高,但另一方面相較于1范數(shù)排序穩(wěn)定性較差。
圖4 AlexNet上依據(jù)L2范數(shù)進(jìn)行排序下的準(zhǔn)確率
實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn),在網(wǎng)絡(luò)模型訓(xùn)練初期,AlexNet的第5卷積層輸出了很多零矩陣,為了驗(yàn)證提出的特征選擇方法是否會(huì)由于處理了過(guò)多的非零矩陣導(dǎo)致有效特征損失的情況,使網(wǎng)絡(luò)損失值不下降,或者性能降低等問題,增加了一個(gè)判斷因子,以保證處理后的非零矩陣不小于總通道數(shù)的一半,即128個(gè)通道。
在ResNet-18上以2范數(shù)排序作為排序規(guī)則進(jìn)行了另一組實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖5所示,其正確率與處理通道數(shù)目相關(guān)性不強(qiáng),隨著需要處理的“壞通道”數(shù)目的增多,正確率快速上升隨后開始波動(dòng),最后下降。在有效通道數(shù)為248時(shí)達(dá)到最大值。相較于上文在AlexNet的2排序時(shí)有效通道數(shù)目和識(shí)別準(zhǔn)確率的變化規(guī)律,ResNet-18由于層數(shù)變多,所以1范數(shù)篩選的特征與2范數(shù)篩選的特征差異變大,兩個(gè)規(guī)則排在末位的通道的相關(guān)性下降。同樣雖然規(guī)律性不如1范數(shù)強(qiáng),但是相對(duì)于1范數(shù),2范數(shù)只處理很少的一部分通道便達(dá)到了最大值。因此在ResNet-18上得到了與AlexNet網(wǎng)絡(luò)上相同的規(guī)律,即以2范數(shù)的排序進(jìn)行通道篩選操作,相較于1范數(shù)排序,它的效率更高,但穩(wěn)定性較差。
圖5 ResNet-18上依據(jù)L2范數(shù)進(jìn)行排序的準(zhǔn)確率
綜合在兩個(gè)網(wǎng)絡(luò)上的實(shí)驗(yàn)結(jié)果,以2范數(shù)進(jìn)行排序也能夠提升網(wǎng)絡(luò)的性能,但識(shí)別準(zhǔn)確率并沒有表現(xiàn)出和有效通道數(shù)目間很強(qiáng)的相關(guān)性。相反地,其識(shí)別準(zhǔn)確率隨著“壞通道”數(shù)目的增加呈現(xiàn)一種波動(dòng)的現(xiàn)象,這表明單一的2范數(shù)排序結(jié)果并不具有很好篩選特征的效果,識(shí)別準(zhǔn)確率提升的原因是使用1范數(shù)排序和2范數(shù)排序的結(jié)果具有一定的相似性,且越在排序末尾,相似性越強(qiáng)??傊?,單一地使用2范數(shù)進(jìn)行排序并不能有效地提升網(wǎng)絡(luò)的性能,因此需要把1范數(shù)的特點(diǎn)和2范數(shù)的特點(diǎn)進(jìn)行結(jié)合,在用1范數(shù)進(jìn)行有效篩選的同時(shí),引入2范數(shù)增加網(wǎng)絡(luò)的魯棒性,減少網(wǎng)絡(luò)的過(guò)擬合。
將1范數(shù)和2范數(shù)分別排序的結(jié)果共同作為篩選的標(biāo)準(zhǔn),分別在AlexNet和ResNet-18上進(jìn)行了并集實(shí)驗(yàn),數(shù)據(jù)集為Orchid flower,按照8的步長(zhǎng)進(jìn)行“壞通道”的判定,取1范數(shù)排序末位中的“壞通道”和2范數(shù)排序末位的“壞通道”的全部特征矩陣視作實(shí)際進(jìn)行處理的“壞通道”,即如式(1)中,在==0的情況下進(jìn)行實(shí)驗(yàn),最后在AlexNet上進(jìn)行了1范數(shù)和2范數(shù)篩選特征的差異性實(shí)驗(yàn),即對(duì)系數(shù)和分別取不同的值,觀察對(duì)識(shí)別準(zhǔn)確率的影響,并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行討論。
首先進(jìn)行了1范數(shù)和2范數(shù)排序的并集實(shí)驗(yàn),在AlexNet上的實(shí)驗(yàn)結(jié)果如圖6所示,其識(shí)別正確率與有效通道數(shù)目幾乎沒有明顯的相關(guān)性,在有效通道數(shù)在248~208之間均高于基準(zhǔn)線,且有效通道數(shù)目在208時(shí)網(wǎng)絡(luò)準(zhǔn)確率得到最優(yōu)值,在248和224時(shí)得到較為相似的次優(yōu)值,但最優(yōu)值略低于只用1范數(shù)或2范數(shù)篩選的最優(yōu)值,這是由于1獨(dú)有的通道和2獨(dú)有的通道里可能都存在有用特征,此時(shí)對(duì)并集進(jìn)行處理會(huì)損失這些有用特征導(dǎo)致正確率下降。
圖6 AlexNet上依據(jù)L1范數(shù)和L2范數(shù)并集的準(zhǔn)確率
在ResNet-18上依據(jù)1范數(shù)和2范數(shù)排序的并集實(shí)驗(yàn)結(jié)果如圖7所示。同樣地,網(wǎng)絡(luò)識(shí)別正確率與有效通道數(shù)目幾乎沒有明顯的相關(guān)性,正確率先快速升高,在有效通道數(shù)為240時(shí)準(zhǔn)確率達(dá)到最大值82.627%,然后快速下降,后趨于平緩,在216時(shí)開始正確率開始下降。這是由于ResNet-18相較于AlexNet網(wǎng)絡(luò)更深,提取到的信息更加抽象,“壞通道”數(shù)目較少且較為聚集,故排序在末位的很少的一部分通道進(jìn)行處理就很好的提升網(wǎng)絡(luò)的性能。在篩選的過(guò)程中,考慮到2范數(shù)篩選的不穩(wěn)定性,因此當(dāng)“壞通道”的數(shù)目大于16時(shí),識(shí)別正確率呈現(xiàn)出無(wú)規(guī)律的波動(dòng),當(dāng)“壞通道”大于40時(shí),準(zhǔn)確率開始低于標(biāo)準(zhǔn)基準(zhǔn)值。由于在最大值時(shí)只對(duì)16個(gè)14×14大小的矩陣進(jìn)行操作,因此時(shí)間效率與原始網(wǎng)絡(luò)幾乎不變,但正確率相較于82.009%有了明顯的提升,證明了特征選擇方法的有效性。
圖7 ResNet-18上依據(jù)L1范數(shù)和L2范數(shù)并集的準(zhǔn)確率
隨后為了驗(yàn)證1范數(shù)和2范數(shù)篩選的差異性,以AlexNet為基礎(chǔ)網(wǎng)絡(luò),數(shù)據(jù)集為Orchid flower,將彼此的處理系數(shù)和分別取不同的值,對(duì)準(zhǔn)確率的對(duì)比隨后給出分析。為了結(jié)合1范數(shù)和2范數(shù)各自篩選的特征信息,又因?yàn)?范數(shù)排序的準(zhǔn)確率與有效通道數(shù)目具有很強(qiáng)的相關(guān)性,因此在只以1范數(shù)排序效果最優(yōu)的:有效通道數(shù)目為208的條件下進(jìn)行實(shí)驗(yàn),將排序的結(jié)果按照式(1)分為4組,對(duì)1范數(shù)和2范數(shù)特有的通道和通過(guò)設(shè)置,系數(shù)進(jìn)行處理,實(shí)驗(yàn)結(jié)果如表1所示,通過(guò)表1可以發(fā)現(xiàn),的取值對(duì)網(wǎng)絡(luò)性能影響不大,這說(shuō)明2范數(shù)確實(shí)不是影響識(shí)別準(zhǔn)確率的主要因素,在取值為2、取值為05時(shí),網(wǎng)絡(luò)識(shí)別準(zhǔn)確率達(dá)到最優(yōu)78012,這也驗(yàn)證了之前對(duì)1范數(shù)和2范數(shù)分別作為排序規(guī)則時(shí)的結(jié)論。
表1 在AlexNet上有效通道數(shù)為208時(shí),a、b取值的結(jié)果
通過(guò)對(duì)比上述兩部分實(shí)驗(yàn)可以得出結(jié)論:在==0的情況,其計(jì)算的空間成本和時(shí)間成本幾乎不變的前提下只需要處理很少的一部分矩陣就可以達(dá)到較好的效果。而由于2范數(shù)與剩余通道數(shù)的相關(guān)性不強(qiáng),因此需要通過(guò)精細(xì)的選擇需要處理的通道數(shù)量和與的值,才能得到最優(yōu)值,并且考慮到排序和對(duì)特征矩陣元素的操作、計(jì)算成本和實(shí)際效果,==0時(shí)的特征選擇方式更為有效。
以AlexNet為主干網(wǎng)絡(luò)在Orchid flower數(shù)據(jù)集上的運(yùn)行時(shí)間。實(shí)驗(yàn)用一張Nvidia RTX2080顯卡,批處理數(shù)為256,內(nèi)存32 GB,處理器為Intel Xeon CPU E5-2678 v3, 運(yùn)行時(shí)間如表2所示。
表2 AlexNet上不同有效通道數(shù)目訓(xùn)練時(shí)間對(duì)比(a=b=0)
結(jié)果表明,運(yùn)行時(shí)間隨著“壞通道”數(shù)量的增加而基本呈線性增長(zhǎng)。與原始的AlexNet相比,差異在于額外的范數(shù)計(jì)算、排序以及對(duì)特征矩陣元素的乘法操作;考慮到應(yīng)用卷積通道篩選方法都需要經(jīng)過(guò)范數(shù)計(jì)算和排序,因此造成時(shí)間上的差異主要原因是乘法操作,額外時(shí)間增加的時(shí)間長(zhǎng)度與需要處理元素總數(shù)呈正相關(guān)。
分別在Orchid flower子集和PLANTCLEF 2014上進(jìn)行了實(shí)驗(yàn)。首先將通道篩選方法分別應(yīng)用在AlexNet、VGG-11、MobileNetv1、ResNet-18上;隨后以AlexNet作為主干網(wǎng)絡(luò),對(duì)比了多種特征選擇方法。其中AlexNet在Orchid flower子集上的實(shí)驗(yàn)精確的調(diào)整了和的值??紤]到性能效率等問題,本文在其他網(wǎng)絡(luò)上進(jìn)行的實(shí)驗(yàn)都是在==0時(shí)進(jìn)行。在VGG-11上訓(xùn)練時(shí),由于最后一部分是全連接層,因此在卷積層的最后一層進(jìn)行通道篩選,最后一層的卷積核數(shù)為512個(gè),即512個(gè)特征矩陣,故將需要篩選的“壞通道”數(shù)設(shè)為32,即保留480個(gè)有效通道;在MobileNetv1上訓(xùn)練時(shí),由于其最后一部分是平均池化層,因此本文在全部的可分離卷積層的倒數(shù)第3層進(jìn)行卷積通道篩選,其卷積核數(shù)目為512,即512個(gè)特征矩陣,同樣將篩選的“壞通道”數(shù)目設(shè)為32,保留480個(gè)有效通道。
1)多種深度卷積神經(jīng)網(wǎng)絡(luò)在Orchid flower數(shù)據(jù)集的結(jié)果對(duì)比
應(yīng)用在多種深度卷積神經(jīng)網(wǎng)絡(luò)上的對(duì)比實(shí)驗(yàn)結(jié)果如表3所示。
表3 多種模型方法在Orchid flower上的準(zhǔn)確率對(duì)比
實(shí)驗(yàn)結(jié)果表明,基于卷積通道篩選的特征選擇方法在多個(gè)類型的深度卷積神經(jīng)網(wǎng)絡(luò)上都能夠有效地提高網(wǎng)絡(luò)的準(zhǔn)確率,其中在VGG-11提升效果相對(duì)較低,原因是VGG-11的最后一層卷積層輸出特征的的尺寸大小是7×7,因此1范數(shù)篩選的通道與2范數(shù)篩選的“壞通道”的相似度極高,所以并沒有將兩種方法的特點(diǎn)結(jié)合有效地進(jìn)行特征選擇,網(wǎng)絡(luò)識(shí)別準(zhǔn)確率的提升非常有限;與之相對(duì)應(yīng)地,ResNet-18和AlexNet都明顯地提升了準(zhǔn)確率,這是因?yàn)檫M(jìn)行通道篩選的特征矩陣的維度分別為14×14和13×13,相較于VGG11,這兩個(gè)網(wǎng)絡(luò)上進(jìn)行處理的特征矩陣尺寸更大,涵蓋的元素值更多,因此1范數(shù)篩選的“壞通道”和2范數(shù)篩選的“壞通道”的差異性更大,將這兩種范數(shù)篩選的“壞通道”結(jié)合能更有效地進(jìn)行特征選擇。
接下來(lái)以AlexNet為主干網(wǎng)絡(luò),將3種目前已經(jīng)應(yīng)用在卷積神經(jīng)網(wǎng)絡(luò)上的特征選擇方法與文中提出的通道篩選方法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表4所示。分別在AlexNet上應(yīng)用了三元組損失、中心損失和SENet中的具有通道級(jí)視覺注意力機(jī)制的收縮激勵(lì)模塊縮放因子為16。表4中的數(shù)據(jù)顯示,在Orchid flower數(shù)據(jù)集上進(jìn)行卷積通道篩選網(wǎng)絡(luò)模型獲得了最高的正確率,說(shuō)明是非常有效的特征選擇方法,另外還可以看到方法和增加收縮激勵(lì)模塊的網(wǎng)絡(luò)正確率較為接近,但是并沒有增加額外的參數(shù),而收縮激勵(lì)模塊是在原有的基礎(chǔ)上并聯(lián)了一個(gè)SE模塊進(jìn)行特征選擇,所以綜上所述文中方法效率更高,計(jì)算代價(jià)更小。
表4 多種特征選擇方法在Orchid flower上的準(zhǔn)確率對(duì)比
2)PLANTCLEF 2014數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對(duì)比
為了驗(yàn)證算法的魯棒性,在另一個(gè)圖像數(shù)據(jù)集上PLANTCLEF 2014數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),基準(zhǔn)網(wǎng)絡(luò)是AlexNet、VGG-11、MobileNetv1、ResNet-18;隨后在AlexNet應(yīng)用了上節(jié)的3種特征選擇方法。在多種深度卷積神經(jīng)網(wǎng)絡(luò)模型上應(yīng)用通道篩選方法的實(shí)驗(yàn)結(jié)果如表5所示。同樣地,在多個(gè)網(wǎng)絡(luò)模型上,通道篩選方法都對(duì)原模型的性能有一定的提升,其中MobileNetv1的提升最為明顯,AlexNet、ResNet-18以及VGG-11的提升相對(duì)較低。這說(shuō)明,通道篩選方法效果提升的程度與數(shù)據(jù)集的復(fù)雜程度以及數(shù)量有一定的關(guān)系。
表5 多種模型方法在PLANTCLEF 2014上的準(zhǔn)確率對(duì)比
在PLANTCLEF 2014上,同樣在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)AlexNet上應(yīng)用了先前提到的3種特征選擇方法,實(shí)驗(yàn)結(jié)果如表6所示,獲得了最高的準(zhǔn)確率。由于PLENTCLEF 2014數(shù)據(jù)集的類別多,但是圖片總數(shù)目相對(duì)較少,因此三元組損失和中心損失方法都出現(xiàn)了明顯的性能下降,而收縮激勵(lì)模塊和文中的方法都還保持良好的正確率,這說(shuō)明收縮激勵(lì)模塊和通道篩序方法在訓(xùn)練數(shù)據(jù)不足時(shí)受到的影響較小,仍能有很好的表現(xiàn),而正確率高于SENet,說(shuō)明文中的方法魯棒性更強(qiáng),在有限的數(shù)據(jù)集總量下依然提取到了非常有辨別力的特征,是更加高效地特征選擇方法。
表6 多種特征選擇方法在PLANTCLEF 2014上的準(zhǔn)確率對(duì)比
針對(duì)大規(guī)模圖像識(shí)別開發(fā)了一種新式的基于卷積通道篩選的特征選擇算法。該方法利用1范數(shù)和2范數(shù)作為評(píng)價(jià)指標(biāo),通過(guò)排序篩選掉排在末位的無(wú)用通道,從而提升網(wǎng)絡(luò)的性能。通過(guò)在兩個(gè)大規(guī)模的圖像數(shù)據(jù)集以及多個(gè)基準(zhǔn)網(wǎng)絡(luò)上的對(duì)比試驗(yàn)證明了提出方法的有效性,最后通過(guò)與目前應(yīng)用在卷積神經(jīng)網(wǎng)絡(luò)上的其他特征選擇方法進(jìn)行對(duì)比,證明了文中提出的方法的優(yōu)越性。