鄔戰(zhàn)軍 牛 敏 許 冰 牛燕雄 耿天琪 張 帆 滿 達(dá)
?
基于譜回歸特征降維與后向傳播神經(jīng)網(wǎng)絡(luò)的識(shí)別方法研究
鄔戰(zhàn)軍 牛 敏*許 冰 牛燕雄 耿天琪 張 帆 滿 達(dá)
(北京航空航天大學(xué)儀器科學(xué)與光電工程學(xué)院 北京 100191)
采用后向傳播(BP)神經(jīng)網(wǎng)絡(luò)對空間目標(biāo)進(jìn)行識(shí)別時(shí),高維的輸入特征導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,識(shí)別性能降低。針對上述難點(diǎn),該文提出一種基于譜回歸(SR)特征降維與BP神經(jīng)網(wǎng)絡(luò)的識(shí)別方法。該方法首先對空間目標(biāo)進(jìn)行HOG特征提取,然后將提取的高維HOG特征進(jìn)行SR降維,最后把降維后的數(shù)據(jù)通過BP分類器進(jìn)行訓(xùn)練識(shí)別。實(shí)驗(yàn)結(jié)果表明:該方法的降維和識(shí)別特性優(yōu)于傳統(tǒng)降維方法PCA, KPAC, LPP, KLPP等,能夠兼顧實(shí)時(shí)性和準(zhǔn)確性,提高了識(shí)別性能。
目標(biāo)識(shí)別;后向傳播神經(jīng)網(wǎng)絡(luò);譜回歸;特征降維
1 引言
空間監(jiān)視系統(tǒng)是地球外層領(lǐng)域的研究熱點(diǎn),空間目標(biāo)識(shí)別是空間監(jiān)視的主要任務(wù)之一,引起多國的廣泛關(guān)注。衛(wèi)星目標(biāo)在太空中沿軌道運(yùn)動(dòng),具有視點(diǎn)結(jié)構(gòu)特征,光照、形狀、尺度和姿態(tài)都有不同程度的變化。BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)能夠逼近任意非線性函數(shù),具有抑制噪聲能力強(qiáng)、容錯(cuò)能力強(qiáng)、自適應(yīng)學(xué)習(xí)能力強(qiáng)和并行處理能力強(qiáng)等優(yōu)點(diǎn),在目標(biāo)識(shí)別領(lǐng)域有廣泛應(yīng)用[1]。但BP神經(jīng)網(wǎng)絡(luò)用于空間目標(biāo)識(shí)別時(shí),高維輸入特征會(huì)使網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,降低訓(xùn)練性能,因此在訓(xùn)練識(shí)別前對原始特征進(jìn)行降維十分必要。
目前常用的特征降維法主要有主成分分析法(Principal Component Analysis, PCA),局部保形投影法等。主成分分析法計(jì)算簡單,效率高,但不適用于高維非線性結(jié)構(gòu)[2,3]。核主成分分析法(KPCA)通過核函數(shù)把低維線性不可分的數(shù)據(jù)映射成高維空間中線性可分的,再在高維空間中使用PCA降維,然而KPCA需要對核矩陣計(jì)算、存儲(chǔ)和特征分解,樣本過多時(shí)計(jì)算代價(jià)大,速度慢,效率低[4,5]。局部保形投影(Locality Preserving Projection, LPP)既解決了線性方法難以保持?jǐn)?shù)據(jù)非線性流形的問題,又克服了非線性方法難以獲得新樣本低維投影的缺點(diǎn),有很好的局部判別能力[6,7]。核局部保形投影(KLPP)比LPP有更好的抽取非線性特征的能力。然而LPP是無監(jiān)督的學(xué)習(xí)方法,當(dāng)圖像的光照、姿態(tài)發(fā)生變化時(shí),或兩類目標(biāo)靠得較近甚至部分重合時(shí),識(shí)別率會(huì)下降;矩陣向向量變換的過程中,容易帶來維度災(zāi)難,計(jì)算量很大。譜回歸(Spectral Regression, SR)方法把求解特征函數(shù)的問題放在了回歸模型中,避免了LPP求解稠密矩陣的特征值問題,它不僅在監(jiān)督和非監(jiān)督的情況下適用,在半監(jiān)督的情況下同樣有不錯(cuò)的效果[8]。
本文提出一種基于SR特征降維與BP神經(jīng)網(wǎng)絡(luò)的識(shí)別方法。該方法首先對空間目標(biāo)提取梯度方向直方圖(Histogram of Oriented Gradient, HOG)特征,對高維HOG特征分別使用PCA, KPCA, LPP, KLPP以及SR和KSR算法進(jìn)行降維,最后使用BP神經(jīng)網(wǎng)絡(luò)分類器對降維后的數(shù)據(jù)進(jìn)行訓(xùn)練識(shí)別。對比各算法降維和識(shí)別特性,SR與BP神經(jīng)網(wǎng)絡(luò)結(jié)合使用,克服了實(shí)時(shí)性與準(zhǔn)確性難兩全的問題,提高了識(shí)別性能。
2 空間目標(biāo)圖像特征提取與降維
2.1 HOG特征提取
2005年,文獻(xiàn)[9]提出HOG特征,充分利用了圖像的局部梯度幅值和方向的特征值[9,10]。HOG特征可以很好地表征目標(biāo)的輪廓信息和局部細(xì)節(jié)特征,準(zhǔn)確率高,對光照、姿態(tài)、距離等因素的變化具有較強(qiáng)的魯棒性[11,12]。根據(jù)空間目標(biāo)的圖像特性和背景特點(diǎn),本文確定對空間目標(biāo)進(jìn)行HOG特征提取,提取過程如下:
(1)計(jì)算各像素點(diǎn)的梯度方向和幅值:用梯度算子求各像素的橫向和縱向梯度,分別設(shè)為和,則像素處的梯度方向和幅值分別為
(2)將圖像劃分為細(xì)胞和塊,并設(shè)定各自的尺寸,圖像中的像素組成細(xì)胞,細(xì)胞組成塊,合理組織塊的結(jié)構(gòu)對目標(biāo)識(shí)別的準(zhǔn)確性和實(shí)時(shí)性有重要影響。HOG的方向數(shù)設(shè)為,將360°平均分成份,每個(gè)方向數(shù)對應(yīng)一個(gè)角度區(qū)間,對細(xì)胞內(nèi)各像素的梯度幅值在各角度區(qū)間上加權(quán)投票,完成細(xì)胞梯度直方圖的建立,得到一個(gè)維向量。然后將每個(gè)塊內(nèi)個(gè)細(xì)胞得到的向量進(jìn)行級(jí)聯(lián),得到塊的維梯度向量。
(3)對各塊特征向量歸一化,級(jí)聯(lián)各塊特征向量得到圖像的HOG特征,并對HOG特征向量歸一化。
2.2 SR特征降維
基于HOG特征的目標(biāo)識(shí)別準(zhǔn)確率高,但特征維度也高,速度慢,分類器性能弱,主要是因?yàn)樘卣髦写嬖谌哂?,要解決計(jì)算量大與準(zhǔn)確率高的矛盾,就需要進(jìn)行降維[13]。譜回歸是流形學(xué)習(xí)中典型的降維方法,它先進(jìn)行圖的譜分析,再對數(shù)據(jù)進(jìn)行回歸處理,所以被稱為譜回歸,簡記為SR。SR將學(xué)習(xí)嵌入函數(shù)的問題轉(zhuǎn)移到了回歸模型中,使得有效計(jì)算和正則化應(yīng)用都變得十分容易,其降維過程如下[14,15]:
(2)選擇權(quán)值:
(3)特征分解: 構(gòu)造特征方程為
(4)正則最小二乘法及SR嵌入: SR算法通過求解最小二乘問題得到高維向低維映射的投影矩陣,正則化最小二乘問題如式(5)所示
如果在RKHS中求嵌入函數(shù),第(4)步可以換成下列形式
(5)正則核最小二乘法及KSR嵌入: KSR算法將最小二乘問題轉(zhuǎn)換為正則核最小二乘問題的求解:
3 基于BP神經(jīng)網(wǎng)絡(luò)的目標(biāo)分類識(shí)別
3.1 BP神經(jīng)網(wǎng)絡(luò)原理
BP神經(jīng)網(wǎng)絡(luò)是基于誤差反向傳播算法的多層前饋神經(jīng)網(wǎng)絡(luò),由RUMELHART和McCLELLAND在1985年提出。BP網(wǎng)絡(luò)將樣本的輸入輸出問題轉(zhuǎn)化為非線性優(yōu)化問題,利用輸出誤差估計(jì)前一層誤差,逐層反傳,至輸入層,按照梯度下降法不斷修正各層權(quán)值,直至誤差達(dá)到設(shè)定值。只要有足夠多的隱含層和隱含節(jié)點(diǎn),BP網(wǎng)絡(luò)就可以逼近任意的非線性函數(shù),它運(yùn)行速度快,學(xué)習(xí)能力強(qiáng),容錯(cuò)能力強(qiáng),具有較高的分辨率[16,17]。
BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層構(gòu)成,學(xué)習(xí)過程由信號(hào)的正向傳播與誤差的反向傳播組成[18]。
(1)信號(hào)正向傳播: 輸入信號(hào)從輸入層經(jīng)過隱層,傳向輸出層,該過程中網(wǎng)絡(luò)權(quán)值固定不變,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài),若在輸出層得不到預(yù)期的輸出,那么系統(tǒng)轉(zhuǎn)向誤差信號(hào)的傳播。
(2)誤差反向傳播: 誤差信號(hào)為實(shí)際輸出與期望輸出的差,它從輸出端傳向隱層,再到輸入層,該過程中網(wǎng)絡(luò)權(quán)值根據(jù)反饋進(jìn)行調(diào)節(jié),通過權(quán)值的不斷調(diào)整,網(wǎng)絡(luò)的實(shí)際輸出值越來越接近期望輸出值。權(quán)值不斷修正的過程,就是網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程,該過程一直持續(xù)到誤差達(dá)到設(shè)定值,或?qū)W習(xí)次數(shù)達(dá)到設(shè)定值。
3.2 BP神經(jīng)網(wǎng)絡(luò)分類器的設(shè)計(jì)
BP神經(jīng)網(wǎng)絡(luò)分類器的設(shè)計(jì),包括輸入層的設(shè)計(jì)、隱含層的設(shè)計(jì)、輸出層的設(shè)計(jì)以及初始權(quán)值、神經(jīng)元激勵(lì)函數(shù)、學(xué)習(xí)速率、期望誤差等參數(shù)的設(shè)計(jì)。構(gòu)建BP神經(jīng)網(wǎng)絡(luò)的步驟如下:
(1)設(shè)計(jì)輸入層: 輸入節(jié)點(diǎn)等于提取的圖像特征維數(shù),本文根據(jù)降維后的特征維數(shù),選擇實(shí)際的輸入節(jié)點(diǎn)。
(2)設(shè)計(jì)隱含層:
(a)隱層數(shù): 增加隱層數(shù)可以提高網(wǎng)絡(luò)的泛化性能,降低誤差,提高識(shí)別率,但也使網(wǎng)絡(luò)復(fù)雜化,訓(xùn)練時(shí)間增加。本文在對比降維效果時(shí)使用3層神經(jīng)網(wǎng)絡(luò),選擇BP神經(jīng)網(wǎng)絡(luò)最佳參數(shù)時(shí),對3層和4層網(wǎng)絡(luò)都進(jìn)行了分析。
(b)隱層神經(jīng)元數(shù): 隱層神經(jīng)元數(shù)的選擇要在一個(gè)合理的范圍內(nèi),數(shù)量太少,易陷入局部最小,訓(xùn)練出的網(wǎng)絡(luò)有可能不收斂,識(shí)別率低,容錯(cuò)性差;數(shù)量過多,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,泛化能力變差,訓(xùn)練時(shí)間增加,實(shí)時(shí)性降低,識(shí)別率也降低。實(shí)際應(yīng)用中參考經(jīng)驗(yàn)公式:
通過調(diào)整隱層神經(jīng)元數(shù)來提高誤差精度比增加隱層數(shù)更容易觀察和控制,所以,一般情況下先考慮改變隱層的神經(jīng)元數(shù)量,在單隱層不能滿足要求時(shí),再考慮增加隱層數(shù),但隱層的數(shù)量最好不超過兩層。理論上已經(jīng)證明:具有Sigmoid非線性函數(shù)的3層BP神經(jīng)網(wǎng)絡(luò)可以以任意的精度去逼近任何的連續(xù)函數(shù)。
(3)設(shè)計(jì)輸出層: 實(shí)際使用時(shí)直接把待識(shí)別目標(biāo)的種類數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸出節(jié)點(diǎn)數(shù)。本文隨機(jī)選擇了1類航天器進(jìn)行實(shí)驗(yàn)研究,輸出節(jié)點(diǎn)數(shù)設(shè)置為1,多類目標(biāo)識(shí)別同理。
(4)用均勻分布隨機(jī)數(shù)將權(quán)值和閾值初始化:
非線性系統(tǒng)中,權(quán)值和閾值的初始化十分重要,如果初始權(quán)值過大,會(huì)使加權(quán)后的輸入進(jìn)入激活函數(shù)的飽和區(qū),導(dǎo)致調(diào)節(jié)停滯。隨機(jī)化在BP模型的實(shí)現(xiàn)中尤為重要,如果不對權(quán)值進(jìn)行隨機(jī)初始化處理,可能導(dǎo)致學(xué)習(xí)過程不收斂。本文中,初始權(quán)值取(-1,1)之間的隨機(jī)數(shù)。
(5)給定神經(jīng)網(wǎng)絡(luò)的輸入樣本、期望輸出、神經(jīng)元激勵(lì)函數(shù)和學(xué)習(xí)速率: 激勵(lì)函數(shù)對網(wǎng)絡(luò)收斂效果有很大影響,神經(jīng)元每個(gè)輸入對應(yīng)一個(gè)特定權(quán)值,輸入的加權(quán)和決定該神經(jīng)元的激活狀態(tài);學(xué)習(xí)速率決定每次訓(xùn)練的權(quán)值變化量,太高導(dǎo)致網(wǎng)絡(luò)震蕩,太低導(dǎo)致收斂慢,訓(xùn)練時(shí)間長,一般情況下,傾向于選擇較小的學(xué)習(xí)速率以保證系統(tǒng)的穩(wěn)定性。本文期望誤差設(shè)為,隱層神經(jīng)元傳遞函數(shù)為正切型函數(shù)tansig,輸出層傳遞函數(shù)為線性函數(shù)purelin,訓(xùn)練函數(shù)為LM,學(xué)習(xí)次數(shù)設(shè)為5000。
(6)對樣本數(shù)據(jù)進(jìn)行訓(xùn)練: 將樣本數(shù)據(jù)讀入,得到隱含層和輸出層的實(shí)際輸出,計(jì)算隱含層誤差和輸出層誤差,如果誤差達(dá)不到設(shè)定值,將誤差信號(hào)沿原路線返回,并根據(jù)誤差反饋對網(wǎng)絡(luò)權(quán)值和閾值進(jìn)行修正,重復(fù)上述過程,直到誤差達(dá)到設(shè)定值,或者學(xué)習(xí)次數(shù)達(dá)到設(shè)定值,訓(xùn)練結(jié)束。
4 實(shí)驗(yàn)結(jié)果及分析
本文按照特征提取,特征降維,目標(biāo)分類訓(xùn)練和識(shí)別的順序進(jìn)行實(shí)驗(yàn)。在確定特征降維方案時(shí),使用3層BP神經(jīng)網(wǎng)絡(luò)從實(shí)時(shí)性和準(zhǔn)確性角度對比不同算法的優(yōu)缺點(diǎn),選擇性能較好的降維方法和特征維數(shù);在確定降維方案的基礎(chǔ)上,分別使用3層和4層BP神經(jīng)網(wǎng)絡(luò)對分類器參數(shù)進(jìn)行選擇,確定效果較好的識(shí)別方案。
(1)HOG特征提?。?目標(biāo)選擇Mars Express航天器,如圖1所示,利用3ds max制作角度和姿態(tài)不同的640×480像素的訓(xùn)練樣本794幅,測試樣本864幅。HOG特征提取參數(shù)設(shè)置如表1所示,訓(xùn)練樣本特征提取時(shí)間為83.219139 s,測試樣本為95.940454 s。
圖1 Mars Express 航天器
表1 HOG特征提取參數(shù)設(shè)置
(2)特征降維: 162維的HOG特征維數(shù)過多,造成冗余,對分類器的設(shè)計(jì)很不利,現(xiàn)將維數(shù)降至5~40維不等,通過降維和識(shí)別的綜合效果,選擇較好的降維算法和維度。各方法降維時(shí)間如表2所示,PCA計(jì)算簡單,運(yùn)算效率高,降維時(shí)間最短;流行學(xué)習(xí)算法LPP和SR,因?yàn)橐獬砻芫仃?,所以LPP降維時(shí)間較長,SR利用正則化最小二乘法避免了求解稠密矩陣,故而時(shí)間較短;KPCA, KSR, KLPP由于要將數(shù)據(jù)變換到核空間,所以降維時(shí)間都比較長,并且依次增加。
使用3層網(wǎng)絡(luò)對降維后的數(shù)據(jù)進(jìn)行訓(xùn)練識(shí)別,對比各降維算法性能,隱層神經(jīng)元數(shù)按照式(9)取值,訓(xùn)練和識(shí)別情況如圖2所示,圖2(a)為訓(xùn)練時(shí)間,圖2(b)為訓(xùn)練誤差,圖2(c)為識(shí)別時(shí)間,圖2(d)為識(shí)別率:訓(xùn)練時(shí)間和識(shí)別時(shí)間都隨特征維數(shù)的增加而增加,各方法差別不大;訓(xùn)練誤差隨特征維數(shù)的增加而減小,按照KPCA, KSR, KLPP, SR, LPP, PCA的順序,誤差依次增大;識(shí)別率隨特征維數(shù)的增加而增加,30維后趨于平緩,按照KPCA, KSR, KLPP, SR, LPP, PCA的順序,識(shí)別率依次減小。
綜合降維特性,訓(xùn)練性能和識(shí)別效果,SR在實(shí)時(shí)性、準(zhǔn)確性、網(wǎng)絡(luò)性能等各方面達(dá)到協(xié)調(diào),將SR與BP神經(jīng)網(wǎng)絡(luò)結(jié)合使用,能達(dá)到較好的識(shí)別效果;當(dāng)維數(shù)超過30維時(shí),識(shí)別率的上升趨于平緩,但訓(xùn)練時(shí)間和識(shí)別時(shí)間還在增加,綜合考慮實(shí)時(shí)性和準(zhǔn)確性,選擇30維的HOG特征進(jìn)行后續(xù)的訓(xùn)練識(shí)別。
(3)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練識(shí)別: 使用BP網(wǎng)絡(luò)進(jìn)行識(shí)別時(shí),隱層數(shù)和隱層神經(jīng)元數(shù)對識(shí)別的精度和時(shí)間都有很大影響。當(dāng)使用3層網(wǎng)絡(luò)時(shí),根據(jù)式(8)可知,隱層神經(jīng)元數(shù)取值范圍是7~16,將精度設(shè)置為,訓(xùn)練和識(shí)別性能隨隱層神經(jīng)元數(shù)的變化如圖3所示,圖3(a)為訓(xùn)練時(shí)間,圖3(b)為訓(xùn)練誤差,圖3(c)為識(shí)別時(shí)間,圖3(d)為識(shí)別率:隨著隱層神經(jīng)元數(shù)的增加,訓(xùn)練時(shí)間持續(xù)增加,訓(xùn)練誤差先降低后升高,識(shí)別時(shí)間先減少后增加,識(shí)別率先增加后降低。這說明隱層神經(jīng)元數(shù)并不是越多越好,會(huì)出現(xiàn)一個(gè)極值,經(jīng)過多次試驗(yàn),選擇最佳神經(jīng)元數(shù),才能保證最好的識(shí)別效果。3層網(wǎng)絡(luò)在神經(jīng)元數(shù)為13時(shí),效果最好,識(shí)別率達(dá)到100%。
4層網(wǎng)絡(luò)時(shí),隱層1和隱層2的神經(jīng)元依次取7~16之間的數(shù),進(jìn)行組合。若精度保持,識(shí)別率基本都接近100%,為了更清晰地反映隱層神經(jīng)元數(shù)對識(shí)別效果的影響,將精度調(diào)整為。如圖4所示,圖4(a)為訓(xùn)練時(shí)間,圖4(b)為訓(xùn)練誤
表2 各方法降維時(shí)間(s)
圖2 基于HOG特征的目標(biāo)訓(xùn)練與識(shí)別
圖3 基于HOG特征的3層網(wǎng)絡(luò)訓(xùn)練與識(shí)別
差,圖4(c)為識(shí)別時(shí)間,圖4(d)為識(shí)別率:訓(xùn)練時(shí)間隨神經(jīng)元數(shù)的增加而增加,識(shí)別時(shí)間規(guī)律性不大,訓(xùn)練誤差隨神經(jīng)元數(shù)的增加先減少后增加,識(shí)別率隨神經(jīng)元數(shù)的增加先增大后減小,出現(xiàn)了極大值。4層網(wǎng)絡(luò)在隱層神經(jīng)元數(shù)為(11, 9)時(shí),效果最好,識(shí)別率為100%。
綜合上述實(shí)驗(yàn)結(jié)果,在隱層數(shù)方面:4層網(wǎng)絡(luò)比3層網(wǎng)絡(luò)更穩(wěn)定,識(shí)別率也更高;在隱層神經(jīng)元數(shù)方面:一定范圍內(nèi),隨著隱層神經(jīng)元數(shù)的增加,識(shí)別率在增加,但是超過一定的限度,識(shí)別率會(huì)隨隱層神經(jīng)元數(shù)的增加而降低,出現(xiàn)極大值。本節(jié)確定分類器方案為:4層網(wǎng)絡(luò),隱層1神經(jīng)元為11,隱層2神經(jīng)元為9。
5 結(jié)束語
本文針對BP神經(jīng)網(wǎng)絡(luò)難以有效訓(xùn)練識(shí)別高維特征空間目標(biāo)的問題,將SR特征降維與BP神經(jīng)網(wǎng)絡(luò)配合使用,利用SR算法將高維特征降至低維,再輸入到BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提高了分類器性能。實(shí)驗(yàn)結(jié)果表明:該方法克服了傳統(tǒng)降維方法實(shí)時(shí)性和準(zhǔn)確性難兩全的問題,降維和識(shí)別特性優(yōu)于PCA, KPCA, LPP, KLPP等常用降維方法,特別適用于高維特征目標(biāo)識(shí)別。
圖4 基于HOG特征的4層網(wǎng)絡(luò)訓(xùn)練與識(shí)別
[1] 喬俊飛, 李淼, 劉江. 一種神經(jīng)網(wǎng)絡(luò)快速修剪算法[J]. 電子學(xué)報(bào), 2010, 38(4): 830-834.
QIAO Junfei, LI Miao, and LIU Jiang. A fast pruning algorithm for neural network[J]., 2010, 38(4): 830-834.
[2] 曾岳, 馮大政. 一種基于加權(quán)變形的2DPCA的人臉特征提取方法[J]. 電子與信息學(xué)報(bào), 2011, 33(4): 769-774. doi: 10.3724/ SP.J.1146.2010.01003.
ZENG Yue and FENG Dazheng. An algorithm of feature extraction of face based on the weighted variation of 2DPC[J].&, 2011, 33(4): 769-774. doi: 10.3724/SP.J.1146.2010.01003.
[3] 馬原, 呂群波, 劉揚(yáng)陽. 基于主成分變換的圖像稀疏度估計(jì)方法[J]. 物理學(xué)報(bào), 2013, 62(20): 204202-1-204202-11. doi: 10.7498/aps.62.204202.
MA Yuan, Lü Qunbo, and LIU Yangyang. Image sparsity evaluation based on principle component analysis[J]., 2013, 62(20): 204202-1-204202-11. doi: 10.7498/aps.62.204202.
[4] 孫韶媛, 李琳娜, 趙海濤. 采用KPCA和BP神經(jīng)網(wǎng)絡(luò)的單目車載紅外圖像深度估計(jì)[J]. 紅外與激光工程, 2013, 42(9): 2348-2352.
SUN Shaoyuan, LI Linna, and ZHAO Haitao. Depth estimation from monocular vehicle infrared images based on KPCA and BP neural network[J]., 2013, 42(9): 2348-2352.
[5] ZHENG W, LAI J, and YUEN P C. Penalized preimage learning in kernel principal component analysis[J]., 2010, 21(4): 551-570.
[6] ZHANG L M, QIAO L S, and CHEN S C. Graph-optimized locality preserving projections[J]., 2010, 43(6): 1993-2002.
[7] 張志偉, 楊帆, 夏克文, 等. 一種有監(jiān)督的LPP算法及其在人臉識(shí)別中的應(yīng)用[J]. 電子與信息學(xué)報(bào), 2008, 30(3): 539-541.
ZHANG Zhiwei, YANG Fan, XIA Kewen,. A supervised LPP algorithm and its application to face recognition[J].&, 2008, 30(3): 539-541.
[8] 于攀, 葉俊勇. 基于譜回歸和核空間最近鄰的基因表達(dá)數(shù)據(jù)分類[J]. 電子學(xué)報(bào), 2011, 39(8): 1955-1960.
YU Pan and YE Junyong. Spectral regression and kernel space K-nearest neighbor for classification of gene expression data[J]., 2011, 39(8): 1955-1960.
[9] NARNEET D and BILL T. Histograms of oriented gradients for human detection[C]. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, San Diego, 2005: 886-893.
[10] SU X, LIN W, ZHENG X,. A new local-main gradient orientation HOG and contour differences based algorithm for object classification[C]. IEEE International Symposium on Circuits and Systems, Beijing, 2013: 2892-2895.
[11] 羅會(huì)蘭, 鐘寶康, 孔繁勝. 帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法[J]. 電子與信息學(xué)報(bào), 2015, 37(5): 1160-1166. doi: 10.11999/JEIT140997.
LUO Huilan, ZHONG Baokang, and KONG Fansheng. Tracking using weighted block compressed sensing and location prediction[J].&, 2015, 37(5): 1160-1166. doi: 10.11999/ JEIT140997.
[12] 韓貴金, 朱虹. 基于HOG和顏色特征融合的人體姿態(tài)估計(jì)[J]. 模式識(shí)別與人工智能, 2014, 27(9): 769-777.
HAN Guijin and ZHU Hong. Human pose estimation based on fusion of HOG and color feature[J]., 2014, 27(9): 769-777.
[13] 宋丹, 唐林波, 趙保軍. 基于仿射梯度方向直方圖特征的目標(biāo)識(shí)別算法[J]. 電子與信息學(xué)報(bào), 2013, 35(6): 1428-1434. doi: 10.3724/SP.J.1146.2012.01241.
SONG Dan, TANG Linbo, and ZHAO Baojun. The object recognition algorithm based on affine histogram of oriented gradient[J].&, 2013, 35(6): 1428-1434. doi: 10.3724/SP.J.1146.2012.01241.
[14] 姜偉, 張晶, 揚(yáng)炳儒. 自適應(yīng)正則化核二維判別分析[J]. 模式識(shí)別與人工智能, 2014, 27(12): 1089-1097.
JIANG Wei, ZHANG Jing, and YANG Bingru. Adaptive regularization based kernel two dimensional discriminant analysis[J]., 2014, 27(12): 1089-1097.
[15] 孫麗娟. 基于譜回歸的人臉識(shí)別的研究[D]. [碩士論文], 重慶大學(xué), 2009.
SUN Lijuan. Research on the face recognition based on spectral regression[D]. [Master dissertation], Chongqing University, 2009.
[16] 潘煒深, 金連文, 馮子勇. 基于多尺度梯度及深度神經(jīng)網(wǎng)絡(luò)的漢字識(shí)別[J]. 北京航空航天大學(xué)學(xué)報(bào), 2015, 41(4): 751-756. doi: 10.13700/j.bh. 1001-5965.2014.0499.
PAN W S, JIN L W, and FENG Z Y. Recognition of Chinese characters based on multi-scale gradient and deep neural network[J]., 2015, 41(4): 751-756. doi: 10.13700/j.bh. 1001-5965.2014.0499.
[17] 張海燕, 李欣, 田書峰. 基于BP神經(jīng)網(wǎng)絡(luò)的仿真線設(shè)計(jì)及其FPGA實(shí)現(xiàn)[J]. 電子與信息學(xué)報(bào), 2007, 29(5): 1262-1265.
ZHANG Haiyan, LI Xin, and TIAN Shufeng. Simulation line design and its FPGA realization based on BP neural network[J].&, 2007, 29(5): 1262-1265.
[18] 孫瓊, 王光飛. 基于BP神經(jīng)網(wǎng)絡(luò)與HMM的駕駛狀態(tài)識(shí)別[C]. 2014中國汽車工程學(xué)會(huì)年會(huì), 上海, 2014: 430-432.
SUN Qiong and WANG Guangfei. Driving state recognition based on BP neural network and HMM[C]. 2014 SAE-China Congress & Exhibition, Shanghai, 2014: 430-432.
鄔戰(zhàn)軍: 男,1971年生,高級(jí)工程師,研究方向?yàn)楣饫w傳感技術(shù).
牛 敏: 女,1991年生,碩士生,研究方向?yàn)槟繕?biāo)檢測與識(shí)別.
許 冰: 女,1984年生,博士生,研究方向?yàn)槟繕?biāo)檢測與識(shí)別.
Research on Recognition Method Based on Spectral Regression and Back Propagation Neural Network
WU Zhanjun NIU Min XU Bing NIU Yanxiong GENG Tianqi ZHANG Fan MAN Da
(Department of Instrument Science and Opto-Electronics Engineering, Beihang University, Beijing 100191, China)
When using Back Propagation (BP) neural network to recognize the spatial target, the high dimensional input features induce the complexity of the network structure and the poor performance of the recognition. In this paper, a new recognition method based on Spectral Regression (SR) feature dimension reduction and BP neural network is proposed for the above difficulties. Firstly, the HOG features are extracted from the spatial object, and then the feature dimensions are reduced by SR. Finally, the BP classifier is used to train the data. Experimental results show that the proposed method is better than the traditional dimension reduction methods such as PCA, KPCA, LPP, KLPP in dimension reduction and recognition, which can juggle real-time and accuracy, thus improving the recognition performance.
Target recognition; Back Propagation (BP) neural network; Spectral Regression (SR); Feature dimension reduction
TP391.4
A
1009-5896(2016)04-0978-07
10.11999/JEIT150781
2015-06-29;改回日期:2015-11-09;網(wǎng)絡(luò)出版:2015-12-18
牛敏 niuminbuaa@163.com