袁 野,張偉科,許左宏
(1.中國人民解放軍32806部隊,北京 100091;2.中國人民解放軍96901部隊,北京 100094;3.軍事科學(xué)院系統(tǒng)工程研究院,北京 100141)
信號波達方向(Direction of Arrival,DOA)估計技術(shù)主要應(yīng)用于目標(biāo)的方位識別與跟蹤場合,因此具有重要的理論研究價值與實際工程應(yīng)用意義,一直以來都有眾多國內(nèi)外學(xué)者對其進行研究,并由此誕生了許多優(yōu)秀的波達方向估計算法。
早在幾十年前,國外學(xué)者便提出了各種經(jīng)典的波達方向解算方法,如多重信號分類(Multiple Signal Classification,MUSIC)算法[1]和旋轉(zhuǎn)不變子空間算法(Estimating Signal Parameter via Rotational Invariance Techniques,ESPRIT)[2],以及各種衍生的高效算法,如root-MUSIC算法[3]、TLS-ESPRIT算法[4]等。然而,上述這些算法時效性較差,或者只是在算法效率或者性能上做出了改進,仍然無法規(guī)避特征值或奇異值分解所帶來的復(fù)雜矩陣計算。因此,需要尋找一些更高效的波達方向估計方法。
近年來,隨著人工智能技術(shù)的發(fā)展,一些基于機器學(xué)習(xí)的信號DOA估計技術(shù)漸漸被學(xué)者提出,徑向基函數(shù)[5]、支持向量機[6]等優(yōu)秀的算法模型被引入進來。這些算法相比于傳統(tǒng)的子空間算法,其計算效率得到了明顯的提升。然而,往往一種機器學(xué)習(xí)算法只適用于特定的某幾種信號環(huán)境與場合,不具備普適性。
深度神經(jīng)網(wǎng)絡(luò)的盛行使得一些較為復(fù)雜的凸優(yōu)化問題得到了很好的解決辦法[7]。1998年,Lecun等人[8]在解決手寫數(shù)字識別的問題時,提出了LeNet網(wǎng)絡(luò),成為了卷積神經(jīng)網(wǎng)絡(luò)的經(jīng)典模型。此后學(xué)者們提出了更多經(jīng)典網(wǎng)絡(luò),如AlexNet[9]、VGG系列網(wǎng)絡(luò)[10]以及GoogLeNet[11]等。這些深度網(wǎng)絡(luò)在圖像識別與分類問題上展現(xiàn)了較強的解算能力與運算效率。
DOA估計作為一種典型的凸優(yōu)化問題[12],在理論上也可以利用深度網(wǎng)絡(luò)算法來求解,且已經(jīng)有眾多學(xué)者對此展開了研究。神經(jīng)網(wǎng)絡(luò)算法是一種通過數(shù)據(jù)驅(qū)動的算法[13],因此基于該方法的DOA估計不需要天線陣列或者信號的先驗信息。文獻[14]中將空域劃分成多個區(qū)域,并利用一組深度神經(jīng)網(wǎng)絡(luò)來同時對各個區(qū)域中的信號DOA進行訓(xùn)練,得到了不錯的效果。然而,多個網(wǎng)絡(luò)并行的算法策略對計算機的硬件性能提出了很高的要求,且兩個目標(biāo)在空間中不能間隔過近,否則算法將失去適應(yīng)性。
本文從圖像的角度分析了信號協(xié)方差矩陣的圖像特征,并利用深度卷積網(wǎng)絡(luò)設(shè)計了一種適用于均勻圓陣的DOA估計網(wǎng)絡(luò)。該網(wǎng)絡(luò)結(jié)構(gòu)較為簡便,計算效率高,且估計精度與傳統(tǒng)超分辨算法相近,工作性能穩(wěn)定,具有較好的后續(xù)研究價值與工程應(yīng)用價值。
假設(shè)共有D個信號入射到一組包含M個全向單元天線的均勻圓陣上,其中第i個信號的入射方向為(θi,φi),圓陣的半徑為r。在第n個快拍所得到的陣列輸出信號x(tn)可以由下列公式計算得到:
(1)
a(θi,φi)=[e-jω0τ1i,e-jω0τ2i,…,e-jω0τMi]T
(2)
x(tn)=As(tn)+v(tn),n=1,2,…,N
(3)
式(3)中:A=[a(θ1),a(θ2),…,a(θD)]表示均勻圓陣的陣列流形;s(tn)和v(tn)分別表示陣列接收到的信號向量和噪聲向量。得到x(tn)之后,陣列輸出協(xié)方差矩陣R可以由下式得出:
(4)
傳統(tǒng)波達方向估計算法通過解算信號的噪聲子空間,并試圖在子空間譜中搜索關(guān)于θi和φi的信息(如MUSIC算法)[1]。雖然基于子空間的算法可以達到超分辨估計的效果,但是這種做法的缺點也是顯而易見的:解算子空間的步驟中包含了復(fù)雜的特征值分解計算,往往使得算法缺乏實時性;對于多信號入射的情況,子空間算法的效果與陣列包含的陣元數(shù)目密切相關(guān),對于間隔較近的兩個角度無法很好地進行解算。
為了解決上述問題,本文提出從圖像的角度來理解R矩陣的概念。從式(4)可以看出,計算得到的R矩陣的形式是一個尺寸為M×M的復(fù)矩陣。將R矩陣的實部Rreal與虛部Rimag分別看作是兩個單獨的矩陣,則這兩個矩陣可以作為R矩陣的兩個通道,組成一個大小為2@M×M的類圖像張量。圖1展示了不同Rreal的圖像特征,從上到下信號的方位角θ=30°,50°和70°,從左到右信號的俯仰角φ=60°,70°和80°,且信噪比分別為0 dB,10 dB和20 dB。
圖1 協(xié)方差矩陣實部的圖像特征Fig.1 Image features of the real part of covariance matrices
從圖像角度可以看出,不同角度對應(yīng)的Rreal有著明顯的區(qū)別,相同角度對應(yīng)的Rreal又有著較為相近的圖案,因此理論上可以利用矩陣圖像域中包含的細微特征對信號的入射角度進行解算。由于天線在空間中接收的信號強度在統(tǒng)計學(xué)角度服從隨機高斯分布[15],且空間中的信噪比也具有隨機性,因此對于相同的入射信號,每次采樣計算出的R也會有所不同。從圖像角度來觀察這一現(xiàn)象,可以認(rèn)為所有的隨機性都是在圖像主體特征上添加一定的擾動而形成的。對于解算信號波達方向的問題,只要R的主體特征依然包含在矩陣其中,便可以精確解出各個信號的入射方位。
作為一種有效的監(jiān)督學(xué)習(xí)方法,深度卷積網(wǎng)絡(luò)被廣泛應(yīng)用于處理圖像分類與識別的種種問題[7],其最經(jīng)典的LeNet卷積網(wǎng)絡(luò)模型在手寫數(shù)字圖像識別領(lǐng)域有著令人驚嘆的表現(xiàn)。由于R經(jīng)過處理后可以形成新的2@M×M類圖像張量,因此本文將利用深度卷積網(wǎng)絡(luò)從圖像域的角度來解決波達方向估計的問題。
文獻[14]中提出了一種利用深度神經(jīng)網(wǎng)絡(luò)組來進行一維波達方向估計的方法,將陣列的接收信號向量直接作為網(wǎng)絡(luò)的輸入張量,并將空間劃分為大小相等的幾個區(qū)域,然后利用并行深度神經(jīng)網(wǎng)絡(luò)來對各個空間區(qū)域內(nèi)所包含的接收信號進行方位估計。但是,其有以下不足:一是劃分空域雖然解決了分類過多的困難,但多組網(wǎng)絡(luò)并行計算的方案嚴(yán)重加劇了計算機的運算負(fù)擔(dān);二是對于兩個信號入射角相鄰過近的情況(兩個目標(biāo)的到達角度相差小于10°),該網(wǎng)絡(luò)組無法對所有目標(biāo)的波達方位進行有效估計。
本文提出利用R來作為網(wǎng)絡(luò)的輸入張量,通過卷積操作對輸入張量中的細微特征進行進一步提取,再通過全連接網(wǎng)絡(luò)將輸入的R圖像張量映射到角度域上,從而得到空間內(nèi)信號的波達方向估計的精確信息。
本文所提出的深度卷積網(wǎng)絡(luò)架構(gòu)如圖2(a)所示。該網(wǎng)絡(luò)由2個卷積測向網(wǎng)絡(luò)和1個參數(shù)匹配網(wǎng)絡(luò)構(gòu)成,2個卷積網(wǎng)絡(luò)CNN1和CNN2分別實現(xiàn)對θ和φ的估計功能,參數(shù)匹配網(wǎng)絡(luò)DNN可以將多個θ和φ進行兩兩配對。CNN1和CNN2接收的輸入是尺寸為2@8×8的張量,代表著8陣元均勻圓陣所接收計算的信號協(xié)方差矩陣類圖像張量,網(wǎng)絡(luò)輸出為空域中包含的角度譜。DNN的輸入是將R拉直后的向量,輸出的是匹配信息。
圖2 用于信號波達方向估計的深度卷積網(wǎng)絡(luò)架構(gòu)Fig.2 The CNN framework used for DOA estimation
卷積測向網(wǎng)絡(luò)CNN1和CNN2的結(jié)構(gòu)如圖2(b)所示,它包含2個卷積層、3個全連接層以及1個輸出層。卷積層C1包含4個特征映射單元,首先通過C1層對R中隱藏的淺層特征進行提取。C1層的卷積核是一個4×4的矩陣,這意味著特征映射單元中的每一個單位都與輸入張量的2@4×4部分區(qū)域相連。為了使得卷積操作能夠從R中獲得較多的信息,卷積核的移動步進設(shè)置為1,且卷積后將得到的特征映射單元填充至與輸入相同大小。
C1做完卷積操作后,將得到尺寸為4@8×8的特征張量,并作為C2層的輸入。C2層依然是一個包含了16個特征映射單元的卷積層,其作用是繼續(xù)利用卷積操作來挖掘包含在R圖像中的深層特征。與C1層相同,C2層依然采用尺寸為4×4的卷積核,步進為1且輸入填充至與C1層輸出相同大小。C2層的輸出為一個尺寸是16@8×8的特征張量,每一個特征單元都對應(yīng)了屬于R圖像的一種隱藏特征。
在傳統(tǒng)的深度卷積網(wǎng)絡(luò)之中,做完卷積操作之后往往會接著進行張量的池化操作。然而,在本文所提出的網(wǎng)絡(luò)中,池化操作被省略了:由于天線陣列對空間的采樣有限(僅能得到尺寸為8×8的協(xié)方差矩陣),對網(wǎng)絡(luò)的輸入張量進行降維池化會減少輸入中包含的信息量,從而導(dǎo)致網(wǎng)絡(luò)的擬合效果下降。因此,本文提出的卷積網(wǎng)絡(luò)中,卷積部分未包含池化操作,卷積后的輸出直接作為全連接網(wǎng)絡(luò)部分的輸入來使用。
將C2層的輸出張量拉直后便可以作為全連接網(wǎng)絡(luò)的輸入張量。通過全連接網(wǎng)絡(luò)部分后,將會得到入射信號的空間角度譜,使得網(wǎng)絡(luò)完成波達方向的功能。D3,D4和D5這3層網(wǎng)絡(luò)都是包含了600個神經(jīng)單元的全連接層。關(guān)于每層使用的激活函數(shù)的選取,在這里選擇非線性的Sigmoid函數(shù)來處理網(wǎng)絡(luò)輸出的向量。為了防止網(wǎng)絡(luò)在訓(xùn)練中出現(xiàn)過擬合的情況,每一層都使用了L2正則化技術(shù)來限制待優(yōu)化參數(shù)的變化范圍,正則化參數(shù)k設(shè)定為0.005。
輸出層為包含90個單元的全連接層,第i個輸出單元代表著在空間中角度為i的位置上的信號響應(yīng)強度。由于本文僅是對基于深度學(xué)習(xí)的二維波達估計技術(shù)進行簡單驗證,因此只選取了1/4空間進行信號采樣(即θ∈[1°,90°],φ∈[1°,90°]),若要使得該技術(shù)應(yīng)用于更大的區(qū)域,只需要改變網(wǎng)絡(luò)的輸出單元個數(shù),并將空間域中的信號采樣范圍進行擴大即可。從網(wǎng)絡(luò)隱藏層輸出的特征向量被作為輸出層的輸入向量。由于波達方向估計的問題也可以視為是一種特殊的圖像分類問題(即將每一個計算出的R圖像分到正確的空間角度類別中),因此Softmax分類器函數(shù)便是輸出層激活函數(shù)很好的一個選擇。在Softmax分類器輸出空間角度譜之后,可以再將結(jié)果通過ReLU函數(shù)層來去除角度譜中包含的負(fù)數(shù)分量,從而使得網(wǎng)絡(luò)最終的輸出角度譜既精確又直觀。
假設(shè)空間中只存在2個入射信號,其入射方向分別為(θ1,φ1)和(θ2,φ2),根據(jù)數(shù)學(xué)中排列組合的知識,共有2種配對方式。因此,可以用包含2個輸出單元的網(wǎng)絡(luò)來解算配對結(jié)果。本文設(shè)計了一個3層的DNN來對θ和φ進行配對,配合估計網(wǎng)絡(luò)完成最終的目標(biāo)測向任務(wù)。該參數(shù)匹配的網(wǎng)絡(luò)架構(gòu)如圖3所示。DNN共包含4層,1個輸入層、2個全連接層以及1個輸出層。輸入層所完成的工作是將整個2@8×8的輸入張量拉直后傳輸給下一層。全連接層D1和D2分別包含128和64個單元,這兩層網(wǎng)絡(luò)的激活函數(shù)都為Sigmoid函數(shù)。最后的二單元輸出層利用Softmax激活函數(shù)進行分類,得到最終配對結(jié)果。
圖3 參數(shù)匹配網(wǎng)絡(luò)架構(gòu)Fig.3 Framework of the parameter matching network
值得注意的是,雖然圖3中將信號數(shù)M固化為2,但該參數(shù)匹配網(wǎng)絡(luò)的架構(gòu)依然適用于M>2的場景,此時只需要將網(wǎng)絡(luò)的輸出單元個數(shù)改為M!即可。
本文中提出的深度卷積網(wǎng)絡(luò)是通過經(jīng)典的反向傳播算法來對網(wǎng)絡(luò)中的參數(shù)進行訓(xùn)練與更新,因此有必要對網(wǎng)絡(luò)待優(yōu)化參數(shù)的梯度下降程度做出可靠的保證,使得在訓(xùn)練網(wǎng)絡(luò)時不會出現(xiàn)梯度爆炸或者梯度消失的情況[7]。
除了輸出層的激活函數(shù)選擇為Softmax函數(shù)之外,其余層都選取運算量少、輸出效果較好的Sigmoid函數(shù)作為激活函數(shù)。然而,當(dāng)待優(yōu)化參數(shù)的值不在0值附近時,經(jīng)過Sigmiod函數(shù)后參數(shù)的梯度會下降得異常緩慢[7]。本文通過引入?yún)?shù)標(biāo)準(zhǔn)化的操作來避免出現(xiàn)上述問題。
參數(shù)標(biāo)準(zhǔn)化技術(shù)是將輸入y中的所有分量映射到0附近一段較小區(qū)間的一種運算技巧,其具體操作見下式:
(5)
將參數(shù)正則化技術(shù)配合Sigmoid函數(shù)一起使用,便可以避免網(wǎng)絡(luò)訓(xùn)練過程中產(chǎn)生梯度消失的問題。
從2.2節(jié)中可以看到,在全連接網(wǎng)絡(luò)部分引入了L2正則化技術(shù)來減輕網(wǎng)絡(luò)過擬合現(xiàn)象,然而,在網(wǎng)絡(luò)層數(shù)較多的情況下,這樣操作依然無法保證過擬合現(xiàn)象不會發(fā)生,因此本文又引入了Dropout技術(shù)對網(wǎng)絡(luò)進行進一步改進。在全連接網(wǎng)絡(luò)部分,每個全連接層之后都會插入一個Dropout層,其中鏈接斷開的概率設(shè)置為0.2,這樣既能保證網(wǎng)絡(luò)的泛化程度足夠,又能防止過擬合現(xiàn)象的發(fā)生。
假設(shè)空間中存在2個相互獨立且入射角度不同的信號,其波長為λ;采樣天線陣列為一組包含8個點源陣的均勻圓陣,陣元之間間隔λ/2,采樣快拍數(shù)設(shè)置為512。信號的方位角θ與俯仰角φ均在[1°,90°]的范圍內(nèi)隨機產(chǎn)生,空間信噪比也在0~20 dB內(nèi)隨機選取,共產(chǎn)生100萬個訓(xùn)練樣本和2 000個測試樣本。
訓(xùn)練樣本和測試樣本的標(biāo)簽集生成方式如下:若天線陣列在某一空間角度上接收到信號,則理想的角度譜會在這一角度位置產(chǎn)生一個沖激響應(yīng),而沒有信號存在的其他角度響應(yīng)為0??紤]到深度卷積網(wǎng)絡(luò)是一種分類器,其最終輸出是每一類的概率密度函數(shù),因此所生成的標(biāo)簽集也應(yīng)該符合這一特性,即輸出的概率在[1°,90°]范圍內(nèi)累加結(jié)果為1,因此可以依照下式來生成合適的標(biāo)簽集:
(6)
式中:δ(·)表示單位沖激函數(shù);D表示信號個數(shù)。
生成了可以用來訓(xùn)練與驗證網(wǎng)絡(luò)的數(shù)據(jù)集后,便可以對網(wǎng)絡(luò)進行訓(xùn)練,并觀察網(wǎng)絡(luò)的實際工作表現(xiàn)與性能。
圖4給出了一組雙目標(biāo)信號的仿真波達估計結(jié)果,可以看出,本文提出的深度卷積網(wǎng)絡(luò)能夠很好地完成雙目標(biāo)波達方向估計的任務(wù)。相比較于具有超分辨特性的MUSIC算法,網(wǎng)絡(luò)得到的空間角度譜更加簡單直觀,且精度較MUSIC算法有所提升,網(wǎng)絡(luò)輸出譜線與理想譜線幾乎重合。同時,相比文獻[14]中的網(wǎng)絡(luò),本文提出的網(wǎng)絡(luò)對于入射角相鄰的兩個信號也有很好的分辨能力,甚至比MUSIC算法的分辨率還要高。
(a)方位角結(jié)果
信號分辨率的仿真結(jié)果如圖5所示,可以看出,本文提出的網(wǎng)絡(luò)在兩個信號入射角度間隔小于5°的情況下也可以給出十分精確的估計。
圖5 相鄰雙目標(biāo)信號仿真估計結(jié)果Fig.5 RMSE results of two adjacent signals
下面對網(wǎng)絡(luò)輸出的均方根誤差(Root Mean Square Error,RMSE)進行仿真來進一步分析網(wǎng)絡(luò)的穩(wěn)定性,結(jié)果如圖6所示,其中圖6(a)的快拍數(shù)設(shè)置為512,圖6(b)的信噪比設(shè)置為10 dB,其余仿真條件相同。
(a)RMSE與SNR之間的關(guān)系
由圖6可以得知,本文所提出的深度卷積網(wǎng)絡(luò)波達方向估計方法對于信噪比不敏感,這是由于該方法運用的是天線輸出協(xié)方差矩陣的圖像特性進行估計,而不是利用相對于信噪比敏感的子空間方法。然而,深度卷積網(wǎng)絡(luò)估計方法對快拍數(shù)較為敏感,在較小快拍采樣的條件下也無法很好地對信號進行估計,但在較大快拍采樣(快拍數(shù)大于500)時性能較好且穩(wěn)定。
值得注意的是,信號的快拍數(shù)是信號能量信噪比的一種度量,快拍數(shù)越多,信號的能量信噪比越大[16]。從仿真結(jié)果來看,本文方法存在一個能量信噪比的門限效應(yīng),當(dāng)目標(biāo)信號的能量信噪比大于一定門限,即快拍數(shù)大于500后,本文方法的性能較為良好且穩(wěn)定;當(dāng)目標(biāo)信號的能量信噪比小于該門限,本文方法的性能隨著能量信噪比的降低而降低。
綜合上文中的實驗,可以看出本文提出的深度卷積網(wǎng)絡(luò)能夠穩(wěn)定有效地解決波達方向估計問題,具有很高的后續(xù)研究價值。
本文針對波達方向估計的問題,設(shè)計了一種適用于均勻圓陣的深度卷積網(wǎng)絡(luò),能夠快速高效地對空間中兩個目標(biāo)的方位角進行精確估計。實驗結(jié)果表明該網(wǎng)絡(luò)的性能較為可靠。相比于傳統(tǒng)空間譜估計算法,本文提出的方法在保證估計精度的前提下避免了復(fù)雜的矩陣求解與運算,大大提高了角度譜的計算速度。相比于文獻[14]中提出的深度神經(jīng)網(wǎng)絡(luò)組,本文提出的網(wǎng)絡(luò)降低了算法對計算機的性能要求,且估計精度得到了有效提升。此外,本文設(shè)計的網(wǎng)絡(luò)僅對高斯信號有效,這是由于基于深度學(xué)習(xí)的波達方向估計方法是通過數(shù)據(jù)驅(qū)動的,在網(wǎng)絡(luò)訓(xùn)練時僅使用了高斯信號的采樣數(shù)據(jù)進行訓(xùn)練。若想使得網(wǎng)絡(luò)能夠適應(yīng)多種信號的復(fù)雜環(huán)境,只需要在網(wǎng)絡(luò)的訓(xùn)練集中增加不同信號并形成訓(xùn)練數(shù)據(jù)即可。
將深度卷積網(wǎng)絡(luò)應(yīng)用于圓陣天線的二維多重信號波達方向估計會進一步提高該技術(shù)的工程應(yīng)用價值,可以作為今后的目標(biāo)進行研究。