朱東升,宿曉靜,劉晉偉,郝程鵬
(中國科學(xué)院 聲學(xué)研究所,北京,100190)
恒虛警檢測(constant false alarm rate,CFAR)方法被廣泛應(yīng)用在雷達或者聲吶檢測系統(tǒng)中。CFAR的基本原理是在保證虛警概率恒定的前提下,根據(jù)待檢測單元的前沿和后沿參考單元估計背景干擾的平均功率,將其作為檢測閾值,從而判斷待檢測單元是否存在目標[1]。早期得到應(yīng)用的CFAR檢測方法是Finn 等[2]提出的單元平均恒虛警檢測器(cell average-CFAR,CA-CFAR)。該方法在均勻瑞利干擾背景下具有較好的檢測性能,但是在多目標環(huán)境中其檢測性能有所下降。為了克服在多目標干擾環(huán)境下CA-CFAR 檢測能力下降的缺點,研究人員提出了一系列解決方法。Trun[3]提出了最小恒虛警檢測器(smallest of CFAR,SO-CFAR),當干擾目標只出現(xiàn)在前沿參考滑窗或后沿參考滑窗中時,SO-CFAR 具有較好的性能,但是當前后沿滑窗中均出現(xiàn)干擾時,SO-CFAR 的性能不足。Rohling[4]提出了基于排序統(tǒng)計的恒虛警檢測器(order statistics-CFAR,OS-CFAR),該檢測器選擇排序統(tǒng)計量中第k個最大的統(tǒng)計量作為背景噪聲估計。當干擾目標個數(shù)小于k值時,該檢測器具有較好的檢測性能,但由于該檢測器只選擇了單個統(tǒng)計量作為背景估計,導(dǎo)致背景信息利用不夠充分,同時當干擾目標個數(shù)大于k值時,檢測器的性能下降比較嚴重。在OS-CFAR 的基礎(chǔ)上,Rakiard[5]和Zaimbashi 等[6]分別提出了刪除均值檢測器(censored mean level detector,CMLD)和刪除平均(trimmed mean,TM)方法,上述2 種方法和OS-CFAR 同樣依賴于固定的門限序值。當門限序值選擇過小時,檢測器的抗干擾能力會嚴重下降。當門限序值選擇過大時,則對背景統(tǒng)計量利用不夠充分,檢測損失變大。
針對固定門限序值選擇導(dǎo)致的問題,研究人員提出了基于排序數(shù)據(jù)方差[7-9](order data variability,ODV)的一系列自適應(yīng)檢測器,包括自動刪除單元平均(automatic censored cell-averaging,ACCA-CFAR)及其擴展ACMLD(automatic censored mean level detector),MACCA(modified automatic censored cellaveraging)等方法,該類方法通過計算背景參考的ODV 指數(shù)剔除掉可能的干擾目標單元,動態(tài)選擇門限序值,進而得到背景功率,以提高檢測器對抗干擾目標的檢測能力。該類方法從本質(zhì)上沒有解決門限設(shè)定的問題,門限S并不會動態(tài)調(diào)整,而門限S的選取會間接影響到檢測器的最終性能。
研究人員嘗試利用機器學(xué)習(xí)對CFAR 檢測器性能進行提升。王皓[10]和Wang[11]等分別利用神經(jīng)網(wǎng)絡(luò)和支持向量機(support vector machine,SVM)解決均勻背景和非均勻背景下最優(yōu)檢測器的選擇問題,以達到在特定環(huán)境下的最優(yōu)檢測性能。但是上述研究對檢測器本身的性能沒有進一步討論。另外,部分研究人員利用決策樹對雷達干擾信號進行識別,證明機器學(xué)習(xí)的方法能夠有效識別雷達檢測中的有源干擾目標[12-14]。遺憾的是對于后續(xù)的目標檢測問題沒有進一步研究。
針對上述檢測器存在的不足,文中通過引入回歸模型來估計當前檢測環(huán)境的干擾目標個數(shù),然后完成自適應(yīng)檢測。首先,通過樣本數(shù)據(jù)和TreeBagger算法訓(xùn)練得到用于估計干擾目標個數(shù)的估計器。然后,在實際檢測過程中,將參考單元作為模型輸入,并認為模型輸出k為當前環(huán)境的干擾目標個數(shù)。將參考單元進行降序排列,并認為序列中前k個單元為干擾目標。選擇剩余參考單元的均值作為背景估計,然后計算對應(yīng)的門限進行檢測。文中稱上述檢測方法為TB-CFAR(TreeBagger-CFAR),同時分析了該檢測器在均勻混響背景和不同多目標環(huán)境下的檢測性能。
TreeBagger[15]是一種決策樹的整合算法,通過Bootstrap[16]對樣本集進行有放回的采樣,形成多個子樣本集,然后針對每個子樣本集進行決策樹回歸模型的構(gòu)建,取所有回歸模型的算術(shù)平均作為最終的預(yù)測值。TreeBagger 算法的實現(xiàn)過程[17]如下所示:
1) 假設(shè)存在樣本集S={{x0,y0},{x1,y1},···,{xN?1,yN?1}},其中xi為樣本的特征向量,yi為對應(yīng)特征向量的標記輸出。
2) 通過Bootstrap 算法,構(gòu)造M個子樣本集為S0,S1,···,SM?1。
3) 分別針對各個子樣本集構(gòu)建決策樹模型,且每個決策樹存在輸出值Cm,則有
4) 對于每個子樣本集對應(yīng)的決策樹,其平方誤差表示為
5) 每個決策樹的最優(yōu)輸出值為使平方誤差最小時的取值,則樣本Sm上Cm的最優(yōu)值是Sm上所有輸入樣本xi對應(yīng)的輸出yi的均值,即
6) 選擇最優(yōu)切分變量j和切分點r,求解
7) 將樣本集Sm中的樣本劃分到區(qū)域S1和S2,構(gòu)成回歸樹。最終樣本集構(gòu)成M個決策樹預(yù)測模型hm,則模型的輸出表示為
利用TreeBagger 回歸算法構(gòu)建檢測環(huán)境下干擾目標個數(shù)的估計器,并將前后沿參考單元作為估計器的輸入。估計器的輸出值為干擾目標個數(shù),其值必為整數(shù),故取輸出y值向負方向舍入的整數(shù)值,即干擾目標個數(shù)k=floor(y),但k不小于零。
TreeBagger 回歸算法的性能主要通過3 個方面來進行衡量:模型的擬合度、泛化誤差和計算復(fù)雜度。
模型的擬合程度是模型最直接的評價指標,代表模型對真實數(shù)據(jù)的因變關(guān)系的描述程度。模型的擬合度高,即代表模型能夠較好地描述數(shù)據(jù)直接的因變關(guān)系,反之則表示模型的描述能力差。典型的擬合度描述指標有均方誤差、決定系數(shù)和校正決定系數(shù)[18],其中校正決定系數(shù)是決定系數(shù)的擴展,能夠抵消樣本數(shù)量和特征數(shù)量對決定系數(shù)的影響。因此采用校正決定系數(shù)作為模型評價指標,定義為
式中:y為真實標記;為真實標記的均值;為預(yù)測標記;n為樣本數(shù)量;p為特征數(shù)量。
泛化誤差代表模型的泛化能力。泛化誤差越小,代表模型在不同數(shù)據(jù)集上的適應(yīng)能力越好,模型的學(xué)習(xí)能量越強。TreeBagger 算法生成樣本子集時采用Bootstrap 算法會產(chǎn)生帶外數(shù)據(jù)(outs of bag,OOB),通常使用OOB 的擬合誤差來估計模型的泛化能力。
計算復(fù)雜度是指該算法運行時的資源消耗和時間消耗。作為CFAR 檢測系統(tǒng),對數(shù)據(jù)處理的實時性要求很高,需要在一定的時間范圍內(nèi)完成數(shù)據(jù)處理,并給出檢測判決。針對文中檢測器主要考慮模型在檢測階段對干擾目標個數(shù)估計的處理能力,即預(yù)測時間。
TB-CFAR 檢測器的結(jié)構(gòu)原理如圖1 所示。TB-CFAR 檢測器實際應(yīng)用過程分為2 個階段。訓(xùn)練階段根據(jù)先驗樣本數(shù)據(jù)構(gòu)建訓(xùn)練集,參考單元為樣本特征,干擾目標個數(shù)為樣本標簽。然后利用TreeBagger 算法構(gòu)建預(yù)測模型。檢測階段輸入信號經(jīng)過平方律檢波器送到參考單元移位器寄存器中,其中D為檢測單元,x1,x2,···,xN/2為前沿參考單元,xN/2+1,xN/2+2,···,xN為后沿參考單元。參考單元作為估計器的輸入進行干擾目標個數(shù)的估計。同時將參考單元進行降序排列。估計器的輸出值向下取整得到的整數(shù)值k作為模型最終輸出,并認為當前環(huán)境下具有k個干擾目標。剔除排序后的k個最大的參考單元,取剩余單元作為背景估計然后將Z與對應(yīng)的閾值因子相乘,再送進比較判決器中與待檢測單元D進行比較完成判決。判決準則表示為其中h1表示目標存在,h0表示目標不存在。其中閾值因子T是根據(jù)預(yù)設(shè)虛警概率和不同干擾目標個數(shù),通過蒙特卡洛仿真得到的[19],檢測階段根據(jù)預(yù)測干擾目標個數(shù)選取對應(yīng)的門限因子。
圖1 CFAR 檢測器模型框圖Fig.1 Block diagram of CFAR detector model
TB-CFAR 檢測器以參考單元作為模型的輸入,用于干擾目標個數(shù)的估計。樣本個數(shù)N和樣本中參考單元個數(shù),也就是特征向量維度V為估計器的主要影響因素。
圖2 為模型校正系數(shù)與訓(xùn)練集樣本個數(shù)的變化曲線,隨著樣本個數(shù)的增加,模型的擬合度變優(yōu),但是趨勢逐漸變緩。樣本個數(shù)的增加使得模型在進行樣本子集創(chuàng)建的時候,子集內(nèi)部的樣本分布更加均衡,能夠有效克服樣本分布不均勻?qū)M合結(jié)果的影響。但是當樣本足夠充分時,其樣本分布也逐漸趨于穩(wěn)定,則模型的擬合度對樣本的敏感程度下降,系數(shù)趨于穩(wěn)定。
圖2 校正決定系數(shù)隨樣本個數(shù)變化曲線Fig.2 The curve of the adjusted coefficient of determination with the number of samples
圖3 為模型校正系數(shù)隨參考單元個數(shù)的變化曲線,隨著參考單元的個數(shù)增加,模型的校正確定系數(shù)增加并趨于平緩。其中參考單元設(shè)計為符合瑞利分布的混響背景采樣。參考單元數(shù)量較少時,數(shù)據(jù)分布的整體差異性較大,而隨著參考單元的增大,數(shù)據(jù)分布能夠反映混響背景的特征。則對于干擾目標的影響敏感度變大,預(yù)測效果變好。
圖3 校正決定系數(shù)隨參考單元個數(shù)變化曲線Fig.3 The curve of the adjusted coefficient of determination with the number of reference units
圖4 為預(yù)測模型OOB 擬合誤差隨模型中決策樹創(chuàng)建數(shù)量的變化曲線,當決策樹生成到100 棵左右時,OOB 擬合誤差趨近平穩(wěn)。因此文中TreeBagger算法的決策樹個數(shù)設(shè)置為100 個。
圖4 OOB 擬合誤差隨樹的個數(shù)變化曲線Fig.4 The curve of the fitting errors of OOB with the number of trees
圖5 為估計器在檢測階段進行干擾目標個數(shù)估計耗時與參考單元個數(shù)的關(guān)系曲線。測試環(huán)境的配置為i5 處理器,內(nèi)存4 GB,系統(tǒng)為Win10 家庭版。如圖5 所示隨著參考單元的增加,預(yù)測時間也隨之增加。預(yù)測時間和參考單元個數(shù)基本上成正比關(guān)系??紤]仿真的擬合性和預(yù)測時間,文中設(shè)定參考單元為32 個。
圖5 參考單元個數(shù)隨預(yù)測耗時變化曲線Fig.5 The curve of the reference units with the time of predict
2.2.1 訓(xùn)練階段
訓(xùn)練集參數(shù)設(shè)置如下:目標類型為SwerlingII型,前沿參考單元=后沿參考單元=16 (R=32),均勻背景下信混比(signal to rever beration ratio,SRR)SRR=10log(λ)。干混比(interference to reverberation ratio,IRR)與SRR相同,即IRR=SRR。干擾目標個數(shù)k隨機生成且1≤k≤16,目標出現(xiàn)位置隨機。
考慮仿真時間和預(yù)測性能,單一混響下樣本個數(shù)為100 時,校正決定系數(shù)為0.865 5 。樣本個數(shù)為1 000 時,校正決定系數(shù)為0.878。模型的擬合程度變化不大,因此文中每個SRR 下樣本個數(shù)選取為100,則樣本總數(shù)M=100×36=3 600,如表1 所示。
表1 訓(xùn)練樣本Table 1 Train samples
2.2.2 檢測階段
通過蒙特卡洛仿真方法分析文中TB-CFAR檢測器的檢測性能。并比較新方法與經(jīng)典檢測器SO-CFAR,OS-CFAR 和ACCA-CFAR 在 不同的目標干擾環(huán)境下的檢測性能。其中仿真參數(shù)設(shè)置如下:虛警概率為Pf=10?4,目標類型為SwerngII 型,Rf=Rl=16(R=32)為前后沿參考單元,IRR=S RR;OS-CFAR 設(shè)置參考單元為k=26,即其能夠容納6 個干擾目標;對于ACCA-CFAR,取p=26。
2.2.3 均勻混響背景
圖6 為5 種檢測器在均勻背景下的檢測性能Pd,可以看出各檢測器的檢測性能比較接近。
圖6 均勻背景下各檢測器檢測性能Fig.6 Detection performance of detectors in the homogeneous environment
2.2.4 多干擾目標環(huán)境
分析TB-CFAR 在多目標環(huán)境中的性能,仿真參數(shù)保存不變。考慮2 種多目標環(huán)境,干擾目標只存在前沿滑窗,分別有2,4,6 個干擾目標;干擾目標在前后沿滑窗均存在,前后沿滑窗干擾目標個數(shù)相等,同時存在2,4,6 個干擾目標,設(shè)定IL和IR分別代表前后沿滑窗干擾目標個數(shù)。
圖7~圖9 中,設(shè)置干擾目標只存在前沿滑窗,干擾目標依次設(shè)置為2,4,6 個。當只有單側(cè)滑窗中存在干擾目標時,SO-CFAR 能夠保持較好的檢測性能。對于OS-CFAR 和ACCA-CFAR,干擾目標的個數(shù)均不大于設(shè)定的門限序值,所以2 種檢測器也保持較好的檢測性能,但是相較于SO-CFAR,2 種檢測器的性能有不同程度的下降,但ACCACFAR 優(yōu)于OS-CFAR。TB-CFAR 的檢測性能劣于SO-CFAR 檢測的檢測性能,主要原因是估計器的估計誤差導(dǎo)致的檢測性能下降。但是TB-CFAR檢測器的性能優(yōu)于OS-CFAR 和ACCA-CFAR。尤其當存在6 個干擾目標時,TB-CFAR 的檢測性能明顯優(yōu)于OS-CFAR 和ACCA-CFAR。
圖7 前沿滑窗有2 個干擾目標時檢測器檢測性能Fig.7 Detection performance of detectors when the front reference units have two interfering targets targets
圖8 前沿滑窗有4 個干擾目標時檢測器檢測性能Fig.8 Detection Performance of detectors when the front reference units have four interfering targets
圖9 前沿滑窗有6 個干擾目標時檢測器檢測性能Fig.9 Detection performance of detectors when the front reference units have six interfering targets
圖10~圖12 為前后沿均存在干擾目標,前后滑窗的干擾目標個數(shù)依次設(shè)定各為2,4,6 個。當前后滑窗均存在干擾目標時,SO-CFAR 的檢測性能大幅下降,無法滿足系統(tǒng)需要。對于OS-CFAR和ACCA-CFAR,隨著干擾目標個數(shù)增加,其檢測性能逐漸下降,當干擾目標個數(shù)超過設(shè)定的門限序值時,檢測器的檢測概率無法達到90%。TBCFAR 檢測器的檢測性能也隨著干擾目標個數(shù)增多逐漸下降,但是優(yōu)于其他檢測器。當前后滑窗有4 個干擾目標時,TB-CFAR 檢測器依然能夠工作。造成檢測器性能下降的原因是由于目標干擾個數(shù)估計準確率下降導(dǎo)致。干擾個數(shù)估計錯誤導(dǎo)致門限序值選擇不當,最終影響檢測器性能。但是檢測器的整體性能下降水平均低于其他檢測器。存在12 個干擾目標時,TB-CFAR 的檢測概率在70%以上,其他檢測器的檢測概率不足40%。
圖10 前后滑窗均有2 個干擾目標時檢測器檢測性能Fig.10 Detection performance of detectors when the front and back units both have two interfering targets
圖11 前后滑窗均有4 個干擾目標時檢測器檢測性能Fig.11 Detection Performance of detectors when the front and back units both have four interfering targets
圖12 前后滑窗均有6 個干擾目標時檢測器檢測性能Fig.12 Detection performance of detectors when the front and back units both have six interfering targets
文中提出了一種新型自適應(yīng)的CFAR 檢測器TB-CFAR,該檢測器利用TreeBagger 算法,訓(xùn)練得到干擾目標個數(shù)估計器。在檢測過程中通過預(yù)測模型對干擾目標個數(shù)進行估計,根據(jù)預(yù)測得到的干擾目標個數(shù),設(shè)定門限序值,將剔除后的背景采樣值的均值作為背景估計。經(jīng)過仿真分析,TBCFAR 檢測器在均勻背景和多目標干擾背景下均具有較好的檢測性能。尤其是在干擾目標個數(shù)先驗信息不足的情況下,該檢測器的性能優(yōu)于其他檢測器。但是文中并沒有分析檢測器在雜波邊緣背景下的檢測性能。下一步工作將分析檢測器在雜波邊緣背景下的性能,同時對TreeBagger 的計算復(fù)雜度進行優(yōu)化,縮短模型預(yù)測時間。