劉志鵬,張國(guó)毅
(1.中國(guó)人民解放軍93993部隊(duì),甘肅 蘭州 730100;2.空軍航空大學(xué),吉林 長(zhǎng)春 130022)
?
·技術(shù)前沿·
一種新的雷達(dá)信號(hào)實(shí)時(shí)分選方法
劉志鵬1,張國(guó)毅2
(1.中國(guó)人民解放軍93993部隊(duì),甘肅 蘭州 730100;2.空軍航空大學(xué),吉林 長(zhǎng)春 130022)
針對(duì)現(xiàn)有實(shí)時(shí)分選方法依賴滑動(dòng)窗(單次處理脈沖數(shù))的選取、分選效率低以及分選結(jié)果存在嚴(yán)重增批現(xiàn)象等缺陷,將脈沖串的接收視為數(shù)據(jù)流過程,從而設(shè)計(jì)了一種基于進(jìn)化數(shù)據(jù)流聚類的雷達(dá)信號(hào)實(shí)時(shí)分選框架。該框架分為在線處理和離線分析兩個(gè)階段,通過引入時(shí)態(tài)密度特征避免了主觀上對(duì)滑動(dòng)窗長(zhǎng)度的選取,并利用衰變檢測(cè)和噪聲點(diǎn)檢測(cè)來提高在線聚類的效率。離線階段通過對(duì)歷史快照的分析可以判明雷達(dá)的活動(dòng)情況,并將屬于一部雷達(dá)的脈沖批組進(jìn)行關(guān)聯(lián)。仿真實(shí)驗(yàn)表明了該框架的有效性和可行性。
信號(hào)分選;數(shù)據(jù)流;時(shí)態(tài)密度;放射傳播聚類;離線分析
在實(shí)時(shí)偵察中,偵收機(jī)不斷接收到新到達(dá)的脈沖串,為了對(duì)這些不斷到達(dá)的脈沖進(jìn)行分選,傳統(tǒng)的做法是利用滑動(dòng)窗去積累一定數(shù)量的脈沖,再對(duì)這些由滑動(dòng)窗分割成一段一段的脈沖串進(jìn)行處理。此種方法的分選結(jié)果受滑動(dòng)窗的影響,而滑動(dòng)窗長(zhǎng)度的選取依賴經(jīng)驗(yàn)設(shè)定,并沒有完整的理論作為支撐。為此,本文提出基于進(jìn)化數(shù)據(jù)流[1-2]的新的分選框架,引入脈沖數(shù)據(jù)的時(shí)態(tài)密度特征[3],從而避開了滑動(dòng)窗選取對(duì)分選結(jié)果的影響。
由于電磁環(huán)境中不斷有輻射源消失和新的輻射源活躍,因此,本文提出的分選框架首先發(fā)掘出活躍批組(批組就是由若干脈沖形成的聚類),利用活躍批組來對(duì)新到達(dá)的脈沖進(jìn)行優(yōu)先關(guān)聯(lián),大大提高了分選的實(shí)時(shí)性。此外,由于算法實(shí)時(shí)給出當(dāng)前電磁環(huán)境的分選結(jié)果而不考慮歷史影響,可能會(huì)造成增批的情況。為解決這個(gè)問題,本文提出的分選框架的在線部分負(fù)責(zé)更新分選的實(shí)時(shí)概要信息,發(fā)現(xiàn)新的輻射源并給出聚類的結(jié)果;離線部分則對(duì)分選結(jié)果的歷史演化進(jìn)行深度分析,完成跟蹤合批,并為用戶提供更為準(zhǔn)確的輻射源偵察信息。
本文建立的基于進(jìn)化數(shù)據(jù)流的分選框架分為兩階段,即在線處理部分和離線處理部分[4]。其中,在線處理部分完成聚類并提取數(shù)據(jù)流的特征向量,形成概要數(shù)據(jù)[5];離線處理部分依據(jù)概要數(shù)據(jù)的歷史演化[6],給出更為精確的分選結(jié)果。
該框架利用到衰變因子、時(shí)態(tài)密度特征、批數(shù)據(jù)概要特征、活躍批組等概念,現(xiàn)進(jìn)行說明如下。
1.1衰變因子及時(shí)態(tài)密度特征
若把數(shù)據(jù)流看做是隨時(shí)間變化的過程,則距現(xiàn)時(shí)刻越近的數(shù)據(jù),重要程度越高,越久遠(yuǎn)的歷史數(shù)據(jù),相對(duì)的重要程度就越低。
定義衰變因子為[7]:
(1)
衰變因子隨時(shí)間的增加而遞減,其值的大小反映了數(shù)據(jù)出現(xiàn)時(shí)間的先后,這里以衰變因子作為權(quán)值來表征數(shù)據(jù)的重要程度,衰減的速率可通過λ的取值進(jìn)行調(diào)節(jié)。
1.2時(shí)態(tài)密度特征
1)脈沖的時(shí)態(tài)密度特征
設(shè)x是數(shù)據(jù)流中的一個(gè)脈沖,t0為脈沖到達(dá)時(shí)刻,則該脈沖的時(shí)態(tài)密度為:
(2)
2)批組的時(shí)態(tài)密度
設(shè)bc為由n個(gè)脈沖聚類形成的批組,則批組bc在時(shí)刻t的時(shí)態(tài)密度特征定義為:
(3)
1.3批組的概要特征
假設(shè)批組bc中包含帶有到達(dá)時(shí)間戳為ti1,ti2,…,tin的脈沖串xi1,xi2,…,xin,定義批數(shù)據(jù)的概要特征BF為:
(4)
式中,Ci為代表批組的聚類中心;Tbci為批組的時(shí)態(tài)密度,表示批組在時(shí)間上的密度;maxi為批組內(nèi)距離中心點(diǎn)最遠(yuǎn)的脈沖;tn為批組最后更新時(shí)間;∑i為批組內(nèi)的脈沖相似性,定義為:
(5)
1.4活躍批組與稀疏批組
批組時(shí)態(tài)密度的最大值為:
(6)
式中,v為數(shù)據(jù)流的流速,故任意批組的平均時(shí)態(tài)密度不超過v/(N(1-e-λ)),N為脈沖總數(shù)。
為提高分選的效率,新到達(dá)的脈沖將優(yōu)先與檢測(cè)到的活躍雷達(dá)關(guān)聯(lián),設(shè)定閾值:
(7)
式中,μ>1,當(dāng)批組bc的時(shí)態(tài)密度Tbc(t)≥Tthred時(shí),認(rèn)為該批組為活躍批組,否則為稀疏批組。
1.5時(shí)態(tài)密度的更新
假設(shè)時(shí)刻tl為批組bc上一次更新的時(shí)刻,由式(3)可得:
(8)
根據(jù)時(shí)態(tài)密度定義得:
(9)
如果該批組在時(shí)刻tn接收到新的脈沖,則其在時(shí)刻tn的時(shí)態(tài)密度更新公式為:
(10)
1.6活躍批組和稀疏批組可被增量的維護(hù)
某一批組bc{Ci,Tbci,∑i,maxi,tn},在Δt內(nèi)沒接收到新的脈沖,則bc概要特征變?yōu)閧Ci,e-λΔtTbci,∑i,maxi,tn+Δt};若在Δt時(shí)間內(nèi)接收到脈沖P,則bc的聚類中心不變,其他信息變更為:
(11)
(12)
(13)
maxi=Idx(dmax(xi,ci))
(14)
式中,maxi取更新后脈沖數(shù)據(jù)中離聚類中心最遠(yuǎn)的脈沖。
2.1初始聚類
對(duì)數(shù)據(jù)流中首先到達(dá)的N個(gè)脈沖利用仿射傳播聚類算法[8-9]進(jìn)行初始聚類,并依據(jù)聚類結(jié)果將脈沖分成若干初始批組,對(duì)任意初始批組bc,若其時(shí)態(tài)密度大于閾值Tthred,則標(biāo)記為活躍批組,否則為稀疏批組,取所有活躍批組的最大半徑作為初始半徑r。
2.2在線聚類
初始化聚類完成后,新到達(dá)的脈沖p將首先與活躍批組相比較,若活躍批組不能吸收,再嘗試將p置于稀疏批組中。批組吸收脈沖要同時(shí)滿足的條件為:新到達(dá)脈沖參數(shù)與聚類中心Ci最近且小于初始半徑r。如果活躍批組與稀疏批組均不能吸收脈沖p,則將其存入緩存盒中,并監(jiān)測(cè)個(gè)數(shù)變化;當(dāng)緩存盒內(nèi)的脈沖數(shù)到達(dá)門限n_max時(shí),利用仿射傳播聚類發(fā)掘出新模式,并將整體模型重建。
2.3衰變檢測(cè)和離群噪聲的檢測(cè)
若活躍批組長(zhǎng)時(shí)間未接受新的脈沖,則隨著時(shí)間推移,其時(shí)態(tài)密度將發(fā)生衰減,直至低于閾值Tthred,此時(shí)活躍批組蛻變?yōu)橄∈枧M,需要從活躍批組隊(duì)列中移入稀疏批組隊(duì)列中,因此,需要定期檢測(cè)活躍批組的時(shí)態(tài)密度。由等式e-λTdTthred+1=Tthred得出最短蛻變時(shí)間為:
(15)
所以選擇Td為衰變檢測(cè)時(shí)間。
同時(shí),隨著時(shí)間的演進(jìn),數(shù)目不斷增多的活躍批組與稀疏批組將不斷增加系統(tǒng)的負(fù)擔(dān),需要對(duì)離群的噪聲點(diǎn)進(jìn)行刪除,而對(duì)于新產(chǎn)生的批組,其時(shí)態(tài)密度較低,又要為其成長(zhǎng)為活躍批組保證一定的成長(zhǎng)時(shí)機(jī)。因此,采用最低閾值淘汰機(jī)制,即每隔Td對(duì)稀疏批組進(jìn)行檢測(cè),如果時(shí)態(tài)密度小于閾值下限,則幾乎不可能成長(zhǎng)為活躍批組,于是將其視為離群噪聲刪除。閾值下限設(shè)為:
(16)
式中,t0為批組首次出現(xiàn)時(shí)刻。易知當(dāng)t=t0時(shí),ξ(t,t0)=1;當(dāng)t→∞時(shí),ξ(t,t0)=Tthred。
活躍批組與稀疏批組相互轉(zhuǎn)化及離群噪聲剔除機(jī)制如圖1所示,t1時(shí)刻,存在活躍批組bc1及稀疏批組bc2。經(jīng)過n1Td時(shí)間后,批組bc1的時(shí)態(tài)密度低于式(7)所設(shè)門限Tthred,蛻變?yōu)橄∈枧M;而批組bc2由于不斷接受新脈沖,時(shí)態(tài)密度大于Tthred,成長(zhǎng)為活躍批組。再經(jīng)歷n2Td時(shí)間后,批組bc1的時(shí)態(tài)密度已低于式(16)確定的閾值下限ξ(t,t0),被視作離群噪聲而被剔除;批組bc2由于有新的脈沖加入仍保持活躍;此時(shí)緩存盒內(nèi)發(fā)現(xiàn)新模式bc3,但時(shí)態(tài)密度較低被判為稀疏批組。
圖1 檢測(cè)機(jī)制示意圖
2.4離線處理
1)批組關(guān)聯(lián)
如果兩個(gè)活躍批組bci{Ci,Tbci,∑i,maxi,tn}和bcj{Cj,Tbcj,∑j,maxj,tn}滿足密度可達(dá),即‖ci-cj‖≤‖maxi-ci‖+‖maxj-cj‖,則認(rèn)為兩個(gè)活躍批組相關(guān)聯(lián)。于是用戶可依據(jù)某一時(shí)刻的快照,以深度優(yōu)先搜索為準(zhǔn)則找到所有相關(guān)聯(lián)的活躍批組,從而得到更準(zhǔn)確的聚類結(jié)果。
2)演化分析
用戶可指定分析時(shí)間差h和時(shí)刻tp,利用快照S(tp)和S(tp-h)相減的結(jié)果得到tp和tp-h的批組集差H,并根據(jù)H得出新增的活躍批組、消失的活躍批組和保持活躍的批組,進(jìn)而分析脈沖流的演化情況。分選框架模型流程如圖2所示。
圖2 進(jìn)化數(shù)據(jù)流分選框架模型
為驗(yàn)證進(jìn)化數(shù)據(jù)流聚類分選框架的可行性,分別用仿真數(shù)據(jù)和實(shí)際數(shù)據(jù)對(duì)算法進(jìn)行測(cè)試,仿真環(huán)境:Windows 7, AMD CPU A6, 4GB 內(nèi)存,編程工具為Matlab 7.10.1。
3.1仿真信號(hào)
實(shí)驗(yàn)所用雷達(dá)數(shù)據(jù)見表1,生成一段50ms的脈沖流,加入3%的噪聲脈沖,并按下式模擬脈沖散失:
TOAi-1+PWi-1+tp≤TOAi
(17)
式中,tp為接受機(jī)反應(yīng)時(shí)間,設(shè)為1μs;當(dāng)脈沖到達(dá)時(shí)間TOAi不滿足式(17)時(shí),則被認(rèn)定為散失脈沖,從脈沖流中去除,雷達(dá)出現(xiàn)和消失的時(shí)間亦見表1。
采用本文提出的基于進(jìn)化數(shù)據(jù)流聚類的分選方法,分選參數(shù)為{RF,PRI,DOA,PM},衰減的速率λ設(shè)為0.5,閾值系數(shù)μ設(shè)為5,得到的在線處理結(jié)果如圖3所示。
圖3 在線處理結(jié)果示意圖
雷達(dá)編號(hào)RF/MHzPRI/μsDOA/(°)PW/μs脈內(nèi)調(diào)制類型出現(xiàn)時(shí)間/μs消失時(shí)間/μsR13200~3400單脈沖捷變2110固定105~1071.1固定CON990044500R23300~3500脈沖組跳變129~134抖動(dòng)101~104.73.5~17.5捷變LFM450014500R33170/3390頻率分集177/183/193三參差103~1054.7固定BPSK35350持續(xù)R43390頻率固定145/155/165/170脈組參差104.1~104.311.2~15.2捷變Costas1001持續(xù)
由圖3可見,由于雷達(dá)R1的脈沖間隔較大,開始被識(shí)別為稀疏批組,隨著新脈沖的加入,6ms(吸收三個(gè)脈沖)后,成長(zhǎng)為活躍批組,在45ms后,批組蛻變?yōu)橄∈杳}沖,隨即又被視為噪聲點(diǎn)剔除。雷達(dá)R2在5ms成為活躍批組,在15ms左右蛻為稀疏批,由于未接收新脈沖,隨即被剔除。雷達(dá)R3和R4分別在1.5ms和36ms左右形成活躍批,并一直延續(xù)到脈沖流結(jié)束。每隔10ms進(jìn)行一次離線分析,統(tǒng)計(jì)分選正確率,并與模糊C-均值聚類算法及修正PRI算法的分選效果進(jìn)行比較,兩種算法的參數(shù)設(shè)置參見文獻(xiàn)[10~11],滑動(dòng)窗設(shè)為1024,結(jié)果如表2所示。
表2 離線分析記錄
通過比較表1和表2可知,基于進(jìn)化數(shù)據(jù)流聚類的分選框架可以準(zhǔn)確地反應(yīng)出輻射源的活動(dòng)情況,具有較高的分選正確率,有效抑制了增批,有效性明顯優(yōu)于已有算法。
表3 實(shí)驗(yàn)數(shù)據(jù)參數(shù)及雷達(dá)活動(dòng)情況
3.2實(shí)際信號(hào)測(cè)試
利用實(shí)際信號(hào)對(duì)數(shù)據(jù)流聚類分選框架進(jìn)行驗(yàn)證,分選特征參數(shù)的選取和算法參數(shù)設(shè)置同3.1節(jié),實(shí)驗(yàn)數(shù)據(jù)為某次航空偵察得到的一段長(zhǎng)度為14.6s的全脈沖數(shù)據(jù),共91700個(gè)脈沖,經(jīng)反復(fù)人工分析后,認(rèn)為該時(shí)間內(nèi)先后出現(xiàn)了共14部雷達(dá),主要參數(shù)及具體情況見表3,這里僅給出部分雷達(dá)大致范圍和變化類型。
采用基于進(jìn)化數(shù)據(jù)流聚類的分選框架,分選參數(shù)為{RF,PW,DOA,PM},衰減的速率λ設(shè)為0.5,活躍批組閾值系數(shù)μ設(shè)為5,得到的離線分析結(jié)果仍與模糊C-均值聚類算法及修正PRI算法的分選效果進(jìn)行比較,最終結(jié)果見表4。
表4 離線分析結(jié)果及與其他算法對(duì)比
從表4可看出,基于進(jìn)化數(shù)據(jù)流的實(shí)時(shí)分選框架對(duì)實(shí)際偵察環(huán)境具有良好的適應(yīng)性,可以正確分析出輻射源的活動(dòng)狀況,有效抑制增批,并且平均分選正確率高于90%,明顯優(yōu)于其他分選算法。
針對(duì)當(dāng)前實(shí)時(shí)分選技術(shù)存在的分選效率低及增批現(xiàn)象嚴(yán)重的問題,本文設(shè)計(jì)了一種基于進(jìn)化數(shù)據(jù)流聚類的實(shí)時(shí)分選框架,即利用聚類算法和時(shí)態(tài)密度建立在線模型,通過衰變檢測(cè)來提高分選效率,最后利用離線分析進(jìn)行合批和歷史數(shù)據(jù)分析。仿真實(shí)驗(yàn)證實(shí)了該方法的實(shí)用性和高效性。■
[1]Ntoutsi I, Zimek A, Palpanas T, et al.Density-based projected clustering over high dimensional data streams[C]∥Anaheim, USA:proc.of the 12th SIAM interna-tional Conference on Data Mining,2012: 987-998.
[2]Kranen P, Kremer H, Jansen T, et al.Stream data mining using the MOA framework[C]∥Busan, Republic of Korea:Proc.of the 17th International Conference on Database Systems for Advanced Applications,2012:309-313.
[3]孫大為, 張廣艷, 鄭緯民.大數(shù)據(jù)流式計(jì)算:關(guān)鍵技術(shù)及系統(tǒng)實(shí)例[J].軟件學(xué)報(bào), 2014, 25(4): 839-862.
[4]牛新征, 佘堃.面向大規(guī)模數(shù)據(jù)的快速并行聚類劃分算法研究[J].計(jì)算機(jī)科學(xué), 2012, (1): 67-71.
[5]徐文華, 覃征, 常揚(yáng).基于半監(jiān)督學(xué)習(xí)的數(shù)據(jù)流集成分類算法[J].模式識(shí)別與人工智能, 2012(2): 117-119.
[6]Xu Ye, Shen Furao, Zhao Jinxi.An incremental learning vector quantization algorithm for pattern classification[J].Neural Computing and Applications, 2012 (6):439-442.
[7]Cormode G, Hadjieleftheriou M.Methods for finding frequent items in data streams[J].The VLDB Journal, 2010 (1): 39-43.
[8]Frey BJ, Dueck D.Clustering by passing messages between data points[J].Science, 2007, 316(5814): 972-976.
[9]王開軍, 張軍英, 李丹,等.自適應(yīng)仿射傳播聚類[J].自動(dòng)化學(xué)報(bào), 2007,33(12): 1242-1246.
[10]尹亮, 潘繼飛, 姜秋喜.基于模糊聚類的雷達(dá)信號(hào)分選[J].火力與指揮控制, 2014, 39(2): 52-57.
[11]羅長(zhǎng)勝, 吳華, 程嗣怡.一種對(duì)重頻調(diào)制與抖動(dòng)信號(hào)的PRI變換分選新方法[J].電訊技術(shù), 2012, 52 (9): 1491-1496.
A novel deinterleaving method in real time of radar signal
Liu Zhipeng1, Zhang Guoyi2
(1.Unit 93993 of PLA, Lanzhou 730100,Gansu,China; 2.Aviation University of Air Force, Changchun 130022,Jilin,China)
In view of the existing real-time sorting methods having defects of relying on sliding window (the pulse number to be conducted one time), low sorting efficiency and serious phenomenon of increased number, pulse sequence is regarded as a data flow process, thus a real-time signal sorting framework based on online clustering of evolution data stream is designed.The framework is divided into two stages as an online part and an offline analysis part.With the utilization of temporal density characteristics, the subjective selection of sliding window length is avoided.And the disintegration detection and noise detection are used to improve the efficiency of online clustering.Off-line stage with the analysis of the historical snapshot can determine the movements of the radar, and merge groups of pulses which come from the same emitter.The simulation experiment shows the validity and feasibility of the framework.
signal deinterleaving;data stream;temporal density;affinity propagation cluster;off-line analysis
2015-12-03;2016-03-09修回。
劉志鵬(1990-),男,碩士研究生,主要研究方向?yàn)槔走_(dá)信號(hào)分選與識(shí)別。
TN971+.1;TN974
A