雷達組網(wǎng)認知管控技術(shù)研究

2017-04-27 15:57陸澤健劉筱秦永剛潘越

科技創(chuàng)新與應(yīng)用 2017年11期

關(guān)鍵詞：認知管控

陸澤健++劉筱++秦永剛++潘越

摘要：雷達組網(wǎng)協(xié)同探測是當前應(yīng)對多種威脅目標的重要手段，文章將認知管控技術(shù)引入到組網(wǎng)探測系統(tǒng)中，通過賦予系統(tǒng)感知外部環(huán)境、學(xué)習、推理并做出有效判斷的能力，能夠使雷達網(wǎng)絡(luò)有效應(yīng)對復(fù)雜多變的戰(zhàn)場環(huán)境，提升系統(tǒng)反應(yīng)能力，最大化探測效能。

關(guān)鍵詞：雷達組網(wǎng)；認知；管控

1 概述

雷達組網(wǎng)探測利用探測系統(tǒng)在空域上空間分集、頻域上頻率分集、極化域上極化分集、時域上信息互補、信息域上信息融合的優(yōu)勢，來突破單一裝備對非合作目標探測存在的局限性。隨著組網(wǎng)探測系統(tǒng)在軍事預(yù)警探測領(lǐng)域的廣泛應(yīng)用，如何有效的利用有限的雷達資源，實現(xiàn)對國土及邊境24小時不間斷監(jiān)測、快速應(yīng)對突發(fā)事件，已經(jīng)成為雷達網(wǎng)絡(luò)系統(tǒng)面臨的重要挑戰(zhàn)之一。

認知控制技術(shù)結(jié)合腦科學(xué)與人工智能技術(shù)，能夠賦予雷達組網(wǎng)系統(tǒng)智能感知外部環(huán)境、學(xué)習、推理并做出有效決策判斷的能力，使雷達系統(tǒng)有效應(yīng)對外部復(fù)雜的戰(zhàn)場環(huán)境[1-2]。與傳統(tǒng)雷達組網(wǎng)資源“開環(huán)管控”模式不同，認知管控強調(diào)“感知-學(xué)習-決策-行動”的反饋閉環(huán)，同時賦予雷達網(wǎng)絡(luò)存儲、記憶的能力。近年來，Haykin教授在人腦認知的機理上，提出并發(fā)展了動態(tài)認知系統(tǒng)（Dynamic Cognitive System，DCS）概念[3]，為認知系統(tǒng)的構(gòu)建提供了理論的支撐。一個典型的動態(tài)認知系統(tǒng)如圖1所示。

2 雷達組網(wǎng)資源管控基本內(nèi)容

雷達組網(wǎng)資源管控包括空間管理、模式管理、時間管理、能量管理、附屬資源管理等諸多方面的內(nèi)容[4]。在雷達組網(wǎng)預(yù)警探測系統(tǒng)中，雷達資源管控與信息融合是密切相關(guān)、互相對應(yīng)的。JDL模型是數(shù)據(jù)和信息融合領(lǐng)域最通用的模型，它將數(shù)據(jù)和信息融合的級別分為威脅評估、態(tài)勢評估、目標評估以及信號評估四個層次[5]。與之相對應(yīng)，雷達資源管控也可以分為四層：任務(wù)規(guī)劃、資源分配、激勵器調(diào)度和信號產(chǎn)生[6]。JDL模型與雷達資源管控模型的對應(yīng)關(guān)系如圖2所示：

雷達組網(wǎng)資源管控的基本內(nèi)容如下：（1）第3級管控（level3）：頂層任務(wù)規(guī)劃，包括對資源優(yōu)化管理周期的設(shè)置、探測目標選擇、目標環(huán)境分析、保衛(wèi)資產(chǎn)設(shè)置、任務(wù)優(yōu)先級、資源狀態(tài)監(jiān)測與評估、探測效能評估等功能；（2）第2級管控（level2）：多傳感器資源分配，主要指不同傳感器之間的資源調(diào)度與協(xié)同工作，包括資源優(yōu)化部署、多目標跟蹤中雷達選擇、目標分配、目標交接等；（3）第1級管控（level1）：傳感器資源安排，主要包括探測空域設(shè)置、時域設(shè)置、工作模式設(shè)置、頻率設(shè)置等；（4）第0級管控（level0）：針對單個雷達的波束調(diào)度、波形、調(diào)制樣式、極化方式、功率分配、脈沖寬度等參數(shù)進行管理和優(yōu)化設(shè)置。

3 雷達組網(wǎng)認知管控系統(tǒng)架構(gòu)

基于動態(tài)認知系統(tǒng)理論以及雷達組網(wǎng)資源管控的基本內(nèi)容，本文提出的雷達組網(wǎng)認知管控架構(gòu)如圖3所示。

在認知管控架構(gòu)中，雷達網(wǎng)絡(luò)通過傳感器對物理環(huán)境的探測，形成對真實環(huán)境的描述，在此基礎(chǔ)上學(xué)習、分析得出感興趣的探測區(qū)域以及目標，結(jié)合傳感器狀態(tài)通過智能規(guī)劃自適應(yīng)生成各類探測行動策略以及感知行動策略，完成資源管控閉環(huán)。系統(tǒng)各部分功能如下：

感知組合：通過傳感器組合實現(xiàn)對物理環(huán)境的量測，同時基于量測數(shù)據(jù)生成目標運動狀態(tài)以及信息熵狀態(tài)。目標運動狀態(tài)表示目標運動物理軌跡，而信息熵狀態(tài)則描述外部環(huán)境的“不確定性”。必要的時候，感知組合接受認知控制模塊的調(diào)節(jié)，完成認知雷達系統(tǒng)的“內(nèi)反饋”。在感知部分可調(diào)節(jié)的雷達資源包括目標運動模型、濾波模型、雜波模型、檢測門限等。

存儲及記憶：雷達測量數(shù)據(jù)中往往包含著對環(huán)境的重要信息，這些信息可能給當前以及今后的探測提供重要的幫助，因此雷達網(wǎng)絡(luò)必須存儲這些信息。記憶是在存儲基礎(chǔ)上建立起的對環(huán)境、對系統(tǒng)自身工作的知識、規(guī)律的總結(jié)，包括感知記憶以及行動記憶。前者表示對環(huán)境的認知（例如先驗檢測概率）以及對感知系統(tǒng)參數(shù)調(diào)節(jié)的記錄，后者表示對每一次調(diào)度策略及其效果的記錄。根據(jù)需要記憶又可以分為短期記憶以及長期記憶，后者主要是指各種算法、知識、規(guī)律等。

認知控制：認知控制是認知雷達網(wǎng)絡(luò)系統(tǒng)的“大腦”，是完成反饋閉環(huán)的中樞。認知控制通過分析感知系統(tǒng)對物理環(huán)境的不確定性描述（信息熵），結(jié)合過去的“記憶”，把認知雷達網(wǎng)絡(luò)系統(tǒng)中有限的資源集中到感興趣的區(qū)域以及目標上，實現(xiàn)探測效能的最大化。認知控制主要包括學(xué)習、規(guī)劃以及評估三大功能。學(xué)習是基于探測的信息熵，確定感興趣的區(qū)域以及目標；規(guī)劃是通過各種智能算法對認知網(wǎng)絡(luò)有限的資源進行動態(tài)調(diào)度，生成或更新應(yīng)對策略；評估是實時在線對生成的策略進行評估分析。認知控制可以實現(xiàn)對探測資源的管控（探測行動策略），也可以實現(xiàn)對感知資源的管控（感知行動策略），甚至還可以通過調(diào)整數(shù)據(jù)率等參數(shù)實現(xiàn)對系統(tǒng)網(wǎng)絡(luò)帶寬以及計算資源的管控。

探測組合：探測組合接受認知控制生成的探測行為策略，調(diào)度合適的雷達資源對物理環(huán)境進行探測?？梢怨芸氐馁Y源包括探測裝備的選擇、探測天線組合、雷達工作模式、波束分配、波形、頻率、功率等。

4 雷達組網(wǎng)認知控制關(guān)鍵技術(shù)

認知管控的目的是在不降低當前系統(tǒng)整體探測性能的前提下，自適應(yīng)將系統(tǒng)有限的資源調(diào)度到感興趣或者重要的區(qū)域以及目標上，提高對重點區(qū)域或目標的探測能力。從上一節(jié)的分析可以看出，認知控制關(guān)鍵的步驟是要完成“感知-學(xué)習-決策-行動”的閉環(huán)，而完成這一閉環(huán)的基礎(chǔ)在于對真實物理環(huán)境的恰當描述以及對環(huán)境、策略的反饋學(xué)習。

4.1 對真實物理環(huán)境不確定性的描述

在傳統(tǒng)的雷達組網(wǎng)系統(tǒng)中，每部雷達上傳的是目標的點跡或者航跡信息，而點跡、航跡等信息僅僅是對目標的物理描述，缺乏對真實世界“不確定性”的描述。為此，需要借助香農(nóng)理論從信息熵的角度描述傳感器網(wǎng)絡(luò)對于目標探測信息量的大小。傳感器網(wǎng)絡(luò)每次探測目標的信息增量定義為：

其中p、q分別為某事件的先驗概率、后驗概率，pi，i=1為N個事件的離散概率，則先驗概率對應(yīng)的信息熵定義為：

若pi=qi，則I（q，p）=0，表示本次量測沒有提供任何信息，若pi≠qi，則I（q，p）≠0，則說明本次量測提供了新的信息。傳感器的目的就是與目標環(huán)境互相作用，以進一步減小目標環(huán)境的“不確定性”。

4.2 基于貝葉斯理論的目標環(huán)境狀態(tài)估計技術(shù)

由于在雷達檢測跟蹤過程中不可避免的存在量測噪聲，因此需要對量測數(shù)據(jù)進行一定的處理，以準確估計目標環(huán)境狀態(tài)。貝葉斯理論能夠依據(jù)積累的經(jīng)驗值以及當前的量測值，準確估計目標的運動狀態(tài)，因此被廣泛應(yīng)用于多目標檢測跟蹤過程中。設(shè)定zk為量測的數(shù)據(jù)向量，xk為目標環(huán)境狀態(tài)向量，則依據(jù)貝葉斯理論有：

貝葉斯理論表明了后驗概率與先驗概率以及當前量測值的關(guān)系。典型的貝葉斯濾波器是卡爾曼濾波器。卡爾曼濾波器精度高，并且具有一定的自適應(yīng)特性，因而是跟蹤濾波中最常用的方法。但在實際系統(tǒng)中，觀測模型往往具有較強的非線性，且模型噪聲可能存在非高斯的情況，因而須使用非線性濾波方法。通過對量測數(shù)據(jù)的濾波，不僅能夠給出目標的運動軌跡，也能夠計算目標的信息熵，這是因為在濾波過程中協(xié)方差矩陣表示的是目標狀態(tài)的不確定性，通過對每一次觀測更新協(xié)方差矩陣，減少目標環(huán)境的不確定性，使信息量增加。

4.3 傳感器網(wǎng)絡(luò)自主學(xué)習技術(shù)

具備自主學(xué)習技術(shù)的傳感器網(wǎng)絡(luò)能夠根據(jù)每次量測的數(shù)據(jù)完成對目標環(huán)境的學(xué)習，在此基礎(chǔ)上采用合適的傳感器組合策略并對策略進行實時在線評估。本文采用增強學(xué)習方法實現(xiàn)雷達組網(wǎng)系統(tǒng)自主學(xué)習的能力。增強學(xué)習算法能夠使機器與環(huán)境進行自主交互，通過感知數(shù)據(jù)完成對目標環(huán)境學(xué)習、規(guī)劃與評估功能，因此十分適合于實現(xiàn)認知控制的反饋閉環(huán)。在認知系統(tǒng)中，目標環(huán)境通?？梢越橐粋€有限狀態(tài)的馬爾科夫決策過程（Markov Decision Process，MDP）。在MDP中，狀態(tài)轉(zhuǎn)移概率和獎勵概率在是隨機的但在問題求解過程中保持不變。增強學(xué)習的問題可以定義為：給定環(huán)境狀態(tài)集合S，認知系統(tǒng)行為集合A，獎勵集合R，求解一系列決策規(guī)則δt，t=1，...，T，使得當前的收益與期望的收益最小化。在t時刻，決策規(guī)則δt也稱為策略。

基于增強學(xué)習的傳感器控制閉環(huán)如圖4所示。在第k個管控步驟，傳感器組合不斷的從目標環(huán)境獲取量測數(shù)據(jù)，在此基礎(chǔ)上計算k時刻目標的信息熵Hk，并結(jié)合先驗的知識預(yù)測k+1時刻目標的信息熵Hk+1，信息增量模塊計算兩個時刻的信息增量Ik+1，作為增強學(xué)習的獎勵函數(shù)。傳感器控制模塊根據(jù)信息增量Ik+1來動態(tài)調(diào)整探測策略，選擇合適的傳感器組合對目標環(huán)境進行探測，從而完成“感知-學(xué)習-決策-行動”的管控閉環(huán)。

5 結(jié)束語

當前，世界上多個國家都在積極發(fā)展各種新型威脅武器，這些新型目標給傳統(tǒng)的防空雷達組網(wǎng)系統(tǒng)造成了很大的威脅。為有效應(yīng)對這些新型非合作目標對我國領(lǐng)土的威脅，需要進一步提高傳統(tǒng)雷達網(wǎng)絡(luò)的智能協(xié)同能力，才能充分發(fā)揮體系作戰(zhàn)的力量。認知管控技術(shù)通過對感知信息的智能處理，可以協(xié)助幫助鑒定一系列的國土突發(fā)威脅，包括可疑目標行動、非法入境、低空飛行器以及自然災(zāi)害等事件，同時實現(xiàn)雷達資源的自適應(yīng)分配、調(diào)整，進而提升雷達組網(wǎng)探測網(wǎng)絡(luò)的整體作戰(zhàn)效能。本文結(jié)合雷達組網(wǎng)資源管控的基本內(nèi)容以及動態(tài)認知系統(tǒng)的基本理論，提出了一種雷達組網(wǎng)認知管控系統(tǒng)架構(gòu)，并對認知控制的關(guān)鍵技術(shù)進行了研究，為雷達組網(wǎng)認知系統(tǒng)的構(gòu)建提供了理論依據(jù)。

參考文獻

[1]HaykinS.， Cognitive radar： a way of the future[J].IEEE Signal Processing Magazine， 2006， 23（1）：30-40.

[2]HaykinS.， Cognitive radar networks [C].Computational Advances in Multi-Sensor Adaptive Processing， 2005 1st IEEE International Workshop on， 2005：1-3.

[3]HaykinS.， FusterJ.M.， On cognitive dynamic systems： Cognitive neuroscience and engineering learning from each other [J].Proc. IEEE， 2014， 102（4）： 608-628.

[4]葉朝謀，丁建江，等.雷達探測資源管理技術(shù)分析與評估[J].現(xiàn)代雷達， 2012， 34（3）：6-11.

[5]Steinberg， A.， Bowman， C.， Rethinking the JDL Data Fusion Levels[C].in Proc .National Symposium on Sensor Data Fusion， 2004.

[6]Felix Smits， Albert Huizing， Wim van Rossum， Peter Hiemstra， A Cognitive Radar Network： Architecture and Application to Multiplatform Radar Management[C].Proceedings of the 5th European Radar Conference， 2008：312-315.

作者簡介：陸澤健（1986，08-），男，2015年獲得北京郵電大學(xué)博士學(xué)位，目前為中電集團電子科學(xué)研究院在站博士后，主要研究方向為多傳感器信息融合、認知系統(tǒng)以及智能優(yōu)化理論和方法。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

雷達組網(wǎng)認知管控技術(shù)研究