国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

雷達組網(wǎng)認知管控技術(shù)研究

2017-04-27 15:57陸澤健劉筱秦永剛潘越
科技創(chuàng)新與應(yīng)用 2017年11期
關(guān)鍵詞:認知管控

陸澤健++劉筱++秦永剛++潘越

摘 要:雷達組網(wǎng)協(xié)同探測是當前應(yīng)對多種威脅目標的重要手段,文章將認知管控技術(shù)引入到組網(wǎng)探測系統(tǒng)中,通過賦予系統(tǒng)感知外部環(huán)境、學(xué)習、推理并做出有效判斷的能力,能夠使雷達網(wǎng)絡(luò)有效應(yīng)對復(fù)雜多變的戰(zhàn)場環(huán)境,提升系統(tǒng)反應(yīng)能力,最大化探測效能。

關(guān)鍵詞:雷達組網(wǎng);認知;管控

1 概述

雷達組網(wǎng)探測利用探測系統(tǒng)在空域上空間分集、頻域上頻率分集、極化域上極化分集、時域上信息互補、信息域上信息融合的優(yōu)勢,來突破單一裝備對非合作目標探測存在的局限性。隨著組網(wǎng)探測系統(tǒng)在軍事預(yù)警探測領(lǐng)域的廣泛應(yīng)用,如何有效的利用有限的雷達資源,實現(xiàn)對國土及邊境24小時不間斷監(jiān)測、快速應(yīng)對突發(fā)事件,已經(jīng)成為雷達網(wǎng)絡(luò)系統(tǒng)面臨的重要挑戰(zhàn)之一。

認知控制技術(shù)結(jié)合腦科學(xué)與人工智能技術(shù),能夠賦予雷達組網(wǎng)系統(tǒng)智能感知外部環(huán)境、學(xué)習、推理并做出有效決策判斷的能力,使雷達系統(tǒng)有效應(yīng)對外部復(fù)雜的戰(zhàn)場環(huán)境[1-2]。與傳統(tǒng)雷達組網(wǎng)資源“開環(huán)管控”模式不同,認知管控強調(diào)“感知-學(xué)習-決策-行動”的反饋閉環(huán),同時賦予雷達網(wǎng)絡(luò)存儲、記憶的能力。近年來,Haykin教授在人腦認知的機理上,提出并發(fā)展了動態(tài)認知系統(tǒng)(Dynamic Cognitive System,DCS)概念[3],為認知系統(tǒng)的構(gòu)建提供了理論的支撐。一個典型的動態(tài)認知系統(tǒng)如圖1所示。

2 雷達組網(wǎng)資源管控基本內(nèi)容

雷達組網(wǎng)資源管控包括空間管理、模式管理、時間管理、能量管理、附屬資源管理等諸多方面的內(nèi)容[4]。在雷達組網(wǎng)預(yù)警探測系統(tǒng)中,雷達資源管控與信息融合是密切相關(guān)、互相對應(yīng)的。JDL模型是數(shù)據(jù)和信息融合領(lǐng)域最通用的模型,它將數(shù)據(jù)和信息融合的級別分為威脅評估、態(tài)勢評估、目標評估以及信號評估四個層次[5]。與之相對應(yīng),雷達資源管控也可以分為四層:任務(wù)規(guī)劃、資源分配、激勵器調(diào)度和信號產(chǎn)生[6]。JDL模型與雷達資源管控模型的對應(yīng)關(guān)系如圖2所示:

雷達組網(wǎng)資源管控的基本內(nèi)容如下:(1)第3級管控(level3):頂層任務(wù)規(guī)劃,包括對資源優(yōu)化管理周期的設(shè)置、探測目標選擇、目標環(huán)境分析、保衛(wèi)資產(chǎn)設(shè)置、任務(wù)優(yōu)先級、資源狀態(tài)監(jiān)測與評估、探測效能評估等功能;(2)第2級管控(level2):多傳感器資源分配,主要指不同傳感器之間的資源調(diào)度與協(xié)同工作,包括資源優(yōu)化部署、多目標跟蹤中雷達選擇、目標分配、目標交接等;(3)第1級管控(level1):傳感器資源安排,主要包括探測空域設(shè)置、時域設(shè)置、工作模式設(shè)置、頻率設(shè)置等;(4)第0級管控(level0):針對單個雷達的波束調(diào)度、波形、調(diào)制樣式、極化方式、功率分配、脈沖寬度等參數(shù)進行管理和優(yōu)化設(shè)置。

3 雷達組網(wǎng)認知管控系統(tǒng)架構(gòu)

基于動態(tài)認知系統(tǒng)理論以及雷達組網(wǎng)資源管控的基本內(nèi)容,本文提出的雷達組網(wǎng)認知管控架構(gòu)如圖3所示。

在認知管控架構(gòu)中,雷達網(wǎng)絡(luò)通過傳感器對物理環(huán)境的探測,形成對真實環(huán)境的描述,在此基礎(chǔ)上學(xué)習、分析得出感興趣的探測區(qū)域以及目標,結(jié)合傳感器狀態(tài)通過智能規(guī)劃自適應(yīng)生成各類探測行動策略以及感知行動策略,完成資源管控閉環(huán)。系統(tǒng)各部分功能如下:

感知組合:通過傳感器組合實現(xiàn)對物理環(huán)境的量測,同時基于量測數(shù)據(jù)生成目標運動狀態(tài)以及信息熵狀態(tài)。目標運動狀態(tài)表示目標運動物理軌跡,而信息熵狀態(tài)則描述外部環(huán)境的“不確定性”。必要的時候,感知組合接受認知控制模塊的調(diào)節(jié),完成認知雷達系統(tǒng)的“內(nèi)反饋”。在感知部分可調(diào)節(jié)的雷達資源包括目標運動模型、濾波模型、雜波模型、檢測門限等。

存儲及記憶:雷達測量數(shù)據(jù)中往往包含著對環(huán)境的重要信息,這些信息可能給當前以及今后的探測提供重要的幫助,因此雷達網(wǎng)絡(luò)必須存儲這些信息。記憶是在存儲基礎(chǔ)上建立起的對環(huán)境、對系統(tǒng)自身工作的知識、規(guī)律的總結(jié),包括感知記憶以及行動記憶。前者表示對環(huán)境的認知(例如先驗檢測概率)以及對感知系統(tǒng)參數(shù)調(diào)節(jié)的記錄,后者表示對每一次調(diào)度策略及其效果的記錄。根據(jù)需要記憶又可以分為短期記憶以及長期記憶,后者主要是指各種算法、知識、規(guī)律等。

認知控制:認知控制是認知雷達網(wǎng)絡(luò)系統(tǒng)的“大腦”,是完成反饋閉環(huán)的中樞。認知控制通過分析感知系統(tǒng)對物理環(huán)境的不確定性描述(信息熵),結(jié)合過去的“記憶”,把認知雷達網(wǎng)絡(luò)系統(tǒng)中有限的資源集中到感興趣的區(qū)域以及目標上,實現(xiàn)探測效能的最大化。認知控制主要包括學(xué)習、規(guī)劃以及評估三大功能。學(xué)習是基于探測的信息熵,確定感興趣的區(qū)域以及目標;規(guī)劃是通過各種智能算法對認知網(wǎng)絡(luò)有限的資源進行動態(tài)調(diào)度,生成或更新應(yīng)對策略;評估是實時在線對生成的策略進行評估分析。認知控制可以實現(xiàn)對探測資源的管控(探測行動策略),也可以實現(xiàn)對感知資源的管控(感知行動策略),甚至還可以通過調(diào)整數(shù)據(jù)率等參數(shù)實現(xiàn)對系統(tǒng)網(wǎng)絡(luò)帶寬以及計算資源的管控。

探測組合:探測組合接受認知控制生成的探測行為策略,調(diào)度合適的雷達資源對物理環(huán)境進行探測??梢怨芸氐馁Y源包括探測裝備的選擇、探測天線組合、雷達工作模式、波束分配、波形、頻率、功率等。

4 雷達組網(wǎng)認知控制關(guān)鍵技術(shù)

認知管控的目的是在不降低當前系統(tǒng)整體探測性能的前提下,自適應(yīng)將系統(tǒng)有限的資源調(diào)度到感興趣或者重要的區(qū)域以及目標上,提高對重點區(qū)域或目標的探測能力。從上一節(jié)的分析可以看出,認知控制關(guān)鍵的步驟是要完成“感知-學(xué)習-決策-行動”的閉環(huán),而完成這一閉環(huán)的基礎(chǔ)在于對真實物理環(huán)境的恰當描述以及對環(huán)境、策略的反饋學(xué)習。

4.1 對真實物理環(huán)境不確定性的描述

在傳統(tǒng)的雷達組網(wǎng)系統(tǒng)中,每部雷達上傳的是目標的點跡或者航跡信息,而點跡、航跡等信息僅僅是對目標的物理描述,缺乏對真實世界“不確定性”的描述。為此,需要借助香農(nóng)理論從信息熵的角度描述傳感器網(wǎng)絡(luò)對于目標探測信息量的大小。傳感器網(wǎng)絡(luò)每次探測目標的信息增量 定義為:

其中p、q分別為某事件的先驗概率、后驗概率,pi,i=1為N個事件的離散概率,則先驗概率對應(yīng)的信息熵定義為:

若pi=qi,則I(q,p)=0,表示本次量測沒有提供任何信息,若pi≠qi,則I(q,p)≠0,則說明本次量測提供了新的信息。傳感器的目的就是與目標環(huán)境互相作用,以進一步減小目標環(huán)境的“不確定性”。

4.2 基于貝葉斯理論的目標環(huán)境狀態(tài)估計技術(shù)

由于在雷達檢測跟蹤過程中不可避免的存在量測噪聲,因此需要對量測數(shù)據(jù)進行一定的處理,以準確估計目標環(huán)境狀態(tài)。貝葉斯理論能夠依據(jù)積累的經(jīng)驗值以及當前的量測值,準確估計目標的運動狀態(tài),因此被廣泛應(yīng)用于多目標檢測跟蹤過程中。設(shè)定zk為量測的數(shù)據(jù)向量,xk為目標環(huán)境狀態(tài)向量,則依據(jù)貝葉斯理論有:

貝葉斯理論表明了后驗概率與先驗概率以及當前量測值的關(guān)系。典型的貝葉斯濾波器是卡爾曼濾波器。卡爾曼濾波器精度高,并且具有一定的自適應(yīng)特性,因而是跟蹤濾波中最常用的方法。但在實際系統(tǒng)中,觀測模型往往具有較強的非線性,且模型噪聲可能存在非高斯的情況,因而須使用非線性濾波方法。通過對量測數(shù)據(jù)的濾波,不僅能夠給出目標的運動軌跡,也能夠計算目標的信息熵,這是因為在濾波過程中協(xié)方差矩陣表示的是目標狀態(tài)的不確定性,通過對每一次觀測更新協(xié)方差矩陣,減少目標環(huán)境的不確定性,使信息量增加。

4.3 傳感器網(wǎng)絡(luò)自主學(xué)習技術(shù)

具備自主學(xué)習技術(shù)的傳感器網(wǎng)絡(luò)能夠根據(jù)每次量測的數(shù)據(jù)完成對目標環(huán)境的學(xué)習,在此基礎(chǔ)上采用合適的傳感器組合策略并對策略進行實時在線評估。本文采用增強學(xué)習方法實現(xiàn)雷達組網(wǎng)系統(tǒng)自主學(xué)習的能力。增強學(xué)習算法能夠使機器與環(huán)境進行自主交互,通過感知數(shù)據(jù)完成對目標環(huán)境學(xué)習、規(guī)劃與評估功能,因此十分適合于實現(xiàn)認知控制的反饋閉環(huán)。在認知系統(tǒng)中,目標環(huán)境通??梢越橐粋€有限狀態(tài)的馬爾科夫決策過程(Markov Decision Process,MDP)。在MDP中,狀態(tài)轉(zhuǎn)移概率和獎勵概率在是隨機的但在問題求解過程中保持不變。增強學(xué)習的問題可以定義為:給定環(huán)境狀態(tài)集合S,認知系統(tǒng)行為集合A,獎勵集合R,求解一系列決策規(guī)則δt,t=1,...,T,使得當前的收益與期望的收益最小化。在t時刻,決策規(guī)則δt也稱為策略。

基于增強學(xué)習的傳感器控制閉環(huán)如圖4所示。在第k個管控步驟,傳感器組合不斷的從目標環(huán)境獲取量測數(shù)據(jù),在此基礎(chǔ)上計算k時刻目標的信息熵Hk,并結(jié)合先驗的知識預(yù)測k+1時刻目標的信息熵Hk+1,信息增量模塊計算兩個時刻的信息增量Ik+1,作為增強學(xué)習的獎勵函數(shù)。傳感器控制模塊根據(jù)信息增量Ik+1來動態(tài)調(diào)整探測策略,選擇合適的傳感器組合對目標環(huán)境進行探測,從而完成“感知-學(xué)習-決策-行動”的管控閉環(huán)。

5 結(jié)束語

當前,世界上多個國家都在積極發(fā)展各種新型威脅武器,這些新型目標給傳統(tǒng)的防空雷達組網(wǎng)系統(tǒng)造成了很大的威脅。為有效應(yīng)對這些新型非合作目標對我國領(lǐng)土的威脅,需要進一步提高傳統(tǒng)雷達網(wǎng)絡(luò)的智能協(xié)同能力,才能充分發(fā)揮體系作戰(zhàn)的力量。認知管控技術(shù)通過對感知信息的智能處理,可以協(xié)助幫助鑒定一系列的國土突發(fā)威脅,包括可疑目標行動、非法入境、低空飛行器以及自然災(zāi)害等事件,同時實現(xiàn)雷達資源的自適應(yīng)分配、調(diào)整,進而提升雷達組網(wǎng)探測網(wǎng)絡(luò)的整體作戰(zhàn)效能。本文結(jié)合雷達組網(wǎng)資源管控的基本內(nèi)容以及動態(tài)認知系統(tǒng)的基本理論,提出了一種雷達組網(wǎng)認知管控系統(tǒng)架構(gòu),并對認知控制的關(guān)鍵技術(shù)進行了研究,為雷達組網(wǎng)認知系統(tǒng)的構(gòu)建提供了理論依據(jù)。

參考文獻

[1]HaykinS., Cognitive radar: a way of the future[J].IEEE Signal Processing Magazine, 2006, 23(1):30-40.

[2]HaykinS., Cognitive radar networks [C].Computational Advances in Multi-Sensor Adaptive Processing, 2005 1st IEEE International Workshop on, 2005:1-3.

[3]HaykinS., FusterJ.M., On cognitive dynamic systems: Cognitive neuroscience and engineering learning from each other [J].Proc. IEEE, 2014, 102(4): 608-628.

[4]葉朝謀,丁建江,等.雷達探測資源管理技術(shù)分析與評估[J].現(xiàn)代雷達, 2012, 34(3):6-11.

[5]Steinberg, A., Bowman, C., Rethinking the JDL Data Fusion Levels[C].in Proc .National Symposium on Sensor Data Fusion, 2004.

[6]Felix Smits, Albert Huizing, Wim van Rossum, Peter Hiemstra, A Cognitive Radar Network: Architecture and Application to Multiplatform Radar Management[C].Proceedings of the 5th European Radar Conference, 2008:312-315.

作者簡介:陸澤健(1986,08-),男,2015年獲得北京郵電大學(xué)博士學(xué)位,目前為中電集團電子科學(xué)研究院在站博士后,主要研究方向為多傳感器信息融合、認知系統(tǒng)以及智能優(yōu)化理論和方法。

猜你喜歡
認知管控
業(yè)財一體化財務(wù)共享模式對建筑企業(yè)成本管控
突出礦井大采高綜采工作面過斷層風險管控研究
地鐵備件管理過程中的成本管控分析
農(nóng)村信用社信貸風險管控思考
中美防長在新加坡談管控風險
淺析企業(yè)債務(wù)融資風險管控
詩性與個性:艾略特認知世界的建構(gòu)
《紅樓夢》隱喻認知研究綜述
淺析當代形式下中國文化在德國的影響及滲透
從社會認同淺談蕭峰之死
南澳县| 宝应县| 都兰县| 瑞安市| 桦南县| 灌云县| 阳城县| 达日县| 东源县| 图木舒克市| 日土县| 普洱| 阳城县| 淳安县| 德保县| 荔波县| 横山县| 万荣县| 如东县| 东山县| 广安市| 广东省| 太康县| 诸暨市| 泗洪县| 陈巴尔虎旗| 河间市| 万宁市| 绥棱县| 武山县| 镇坪县| 桂阳县| 海门市| 梧州市| 桃园县| 上栗县| 兴业县| 措美县| 二手房| 晋城| 吉林市|