周城宏,錢衛(wèi)平,郭永強(qiáng)
(北京跟蹤與通信技術(shù)研究所,北京 100094)
雷達(dá)系統(tǒng)中的認(rèn)知控制策略
周城宏,錢衛(wèi)平,郭永強(qiáng)
(北京跟蹤與通信技術(shù)研究所,北京100094)
摘要:人類大腦通過認(rèn)知控制來增強(qiáng)對(duì)周圍環(huán)境的感知能力,雷達(dá)在探測和測量的過程中通過控制系統(tǒng)對(duì)自身狀態(tài)的調(diào)節(jié)來增強(qiáng)工作性能;將認(rèn)知控制引入雷達(dá)系統(tǒng)有助于雷達(dá)的智能化;基于如上出發(fā)點(diǎn),首先概述了認(rèn)知控制的研究狀況和概念,類比了大腦認(rèn)知系統(tǒng)和工程認(rèn)知?jiǎng)討B(tài)系統(tǒng)的共通之處,隨后建立了認(rèn)知控制的數(shù)學(xué)模型,將其歸結(jié)為系統(tǒng)熵態(tài)的最優(yōu)估計(jì)問題和最優(yōu)控制問題,最后將認(rèn)知控制策略引入雷達(dá)對(duì)目標(biāo)的感知過程中。
關(guān)鍵詞:認(rèn)知控制;認(rèn)知?jiǎng)討B(tài)系統(tǒng);信息缺失;雙態(tài)模型;系統(tǒng)熵態(tài)
本文引用格式:周城宏,錢衛(wèi)平,郭永強(qiáng).雷達(dá)系統(tǒng)中的認(rèn)知控制策略[J].四川兵工學(xué)報(bào),2015(12):99-102.
Citation format:ZHOU Cheng-hong,QIAN Wei-ping, GUO Yong-qiang.Cognitive Control Strategy in Radar System[J].Journal of Sichuan Ordnance,2015(12):99-102.
Cognitive Control Strategy in Radar System
ZHOU Cheng-hong,QIAN Wei-ping, GUO Yong-qiang
(Beijing Institute of Tracking and Telecommunications Technology, Beijing 100094, China)
Abstract:Human brain enhances the perception of environment by cognitive control, and similarly, radar control system adjusts state parameters to improve the detection performance. It is promising to introduce cognitive control into radar system to promote the intelligentization of radar. Based on the above background, the concept and research status of cognitive control in psychology and neuroscience were overviewed, and the similarity between human brain and cognitive dynamic system was discussed. Subsequently, a mathematical model of cognitive control was constructed, which can be equal to the optimal estimation and optimal control of entropic state. Finally the strategy of cognitive control in radar was put forward.
Key words:cognitive control; cognitive dynamic system; information gap; two-state model; entropic state
認(rèn)知控制的概念起源于心理學(xué)和神經(jīng)心理學(xué)。1959年Gardner第一次使用認(rèn)知控制,用來描述認(rèn)知過程中的控制原理并解釋相關(guān)任務(wù)實(shí)驗(yàn)結(jié)果。隨后1972年Hammond和 Summers提出 “人在執(zhí)行認(rèn)知任務(wù)中涉及知識(shí)獲取和對(duì)已獲得知識(shí)的認(rèn)知控制兩個(gè)不同過程”的觀點(diǎn),認(rèn)為在認(rèn)知任務(wù)和精神分析任務(wù)中知識(shí)的獲取和應(yīng)用是相互獨(dú)立獨(dú)立的認(rèn)知過程環(huán)節(jié),并從理論上引入認(rèn)知控制的概念,用以闡述其在關(guān)于人類學(xué)習(xí)、判斷和人際活動(dòng)研究中的重要作用[1]。2005年,Brass從認(rèn)知心理學(xué)的角度給出認(rèn)知控制的定義,“認(rèn)知控制過程指的是我們根據(jù)內(nèi)在的目標(biāo)協(xié)調(diào)思想和行動(dòng)的能力”[2]。2009年,Kouneiher提出“認(rèn)知控制在神經(jīng)層面可以看做個(gè)體對(duì)其行為可能導(dǎo)致的后果和已經(jīng)導(dǎo)致的后果進(jìn)行評(píng)估的結(jié)果”[3]。此后2010年,F(xiàn)eldman和Friston在神經(jīng)心理學(xué)中引入環(huán)境的概率分布表示觀點(diǎn),認(rèn)為大腦系統(tǒng)可通過注意來優(yōu)化環(huán)境的概率表示,以便減少環(huán)境感知的熵,實(shí)現(xiàn)不確定性的降低[4]。在人類大腦認(rèn)知系統(tǒng)中,知覺的作用在于從噪聲環(huán)境獲取的觀測量中提取出有效信息。大腦針對(duì)知覺信息通過采取應(yīng)對(duì)行為來保持對(duì)環(huán)境信息的連續(xù)最優(yōu)獲取,這樣的應(yīng)對(duì)行為即為認(rèn)知行動(dòng)。例如,人類視知覺系統(tǒng)在黑暗環(huán)境中對(duì)物體無法準(zhǔn)確識(shí)別,大腦通過放大瞳孔的認(rèn)知行動(dòng)來緩和對(duì)環(huán)境感知的不確定程度,此外,在條件允許的特定情況下也會(huì)通過開燈、開手電筒等決策行為應(yīng)對(duì)。
1認(rèn)知?jiǎng)討B(tài)系統(tǒng)
認(rèn)知?jiǎng)討B(tài)系統(tǒng)是Fuster在人類大腦認(rèn)知系統(tǒng)研究中提出的概念,用以描述視知覺中的知覺動(dòng)作反饋過程,包含知覺動(dòng)作回路(Perception-action cycle)、記憶(Memory)、注意(Attention)和智能(Intelligence)等基本要素[5]。知覺動(dòng)作回路是大腦知覺系統(tǒng)的結(jié)構(gòu)基礎(chǔ),如圖1所示。在大腦視知覺系統(tǒng)中,皮質(zhì)感覺區(qū)感知認(rèn)知任務(wù)(環(huán)境)的視覺刺激,隨后皮質(zhì)運(yùn)動(dòng)區(qū)獲得感覺區(qū)的信息反饋,通過認(rèn)知行動(dòng)的調(diào)節(jié)作用來適應(yīng)環(huán)境以實(shí)現(xiàn)環(huán)境信息的最大獲取。
圖1 大腦知覺系統(tǒng)(左)和認(rèn)知?jiǎng)討B(tài)系統(tǒng)(右)基本結(jié)構(gòu)
認(rèn)知?jiǎng)討B(tài)系統(tǒng)是對(duì)大腦知覺系統(tǒng)的高度抽象,控制器的調(diào)節(jié)行為依賴于知覺器感知環(huán)境后的信息反饋,知覺器的信息獲取包含對(duì)環(huán)境狀態(tài)的測量與估計(jì),控制器的響應(yīng)則涉及系統(tǒng)的最優(yōu)控制。通過知覺動(dòng)作回路的作用,認(rèn)知?jiǎng)討B(tài)系統(tǒng)最大限度地實(shí)現(xiàn)與動(dòng)態(tài)環(huán)境的交互融合[6-9]。認(rèn)知系統(tǒng)通過記憶存儲(chǔ)知覺過程、反饋回路、控制過程中所獲取的知識(shí)與經(jīng)驗(yàn),并反過來輔助、促進(jìn)各過程中知識(shí)的獲取、經(jīng)驗(yàn)的提升以及模塊功能的完善。注意以及智能,以算法的方式整合在知覺動(dòng)作回路之中,保障控制功能的最佳實(shí)現(xiàn)。
通過類比將認(rèn)知?jiǎng)討B(tài)系統(tǒng)引入雷達(dá)系統(tǒng),可構(gòu)建具有人類認(rèn)知特性的智能雷達(dá)系統(tǒng)。在工程背景下,環(huán)境信息通過測量過程流入知覺器,知覺器利用貝葉斯估計(jì)實(shí)現(xiàn)信息提取,信息反饋路徑將知覺器與控制器聯(lián)系一起,控制器在優(yōu)化算法下執(zhí)行最佳控制,控制系統(tǒng)的閉環(huán)回路由此形成。工程系統(tǒng)中的知覺動(dòng)作回路是認(rèn)知控制的基本結(jié)構(gòu),記憶、注意與智能等特性通過存儲(chǔ)器、體制結(jié)構(gòu)和智能算法等實(shí)現(xiàn)。
2量測信息的度量模型
測量信息由傳感器在噪聲環(huán)境中直接測量獲得,包含有效信息和環(huán)境噪聲、干擾等因素引入的無用信息;將測量空間向信息空間的投影,可提取有效信息,分為與當(dāng)前任務(wù)需求緊密聯(lián)系的相關(guān)信息和與之無關(guān)的冗余信息;在最小風(fēng)險(xiǎn)意義下,執(zhí)行當(dāng)前任務(wù)所需的信息為充分信息,相關(guān)信息是充分信息與有效信息的交集;充分信息中無法通過測量獲取的部分,即充分信息與相關(guān)信息的差集為信息缺失(Information gap)[11],如圖2所示。
圖2 信息缺失概念示意圖
工程系統(tǒng)中的認(rèn)知控制可由如下定義給出:假設(shè)存在一個(gè)擁有知覺動(dòng)作回路結(jié)構(gòu)的類人腦隨機(jī)動(dòng)力系統(tǒng),認(rèn)知控制的功能就是調(diào)節(jié)從系統(tǒng)知覺部分向其執(zhí)行部分流動(dòng)的信息流,從而在最小風(fēng)險(xiǎn)意義下縮減當(dāng)前任務(wù)的信息缺失。
系統(tǒng)雙態(tài)模型的思想為用系統(tǒng)狀態(tài)和系統(tǒng)熵態(tài)表征系統(tǒng)信息特征。系統(tǒng)狀態(tài)是系統(tǒng)信息的表征,是經(jīng)典測量操作下的不變量(非量子理論體系);系統(tǒng)熵態(tài)是信息缺失的度量,是系統(tǒng)不確定度的表征。
2.2.1狀態(tài)空間模型
在給定時(shí)刻,系統(tǒng)狀態(tài)表征當(dāng)前時(shí)刻的系統(tǒng)信息,同理,狀態(tài)隨時(shí)間的變化表征系統(tǒng)的演化行為。系統(tǒng)的真實(shí)狀態(tài)無法直接獲取,只能通過噪聲環(huán)境下的觀測量間接估計(jì),如在先驗(yàn)信息條件下的貝葉斯估計(jì)。對(duì)系統(tǒng)的先驗(yàn)認(rèn)識(shí)可體現(xiàn)在狀態(tài)空間模型(State-space model)如圖3所示,包含描述系統(tǒng)演化的狀態(tài)方程和刻畫系統(tǒng)狀態(tài)獲取的量測方程。
圖3 狀態(tài)空間模型
狀態(tài)方程
xn離散時(shí)間系統(tǒng)狀態(tài)為馬爾科夫序列,狀態(tài)方程表示從n時(shí)刻到n+1時(shí)刻的狀態(tài)轉(zhuǎn)移,n表示離散時(shí)間,狀態(tài)轉(zhuǎn)移取決于轉(zhuǎn)移函數(shù)、當(dāng)前狀態(tài)和系統(tǒng)噪聲,其中an(.,.)為狀態(tài)轉(zhuǎn)移函數(shù),xn為當(dāng)前狀態(tài),xn+1為下一時(shí)刻狀態(tài),ωn為系統(tǒng)噪聲。如果系統(tǒng)噪聲為加性噪聲,則狀態(tài)方程可簡化為xn+1=an(xn)+ωn;如果狀態(tài)轉(zhuǎn)移為線性函數(shù),xn+1=An+1,nxn+ωn,系統(tǒng)方程可簡化為線性方程,其中An+1,n為狀態(tài)轉(zhuǎn)移矩陣;如果ωn為高斯過程,則狀態(tài)方程為線性高斯系統(tǒng),協(xié)方差矩陣可記為Qω,n。
量測方程:
yn表示目標(biāo)狀態(tài)量測量,量測結(jié)果決定于量測函數(shù)、當(dāng)前狀態(tài)、量測噪聲,其中bn(.,.)為量測函數(shù),vn為測量噪聲。若量測噪聲為加性噪聲,則量測方程可簡化為xn+1=bn(xn)+vn;若量測過程為線性函數(shù),則量測方程可簡化為xn+1=Bnxn+vn,其中Bn為量測矩陣;若vn為高斯隨機(jī)過程,協(xié)方差矩陣可記為Rv,n,則量測方程為線性高斯的。
2.2.2系統(tǒng)熵態(tài)模型
由于系統(tǒng)本身、測量環(huán)節(jié)等存在一定程度的不確定性,因而系統(tǒng)的狀態(tài)和觀測量均用隨機(jī)變量表征。系統(tǒng)狀態(tài)即為一個(gè)概率分布,實(shí)際觀測結(jié)果即為觀測變量的實(shí)現(xiàn)。狀態(tài)的獲得需通過噪聲環(huán)境下的測量,反之,可通過測量結(jié)果來估計(jì)系統(tǒng)狀態(tài)的后驗(yàn)概率分布。信息缺失的概念刻畫了系統(tǒng)狀態(tài)的不確定程度,信息論中不確定度可由概率分布的全局量——熵表征,因而信息缺失可由系統(tǒng)熵態(tài)刻畫,可定義為系統(tǒng)狀態(tài)后驗(yàn)分布的Shannon熵。
若xn表示系統(tǒng)n時(shí)刻狀態(tài),p(xn)表示系統(tǒng)狀態(tài)的先驗(yàn)概率分布,當(dāng)獲得n時(shí)刻觀測量yn后,p(xn|n)表示該時(shí)刻系統(tǒng)狀態(tài)的后驗(yàn)概率分布,該時(shí)刻系統(tǒng)熵態(tài)Hn|n定義為p(xn|n)的Shannon熵:
xn是隨機(jī)變量,Yn是觀測集{y1,y2,…,yn}。
3認(rèn)知控制模型
雷達(dá)認(rèn)知控制的基本思想在于通過控制系統(tǒng)實(shí)時(shí)調(diào)整自身狀態(tài)來減小目標(biāo)測量過程中的信息缺失。因而認(rèn)知控制可以歸結(jié)為兩個(gè)子問題,即系統(tǒng)熵態(tài)的最優(yōu)估計(jì)和系統(tǒng)熵態(tài)的最優(yōu)控制。
系統(tǒng)熵態(tài)是系統(tǒng)狀態(tài)后驗(yàn)概率分布的Shannon熵,因而系統(tǒng)熵態(tài)的估計(jì)取決于系統(tǒng)狀態(tài)的感知。系統(tǒng)狀態(tài)的感知過程是對(duì)系統(tǒng)狀態(tài)進(jìn)行獲取和估計(jì)的過程。狀態(tài)獲取結(jié)果為傳感器觀測集,是觀測隨機(jī)變量的實(shí)現(xiàn);狀態(tài)估計(jì)可通過最小方差、最大似然、最小二乘等思想實(shí)現(xiàn),然而,在具備系統(tǒng)狀態(tài)先驗(yàn)信息的情況下,可通過貝葉斯估計(jì)在最小風(fēng)險(xiǎn)函數(shù)意義下實(shí)現(xiàn)最優(yōu)估計(jì)。一般可采取最小平均風(fēng)險(xiǎn)函數(shù)意義下的貝葉斯估計(jì)。對(duì)于最小均方差準(zhǔn)則,加性高斯白噪聲下的線性系統(tǒng),貝葉斯濾波器簡化為卡爾曼濾波器;對(duì)于非線性高斯系統(tǒng),貝葉斯濾波器可通過EKF、UKF或CKF等近似實(shí)現(xiàn);非線性非高斯系統(tǒng)則選用Monte Carlo粒子濾波器。狀態(tài)估計(jì)的準(zhǔn)確程度取決于系統(tǒng)狀態(tài)的后驗(yàn)不確定度,即信息缺失量,系統(tǒng)熵態(tài)可用系統(tǒng)狀態(tài)的后驗(yàn)概率分布的Shannon熵表示。獲得系統(tǒng)狀態(tài)后驗(yàn)概率分布后,通過降低信息缺失來增強(qiáng)狀態(tài)估計(jì)性能的最優(yōu)控制是認(rèn)知控制的基本思想。
在認(rèn)知控制結(jié)構(gòu)中,認(rèn)知行動(dòng)可直接作用于環(huán)境,從而間接影響知覺器的知覺過程,例如辨識(shí)在黑暗環(huán)境中的物體,開燈的行為便是通過改變環(huán)境提升對(duì)物體的知覺;認(rèn)知行動(dòng)也可作用于系統(tǒng)本身,例如改變傳感器等結(jié)構(gòu)的自身配置,在黑暗環(huán)境放大瞳孔來增加物體反射光的接收,認(rèn)知雷達(dá)通過調(diào)整發(fā)射波形來改善當(dāng)前目標(biāo)探測性能;物理行動(dòng)同樣能夠作用于系統(tǒng),例如挪近物體位置有助于黑暗環(huán)境中物體辨識(shí)。
假設(shè)雷達(dá)的狀態(tài)可由參數(shù)集Λ表征,其中Λ={λk|k=1,2,…,n},λk為表征雷達(dá)系統(tǒng)狀態(tài)的參數(shù),如載頻、帶寬、極化、功率、天線、波形等所有相關(guān)參量,雷達(dá)在n時(shí)刻發(fā)射的信號(hào)可由Λn表征,在雷達(dá)目標(biāo)與環(huán)境的共同電磁散射作用下得到觀測量yn,隨之得到系統(tǒng)熵態(tài)Hn|n,因此Hn|n~Λn,因此在模型Hn|n(Λ)下求解Λ使得
如上的參數(shù)調(diào)整過程即為圖4中認(rèn)知控制器對(duì)系統(tǒng)的認(rèn)知行動(dòng)作用,雷達(dá)通過認(rèn)知控制過程調(diào)整到優(yōu)化發(fā)射狀態(tài)后執(zhí)行對(duì)目標(biāo)的量測過程。本質(zhì)上,Hn|n是控制過程的目標(biāo)函數(shù),而Λ是控制變量。
圖4 認(rèn)知?jiǎng)討B(tài)系統(tǒng)中的認(rèn)知控制結(jié)構(gòu)
認(rèn)知控制中,可將系統(tǒng)熵態(tài)定義為Hn|n,表示獲取第n個(gè)觀測量后確定的系統(tǒng)不確定度。與系統(tǒng)狀態(tài)不同,系統(tǒng)熵態(tài)無法直接控制。例如,目標(biāo)的位置與期望存在一定偏差,可直接改變目標(biāo)位置進(jìn)行補(bǔ)償;然而目標(biāo)的熵態(tài)與期望一定偏差,則無法直接減少目標(biāo)狀態(tài)不確定度,只能通過其他量間接控制。此外,系統(tǒng)熵態(tài)的減小,不僅僅要在局部實(shí)現(xiàn),更要在全局實(shí)現(xiàn)。即在n時(shí)刻獲得觀測量后,通過采取控制行為,在降低n+1時(shí)刻系統(tǒng)熵態(tài)的同時(shí),也要降低n+1之后所有時(shí)刻的系統(tǒng)熵態(tài)。
4結(jié)論
認(rèn)知控制來源于心理學(xué)與神經(jīng)科學(xué),尚未在工程領(lǐng)域得到廣泛應(yīng)用。認(rèn)知控制模擬人類認(rèn)知系統(tǒng),是以降低信息缺失為基本思想的信息控制方法。本文在對(duì)認(rèn)知心理學(xué)和認(rèn)知神經(jīng)科學(xué)中大腦認(rèn)知控制研究加以分析的基礎(chǔ)上,通過類比將人類認(rèn)知控制過程引入雷達(dá)系統(tǒng),構(gòu)建了信息缺失最小化的認(rèn)知控制模型,并將問題轉(zhuǎn)化為系統(tǒng)熵態(tài)的最優(yōu)估計(jì)與控制,最終對(duì)認(rèn)知控制在雷達(dá)系統(tǒng)中的作用進(jìn)行了分析論述。認(rèn)知控制是一種融合認(rèn)知、信息與控制的新思維方法,在智能雷達(dá)系統(tǒng)中將有極大需求和應(yīng)用。
參考文獻(xiàn):
[1]Hammond K R,Summers D A.Cognitive control[J].Psychological review,1972,79(1):58.
[2]Brass M,Derrfuss J,Forstmann B,et al.The role of the inferior frontal junction area in cognitive control[J].Trends in cognitive sciences,2005,9(7):314-316.
[3]Kouneiher F,Charron S,Koechlin E.Motivation and cognitive control in the human prefrontal cortex[J].Nature neuroscience,2009,12(7):939-945.
[4]Feldman H,Friston K J.Attention,uncertainty,and free-energy[J].Frontiers in human neuroscience,2010(4):17-21.
[5]Fuster J M.Cortex and mind:Unifying cognition[M].Oxford university press,2003.
[6]Haykin S,Xue Y,Setoodeh P.Cognitive radar:Step toward bridging the gap between neuroscience and engineering[J].Proceedings of the IEEE,2012,100(11):3102-3130.
[7]Haykin S,Fatemi M,Setoodeh P,et al.Cognitive control[J].Proceedings of the IEEE,2012,100(12):3156-3169.
[8]Haykin S.Cognitive radio:brain-empowered wireless communications[J].Selected Areas in Communications,IEEE Journal on,2005,23(2):201-220.
[9]Haykin S.Cognitive dynamic systems:Perception-Action cycle,radar and radio[M].Cambridge University Press,2012.
[10]Ben-Haim Y.Information-gap decision theory:decisions under severe uncertainty[M].Academic Press,2001.
[11]Arasaratnam I,Haykin S.Cubature kalman filters[J].Automatic Control,IEEE Transactions on,2009,54(6):1254-1269.(責(zé)任編輯周江川)
【信息科學(xué)與控制工程】
中圖分類號(hào):TN95
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1006-0707(2015)12-0099-04
doi:10.11809/scbgxb2015.12.025
作者簡介:周城宏(1989—),男,碩士研究生,主要從事認(rèn)知雷達(dá)體制與技術(shù)和動(dòng)態(tài)目標(biāo)的電磁散射研究。
收稿日期:2015-06-01