特邀策劃人
李艷斌
博士,中國電子科技集團(tuán)公司第五十四研究所研究員。
暢鑫
博士,中國電子科技集團(tuán)公司第五十四研究所高級工程師。
劉東輝
博士,石家莊鐵道大學(xué)管理學(xué)院講師,長期從事復(fù)雜系統(tǒng)管理、策略優(yōu)化等領(lǐng)域的研究。獲評中國地質(zhì)大學(xué)(北京)優(yōu)秀博士學(xué)位論文,在國內(nèi)外期刊和會(huì)議發(fā)表論文15 篇,其中,以第一作者發(fā)表SCI / SSCI 論文5 篇。主研河北省教育廳青年基金項(xiàng)目1 項(xiàng),擔(dān)任Nonlinear Dynamics,International Journal of Financial Research,Complexity 等國際期刊審稿人。
馬宏斌
博士,航天工程大學(xué)電子與光學(xué)工程系、智能化航天測運(yùn)控教育部重點(diǎn)實(shí)驗(yàn)室講師。長期從事人工智能、電磁頻譜感知等領(lǐng)域的研究,在國內(nèi)外期刊和會(huì)議發(fā)表論文10 篇,其中,SCI 論文8 篇,會(huì)議優(yōu)秀論文1 篇,授權(quán)發(fā)明專利21 項(xiàng),擔(dān)任IEEE Signal Letters,SignalImage and Video Processing 等期刊審稿人。
內(nèi)容導(dǎo)讀
隨著Alpha Go 在圍棋領(lǐng)域擊敗李在石奪冠、Alpha Star 在復(fù)雜的“星際爭霸2”游戲中完勝職業(yè)選手、深度強(qiáng)化學(xué)習(xí)支撐在托卡馬克裝置內(nèi)保持核聚變等離子體穩(wěn)定驚艷全球,這些里程碑事件展示了基于人工智能的決策技術(shù)在各種實(shí)時(shí)、動(dòng)態(tài)和復(fù)雜環(huán)境下的驚人表現(xiàn),從而證明了其在決策制定方面的巨大潛力。在各個(gè)領(lǐng)域中,基于人工智能的決策技術(shù)都具有革命性的潛力。在無人駕駛領(lǐng)域,智能系統(tǒng)可以根據(jù)路況和環(huán)境實(shí)時(shí)做出決策,提高交通安全性和效率。在頻譜管控方面,人工智能可以優(yōu)化無線電頻譜的利用,提高通信網(wǎng)絡(luò)的性能。在智慧醫(yī)療領(lǐng)域,人工智能可以幫助醫(yī)生做出更準(zhǔn)確的診斷和治療建議,提高醫(yī)療服務(wù)的質(zhì)量和效率。在指揮控制領(lǐng)域,人工智能可以輔助軍事人員及時(shí)做出決策,應(yīng)對各種復(fù)雜情況。因此,推動(dòng)智能決策技術(shù)的發(fā)展是將我國建成人工智能領(lǐng)域的領(lǐng)先國家和全球創(chuàng)新中心的重要方向之一。
在當(dāng)今所處的大數(shù)據(jù)時(shí)代,智能決策技術(shù)能夠充分地利用海量數(shù)據(jù)分析、挖掘和探索內(nèi)在機(jī)理,解決動(dòng)態(tài)復(fù)雜場景下的多目標(biāo)優(yōu)化和多智能體的協(xié)同管控等問題。為集中展現(xiàn)基于人工智能的決策技術(shù)的最新研究成果,《無線電工程》第6 期推出“基于人工智能的決策技術(shù)”專題。專題采用公開征稿的方式組織稿件,在所有通過專家評審的稿件中,最終確定錄用稿件7 篇。專題主要展示了通信輻射源識(shí)別、協(xié)作頻譜感知、解決獎(jiǎng)賞稀疏性問題、多智能體協(xié)同能力提升、基于LEO 衛(wèi)星網(wǎng)絡(luò)的切換判決、電力物聯(lián)網(wǎng)動(dòng)態(tài)切片策略和車聯(lián)網(wǎng)資源分配等研究成果。
在通信輻射源識(shí)別方面收錄1 篇論文。作為電磁頻譜決策和管控的重要環(huán)節(jié),王育欣等介紹了開源輻射源識(shí)別數(shù)據(jù)集,綜述了基于知識(shí)驅(qū)動(dòng)和基于數(shù)據(jù)驅(qū)動(dòng)的輻射源個(gè)體識(shí)別技術(shù)研究現(xiàn)狀,剖析了當(dāng)前深度學(xué)習(xí)在輻射源個(gè)體識(shí)別領(lǐng)域面臨的問題,指引了未來輻射源個(gè)體識(shí)別的發(fā)展方向。
在協(xié)作頻譜感知方面收錄1 篇論文。為解決多節(jié)點(diǎn)協(xié)作頻譜感知引起的全局決策延遲問題,劉春玲等提出節(jié)點(diǎn)評估與選擇和網(wǎng)格搜索的強(qiáng)化學(xué)習(xí)算法。先通過節(jié)點(diǎn)評估與選擇算法阻止惡意用戶參與協(xié)作頻譜感知,再基于網(wǎng)格搜索的強(qiáng)化學(xué)習(xí)機(jī)制搜索出所有可能的參數(shù)組合。仿真結(jié)果表明,該方法與其他算法相比,在提高檢測概率的同時(shí),解決了全局決策延遲的問題。
在解決多智能體策略生成獎(jiǎng)賞稀疏性問題的理論研究方面收錄1 篇論文。針對特定策略如何快速產(chǎn)生對抗策略這一問題,劉東輝等基于靜態(tài)博弈理念,對馬爾科夫決策過程演化,以對抗結(jié)果作為目標(biāo)函數(shù),基于動(dòng)作集合優(yōu)化目標(biāo)函數(shù),對策略優(yōu)化問題進(jìn)行數(shù)學(xué)建模。相比于經(jīng)典多智能體強(qiáng)化學(xué)習(xí)方法,本方法能夠針對特定策略高效產(chǎn)生多智能體對抗策略。
在提升多智能體協(xié)同能力的理論研究方面收錄1 篇論文。針對典型多智能體博弈對抗策略生成框架缺乏從整體角度對子策略的協(xié)同控制的問題,暢鑫等基于分層強(qiáng)化學(xué)習(xí)提出改進(jìn)方法。構(gòu)造融合觀測信息的頂層策略控制模型,完成控制信息的映射。基于開源對抗場景的實(shí)驗(yàn)結(jié)果表明,該策略生成方法對于多智能體協(xié)同對抗效果提升明顯。
在基于LEO 衛(wèi)星網(wǎng)絡(luò)的切換判決方面收錄1 篇論文。張英健等結(jié)合LEO 衛(wèi)星網(wǎng)絡(luò)切換判決方法研究進(jìn)展,綜述了切換判決方法。歸納了常用的圖論模型切換判決方法??偨Y(jié)了機(jī)器學(xué)習(xí)在LEO 衛(wèi)星網(wǎng)絡(luò)切換判決中的應(yīng)用。結(jié)合常用評價(jià)性能指標(biāo)對不同切換判決方法進(jìn)行了對比分析。對未來LEO 衛(wèi)星網(wǎng)絡(luò)切換研究值得關(guān)注的問題進(jìn)行了展望,為后續(xù)相關(guān)研究提供解決思路。
在電力物聯(lián)網(wǎng)動(dòng)態(tài)切片策略研究方面收錄1 篇論文。辛銳等研究了動(dòng)態(tài)網(wǎng)絡(luò)場景下的切片策略,基于深度強(qiáng)化學(xué)習(xí)算法求解虛擬網(wǎng)絡(luò)功能部署和業(yè)務(wù)傳輸路由確定這一復(fù)雜聯(lián)合優(yōu)化問題,實(shí)驗(yàn)證明所提策略能根據(jù)目前的網(wǎng)絡(luò)狀態(tài)靈活地改變部署方案,控制業(yè)務(wù)路由平均能量損耗、平均可靠性和平均剩余帶寬占有率,提高了網(wǎng)絡(luò)整體傳輸性能。
在車聯(lián)網(wǎng)資源分配方面收錄1 篇論文。孟水仙等為解決車輛高速移動(dòng)性和全局狀態(tài)信息獲取困難等問題,提出了一種基于完全分布式多智能體深度強(qiáng)化學(xué)習(xí)的資源分配算法。引入共享經(jīng)驗(yàn)池機(jī)制、長短期記憶網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)結(jié)合增強(qiáng)算法的準(zhǔn)確性和預(yù)測能力。實(shí)驗(yàn)結(jié)果表明,所提出的算法能夠滿足車對基礎(chǔ)設(shè)施鏈路的高吞吐量以及車對車鏈路的低延遲要求,并且對環(huán)境變化表現(xiàn)出良好的適應(yīng)性。
綜上所述,專題收錄的7 篇論文,分別針對特定的研究問題,從理論研究和工程應(yīng)用維度,多個(gè)視角展示了當(dāng)前基于人工智能的決策技術(shù)的進(jìn)展,得到了有意義的研究結(jié)論,能夠提供較好的參考作用。當(dāng)然,這些論文也不能窮盡智能通信技術(shù)各方面的進(jìn)展,希望通過這些論文的刊出,讓更多的專家學(xué)者和研究人員關(guān)注該領(lǐng)域的發(fā)展,從而促進(jìn)產(chǎn)生更多的研究成果。
最后,感謝參與稿件評審的各位專家學(xué)者的辛勤工作,衷心希望專題的出版能夠?qū)谌斯ぶ悄艿臎Q策技術(shù)研究起到有益的作用。