吳浩煒,張川
(1.中國電子科技南湖研究院,浙江 嘉興 314001;2.中國科學(xué)技術(shù)大學(xué)先進(jìn)技術(shù)研究院,安徽 合肥 230000)
無人駕駛飛機(jī)(Unmanned Aerial Vehicle,UAV)簡(jiǎn)稱“無人機(jī)”,因其價(jià)格低、維護(hù)成本小、高機(jī)動(dòng)性等優(yōu)點(diǎn),已廣泛應(yīng)用于軍事和民用領(lǐng)域[1]。無人機(jī)避障技術(shù)和路徑規(guī)劃是無人機(jī)自主飛行、保障無人機(jī)安全和完成任務(wù)的關(guān)鍵技術(shù)。提高無人機(jī)的路徑規(guī)劃能力對(duì)無人機(jī)智能化、自主化是不可或缺的。
無人機(jī)的路徑規(guī)劃任務(wù)是綜合考慮無人機(jī)自身的動(dòng)力學(xué)約束和環(huán)境約束,結(jié)合飛行路徑長(zhǎng)度、最優(yōu)性、安全性、飛行能耗、飛行時(shí)長(zhǎng)等因素,規(guī)劃出一條從出發(fā)點(diǎn)到目的地的最優(yōu)路徑。飛行路徑的求解是一個(gè)NP-Hard(非確定性多項(xiàng)式時(shí)間)問題,并且往往是非凸問題,因此最優(yōu)路徑求解的計(jì)算量極大。而對(duì)無人機(jī)系統(tǒng)這類時(shí)變非線性動(dòng)態(tài)系統(tǒng)而言,高計(jì)算效率的路徑規(guī)劃能力至關(guān)重要。
總體而言,無人機(jī)的路徑規(guī)劃應(yīng)滿足以下四點(diǎn)原則:(1)路徑規(guī)劃應(yīng)能得到從起始節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)的路徑;(2)無人機(jī)在飛行路徑上不會(huì)與障礙物碰撞;(3)生成的路徑需要滿足無人機(jī)自身的機(jī)動(dòng)約束;(4)生成的路徑應(yīng)該盡可能優(yōu)化。為了更全面細(xì)致地了解無人機(jī)的各種路徑規(guī)劃技術(shù),本文將對(duì)現(xiàn)有文獻(xiàn)進(jìn)行全面綜述,如圖1所示為無人機(jī)路徑規(guī)劃技術(shù)圖示。
圖1 無人機(jī)路徑規(guī)劃技術(shù)Figure 1 UAV path planning technology
在基于采樣的路徑規(guī)劃方法中,無人機(jī)的路徑規(guī)劃問題轉(zhuǎn)化為一個(gè)連續(xù)的狀態(tài)空間中從有限的候選路徑中選擇一條可行的路徑。在進(jìn)行路徑規(guī)劃前,需要預(yù)先定義三維空間環(huán)境的空間配置信息,將整體的狀態(tài)空間離散成有限的點(diǎn)集,然后使用路徑規(guī)劃方法將節(jié)點(diǎn)映射到空間配置上,在有限點(diǎn)集中通過數(shù)值方法搜索最優(yōu)路徑。基于采樣的路徑規(guī)劃具有以下優(yōu)點(diǎn):(1)能夠在較短的時(shí)間內(nèi)尋找到一條可行的飛行路徑,能很好地滿足實(shí)時(shí)性要求,且可以理論推導(dǎo)出路徑具備的概率完備性;(2)能夠適用于不同的動(dòng)態(tài)環(huán)境;(3)不需要顯式地枚舉約束條件,可以進(jìn)行路徑軌跡檢查?;诓蓸拥穆窂揭?guī)劃方法有風(fēng)險(xiǎn)地圖、單元分解、路線圖、勢(shì)場(chǎng)法等。
考慮到無人機(jī)飛行時(shí)的靜態(tài)和動(dòng)態(tài)威脅,Mujumdar和Padhi[2]提出將無人機(jī)路徑規(guī)劃分成全局路徑規(guī)劃和局部路徑規(guī)劃兩階段。Primatesta等[3]提出了風(fēng)險(xiǎn)地圖這一概念。風(fēng)險(xiǎn)地圖是一種基于位置風(fēng)險(xiǎn)的動(dòng)態(tài)地圖,地圖中的每一個(gè)位置點(diǎn)都與無人機(jī)飛過該點(diǎn)的風(fēng)險(xiǎn)相關(guān),風(fēng)險(xiǎn)成本量化了無人機(jī)飛過該點(diǎn)的風(fēng)險(xiǎn)。他們提出了在基于風(fēng)險(xiǎn)地圖的基礎(chǔ)上,對(duì)無人機(jī)進(jìn)行全局離線路徑規(guī)劃和局部在線路徑規(guī)劃兩個(gè)階段。全局離線路徑規(guī)劃在給定風(fēng)險(xiǎn)地圖、起始節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)的情況下,避開靜態(tài)障礙物和禁飛區(qū),在計(jì)算最小風(fēng)險(xiǎn)成本的情況下搜索一條最優(yōu)飛行路徑,全局離線路徑規(guī)劃是在無人機(jī)開始執(zhí)行任務(wù)前計(jì)算的。局部在線路徑規(guī)劃是根據(jù)不斷變化的動(dòng)態(tài)風(fēng)險(xiǎn)地圖,對(duì)已經(jīng)生成的全局離線規(guī)劃路徑進(jìn)行調(diào)整。當(dāng)預(yù)先生成的路徑中出現(xiàn)未預(yù)料到的障礙物和其他風(fēng)險(xiǎn)因素時(shí),風(fēng)險(xiǎn)地圖會(huì)發(fā)生變化,局部在線路徑規(guī)劃會(huì)根據(jù)變化的風(fēng)險(xiǎn)地圖重新進(jìn)行路徑規(guī)劃,確保無人機(jī)不會(huì)與障礙物發(fā)生碰撞。Primatesta等[3]首先在靜態(tài)風(fēng)險(xiǎn)地圖上使用改進(jìn)A*算法的risk A*算法計(jì)算全局路徑,然后在動(dòng)態(tài)風(fēng)險(xiǎn)地圖上提出了一種Borderland算法。該算法基于應(yīng)用于網(wǎng)格圖的Bug算法,在在線路徑規(guī)劃中檢查不斷變化的動(dòng)態(tài)風(fēng)險(xiǎn)圖并對(duì)規(guī)劃的路徑進(jìn)行實(shí)時(shí)調(diào)整。實(shí)驗(yàn)結(jié)果表明,Borderland算法能夠在短時(shí)間、多種場(chǎng)景下調(diào)整路徑,最大程度地降低風(fēng)險(xiǎn)成本,且Borderland算法并不從頭開始計(jì)算新路徑,而是僅在必要情況下對(duì)現(xiàn)有路徑進(jìn)行調(diào)整。尤其在高維地圖中,該方法具有明顯優(yōu)勢(shì)。
在單元分解法中,首先將構(gòu)形空間C-space(configuration space)劃分為不同的單元或者區(qū)域的集合,然后計(jì)算出同一單元或相鄰單元的安全路徑。當(dāng)計(jì)算出C-space的單元分解后,按順序連接單元后即可得到飛行路徑[4]。
路線圖方法通過定義三維空間環(huán)境中的曲線來計(jì)算自由C-space的連通性。當(dāng)路線圖構(gòu)建完成后,在搜索階段,根據(jù)給定的初始節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)通過拼接曲線來搜索飛行路徑。路線圖方法常適用于靜態(tài)環(huán)境,路徑規(guī)劃的時(shí)間較短,通常可以完成實(shí)時(shí)求解。目前使用最廣泛的路線圖方法有A*算法、快速擴(kuò)展隨機(jī)樹(Rapidly-Exploring Random Tree,RRT)等。
RRT算法由于其對(duì)動(dòng)態(tài)環(huán)境良好的適應(yīng)性,已被廣泛應(yīng)用于無人機(jī)路徑規(guī)劃中,如圖2所示為RRT算法示意圖。Zhang等[5]提出了一種RRT Connect方法,該方法將RRT與人工勢(shì)場(chǎng)法相結(jié)合,對(duì)無人機(jī)飛行路徑進(jìn)行規(guī)劃,仿真結(jié)果表明RRT Connect相比RRT得到了更短的飛行路徑長(zhǎng)度。Lin和Saripalli[6]提出了一種基于閉環(huán)RRT的路徑規(guī)劃生成樹,并在該方法的基礎(chǔ)上提出了三種改進(jìn)模型:(1)簡(jiǎn)化節(jié)點(diǎn)連接策略,用以減少路徑規(guī)劃的時(shí)間;(2)利用中間節(jié)點(diǎn),通過無碰撞軌跡的中間節(jié)點(diǎn)以提高路徑規(guī)劃過程的效率;(3)可達(dá)集的碰撞預(yù)測(cè),通過利用可達(dá)集節(jié)點(diǎn)對(duì)障礙物的運(yùn)動(dòng)進(jìn)行預(yù)測(cè),提出了候選軌跡法,使得無人機(jī)網(wǎng)絡(luò)對(duì)意外障礙物具有更強(qiáng)的健壯性。同時(shí)他們?cè)诶碚撋贤茖?dǎo)出了算法具有概率完備性,若存在解,則在足夠的采樣點(diǎn)上尋找到解的概率收斂于1。實(shí)驗(yàn)結(jié)果表明,該路徑規(guī)劃算法能夠讓無人機(jī)避開不同數(shù)量、不同飛行方向的移動(dòng)障礙物,并且能夠在不同的無人機(jī)平臺(tái)上工作。Yang等[7]提出了一種基于環(huán)境勢(shì)場(chǎng)的RRT算法以解決無人機(jī)路徑規(guī)劃問題,實(shí)驗(yàn)結(jié)果表明,該算法具有較高的收斂效率。
圖2 快速擴(kuò)展隨機(jī)樹(RRT)Figure 2 Rapidly expanding random tree
人工勢(shì)場(chǎng)法(Artificial Potential Field,APF)最早是由Khatib[8]提出的,該算法簡(jiǎn)單有效,計(jì)算量小且路徑平滑,但存在局部極小現(xiàn)象。如圖3所示為人工勢(shì)場(chǎng)法中目標(biāo)產(chǎn)生的引力場(chǎng)和障礙物產(chǎn)生的斥力場(chǎng)。毛晨悅等[9]提出了一種基于APF的無人機(jī)路徑規(guī)劃避障算法,在給定出發(fā)點(diǎn)和目標(biāo)點(diǎn)的情況下預(yù)先生成一條路徑,以提高路徑連貫性,將安全性、平滑性和飛行能耗作為調(diào)節(jié)因子來計(jì)算代價(jià)函數(shù),最終在候選路徑中選取代價(jià)最小的飛行路徑。丁家如等[10]提出了改進(jìn)APF的無人機(jī)路徑規(guī)劃算法,該算法在路徑規(guī)劃前對(duì)全局地圖信息進(jìn)行了威脅建模和連通性分析,縮小了搜索范圍,同時(shí)通過曲率檢查對(duì)軌跡平滑化,提高了算法的效率和適應(yīng)性。Dai等[11]提出了一種分層PFM(Potential Field Method)來解決無人機(jī)飛行中目的節(jié)點(diǎn)不可達(dá)的問題,Bai等[12]向PFM中加入了縱向因素以解決無人機(jī)之間的局部極小陷阱。Chen等[13]在PFM中加入了協(xié)調(diào)力以解決無人機(jī)飛行過程中的局部極小問題。仿真結(jié)果表明,該方法避免碰撞的概率為98%,可以得到一條安全無碰撞的最優(yōu)路徑。
圖3 人工勢(shì)場(chǎng)法中目標(biāo)產(chǎn)生的引力場(chǎng)和障礙物產(chǎn)生的斥力場(chǎng)Figure 3 The gravitational field generated by the target and the repulsive field generated by the obstacle in the artificial potential field method a)gravitational field b)repulsive field
基于數(shù)學(xué)模型的路徑規(guī)劃方法將無人機(jī)的路徑規(guī)劃問題轉(zhuǎn)化為數(shù)值優(yōu)化問題,旨在解析意義上得到一條最優(yōu)路徑。該類方法主要包括線性規(guī)劃(Linear Programming,LP)、混 合 整 數(shù) 線 性 規(guī) 劃(Mixed Integer Linear Programming,MILP)、非線性規(guī)劃(Nonlinear Programming,NP)、動(dòng)態(tài)規(guī)劃(Dynamic Programming,DP)、貝塞爾曲線、Dubins曲線等。這類算法的時(shí)間復(fù)雜度通常是用多項(xiàng)式方程來描述的,計(jì)算時(shí)長(zhǎng)很長(zhǎng),故大多數(shù)基于數(shù)學(xué)模型的算法通常被用于無人機(jī)的離線路徑規(guī)劃中。將LP應(yīng)用于無人機(jī)的路徑規(guī)劃時(shí),可以將非線性復(fù)雜問題轉(zhuǎn)化為線性規(guī)劃模型。MILP已經(jīng)在數(shù)學(xué)建模中得到了廣泛的使用,被認(rèn)為是能夠提出最優(yōu)解和接近最優(yōu)解的強(qiáng)大數(shù)學(xué)工具,因此De Waen等[14]利用MILP計(jì)算得到了無人機(jī)飛行路徑。DP可以將問題分解為多個(gè)相關(guān)的子問題。在無人機(jī)的路徑規(guī)劃問題中,DP的目標(biāo)是計(jì)算圖中所有節(jié)點(diǎn)到目的節(jié)點(diǎn)的距離,子問題是計(jì)算到相鄰點(diǎn)的距離。在這些解中,DP首先考慮最小子問題的解,然后向高一級(jí)的問題推進(jìn),最終以迭代的方式找到最優(yōu)解。Liu等[15]提出了一種基于橢圓切線模型的路徑規(guī)劃方法,該方法可以在不構(gòu)建周圍環(huán)境地圖的情況下快速進(jìn)行路徑規(guī)劃,實(shí)驗(yàn)結(jié)果表明,該方法可以有效地完成無人機(jī)實(shí)時(shí)目標(biāo)跟蹤任務(wù)。貝塞爾曲線通常用于對(duì)生成軌跡進(jìn)行平滑處理。B樣條曲線(B-spline Curves)是貝塞爾曲線的一種一般化,在繼承了貝塞爾曲線的幾何不變性、保凸性的同時(shí),B樣條曲線在點(diǎn)無論增加多少的情況下,多項(xiàng)式的次數(shù)都不會(huì)增加。因此,B樣條曲線在無人機(jī)的路徑規(guī)劃中對(duì)生成的路徑軌跡進(jìn)行平滑處理時(shí)特別有效。Primatesta等[4]對(duì)路徑軌跡使用了Dubins曲線進(jìn)行平滑處理,Qu等[16]使用B樣條曲線對(duì)路徑軌跡進(jìn)行平滑處理,結(jié)果表明它們都很好地滿足了無人機(jī)飛行時(shí)的動(dòng)力學(xué)約束。
在實(shí)際規(guī)劃無人機(jī)路徑時(shí),可以采用啟發(fā)式搜索算法將問題的時(shí)間復(fù)雜性降低到多項(xiàng)式時(shí)間問題的水平。啟發(fā)式搜索算法是受自然啟發(fā)所創(chuàng)造出的一套算法,它起源于模仿生物的交互行為或物理現(xiàn)象。在實(shí)際問題中,用傳統(tǒng)的方法無法解決的高復(fù)雜度優(yōu)化問題,可以考慮使用啟發(fā)式搜索算法進(jìn)行解決[17]。啟發(fā)式搜索方法用于解決無人機(jī)的路徑規(guī)劃時(shí),即是在無人機(jī)的自身動(dòng)力學(xué)、周圍環(huán)境和實(shí)時(shí)性等條件的約束下,將路徑規(guī)劃問題轉(zhuǎn)變?yōu)閺?fù)雜優(yōu)化問題。
Mirjalili等[18]提出了一種灰狼優(yōu)化算法(Grey Wolf Optimizer,GWO),將無人機(jī)路徑求解模擬成狼群捕食,該算法具有良好的靈活性和實(shí)時(shí)性。Radmanesh等[19]提出了一種基于灰狼優(yōu)化算法的無人機(jī)感知避障和路徑規(guī)劃算法,用以解決在未知環(huán)境下的多無人機(jī)路徑規(guī)劃問題。Qu等[16]認(rèn)為灰狼優(yōu)化算法存在兩個(gè)缺陷:一是在搜索過程中,所有的狼都執(zhí)行相同的行為,而不考慮個(gè)體的特征,對(duì)整個(gè)群體進(jìn)行統(tǒng)一的開發(fā)行為;二是當(dāng)所需要優(yōu)化的問題維度增加時(shí),算法的性能下降明顯。無人機(jī)的路徑規(guī)劃問題在復(fù)雜的三維環(huán)境中通常具有很高的維度,因此當(dāng)灰狼優(yōu)化算法應(yīng)用于無人機(jī)路徑規(guī)劃時(shí)算法性能會(huì)顯著下降。因此他們提出了一種新的基于強(qiáng)化學(xué)習(xí)的灰狼優(yōu)化算法來離線計(jì)算無人機(jī)的最優(yōu)飛行路徑,并進(jìn)行幾何調(diào)整和優(yōu)化調(diào)整,確保了飛行路徑的可行性、平滑性和局部最優(yōu)性。
Wu等[20]提出了一種避障天牛須搜索(Obstacle Avoidance Beetle Antennae Search,OABAS)算法,該算法考慮了更短的飛行路徑長(zhǎng)度,并結(jié)合無人機(jī)自身最大轉(zhuǎn)彎角的動(dòng)力學(xué)約束和實(shí)時(shí)避障的要求與最小威脅面(Minimum Threat Surface,MTS)對(duì)飛行路徑進(jìn)行規(guī)劃,仿真結(jié)果表明了該算法的有效性。Tian等[21]提出了一種改進(jìn)人工蜂群算法,改進(jìn)后的算法需要的參數(shù)少、收斂速度快、計(jì)算時(shí)間短,適用于多無人機(jī)在實(shí)時(shí)環(huán)境下的避障。Cheng等[22]將遺傳算法和模擬退火算法相結(jié)合,提出了一種新的算法,該算法具有收斂速度快、成本最小等優(yōu)點(diǎn)。Yang和Yoo[23]將遺傳算法和蟻群算法相結(jié)合,根據(jù)傳感、能耗、時(shí)間和風(fēng)險(xiǎn)選擇無人機(jī)最優(yōu)路徑。
通常來說,啟發(fā)式搜索算法由于計(jì)算耗時(shí)較長(zhǎng),難以應(yīng)對(duì)動(dòng)態(tài)實(shí)時(shí)的路徑規(guī)劃場(chǎng)景,因此常被用于無人機(jī)全局離線路徑規(guī)劃中。
近年來,隨著深度學(xué)習(xí)(Deep Learning,DL)技術(shù)的發(fā)展,已有越來越多的學(xué)者提出將深度學(xué)習(xí)技術(shù)應(yīng)用于無人機(jī)上,引入了深度學(xué)習(xí)-無人機(jī)(DLUAVs)的概念。深度學(xué)習(xí)技術(shù)用于智能化自主機(jī)器人是未來機(jī)器人發(fā)展的一個(gè)趨勢(shì)。近年來,越來越多的研究人員提出了各種不同的神經(jīng)網(wǎng)絡(luò)模型和目標(biāo)檢測(cè)算法,給無人機(jī)的路徑規(guī)劃提供了新的解決方案。Loquercio等[24]提出了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的DroNet框架模型,該模型通過學(xué)習(xí)城市街道上正常行駛的汽車和自行車來學(xué)習(xí)導(dǎo)航;實(shí)驗(yàn)結(jié)果表明,無人機(jī)基于該模型可以對(duì)未預(yù)料的事件和障礙物迅速做出反應(yīng),具備在城市中安全飛行的能力。Palossi等[25]實(shí)際制作出了DroNet納米無人機(jī),實(shí)現(xiàn)了納米無人機(jī)的自主導(dǎo)航,結(jié)果表明無人機(jī)可以以4m/s的速度安全飛行。Wang等[26]利用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法和深度攝像機(jī),得到了無人機(jī)最優(yōu)避障策略和最短飛行路徑的路徑規(guī)劃方法;實(shí)驗(yàn)結(jié)果表明,該方法能夠顯著地提高無人機(jī)對(duì)環(huán)境的感知能力、避障能力和自主飛行能力。如圖4所示為用于無人機(jī)的一個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型示例。
圖4 用于無人機(jī)的一個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型示例Figure 4 An example of a convolutional neural network model for drones
強(qiáng)化學(xué)習(xí)的本質(zhì)如圖5所示,是智能體通過與環(huán)境交互來得到最優(yōu)策略,以期能得到最大化的長(zhǎng)期回報(bào)。目前,無模型強(qiáng)化學(xué)習(xí)已成為無人機(jī)路徑規(guī)劃領(lǐng)域的流行方法之一。Q-Learning算法即是一種強(qiáng)化學(xué)習(xí)下的路徑規(guī)劃算法。QLearning可以視為一種用隨機(jī)近似方法求解Bellman方程的方法,它將所有的狀態(tài)-動(dòng)作都存儲(chǔ)在一張Q-Table中,且由于迭代學(xué)習(xí)不斷產(chǎn)生的狀態(tài)-動(dòng)作Q值需要維護(hù)和更新,因此在處理高維狀態(tài)時(shí)存在局限性。為了解決這個(gè)問題,Mnihet等[27]提出了深度Q網(wǎng)絡(luò)(Deep Q Network,DQN),將原始圖像的高維狀態(tài)作為深度Q網(wǎng)絡(luò)的輸入。深度強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的結(jié)合,對(duì)自主智能體問題研究有很強(qiáng)的適用性。Singla等[28]設(shè)計(jì)了一個(gè)基于記憶的DQN網(wǎng)絡(luò),用以在未知環(huán)境中實(shí)現(xiàn)無人機(jī)的有效避障,通過在長(zhǎng)觀測(cè)序列中保留關(guān)鍵信息,解決了無人機(jī)避障中的部分可觀察性問題,實(shí)驗(yàn)結(jié)果表明該方法的有效性相比DQN有著顯著的提升。Yan等[29]提出了一種深度強(qiáng)化學(xué)習(xí)方法,用于動(dòng)態(tài)威脅環(huán)境下的無人機(jī)路徑規(guī)劃,實(shí)驗(yàn)結(jié)果表明該方法在靜態(tài)和動(dòng)態(tài)的導(dǎo)航任務(wù)中具有良好的泛化能力和實(shí)時(shí)性。Wang等[30]開發(fā)了深度強(qiáng)化學(xué)習(xí)框架用于無人機(jī)在復(fù)雜環(huán)境下的路徑規(guī)劃和自主導(dǎo)航。在該框架下,無人機(jī)的路徑規(guī)劃問題轉(zhuǎn)化為部分可觀察馬爾可夫決策過程(Partially Observable Markov Decision Process,POMDP),他們提出了通用的深度強(qiáng)化學(xué)習(xí)算法來解決問題。該方法在沒有重建地圖和路徑規(guī)劃的情況下,能夠使無人機(jī)在復(fù)雜環(huán)境中從初始位置飛行到目的地,并且可以推廣到更大規(guī)模、更為復(fù)雜的三維環(huán)境中,且方法的性能下降很小。
圖5 強(qiáng)化學(xué)習(xí)的結(jié)構(gòu)Figure 5 Structure of reinforcement learning
無人機(jī)的智能化和自主化是無人機(jī)在軍事和民用領(lǐng)域上發(fā)展的關(guān)鍵技術(shù)。無人機(jī)系統(tǒng)平臺(tái)限制了無人機(jī)的尺寸、重量、有效載荷和飛行時(shí)長(zhǎng)等因素,這些因素又主要受限于當(dāng)前的傳感器和電池技術(shù)。此外,機(jī)載處理也是無人機(jī)研究的重點(diǎn),尤其是當(dāng)通信能力會(huì)極大影響無人機(jī)性能時(shí),如在有限的帶寬下傳輸大量數(shù)據(jù)。對(duì)于多無人機(jī)協(xié)同飛行,如何防御可能的網(wǎng)絡(luò)攻擊是一個(gè)挑戰(zhàn)。為了保證多無人機(jī)協(xié)同飛行時(shí)的安全,需要考慮網(wǎng)絡(luò)干擾、數(shù)據(jù)協(xié)同傳輸?shù)?。Challita等[31]總結(jié)了主要的無線網(wǎng)絡(luò)和安全問題,并介紹了不同的基于人工智能的方法和通過深度學(xué)習(xí)方法來對(duì)安全事件和警報(bào)進(jìn)行分類。Xin等[32]介紹了基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法對(duì)入侵檢測(cè)進(jìn)行網(wǎng)絡(luò)分析的方法。Xiao等[33]提出了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)-無人機(jī)系統(tǒng)網(wǎng)絡(luò)安全異常行為檢測(cè)方案。Al-Emadi等[34]提出的算法利用無人機(jī)獨(dú)特的聲紋進(jìn)行安全檢測(cè)和識(shí)別。
如表1所示為無人機(jī)路徑規(guī)劃方法的總結(jié)。當(dāng)無人機(jī)在現(xiàn)實(shí)環(huán)境中飛行時(shí),路徑規(guī)劃通常涉及高維連續(xù)狀態(tài),以目前的方法還無法有效解決無人機(jī)的路徑規(guī)劃問題,進(jìn)而限制了無人機(jī)平臺(tái)應(yīng)用程序的開發(fā)。在元啟發(fā)式算法中,Wolpert和Macerday提出了沒有免費(fèi)的午餐(No Free Lunch,NFL)定理,他們認(rèn)為不存在獨(dú)立于具體應(yīng)用之外的普遍適用的優(yōu)化算法。如何有效解決無人機(jī)的路徑規(guī)劃問題還是一個(gè)未知的挑戰(zhàn)。深度學(xué)習(xí)技術(shù)應(yīng)用到無人機(jī)上可以很好地滿足高度自主化無人機(jī)的操作需求,然而將深度學(xué)習(xí)技術(shù)和無人機(jī)技術(shù)結(jié)合起來仍然存在著很多挑戰(zhàn),如深度學(xué)習(xí)技術(shù)自身的理論問題、訓(xùn)練數(shù)據(jù)集的選取問題等。
表1 無人機(jī)路徑規(guī)劃方法簡(jiǎn)述Table 1 Brief introduction of UAV planning method
由于深度學(xué)習(xí)方法的本質(zhì)是從訓(xùn)練過程使用的數(shù)據(jù)中提取更復(fù)雜抽象的高層表示屬性或類別特征,因此使用的數(shù)據(jù)集的數(shù)量和質(zhì)量對(duì)深度學(xué)習(xí)方法的泛化能力和效力有較大影響,多數(shù)深度學(xué)習(xí)模型的不足也在于學(xué)習(xí)過程中所使用的數(shù)據(jù)數(shù)量和質(zhì)量問題。對(duì)于監(jiān)督學(xué)習(xí)方法,在不同的現(xiàn)實(shí)環(huán)境中生成具有泛化能力的模型需要大量的數(shù)據(jù);自監(jiān)督學(xué)習(xí)方法采用了自動(dòng)化收集數(shù)據(jù)和標(biāo)記數(shù)據(jù)過程,以生成大量的數(shù)據(jù)集,然而這些數(shù)據(jù)集也受到標(biāo)記數(shù)據(jù)生成策略的限制。現(xiàn)實(shí)環(huán)境和虛擬環(huán)境之間的差距限制了仿真方法在現(xiàn)實(shí)世界的適用性,如何開發(fā)更具有現(xiàn)實(shí)特性的虛擬數(shù)據(jù)集仍是一個(gè)問題。同時(shí),強(qiáng)化學(xué)習(xí)的試錯(cuò)特性也會(huì)引發(fā)安全問題,在現(xiàn)實(shí)環(huán)境中可能遭受崩潰[35]。深度學(xué)習(xí)-無人機(jī)系統(tǒng)分層架構(gòu)的較低層系統(tǒng),如特征提取系統(tǒng),需要大量的計(jì)算資源。這些資源需要強(qiáng)大的通信能力和機(jī)外處理能力,因此難以在無人機(jī)平臺(tái)上集成。如何進(jìn)一步開發(fā)深度學(xué)習(xí)-無人機(jī)系統(tǒng)架構(gòu)和提升嵌入式硬件技術(shù)是極其重要的挑戰(zhàn)。