劉文進(jìn), 許馨水, 南敬昌, 高明明
(遼寧工程技術(shù)大學(xué) 電子與信息工程學(xué)院,遼寧 葫蘆島 125105)
由于超寬帶(ultra-wideband,UWB)系統(tǒng)傳輸信號(hào)的頻寬很寬(3.1~10.6 GHz),覆蓋了其他窄帶信號(hào)頻段[1,2],學(xué)者通過在UWB天線的輻射單元上開槽[3,4]等方法引入了陷波功能,來避免窄帶信號(hào)產(chǎn)生的電磁干擾。然而依靠傳統(tǒng)的計(jì)算機(jī)輔助設(shè)計(jì)(computer aided design,CAD)輔助軟件設(shè)計(jì)優(yōu)化UWB天線計(jì)算量大、耗時(shí)長,因此借助神經(jīng)網(wǎng)絡(luò)建立天線行為模型具有重要的研究意義。Elman神經(jīng)網(wǎng)絡(luò)作為一種典型的動(dòng)態(tài)遞歸神經(jīng)網(wǎng)絡(luò)[5],既能實(shí)現(xiàn)靜態(tài)系統(tǒng)的建模,也能實(shí)現(xiàn)動(dòng)態(tài)系統(tǒng)的映射并直接反映系統(tǒng)的動(dòng)態(tài)特性,被廣泛應(yīng)用于各個(gè)領(lǐng)域。量子粒子群優(yōu)化(quantum particle swarm optimization,QPSO)算法是孫俊等人[6,7]通過建立量子勢阱的粒子群模型提出的一種群智能優(yōu)化算法,能夠有效優(yōu)化神經(jīng)網(wǎng)絡(luò)的參數(shù)。為了實(shí)現(xiàn)更加快速高效建模,本文基于引入維數(shù)搜索策略(search for dimension policies,SD)的QPSO(SDQPSO)算法,建立SDQPSO-IElman神經(jīng)網(wǎng)絡(luò)智能模型,并應(yīng)用到一種雙陷波UWB天線中實(shí)現(xiàn)精確建模。
粒子群優(yōu)化(particle swarm optimization,PSO)算法是將待優(yōu)化問題可能產(chǎn)生的K個(gè)解表述為N維目標(biāo)搜索空間中飛行的粒子,每個(gè)粒子根據(jù)其他粒子和自身飛行經(jīng)驗(yàn)動(dòng)態(tài)調(diào)整飛行狀態(tài),不斷靠近種群中當(dāng)前位置最優(yōu)的粒子,并通過軌道模型[8]的形式實(shí)現(xiàn)收斂,在此過程中粒子的最大速度會(huì)限制每次的運(yùn)動(dòng)面積,不能保證粒子的運(yùn)動(dòng)范圍覆蓋整個(gè)可行空間。QPSO算法是一種基于PSO算法框架的隨機(jī)并行概率搜索算法,受量子計(jì)算原理中的概率優(yōu)化算法的啟發(fā),認(rèn)為粒子具有量子行為,粒子在量子化的吸引勢場中,受引力的作用產(chǎn)生束縛態(tài),形成種群聚集性,使每個(gè)粒子收斂到它的吸引點(diǎn)
pi=[pi,1,pi,2,…,pi,N],i=1,2,…,K
(1)
第i個(gè)粒子的位置為
Xi(T)=[Xi,1(T),Xi,2(T),…,Xi,N(T)],
i=1,2,…,K
(2)
種群中粒子能夠搜索到的個(gè)體最優(yōu)位置為
Pi(T)=[Pi,1(T),Pi,2(T),…,Pi,N(T)],
i=1,2,…,K
(3)
群體的全局最好位置為
G(T)=[G1(T),G2(T),…,GN(T)]
(4)
在T時(shí)刻勢阱中第i個(gè)粒子的中心位置坐標(biāo)為
pi=φ×Pi(T)+(1-φ)×Gs(T),s=1,2,…,N
(5)
產(chǎn)生的束縛態(tài)確保運(yùn)動(dòng)中的粒子在整個(gè)可行解空間中進(jìn)行搜索,由波函數(shù)ψ模的平方來確定粒子在空間中出現(xiàn)的概率,利用Schr?dinger方程求解得到勢阱中每一個(gè)粒子的束縛態(tài)函數(shù)
(6)
利用Monte Carlo算法求得第i個(gè)粒子在勢阱中T+1時(shí)刻的位置
(7)
勢阱的特征長度表達(dá)式為
Li(T)=2α|C(T)-Xi(T)|
(8)
為了更好控制Li(T)使其收斂,選擇在算法中引入平均最好位置變量方法,即
(9)
將式(8)代入式(7)中,則得到QPSO算法的進(jìn)化方程
Xi(T+1)=pi(T)±α×|C(T)-Xi(T)|×
(10)
以上式子中,ψ與hi(T)均為平均分布在(0,1)區(qū)間的隨機(jī)數(shù)。收縮—擴(kuò)張系數(shù)α為算法中唯一需要人為設(shè)定的參數(shù),其計(jì)算公式為
(11)
式中 MAXITER為最大迭代次數(shù)。當(dāng)α取值較大時(shí),粒子的收斂速度較快,當(dāng)α取值較小時(shí),粒子的收斂速度較慢,已有數(shù)據(jù)表明[9],只有α滿足小于1.782時(shí),才能保證粒子充分收斂。
對于QPSO算法,粒子的每個(gè)維度通常是隨機(jī)初始化的,很難保證初始解的大部分維數(shù)根據(jù)求值函數(shù)是最優(yōu)的,一個(gè)具有許多優(yōu)良維度的粒子可能會(huì)因?yàn)橐恍┎涣季S度的影響而被舍棄,從而降低算法的搜索效率。種群中每一個(gè)粒子Xi(T)都是N維個(gè)體,維數(shù)搜索策略將粒子的每一維都視為一個(gè)個(gè)體,用這個(gè)個(gè)體替換QPSO中整個(gè)粒子,根據(jù)評價(jià)函數(shù)從K-1個(gè)粒子中選取每一維度適應(yīng)度值最好的粒子,組成一個(gè)完整的粒子XK(T)。搜索過程如圖1。
圖1 粒子的維數(shù)搜索過程
假設(shè)根據(jù)評價(jià)函數(shù)計(jì)算出XK-1,1(T)是第一維度中適應(yīng)度值最好的粒子,則選擇XK-1,1(T)作為第K個(gè)粒子的一維解,意味著XK-1,1(T)是K-1個(gè)粒子中最優(yōu)維度。按照此搜索方式,繼續(xù)尋找第K個(gè)粒子的下一個(gè)維度。通過維數(shù)搜索策略,從K-1個(gè)粒子中生成包含所有維數(shù)的最優(yōu)解。當(dāng)?shù)玫剿芯S數(shù)時(shí),質(zhì)點(diǎn)在第T次迭代(T=1,2,…,MAXITER)逐步形成問題的新解XK。在QPSO算法中引入粒子維數(shù)搜索策略,既優(yōu)化粒子的組成,又提高了算法在求解空間中的搜索效率。
Elman神經(jīng)網(wǎng)絡(luò)是一種具反饋功能的動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò),除了輸入層、隱含層和輸出層以外,在隱含層環(huán)節(jié)增加承接層作為反饋支路,對隱含層前一時(shí)刻的輸出進(jìn)行存儲(chǔ)和延遲處理后,同當(dāng)前時(shí)刻的輸入數(shù)據(jù)一起再次作用到隱含層,這種內(nèi)部反饋機(jī)制有利于網(wǎng)絡(luò)模型的全局穩(wěn)定性,使Elman神經(jīng)網(wǎng)絡(luò)的精度高于BP神經(jīng)網(wǎng)絡(luò),但效果并不明顯。為了在使用少量神經(jīng)元數(shù)目的前提下,動(dòng)態(tài)實(shí)現(xiàn)高階系統(tǒng)精度,本文提出在承接層加入自反饋增益因子,并引入直接輸入—輸出層連接來提高網(wǎng)絡(luò)的泛化能力。改進(jìn)的Elman(IElman)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2。
圖2 IElman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
IElman神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)表達(dá)式如下
y(t)=g(w2x(t)+γz(t))
(12)
x(t)=f(w3u(t)+w1z(t-1))
(13)
u(t)=x(t-1)+βu(t)
(14)
式中w1,w2,w3分別為輸入層—隱含層之間,隱含層—輸出層之間,承接層—隱含層之間的連接權(quán)值;γ為輸出與輸入之間的連接權(quán)值;z(t)為網(wǎng)絡(luò)的外輸入,x(t)為隱含層的輸出,u(t)為承接層的輸出,y(t)為網(wǎng)絡(luò)輸出。采用Sigmoid型非線性函數(shù)作為隱含層神經(jīng)元的傳遞函數(shù),用f(*)表示;采用線性函數(shù)作為輸出層神經(jīng)元的傳遞函數(shù),用g(*)表示;t為當(dāng)前時(shí)刻。自反饋因子增益因子β取值為[0,1),當(dāng)β取0時(shí),承接層不存在自反饋機(jī)制。網(wǎng)絡(luò)誤差函數(shù)為E的表達(dá)為
(15)
式中e(t)為網(wǎng)絡(luò)理想輸出,M為樣本數(shù),j為第j個(gè)樣本。
為了進(jìn)一步提高IElman神經(jīng)網(wǎng)絡(luò)的精度,采用SDQPSO算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,具體步驟如下:1)確定神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),初始化網(wǎng)絡(luò)的權(quán)值閾值;2)設(shè)置QPSO算法的種群大小K,維數(shù)N等參數(shù),初始化K-1個(gè)粒子,采用維數(shù)搜索策略生成第K個(gè)粒子;3)計(jì)算當(dāng)前粒子的適應(yīng)度值,并與前一時(shí)刻的適應(yīng)度值進(jìn)行比較,若當(dāng)前粒子適應(yīng)度值較好,更新當(dāng)前粒子的位置為個(gè)體最優(yōu)位置Pi(T);4)計(jì)算種群當(dāng)前全局最優(yōu)位置,與前一時(shí)刻進(jìn)行比較,選擇較好的更新為粒子全局最優(yōu)位置Gs(T);5)根據(jù)式(5)更新勢阱中每一維粒子的中心位置坐標(biāo)pi;6)根據(jù)式(9)得到種群的平均最好位置C(T);7)用位置更新公式(10)更新K-1個(gè)粒子的位置,采用維數(shù)搜索策略生成第K個(gè)解;8)重復(fù)步驟3~步驟7,直到找到最優(yōu)解或達(dá)到最大迭代次數(shù);9)輸出SDQPSO算法得到的最優(yōu)解,訓(xùn)練神經(jīng)網(wǎng)絡(luò),建立SDQPSO-IElman網(wǎng)絡(luò)模型。
本文設(shè)計(jì)的天線正面與背面基本結(jié)構(gòu)如圖3所示,該天線由圓形輻射貼片、介質(zhì)基板、微帶饋線和截短接地板組成。采用FR4作為介質(zhì)基板,損耗角正切為0.02,高為32 mm,寬為25 mm,厚為1.6 mm。分別在天線的截短接地板和微帶饋線上開對稱的L形和U形窄縫隙。d5為L形窄縫隙距離介質(zhì)基板左右兩側(cè)的距離,L4為截短接地板的長度。使用HFSS仿真軟件對各個(gè)窄縫隙的尺寸參數(shù)進(jìn)行優(yōu)化仿真,得到天線最佳尺寸結(jié)構(gòu),具體參數(shù)如表1。
圖3 天線結(jié)構(gòu)
表1 天線尺寸
圖4和圖5分別為天線的S11和電壓駐波比(voltage standing wave radio,VSWR)仿真曲線圖,S11的值小于-10 dB,VSWR的值在2以下的波段是UWB天線正常工作的波段。由圖可知,中心頻率分別在3.5 GHz和7.22 GHz處,實(shí)現(xiàn)了雙陷波特性,成功濾除全球接入互操作性(WIMAX),衛(wèi)星X波段和國際電信聯(lián)盟(ITU)波段三種窄帶信號(hào)的干擾。
圖4 S11曲線
圖5 VSWR曲線
單獨(dú)使用HFSS仿真軟件對天線進(jìn)行設(shè)計(jì)往往需要耗費(fèi)大量的時(shí)間[10]和人力,而神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的自適應(yīng)性,能夠?qū)W習(xí)輸入與輸出之間的對應(yīng)關(guān)系,從而建立具有天線特性的網(wǎng)絡(luò)模型。天線的S11和VSWR參數(shù)都能夠反映天線是否實(shí)現(xiàn)良好匹配,這里選擇S11參數(shù)作為輸出,天線的頻率作為輸入,建立神經(jīng)網(wǎng)絡(luò)模型并進(jìn)行訓(xùn)練。
從HFSS仿真軟件中提取500組S11參數(shù)和對應(yīng)的天線頻率,訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)分別占80 %和20 %。頻率范圍為2~16 GHz,步長設(shè)置為0.01,為了提高預(yù)測精度,先對數(shù)據(jù)進(jìn)行歸一化處理。利用隱含層節(jié)點(diǎn)計(jì)算公式確定隱含層的大致范圍在2~11,選擇不同的隱含層節(jié)點(diǎn)數(shù)會(huì)得到不同的網(wǎng)絡(luò)誤差,經(jīng)過測試網(wǎng)絡(luò)誤差最小[11]時(shí)的隱含層節(jié)點(diǎn)數(shù)為9,以此確定網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。分別建立BP,Elman與IElman神經(jīng)網(wǎng)絡(luò)模型,用相同的數(shù)據(jù)對三種網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,在MATLAB 20R2018a仿真平臺(tái)上進(jìn)行仿真實(shí)驗(yàn),誤差限設(shè)為0.001,最大訓(xùn)練次數(shù)1 000次。圖6為HFSS與三種模型的輸出對比,圖7為誤差對比。由圖可知,IElman神經(jīng)網(wǎng)絡(luò)模型計(jì)算輸出更加接近實(shí)際輸出,泛化能力更強(qiáng)。表2給出3種模型的平均絕對誤差(mean absolute error,MAE)分別為:2.610 71,1.357 78,0.576 97,IElman神經(jīng)網(wǎng)絡(luò)的誤差最小,表明該網(wǎng)絡(luò)結(jié)構(gòu)模型具有更好的并行信息處理能力,能夠很好地描述天線參數(shù)間復(fù)雜的非線性關(guān)系。
圖6 IElman等模型輸出對比
圖7 IElman等模型訓(xùn)練誤差對比
表2 不同模型MAE及收斂時(shí)間對比
從局部細(xì)節(jié)來看,IElman神經(jīng)網(wǎng)絡(luò)部分計(jì)算輸出值與實(shí)際輸出值之間仍存在較大誤差,這是因?yàn)樵谟?xùn)練過程中仍存在易陷入局部極小值的問題,導(dǎo)致個(gè)別點(diǎn)無法實(shí)現(xiàn)理想擬合,因此,構(gòu)建SDQPSO-IElman模型來提高模型的精度和收斂速度。種群數(shù)量設(shè)置為K=30,維數(shù)N=28,最大迭代次數(shù)MAXITER=100,分別與IElman和QPSO-IElman模型進(jìn)行對比,結(jié)果如圖8和圖9??梢钥闯?,兩種方法均可以改善IElman神經(jīng)網(wǎng)絡(luò)模型局部點(diǎn)誤差較大的現(xiàn)象,實(shí)現(xiàn)良好的預(yù)測效果,MAE分別為0.097 86和0.023 79。相較QPSO-IElman網(wǎng)絡(luò)模型,本文提出的神經(jīng)網(wǎng)絡(luò)模型精度提高75.69 %,收斂速度提高8.18 %;與標(biāo)準(zhǔn)Elman神經(jīng)網(wǎng)絡(luò)模型相比精度提高98.25 %,收斂速度提高34.81 %。綜上所述,本文提出的SDQPSO-IElman模型具有更低的平均絕對誤差和更快的收斂速度。
圖8 SDQPSO-IElman等模型輸出對比
本文在標(biāo)準(zhǔn)的Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的承接層中增加自反饋增益因子,并引入輸入—輸出層連接,提高網(wǎng)絡(luò)泛化能力;利用維數(shù)搜索策略篩選出QPSO算法中維數(shù)較好的粒子進(jìn)行重新組合,增強(qiáng)算法尋優(yōu)能力,使算法收斂速度更快,具有更強(qiáng)的穩(wěn)態(tài)魯棒性和更高的精度。最后構(gòu)建SDQPSO-IElman神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了對雙陷波天線的S11參數(shù)和頻率的精確建模,與其他神經(jīng)網(wǎng)絡(luò)模型相比整體性能最優(yōu)。