陶 軍,劉 瑜,2
(1.安徽大學電子信息工程學院,安徽 合肥 230601;2.計算智能與信號處理教育部重點實驗室,安徽 合肥 230601)
時域有限差分法[1](Finite difference time domain method,FDTD)是電磁計算建模中廣泛應用的數(shù)值方法[2]之一。對于電磁問題,F(xiàn)DTD被表示為離散化的麥克斯韋微分方程[3-4],逐時空步迭代,完成問題的求解。常規(guī)FDTD的計算量龐大且求解時間較長,通??梢試L試并行計算或利用圖形處理器(GPU)等軟硬件手段提高運算效率。當前人工智能和深度學習的發(fā)展,為電磁計算的數(shù)值建模提供了新的思路。
本文基于卷積神經網(wǎng)絡(Convolutional neural network,CNN)的計算原理,探討了FDTD方法與CNN結構的等價性特點。在此基礎上,優(yōu)化結構和超參數(shù),構建自由空間電磁波傳播的FDTD-CNN仿真模型,并將此模型應用于一維等離子體光子晶體的電磁傳播模擬,評估驗證了FDTD-CNN模型的泛化復用性與計算性能特點。
FDTD方法將電磁波Ε、H分量在空間和時間上交替抽樣,將Maxwell方程表示為時域的差分方程,迭代更新逐次推進。FDTD方法在一維情況下可表示為如下的差分格式:
從數(shù)學角度來看,卷積離散后,可寫為
卷積神經網(wǎng)絡[5-8]由一個或者多個卷積層和末端的全連接層,以及激活函數(shù)組成。輸入尺寸為(N,Cin,H,W),輸出尺寸為(N,Cout,Hout,Wout)的卷積層數(shù)學形式可表示為
其中,O為卷積層的輸出;B為卷積層的偏置;W為卷積層的權重,即卷積核參數(shù);I為卷積層的輸入。圖1直觀地展示了卷積層的卷積操作:大小為m×m的卷積核在大小為n×n的輸入上每次滑動一個步長(默認為1)的距離,最終可得大小為Hout×Wout的輸出。忽略偏置,填充步長為1,卷積核大小為3×3卷積層的輸出坐標為(i,j)點的計算公式為
圖1 卷積操作
一維情況下,式(4)可簡化為
改變W取值,一維卷積操作可變?yōu)榍跋蚧蚝笙虿罘帧Ρ仁剑?)和式(5)可以發(fā)現(xiàn),一維情況下,當卷積核對應參數(shù)與差分相同時,卷積操作與差分操作在數(shù)學上等價,即差分可視為特殊的卷積,數(shù)學上的這種等價關系使其可用卷積代替差分實現(xiàn)FDTD方法。
FDTD迭代方程表明在更新電場(或磁場)時需要磁場(或電場)的信息,且電場與磁場的參數(shù)存在區(qū)別,因此為E、H分別設置卷積層和線性層。CNN模型訓練前這部分參數(shù)需要根據(jù)材料的性質進行一定程度的初始化,降低模型在開始訓練時的損失,提高訓練速度。更新電磁場后,加入吸收邊界的信息對電磁場邊界處的值進行修正。組合電場、磁場和邊界條件的信息后,經卷積層和全連接層修正和調整,計算出下一時間步的E(或H)。對于吸收邊界,卷積后分別使用雙曲正切基函數(shù)和Tanh Shrink函數(shù)壓縮場值,將邊界中的電磁場按場值大小分開處理,避免因場值大小相差懸殊導致部分信息丟失。CNN具體網(wǎng)絡結構設置如圖2所示,模型參數(shù)設置如表1所示。
圖2 卷積神經網(wǎng)絡結構
表1中數(shù)字序號后的參數(shù)為計算域模型的參數(shù),字母序號后的參數(shù)為吸收邊界模型的參數(shù)。表中Conv1D表示卷積層,k為卷積核尺寸,p為填充,s為卷積核每次移動的步長,Linear為線性層,s為線性層的輸出,Pooling為池化。
表1 一維CNN模型參數(shù)
作為一種深度學習方法,CNN模型是從大量的數(shù)據(jù)訓練中學習到相關的規(guī)律和邏輯,并利用學習來的規(guī)律預測未知現(xiàn)象。因此,高質量的訓練數(shù)據(jù)是CNN模型成功的關鍵。對于FDTD-CNN模型,可采用常規(guī)FDTD計算結果作為訓練數(shù)據(jù),例如仿真一維無限大自由空間,計算空間設置為40 000個網(wǎng)格,兩側邊界條件設為10層伸縮坐標完美匹配層(PML),時間穩(wěn)定因子s=0.5。采用升余弦函數(shù)和正弦函數(shù)作為激勵源的信號函數(shù)。為提高數(shù)據(jù)的多樣性,可改變激勵源峰值和位置,多次計算,記錄電場與磁場值,寫入.CSV文件并保存為CNN訓練數(shù)據(jù)。
一維FDTD仿真的數(shù)據(jù)相似度較高,為避免在訓練時產生過擬合問題,需在訓練前進行數(shù)據(jù)增強預處理,給數(shù)據(jù)添加隨機噪聲。這里選擇高斯噪聲,峰值隨當前學習率變化。在訓練時發(fā)現(xiàn)高斯噪聲峰值與當前學習率比值設為15:1時訓練效果最好。隨后將數(shù)據(jù)按8:1的比例隨機亂序劃分為數(shù)據(jù)集和測試集,模型每次讀取6組數(shù)據(jù)進行訓練,模型初始學習率設為0.001,采用絕對值誤差(MAE)損失函數(shù)。因為數(shù)據(jù)存在前后關聯(lián),保留前后時間步的梯度參與CNN模型參數(shù)的更新可以提升訓練效果。但長時間步的梯度累積會導致訓練速度下降,為提升速度選擇每5步對梯度進行截斷。FDTD-CNN模型在參數(shù)進行初始化后開始訓練,當損失函數(shù)的結果小于期望或長時間變化較小時保存模型并調整學習率。MAE損失函數(shù)的數(shù)學方程可表示為
CNN模型支持單精度(single)和半精度(binary16)浮點數(shù)格式。在訓練時以及之后的驗證中分別采用單精度和半精度數(shù)運行10萬步,任取一段網(wǎng)格點的電場值,與常規(guī)FDTD以及解析解的計算結果相比較,結果如圖3所示(橫坐標為網(wǎng)格數(shù))。可見單精度和半精度下FDTD-CNN模型與傳統(tǒng)FDTD的仿真結果吻合得很好,這表明CNN結構具備模擬電磁波傳播的能力。
圖3 一維自由空間仿真結果
為進一步測試FDTD-CNN模型的泛化特性,以及對復雜介質電磁問題的處理能力,改變數(shù)據(jù)集重新訓練模型。復雜介質數(shù)據(jù)集采用一維等離子體光子晶體[9],由等離子體和介質交替組成。每層等離子體和介質的厚度為10個網(wǎng)格,物理結構如圖4所示。介質的相對介電常數(shù)設為4,等離子體參數(shù)設為ωp=4π×1010、vc=3×1010,其中ωp為等離子體頻率,vc為碰撞頻率。計算域設為190個網(wǎng)格,兩側使用10層PML進行截斷。采用處于光子晶體通帶內的100 GHz正弦波激勵。多次改變激勵源峰值和位置進行計算,提高數(shù)據(jù)的多樣性,最后將仿真結果寫入.CSV文件并保存數(shù)據(jù)。
圖4 一維光子晶體結構
基于和一維自由空間仿真相同的訓練策略,初始化光子晶體FDTD-CNN模型后,在單精度和半精度下分別運行2萬步,結果與常規(guī)FDTD比較如圖5所示。為驗證FDTD-CNN模型的泛化能力,改變正弦波激勵的頻率為光子晶體禁帶內的66 GHz,計算結果如圖6所示??梢钥闯?,F(xiàn)DTD-CNN模型在光子晶體仿真中仍然有良好的表現(xiàn),對不同介質、不同頻率仿真的數(shù)據(jù)有良好的適應性,具備一定的泛化復用能力。
圖5 光子晶體通帶仿真結果
圖6 光子晶體禁帶仿真結果
在FDTD-CNN模型的計算性能方面,利用一維自由空間仿真區(qū)域的可縮放性,保持網(wǎng)格參數(shù)與激勵源不變,逐次增加網(wǎng)格數(shù)從10 000到5 000 000,分別計算10萬步,記錄運行所用時間和占用的內存資源,結果如表2所示??梢?,由于CNN模型可自動執(zhí)行圖形處理器(GPU)并行化的特點,不論單精度還是半精度模式,計算時間均優(yōu)于傳統(tǒng)的FDTD,隨著網(wǎng)格點增多,計算規(guī)模擴大,優(yōu)勢更加明顯。而單精度、半精度兩種模式的CNN模型,半精度計算時間稍短,但差異不大,主要優(yōu)勢是占用內存比單精度少,隨著計算規(guī)模擴大,節(jié)省內存的優(yōu)勢也更加明顯,從前述仿真結果可知,半精度和單精度的CNN模型計算誤差非常接近,因此,對于大尺度的電磁仿真問題,半精度CNN模型更加適用。
表2 計算時間和占用內存比較
綜上所述,利用卷積操作與差分運算的內在聯(lián)系,構建了電磁傳播計算的FDTD-CNN模型,以及適用于模型訓練的FDTD計算域數(shù)據(jù)集。為避免一維模型訓練中易出現(xiàn)的過擬合問題,進一步探討了添加高斯噪聲的數(shù)據(jù)增強預處理技術。實例計算表明,該模型訓練后能夠較好地模擬不同介質特征的電磁傳播現(xiàn)象,并且具備良好的泛化復用性。
與傳統(tǒng)FDTD相比,F(xiàn)DTD-CNN模型的應用需要預先準備好用于訓練的、能夠良好描述計算域特征的數(shù)據(jù)集,這是深度學習類算法的一個固有特點,增加了模型應用的困難。而傳統(tǒng)FDTD已普遍應用了幾十年,積累了大量的電磁計算特征數(shù)據(jù),對這些數(shù)據(jù)的有效利用,正好滿足了模型訓練的數(shù)據(jù)資源需求。FDTD-CNN模型將傳統(tǒng)電磁計算與深度學習相結合,不僅為電磁計算的數(shù)值建模提供了新的思路,更重要的是為長期積累的大量電磁計算數(shù)據(jù)的分析與再利用提供了有效途徑。