宋秉紅
( 蘭州城市建設(shè)設(shè)計研究院有限公司, 蘭州 730050 )
電離層是日地空間觀測環(huán)境中的一個重要組成部分,對人類生活生產(chǎn)產(chǎn)生了重要的影響. 電離層作為近地空間環(huán)境的重要組成部分,對電波通信、衛(wèi)星導(dǎo)航定位等都有重要影響,對電離層電子總含量(total electron content,TEC)進行預(yù)報,有助于理解電離層時空演化特征和應(yīng)用[1-2]. 早期學(xué)者可通過對電離層建模對電離層進行預(yù)報,主要分為經(jīng)驗?zāi)P?國際參考電離層(international reference ionosphere,IRI)模型)和數(shù)學(xué)模型(球諧函數(shù)模型、自回歸滑動平均(autoregressive moving average model,ARMA)模型、Klobuchar 模型、整合移動平均自回歸(autoregressive integrated moving average model, ARIMA)模型、NeQuick 模型等[3-4]). 近年來,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)的快速發(fā)展和計算機硬件性能的提升為電離層預(yù)報提供了新的思維方向. 深度學(xué)習(xí)方法作為一種特定類型的機器學(xué)習(xí)方法,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型相比,新增了更多的網(wǎng)絡(luò)層級和參數(shù),在應(yīng)用能力方面顯著提升[5]. 人工神經(jīng)網(wǎng)絡(luò)能夠處理非線性函數(shù)的問題為電離層預(yù)報提供了理論基礎(chǔ)[6-7]. 廖文梯等[8]基于長短期記憶(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型和深度神經(jīng)網(wǎng)絡(luò)(deep neural networks, DNN)的混合模型對全球電離層TEC 進行中短期預(yù)報,該混合模型有效解決了網(wǎng)絡(luò)層數(shù)增加帶來的梯度消失的問題;馬國輝等[9]基于深度學(xué)習(xí)門限循環(huán)單位(gate recurrent unit,GRU)模型對電離層TEC 進行了預(yù)報,實驗結(jié)果表明:GRU 模型能夠較好地預(yù)測低、中、高地區(qū)電離層TEC,且在低緯地區(qū)的精度高于中緯地區(qū),中緯地區(qū)的精度高于高緯地區(qū);吉長東等[10]基于LSTM 神經(jīng)網(wǎng)絡(luò)模型和總體經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)結(jié)合的方法實現(xiàn)了對電離層TEC 值進行短期預(yù)報. 電離層TEC 數(shù)值大小與太陽活動、地磁活動、中性大氣背景以及電動力學(xué)過程有關(guān)密切相關(guān)[11],目前既有文獻較多僅對TEC 數(shù)值進行時間序列分析及其預(yù)報,本文采用非線性預(yù)報反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)模型將電離層格網(wǎng)(global ionosphere maps,GIM)數(shù)據(jù)、時間點、經(jīng)緯度、太陽射電通量F10.7數(shù)據(jù)、赤道地磁活動指數(shù)Dst和全球地磁活動指數(shù)Kp數(shù)據(jù),以此來提高電離層TEC 預(yù)報的精度,同時可為今后探索電離層數(shù)據(jù)在天氣預(yù)報方面的應(yīng)用提供依據(jù).
BPNN 算法主要由輸入層、隱含層和輸出層三部分組成. BPNN 模型主要與網(wǎng)絡(luò)層數(shù)、每層的神經(jīng)元個數(shù)和激活函數(shù)有關(guān).
神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度取決于隱含層的個數(shù)和神經(jīng)元的個數(shù),隱含層的個數(shù)又取決于輸入層和輸出層的神經(jīng)元個數(shù). 隨著神經(jīng)元個數(shù)的增加樣本訓(xùn)練迭代次數(shù)會隨之增加,本文通過經(jīng)驗公式來確定最佳的 隱含層神經(jīng)元的個數(shù)[12],即
式中:k為隱含神經(jīng)層神經(jīng)元的個數(shù);m為輸入層的神經(jīng)元的個數(shù);n為輸出層神經(jīng)元的個數(shù),a為常數(shù),一般在[1,10]取值.
在建模的過程中若輸入原始數(shù)據(jù),往往會導(dǎo)致輸入層中神經(jīng)元權(quán)重不同對結(jié)果產(chǎn)生一定的影響,因此在建模過程中往往對輸入層數(shù)據(jù)進行歸一化處理,將原 始數(shù)據(jù)映射在區(qū)間(–1,1)中,即
式中:Xi為歸一化處理之后得到的數(shù)值;X為歸一化處理的對象;Xmax、Xmin分別為原始數(shù)據(jù)中最大值和最 小值.
LSTM 神經(jīng)網(wǎng)絡(luò)模型是在遞歸神經(jīng)網(wǎng)絡(luò)(recurr ent neural network,RNN)模型的基礎(chǔ)上新增了3 個“門限”結(jié)構(gòu)來替代原有的RNN 神經(jīng)元,通過輸入門限、遺忘門限和輸出門限來選擇性記憶反饋的誤差函數(shù)隨梯度下降的修正參數(shù),從而實現(xiàn)時間上的記憶功能,并防止梯度消失,假設(shè)為輸入層數(shù)據(jù),為模型的輸出結(jié)果,則LSTM 記憶單元的狀態(tài)和輸出的計算公式可表示為:
式中:it、Ot和ft分別為t時刻輸入門、遺忘門和輸出門的輸出值;ct、mt分別為神經(jīng)元和記憶單元在t時刻的激活狀態(tài);W為神經(jīng)網(wǎng)絡(luò)模型不同層之間的權(quán)系數(shù)矩陣;b為偏置項;σ為激活函數(shù);tanh為雙曲正切激活函數(shù).
本文實驗使用的數(shù)據(jù)包括歐洲定軌中心(Center for Orbit Determination in Europe,CODE)提供的電離層格網(wǎng)GIM 數(shù)據(jù),空間分辨率均為2.5°×5°,時間分辨率為1 h;中國科學(xué)院空間環(huán)境預(yù)報中心提供太陽射電通量F10.7數(shù)據(jù),時間分辨率為1 d;日本京都地磁數(shù)據(jù)中心提供赤道地磁活動指數(shù)Dst和全球地磁活動指數(shù)Kp數(shù)據(jù),時間分辨率為3 h. 在實際使用過程中需要將各個數(shù)據(jù)的線性內(nèi)插方式得到時間分辨率為1 h 的數(shù)據(jù).
本文選擇樣本數(shù)量為2020—2021 年數(shù)據(jù),共計731 d,考慮到全球電離層TEC 存在半年/年周期性變化,本文實驗數(shù)據(jù)為抽樣選取,以一個月為周期,每個月前20 d 數(shù)據(jù)作為訓(xùn)練集,中間5 d 為驗證集,后5 d 為測試集,若當(dāng)月天數(shù)不足30 d 的,則訓(xùn)練集減少相應(yīng)的天數(shù),若當(dāng)月天數(shù)超過30 d 的,增訓(xùn)練集增加相應(yīng)的天數(shù),訓(xùn)練樣本結(jié)構(gòu)如圖1 所示.
圖1 BPNN 模型樣本訓(xùn)練結(jié)構(gòu)圖
在圖1 中,B、L表示格網(wǎng)點經(jīng)緯度信息,同時將原始GIM 數(shù)據(jù)進行歸一化處理,經(jīng)過歸一化處理的數(shù)據(jù)能夠更好反饋特征項,不會因為某個數(shù)量量級過大導(dǎo)致模型精度較差的結(jié)果. 通過式(4)確定隱含層的個數(shù)為14 個. 樣本輸入輸出數(shù)據(jù)均為附加時間和空間位置屬性的GIM 格網(wǎng)數(shù)據(jù).
將CODE 中心提供的2020—2021 年共計731 d的GIM 數(shù)據(jù)按照低緯度(22.5°N,65°E)、(22.5°N,125°E)、中緯度(45°N,65°E)、(45°N,125°E)、高緯度(67.5°N,65°E)、(67.5°N,125°E)以月為周期提取各格網(wǎng)點時間序列數(shù)據(jù),每個月前20 d 數(shù)據(jù)作為訓(xùn)練集,中間5 d 數(shù)據(jù)為驗證集來輔助預(yù)報模型的構(gòu)建,后5 d為測試集進行精度評估. 將電離層預(yù)報結(jié)果與CODE中心的電離層產(chǎn)品數(shù)據(jù)進行對比,同時以殘差的平均值、均方根誤差 (root mean square error,RMSE)和平均相對精度作為精度因子進行精度評估. 殘差的平均值、RMSE 和平均相對精度分別表示為:
式中:AAVE為殘差的平均值;ARMSE為RMSE;ARA為平均相對精度; TECi為第i個歷元電離層預(yù)報值;TECGIMi為第i個歷元的參考值;n為歷元長度.
將CODE 中心提供的GIM 產(chǎn)品作為參考值,將低緯度(22.5°N,65°E)、(22.5°N,125°E)、中緯度(45°N,65°E)、(45°N,125°E)和高緯度(67.5°N,65°E)、(67.5°N,125°E)各格網(wǎng)點共計60 d (每月5 d 的預(yù)報結(jié)果,2 a共計60 d)的預(yù)報結(jié)果進行對比分析,將最大殘差值、最小值、平均值、RMSE、平均相對精度進行統(tǒng)計,結(jié)果如表1 所示.
表1 預(yù)報電離層各網(wǎng)點殘差值統(tǒng)計結(jié)果
由表1 可知,基于BPNN 模型預(yù)報的電離層TEC 值在低緯度、中緯度、高緯度的預(yù)測結(jié)果存在差異性,這可能是由于不同緯度地區(qū)電離層TEC 值存在較大差異性導(dǎo)致的. 低緯度、中緯度和高緯度電離層格網(wǎng)點TEC 最大殘差值分別為3.12 TECU、3.88 TECU、5.02 TECU,低緯度的平均相對精度優(yōu)于中緯度平均相對精度,中緯度的平均相對精度優(yōu)于高 緯度平均相對精度,在低緯度地區(qū)、中緯度地區(qū)、高緯度地區(qū)平均RMSE 分別為1.94 TECU、2.13 TECU、3.08 TECU.
為了進一步評估BP 神經(jīng)網(wǎng)絡(luò)BPNN 模型在電離層預(yù)報中的可靠性和穩(wěn)定性,將BPNN 神經(jīng)網(wǎng)絡(luò)模型電離層預(yù)報結(jié)果與LSTM 神經(jīng)網(wǎng)絡(luò)模型電離層預(yù)報結(jié)果進行對比分析,結(jié)果如圖2 所示.
圖2 2 種神經(jīng)網(wǎng)絡(luò)模型預(yù)報精度對比圖
由圖2 可知,在中緯度、高緯度地區(qū)BPNN 和LSTM 神經(jīng)網(wǎng)絡(luò)模型對電離層預(yù)報均有較好的精度,且2 種神經(jīng)網(wǎng)絡(luò)模型對電離層預(yù)報精度基本相當(dāng).與BPNN 神經(jīng)網(wǎng)絡(luò)模型相比,LSTM 神經(jīng)網(wǎng)絡(luò)模型在低緯度地區(qū)預(yù)測的電離層殘差值和RMES 值更大,預(yù)報精度較低. 因此,在低緯度地區(qū)使用BPNN神經(jīng)網(wǎng)絡(luò)模型對電離層預(yù)報具有更高的精度. 同時,也進一步證實了BPNN 神經(jīng)網(wǎng)絡(luò)模型在電離層預(yù)報中具有較好的可靠性和穩(wěn)定性.
針對TEC 時間序列高噪聲、非平穩(wěn)、包含了線性和非線性的動態(tài)序列的問題,本文采用非線性預(yù)報BPNN 模型將GIM 數(shù)據(jù)、時間點、經(jīng)緯度、太陽射電通量F10.7數(shù)據(jù)、赤道地磁活動指數(shù)Dst和全球地磁活動指數(shù)Kp數(shù)據(jù)作為樣本訓(xùn)練,同時將預(yù)報結(jié)果進行精度評估,實驗結(jié)果表明:
1) 基于BPNN 模型通過樣本訓(xùn)練能夠較好地預(yù)報低緯度、中緯度和高緯度電離層TEC 值;
2) BPNN 模型能夠較好地反映出電離層TEC 值的變化特征,在低緯度、中緯度、高緯度的預(yù)報殘差平均值分別為1.505 TECU、1.595 TECU、1.885 TECU;平均RMSE 分別為1.94 TECU、2.13 TECU、3.08 TECU;平均相對精度分別為90.5%、88.7%、85.35%;
3) 由于電離層時空特性變化機理較為復(fù)雜,如何將預(yù)報電離層TEC 數(shù)據(jù)在地震預(yù)報、天氣預(yù)報中取得實際應(yīng)用可作為下一步重點研究內(nèi)容之一.