薛文文,苗洪利,苗翔鷹
(中國海洋大學 信息科學與工程學院,山東 青島 266100)
電離層對微波的延遲是影響微波遙感對地面及海洋觀測的重要因素。特別是對于衛(wèi)星高度計對海表面高度的厘米級測量精度,電離層延遲會帶來較大的測高誤差。電離層延遲主要取決于電離層中的電子密度及總電子含量(Total Electron Content,TEC)。國際參考電離層(International Reference Ionosphere,IRI)構建了分層模型,用以預報平靜電離層的平均狀態(tài),能夠準確預測80%以上的微波路徑上的電子含量[1-2]。但是,IRI模型構造復雜、參數較多,不利于模型的推廣使用[3]。近年來,國外學者通過IRI與高度計實測數據進行分析,認為IRI表示在電離層變化情況上具有較高的精確度。但是,用戶一般在其官網上通過輸入必要的時間、位置及高度參量而獲取總電子含量[4],為在單頻衛(wèi)星高度計上應用該模型帶來困難?;诖髷祿纳疃葘W習可以通過網站獲取大量數據,建立基于IRI的神經網絡模型[5]。
Keras是基于Tensorflow后端,由Python語言編寫的一種高層神經網絡結構。Tensorflow是Google的開源框架,是當今大數據、人工智能、圖像識別及深度學習等領域的強大工具。Keras由于具備高效可擴展的序貫模型和函數式模型,其性能優(yōu)于傳統(tǒng)BP算法。
本文基于IRI電離層預測值,通過Keras網絡框架構建一個神經網絡模型,利用Jason-2衛(wèi)星高度計雙頻法測得的總電子含量值對神經網絡模型進行檢驗,旨在將該模型應用于單頻高度計的電離層延遲校正。
IRI官網(http://irimodel.org/)給出 IRI-2016 在線運行界面,可以輸入時間及位置等信息獲取所需電離層電子含量。但是這種交互式操作,對于幾十萬甚至上千萬的數據量來說難以操作。本文采用Python編寫程序,通過程序獲取所需數據原理示意圖如圖1所示。
圖1 IRI數據獲取原理圖
在客戶端將所需要的請求數據進行POST編碼后發(fā)送請求到服務器,服務器會根據POST請求發(fā)送response響應給客戶端??蛻舳耸盏椒掌靼l(fā)來的數據后,使用Python解析庫將需要的信息提取并且保存在本地計算機。本文使用的爬蟲信息與IRI官網上信息一致,包括時間信息(year,month,day,time),位置信息(latitude,longitude,height),還有可選信息F10.7 radio flux(10.7 cm的太陽輻射通量是太陽活動的極好指標[6]。它通常被稱為F10.7指數,是太陽活動中運行時間最長的記錄之一)等,這樣得到的總電子含量TEC,記為TECIRI[7]。
選 取 Jason-2的 GDR(Geophysical Data Records)中2016年Cycle281數據,每個Cycle由近10 d、254個 Pas(s升降軌)、127圈構成。
提取其中Ku波段的時間、經度、緯度及對應的用雙頻法測得的電離層延遲值Δ,Δ與總電子含量TEC的關系如式(1)[8-9]所示:
根據式(1)可以算出總電子含量:
f為Ku波段的頻率,其值為13.575 GHz;總電子含量TEC的單位為TECU,1 TECU=1016el/m2。
在Jason-2的Cycle281中提取Pass11-Pass30(10圈,接近1 d)的時間、經緯度、高度及Ku波段電離層延遲等信息,利用式(2)將電離層延遲換算為TEC值,記為TECJason-2。
對比Jason-2與IRI-2016的TEC值,必須首先進行時間和空間信息的匹配。將Jason-2數據中的時間,經度、緯度、高度信息依次輸入到網絡獲取軟件的POST請求當中,這樣就可以得到時間和位置完全匹配的兩列TEC數據。按時間排序的兩列TEC數值分布見圖2所示。
圖2 電離層總電子含量分布
從圖2可以看出,Jason-2繞地球每一圈,其觀測到的與地面之間的總電子總量具有周期性,反映了地面固定位置電離層分布的日周期性,而IRI-2016模型值表現出與Jason-2觀測值較強的分布一致性。
Jason-2利用雙頻觀測法進行每秒一次的實時觀測,受實時環(huán)境因素影響,會產生較大波動,而IRI-2016模型值是由多層公式積分而得,其結果必為連續(xù)可微函數值,其分布為平滑曲線。
由于IRI-2016模型值與雙頻法測量值分布及量值基本一致,因此,基于IRI-2016模型值深度學習的Keras神經網絡模型可以用于衛(wèi)星高度計的電離層延遲校正。
深度學習的數據集來自IRI-2016模型中2016年將近300萬組數據,經緯度的精度為0.01°,時間的精度為36 s。70%用于訓練模型,30%用于測試模型。深度學習對計算機性能要求極大,本文選取IRI模型適當的時間及空間精度,同時兼顧學習時間和模型結果準確率[10]。
Keras神經網絡模型的時間輸入分為兩個部分:一部分為年積日,即從每年的1月1日起開始累計的天數,另一部分為日積時,即每天的時刻數(以0.01小時單位)。同時輸入的參數還有空間位置信息,包括經度(longitude)、緯度(latitude)、高度(height)及 F10.7信息。
圖3為Keras神經網絡模型結構示意圖,將前述輸入參量作為輸入層,選擇合適的激活函數以及模型的優(yōu)化器將各層數據輸入訓練。模型的層數以及各層的節(jié)點數需要不斷地訓練調整,直到損失達到最小及梯度不再下降,進而固定各層參數,完成模型的建立。
圖3 Keras神經網絡模型結構
本文全鏈接采用6層網絡,前5層的激活函數均為“relu”,最后一層采用“l(fā)inear”。在隱含層選用“relu”是因為它具有如下優(yōu)點:克服梯度消失的問題與加快訓練速度。最后選用“l(fā)inear”線性激活函數,為了補償網絡輸出結果的線性偏置[11]。
對所建立的Keras網絡模型,只要將待測日期和時間分解為年積日和日積時,連同待測位置的經緯度及高度輸入模型,即可輸出總電子含量TEC值,記為TECKeras。當然,本文所建模型固定高度為Jason-2的軌道高度(1 336 km),模型只針對于特定的高度計[9-10]。
神經網絡模型的建立均需要測試,一般采用數據集的20%用于模型測試[12]。圖4為模型輸出值TECKeras和數據集中的目標值TECIRI的擬合散點圖。
圖4 TECKeras和TECIRI擬合散點圖
由圖4可以看出,Keras模型輸出值與IRI-2016的模型值具有很好的一致性。統(tǒng)計結果表明,二者的均方根誤差為0.72 TECU,相關系數高達0.99。這說明Keras模型具有較高的有效性和可靠性。
將所建模型應用到Jason-2的Cycle281-290中的數據,從結果中選用兩個PASS做出細節(jié)描述。圖5為Pass17和pass18一圈的TEC分布。
圖5 單圈雙頻觀測值和Keras模型值分布
圖中,灰色線為Jason-2雙頻測量的TEC值,為了與Keras模型值(黑色線)進行有效對比,將其進行多項式擬合,其擬合線見圖5中的藍色線。從中可以看出,擬合后的TEC值分布整體與Keras模型值分布較為接近。但是也可以看出,在部分地區(qū)Jason-2的測量值與網絡模型輸出值存在偏差。圖6為單圈情況下兩者的誤差分布直方圖。
圖6 Jason-2與模型輸出值TEC誤差分布直方圖
如圖6所示,Jason-2與模型值兩者的偏差一般在-15~20 TECU之間,且分布集中區(qū)域為-5~10之間,這樣的誤差分布表現出兩者的一個系統(tǒng)性偏差,大約為 4~5 TECU。
圖7 Jason-2與Keras模型值對比
如圖7所示,選用Cycle281-290的高度計數據,TECJason-2為雙頻觀測數據,TECmodel為Keras模型輸出數據,模型輸出值在各Cycle的Jason-2數據上表現出良好的一致性,對于范圍更廣的測量區(qū)域做出兩者的數據分布圖[13]。統(tǒng)計10個Cycle的各自均方根差(RMSE)和相關系數及平均值,結果見表1所示。
從表1可以看出,二者在各個Cycle內的均方根誤差比較穩(wěn)定,均值為4.46 TECU,換算為Ku波段的電離層延遲為8.5 mm,對于測高精度為厘米的衛(wèi)星高度計有良好的提升,毫米的電離層延遲誤差可以接受[14-15]。二者的相關系數均值為0.75,此結果為原始雙頻觀測數據與模型對比得到,而原始雙頻觀測數據相鄰點存在測量誤差,其值波動較大,如圖5所示,如果進行平滑處理,會提升其相關系數。盡管兩者的相對誤差達到0.25左右,但是TEC值當TECU達到較大值30 TECU時候,兩者的誤差也就為6 TECU左右,符合之前對模型的誤差分析。從圖7得到,在模型推廣到其他Cycle的時候,模型輸出值精度和各Cycle數據相同,具有較高的準確率。
表1 Jason-2雙頻觀測值與Keras模型值對比
本文采用python編程在IRI網站獲取了與Jason-2衛(wèi)星高度計Cycle281-290同軌道信息的IRI-2016模型電離層總電子含量數據。通過將該數據與Jason-2利用雙頻法測得的總電子含量比較,二者均具有明顯一致性。
基于IRI-2016數據,通過深度學習建立了Keras神經網絡模型。經測試,模型輸出值與測試數據集中的目標值之間的相關系數高達0.99,均方根誤差為0.72 TECU,說明模型有效。
將所建Keras神經網絡模型應用于Jason-2衛(wèi)星高度計,對比模型值與雙頻觀測值。結果表明,二者在10個cycle的平均電子含量均方根誤差為4.46 TECU,平均相關系數為0.75,對應的Ku波段傳輸延遲值為8.5 mm。
本文所建立的Keras神經網絡模型只適用于Jason-2及與其同軌道高度的高度計,這是由于建模時選用Jason-2的軌道高度。IRI模型是從電離層以不同高度分層的數據獲得的經驗模型,只要選取不同軌道高度的IRI數據建模,就可將模型應用于任意高度單頻高度計的電離層延遲誤差校正。