夏吉業(yè),張海勇,徐 池,賀 寅
(海軍大連艦艇學院,遼寧 大連 116018)
短波通信自上世紀初出現(xiàn)以來,就一直被廣泛的應用于無線通信中,在遠程通信方面,相比于衛(wèi)星通信,短波通信能夠不依靠中繼用較小的發(fā)射功率達成通信,此外,短波通信在軍事通信中也占據(jù)著重要地位[1-2],發(fā)展短波通信意義重大。
短波遠程通信是通過電離層反射實現(xiàn)的,受電離層色散、時變[3]等特性及信道傳輸過程中存在的多普勒頻移、衰落、多徑時延、噪聲干擾[4]等現(xiàn)象影響,只有選擇適當?shù)耐ㄐ蓬l率,才能使通信過程在優(yōu)質(zhì)信道中達成,保證短波遠程通信的通信效果。因此,實現(xiàn)精準的通信頻率預測在短波遠程通信過程中尤為重要[5]。
傳統(tǒng)頻率預測方法主要有國際無線電咨詢委員會(CCIR)推薦方法(即340 報告)和亞大預測[6],通過公式來進行計算的方法進行預測,之后國際電聯(lián)通信大會(ITU-R,即原CCIR)給出三個短波信道模型,即報告252、報告252 補編和報告894[7-8]。隨后國外推出了一系列頻率預測程序,主要有IONCAP、VOACAP、PropMan、NTIA/ITS 以及W6ELProp 等[5],這些預測程序針對不同的適用環(huán)境和條件,在一定程度上提高了預測精度,但主要是在理想模式下進行的,對氣候、太陽活動、電離層跳變等不確定因素不能很好估計[9]。在國內(nèi)方面,2007 年中國電波傳播研究所結(jié)合亞大地區(qū)電離層探測數(shù)據(jù),對亞大模型進行改進,有效的提高了該地區(qū)頻率預測的精度[10-11],但受地域限制,該方法在通信距離超過4000 公里時的預測精度較低,基本不能滿足遠程通信時對通信頻率的預測需求。
隨著機器學習和人工神經(jīng)網(wǎng)絡算法的出現(xiàn)和發(fā)展,從本世紀初開始,研究者們利用人工神經(jīng)網(wǎng)絡強大的非線性預測能力,將其引入到短波頻率預測領域,并獲得了一些成果。最初的方法是用反向傳播(BP)神經(jīng)和網(wǎng)絡預測f0F2 月中值[12],預測誤差在0.3 MHz以上,在太陽黑子周期劇烈變化時甚至達到1 MHz 以上;簡相超[13]等人將混沌理論和神經(jīng)網(wǎng)絡相結(jié)合方法,構(gòu)成混合模型來進行短波頻率參數(shù)預測;金會彬[14]等人基于神經(jīng)網(wǎng)絡的foF2 預測方法,提高了對電離層暴期的預測結(jié)果;任淑婷[15]等人提出基于模糊小波神經(jīng)網(wǎng)絡[16-18]的短波頻率預測模型;趙德群[9]等人提出思維進化小波神經(jīng)網(wǎng)絡(MEA-WNN)與混沌理論相結(jié)合的短波通信頻率預測方法,提高對f0F2 的預測精度。上述算法均存在一些缺陷,主要體現(xiàn)在對數(shù)據(jù)的處理太過復雜、對參數(shù)要求較為苛刻、選擇神經(jīng)網(wǎng)絡模型存在收斂慢、梯度消失或爆炸等問題。為避免神經(jīng)網(wǎng)絡在反向傳播時產(chǎn)生的梯度消失,結(jié)合揮深度學習算法[19-20]對處理非線性時間序列的獨特優(yōu)勢,2019年張雯鶴[21]等人提出一種基于長短期記憶神經(jīng)網(wǎng)絡(LSTM)模型預測f0F2 的方法,該模型具有收斂速度快、收斂性較好等特點,但僅對f0F2 月中值實現(xiàn)了預測和驗證;同年,尚教凱[22]等人基于LSTM 模型實現(xiàn)對未來24 小時的點對點遠程短波通信可用頻率預測,但該方法使用單特征輸入時預測耗時較長,使用多特征輸入時結(jié)果存在時延,仍有提升空間。
為解決上述問題,本文提出一種基于卷積神經(jīng)網(wǎng) 絡(Convolutional Neural Network,CNN) 和 雙 向長短期記憶神經(jīng)網(wǎng)絡(Bidirectional Long Short Term Memory,BiLSTM)相結(jié)合的模型,即CNN-BiLSTM模型,來實現(xiàn)對遠程短波通信頻率的預測。
卷積神經(jīng)網(wǎng)絡(CNN)通過原始數(shù)據(jù)與卷積核相乘來提取局部特征,在一個網(wǎng)絡中可以通過選擇多種類型卷積核來達到提取多個局部特征的目的,因此CNN 相比其他網(wǎng)絡,其提取布局特征的能力更為突出。該網(wǎng)絡主要由卷積層、池化層和全連接層組成。其中,運用卷積核對原始數(shù)據(jù)進行卷積操作來提取特征的過程發(fā)生在卷積層,該層是CNN 網(wǎng)絡的核心層,其過程可用式(1)表示。
式中,σ為激活函數(shù);? 為卷積操作;W為權值矩陣;b為偏置矩陣。
池化層的作用是將卷積層得到的輸出通過池化操作來對處理后的數(shù)據(jù)進行壓縮,提高泛化能力。本文模型選用最大池化函數(shù)對卷積結(jié)果進行池化操作,通過取最大值來完成對局部特征區(qū)域的數(shù)據(jù)壓縮過程,其過程如式(2):
式中,di為通過卷積層提取的特征,m為池化寬度。
全連接層的作用是將前邊網(wǎng)絡提取到的特征信息綜合到一起,它的每個結(jié)點都連接著上一層的所有結(jié)點,因此其相關參數(shù)較多。通過全連接層使所提取的特征具有更高層的含義,從而達成該網(wǎng)絡模型所要實現(xiàn)的物理意義。
長短期記憶神經(jīng)網(wǎng)絡(LSTM)最早由Hochreiter[23]于1997 年提出,是在循環(huán)神經(jīng)網(wǎng)絡(RNN)上的一種改進,在RNN 基礎上引入記憶模塊,在提高了計算效率[24]的同時,有效的解決了RNN 出現(xiàn)的梯度消失或者爆炸問題[25]。
LSTM 模型具有較好的非線性時間序列的處理能力,但在實驗過程中發(fā)現(xiàn),LSTM 的記憶能力有一定限度,并且該模型是一個單向傳遞的過程,即后一時刻的狀態(tài)對當前時刻沒有任何影響,而在短波通信頻率預測過程中,認為在一定的時間間隔內(nèi),頻率的預測可以綜合考慮前、后時刻的輸入和狀態(tài),來提高預測效果。因此,本文引入雙向長短期記憶神經(jīng)網(wǎng)絡(BiLSTM),該模型將兩層不同的LSTM 互連,使每個輸入都會從正反兩個方向經(jīng)過網(wǎng)絡,該模型一方面增強了處理非線性時間序列的能力,另一方面也能進行更充分的學習訓練,利用當前輸入和后一時刻的狀態(tài)進行短波頻率預測,因此在理論上有更好的預測效果。BiLSTM 模型結(jié)構(gòu)如圖1 所示。
圖1 雙向長短期記憶神經(jīng)網(wǎng)絡結(jié)構(gòu)
該模型的運算結(jié)果如式(3)、式(4)所示。
在CNN 網(wǎng)絡運算過程中,為精確的逼近訓練數(shù)據(jù)的局部特征,容易出現(xiàn)過擬合現(xiàn)象,為解決這一問題,本文提出的模型在CNN 網(wǎng)絡之后進行Dropout 運算。該算法由Alex[26]等人于2012 年提出,原理是在每個訓練批次中,適當忽略部分特征檢測器,減少相互作用,因此在網(wǎng)絡運行過程中不會太過依賴某些局部特征,有效的降低模型過擬合,從而增強了模型的泛化能力。使用該算法的神經(jīng)網(wǎng)絡模型與標準神經(jīng)網(wǎng)絡模型的對比如圖2 所示。
圖2 標準神經(jīng)網(wǎng)絡與Dropout 網(wǎng)絡模型對比
該算法由于忽略部分檢測器,使當前層的檢測器無需遍歷下一層的每個檢測器,降低了網(wǎng)絡模型的復雜程度,因此該算法在解決過擬合現(xiàn)象的同時,也大大減少了網(wǎng)絡模型的運算時間。綜合考慮歷史經(jīng)驗及多次嘗試,在本文的模型中使用該算法忽略的檢測器比例為20%。
短波遠程通信的最高可用頻率受電離層特性影響,具有一定空間和時間上相關性,不少學者也在進行短波通信頻率時間柵格和空間柵格尺度的研究。結(jié)合在本文中分析得到的CNN 具有較好的提取空間局部特征能力與BiLSTM 在處理非線性時間序列時獨到的優(yōu)勢,提出基于CNN-BiLSTM 的融合模型短波通信頻率預測模型,結(jié)構(gòu)如圖3 所示。
該網(wǎng)絡模型主要可劃分為輸入層、CNN 層、Dropout 層、BiLSTM 層、全連接層和輸出層,其中CNN 層和BiLSTM 層為本模型的核心結(jié)構(gòu),CNN 層是由多個一維卷積(Conv1D)層和一維最大池化(MaxPooling1D)層堆疊組成。利用該模型進行遠程短波通信頻率預測的過程如下。
將歷史通信頻率等相關數(shù)據(jù)集作為該網(wǎng)絡的輸入,經(jīng)數(shù)據(jù)歸一化、形成矩陣向量等預處理之后,進入CNN 層利用多層卷積核與池化核參數(shù)對相關頻率數(shù)據(jù)進行局部深層特征提取,提取完畢后得到多組特征向量再經(jīng)Dropout 層隨機丟棄部分特征以提高模型的穩(wěn)健性,隨后將處理后的輸出特征通過BiLSTM 網(wǎng)絡進行訓練,最后,將經(jīng)BiLSTM 訓練得到的輸出結(jié)果進行拼接融合,再經(jīng)全連接層進行信息綜合后,得到模型預測的頻率值。
圖3 CNN-BiLSTM 模型結(jié)構(gòu)
短波通信的歷史數(shù)據(jù)是指通信雙方在達成較穩(wěn)定的短波通信過程中使用或設置的一些相關通信參數(shù),包括通信時刻、雙方位置、通信頻率、通信功率等因素,由于該數(shù)據(jù)是實際通信過程中產(chǎn)生的,具有較高的可靠性和準確性,若能積累一定數(shù)量較為連續(xù)的歷史數(shù)據(jù),則可用來進行短波通信頻率預測。受限于實際情況,無法得到足以支撐該模型需求的歷史通信頻率值作為樣本數(shù)據(jù),本文采用ITS/REC533 軟件提取仿真數(shù)據(jù),即2014 年8 月31 日09 時至2015 年1 月29 日08 時北京石景山到福建臺江兩點間,時間間隔為1 小時的短波最高通信頻率數(shù)值,組成樣本數(shù)據(jù)。該樣本數(shù)據(jù)集共有3624 h數(shù)據(jù),其中,前3600 h數(shù)據(jù)(共150 天)作為模型的訓練樣本,后24 h 數(shù)據(jù)作為模型的測試樣本,數(shù)據(jù)格式如表1 所示。
為對比預測結(jié)果的好壞,使用預測的均方根誤差(RMSE)和模型運行時間作為評判標準。RMSE值越小,所用時間越短,就代表該模型預測的效果越好。其中,RMSE 的計算公式如式(5)所示:
式中,yt和分別為t時刻的通信頻率真實值和預測值,N為測試集的尺度。
表1 樣本數(shù)據(jù)表
單特征輸入LSTM 模型、多特征輸入LSTM 模型與本文提出的CNN-BiLSTM 模型進行短波通信頻率預測的結(jié)果如圖4、圖5、圖6 所示。
圖4 單特征輸入LSTM 模型預測結(jié)果
圖5 多特征輸入LSTM 模型預測結(jié)果
圖6 CNN-BiLSTM 模型預測結(jié)果
圖中虛線為通信頻率的真實值,實線為通信頻率的模型預測值,這三種模型的RMSE 和模型運行時間如表2 所示。
表2 三種模型RMSE 及運行時間對比
對比上述圖表可以發(fā)現(xiàn),在模型預測的準確性方面,單特征輸入LSTM 預測模型RMSE 值僅為0.204,準確度最高,從圖形中可以看出除初始1-3 h 的預測結(jié)果存在1 MHz 左右誤差外,與真實值吻合較好;CNN-BiLSTM 預測模型RMSE 值為0.544,準確度次之,在預測MUF 值的高、低點存在1 MHz 左右的誤差外,基本與真實值保持一致;多特征輸入LSTM 預測模型RMSE 值為2.148,準確度最低,預測結(jié)果除初始1 h誤差較大外,預測值與真實值存在約1 h 時延且有逐漸擴大趨勢。在模型的運行時間方面,預測準確度較低的多特征輸入LSTM 預測模型用時最短,僅為8.68 s;CNN-BiLSTM 預測模型次之,用時38.44 s;而準度度最高的單特征輸入LSTM 預測模型用時最長,為203.22 s,是多特征輸入LSTM 模型的23.4 倍,CNNBiLSTM 模型的5.3 倍。
綜上所述,在短波通信頻率預測方面,單特征輸入LSTM 模型具有預測精度高,但費時較長的特點;多特征輸入LSTM 模型極大的縮短了預測時間,但預測結(jié)果存在1 h 時延,預測效果得不到保證;本文提出的CNN-BiLSTM 預測模型在基本保證預測精度的基礎上,極大的縮短了單特征輸入LSTM 模型預測所用時間,又有效的解決了多特征輸入LSTM 模型所存在的預測時延問題,因此該模型可用于短波通信頻率預測。
在實際通信過程中,要想獲得連續(xù)150 天的短波通信歷史數(shù)據(jù)難度較大,對固定臺站與移動臺站、移動臺站與移動臺站間的短波通信而言尤為如此。因此,出于短波通信的實際考慮,如何在保證短波通信頻率預測精度的基礎上,盡可能的減少所需要的通信歷史數(shù)據(jù)成為本文重點研究內(nèi)容。
為減少對通信歷史數(shù)據(jù)的需求,本文分別使用連續(xù)7 天、8 天、9 天、10 天、11 天、12 天,間隔1小時的仿真數(shù)據(jù)作為訓練樣本,后1 天的仿真數(shù)據(jù)作為測試樣本,利用本文提出的CNN-BiLSTM 短波頻率預測模型進行仿真實驗,并與單特征、多特征輸入LSTM 模型進行對比,實驗結(jié)果如圖7 所示。
圖7 短波通信頻率預測效果
在圖7 中,(a)~(f)分別表示訓練樣本為7-12天時的CNN-BiLSTM 模型仿真結(jié)果,(g)、(h)表示訓練樣本為12 天時,使用單特征輸入LSTM 模型和多特征輸入LSTM 模型的仿真結(jié)果,藍色虛線為通信頻率的真實值,黃色實線為通信頻率的模型預測值。模型運行時間及誤差如表3 所示。
表3 模型運行及誤差表
從圖(a)~(f)及上表中可以看出,在預測準確性方面,本文提出的CNN-BiLSTM 模型隨訓練樣本天數(shù)的增加,預測精度不斷增加,在訓練樣本數(shù)為12 天時,RMSE 值僅為0.227,除頻率最高處存在0.5 MHz 的誤差外,預測值與真實值基本吻合;在模型運行時間方面,隨訓練樣本天數(shù)增加,模型運行時間基本呈遞增趨勢,但總體差距不大,最短運行時間與最長運行時間相差25.73 s;在樣本最大誤差率方面,隨訓練樣本天數(shù)增加,誤差率逐步降低,在訓練樣本為12 天時最大誤差率低至3.08%。
從圖(f)~(h)及上表中可以看出,在訓練樣本數(shù)為12 天時,單特征輸入LSTM 模型和多特征輸入LSTM 模型的預測精度相對較低,預測最大誤差分別為4.5 MHz 和5.2 MHz,最大誤差率均達到20%以上,相比之下,本文提出的CNN-BiLSTM 預測模型在預測精度、最大誤差以及最大誤差率方面都有顯著提升。由此可以得出,在訓練樣本數(shù)較少的情況下,CNNBiLSTM 預測模型的預測效果要優(yōu)于單特征、多特征輸入LSTM 預測模型。
綜上所述,本文提出的CNN-BiLST 模型可實現(xiàn)對未來1 天的短波通信頻率較為精準的預測,并且相對于單特征、多特征輸入LSTM 預測模型,該預測模型在保證預測精度的同時,大幅縮減了對短波通信歷史數(shù)據(jù)的數(shù)量要求,增加了在實際短波通信過程中的適用性。
本文概述了通信頻率預測發(fā)展現(xiàn)狀及存在問題,提出了CNN-BiLSTM 模型用于遠程短波通信頻率預測,并與單特征、多特征輸入LSTM 預測模型進行了對比仿真實驗,驗證了該模型可用于短波通信頻率預測,在訓練樣本數(shù)較少的情況下,該模型的預測精度優(yōu)于單特征、多特征輸入LSTM 預測模型,對短波遠程通信頻率的預測研究具有一定借鑒意義。該方法基于短波通信的歷史數(shù)據(jù)進行通信頻率預測,如何更好的采集存儲歷史數(shù)據(jù)以及對歷史數(shù)據(jù)的處理利用等方面還值得進行進一步研究。