李天秀,石磊,王俊輝,李佳豪
(空軍工程大學(xué)信息與導(dǎo)航學(xué)院,陜西 西安 710077)
基于量子力學(xué)基本原理的量子通信技術(shù)以其理論上的無條件安全性[1,2]成為保密通信領(lǐng)域的熱點(diǎn)之一。目前,量子通信技術(shù)已進(jìn)入實(shí)用化乃至全球網(wǎng)絡(luò)化建設(shè)的進(jìn)程,在遠(yuǎn)距離量子通信過程中,自由空間量子通信系統(tǒng)具有損耗小、靈活性強(qiáng)、傳輸距離遠(yuǎn)等優(yōu)點(diǎn),是全球化組網(wǎng)的重要方式[3-5]。在自由空間量子通信過程中,量子信號會受到復(fù)雜大氣環(huán)境的影響,從而不可避免地出現(xiàn)量子信號的衰減,對量子信號大氣衰減情況的分析研究是提高自由空間量子通信性能的重要理論基礎(chǔ)之一。
在理論模型研究方面,Nie等多個團(tuán)隊[6-8]研究了包括霧霾、雷暴云在內(nèi)的多種大氣環(huán)境對量子信號在空間中遠(yuǎn)距離傳輸?shù)男阅艿挠绊?。Vasylyev等[9]針對雨、霧天氣下量子光信號經(jīng)過大氣湍流后的性能變化建立了近似橢圓光束的量子光模型。上述研究在對量子信號空間信道特性建模分析的基礎(chǔ)上提出了相應(yīng)的補(bǔ)償方案以應(yīng)對大氣環(huán)境影響,而補(bǔ)償方案的實(shí)現(xiàn)和優(yōu)化是進(jìn)一步研究的重點(diǎn)。
2019年,南京郵電大學(xué)王琴團(tuán)隊提出了一種使用深度學(xué)習(xí)方法進(jìn)行主動預(yù)測和反饋控制的相位漂移解決方法[10]。該方案利用長短時記憶網(wǎng)絡(luò)結(jié)合實(shí)時獲取的溫度、濕度、光強(qiáng)等數(shù)據(jù)對相電壓進(jìn)行預(yù)測,并根據(jù)預(yù)測結(jié)果進(jìn)行參數(shù)預(yù)調(diào)整,有效提高了系統(tǒng)傳輸效率,并降低了系統(tǒng)誤碼率。該方法的核心思想是利用深度學(xué)習(xí)方法,在可實(shí)時獲取的參數(shù)基礎(chǔ)上對關(guān)鍵參數(shù)進(jìn)行預(yù)測,并根據(jù)預(yù)測結(jié)果預(yù)先使用相應(yīng)的補(bǔ)償方案,最終實(shí)現(xiàn)系統(tǒng)參數(shù)的動態(tài)調(diào)整和性能的實(shí)時提升,在空間量子通信系統(tǒng)中同樣也可以應(yīng)用這一思路。
在空間量子通信系統(tǒng)中,大氣條件的改變會影響最終密鑰率的生成。針對不同大氣信道條件,對包括信號光強(qiáng)度在內(nèi)的各種系統(tǒng)參數(shù)進(jìn)行有效調(diào)整和選擇,可以優(yōu)化系統(tǒng)最終的密鑰生成。大氣信道參數(shù)是其他參數(shù)調(diào)整的基礎(chǔ),對大氣信道條件的預(yù)測為預(yù)先的參數(shù)調(diào)整提供了依據(jù),使得光源等系統(tǒng)參數(shù)的調(diào)整可以有針對性地預(yù)先進(jìn)行,以獲得實(shí)時優(yōu)化效果。
本文基于上述研究思路,采用深度學(xué)習(xí)方式,利用可獲取的氣象數(shù)據(jù)提出了量子大氣衰減系數(shù)的預(yù)測方案。分別利用誤差反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、長短期記憶網(wǎng)絡(luò)(LSTM)、門限循環(huán)單元(GRU)三種神經(jīng)網(wǎng)絡(luò)模型,并根據(jù)測試情況對網(wǎng)絡(luò)性能進(jìn)行了分析比較。這一方案能夠?yàn)獒槍r變大氣信道的補(bǔ)償方法提供數(shù)據(jù)基礎(chǔ),同時可以根據(jù)不同系統(tǒng)的實(shí)測數(shù)據(jù)進(jìn)行更深入的探索和拓展。
本量子信號大氣衰減系數(shù)預(yù)測實(shí)驗(yàn)的具體流程如圖1所示,包括數(shù)據(jù)預(yù)處理、模型構(gòu)建與訓(xùn)練數(shù)據(jù)預(yù)測與分析。各步驟具體內(nèi)容如下:
圖1 實(shí)驗(yàn)流程圖Fig.1 Flow chart of the experiment
1)數(shù)據(jù)采集與預(yù)處理。數(shù)據(jù)的預(yù)處理主要包括數(shù)據(jù)質(zhì)量的控制、數(shù)據(jù)轉(zhuǎn)化、歸一化處理、數(shù)據(jù)集的劃分。數(shù)據(jù)質(zhì)量的控制包括去除壞點(diǎn)和數(shù)據(jù)補(bǔ)缺;數(shù)據(jù)轉(zhuǎn)化、歸一化處理及數(shù)據(jù)集的劃分將在后文進(jìn)行詳細(xì)說明。
2)模型構(gòu)建與訓(xùn)練。分別使用BPNN、LSTM、GRU三種深度學(xué)習(xí)算法進(jìn)行模型構(gòu)建,以及算法初始參數(shù)設(shè)置,并根據(jù)訓(xùn)練情況進(jìn)行參數(shù)調(diào)節(jié)。
3)數(shù)據(jù)預(yù)測與分析。將測試集數(shù)據(jù)輸入不同網(wǎng)絡(luò)模型中,輸出預(yù)測結(jié)果。對預(yù)測結(jié)果和實(shí)測值進(jìn)行數(shù)學(xué)分析和比較。
量子光信號在大氣信道內(nèi)傳輸?shù)倪^程中會受到包括大氣分子吸收、懸浮微粒吸收、瑞利散射、米氏散射在內(nèi)的多種因素影響[11],導(dǎo)致光信號強(qiáng)度的衰減。定義光信號經(jīng)過大氣信道前后的強(qiáng)度比值為大氣信道傳輸效率ηatm,其與大氣環(huán)境和傳輸距離的關(guān)系可以表示為[12]
式中:α為大氣信道衰減系數(shù),用于表征大氣環(huán)境對量子信號衰減的強(qiáng)弱;L表示傳輸距離。α在實(shí)際條件下可以通過實(shí)驗(yàn)數(shù)據(jù)獲得,為了便于估測,文獻(xiàn)[13]根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行擬合,給出了大氣信道衰減系數(shù)與能見度之間的經(jīng)驗(yàn)公式
式中:γ表示通信過程使用的信號光波長,Vν為能見度,參數(shù)q的取值與能見度的關(guān)系為
本研究利用(2)、(3)式對能見度數(shù)據(jù)進(jìn)行轉(zhuǎn)化,從而獲得大氣信道衰減系數(shù)的原始數(shù)據(jù),作為輸入向量的重要參數(shù)之一。
本實(shí)驗(yàn)所使用的數(shù)據(jù)集為西安地區(qū)氣象數(shù)據(jù),氣象站區(qū)站編號57036,位置為北緯108.93°,東經(jīng)34.3°,數(shù)據(jù)集記錄了2018年6月至2020年6月的氣象數(shù)據(jù),包含氣壓、溫度、相對濕度、風(fēng)速、能見度數(shù)據(jù),數(shù)據(jù)采樣間隔為3 h,數(shù)據(jù)樣例如表1所示,衰減系數(shù)由能見度通過(2)、(3)式轉(zhuǎn)化得到,其中通信波長取值為850 nm,氣溫、氣壓、濕度、風(fēng)速數(shù)據(jù)均為平均值。
表1 數(shù)據(jù)樣例Table 1 Samples of raw data
由于不同變量采用不同單位,為了便于不同輸入變量的復(fù)合計算及模型訓(xùn)練,需對輸入數(shù)據(jù)進(jìn)行歸一化處理,即
從而使其映射在[0,1]范圍內(nèi),其中x*表示歸一化后的數(shù)據(jù),x為原始數(shù)據(jù),xmin和xmax分別表示相應(yīng)數(shù)據(jù)集合內(nèi)的最小值和最大值。
經(jīng)預(yù)處理和整理后得到的數(shù)據(jù)集共6000條,將其劃分為30個數(shù)據(jù)集合,每個數(shù)據(jù)集包含200條數(shù)據(jù)。數(shù)據(jù)集按9:1的比例劃分訓(xùn)練集和測試集,即27個數(shù)據(jù)集共5400條數(shù)據(jù)用于模型訓(xùn)練,三個數(shù)據(jù)集共600條數(shù)據(jù)用于模型測試。在不同網(wǎng)絡(luò)結(jié)構(gòu)中使用的數(shù)據(jù)集及劃分方法相同。
1986年,Rumelhart等[14]提出反向誤差傳播(BP)學(xué)習(xí)算法。該算法利用輸出后的誤差來估計輸出層的直接前導(dǎo)層誤差,再以此估計更前一層的誤差,如此反復(fù)可獲得各層的誤差估計。采用BP學(xué)習(xí)算法的前饋型神經(jīng)網(wǎng)絡(luò)即BP神經(jīng)網(wǎng)絡(luò)(BPNN),其基本結(jié)構(gòu)如圖2所示。BPNN是具有很強(qiáng)非線性映射能力的柔性網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)中包含輸入層、隱藏層、輸出層,中間層數(shù)和各層的神經(jīng)元個數(shù)可根據(jù)模型的需要和網(wǎng)絡(luò)訓(xùn)練情況進(jìn)行調(diào)整。BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程包含工作信號正向傳播運(yùn)算和誤差信號通過傳播反饋調(diào)節(jié)網(wǎng)絡(luò)兩個部分,這兩個過程交替迭代進(jìn)行以完成網(wǎng)絡(luò)功能。
圖2 BPNN結(jié)構(gòu)圖Fig.2 Structure of BPNN
BPNN典型網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。正向傳播時,樣本數(shù)據(jù)由輸入層傳入,經(jīng)隱藏層逐層處理后流向輸出層。在輸出層判斷實(shí)際輸出與期望輸出的關(guān)系,若取值不符,則進(jìn)入誤差的反向傳播環(huán)節(jié)。反向傳播時,將輸出通過隱藏層向輸入層逐層反向傳輸,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號,依據(jù)誤差信號對權(quán)值進(jìn)行修正。網(wǎng)絡(luò)權(quán)值修正的過程可使最終的實(shí)際輸出值向期望值無限接近,直至滿足預(yù)定精度。
本研究使用的BPNN網(wǎng)絡(luò)采用經(jīng)典三層網(wǎng)絡(luò)結(jié)構(gòu)。輸入層的輸入向量包含四個氣象數(shù)據(jù)值及大氣信道衰減系數(shù)值;隱藏層采用單層結(jié)構(gòu),層內(nèi)含有30個神經(jīng)元;輸出層為單一輸出,學(xué)習(xí)率參數(shù)設(shè)置為adaptive模式。
1997年Hochreiter和Schmidhuber[15]提出的長短時記憶網(wǎng)絡(luò)(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種改進(jìn)類型,適用于時序數(shù)據(jù)的分類、處理、預(yù)測。LSTM網(wǎng)絡(luò)的外部結(jié)構(gòu)與傳統(tǒng)RNN結(jié)構(gòu)相同,但其隱藏層的改變可以有效解決RNN網(wǎng)絡(luò)訓(xùn)練時可能會出現(xiàn)的梯度消失、梯度爆炸等問題,LSTM結(jié)構(gòu)如圖3所示。
圖3 LSTM結(jié)構(gòu)圖Fig.3 Structure of LSTM
典型的LSTM網(wǎng)絡(luò)單元包含輸入門、輸出門、遺忘門。其中遺忘門會根據(jù)當(dāng)前時刻輸入和上一時刻輸出決定記憶數(shù)據(jù)中的哪一部分需要被丟棄,這一環(huán)節(jié)是LSTM與傳統(tǒng)RNN網(wǎng)絡(luò)的重要區(qū)別;輸入門根據(jù)當(dāng)前時刻輸入和上一時刻輸出對上一時刻單元狀態(tài)進(jìn)行數(shù)據(jù)更新,形成新的單元狀態(tài);輸出門則根據(jù)最新單元狀態(tài)、上一時刻輸出和當(dāng)前時刻輸入決定該時刻輸出值。具體公式推導(dǎo)過程參見文獻(xiàn)[16]。
本文選擇的LSTM網(wǎng)絡(luò)模型包含雙層LSTM網(wǎng)絡(luò),每層含有100個神經(jīng)元,采用均方誤差作為損失函數(shù)、tanh函數(shù)為激活函數(shù)并在每層后加入Dropout層,從而防止數(shù)據(jù)過擬合。
作為LSTM最為成功的變體之一,GRU網(wǎng)絡(luò)是在LSTM基礎(chǔ)上進(jìn)行簡化得到的,其保留了與LSTM相近的效果,GRU基本網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示[17]。GRU網(wǎng)絡(luò)單元將LSTM網(wǎng)絡(luò)單元的三個門整合為兩個門,使用重置門控制前序隱藏狀態(tài)的保留,實(shí)現(xiàn)了LSTM中遺忘門和輸入門的信息控制。
圖4 GRU結(jié)構(gòu)圖Fig.4 Structure of GRU
本實(shí)驗(yàn)中GRU網(wǎng)絡(luò)使用Keras框架下RNN模塊中的GRU類,初始化定義隱藏層數(shù)為256,使用adam優(yōu)化器,并同樣添加Dropout層以防止數(shù)據(jù)過擬合,數(shù)據(jù)輸入輸出格式與BPNN網(wǎng)絡(luò)相同。
為了有效衡量模型的預(yù)測性能,本研究采用擬合度(R2)、均方根誤差(ERMS)、平均絕對誤差(EMA)三個指標(biāo)作為性能評價指標(biāo)。各評價指標(biāo)的具體定義為
式中:yi為實(shí)際數(shù)據(jù)值,為數(shù)據(jù)集實(shí)際數(shù)據(jù)平均值,為預(yù)測數(shù)據(jù)值。
上述指標(biāo)中R2表征自變量與因變量之間的整體擬合度,數(shù)值越接近1,說明預(yù)測值與實(shí)際值擬合程度越高,模型性能越好。ERMS能夠反映測量的精密度,EMA表征數(shù)據(jù)的離散程度,上述兩個指標(biāo)數(shù)值越小,則模型的整體性能越好。
利用前文預(yù)處理后的數(shù)據(jù)和網(wǎng)絡(luò)模型分別進(jìn)行訓(xùn)練可以得到最終預(yù)測網(wǎng)絡(luò),采用單步預(yù)測方法并利用測試集數(shù)據(jù)進(jìn)行預(yù)測,分別計算三種預(yù)測網(wǎng)絡(luò)的評價指標(biāo),用以比較分析。
圖5所示為三種預(yù)測網(wǎng)絡(luò)預(yù)測結(jié)果與測試集實(shí)際數(shù)據(jù)分布的散點(diǎn)密度圖,圖中數(shù)據(jù)為歸一化后的數(shù)據(jù),預(yù)測數(shù)據(jù)未進(jìn)行數(shù)據(jù)還原。需要說明的是真實(shí)的原始數(shù)據(jù)存在如圖6所示的峰值,且峰值處數(shù)據(jù)變化顯著,即此時大氣條件顯著惡化,通信性能嚴(yán)重衰減。為了保證實(shí)驗(yàn)數(shù)據(jù)的真實(shí)性和實(shí)驗(yàn)結(jié)果對現(xiàn)實(shí)情況的有效表征,未對這部分?jǐn)?shù)據(jù)進(jìn)行剔除,導(dǎo)致大部分?jǐn)?shù)據(jù)處于相對低位,這也是圖5中散點(diǎn)主要集中于低位的原因。從散點(diǎn)圖分布及密度來看,BPNN網(wǎng)絡(luò)在數(shù)據(jù)處于相對平穩(wěn)的低取值時預(yù)測性能良好,但部分?jǐn)?shù)據(jù)存在明顯偏離。LSTM和GRU網(wǎng)絡(luò)預(yù)測結(jié)果整體分布較好。LSTM網(wǎng)絡(luò)在個別尖峰數(shù)據(jù)點(diǎn)時存在較大誤差,GRU網(wǎng)絡(luò)出現(xiàn)了個別極大偏差數(shù)據(jù),該數(shù)據(jù)點(diǎn)將會對性能指標(biāo)的評價產(chǎn)生較大影響。
圖5 預(yù)測值與真實(shí)值的散點(diǎn)密度。(a)BPNN;(b)LSTM;(c)GURFig.5 Scatter diagram of predictive and actual values.(a)BPNN;(b)LSTM;(c)GUR
根據(jù)圖6中對單組數(shù)據(jù)的預(yù)測數(shù)據(jù)和實(shí)際數(shù)據(jù)折線圖的比對可以發(fā)現(xiàn),三種網(wǎng)絡(luò)預(yù)測結(jié)果的趨勢與實(shí)際數(shù)據(jù)趨勢基本相似,BPNN網(wǎng)絡(luò)在低取值部分的數(shù)據(jù)擬合程度較好,但在峰值處存在明顯誤差;LSTM網(wǎng)絡(luò)在低取值部分?jǐn)?shù)據(jù)相對誤差較大,但由于數(shù)據(jù)值本身較小,因此絕對誤差較小,整體擬合度較高;GUR網(wǎng)絡(luò)對于峰值處數(shù)據(jù)的預(yù)測能力明顯較好,使得整體網(wǎng)絡(luò)性能表現(xiàn)更佳。
圖6 預(yù)測值與真實(shí)值曲線擬合。(a)BPNN;(b)LSTM;(c)GURFig.6 Fitting of predictive and actual values.(a)BPNN;(b)LSTM;(c)GUR
表2中給出了三種網(wǎng)絡(luò)模型評價指標(biāo)的計算結(jié)果,其中R2與散點(diǎn)圖中數(shù)據(jù)密度及數(shù)據(jù)分布結(jié)果一致,BPNN網(wǎng)絡(luò)的預(yù)測性能與LSTM和GRU網(wǎng)絡(luò)相比相對較差,但是仍然能夠?qū)崿F(xiàn)80%以上的數(shù)據(jù)擬合度。就ERMS和EMA兩個指標(biāo)來看,BPNN網(wǎng)絡(luò)的整體性能也相對較差,LSTM和GRU網(wǎng)絡(luò)性能基本相同,其中GRU網(wǎng)絡(luò)的ERMS較大,很大程度上受到了個別離散數(shù)據(jù)點(diǎn)的影響,若對存在極大偏離的數(shù)據(jù)點(diǎn)進(jìn)行修正,則GRU網(wǎng)絡(luò)的整體性能都將稍優(yōu)于LSTM網(wǎng)絡(luò)。
表2 預(yù)測網(wǎng)絡(luò)性能指標(biāo)Table 2 Evaluation results of prediction network
綜合數(shù)據(jù)分布和評價指標(biāo)可知,三種網(wǎng)絡(luò)結(jié)構(gòu)均能實(shí)現(xiàn)量子信號大氣衰減系數(shù)的有效預(yù)測,且均能夠獲得80%以上的數(shù)據(jù)擬合,LSTM及GRU網(wǎng)絡(luò)具有整體更為良好的性能。在大氣條件相對穩(wěn)定的情況下,即數(shù)值處于相對平穩(wěn)的低位時可使用BPNN網(wǎng)絡(luò)作為預(yù)測手段。對于急劇變化的數(shù)據(jù)點(diǎn),BPNN預(yù)測誤差雖然較大,但是仍能對突變情況起到預(yù)警作用。當(dāng)大氣條件處在波動相對較大的情況下時,應(yīng)考慮使用GUR網(wǎng)絡(luò),同時需要通過進(jìn)一步的訓(xùn)練避免個別極大偏差數(shù)據(jù)的出現(xiàn),以獲得更好性能。
三種網(wǎng)絡(luò)模型的預(yù)測能力均需要進(jìn)一步優(yōu)化,特別是對部分偏離數(shù)據(jù)和尖峰值的預(yù)測能力需要明顯改善,從而獲得更佳的預(yù)測結(jié)果。同時可以在優(yōu)化數(shù)據(jù)集、提高時間密度的基礎(chǔ)上采用多步預(yù)測方法,從而更好地表征信道變化過程的時間連續(xù)性。
所提出方案可以為通信系統(tǒng)優(yōu)化提供數(shù)據(jù)支持,這里以誘騙態(tài)MDI-QKD量子通信系統(tǒng)光源優(yōu)化為例進(jìn)行簡介。根據(jù)仿真分析及相關(guān)實(shí)驗(yàn),信號態(tài)、誘騙態(tài)光強(qiáng)的設(shè)置對誘騙態(tài)MDI-QKD系統(tǒng)的密鑰生成有一定影響,在一定條件下存在最優(yōu)化的光源選擇方案[18,19]。在光纖信道中,一般認(rèn)為影響光源強(qiáng)度選擇的重要因素是信道長度,其本質(zhì)上影響的是通信鏈路的衰減,因此在空間通信系統(tǒng)中對大氣信道衰減系數(shù)進(jìn)行預(yù)測,結(jié)合空間信道長度可以有效預(yù)估空間信道衰減,并有針對性地對信號態(tài)、誘騙態(tài)光強(qiáng)進(jìn)行調(diào)整,從而實(shí)現(xiàn)系統(tǒng)的實(shí)時優(yōu)化。
在大氣信道條件實(shí)時變化的背景下,針對量子信號大氣衰減系數(shù)實(shí)時變化情況提出了基于深度學(xué)習(xí)的預(yù)測方式,分別使用BPNN、LSTM、GRU三種深度學(xué)習(xí)算法進(jìn)行了實(shí)驗(yàn)驗(yàn)證。對三種深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練和測試證明了利用深度學(xué)習(xí)方法預(yù)測量子信號大氣衰減系數(shù)方案的可行性和有效性,同時通過對比可以發(fā)現(xiàn):BPNN網(wǎng)絡(luò)性能相對較差,LSTM和GRU具有更好表現(xiàn),擬合度可以達(dá)87%以上。依據(jù)實(shí)驗(yàn)結(jié)果,在后續(xù)實(shí)踐應(yīng)用中可以選擇LSTM或GRU網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)預(yù)測,并進(jìn)行進(jìn)一步的數(shù)據(jù)集和網(wǎng)絡(luò)優(yōu)化。本研究所提出的預(yù)測方法和實(shí)驗(yàn)結(jié)果為包括光源參數(shù)等系統(tǒng)參數(shù)的預(yù)先優(yōu)化調(diào)整提供了數(shù)據(jù)支持,將針對給定信道條件的優(yōu)化方案有效拓展為實(shí)時、動態(tài)的優(yōu)化方案,為后續(xù)工程化應(yīng)用打下了基礎(chǔ)。