宋兆涵,張德智
(中國運(yùn)載火箭技術(shù)研究院,北京 100076)
隨著航天技術(shù)的發(fā)展,空間飛行器組網(wǎng)通信模式已經(jīng)逐步成為了新的研究熱點(diǎn)[1]??臻g飛行器自組織網(wǎng)絡(luò)具有極強(qiáng)的自組織、自配置和管理能力,以適應(yīng)通信任務(wù)的變化,增強(qiáng)網(wǎng)絡(luò)靈活性[2]。當(dāng)前多數(shù)空間飛行器數(shù)據(jù)鏈采用預(yù)先分配時(shí)隙的TDMA 協(xié)議和固定時(shí)間基準(zhǔn)終端進(jìn)行組網(wǎng)通信,以Link16 數(shù)據(jù)鏈為例[3],要建立網(wǎng)絡(luò)同步,系統(tǒng)必須單獨(dú)設(shè)定一個(gè)終端為網(wǎng)絡(luò)提供時(shí)間基準(zhǔn),這個(gè)終端被稱為網(wǎng)絡(luò)時(shí)間基準(zhǔn)(Network Time Reference,NTR)。由這個(gè)選定終端保持的時(shí)間定義為系統(tǒng)網(wǎng)絡(luò)時(shí)間。以這個(gè)時(shí)間為基準(zhǔn),再來定義時(shí)隙的起點(diǎn)與終點(diǎn),并確保多重網(wǎng)絡(luò)中“時(shí)分”的校準(zhǔn)[4]。網(wǎng)絡(luò)時(shí)間基準(zhǔn)終端周期性地發(fā)送入網(wǎng)報(bào)文,幫助系統(tǒng)其他終端與網(wǎng)絡(luò)同步并獲得系統(tǒng)時(shí)間[5]。在此過程中,若時(shí)間基準(zhǔn)終端受到打擊,喪失通信能力,則組網(wǎng)過程失敗[6]。因此,單獨(dú)設(shè)定某一飛行器終端作為NTR 無法保證網(wǎng)絡(luò)建立過程的可靠性[7]。
同時(shí),對于臨時(shí)收到組網(wǎng)要求,需要快速建立自組織網(wǎng)絡(luò)協(xié)同執(zhí)行任務(wù)的空間飛行器網(wǎng)絡(luò),預(yù)先分配時(shí)隙的方式顯然并不適用[8]。因此,本文設(shè)計(jì)了一種無初始時(shí)隙分配信息且無固定NTR 的飛行器初始組網(wǎng)策略,通過節(jié)點(diǎn)競爭占用時(shí)隙,完成網(wǎng)絡(luò)自主的初始時(shí)隙分配,保證網(wǎng)絡(luò)中各節(jié)點(diǎn)掌握網(wǎng)絡(luò)拓?fù)湫畔?,后續(xù)進(jìn)行穩(wěn)定通信。在此過程中,節(jié)點(diǎn)之間通過信息交互快速完成時(shí)鐘同步建立網(wǎng)絡(luò)通信鏈路,縮短了組網(wǎng)時(shí)間,提高了組網(wǎng)靈活性。
由于各空間飛行器節(jié)點(diǎn)在進(jìn)入網(wǎng)絡(luò)前并未預(yù)先完成時(shí)間同步和時(shí)隙分配,因此節(jié)點(diǎn)需通過競爭的方式占用時(shí)隙。在組網(wǎng)過程中,各節(jié)點(diǎn)通過競爭過程完成時(shí)幀周期內(nèi)時(shí)隙無沖突分配和時(shí)間同步,直至所有節(jié)點(diǎn)均可穩(wěn)定占用時(shí)隙進(jìn)行通信,認(rèn)為組網(wǎng)過程完成。
組網(wǎng)開始時(shí),節(jié)點(diǎn)初始化為未分配狀態(tài),持續(xù)監(jiān)聽信道,節(jié)點(diǎn)存儲時(shí)隙分配表為空,因此時(shí)幀中所有時(shí)隙均為空閑時(shí)隙??臻e時(shí)隙到來時(shí),節(jié)點(diǎn)有一定的概率P 對當(dāng)前時(shí)隙發(fā)起競爭,廣播自身拓?fù)湫畔⒑蜁r(shí)隙占用信息。
由于網(wǎng)絡(luò)中無時(shí)間基準(zhǔn)終端(NTR),節(jié)點(diǎn)在廣播時(shí)將自身時(shí)刻信息寫入廣播信息告知其他節(jié)點(diǎn),節(jié)點(diǎn)根據(jù)收到的時(shí)刻信息調(diào)整自身時(shí)間,直至與網(wǎng)絡(luò)中最晚時(shí)刻信息保持一致。由于時(shí)幀起始時(shí)刻為節(jié)點(diǎn)已知信息,因此實(shí)際時(shí)刻信息最晚的節(jié)點(diǎn)最早進(jìn)入組網(wǎng)進(jìn)程。在此過程中,不存在一個(gè)節(jié)點(diǎn)i 作為網(wǎng)絡(luò)中的NTR,其余節(jié)點(diǎn)不需等待節(jié)點(diǎn)i 周期性廣播完成時(shí)間同步,而是通過節(jié)點(diǎn)在競爭過程中進(jìn)行信息交互,不斷向較晚時(shí)刻信息進(jìn)行調(diào)整,直至完成時(shí)間同步。若時(shí)刻信息最晚的節(jié)點(diǎn)遭受打擊,只要其時(shí)刻信息已轉(zhuǎn)發(fā)至網(wǎng)絡(luò)中其他節(jié)點(diǎn),則此時(shí)刻信息已成為網(wǎng)絡(luò)中的時(shí)間基準(zhǔn),其余節(jié)點(diǎn)依舊可以同步至此時(shí)刻,網(wǎng)絡(luò)節(jié)點(diǎn)時(shí)間同步可照常進(jìn)行;若其遭受打擊前尚未廣播時(shí)刻信息,則網(wǎng)絡(luò)時(shí)間同步至剩余節(jié)點(diǎn)中最晚時(shí)刻。時(shí)隙競爭流程如圖1 所示。
圖1 節(jié)點(diǎn)競爭時(shí)隙流程圖
各節(jié)點(diǎn)在監(jiān)聽過程中,根據(jù)收到的廣播信息完成時(shí)間同步,同時(shí)更新自身存儲的網(wǎng)絡(luò)拓?fù)湫畔⒈砗蜁r(shí)隙分配表。本文所討論的飛行器自組網(wǎng)場景中,所有飛行器節(jié)點(diǎn)相互獨(dú)立,沒有主從之分,各節(jié)點(diǎn)獨(dú)立發(fā)起競爭,因此可能存在多個(gè)節(jié)點(diǎn)在同一空閑時(shí)隙同時(shí)廣播占用信息[9],因此需建立沖突判決機(jī)制。
若多個(gè)節(jié)點(diǎn)同時(shí)對當(dāng)前時(shí)隙發(fā)起競爭,當(dāng)前節(jié)點(diǎn)各自的一跳鄰節(jié)點(diǎn)獲得不同的時(shí)隙占用信息,并在不同時(shí)隙分別廣播告知第三方節(jié)點(diǎn),第三方節(jié)點(diǎn)先后收到?jīng)_突占用信息后采用沖突判決機(jī)制判定時(shí)隙歸屬,并更新時(shí)隙分配表,將判決結(jié)果廣播告知網(wǎng)絡(luò)中其他節(jié)點(diǎn),從而避免時(shí)隙重復(fù)占用。沖突避免機(jī)制如圖2 所示。
圖2 普通沖突避免機(jī)制流程圖
當(dāng)多個(gè)節(jié)點(diǎn)同時(shí)發(fā)起競爭,且網(wǎng)絡(luò)中其他節(jié)點(diǎn)均由于同時(shí)收到多個(gè)沖突信號或未收到廣播信息而無法更新時(shí)隙分配表,則當(dāng)前時(shí)隙始終被兩節(jié)點(diǎn)同時(shí)占用,無法完成所有節(jié)點(diǎn)無沖突時(shí)隙分配,將此沖突稱為導(dǎo)致組網(wǎng)過程失敗的絕對沖突。出現(xiàn)絕對沖突的條件為多個(gè)節(jié)點(diǎn)同時(shí)發(fā)起競爭,具有相同的子節(jié)點(diǎn),同時(shí)不存在第三方節(jié)點(diǎn)對時(shí)隙分配進(jìn)行判決。當(dāng)絕對沖突發(fā)生,同時(shí)申請時(shí)隙的節(jié)點(diǎn)會持續(xù)在相同子節(jié)點(diǎn)發(fā)出的廣播信息中檢索到時(shí)隙占用失敗?;诖颂攸c(diǎn),為避免出現(xiàn)絕對沖突,需令節(jié)點(diǎn)對收到的廣播信息中對時(shí)隙占用是否成功進(jìn)行判決,若持續(xù)10 次在同一節(jié)點(diǎn)的廣播信息中檢索到占用失敗,則清空時(shí)隙占用信息,重新對其他時(shí)隙發(fā)起競爭。因此,算法加入判決機(jī)制,如圖3 所示。
圖3 絕對沖突避免機(jī)制流程圖
根據(jù)馬爾可夫決策過程<S,A,P,R,γ>建立數(shù)學(xué)模型,獲取網(wǎng)絡(luò)節(jié)點(diǎn)時(shí)隙分配狀態(tài)的最優(yōu)策略,從而計(jì)算出最優(yōu)競爭概率。
節(jié)點(diǎn)競爭過程中,隨著網(wǎng)絡(luò)中已成功占用時(shí)隙的節(jié)點(diǎn)數(shù)增長,抽象出馬爾可夫有限狀態(tài) 集:S={s1,s2,s3,…,sn}。其中n 為網(wǎng)絡(luò)中所有節(jié)點(diǎn)數(shù)目,狀態(tài)si表示網(wǎng)絡(luò)中有i個(gè)時(shí)隙被成功占用,狀態(tài)sn為最終狀態(tài)。
節(jié)點(diǎn)相互獨(dú)立地對時(shí)隙發(fā)起競爭,定義狀態(tài)轉(zhuǎn)換圖中有限動作集:A={a1,a2,a3,a4},給定狀態(tài)動作分布如圖4所示。
圖4 給定狀態(tài)動作分布
動作分布策略π 定義如下:
式中,a1為無沖突競爭行為,a2為發(fā)生普通沖突競爭行為,a3為無競爭行為,a4為發(fā)生絕對沖突競爭行為。
由動作集和動作對組網(wǎng)時(shí)間的影響,定義馬爾可夫決策過程獎勵函數(shù)如下:
以狀態(tài)值函數(shù)表征競爭組網(wǎng)的效率,狀態(tài)值函數(shù)取最大時(shí),組網(wǎng)效率最高,狀態(tài)值函數(shù)貝爾曼最優(yōu)方程為:
式中,取折扣因子γ=1/2,且:
經(jīng)過價(jià)值迭代算法易得到當(dāng)最優(yōu)狀態(tài)值收斂時(shí),輸出最優(yōu)策略為π*={a1,a1,a1,…,a1},組網(wǎng)效率最高。
為滿足組網(wǎng)效率最高,需保證時(shí)幀周期內(nèi)被成功占用的時(shí)隙狀態(tài)按照最優(yōu)策略π*進(jìn)行轉(zhuǎn)移,因此需求得最優(yōu)競爭概率p,使動作a1分布概率達(dá)到最大。狀態(tài)以動作a1進(jìn)行轉(zhuǎn)移,可推論節(jié)點(diǎn)發(fā)起競爭的概率p 隨著剩余節(jié)點(diǎn)數(shù)目的減少而增大,且與剩余節(jié)點(diǎn)數(shù)目的倒數(shù)呈線性相關(guān),設(shè)系數(shù)為k,則:
利用MATLAB 對動作a1的分布概率P 與k 值的關(guān)系進(jìn)行分析:
得到結(jié)果如圖5 所示,k=1 時(shí),動作a1分布概率達(dá)到最大。因此,根據(jù)馬爾可夫決策模型分析和理論計(jì)算,可得到最優(yōu)競爭概率p 理論值為:
圖5 k 值與動作概率關(guān)系圖
本文采用OPNET 仿真平臺,搭建網(wǎng)絡(luò)模型對組網(wǎng)策略進(jìn)行仿真分析,仿真參數(shù)設(shè)置如表1 所示。
表1 算法運(yùn)行時(shí)間比較
在高速移動的空間網(wǎng)絡(luò)中,飛行器間是否能實(shí)現(xiàn)快速組網(wǎng)是衡量自組網(wǎng)中媒體接入?yún)f(xié)議性能的一項(xiàng)非常重要的指標(biāo)。
通過OPNET 對組網(wǎng)過程進(jìn)行仿真,網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)目為10,改變競爭概率系數(shù)k 值,得到不同競爭概率下的組網(wǎng)完成時(shí)間的5 次平均值,仿真結(jié)果如圖6 所示。可以看出,當(dāng)節(jié)點(diǎn)競爭概率與剩余可發(fā)起競爭的節(jié)點(diǎn)數(shù)目呈線性相關(guān),且斜率值k 在1~1.5 之間時(shí),組網(wǎng)時(shí)間最短,約140 ms,組網(wǎng)效率最高,與理論值k=1 大致相符。
組網(wǎng)過程開始前,節(jié)點(diǎn)間初始時(shí)刻可能存在一定程度的誤差,因此在組網(wǎng)過程中,需對節(jié)點(diǎn)時(shí)間進(jìn)行同步。在節(jié)點(diǎn)初始時(shí)刻相差較大的場景,最早進(jìn)入組網(wǎng)進(jìn)程的節(jié)點(diǎn)可優(yōu)先發(fā)起多次競爭,其余節(jié)點(diǎn)處于靜默狀態(tài),收到此節(jié)點(diǎn)信息后迅速調(diào)整時(shí)差完成時(shí)間同步,時(shí)間同步完成時(shí)間基本一定。當(dāng)節(jié)點(diǎn)間時(shí)差小于1 s 時(shí),時(shí)間同步過程以時(shí)隙為5 ms 為單位精細(xì)調(diào)整,仿真結(jié)果如圖7所示。節(jié)點(diǎn)1 存儲最晚時(shí)刻信息,縱坐標(biāo)為其余節(jié)點(diǎn)與節(jié)點(diǎn)1 時(shí)差絕對值。隨仿真時(shí)間的增加,以2 s 時(shí)刻作為第一個(gè)時(shí)幀起始時(shí)間,各節(jié)點(diǎn)在組網(wǎng)過程中不斷調(diào)整時(shí)差,于0.14 s 后全部完成時(shí)間校準(zhǔn),與基準(zhǔn)時(shí)間的時(shí)差均調(diào)整為0。
圖7 時(shí)間同步過程
在圖7 對應(yīng)仿真參數(shù)基礎(chǔ)上,在組網(wǎng)開始0.04 s 時(shí)刻摧毀節(jié)點(diǎn)1。由圖8(a)看出,節(jié)點(diǎn)1 被摧毀前,尚未發(fā)送時(shí)刻信息,因此網(wǎng)絡(luò)時(shí)間同步至剩余節(jié)點(diǎn)中最晚時(shí)刻,網(wǎng)絡(luò)節(jié)點(diǎn)正常完成時(shí)間同步。若在組網(wǎng)開始0.1 s 時(shí)刻摧毀節(jié)點(diǎn)1,由圖8(b)看出,節(jié)點(diǎn)1 被摧毀前,其時(shí)刻信息已轉(zhuǎn)發(fā)至節(jié)點(diǎn)2 和節(jié)點(diǎn)10,則節(jié)點(diǎn)1 時(shí)刻信息已進(jìn)入網(wǎng)絡(luò)成為時(shí)間基準(zhǔn),因此網(wǎng)絡(luò)時(shí)間可以正常同步至此時(shí)刻。
圖8 摧毀初始時(shí)間基準(zhǔn)節(jié)點(diǎn)
仿真結(jié)果表明,即使在組網(wǎng)過程中摧毀網(wǎng)絡(luò)中初始的時(shí)間基準(zhǔn)節(jié)點(diǎn),快速組網(wǎng)和時(shí)間同步依舊可以正常完成,證明了無固定時(shí)鐘基準(zhǔn)模式組網(wǎng)策略的靈活性和安全性。
圖9 顯示了網(wǎng)絡(luò)拓?fù)浣M網(wǎng)完成時(shí)間隨節(jié)點(diǎn)間時(shí)差范圍的變化,可以看出,隨節(jié)點(diǎn)數(shù)目的增加,網(wǎng)絡(luò)組網(wǎng)時(shí)間逐漸增加。同時(shí),隨節(jié)點(diǎn)時(shí)差范圍增加,時(shí)間同步完成時(shí)間趨于一定,組網(wǎng)完成時(shí)間逐漸趨于穩(wěn)定,與上述研究相符。由圖可以看出,本文提出的快速組網(wǎng)策略滿足6~10 個(gè)節(jié)點(diǎn)數(shù)目的空間飛行器組網(wǎng)需求,組網(wǎng)時(shí)間在400 ms 以內(nèi)。
圖9 組網(wǎng)完成時(shí)間與時(shí)差、節(jié)點(diǎn)數(shù)目的關(guān)系
本文設(shè)計(jì)了一種無初始時(shí)隙分配和無固定時(shí)間基準(zhǔn)終端的分布式空間飛行器自組網(wǎng)的初始組網(wǎng)策略,主要實(shí)現(xiàn)了飛行器網(wǎng)絡(luò)快速組網(wǎng)和時(shí)鐘同步。本文提出了競爭式組網(wǎng)策略,建立馬爾可夫決策模型計(jì)算出最優(yōu)競爭概率,并進(jìn)行了仿真驗(yàn)證,驗(yàn)證了組網(wǎng)效率最高時(shí)節(jié)點(diǎn)競爭概率與理論值大致相符。同時(shí)提出無NTR 時(shí)鐘同步策略,仿真結(jié)果表明,本文提出的時(shí)間同步策略提高了飛行器組網(wǎng)過程中網(wǎng)絡(luò)的抗毀性和靈活性。因此,本文研究的快速組網(wǎng)策略適用于協(xié)同組網(wǎng)任務(wù)具有臨時(shí)性、可靠性要求高的空間飛行器自組網(wǎng)。