鄭小鵬,王小輝,陳春燕
(中國運載火箭技術研究院研究發(fā)展部,北京 100076)
綜合電子系統(tǒng)重構是指在系統(tǒng)資源或運行環(huán)境故障影響下,為保障系統(tǒng)功能和性能正常,重新配置系統(tǒng)的軟硬件資源的過程。綜合電子系統(tǒng)邏輯映射具有多樣性和不確定性[1],如何在保證系統(tǒng)正常重構情況下,在滿足系統(tǒng)的可靠性和安全性要求下,提高系統(tǒng)的資源利用率和架構靈活性,已成為綜合電子系統(tǒng)的重要研究方面。
目前,對綜合電子系統(tǒng)重構的研究主要包含系統(tǒng)重構配置、重構機制、重構模型的建立與優(yōu)化、重構藍圖的設計與生成等[2-4]。Chu[5]等提出一種在考慮功能冗余要求的情況下優(yōu)化綜合電子系統(tǒng)配置方案的方法,針對具有功能冗余要求的通用綜合電子系統(tǒng),給出了配置方案模型及其相關的可調度性和可靠性約束。Fontoura[6]等提出通過重構狀態(tài)空間的轉換,將增強AADL 規(guī)范的故障模型與重構邏輯相結合,來表示容錯能力。羅慶[7]等提出一種基于改進Q 學習的重構藍圖生成方法,綜合考慮重構影響、重構時間、重構降級以及負載均衡等多優(yōu)化目標。綜上所述,國內外目前很少對于綜合電子系統(tǒng)重構時間分析的研究,求解綜合電子系統(tǒng)重構時間的方法大多來自仿真實驗,這使得綜合電子系統(tǒng)重構的可靠性分析面臨著安全隱患。
本文通過對綜合電子系統(tǒng)、系統(tǒng)重構和重構時間進行建模,依據(jù)對綜合電子系統(tǒng)架構、重構策略和重構過程的研究,搭建綜合電子系統(tǒng)可重構平臺,基于理論基礎和重構驗證平臺對重構時間進行分析和驗證。
根據(jù)綜合電子系統(tǒng)的組成和特點,對綜合電子系統(tǒng)軟硬件進行建模,描述在系統(tǒng)硬件上的軟件的配置模型,分析故障觸發(fā)下的系統(tǒng)重構,建立重構時間模型,設計應用遷移優(yōu)化算法。
綜合電子系統(tǒng)由系統(tǒng)硬件和系統(tǒng)軟件組成。為實現(xiàn)可重構綜合電子系統(tǒng),在系統(tǒng)上搭載多個處理器,實現(xiàn)多核心并行處理機制。
1.1.1 系統(tǒng)硬件模型
綜合電子系統(tǒng)的核心組件包括處理器、存儲器、總線和外圍設備等。對系統(tǒng)中的處理器和總線建模,令處理器為C,總線為B,系統(tǒng)內核心硬件集合表示為:
處理器集合表示為:
每個處理器包含多個核心,處理器核心集合表示為:
系統(tǒng)總線是處理器間數(shù)據(jù)傳輸?shù)耐ǖ?,主要包含總線寬度和傳輸帶寬,表示為:
1.1.2 系統(tǒng)軟件模型
綜合電子系統(tǒng)包含一系列軟件應用,表示為:
相關屬性表示為:
式中,Acmd代表軟件可執(zhí)行程序大小,Adata代表軟件運行時數(shù)據(jù)所需存儲空間,Areq代表軟件優(yōu)先級。
為保證軟件正常運行,將軟件部署在處理器核心上,部署關系表示為:
系統(tǒng)配置是軟硬件間建立關系的映射,表示為:
其中,ACi表示應用Appi的部署情況,SCi表示系統(tǒng)的配置。
綜合電子系統(tǒng)的故障類型主要有處理器故障和處理器核心故障,處理器Ci故障表示為Fi,處理器Ci的核心CiPj故障表示為,系統(tǒng)故障定義為Fij:
綜合電子系統(tǒng)重構遷移模型表示為系統(tǒng)在故障觸發(fā)下從一個配置運行狀態(tài)遷移到新的配置運行狀態(tài),定義為:
其中RCi代表系統(tǒng)重構藍圖,SCj表示系統(tǒng)在故障發(fā)生前的運行狀態(tài),SCk表示在故障發(fā)生后系統(tǒng)進入的狀態(tài)。當系統(tǒng)在狀態(tài)SCj下發(fā)生不可恢復的故障,進入到故障狀態(tài)SCfault,圖1 表示系統(tǒng)10 種運行狀態(tài)對應的16 種重構藍圖的狀態(tài)遷移圖。
圖1 系統(tǒng)遷移圖
若處理器內某個核心發(fā)生故障,可以由其他核心承擔故障核心應用的運行,核心間應用遷移相對簡單,包含應用撤銷和應用綁定,核間重構時間模型表示為:
其中,t(AR)表示應用撤銷需要的時間,t(AB)表示應用綁定需要的時間。
若系統(tǒng)內某處理器發(fā)生故障,需要將該處理器上部署的應用遷移到其他處理器上,在遷移過程中產生應用撤銷、應用加載、應用綁定及狀態(tài)同步等動作。處理器間重構時間模型表示為:
其中,t(AL)表示故障應用重新加載需要的時間,t(AD)表示故障應用恢復需要的時間。
系統(tǒng)重構包含了核間重構和處理器間重構,其重構時間的長短直接由遷移過程規(guī)劃決定,為了減少遷移產生時間,不同處理器間通常采用并行遷移方式。執(zhí)行優(yōu)化算法會產生兩個集合,一個是可并行遷移的應用Aen,另一個是只能單獨遷移的應用Adis。其算法步驟如下:
(1)獲得需要遷移的應用列表;
(2)依據(jù)并行遷移屬性對應用分類,并放入集合和集合中;
(3)對于集合,依據(jù)硬件資源約束將同時遷移的應用劃分為一組,最終將分為若干可并行遷移的應用組,每一個應用組表示為:
(4)探索最小遷移策略:驗證每個可并行遷移應用組的可行性,并進行調整;
(5)只能單獨遷移的應用按順序執(zhí)行,得到最終優(yōu)化后的最短時延遷移策略最優(yōu)解集:
最優(yōu)解集中方括號內表示可并行遷移應用,最后的單獨應用表示順序遷移應用。
為驗證系統(tǒng)重構過程對系統(tǒng)正常運行的影響,本文搭建了綜合電子系統(tǒng)重構驗證平臺,通過模擬系統(tǒng)運行中產生的故障,計算系統(tǒng)重構消耗的時間,分析重構過程的可靠性和安全性。
系統(tǒng)的總體架構主要包含綜合電子系統(tǒng)和重構管理監(jiān)控系統(tǒng),驗證平臺執(zhí)行流程主要由兩系統(tǒng)間指令和數(shù)據(jù)的交互產生,如圖2 所示。
圖2 執(zhí)行總體流程
綜合電子系統(tǒng)重構驗證平臺執(zhí)行流程如下:
(1)綜合電子系統(tǒng)首先對軟硬件資源進行虛擬化管理,然后向重構管理監(jiān)控系統(tǒng)資源信息和自檢信息。
(2)通過系統(tǒng)間的通信來配置任務模式藍圖,并將任務執(zhí)行結果反饋給重構管理監(jiān)控系統(tǒng)。
(3)綜合電子系統(tǒng)接收重構管理監(jiān)控系統(tǒng)的測試指令并對其進行解析和執(zhí)行,將執(zhí)行結果反饋給重構管理系統(tǒng)。
(4)重構管理監(jiān)控系統(tǒng)通過故障模擬,將故障通過指令注入綜合電子系統(tǒng),綜合電子系統(tǒng)執(zhí)行重構恢復正常狀態(tài)后,將系統(tǒng)狀態(tài)反饋給重構管理監(jiān)控系統(tǒng)。
本文通過綜合電子系統(tǒng)重構驗證平臺對綜合電子系統(tǒng)重構時間進行實驗驗證。通過計算重構過程消耗的時間、重構藍圖的部署來驗證重構過程的有效性和正確性。
綜合電子系統(tǒng)重構驗證平臺軟件應用相關屬性如表1 所示。綜合電子系統(tǒng)應用的初始配置如表2 所示。
表1 平臺軟件屬性
表2 應用初始部署
向綜合電子系統(tǒng)注入三種類型的故障進行重構時間的分析和驗證,分別是處理器單核心故障、處理器故障和多級故障。本文重構時間驗證基于處理器A 作為主處理器,處理器B 作為備用處理器,向綜合電子系統(tǒng)處理器A 中注入核心1 故障、核心2 故障和處理器故障并分別進行實驗驗證和數(shù)據(jù)分析。對每個注入綜合電子系統(tǒng)的故障都使用基于強化學習的智能重構[8]方法生成對應的重構藍圖。
當發(fā)生處理器A 核心1 故障,需要對部署在核心1上的應用進行遷移,由于核心2 可以承擔故障應用的運行,只需進行核心間重構,將核心1 上的應用遷移到核心2 即可;當發(fā)生處理器核心2 故障時,需要對部署在核心2 上的軟件進行遷移重構;當處理器A 發(fā)生故障時,需要對處理器A 上部署的所有應用進行重新部署。遷移過程消耗的時間理論值如表3 所示。
表3 重構遷移過程理論消耗時間值分析
綜合電子系統(tǒng)重構驗證平臺對3 種故障分別進行100 故障模擬,三種故障實驗相關數(shù)據(jù)如表4 所示。
表4 實驗數(shù)據(jù)匯總
由表4 可知,三種故障類型的實驗值方差都很小,說明實驗產生的重構時間比較穩(wěn)定,重構藍圖的執(zhí)行效果較好。
處理器A 的核心1 故障比核心2 故障導致的重構時間顯著要小,其原因是核心1 故障引起的重構過程只有應用載處理器內部的部署表示,而核心2 故障還需要進行應用指令和數(shù)據(jù)遷移,受處理器間傳輸帶寬影響,重構消耗時間就更長。處理器A 故障導致的重構時間最長,由于遷移的應用數(shù)量較多,需要對遷移過程進行優(yōu)化,對于處理器A、B 共同部署的應用還需要進行主備切換。
綜上所示,綜合電子系統(tǒng)重構時間與故障類型及其重構藍圖有關,故障對系統(tǒng)影響越大,重構藍圖越復雜,重構消耗時間也越長。
本文基于可重構綜合電子系統(tǒng)架構,研究了綜合電子系統(tǒng)重構時間方法。首先基于綜合電子系統(tǒng)模型,對系統(tǒng)的軟硬件進行建模;然后通過分析系統(tǒng)運行過程中產生的故障類型對綜合電子系統(tǒng)重構遷移過程進行建模。總結核間重構時間、處理器間重構時間和系統(tǒng)重構時間的計算公式,利用綜合電子系統(tǒng)重構驗證平臺進行故障模擬和重構時間驗證。實驗證明,重構時間因不同故障類型導致的系統(tǒng)重構有所差異,通過優(yōu)化重構藍圖和遷移過程可以有效縮短重構過程消耗的時間。