張振剛
摘 ?要: MIL?1394B總線在國(guó)內(nèi)外航空電子系統(tǒng)中應(yīng)用越來(lái)越廣泛,而MIL?1394B總線采用菊花鏈的物理層,單個(gè)節(jié)點(diǎn)的復(fù)位故障會(huì)導(dǎo)致整個(gè)網(wǎng)絡(luò)的復(fù)位擴(kuò)散,使整個(gè)網(wǎng)絡(luò)不能正常通信。針對(duì)MIL?1394B總線在綜合化航空電子設(shè)備的應(yīng)用中故障難以隔離,提出一種通過(guò)先驗(yàn)信息隔離故障的方法。首先分析復(fù)位故障的原理,從而結(jié)合MIL?1394B總線在航空電子系統(tǒng)中預(yù)先分配節(jié)點(diǎn)號(hào)的先驗(yàn)信息,獲取、分析AS643總線的SELF?ID包建立鏈接的信用值機(jī)制,設(shè)計(jì)一種檢測(cè)信用值的方法,并改造節(jié)點(diǎn)的硬件設(shè)計(jì),使節(jié)點(diǎn)鏈接的信用值低于閾值后可關(guān)閉錯(cuò)誤鏈接,從而實(shí)現(xiàn)MIL?1394B的網(wǎng)絡(luò)故障檢測(cè)和隔離。該設(shè)計(jì)方法和機(jī)制通過(guò)實(shí)物系統(tǒng)進(jìn)行驗(yàn)證,可用于高度綜合化的航空電子系統(tǒng)中。
關(guān)鍵詞: MIL?1394B總線; 航空電子系統(tǒng); 錯(cuò)誤檢測(cè); 故障隔離; 總線網(wǎng)絡(luò); 復(fù)位擴(kuò)散
中圖分類號(hào): TN915.04?34; TP336 ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2019)13?0015?04
Research and implementation of MIL?1394B bus fault isolation method
ZHANG Zhengang
(Southwest China Institute of Electronic Technology, Chengdu 610056, China)
Abstract: MIL?1394B bus is widely used in avionics system at home and abroad, but it adopts physical connecting mode of chrysanthemum chain, whose reset fault of a single node will lead to the reset diffusion of the whole network and the communication abnormality of whole network. Since the fault of MIL?1394B bus is difficult to isolate in integrated avionics device, a fault isolation method using prior information is proposed. The principle of reset fault is analyzed, and then the prior information of node number in avionics system is pre?assigned in combination with MIL?1394B bus to acquire and analyze SELF?ID packet of AS643 bus, and establish the mechanism of link credit value. A method of detecting credit value is designed, and the hardware design of node is reformed to close the error link while the credit value is lower than the threshold, which can realize the fault detection and isolation of MIL?1394B network. The designed method and mechanism were verified by a physical system, and can be used in highly?integrated avionics system.
Keywords: MIL?1394B bus; avionics system; fault detect; fault isolation; bus network; reset diffusion
0 ?引 ?言
航空電子系統(tǒng)已經(jīng)從傳統(tǒng)的聯(lián)合式架構(gòu)逐步演進(jìn)到先進(jìn)的綜合化架構(gòu)、高度綜合化架構(gòu)。隨著綜合化程度不斷提高以及機(jī)載傳感器技術(shù)的發(fā)展,航空電子系統(tǒng)對(duì)作為系統(tǒng)關(guān)鍵技術(shù)之一的機(jī)載總線網(wǎng)絡(luò)也提出了新的要求,早期的MIL?STD?1553B,ARINC429等總線技術(shù)已經(jīng)無(wú)法完全滿足高帶寬、低延遲和高確定性的應(yīng)用需求。很多新型商用總線在做了一定修改和限定后開始被應(yīng)用到軍用航空電子系統(tǒng),如美軍在F35的航空電子中采用一種基于1394總線改進(jìn)形成MIL?1394B總線。MIL?1394B總線網(wǎng)絡(luò)在1394總線的基礎(chǔ)上增加了應(yīng)用限定和改進(jìn),保留了1394總線即插即用、傳輸帶寬高等特點(diǎn),又增加了時(shí)間確定性等特點(diǎn),使其更適用于軍用航空領(lǐng)域[1]。
國(guó)內(nèi)也展開了MIL?1394B總線技術(shù)在航空電子系統(tǒng)中的研究和應(yīng)用,并給出幾種節(jié)點(diǎn)設(shè)計(jì)的解決方案和網(wǎng)絡(luò)實(shí)現(xiàn)方式[2?4]。然而,MIL?1394B總線采用菊花鏈的物理連接方式,節(jié)點(diǎn)和鏈路傳輸?shù)牟环€(wěn)定性將會(huì)影響整個(gè)網(wǎng)絡(luò)的傳輸過(guò)程,甚至導(dǎo)致機(jī)載設(shè)備的部分功能失效,文獻(xiàn)[5]提出增加網(wǎng)絡(luò)互聯(lián)復(fù)雜度,文獻(xiàn)[3]提出完全備份網(wǎng)絡(luò)的多余度網(wǎng)絡(luò)設(shè)計(jì)來(lái)解決高航空航天電子系統(tǒng)中高可靠性的需求。而隨著綜合航空電子技術(shù)的發(fā)展,以高度綜合化通信導(dǎo)航識(shí)別系統(tǒng)[6]為例,系統(tǒng)要求更小的體積、重量來(lái)實(shí)現(xiàn)原有的功能,并且不能降低可靠性。因此完全備份的方法已經(jīng)不能滿足此類設(shè)備的需求。
本文采用獲取1394總線原生的SELFID報(bào)文以及網(wǎng)絡(luò)物理連接的先驗(yàn)信息,通過(guò)軟件自動(dòng)探測(cè)、隔離不穩(wěn)定的節(jié)點(diǎn)及鏈路,使網(wǎng)絡(luò)中未失效的處理通道正常運(yùn)行,最大化地提高設(shè)備的利用率,在保證可靠性的前提下,提升綜合化后的重量、體積等性能。
1 ?MIL?1394B總線特點(diǎn)
1.1 ?物理鏈路冗余
在IEEE?1394B?2002總線標(biāo)準(zhǔn)中,允許總線網(wǎng)絡(luò)中存在物理環(huán)路冗余。在MIL?1394B協(xié)議標(biāo)準(zhǔn)中利用該特性實(shí)現(xiàn)了第一級(jí)物理鏈路冗余,很多系統(tǒng)中利用該特性實(shí)現(xiàn)網(wǎng)絡(luò)冗余。
1.2 ?網(wǎng)絡(luò)集中運(yùn)行控制管理
在MIL?1394B網(wǎng)絡(luò)協(xié)議中,網(wǎng)絡(luò)上的節(jié)點(diǎn)分為中央控制節(jié)點(diǎn)(CC node)和遠(yuǎn)程節(jié)點(diǎn)。中央控制節(jié)點(diǎn)負(fù)責(zé)下發(fā)時(shí)間基準(zhǔn),維護(hù)整個(gè)網(wǎng)絡(luò)的時(shí)隙同步。遠(yuǎn)程節(jié)點(diǎn)接收中央控制節(jié)點(diǎn)的時(shí)間信息,并按照分配好的時(shí)隙發(fā)送和接收消息,通過(guò)這種機(jī)制提高通信的時(shí)間確定性。在機(jī)載設(shè)備中,通常將中央控制節(jié)點(diǎn)作為網(wǎng)絡(luò)管理單元。
1.3 ?確定性的通道地址
MIL?1394B總線上的節(jié)點(diǎn)在初始化過(guò)程中實(shí)現(xiàn)通道號(hào)分配,總線網(wǎng)絡(luò)上的每個(gè)參與通信的節(jié)點(diǎn)通過(guò)分配通道號(hào)完成地址識(shí)別,實(shí)現(xiàn)通信傳輸。不同于1394B網(wǎng)絡(luò)依靠自標(biāo)識(shí)完成各個(gè)節(jié)點(diǎn)的識(shí)別,不同的識(shí)別過(guò)程各個(gè)節(jié)點(diǎn)的ID號(hào)存在不一致的可能性,而在航空電子系統(tǒng)中由于確定性的需求,MIL?1394B總線建立時(shí)同一節(jié)點(diǎn)的通道號(hào)是預(yù)先分配的,不會(huì)動(dòng)態(tài)變化。默認(rèn)中央控制節(jié)點(diǎn)的通道號(hào)為0通道。
1.4 ?自標(biāo)識(shí)報(bào)文機(jī)制
總線上所有節(jié)點(diǎn)的物理層都會(huì)向網(wǎng)絡(luò)上發(fā)送自標(biāo)識(shí)報(bào)文SELFID,各個(gè)節(jié)點(diǎn)根據(jù)自標(biāo)識(shí)報(bào)文的內(nèi)容以及上報(bào)自標(biāo)識(shí)包的順序完成物理連接關(guān)系的識(shí)別,并建立樹狀拓?fù)浣Y(jié)構(gòu)。
2 ?故障隔離原理和方案
2.1 ?總線故障現(xiàn)象
由于MIL?1394B總線采用IEEE?1394B?2002總線的物理層,在新的總線節(jié)點(diǎn)接入時(shí),通過(guò)向總線上發(fā)送BUS_RESET,使總線上的所有節(jié)點(diǎn)進(jìn)入總線初始化過(guò)程,初始化完成后進(jìn)入樹標(biāo)識(shí)過(guò)程,樹標(biāo)識(shí)過(guò)程完成后總線的初始化工作結(jié)束,才能進(jìn)行正常通信。該特性也導(dǎo)致總線上的各個(gè)節(jié)點(diǎn)如果不斷產(chǎn)生復(fù)位,將會(huì)影響整個(gè)網(wǎng)絡(luò)的正常通信。
如圖1所示,當(dāng)整個(gè)網(wǎng)絡(luò)中存在一個(gè)故障節(jié)點(diǎn),且該節(jié)點(diǎn)的故障現(xiàn)象是不穩(wěn)定的連接,將使整個(gè)網(wǎng)絡(luò)處于反復(fù)的初始化過(guò)程,導(dǎo)致整個(gè)網(wǎng)絡(luò)的通信受到影響。同時(shí),由于整個(gè)網(wǎng)絡(luò)的時(shí)間同步源也受到影響,整個(gè)網(wǎng)絡(luò)的時(shí)間基準(zhǔn)將會(huì)不斷重復(fù)建立和發(fā)布,MIL?1394B基于時(shí)間的確定性也會(huì)受到影響。為了區(qū)別一般可恢復(fù)的復(fù)位,定義這種復(fù)位形式為錯(cuò)誤復(fù)位,顯然這種復(fù)位對(duì)總線網(wǎng)絡(luò)是有害的。
2.2 ?故障檢測(cè)、隔離方法
2.2.1 ?錯(cuò)誤復(fù)位故障檢測(cè)、隔離原理
節(jié)點(diǎn)的大部分故障可以通過(guò)報(bào)文傳遞過(guò)程和報(bào)文內(nèi)容進(jìn)行隔離[7],然而不穩(wěn)定的連接和節(jié)點(diǎn)的反復(fù)復(fù)位引進(jìn)的故障失效,通過(guò)MIL?1394B網(wǎng)絡(luò)協(xié)議本身[8]和一般的狀態(tài)自檢信息無(wú)法檢測(cè)和隔離。但根據(jù)實(shí)際工程經(jīng)驗(yàn)和節(jié)點(diǎn)的失效模型,為了解決此類問(wèn)題,可以利用MIL?1394B總線網(wǎng)絡(luò)物理連接具有先驗(yàn)信息的特點(diǎn)。而現(xiàn)有的MIL?1394B軟硬件實(shí)現(xiàn)[2?4]通常無(wú)法實(shí)現(xiàn)錯(cuò)誤復(fù)位故障的檢測(cè)與隔離,通過(guò)對(duì)節(jié)點(diǎn)的軟硬件設(shè)計(jì)和網(wǎng)管程序的改進(jìn)可以實(shí)現(xiàn)。引入總線節(jié)點(diǎn)和連接的復(fù)位信用模式,判斷復(fù)位是正常復(fù)位或者是非正常復(fù)位,對(duì)總線網(wǎng)絡(luò)采取不同的處理方式,完成錯(cuò)誤復(fù)位故障的檢測(cè)、隔離。
2.2.2 ?故障隔離硬件設(shè)計(jì)
如圖2所示,在改進(jìn)后的網(wǎng)絡(luò)實(shí)現(xiàn)中,不同于一般MIL?1394B的FPGA設(shè)計(jì),RN節(jié)點(diǎn)和CC節(jié)點(diǎn)的邏輯設(shè)計(jì)不但要完成MIL?1394B協(xié)議解析,還增加了端口信用管理組件,每個(gè)節(jié)點(diǎn)都可以通過(guò)CC分發(fā)的配置信息記錄各自節(jié)點(diǎn)的端口信用度,并通過(guò)硬件設(shè)計(jì)的端口控制線實(shí)現(xiàn)端口的開/閉。在端口信用管理組件發(fā)現(xiàn)節(jié)點(diǎn)失效后也可以完成對(duì)物理層芯片的關(guān)閉。在物理層芯片關(guān)閉后該節(jié)點(diǎn)不會(huì)重新入網(wǎng)。
2.2.3 ?基于CC節(jié)點(diǎn)的故障隔離軟件設(shè)計(jì)
CC節(jié)點(diǎn)的網(wǎng)絡(luò)管理程序組成如圖3所示。
網(wǎng)絡(luò)管理程序各組成部分中,與本文的研究?jī)?nèi)容相關(guān)的主要有邏輯拓?fù)渖山M件、邏輯樹拓?fù)涞怯泿?kù)組件、信用管理組件及物理拓?fù)淇刂平M件。邏輯拓?fù)渖山M件:根據(jù)系統(tǒng)中的網(wǎng)絡(luò)連接信息生成可能的所有拓?fù)?邏輯樹拓?fù)涞怯泿?kù)組件:將邏輯拓?fù)渖山M件中的邏輯樹形成登記并建庫(kù);信用管理組件:計(jì)算并記錄各個(gè)邏輯拓?fù)涞男庞?物理拓?fù)淇刂平M件:根據(jù)邏輯拓?fù)涞男庞弥滇尫藕完P(guān)閉各物理鏈路。
2.2.4 ?故障隔離工作機(jī)制
CC節(jié)點(diǎn)根據(jù)建立的物理連接關(guān)系以及通道號(hào)的預(yù)先配置特性,完成所有可能實(shí)現(xiàn)的邏輯拓?fù)涞怯洠洖閘ogicTree{[n]},其中,[n]的取值范圍為1到所有可能的最大數(shù)。logicTree中記錄了包括樹狀結(jié)構(gòu)下當(dāng)前邏輯連接對(duì)應(yīng)的節(jié)點(diǎn)間建立的物理端口連接,例如link.cc2R1=cc.a_R1.B,并記錄了當(dāng)前物理連接的信用值link.cc2R1.credit。
網(wǎng)絡(luò)啟動(dòng)運(yùn)行后,如出現(xiàn)錯(cuò)誤復(fù)位故障的節(jié)點(diǎn),導(dǎo)致總線復(fù)位次數(shù)過(guò)多,超過(guò)設(shè)置的閾值,關(guān)閉可復(fù)用的端口,形成唯一的logicTree,如果故障復(fù)位依然存在,CC節(jié)點(diǎn)上的網(wǎng)絡(luò)管理程序開始記錄每一次復(fù)位后的SELFID值以及SELFID上報(bào)的順序,根據(jù)logicTree的記錄判斷出每次復(fù)位節(jié)點(diǎn)的當(dāng)前網(wǎng)絡(luò)復(fù)位完成后的物理端口連接關(guān)系。由于不穩(wěn)定節(jié)點(diǎn)的連接在不同的復(fù)位后存在不能持續(xù)出現(xiàn)的現(xiàn)象,一旦某次復(fù)位初始化完成后,某個(gè)節(jié)點(diǎn)的連接未上線,就會(huì)被網(wǎng)絡(luò)管理程序減少記錄連接的信用值。隨著不穩(wěn)定的復(fù)位反復(fù)出現(xiàn),不穩(wěn)定的連接信用值不斷降低,當(dāng)該條連接的信用值降低到設(shè)計(jì)的規(guī)定值后,該條連接對(duì)應(yīng)的物理端口將會(huì)被網(wǎng)絡(luò)管理程序中的信用管理組件通知端口信用邏輯組件進(jìn)行關(guān)閉。關(guān)閉信用值較低的連接后,總線網(wǎng)絡(luò)開始在所有的可用物理連接上實(shí)現(xiàn)節(jié)點(diǎn)的通信,保證正常節(jié)點(diǎn)的通信。
3 ?測(cè)試與驗(yàn)證
測(cè)試主要驗(yàn)證發(fā)現(xiàn)、隔離錯(cuò)誤復(fù)位故障的能力和整個(gè)過(guò)程的時(shí)間,依靠搭建原型驗(yàn)證系統(tǒng),并在節(jié)點(diǎn)中通過(guò)向邏輯代碼發(fā)送復(fù)位指令摸擬注入錯(cuò)誤復(fù)位故障。
圖4的測(cè)試驗(yàn)證環(huán)境由兩個(gè)RN節(jié)點(diǎn)及其嵌入式主機(jī)、一個(gè)CC節(jié)點(diǎn)及其嵌入式主機(jī)和MIL?1394B總線分析儀組成??偩€分析儀可向主機(jī)上報(bào)統(tǒng)計(jì)總線上的復(fù)位數(shù)據(jù)和顯示拓?fù)湫畔?。除和總線分析儀的連接外,驗(yàn)證系統(tǒng)存在3條總線連接,分別為link.cc2R1,link.cc2R2,link.R12R2。link.cc2R1,link.cc2R2構(gòu)建的是網(wǎng)絡(luò)邏輯拓?fù)鋖ogicTree1;link.cc2R1,link.R12R2構(gòu)建的是網(wǎng)絡(luò)邏輯拓?fù)鋖ogicTree2;link.cc2R2,link.R12R2構(gòu)建的是網(wǎng)絡(luò)邏輯拓?fù)鋖ogicTree3。為了測(cè)試方法的有效性,在link.cc2R2的連接上不斷注入錯(cuò)誤復(fù)位故障。各連接的信用初值設(shè)為11,設(shè)置總線閾值為10。
復(fù)位故障檢測(cè)數(shù)據(jù)如表1所示。從表1中的數(shù)據(jù)可以看出,當(dāng)注入復(fù)位故障次數(shù)超過(guò)一定的數(shù)值后,故障連接的信用降低為0,驗(yàn)證系統(tǒng)將關(guān)閉存在故障連接的邏輯樹注冊(cè),僅支持唯一的無(wú)故障連接logicTree2,整個(gè)網(wǎng)絡(luò)不再重復(fù)復(fù)位,可以進(jìn)行正常通信。
4 ?結(jié) ?論
針對(duì)現(xiàn)有的MIL?1394B總線拓?fù)渥R(shí)別機(jī)制主要是基于1394包的拓?fù)渥R(shí)別,雖然能夠在一定程度上解決系統(tǒng)設(shè)計(jì)和驗(yàn)證工作,但并沒(méi)有充分利用MIL?1394B總線的信息,使系統(tǒng)在應(yīng)用此總線時(shí)存在難以識(shí)別具體故障節(jié)點(diǎn)的問(wèn)題。本文提出的設(shè)計(jì)方法通過(guò)分析MIL?1394B協(xié)議的本身特性以及1394報(bào)文的原有信息,可確定上報(bào)各節(jié)點(diǎn)的邏輯連接關(guān)系并能自動(dòng)檢測(cè)非穩(wěn)定故障節(jié)點(diǎn),完成隔離故障節(jié)點(diǎn)并據(jù)此實(shí)現(xiàn)系統(tǒng)的重構(gòu)。在某型綜合化通信航空識(shí)別系統(tǒng)中應(yīng)用穩(wěn)定,支持了該系統(tǒng)的綜合化實(shí)現(xiàn)。同時(shí),該技術(shù)可應(yīng)用于系統(tǒng)在線測(cè)試過(guò)程中,實(shí)現(xiàn)系統(tǒng)總線網(wǎng)絡(luò)的自檢等功能。
參考文獻(xiàn)
[1] IEEE Computer Society. IEEE?1394B interface requirements for military and aerospace vehicle applications SAE aerospace standard 5643 [S]. US: IEEE Computer Society, 2004.
[2] 趙彬,田澤,楊峰,等.基于AS5643協(xié)議的接口模塊設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(8):100?102.
ZHAO Bin, TIAN Ze, YANG Feng, et al. Design and implementation of MIL?1394 module based on AS5643 protocol [J]. Computer technology and development, 2013, 23(8): 100?102.
[3] 趙彬,易寧寧,鄭斐,等.航電1394總線節(jié)點(diǎn)設(shè)計(jì)實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2016,42(6):13?16.
ZHAO Bin, YI Ningning, ZHENG Fei, et al. Design and implementation of avionics 1394 node [J]. Application of electronic technique, 2016, 42(6): 13?16.
[4] 馬寧,王宣明,鄭斐.飛機(jī)管理系統(tǒng)1394總線AS5643協(xié)議的設(shè)計(jì)與實(shí)現(xiàn)[J].航空計(jì)算技術(shù),2013,43(6):122?124.
MA Ning, WANG Xuanming, ZHENG Fei. Design and implementation of vehicle management system 1394 bus AS5643 protocol [J]. Aeronautical computing technique, 2013, 43(6): 122?124.
[5] 周慶瑞,孫輝先.IEEE1394網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的可靠性研究[J].宇航學(xué)報(bào),2008,29(4):1403?1408.
ZHOU Qingrui, SUN Huixian. Research on reliability of physical topology for IEEE 1394 [J]. Journal of astronautics, 2008, 29(4): 1403?1408.
[6] 何志強(qiáng).綜合化航空電子系統(tǒng)發(fā)展歷程及重要支撐技術(shù)[J].電訊技術(shù),2004,44(4):1?5.
HE Zhiqiang. Development and important supporting technology of integrated avionics system [J]. Telecommunication engineering, 2004, 44(4): 1?5.
[7] 朱良,杜承烈.通用航空總線測(cè)試與分析軟件的設(shè)計(jì)和實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),2007,24(7):125?127.
ZHU Liang, DU Chenglie. Design and realization of universal avionics bus testing and analysis software [J]. Microelectrnics & computer, 2007, 24(7): 125?127.
[8] BAI Haowei. Analysis of a SAE MIL?1394B based high speed avionics network architecture for space and defense applications [C]// 2007 IEEE Aerospace Conference. Big Sky: IEEE, 2007: 1344?1352.
[9] 辛永利,田澤,楊峰.機(jī)載UMS 系統(tǒng)二余度1394B總線網(wǎng)絡(luò)設(shè)計(jì)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2015,25(3):197?201.
XIN Yongli, TIAN Ze, YANG Feng. Design of dual?redundancy 1394B bus network for airborne UMS [J]. Computer technology and development, 2015, 25(3): 197?201.