陳 勇
(民航華東空中交通管理局技術(shù)保障中心,上海 200335)
VCS3020系列語(yǔ)音通信交換系統(tǒng)是歐洲公司出產(chǎn)的一種全數(shù)字無(wú)阻塞的數(shù)字語(yǔ)音通信系統(tǒng)。該公司一直從事生產(chǎn)可靠性和安全性要求非常高的用于大型民用和軍用空中交通管制中心的語(yǔ)音交換通信系統(tǒng)。語(yǔ)音通信交換系統(tǒng)(Voice Communication Switching System),民航內(nèi)部簡(jiǎn)稱為內(nèi)話系統(tǒng)。它實(shí)際上是一種專用的交換機(jī),可以接入無(wú)線電甚高頻/高頻設(shè)備、各類電話設(shè)備、網(wǎng)絡(luò)設(shè)備,同時(shí)提供觸摸屏席位(OP),上有3D模擬的按鍵,管制人員通過(guò)按下這些按鍵操作各個(gè)無(wú)線設(shè)備與飛行機(jī)組通話(地/空通信),操作電話設(shè)備與其他空管部門管制人員進(jìn)行協(xié)調(diào)(地/地通信)。由于民航空管的工作特點(diǎn),因此對(duì)設(shè)備的實(shí)時(shí)性可靠性要求比較高。
VCS3020語(yǔ)音通信交換設(shè)備版本很多,是一個(gè)系列,但是它們的系統(tǒng)框架都是一樣的,只是在一些具體的板卡上有改進(jìn)。VCS3020系列設(shè)備的硬件結(jié)構(gòu)是一個(gè)以交換模塊為中心的星型拓?fù)浣Y(jié)構(gòu)。交換模塊由兩套子系統(tǒng)Syetem A和System B組成。 無(wú)線(Radio)有線(Telephone)接口和席位(OP)通過(guò)外圍處理接口(GPIF)連接到兩個(gè)核心交換系統(tǒng)A和B。
交換模塊內(nèi)部結(jié)構(gòu)分為A、B兩個(gè)子系統(tǒng),每個(gè)系統(tǒng)由CIF板,JIF板還有數(shù)據(jù)總線構(gòu)成。CIF板位于數(shù)據(jù)總線的一端,控制數(shù)據(jù)總線的運(yùn)行,JIF板掛在數(shù)據(jù)總線下,通過(guò)四芯的PCM電纜與接口機(jī)框(drawer)和席位相連。每塊CIF板控制一條數(shù)據(jù)總線,每條數(shù)據(jù)總線下掛最多15塊JIF板。根據(jù)用戶的需求每個(gè)子系統(tǒng)中最多可以有8塊CIF,控制8條總線。CIF板之間也有一條總線,帶寬622MB/s,用于數(shù)據(jù)總線之間的數(shù)據(jù)交換。在A、B系統(tǒng)的CIF板之間有數(shù)據(jù)同步和時(shí)鐘同步數(shù)據(jù)傳輸。交換模塊的A、B兩個(gè)子系統(tǒng)結(jié)構(gòu)功能完全相同,同時(shí)運(yùn)行,互為冗余備份。
圖1 席位、接口機(jī)框與JIF板連接示意圖
JIF板與席位和接口機(jī)框的連接如圖1所示,每塊JIF板有8個(gè)PCM電纜接口,席位觸摸屏(TED,touch equipment device)連出兩條PCM電纜分別接入A、B兩個(gè)子系統(tǒng)的兩塊JIF板,接口機(jī)框(drawer)左右兩端各有一塊外圍處理板(GPIF),每塊GPIF板連出兩條PCM電纜分別接入A、B兩個(gè)系統(tǒng)的兩塊JIF板,即每個(gè)接口機(jī)框有四條PCM電纜和中央交換模塊的JIF板相連。
從上述框可以看出VCS3020系統(tǒng)有兩套獨(dú)立運(yùn)行的交換系統(tǒng),信號(hào)和數(shù)據(jù)分布處理,每套交換系統(tǒng)連續(xù)運(yùn)行并有相同的優(yōu)先級(jí),如果某一系統(tǒng)發(fā)生故障,信號(hào)和數(shù)據(jù)可以走另外一路。外圍話音和數(shù)據(jù)具有多重鏈路,可以確保將某一部件故障影響控制在最小范圍內(nèi)。
經(jīng)過(guò)多年的運(yùn)行考驗(yàn),VCS3020系列設(shè)備的可靠性是很不錯(cuò)的,但近期有技保部門反映在管制員使用過(guò)程中席位觸摸屏上有時(shí)一些無(wú)線按鍵會(huì)突然失效,影響管制指揮,存在安全隱患。筆者所在部門最近剛好安裝了一套VCS3020X系統(tǒng),該系統(tǒng)還沒有正式投入使用,正好可以用來(lái)測(cè)試一下,看看故障是否能模擬出來(lái),同時(shí)分析故障產(chǎn)生的原因
在了解了其他技保部門所反映的故障信息后,筆者設(shè)計(jì)了模擬故障的方案。首先將交換模塊系統(tǒng)A的一塊JIF板拔出,觀察安裝于監(jiān)控室的席位op17、op18的狀態(tài),觸摸屏各個(gè)無(wú)線按鍵及各個(gè)無(wú)線板的工作狀態(tài)是否有異常,使用操作是否正常,監(jiān)控系統(tǒng)TMCS上的告警信息是否有異常。然后再將席位的a、b兩路PCM電纜分別拔出觀察席位狀態(tài),重復(fù)幾次觀察狀態(tài)的不同。
查閱技術(shù)手冊(cè),無(wú)線接口機(jī)框RIF01連出的四根PCM電纜分別接到系統(tǒng)A的JIF1a的兩個(gè)接口和系統(tǒng)B的JIF1b的兩個(gè)接口上。席位op17、op18則是接在JIF4a和4b上。當(dāng)拔出系統(tǒng)A的JIF板1a時(shí),監(jiān)控系統(tǒng)TMCS上有JIF1a的連接(connection)告警,RIF01的兩塊GPIF a路(connection)告警。兩個(gè)席位狀態(tài)正常操作正常,席位op18上所有接在無(wú)線接口機(jī)框RIF01上的頻率按鍵從灰色變成白色,按下無(wú)反應(yīng)已經(jīng)按鍵失效。席位op17上所有RIF01機(jī)框上的頻率按鍵則在灰色白色之間不停地變化,即按鍵從正常的灰色變成失效的白色,幾秒鐘后再變回灰色然后再變成白色,然后再變成灰色,白色不停。根據(jù)以上現(xiàn)象分析,可能是該系統(tǒng)的席位和無(wú)線接口機(jī)框雖然同時(shí)連接到A、B兩個(gè)系統(tǒng),A、B兩系統(tǒng)也同時(shí)在運(yùn)行,但實(shí)際上信號(hào)只在某一路系統(tǒng)中傳輸或是說(shuō)完整的傳輸。當(dāng)JIF1a拔出后,RIF01機(jī)框就只連接到系統(tǒng)B,op17、op18雖然各有兩根PCM電纜分別連接系統(tǒng)A、B,但op18話音數(shù)據(jù)開始走于系統(tǒng)A,RIF01只連在系統(tǒng)B上,連不到系統(tǒng)A,所以在op18上RIF01上的按鍵就是失效的。op17的狀態(tài)就比較奇怪,RIF01上的按鍵在灰色和白色之間不停的變化,好像是在切換,但切換不成功又切回來(lái)。拔掉op17連接系統(tǒng)B的PCM電纜強(qiáng)制席位信號(hào)數(shù)據(jù)走系統(tǒng)A后RIF01的按鍵變白失效,再插回B路PCM電纜后RIF01上的按鍵一段時(shí)間后就恢復(fù)成正常的灰色,操作也正常了,好像切換成功,再拔掉a路PCM電纜,RIF01的按鍵狀態(tài)正常,工作正常。這時(shí)拔掉op18a路PCM電纜,強(qiáng)制op18的信號(hào)和數(shù)據(jù)走系統(tǒng)B,RIF01的按鍵也恢復(fù)狀態(tài)正常。將席位的PCM電纜和JIF1a插回,等重啟完成告警消失后再次拔出,這次op17、op18上RIF01上的按鍵狀態(tài)都正常,因該是經(jīng)過(guò)前面的操作op17、op18的信號(hào)數(shù)據(jù)都走在系統(tǒng)B上,拔出JIF1a系統(tǒng)A與RIF01的鏈接則被強(qiáng)制中斷,但和席位的信號(hào)數(shù)據(jù)交互并沒有影響。其后又進(jìn)行了多次相同的模擬故障操作,席位上按鍵的狀態(tài)變化都上述類似。
VCS3020系列語(yǔ)音通信交換系統(tǒng)是一個(gè)全數(shù)字無(wú)阻塞的冗余雙系統(tǒng)獨(dú)立并行運(yùn)行的先進(jìn)的語(yǔ)音交換系統(tǒng),共享資源的雙重配置,具有多重話音數(shù)據(jù)通道,容錯(cuò)的星型拓?fù)浣Y(jié)構(gòu),分布處理各種通信業(yè)務(wù),有很高的可靠性。但也正是由于其雙系統(tǒng)獨(dú)立運(yùn)行,兩套系統(tǒng)之間只有時(shí)鐘控制數(shù)據(jù)同步信號(hào)交互,信號(hào)和數(shù)據(jù)雖然也在兩套系統(tǒng)中同時(shí)傳輸,但席位正好在兩套系統(tǒng)的交叉點(diǎn)上,為避免沖突,只能從一套系統(tǒng)收發(fā)信號(hào)數(shù)據(jù),當(dāng)其出現(xiàn)故障時(shí)再切換到另一套系統(tǒng)上。如果接口機(jī)框和席位收發(fā)信號(hào)數(shù)據(jù)不在同一系統(tǒng)就會(huì)連不通,這也就是為什么當(dāng)一路JIF板拔出后,席位op18上出現(xiàn)RIF01按鍵失效的現(xiàn)象。
至于為什么在同樣拔出一塊JIF板,部分影響RIF01機(jī)框的連通的模擬故障情況下,在兩個(gè)席位上RIF01的按鍵狀態(tài)卻有不同,并沒有一個(gè)令人信服的解釋。筆者在模擬故障恢復(fù)過(guò)程中發(fā)現(xiàn)兩個(gè)席位從故障中恢復(fù)時(shí)間有較大的差異。在將席位的PCM電纜拔出后再插回的過(guò)程中發(fā)現(xiàn)席位op18在PCM電纜插回后27秒顯示PCM連接恢復(fù),59秒按鍵恢復(fù)正常;席位op17則是在PCM電纜插回2分03秒PCM恢復(fù),2分40秒按鍵恢復(fù)。兩個(gè)席位硬件上沒有區(qū)別,維護(hù)人員可設(shè)置的參數(shù)也相同,這種差異只能是其系統(tǒng)內(nèi)部不同造成的,可能兩個(gè)席位的內(nèi)部?jī)?yōu)先級(jí)不同,也可能與席位當(dāng)時(shí)的工作狀態(tài)有關(guān),具體的原因還要咨詢廠方的技術(shù)人員。