譚 毅,凌 敏
(長沙通信職業(yè)技術(shù)學(xué)院通信工程系,湖南長沙 410015)
隨著通信技術(shù)不斷發(fā)展,單一的語音信息不能滿足人們的需求,這就要求通信運營商與開發(fā)商建立一個能提供更加豐富滿足人們業(yè)務(wù)需求的通信網(wǎng)絡(luò),而交換機(jī)的作用在整個網(wǎng)絡(luò)中尤為突出。當(dāng)程控交換機(jī)在運行時出現(xiàn)系統(tǒng)故障,首先要對故障進(jìn)行準(zhǔn)確定位,找到位置;然后再對所出現(xiàn)的故障現(xiàn)象進(jìn)行正確的分析判斷,找出原因;最后對癥下藥,排除故障,讓交換機(jī)恢復(fù)正常運行。由于程控交換機(jī)的迅速發(fā)展,現(xiàn)在已達(dá)到對程控交換機(jī)實行有條件的無人看守和集中管理的維護(hù)模式,以減少開支。這就要求維護(hù)人員有一定的專業(yè)知識并能掌握常用的維護(hù)方法。
采用間接控制方式的交換系統(tǒng)(包括程控交換在內(nèi))可分為兩大部分:話路設(shè)備與控制設(shè)備。其中話路設(shè)備主要由提供接續(xù)通道的通話網(wǎng)絡(luò)組成;控制設(shè)備集中接收、儲存及分析用戶的選擇信號,控制通話網(wǎng)絡(luò)接通。
有三種常見的交換機(jī)體系結(jié)構(gòu):縱橫制式(cross-bar)、共享存儲器(shared-memory)和高速總線(high-speed bus)。
1)縱橫制式交換機(jī)
在機(jī)電式交換機(jī)中,最具有代表性、性能也較完善的是縱橫制自動電話交換機(jī)。該交換機(jī)自誕生以來,在電話發(fā)展史上引起一次重大的改革,是它最先采用間接控制方式,其控制原理被當(dāng)今最先進(jìn)的程控交換機(jī)所采用??v橫制式交換機(jī)的輸入/輸出端口可以看作是幾條在一些交點上交匯的街道。信息流量少時,數(shù)據(jù)在轉(zhuǎn)發(fā)前不必存儲,這稱為“直接”傳輸。然而,當(dāng)交點處繁忙時,縱橫式交換機(jī)要求每個端口的輸入緩沖器存儲數(shù)據(jù),這種情況稱為“阻塞”。雖然它價格低廉,最早進(jìn)入市場,但結(jié)構(gòu)過于簡單,無法有效地把低速接口(以太網(wǎng)和令牌環(huán)網(wǎng))轉(zhuǎn)換成高速接口(ATM和FDDI)。
2)共享儲存器交換機(jī)
隨著經(jīng)濟(jì)的增長和通信技術(shù)的日新月異,人們對獲得信息的速度要求越來越高,所以在高速路由器中,采用輸入排隊機(jī)制的交換結(jié)構(gòu)(crossbar)和共享存儲器交換結(jié)構(gòu)應(yīng)用廣泛。輸入排隊機(jī)制的交換機(jī)的優(yōu)點是交換核心的速率與輸入/輸出速率一樣,但存儲器的利用率較低;共享儲存器交換機(jī)把輸入/輸出緩沖器合并,使之變?yōu)橐粋€全局緩沖池,交換機(jī)首先把輸出的數(shù)據(jù)放在存儲器中,然后發(fā)送出去。這種方式稱為“存儲—轉(zhuǎn)發(fā)”。共享存儲器交換機(jī)的優(yōu)點是存儲器利用效率很高,但要求核心速率要遠(yuǎn)高于各端口線速率,對于存儲器運行速度要求很高。
3)高速總線交換機(jī)
高速總線交換機(jī)把ASIC連到一條高速數(shù)據(jù)總線上,在總線連接端口處,數(shù)據(jù)被轉(zhuǎn)換成適合在總線上傳輸?shù)臉?biāo)準(zhǔn)格式后,由總線把它送至目的地。由于總線可以同時處理每個端口的全部傳輸,沒有數(shù)據(jù)路徑瓶頸問題,因此常被稱為是一種“無阻塞”的交換機(jī)。下面就以中興ZXJ10程控交換機(jī)為例詳細(xì)闡述。ZXJ10的組成主要有硬件結(jié)構(gòu)和軟件結(jié)構(gòu)兩個部分。ZXJ10采用模塊化結(jié)構(gòu),全分散的控制方式,可由一到數(shù)十個模塊組成,根據(jù)不同的容量調(diào)整不同的模塊與之對應(yīng)。主要模塊有:消息交換模塊、中心交換網(wǎng)絡(luò)模塊、操作維護(hù)模塊、近端外圍交換模塊、遠(yuǎn)端外圍交換模塊、分組交換模塊、遠(yuǎn)端用戶單元。ZXJ10的軟件系統(tǒng)分為兩個部分:前臺軟件和后臺軟件。前臺軟件主要處理接續(xù)和交換數(shù)據(jù),包含了操作維護(hù)模塊軟件。后臺軟件只要執(zhí)行人為輸入的命令。
通俗的講,交換機(jī)具有物理編址、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、錯誤校驗、幀序列,以及流控的功能。目前,交換機(jī)還具有一些新的功能,如對VLAN(虛擬局域網(wǎng))的支持,對鏈路匯聚的支持,甚至有的還具有防火墻的功能,還可以靈活的對網(wǎng)絡(luò)進(jìn)行增加、移動和改變,對網(wǎng)絡(luò)廣播流量進(jìn)行控制。歸納起來可以用一句話表示:交換機(jī)能夠幫助用戶提高網(wǎng)絡(luò)性能并簡化網(wǎng)絡(luò)的操作和管理。
程控電話交換機(jī)是用計算機(jī)控制的實時信息交換系統(tǒng),它由硬件設(shè)備和軟件系統(tǒng)兩大部分組成。由于交換機(jī)在復(fù)雜的環(huán)境中運行,外部信息是隨機(jī)發(fā)生的,交換機(jī)內(nèi)部要求實時處理,而且通信網(wǎng)絡(luò)上的各類故障狀態(tài)也會反應(yīng)到交換機(jī)中。為保障交換機(jī)的安全、可靠的運行,采取必要的、行之有效的維護(hù)手段必不可少。通過日常的維護(hù)工作,有針對性地對設(shè)備的軟件、硬件、運行環(huán)境等進(jìn)行系統(tǒng)的排查。做到及時發(fā)現(xiàn)故障現(xiàn)象,分析故障原因、消除故障,從而保障設(shè)備運行狀態(tài)良好。
按照維護(hù)目的的不同,可將設(shè)備維護(hù)分為例行維護(hù)和故障處理。2.1.1例行維護(hù)是一種預(yù)防性的維護(hù),它是指在加電運行的設(shè)備的中由操作系統(tǒng)啟動,之后將使用時間表自動啟動預(yù)先定義的測試類型,能及時檢查并糾正設(shè)備所存在的缺陷或隱患,是為了保持設(shè)備能夠長期可靠、安全、穩(wěn)定運行的維護(hù),是一種預(yù)防性的措施。
2.1.2 交換機(jī)硬件和軟件故障處理
故障處理是指在設(shè)備硬件或軟件發(fā)生故障時,為保證設(shè)備正常運行和全程全網(wǎng)業(yè)務(wù)的運行,減少或挽回?fù)p失而采取的一種補(bǔ)救性措施。
2.1.2.1 硬件故障處理
1)硬件故障檢測
在設(shè)計硬件電路時應(yīng)包括硬件監(jiān)督電路,硬件故障一旦出現(xiàn),硬件監(jiān)督電路應(yīng)能立即檢測出來,以避免故障擴(kuò)散到其它部件單元。
2)硬件故障處理
當(dāng)一個硬件故障被檢測出來后,對于懷疑有故障的部件,其在總線上的接口禁止位要被設(shè)置,同時激活連接到每個處理機(jī)的系統(tǒng)故障線,與故障有關(guān)的其它信息和故障的位置被送到相應(yīng)的告警寄存器中。
硬件故障處理進(jìn)程激活后,先用診斷程序驗證錯誤,對不可驗證的偶發(fā)性故障,若不再重復(fù)出現(xiàn),系統(tǒng)就會容忍它并重新啟動該部件,但故障信息將會存到歷史文件中去,同時故障處理進(jìn)程將對錯誤進(jìn)行統(tǒng)計,對于統(tǒng)計結(jié)果達(dá)到一定閾值的故障部件,不需要驗證錯誤再次出現(xiàn),系統(tǒng)就直接將該部件的狀態(tài)置為不可用。對于確認(rèn)的故障部件的狀態(tài)也置為不可用,系統(tǒng)還根據(jù)故障類型以及對系統(tǒng)的影響,選擇適當(dāng)?shù)幕謴?fù)級別。故障信息同時傳到操作維護(hù)終端盒歷史文件中,告警也會出現(xiàn)在告警板上。故障消息包含被懷疑有故障的模塊名,這樣交換機(jī)現(xiàn)場或維護(hù)人員就能分析錯誤,準(zhǔn)確定位故障位置,立即更換故障模塊。
在報告故障的同時,系統(tǒng)狀態(tài)分析程序也會接到有故障的通知,硬件故障處理進(jìn)程還根據(jù)發(fā)生故障的不同部件以及故障的出現(xiàn)頻率,采用不同恢復(fù)動作來糾正錯誤。
2.1.2.2 軟件故障處理
1)軟件故障檢測
軟件故障可由硬件設(shè)備檢驗出,如在基本處理機(jī)的訪問控制部件中,用硬件電路來檢查訪問授權(quán)和內(nèi)存區(qū)域的保護(hù)特性,用它監(jiān)督對內(nèi)存的存取操作是否被允許。但軟件故障主要是由軟件來檢測,通常有以下幾種軟件設(shè)計方法:
(1)在程序設(shè)計時,利用程序設(shè)計語言本身提供的功能,如:利用編譯程序的語法檢查,避免程序中的結(jié)構(gòu)、格式和語句的錯誤;
(2)采取防范性措施,對關(guān)鍵性的數(shù)據(jù)和錯誤易擴(kuò)散的危險區(qū)域采用寫保護(hù)方法,對采取訪問進(jìn)行檢驗,對無授權(quán)訪問的不允許操作;
(3)用檢查程序?qū)彶檐浖e誤;
(4)用實時系統(tǒng)監(jiān)督在固定時間周期內(nèi)某些進(jìn)程是否已經(jīng)執(zhí)行過,方法是設(shè)置字符串表,每個進(jìn)程對應(yīng)字符串表中的一位標(biāo)志位,執(zhí)行過的進(jìn)程標(biāo)志位為1,系統(tǒng)監(jiān)督程序讀標(biāo)志位,若標(biāo)志位已設(shè)置說明系統(tǒng)運行正常,否則就要采取補(bǔ)救措施。系統(tǒng)監(jiān)督程序還判定一個進(jìn)程是否處于死鎖狀態(tài),它向進(jìn)程發(fā)送一個消息并等待進(jìn)程的響應(yīng),如果沒有響應(yīng),就認(rèn)為進(jìn)程已死鎖,有軟件錯誤。
(5)用系統(tǒng)狀態(tài)分析程序分析交換機(jī)系統(tǒng)中是否有多個處理機(jī)發(fā)生故障,硬件開關(guān)的設(shè)置是否有誤,各部件單元的配置狀態(tài)是否正確,若不正確則重設(shè),使假錯的設(shè)備可以再啟動。系統(tǒng)狀態(tài)分析程序是在使得系統(tǒng)處理能力降低的重配置后被啟動的,或在固定時間間隔內(nèi)周期性啟動,也可以用人機(jī)命令啟動和修改執(zhí)行程序的時間間隔。
2)軟件故障處理
軟件故障不可能象它出現(xiàn)一樣被自動修改,只能采取一些補(bǔ)救措施來消除錯誤的影響,而將錯誤報告提交給程序開發(fā)人員,供他們進(jìn)行脫機(jī)的故障分析并修改錯誤,通過打補(bǔ)丁的方式,將修改后的軟件送入正在運行的交換機(jī)中。
軟件故障處理程序在啟動后先分析故障現(xiàn)場情況,根據(jù)從中斷處理程序傳來的故障信息來判定錯誤類型以及故障定位。
為了確?;謴?fù)工作的有效性,軟件故障處理程序必須保留故障統(tǒng)計信息,它要統(tǒng)計那些導(dǎo)致系統(tǒng)重啟動的錯誤出現(xiàn)頻率和執(zhí)行恢復(fù)工作的頻率,并監(jiān)督在一定的時間周期內(nèi)統(tǒng)計值是否超過預(yù)先定義的閾值,若超過就要恢復(fù)工作的級別并逐步升級。
針對設(shè)備運行情況,實施不同的維護(hù)方法很有必要。設(shè)備的維護(hù)方法一般可分為正常維護(hù)和非正常維護(hù)。正常維護(hù)是指對設(shè)備運行狀態(tài)進(jìn)行仔細(xì)觀察、測試和分析,從而做出相應(yīng)的技術(shù)維護(hù)處理。非正常維護(hù)是指通過人為的制造故障發(fā)生條件,從而觀察設(shè)備運行過程中元器件的性能和功能是否出現(xiàn)老化和性能不良。如檢測某一模塊功能時,通過對該模塊實施人為干擾條件,再檢測模塊應(yīng)有功能發(fā)揮情況,從而對模塊的性能進(jìn)行判斷。
2.3.1 機(jī)房溫濕度
如果機(jī)房內(nèi)有溫度計和濕度計就查看溫濕度計,如果沒有就查看后臺告警界面上的環(huán)境信息,機(jī)房的溫度范圍是:15℃-25℃,濕度范圍是:30%-70%,如果溫濕度超過范圍,應(yīng)及時上報并記錄。
2.3.2 檢查交換機(jī)運行狀態(tài)
l)查看后臺服務(wù)器及維護(hù)終端界面是否有錯誤告警,界面切換是否準(zhǔn)確及時,如有類似問題,應(yīng)與本局技術(shù)人員聯(lián)系,定位故障,或直接與廠家維護(hù)人員聯(lián)系。
2)檢查機(jī)架溫度是否明顯過高,機(jī)房是否有異味,機(jī)房環(huán)境可否符合本地要求。如有問題,應(yīng)及時上報并記錄。
3)檢查前后臺通信狀況。查看告警界面是否存在通信中斷;使用文件管理分別顯示各模塊MP文件,顯示返回結(jié)果應(yīng)準(zhǔn)確、及時。如命令超時或返回結(jié)果較慢,檢查原因或與廠家維護(hù)人員聯(lián)系。
4)檢查前臺MP主備狀態(tài)。在后臺告警界面機(jī)架狀態(tài)圖中,點擊備用MP后彈出狀態(tài)圖,多次點擊“狀態(tài)”按鈕,觀察狀態(tài)顯示是否準(zhǔn)確及時。如超時或結(jié)果上報較慢,說明主備通信狀態(tài)不正常,應(yīng)與本局技術(shù)人員聯(lián)系,定位故障,或直接與廠家維護(hù)人員聯(lián)系。
5)查看后臺服務(wù)器及各終端工作狀態(tài)。在服務(wù)器及各操作維護(hù)終端上進(jìn)行簡單修改操作,命令執(zhí)行是否準(zhǔn)確及時,如不能正常使用,應(yīng)與本局技術(shù)人員聯(lián)系,定位故障,或直接與廠家維護(hù)人員聯(lián)系。
6)測試告警上報狀況。在維護(hù)終端上復(fù)位對業(yè)務(wù)無影響的某一單板(如備用SP板),看告警箱是否有相應(yīng)聲光告警,后臺告警界面中,信息總覽頁面是否有相應(yīng)告警條目,機(jī)架圖是否顯示相應(yīng)告警色彩。如有相應(yīng)現(xiàn)象則正常,否則有問題,應(yīng)與本局技術(shù)人員聯(lián)系,定位故障,或直接與廠家維護(hù)人員聯(lián)系。
7)查看當(dāng)前告警。后臺告警界面中,選中某一模塊,信息查詢頁面中“類別選定”為當(dāng)前告警,“告警級別”選定為所有告警,點擊開始查詢按鈕,結(jié)果顯示是否有不正常告警,如有必須詳細(xì)記錄落實,應(yīng)與本局技術(shù)人員聯(lián)系,定位故障,或直接與廠家維護(hù)人員聯(lián)系。依此方式查詢所有模塊。
8) 查看前一天歷史告警。后臺告警界面中,選中某一模塊,信息查詢頁面中“類別選定”為歷史告警,“時間設(shè)定”為前一個24小時,“告警級別”選定為所有告警,點擊開始查詢按鈕,結(jié)果顯示是否有不正常告警,如有必須詳細(xì)記錄落實。應(yīng)與本局技術(shù)人員聯(lián)系,定位故障,或直接與廠家維護(hù)人員聯(lián)系。依此方式查詢所有模塊。
隨著經(jīng)濟(jì)的快速增長、通信技術(shù)的日新月異,極大地推動和刺激了通信行業(yè)的發(fā)展和進(jìn)步。人們對通信的要求不僅是通信網(wǎng)絡(luò)中信號的穩(wěn)定、可靠,還要能滿足人們對不同業(yè)務(wù)的獲取。而交換機(jī)在通信網(wǎng)中起著不可替代的作用,交換機(jī)安全、穩(wěn)定和可靠地運行是通信信號穩(wěn)定、可靠和人們獲得業(yè)務(wù)的基本保證。其體系結(jié)構(gòu)從縱橫式到共享存儲式到高速總線式,經(jīng)歷了漫長而曲折的過程。不管采用什么結(jié)構(gòu)體系的交換機(jī),一旦投入使用,就要求其在通信網(wǎng)絡(luò)中能不間斷的進(jìn)行工作,保障通信不中斷,所以對交換機(jī)的日常維護(hù)和外部環(huán)境的監(jiān)控是維護(hù)人員要高度重視的長期而復(fù)雜的工作。
[1]張文冬.程控數(shù)字交換技術(shù)原理[M].北京:北京郵電大學(xué)出版社,1994.
[2]沈金龍.現(xiàn)代電信交換和網(wǎng)絡(luò)[M].北京:人民郵電出版社,2001.
[3]黎連業(yè).交換機(jī)及其應(yīng)用技術(shù)[M].北京:清華大學(xué)出版社,2004.234.
[4]陳維言.電話交換技術(shù)[M].北京:人民郵電出版社,1995.78. .
[5]葉敏.程控數(shù)字交換與交換網(wǎng)[M].北京:北京郵電大學(xué)出版社,2003.96.
[6]李大來.S1240程控交換機(jī)操作與維護(hù)[M].北京:人民郵電出版社,1994.204.
[7]張曙光,李茂長.電話通信網(wǎng)與交換技術(shù)[M].北京:國防工業(yè)出版社,2002.105.
[8]索紅光,王海燕,趙清杰,于峰,石樂義.現(xiàn)代通信技術(shù)概論[M].北京:國防工業(yè)出版社,2005.24.