国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中興BSC-LAPD單板故障引起業(yè)務中斷的處理

2014-08-08 17:21:31楊寧
無線互聯(lián)科技 2014年6期
關鍵詞:故障

楊寧

摘要:本文從中興設備的一次無規(guī)律的群發(fā)性斷站故障的處理出發(fā),分別總結了故障的現(xiàn)象、原因及反映問題,并針對故障的產(chǎn)生制定了相應的規(guī)避措施及改進建議,在此基礎上系統(tǒng)地整理了相關對應關系的資料,提出了針對此類故障的一般解決思路和方法,供大家參考。

關鍵詞:LAPD;斷站;故障;處理1故障處理過程

我公司GSM網(wǎng)絡基站控制器采用的是中興ZXR10-IBSC,2011年某日,某BSC下轄的羅莊湯莊等共15個基站同時出現(xiàn)斷站,經(jīng)對中興基站網(wǎng)管進行告警查詢,發(fā)現(xiàn)與其他斷站障礙告警碼一致,出現(xiàn)“站點LAPD斷告警(16785414)”的同時也都出現(xiàn)了“機架LAPD斷告警(16785409)”。于是值班人員分別查看了基站所處位置的電源、傳輸情況,這15個站并不在同一條傳輸鏈上或是同一物理區(qū)域內(nèi),基本排除傳輸和電源的故障。經(jīng)檢查BSC的資源分配,這15個站點都分布在同一BSC上,故對BSC級單板進行歷史通知、歷史告警和現(xiàn)網(wǎng)告警的查詢,一條與斷站告警幾乎同時出現(xiàn)的告警引起了我們的關注,即“單板和歸屬模塊之間的控制面通訊異常(8393985)”告警,而發(fā)生位置是IBSC中1架1框4槽位的單板,CPU序號為2,經(jīng)查看設備面板框圖,發(fā)現(xiàn)處于1架1框4槽的單板是SPB板(信令處理板),分別用于處理局間的MTP層(消息傳遞部分)信令、基站與BSC之間的LAPD信令及Gb接口信令。而該位置上所配置的SPB板邏輯上是用于處理LAPD信令的。從而我們通過實時的動態(tài)控制對411位置(1架1框4槽)的SPB板的4個CPU分別進行“CPU占用率查詢”操作,結果四個CPU中CPU2沒反應。進一步對業(yè)務中斷站點進行資源的查詢,發(fā)現(xiàn)中斷基站全部位于該LAPD的下,初步判斷該板故障,本著先恢復現(xiàn)場業(yè)務思路,對CPU2進行復位的時候,但無任何反應,故確定該單板中的CPU2出現(xiàn)了故障。于是本著先恢復業(yè)務,再進一步分析總結障礙的思路,我們利用備板更換了故障單板,該故障恢復。

2故障原因分析

2.1 LAPD板的工作原理

2.1.1 LAPD板與SPB板的對應

LAPD板是一個邏輯概念,它的物理單板對應SPB板(信令處理板),SPB板有下列屬性:⑴對外提供16路E1/T1接口。⑵單板含有4個CPU處理單元。⑶根據(jù)板子上所加載的軟件的不同,SPB板可用作邏輯單板:LAPD、信令處理板SPB和Gb接口處理板GIPB等。1)LAPD板主要完成LAPD信令的處理;2)信令處理板SPB主要完成局間信令的處理;3)Gb接口處理板GIPB完成GPRS的FR(全速率)、NS(網(wǎng)絡業(yè)務)和部分BSSGP(基站子系統(tǒng)GPRS協(xié)議)處理,并完成Gb接口(PCU至SGSN的接口)功能。

2.1.2 SPB板由以下5個單元組成

⑴接口單元:與電路交換單元連接,提供E1接口功能。

⑵電路交換單元:對接口單元的電路和來自背板的電路實現(xiàn)交換功能。

⑶CPU單元:完成信令處理、單板管理和內(nèi)部接續(xù)控制。

⑷控制面交換單元:完成控制面數(shù)據(jù)交換并提供控制面FE口。

⑸媒體面交換單元:完成用戶面數(shù)據(jù)交換并提供用戶面面FE口。

2.1.3 單板數(shù)據(jù)流向說明

來自E1口或背板的數(shù)據(jù)經(jīng)過接口單元處理,送至電路交換單元交換,然后送至CPU單元處理,最后通過交換單元送至其他單板處理。

2.2 基站至基站控制器之間LAPD信令的處理流程

來自BTS(基站)的LAPD信令由DTB/SPB板接入,通過本資源框UIMU(用戶面通用接口模塊)單板上的電路交換網(wǎng)交換到LAPD板,由LAPD板完成LAPD信令第二層的處理,之后LAPD板再將處理完的信令消息通過本資源框UIMU單板送至處理器框中的UIMC(控制面通用接口模塊)單板,再由UIMC送至CMP(處理控制板)單板,由CMP板完成LAPD信令第三層的消息處理。

2.3 LAPD板的用途及配置

⑴LAPD板的用途及配置:基站至基站控制器之間的A-bis口上所承載的信令為LAP-D信令,用來處理LAPD信令的板子為LAPD板。對于一個單機架的IBSC來說,一般配置一個資源框的2塊SPB板用作LAPD板,主要完成LAPD信令的處理。而對于雙機架的IBSC來說,可配置2-3個資源框,這樣就可配置4-6塊LAPD板。1個LAPD板便對應1個模塊。

⑵LAPD板的處理容量:對于老的V2的BSC來說,一塊LAPD板可支持處理40條A-bis口上的信令鏈路(對應基站至基站控制器間一個2M的1個時隙),假設一個基站至一個BSC只開通了1條LAPD信令,這樣理論上一塊LAPD板可支持約40個基站的接入,再加上冗余方面的考慮,一塊LAPD板最多可支持40個載頻上所傳送信令的處理。對于新的IBSC來說,1塊LAPD板可支持處理384條LAPD信令鏈路,理論上1個基站6塊載頻中所承載的信令消息可復用至1條LAPD信令上傳送,這樣理論上1塊LAPD板可處理384*6個載頻中所傳遞的信息。而實際上因1塊LAPD板就對應1個模塊,1個模塊最大可支持512條載頻,這樣1個LAPD板最多便可處理512條載頻中所承載的信息。

⑶LAPD板中4個CPU的分配原則:1個LAPD板中有4個CPU,對應硬件的4個芯片,在增加基站的人機命令中,我們找不到可以指定某一塊SPB板、某一個CPU的命令參數(shù),從而哪塊SPB板、某一塊SPB板的哪個CPU具體負責哪些基站LAPD信令的處理是系統(tǒng)默認分配的,并不是人工指定的。假設系統(tǒng)認為1個LAPD板中1個CPU最多能處理20個基站的A-bis口信令,那么我們在添加基站數(shù)據(jù)時,前面加的20個基站便由系統(tǒng)分配到第一個CPU負責,而第21個基站A-bis口信令便由第二個CPU負責。而且哪個CPU負責哪些站無法通過人機命令顯示出來,只能通過前臺ORACLE數(shù)據(jù)的方式依次導出。

2.4 分析結論

邏輯上的LAPD板物理對應SPB板,用來處理基站至基站控制器之間LAPD信令的第二層,充當著信令終端的功能,而其中4個CPU通過負荷分擔的方式分別處理一部分基站的LAPD信令,由于用來處理LAPD信令的SPB板中一個CPU故障,使得該CPU所負責處理的那部分基站的LAPD通信鏈路中斷,與該CPU相關的所有站點的信令鏈路中斷,系統(tǒng)業(yè)務無法正常進行。

3故障總結及改進措施

3.1 對相關資料進行健全與完善

此類故障出現(xiàn)時,由于我們只有基站與數(shù)字中繼板DTB的對應資料和基站與LAPD板的對應關系,缺少基站與LAPD板中某一個CPU的對應資料,在本次故障的處理中,雖然出現(xiàn)了一條幾乎同時的告警,但由于缺少基站與LAPD單板中CPU的對應關系,仍然給故障的判斷帶來困難,拖延了處理時限。因此應加強基本資料的隨時整理和保存?zhèn)浞荨?/p>

3.2 加強設備的預防性維護工作,及時消除故障隱患

對于IBSC來說,1塊LAPD板具有著支持384條LAPD信令鏈路、512條載頻信息處理的超大容量,集成度高的同時的也帶來了安全方面的隱患,一塊SPB板的故障,將可能引起上百個站的斷站。由于此類單板沒有相關的主備模式可以配置,只能加強對設備的預檢預修,制定相關的測試計劃,在話務閑時依次把LAPD板全部定期測試一遍,便于及時發(fā)現(xiàn)故障隱患,將故障消除在萌芽狀態(tài)。針對此類單板獨特的重要性,建議在所有的IBSC機房都全部配齊必要的備件和維修工具,并定期檢測,保證備板的有效性,便于出現(xiàn)故障時及時更換,縮短故障恢復歷時。

3.3 定期檢查IBSC/BSC的告警信息,及時發(fā)現(xiàn)設備存在的隱患

經(jīng)過檢查中興網(wǎng)管中的歷史告警,我們發(fā)現(xiàn)同樣的“單板和歸屬模塊之間的控制面通訊異常(8393985)”告警、同樣的位置下此前也出現(xiàn)過一次,但是該告警瞬間就恢復了,并沒有影響到斷站,從而也就沒有引起維護人員的注意。此次故障告誡我們應定期檢查IBSC/BSC的歷史告警信息,認真地對待并分析每一次告警,即使是瞬間告警也不能放過,說不定這一次的瞬斷就是下一次嚴重故障的隱患所在。

3.4 修改LAPD單板的相關告警級別

LAPD單板的“單板和歸屬模塊之間的控制面通訊異常(8393985)”告警為重要告警,而由于IBSC的LAPD單板獨特的重要地位,為了引起監(jiān)控值班人員的重視,我們修改了LAPD單板的“單板和歸屬模塊之間的控制面通訊異常(8393985)”的告警級別,將其置為與斷站相同的嚴重告警,便于及時發(fā)現(xiàn)此類故障,及時修復,減少對網(wǎng)絡的影響。

3.5 對BSC/IBSC的常見硬件處理方法和思路進行總結,并開展培訓,使每一位維護人員都能熟練掌握

以下是常見故障的解決思路:

⑴倒換復位法:對于相應的硬件告警,首先可以采用復位單板的方法來確認是否是永久性故障,還是暫時性運行故障。到前臺直接插拔單板,有時候比在后臺遠程復位更有效。

⑵替換法:在硬件排查中,這是一個行之有效的方法。將有告警的單板和正常運行的單板交換槽位,看是否告警跟著走,就可以確定故障原因是單板問題,還是槽位、線纜的問題。也可以用備件替換。

⑶數(shù)據(jù)重新裝載:單板軟件、基站數(shù)據(jù)重新裝載可以清除系統(tǒng)內(nèi)部的混亂數(shù)據(jù),有時候可以有效的解決非硬件故障。

⑷打印、信令分析:當基本的硬件排查仍無法解決故障時,前后臺的打印日志,以及Abis口、A口以及GB口的信令跟蹤消息,能很好的幫助我們定位故障。

⑸撥打測試:對于基站下通話異常的情況,閉塞時隙(或逐個指定載頻時隙和A口時隙,進行指定中繼撥打),然后依次進行撥打測試,能準確地定位故障。

3.6 對LAPD單板故障的故障現(xiàn)象、原因及處理步驟進行總結,并打印、在所有IBSC機房上墻,寫入設備的應急預案中,便于緊急情況下及時處理

以下是詳細LAPD板故障后的處理步驟:

3.6.1 LAPD單板故障

⑴故障現(xiàn)象:整個LAPD板無法正常運行。LAPD通信鏈路中斷,與該LAPD板對應的所有站點的信令鏈路中斷,基站退服。

⑵故障原因:LAPD板與MP之間的通信斷、硬件故障、時鐘丟失等均會導致此告警。

⑶故障處理

1)檢查LAPD板是否上電或插緊。2)檢查時鐘板是否異常,如果異常則首先排除時鐘故障。3)復位LAPD板,觀察故障是否存在。4)檢查后背板連線是否有松動或異常。5)檢查 ECOM板版本,如有問題重新下載ECOM板。6)如果上述措施無效,則更換單板。⑷注意事項:接觸單板或部件時必須帶防靜電手環(huán)。

3.6.2 LAPD單板中的某個CPU故障

⑴故障現(xiàn)象:一塊LAPD單板中的某個CPU無法正常運行。LAPD 通信鏈路中斷,與該LAPD板某個CPU相關的所有站點的信令鏈路中斷,基站退服。而與該LAPD板中其他CPU相關的所有站點都正常。往往出現(xiàn)“單板和歸屬模塊之間的控制面通訊異常(8393985)”的告警,在“發(fā)生位置”一欄,系統(tǒng)會標明架號、框號、槽號及CPUNO號。

⑵故障原因:LAPD單板中某個CPU與 MP之間的通信斷、硬件故障、時鐘丟失等均會導致此告警。

⑶故障處理

1)對LAPD板的檢查同上述“LAPD單板故障”步驟;2)對出現(xiàn)告警的CPU執(zhí)行“CPU占用率查詢”操作,看CPU的返回狀態(tài);3)對LAPD單板中出現(xiàn)告警的CPU進行手工復位,觀察故障是否存在;4)檢查后背板連線是否有松動或異常;5)重新裝載單板;6)如果上述措施無效,則更換單板。

4)注意事項:接觸單板或部件時必須帶防靜電手環(huán)。

4總結與體會

一次斷站故障的出現(xiàn)并不可拍,可怕的是對故障的熟視無睹,只要能夠及時總結故障產(chǎn)生的深層次原因,從而制定相應的措施予以規(guī)避,相信我們的網(wǎng)絡會越來越堅強,各項維護指標及服務指標會越來越好。在今后的故障處理中,我們?nèi)詫猿帧叭环胚^”的原則,即不查明故障原因不放過、不制定預防措施不放過、不舉一反三不放過,變被動為主動,不斷地總結維護經(jīng)驗、提高維護水平,為建設聯(lián)通精品網(wǎng)絡而努力。

猜你喜歡
故障
故障一點通
奔馳R320車ABS、ESP故障燈異常點亮
WKT型可控停車器及其故障處理
基于OpenMP的電力系統(tǒng)并行故障計算實現(xiàn)
電測與儀表(2016年5期)2016-04-22 01:13:50
故障一點通
故障一點通
故障一點通
故障一點通
故障一點通
江淮車故障3例
阜新| 杂多县| 宜宾市| 娄烦县| 赤壁市| 甘南县| 城固县| 武鸣县| 康保县| 济阳县| 马公市| 莱州市| 裕民县| 胶州市| 光山县| 昭通市| 镇宁| 高密市| 平潭县| 全南县| 云和县| 桂东县| 大埔县| 兴国县| 静海县| 肃北| 普定县| 霍山县| 彭水| 文昌市| 临猗县| 清远市| 西吉县| 阿荣旗| 岑溪市| 聂荣县| 乡宁县| 张家港市| 松阳县| 五大连池市| 益阳市|