摘? 要:南寧市東盟國際信息園是中國電信的重要保障區(qū)域,在東盟國際信息園機房里,多臺BBU均出現(xiàn)GPS異常告警,導(dǎo)致大量用戶的手機無法接入小區(qū),不能正常上網(wǎng)、打電話。在故障處理過程中,首先檢查了GPS系統(tǒng),更換了從機后,故障有所改善,但是不久后發(fā)現(xiàn),并未徹底解決問題。后來,經(jīng)反復(fù)探索創(chuàng)造了一種處理GPS和A設(shè)備故障的新方法,更換主機和從機,新增從機并更換端口,檢查A設(shè)備并進(jìn)行巧妙的散熱處理,這個多BBU疑難故障最終迎刃而解,使用戶的無線通信得以快速恢復(fù)正常。
關(guān)鍵詞:東盟國際信息園BBU;GPS故障;主機;從機;A設(shè)備;過熱
中圖分類號:TN929.5? ? 文獻(xiàn)標(biāo)識碼:A? ? 文章編號:2096-4706(2023)18-0047-04
A New Method to Solve BBU Difficult Faults Based on GPS and A Equipment
LIU Lirong
(Scene Comprehensive Maintenance Center, China Telecom Nanning Branch, Nanning? 530012, China)
Abstract: The ASEAN International Information Park in Nanning is an important guarantee area for China Telecom. In the generator room of the ASEAN International Information Park, several BBUs have GPS abnormal alarms, resulting in the inability of a large number of users' mobile phones to access the cell, then they could not access to the internet and make calls. In the process of troubleshooting, the GPS system is checked first, and the slave machine is replaced. The faults are improved, but it is found later that the problem is not completely solved. Later, after repeated exploration, a new method to deal with GPS and A equipment faults is created, including replacing the host machine and the slave machine, adding a new slave machine and changing the port, checking A equipment and conducting ingenious heat dissipation treatment, so that the troublesome faults of several BBUs are finally solved, and the user's wireless communication is quickly restored to normal.
Keywords: BBU in the ASEAN International Information Park; GPS fault; the host machine; the slave machine; A equipment; overheating
0? 引? 言
南寧市東盟國際信息園是中國電信廣西公司三樞紐及一大批重要產(chǎn)業(yè)基地的所在地,是中國電信的重要保障區(qū)域。2022年4月中旬,東盟國際信息園及附近一帶出現(xiàn)大量用戶投訴,經(jīng)過核查華為無線網(wǎng)管發(fā)現(xiàn),東盟國際信息園機房的多臺BBU同時出現(xiàn)時鐘參考源異常告警,即GPS告警[1],造成BBU下帶的相關(guān)小區(qū)雖然在華為無線網(wǎng)管上顯示狀態(tài)正常,但是,實際接入的用戶數(shù)為0,意味著這一帶的電信用戶已經(jīng)無法正常上網(wǎng)、打電話[2,3]。
東盟國際信息園的建筑以大型商務(wù)辦公樓為主,所以其基站形式以室內(nèi)分布系統(tǒng)(簡稱室分)為主,宏站為輔。室分可以分為兩大場景:住宅室分和平層室分,對于東盟國際信息園來說,平層室分可以為大型商務(wù)辦公樓內(nèi)部提供無線信號,宏站可以為大型商務(wù)辦公樓外側(cè)、路面、附近居民區(qū)提供無線信號[4]。因此,東盟國際信息園機房的BBU以室分BBU為主,宏站BBU為輔。在大型平層室分中,GPS系統(tǒng)是不可或缺的重要結(jié)構(gòu),缺少GPS系統(tǒng)或者GPS系統(tǒng)發(fā)生故障的大型平層室分,會因為無法搜星而失去正常工作的能力,導(dǎo)致用戶無法成功接入室分小區(qū)[5]。GPS告警是大型平層室分中常見的故障,但是也屬于處理難度較大的故障[6],牽一發(fā)而動全身,一旦此類故障發(fā)生,將會造成較大范圍的無線信號異常,極易引發(fā)用戶投訴,但是,此類故障的真正原因往往較難定位,給故障排查和處理工作帶來不少的麻煩[7]。
1? 分析過程
目前,研究無線通信系統(tǒng)GPS告警的論文較少[8],而且對實際故障的處理缺乏明確的指導(dǎo)意義,因而,當(dāng)前亟需一種步驟明確、目標(biāo)清晰、操作簡便、效果明顯的GPS故障處理方法,才能解決這個領(lǐng)域的難題。此外,東盟國際信息園機房里除了GPS告警,還存在BBU和A設(shè)備告警,需要一并進(jìn)行處理干凈,不留下設(shè)備隱患。綜合考慮上述因素,針對GPS系統(tǒng)、從機、主機、端口、A設(shè)備、空調(diào)等對象,經(jīng)過反復(fù)探索和嘗試,本文創(chuàng)造了一種基于GPS和A設(shè)備解決BBU疑難故障的新方法,取得的故障處理效果較為顯著,可以為通信行業(yè)其他企業(yè)提供參考借鑒。
分析和處理該故障的過程比較曲折,大致可以將該過程分為以下5個步驟:檢查GPS系統(tǒng)、更換從機、更換主從機、新增從機并更換端口、A設(shè)備檢查與散熱,下面對這5個步驟分別進(jìn)行介紹。
2? 解決措施
2.1? 檢查GPS系統(tǒng)
首先,經(jīng)過現(xiàn)場檢查,出現(xiàn)故障的BBU對應(yīng)的GPS及其饋線都沒有出現(xiàn)異常情況。但是,雙星授時系統(tǒng)的主機和從機是否能帶得動?xùn)|盟國際信息園機房里的20多臺BBU是存在疑問的。后來,經(jīng)過與督導(dǎo)探討核實,該主機和從機是由中興廠家生產(chǎn)的,其結(jié)構(gòu)是GPS系統(tǒng)中的常見結(jié)構(gòu):主機連接兩路GPS天線;從機上聯(lián)至主機,獲取時鐘信號,從機的主要作用是彌補主機的端口不足,可以擴展下帶更多BBU;主機和從機都具有放大時鐘信號功率的作用。該從機的名稱為:GPS/北斗雙頻時鐘分配器從機,如圖1所示。
2.2? 更換從機
由于現(xiàn)場GPS系統(tǒng)檢查和后臺華為無線網(wǎng)管觀察均未能直接發(fā)現(xiàn)故障原因,可以認(rèn)為,從機發(fā)生故障的可能性比較大。為了驗證這一判斷,需要更換一臺從機,然而,代維倉庫和工程倉庫都沒有該備件可以提供,聯(lián)系中興廠家發(fā)貨到達(dá)南寧至少需要兩三天,這對于緊急故障處理來說是不能允許的。此時,恰好找到一臺華為廠家贈送試用的雙星授時系統(tǒng)從機,雖然不是中興設(shè)備,但是也可以通過試用一小段時間,觀察試用效果。該從機的名稱為:通用衛(wèi)星信號分配單元GDU,如圖2所示。
當(dāng)天晚上,換上該從機之后,從后臺華為無線網(wǎng)管可以看到,東盟國際信息園機房的各個BBU的GPS告警相繼都恢復(fù)了,現(xiàn)場也沒有發(fā)現(xiàn)其他設(shè)備故障。
2.3? 更換主從機
然而,過了一段時間之后,東盟國際信息園機房的多臺BBU居然再次出現(xiàn)了GPS告警,經(jīng)過檢查,仍然無法確定其故障原因??紤]到中興生產(chǎn)的主機下帶華為生產(chǎn)的從機有可能會出現(xiàn)不匹配的情況,所以,只能聯(lián)系中興廠家按原來的型號寄來了一套中興主機和從機,然而,更換這套中興主機和從機上去之后,GPS告警并沒有在華為無線網(wǎng)管上清除。這令排查工作一度陷入困境。
2.4? 新增從機并更換端口
為了徹底查找出故障的真正原因,中國電信南寧分公司的電信維護(hù)主管與中興廠家專家、督導(dǎo)、代維、施工隊多方聯(lián)合到現(xiàn)場進(jìn)行研究,探討在之前的檢查中可能存在的細(xì)節(jié)遺漏。為了排除BBU數(shù)量多對GPS系統(tǒng)的影響,新增了一臺同型號的中興從機,并使兩臺中興從機下帶BBU的數(shù)量大致相同。
在現(xiàn)場檢查中發(fā)現(xiàn),主機有A1/B1和A2/B2這兩組端口,從機上聯(lián)的是B1和B2這兩組端口,經(jīng)過中興廠家專家確認(rèn),這是錯誤的接法,正確的接法應(yīng)該是從機上聯(lián)至主機的兩個ANTOUT口(即天線輸出口)。按照正確的接法修改好連接之后,經(jīng)過華為無線網(wǎng)管觀察確認(rèn),GPS告警已經(jīng)全部恢復(fù)了。A1/B1、A2/B2和ANTOUT端口如圖3和圖4所示。
2.5? A設(shè)備檢查與散熱
然而,解決GPS告警并不是本次故障處理的終點,在故障處理過程中,還發(fā)現(xiàn)有一臺A設(shè)備中斷了,其下帶4臺BBU,從華為無線網(wǎng)管上可以觀察到,這4臺BBU是剛中斷不久,之前一直沒有中斷過,所以,這算是意外的發(fā)現(xiàn)。經(jīng)過檢測,該A設(shè)備的兩個路由的收光和發(fā)光都是正常的,現(xiàn)場下電并重啟A設(shè)備后,該A設(shè)備恢復(fù)了,但是5個小時之后,經(jīng)過A設(shè)備的網(wǎng)管人員核實,A設(shè)備再次中斷了。為了驗證A設(shè)備的中斷與其上聯(lián)的B設(shè)備有沒有關(guān)系,當(dāng)天晚上0時,到江南區(qū)黃茅坪分局的B設(shè)備機房,測到從A設(shè)備過來的收光值是-20,光衰較大,可能是尾纖有故障,于是,次日上午,光纜維護(hù)員來江南區(qū)黃茅坪分局的B設(shè)備機房重新跳纖,使A設(shè)備過來的收光值達(dá)到-14,這是在正常值范圍內(nèi)的。但是,此時A設(shè)備依然處于中斷狀態(tài),這就說明A設(shè)備中斷的原因和光路沒有直接關(guān)系。
為了排查A設(shè)備中斷可能存在的其他關(guān)聯(lián)因素,回到A設(shè)備和BBU的機房現(xiàn)場,在觸摸設(shè)備表面外殼時發(fā)現(xiàn),A設(shè)備和BBU的表面燙手,溫度明顯高于正常范圍,按照平時的維護(hù)經(jīng)驗分析,溫度過熱很可能會影響設(shè)備的正常工作。該機房里只有兩臺空調(diào),但是各種設(shè)備卻很多,擺放比較密集,空調(diào)的冷風(fēng)難以全面覆蓋所有設(shè)備。為了能夠更好地散發(fā)熱量,把A設(shè)備所在機柜的門拆卸下來,并調(diào)整空調(diào)的擺放位置和風(fēng)向,使冷風(fēng)能正面吹到A設(shè)備,過了片刻之后,下電并重啟A設(shè)備,A設(shè)備自行恢復(fù)正常了。
3? 實施效果
在整個排查和處理過程結(jié)束之后,通過華為無線網(wǎng)管觀察連續(xù)一周的告警數(shù)據(jù)后發(fā)現(xiàn),東盟國際信息園機房的所有BBU沒有再出現(xiàn)GPS告警,A設(shè)備也沒有再中斷過,這一帶的用戶都能正常接入小區(qū),各項無線網(wǎng)絡(luò)優(yōu)化指標(biāo)也均正常。經(jīng)過電話回訪,之前不能用手機上網(wǎng)、打電話的用戶都表示已經(jīng)可以正常使用了。中國電信南寧分公司的領(lǐng)導(dǎo)也對本次緊急故障的快速解決表示肯定。
因此,在本次故障處理中涉及的5個步驟(檢查GPS系統(tǒng)、更換從機、更換主從機、新增從機并更換端口、A設(shè)備檢查與散熱)是正確的、有效的、實用的,是摸排并解決多BBU場景下的GPS疑難故障的一種全新方法。
4? 結(jié)? 論
通過本次故障處理實踐,可以總結(jié)出以下結(jié)論和經(jīng)驗:
1)復(fù)雜的故障往往可能擁有簡單的原因,但簡單的原因往往需要專業(yè)、細(xì)致、全面、深入的方式方法才能被摸索出來,而且還要敢于不斷試錯、不斷改進(jìn)方法,面對失敗不灰心氣餒,要敢于從非常規(guī)的角度去思考疑難故障原因。
2)本文提出的一種基于GPS和A設(shè)備解決BBU疑難故障的新方法,主要分為以下5個步驟:檢查GPS系統(tǒng)、更換從機、更換主從機、新增從機并更換端口、A設(shè)備檢查與散熱。這5個步驟是有先后順序的,但是并不一定需要把這些步驟全部做完才能處理好GPS異常告警,只要能夠使該告警得到清除,可以只進(jìn)行其中的某幾個步驟。
3)檢查GPS告警時,可以優(yōu)先檢查雙星授時系統(tǒng)的主機和從機是否有故障、是否能夠帶得動眾多BBU,但是,如果經(jīng)過更換、新增主機和從機后還是無法解決問題,可以考慮檢查從機和主機之間的接線是否正確,若接線出現(xiàn)錯誤,應(yīng)該及時糾正。
4)通信設(shè)計院在制作室分方案時,最好能在圖紙上明確標(biāo)出GPS系統(tǒng)的主要接線端口和線序,方便施工隊準(zhǔn)確識別。而且,繪制圖紙的設(shè)計師應(yīng)該在施工前向施工隊做好全面、詳細(xì)的交底工作,把GPS系統(tǒng)接線等容易忽略的細(xì)節(jié)交代清楚。
5)施工隊?wèi)?yīng)該加強內(nèi)部人員的專業(yè)技能培訓(xùn),注重操作細(xì)節(jié)交底,缺乏經(jīng)驗的新進(jìn)人員要由經(jīng)驗豐富的老員工帶班進(jìn)行現(xiàn)場安裝指導(dǎo),避免低級錯誤發(fā)生,確保接線端口順序、設(shè)備安裝位置均準(zhǔn)確無誤。
6)工程竣工后,在設(shè)備和工藝驗收階段,監(jiān)理和代維除了驗收RRU、直放站等主設(shè)備外,還應(yīng)該注意驗收GPS系統(tǒng)等容易忽視的細(xì)節(jié),并且現(xiàn)場測試信號強度、網(wǎng)速,確認(rèn)能否正常上網(wǎng)、打電話,盡可能在現(xiàn)場發(fā)現(xiàn)問題,向施工隊提出整改建議。
7)遇到較為復(fù)雜的設(shè)備故障,經(jīng)過現(xiàn)場仔細(xì)檢查仍然無法摸清處理思路,應(yīng)該邀請廠家專家、督導(dǎo)到現(xiàn)場指導(dǎo)操作,明確處理方向,及時發(fā)現(xiàn)細(xì)節(jié)問題,避免在錯誤的道路上越走越遠(yuǎn),浪費時間。
8)處理BBU故障時,應(yīng)該注意觀察A設(shè)備有無故障,如果出現(xiàn)A設(shè)備中斷或閃斷等故障,可以從收光、發(fā)光和過熱等角度去考慮故障原因,并且要注意聯(lián)系B設(shè)備和空調(diào)的狀態(tài)進(jìn)行考慮,不要遺漏可能引發(fā)故障的不常見因素。
9)在BBU、A設(shè)備等各類設(shè)備較多的機房,要合理地放置空調(diào)的位置,控制好風(fēng)向,如果遇到冷風(fēng)難以覆蓋關(guān)鍵設(shè)備的情況,可以考慮拆卸下機柜的門,確保關(guān)鍵設(shè)備能夠及時散出熱量,如果條件允許,可以通知鐵塔公司安排新增一臺空調(diào),盡最大可能消除潛在的故障隱患。
參考文獻(xiàn):
[1] 王洪軍.中興NODE-B基站故障探討 [C]//2011年通信與信息技術(shù)新進(jìn)展——第八屆中國通信學(xué)會學(xué)術(shù)年會論文集.武漢:國防工業(yè)出版社,2011:117-119.
[2] 李曉明.TD-LTE無線網(wǎng)絡(luò)高層建筑覆蓋技術(shù)研究與應(yīng)用 [J].移動通信,2015,39(17):22-23.
[3] 王方正,張文超.LTE室內(nèi)分布系統(tǒng)典型建設(shè)方案研究 [J].中國新通信,2014,16(4):123-125.
[4] 趙東亮.LTE室內(nèi)分布系統(tǒng)演進(jìn)方案研究 [J].中國科技縱橫,2014(18):22.
[5] 彭博.GPS時鐘同步在無線通信系統(tǒng)中的應(yīng)用 [J].中國新通信,2016,18(12):83.
[6] 張鵬. 關(guān)于GPS隱性故障在CDMA優(yōu)化中的解決探討 [C]//2014信息通信網(wǎng)技術(shù)業(yè)務(wù)發(fā)展研討會.北京:北京通信學(xué)會,2014.
[7] 羅小光,劉加勇.TD-LTE網(wǎng)絡(luò)時鐘授時故障定位與分析 [J].信息通信,2017(5):197-198.
[8] 曹美芬.LTE分布式基站中可拓展式BBU告警系統(tǒng)的設(shè)計和實現(xiàn) [D].陜西:西安電子科技大學(xué),2019.
作者簡介:劉力榮(1993-),男,漢族,廣西博白人,工程師,碩士研究生,研究方向:無線網(wǎng)絡(luò)維護(hù)與優(yōu)化。