答嘉曦+黃政力+楊炎坤+李憲鋒
【摘要】針對基站隱性故障檢測難題,研究多種檢測手段結合互補,對后臺異常性能指標進行分析,篩選出存在隱性故障的小區(qū)及定位故障所在設備,借助用雷卡測試儀表進行檢測和處理驗證,并通過試點案例分析研究出能準確快速定位隱性故障的方法。
【關鍵詞】基站隱性故障異常指標雷卡
中圖分類號:TN929.5文獻標識碼:A文章編號:1006-1010(2014)-08-0090-07
Analysis of Hidden Failure Detection and Handling Methods of Base Station
DA Jia-xi1, HUANG Zheng-li1, YANG Yan-kun2, LI Xian-feng2
(1. China Mobile Group Guangdong Co., Ltd., Guangzhou 510627, China;
2. Shenzhen Kehong Communications Co., Ltd., Shenzhen 518048, China)
[Abstract] To solve the recessive failure (HF) detection problems of base transceiver station (BTS), various detection means is studied and combined, and the abnormal performance indicators (API) of the background are analyzed. The cells existing HF and the devices existing locating faults are selected to be detected and verified by Reka test instruments. In addition, the studied method which can locate HF fast and accurately is analyzed by pilot cases.
[Key words]base stationhidden failureAPIReka
1 引言
在網(wǎng)絡故障處理及網(wǎng)絡優(yōu)化中,有部分問題點出現(xiàn)得比較隱蔽,故障的原因同樣也比較隱蔽,通常這類故障不能及時被發(fā)現(xiàn)。因此,對于隱性問題的發(fā)現(xiàn)、排查和處理,必須作為維護工作中重點關注的內容之一。本文主要對愛立信RBS2000系列主設備隱性問題的發(fā)現(xiàn)、排查步驟進行闡述,并通過典型問題及案例進一步指導網(wǎng)絡優(yōu)化分析和維護人員排查,快速、準確地定位和處理隱性故障,其他系列(RBS6000)主設備可以借為參考使用。
2 網(wǎng)絡異常指標分析
從異常指標入手,本文通過列舉硬件隱性故障在指標方面的表現(xiàn)(不包含上行干擾類),并根據(jù)實驗出來的經(jīng)驗,提出故障引起異常指標的隱性故障參考門限經(jīng)驗值,所有數(shù)據(jù)均基于實際網(wǎng)絡測試和搜集。
在隱性問題的發(fā)現(xiàn)上,主要有兩種話務數(shù)據(jù)的分析方式:一是通過性能指標的門限值來判斷指標是否超標,網(wǎng)絡存在問題;二是通過性能指標的突變來監(jiān)控網(wǎng)絡質量,特別是重要指標的突變往往意味著網(wǎng)絡質量發(fā)生了嚴重的問題。
從基站(愛立信)隱性故障,直接或間接引起網(wǎng)絡性能指標(涉及指標均以愛立信為準)異常,主要指標包括:STS、MRR、MOTS和A+A-bis(省網(wǎng)絡綜合分析平臺指標)。通過對上述指標進行分析,綜合現(xiàn)場檢測定位情況,查找出隱性故障所在,目的是能夠快速處理網(wǎng)絡隱患,減少基站退服和用戶投訴。
2.1話務統(tǒng)計數(shù)據(jù)分析
STS、MRR、MOTS指標故障參考值如表1所示。
(1)STS指標分析
通過對五大類進行綜合分析,找出隱性故障小區(qū)的相關性和規(guī)律性特征。
◆SDCCH性能指標
主要異常體現(xiàn):
SDCCH通話時長一般為2~5s,當存在干擾時,由于解碼速度降低會導致通話時長加長,但在這種情況下都不會超過5s。若出現(xiàn)通話時長達到7~8s甚至10s以上,出現(xiàn)硬件故障的可能性很大。
◆TCH性能指標
主要異常體現(xiàn):
信道完好率:若持續(xù)不能達到100%且沒有告警,則可能是TRU或者DXU故障,由于隱性故障導致該小區(qū)經(jīng)常無法正常占用信令時隙。
話音接通率:小區(qū)非擁塞時話音接通率較低,可懷疑存在隱性故障。
TCH掉話及T占用時長:掉話會導致T占用時長過短,主要是由于突然掉話增多,因此當小區(qū)掉話或T占用時長出現(xiàn)異常時,可能存在隱性故障。
◆切換性能指標
主要異常體現(xiàn):
內切嚴重:當通話一旦建立或轉移到故障載波時,就會引起內切。正常情況下,一個小區(qū)在一小時的內切次數(shù)最多不超過50次。當出現(xiàn)小區(qū)內切次數(shù)在一小時內達到上百次甚至500次以上時,很有可能是出現(xiàn)了載波故障。
◆干擾性能
主要異常體現(xiàn):
上行干擾:隱性故障所產(chǎn)生的干擾和直放站所產(chǎn)生的干擾有著比較明顯的區(qū)別。隱性故障產(chǎn)生的干擾往往是2、3級居多,通常占到15%~30%;直放站的干擾則是4、5級居多。
◆話音質量
主要異常體現(xiàn):
上行話音質量:隱性故障產(chǎn)生可以結合干擾性能,再根據(jù)RLCRP指令查看干擾的分布情況,是否在同一個載波或同一個CDU上面。
下行話音質量:隱性故障可以是X-BUS存在故障引起,現(xiàn)場檢測可以通過對比開/關跳頻前后的質量情況進行分析。
(2)MRR指標分析
MRR利用對服務小區(qū)無線信號測量統(tǒng)計,而不是對事件的統(tǒng)計,具有信息全面、效率高的優(yōu)勢。
◆上下行信號強度
一般正常差值為13dBm左右,如果相差過大則有可能存在隱性故障。
◆上下行路徑損耗
一般正常差值為10dBm左右,如果相差過大則有可能存在隱性故障。
◆上下行語音質量
正常MRR語音質量值在95%以上,出現(xiàn)上行或下行語音質量很差的情況,則有可能存在隱性故障。
◆上下行覆蓋率
正常MRR上下行覆蓋率在95%以上,出現(xiàn)上行或下行語音覆蓋很差的情況,則有可能存在隱性故障。
◆TA值
正常(沒有帶直放站或拉遠)TA值不應高于2~3,即1~1.5km。對于TA值較大的小區(qū),應該給予考察,有可能存在隱性故障。
(3)MOTS指標分析
愛立信MOTS統(tǒng)計提供了對小區(qū)的每個時隙進行統(tǒng)計的功能,通過對時隙的掉話統(tǒng)計,可以統(tǒng)計每個載波掉話情況,進而可初步判斷存在隱性故障的可能。掉話原因可歸結為以下五類:
◆錯誤的指示(Error Indication)
◆連接失敗指示(Connection Failure Indication)
◆異常斷開連接請求(Abnormal Disconnect Request)
◆在小重啟動時跟蹤失?。═race Failure at Small Restart)
◆軟件功能異常釋放(Forlopp Release)
分析流程說明:
◆某個載頻的掉話率偏高。
常規(guī)優(yōu)化后指標改善不明顯,判斷該載頻、CDU可能存在隱性故障。
◆多個載頻的掉話率偏高。
檢查小區(qū)是否開啟跳頻,排除因某個載波不佳而導致多個載波的掉話率高;分析掉話率高的載波是否屬于同一個CDU,排查CDU是否有故障;如果載波不屬于同一個CDU,則檢查該天饋系統(tǒng)是否存在隱性故障。
endprint
◆小區(qū)內所有載波的時隙掉話偏高。
檢查小區(qū)的參數(shù)設置是否合理,現(xiàn)場排查天饋線系統(tǒng)是否存在隱性故障,再結合BSC其他話務報表所指示的掉話原因作進一步分析。
(4)A-bis指標分析
利用省公司“無線網(wǎng)優(yōu)綜合數(shù)據(jù)管理平臺”,提取A-bis數(shù)據(jù)進行分析,目前所有參數(shù)門限值已集成到A-bis信令應用層軟件,通過該平臺分析準確性較高,具備異常信令Cause專項分析,包括:
◆SDCCH掉話Cause值分析
◆TCH掉話Cause值分析
◆TCH指配失敗Cause值分析
◆位置更新失敗Cause值分析
◆MO短信失敗Cause值分析
◆MT短信失敗Cause值分析
◆Cause詳單查詢
該平臺可找出全網(wǎng)定義采集的小區(qū)載波數(shù)據(jù)進行分析,并結合愛立信話務統(tǒng)計數(shù)據(jù)找出現(xiàn)網(wǎng)存在隱性故障小區(qū)(載波)。
分析流程說明:
◆載頻硬件問題
分析掉話只集中在某一塊載頻上,且次數(shù)比其他載頻高,對該載頻作Reset TRX操作。下個時段如果該載頻依然存在掉話高,則更換載頻。
◆CDU模塊故障
掉話集中在某幾塊載頻上,觀察掉話高的載頻是否屬于同一塊CDU,若是則更換該CDU。
◆天饋系統(tǒng)故障
掉話集中在某幾塊載頻上(4塊以下),且載頻大多數(shù)情況下是分布在不同的CDU上;同時,小區(qū)的其他載頻出現(xiàn)少許占有但沒有出現(xiàn)高掉話。先檢查小區(qū)是否開啟跳頻,分析是否因某個頻點不佳導致,若是則更換頻點。更換后如果掉話依然高,則現(xiàn)場檢查天饋系統(tǒng)是否有隱性故障。
2.2故障小區(qū)篩選
通過對話務數(shù)據(jù)進行指標分析,篩選出存在指標異常的隱性故障小區(qū),主要篩選流程如下:
(1)對A-bis數(shù)據(jù)進行篩選,生成多時段全網(wǎng)或單個網(wǎng)元性能比較差的小區(qū)列表。沒有A-bis采集數(shù)據(jù)的地市,建議通過采集MOTS數(shù)據(jù)進行分析。
(2)A-bis(MOTS)指標較差的小區(qū)列表,結合STS的干擾項對ICMBAND進行干擾級別設定篩選,建議篩選干擾系數(shù)<2的小區(qū)進一步分析,這一步過濾可能存在上行干擾的小區(qū)。
(3)對STS話務項指標再進一步進行分析,主要是對C/T的信道完好率、申請次數(shù)、掉話次數(shù)和掉話率進行綜合分析,這一步可以找出由于基站隱性故障,導致信道完好率、申請次數(shù)、掉話次數(shù)和掉話率的小區(qū)。
(4)結合MRR指標分析,對上下行質量、信號強度、路徑損耗、TA分析(根據(jù)TA情況分析是否存在過覆蓋或帶拉遠設備)、上下行功率等級等進行分析,特別是上下行不平衡小區(qū),大部分是由于天饋系統(tǒng)硬件存在隱性故障導致不平衡。
(5)小區(qū)篩選是根據(jù)每個小區(qū)分析的實際情況,對小區(qū)的網(wǎng)優(yōu)設置參數(shù)進行檢查,確定不是網(wǎng)優(yōu)參數(shù)問題的情況下,參考話務統(tǒng)計數(shù)據(jù),分析對故障進行預處理和定位。
3 現(xiàn)場檢測驗證方法
3.1雷卡排查規(guī)范
利用雷卡6113儀表對基站的發(fā)射和接收機性能進行綜合測試,分析是否符合GSM規(guī)范要求,對于不符合規(guī)范的指標,定位問題具體在接收哪個部件,進行設備更換。
雷卡設備測試指標參考如表2所示:
表2雷卡設備測試指標參考
雷卡設備測試項 參考值
Configure BTS 900頻段47dBm/1 800頻段45dBm
Transmitter Test Frequency Error <+95.0Hz
RMS Phase Error <+5.0Deg
Peak Phase Error <+20.0Deg
BTS Output Power <+40.0dBm
Receiver BER FER <0.1%
Class Ib RBER <0.4%
Class II RBER <2.0%
Access Burst FER <0.5%
RX Level Rx Level與Mean<2dB
具體測試項如下:
(1)雷卡測試定位RBS2202主設備故障
對于硬件故障的定位,可從以下方面進行判斷:
◆一個RBS機柜單個TRU測試出現(xiàn)Fail(包括發(fā)射和接收端測試)時,則定位為TRU故障或TRU連線問題。
◆如果測試小區(qū)的CDU型號為CDU A、CDU C、CDU C+時,當2個TRU(包括發(fā)射和接收端測試)測試不通過,而這兩個TRU又同屬于同一個CDU,則可以定位故障的硬件為測試TRU所屬的CDU。
◆如果測試小區(qū)的CDU型號為CDU D型,當同屬一個CU的2個TRU發(fā)射端測試不通過時,故障點就定位為CU;如果多個TRU的接收端測試不通過時,則定位于DU故障或FUD(FU)故障。
◆在保證雷卡儀表設置正確的前提下,如果測試小區(qū)所有TRU的測試項都不通過,則定位為DXU故障。
(2)雷卡測試定位RBS2206主設備故障
RBS2206設備的載波是DTRU,每個物理載波等同于2個普通TRU,常用的CDU型號有CDU F、CDU G型,每個CDU是4路邏輯TRU(2個物理DRU)的功率合成。另外,2206設備新增了CXU,用于分配12路RX信號,所以對于雷卡測試的定位故障,與2202稍有不同。
◆對于單個邏輯TRU或同一個DTRU的兩個邏輯TRU測試不通過(包括發(fā)射和接收端測試),可簡單定位為單個DTRU故障或載波連線問題(此類可能性比較?。?。
◆對于同屬一個CDU的多個載波的發(fā)射項測試不通過,且接收端測試(不超過4個邏輯TRU)不通過的現(xiàn)象,故障可定位于CDU。
◆如果測試小區(qū)超過4路邏輯TRU接收端測試不通過,則故障點可定位在CXU。
◆如果測試小區(qū)所有TRU的測試項都不通過,則定位為DXU故障。
◆CDU F連線錯用,故障體現(xiàn)為:同小區(qū)前后4個邏輯TRU發(fā)射機測試發(fā)射功率偏低。
3.2TEMS排查規(guī)范
利用TEMS鎖頻TCH測試定位故障,Channel Verification功能可以很直觀地看到每次通話過程中占用到TCH的TS0~TS7中的每個TS,通過定義測試門限值。
3.3DXU LOG數(shù)據(jù)驗證
愛立信RBS_DXU_LOG文件中記錄了整個基站的所有軟、硬件設備運行信息,通過分析LOG文件發(fā)現(xiàn)基站內部問題,并有效解決基站隱性故障。
同時,LOG文件也記錄了基站以外設備(即傳輸和BSC)對基站的影響情況,有助于定位疑難故障,提高搶修及時率。
DXU LOG的查看方法:
DXU LOG組成:Detailed log&General log
DXU LOG時鐘:內部時鐘&外部時鐘
內部時鐘:[90-01-01 00:00:00.010],以90-01-01開頭
外部時鐘:[11-07-12 15:22:50.208],以實際時間開頭
關鍵部分:主要關注Detailed log的外部時鐘部分——故障發(fā)生時間
提取方法:OMT(本地提取)&REMOTE OMT(遠程提?。?/p>
正常運行設備Log VS 出現(xiàn)故障設備Log:
LOG數(shù)據(jù)說明:
[11-07-09 11:54:11.002] P_MPSK_CLOCK timeout_clock_main.c:419 TRACED:Setting time: 11-07-09 11:54:42.000
[11-07-09 15:54:42.006] P_MPSK_CLOCK timeout_clock_main.c:419 TRACED:Setting time: 11-07-09 15:55:13.000
endprint
說明:正常運行設備(即基站側、傳輸側和BSC側不進行任何操作),每隔4小時與BSC同步時鐘(Setting time……)
若基站側、傳輸側或BSC側發(fā)生操作,則DXU LOG會記錄相關的事件,例如:
事件:頻段超限(6000設備載波頻點設置不得超過15M)
[11-07-09 17:17:45.966] O_TGC_Main../TMP/IC/tgc_mainBody.ic:683
TRACED:Ts List Check Band Width Rx Band Width Out of range:24600>20000 TRXinst:3
故障:FC碼
[11-07-09 17:19:02.982] O_RBS_Status RBS_STATUS_DEF.c:398
FAULT:11-07-09 17:19 FuncType: TRX, Instance 0,Raise, EC2, TERR LINK IDLE 4 EC2
FAULT表示故障信息;FuncType表示出現(xiàn)告警的MO;Instance 0表示出現(xiàn)告警的ID,一般是邏輯ID;EC2, TERR LINK IDLE 4 EC2表示告警的類似;EC2外部告警(告警類型:1A、2A、1B、2B、EC1、EC2)。
4 現(xiàn)場故障處理方法
根據(jù)后臺話務統(tǒng)計性能指標分析結果與現(xiàn)場RBS_DXU_LOG數(shù)據(jù)分析、雷卡、TEMS、互調檢測結果,對驗證對應的故障器件進行處理?,F(xiàn)場驗證流程如圖1所示:
處理步驟如下:
(1)檢查主設備和天饋線的連接是否正確,如果不正確,則進行正確連接;如果連接正確,則進行下一步處理。
(2)更換現(xiàn)場驗證存在故障的器件(DXU、CDU、TRU和CXU),現(xiàn)場雷卡檢測更換上去的器件是否存在故障(部分更換上去的備件也存在故障),若檢測后更換上去的備件正常,則激活小區(qū),現(xiàn)場進行TEMS測試接入、通話和上網(wǎng)是否正常。同時,等待即時話務統(tǒng)計指標跟蹤,如果指標有改善,則處理結束;如果沒有改善,則進行下一步處理。
(3)停閉小區(qū),更換互調檢測到的故障器件或連接線,通過互調檢測更換上的器件或連接是否通過,如果通過,則激活小區(qū),現(xiàn)場進行TEMS測試接入、通話和上網(wǎng)是否正常;同時,等待即時話務統(tǒng)計指標跟蹤,若指標有改善則處理結束。
5 基站隱性故障案例
故障名稱:華師南D2小區(qū)載波隱性故障
故障現(xiàn)象:
根據(jù)STS和A-bis指標分析:該小區(qū)的C掉話較高,T掉話也偏高;MRR指標分析:上行平均電平偏低。
原因分析:
(1)現(xiàn)場對華師南D2進行TEMS鎖頻測試,發(fā)現(xiàn)-6、-7頻點存在瞬間場強變弱的現(xiàn)象。
(2)閉站后,雷卡測試發(fā)現(xiàn)-6、-7載波接收誤碼、接收脈沖和接收電平不通過(見圖2)。
(3)現(xiàn)場發(fā)現(xiàn)CXU和TRU連接線存在連接錯誤,重新連接后,兩個載波還是存在故障,懷疑CXU端口存在故障。
(4)判斷為CXU故障。
故障處理:
更換CXU之后,雷卡測試正常,TEMS測試信號強度由-80dBm提升至-60dBm左右,觀察指標發(fā)現(xiàn)有明顯改善:處理前每天C掉話總次數(shù)為154次,處理后降低至21次,T掉話由處理前37次改善為0,故判斷CXU存在隱性故障(見圖3)。
6 總結
通過利用后臺數(shù)據(jù)(A+A-bis和MOTS)分析和現(xiàn)場雷卡、TEMS檢測設備,可以準確快速地定位和處理隱性故障。筆者建議推廣使用此方法,既能夠快速處理網(wǎng)絡隱患,減少基站退服和用戶投訴,又可以提升網(wǎng)絡設備的服務能力。
參考文獻:
[1] 張威. GSM網(wǎng)絡優(yōu)化——原理與工程[M]. 2版. 北京: 人民郵電出版社, 2009.
[2] 趙倩雯. 利用DXU_LOG分析設備故障[Z]. 2011.
[3] 朱林鈞,邢洪波,黃頌. 基于基站臨界點故障的雷卡測試分析[J]. 移動通信, 2011(3): 99-101.
[4] 朱林鈞,邢洪波,鐘雪峰,等. 淺析雷卡測試與MRR功能指標體現(xiàn)[J]. 移動通信, 2010(8): 21-25.
[5] 劉韜,邢洪波. 基站健康檢查必要性及方法[J]. 電信工程技術與標準化, 2009(9): 73-76.★
作者簡介
答嘉曦:系統(tǒng)分析師,碩士畢業(yè)于華中科技大學,現(xiàn)任中國移動通信集團廣東有限公司網(wǎng)絡優(yōu)化中心中級網(wǎng)優(yōu)支撐主管,從事無線設備維護管理工作。
黃政力:高級工程師,MBA畢業(yè)于暨南大學,現(xiàn)任職于中國移動通信集團廣東有限公司網(wǎng)絡優(yōu)化中心,從事無線網(wǎng)絡維護管理工作。
楊炎坤:現(xiàn)任深圳市科虹通信有限公司工程部項目經(jīng)理,從事移動無線網(wǎng)絡維護管理工作。
endprint
說明:正常運行設備(即基站側、傳輸側和BSC側不進行任何操作),每隔4小時與BSC同步時鐘(Setting time……)
若基站側、傳輸側或BSC側發(fā)生操作,則DXU LOG會記錄相關的事件,例如:
事件:頻段超限(6000設備載波頻點設置不得超過15M)
[11-07-09 17:17:45.966] O_TGC_Main../TMP/IC/tgc_mainBody.ic:683
TRACED:Ts List Check Band Width Rx Band Width Out of range:24600>20000 TRXinst:3
故障:FC碼
[11-07-09 17:19:02.982] O_RBS_Status RBS_STATUS_DEF.c:398
FAULT:11-07-09 17:19 FuncType: TRX, Instance 0,Raise, EC2, TERR LINK IDLE 4 EC2
FAULT表示故障信息;FuncType表示出現(xiàn)告警的MO;Instance 0表示出現(xiàn)告警的ID,一般是邏輯ID;EC2, TERR LINK IDLE 4 EC2表示告警的類似;EC2外部告警(告警類型:1A、2A、1B、2B、EC1、EC2)。
4 現(xiàn)場故障處理方法
根據(jù)后臺話務統(tǒng)計性能指標分析結果與現(xiàn)場RBS_DXU_LOG數(shù)據(jù)分析、雷卡、TEMS、互調檢測結果,對驗證對應的故障器件進行處理。現(xiàn)場驗證流程如圖1所示:
處理步驟如下:
(1)檢查主設備和天饋線的連接是否正確,如果不正確,則進行正確連接;如果連接正確,則進行下一步處理。
(2)更換現(xiàn)場驗證存在故障的器件(DXU、CDU、TRU和CXU),現(xiàn)場雷卡檢測更換上去的器件是否存在故障(部分更換上去的備件也存在故障),若檢測后更換上去的備件正常,則激活小區(qū),現(xiàn)場進行TEMS測試接入、通話和上網(wǎng)是否正常。同時,等待即時話務統(tǒng)計指標跟蹤,如果指標有改善,則處理結束;如果沒有改善,則進行下一步處理。
(3)停閉小區(qū),更換互調檢測到的故障器件或連接線,通過互調檢測更換上的器件或連接是否通過,如果通過,則激活小區(qū),現(xiàn)場進行TEMS測試接入、通話和上網(wǎng)是否正常;同時,等待即時話務統(tǒng)計指標跟蹤,若指標有改善則處理結束。
5 基站隱性故障案例
故障名稱:華師南D2小區(qū)載波隱性故障
故障現(xiàn)象:
根據(jù)STS和A-bis指標分析:該小區(qū)的C掉話較高,T掉話也偏高;MRR指標分析:上行平均電平偏低。
原因分析:
(1)現(xiàn)場對華師南D2進行TEMS鎖頻測試,發(fā)現(xiàn)-6、-7頻點存在瞬間場強變弱的現(xiàn)象。
(2)閉站后,雷卡測試發(fā)現(xiàn)-6、-7載波接收誤碼、接收脈沖和接收電平不通過(見圖2)。
(3)現(xiàn)場發(fā)現(xiàn)CXU和TRU連接線存在連接錯誤,重新連接后,兩個載波還是存在故障,懷疑CXU端口存在故障。
(4)判斷為CXU故障。
故障處理:
更換CXU之后,雷卡測試正常,TEMS測試信號強度由-80dBm提升至-60dBm左右,觀察指標發(fā)現(xiàn)有明顯改善:處理前每天C掉話總次數(shù)為154次,處理后降低至21次,T掉話由處理前37次改善為0,故判斷CXU存在隱性故障(見圖3)。
6 總結
通過利用后臺數(shù)據(jù)(A+A-bis和MOTS)分析和現(xiàn)場雷卡、TEMS檢測設備,可以準確快速地定位和處理隱性故障。筆者建議推廣使用此方法,既能夠快速處理網(wǎng)絡隱患,減少基站退服和用戶投訴,又可以提升網(wǎng)絡設備的服務能力。
參考文獻:
[1] 張威. GSM網(wǎng)絡優(yōu)化——原理與工程[M]. 2版. 北京: 人民郵電出版社, 2009.
[2] 趙倩雯. 利用DXU_LOG分析設備故障[Z]. 2011.
[3] 朱林鈞,邢洪波,黃頌. 基于基站臨界點故障的雷卡測試分析[J]. 移動通信, 2011(3): 99-101.
[4] 朱林鈞,邢洪波,鐘雪峰,等. 淺析雷卡測試與MRR功能指標體現(xiàn)[J]. 移動通信, 2010(8): 21-25.
[5] 劉韜,邢洪波. 基站健康檢查必要性及方法[J]. 電信工程技術與標準化, 2009(9): 73-76.★
作者簡介
答嘉曦:系統(tǒng)分析師,碩士畢業(yè)于華中科技大學,現(xiàn)任中國移動通信集團廣東有限公司網(wǎng)絡優(yōu)化中心中級網(wǎng)優(yōu)支撐主管,從事無線設備維護管理工作。
黃政力:高級工程師,MBA畢業(yè)于暨南大學,現(xiàn)任職于中國移動通信集團廣東有限公司網(wǎng)絡優(yōu)化中心,從事無線網(wǎng)絡維護管理工作。
楊炎坤:現(xiàn)任深圳市科虹通信有限公司工程部項目經(jīng)理,從事移動無線網(wǎng)絡維護管理工作。
endprint
說明:正常運行設備(即基站側、傳輸側和BSC側不進行任何操作),每隔4小時與BSC同步時鐘(Setting time……)
若基站側、傳輸側或BSC側發(fā)生操作,則DXU LOG會記錄相關的事件,例如:
事件:頻段超限(6000設備載波頻點設置不得超過15M)
[11-07-09 17:17:45.966] O_TGC_Main../TMP/IC/tgc_mainBody.ic:683
TRACED:Ts List Check Band Width Rx Band Width Out of range:24600>20000 TRXinst:3
故障:FC碼
[11-07-09 17:19:02.982] O_RBS_Status RBS_STATUS_DEF.c:398
FAULT:11-07-09 17:19 FuncType: TRX, Instance 0,Raise, EC2, TERR LINK IDLE 4 EC2
FAULT表示故障信息;FuncType表示出現(xiàn)告警的MO;Instance 0表示出現(xiàn)告警的ID,一般是邏輯ID;EC2, TERR LINK IDLE 4 EC2表示告警的類似;EC2外部告警(告警類型:1A、2A、1B、2B、EC1、EC2)。
4 現(xiàn)場故障處理方法
根據(jù)后臺話務統(tǒng)計性能指標分析結果與現(xiàn)場RBS_DXU_LOG數(shù)據(jù)分析、雷卡、TEMS、互調檢測結果,對驗證對應的故障器件進行處理?,F(xiàn)場驗證流程如圖1所示:
處理步驟如下:
(1)檢查主設備和天饋線的連接是否正確,如果不正確,則進行正確連接;如果連接正確,則進行下一步處理。
(2)更換現(xiàn)場驗證存在故障的器件(DXU、CDU、TRU和CXU),現(xiàn)場雷卡檢測更換上去的器件是否存在故障(部分更換上去的備件也存在故障),若檢測后更換上去的備件正常,則激活小區(qū),現(xiàn)場進行TEMS測試接入、通話和上網(wǎng)是否正常。同時,等待即時話務統(tǒng)計指標跟蹤,如果指標有改善,則處理結束;如果沒有改善,則進行下一步處理。
(3)停閉小區(qū),更換互調檢測到的故障器件或連接線,通過互調檢測更換上的器件或連接是否通過,如果通過,則激活小區(qū),現(xiàn)場進行TEMS測試接入、通話和上網(wǎng)是否正常;同時,等待即時話務統(tǒng)計指標跟蹤,若指標有改善則處理結束。
5 基站隱性故障案例
故障名稱:華師南D2小區(qū)載波隱性故障
故障現(xiàn)象:
根據(jù)STS和A-bis指標分析:該小區(qū)的C掉話較高,T掉話也偏高;MRR指標分析:上行平均電平偏低。
原因分析:
(1)現(xiàn)場對華師南D2進行TEMS鎖頻測試,發(fā)現(xiàn)-6、-7頻點存在瞬間場強變弱的現(xiàn)象。
(2)閉站后,雷卡測試發(fā)現(xiàn)-6、-7載波接收誤碼、接收脈沖和接收電平不通過(見圖2)。
(3)現(xiàn)場發(fā)現(xiàn)CXU和TRU連接線存在連接錯誤,重新連接后,兩個載波還是存在故障,懷疑CXU端口存在故障。
(4)判斷為CXU故障。
故障處理:
更換CXU之后,雷卡測試正常,TEMS測試信號強度由-80dBm提升至-60dBm左右,觀察指標發(fā)現(xiàn)有明顯改善:處理前每天C掉話總次數(shù)為154次,處理后降低至21次,T掉話由處理前37次改善為0,故判斷CXU存在隱性故障(見圖3)。
6 總結
通過利用后臺數(shù)據(jù)(A+A-bis和MOTS)分析和現(xiàn)場雷卡、TEMS檢測設備,可以準確快速地定位和處理隱性故障。筆者建議推廣使用此方法,既能夠快速處理網(wǎng)絡隱患,減少基站退服和用戶投訴,又可以提升網(wǎng)絡設備的服務能力。
參考文獻:
[1] 張威. GSM網(wǎng)絡優(yōu)化——原理與工程[M]. 2版. 北京: 人民郵電出版社, 2009.
[2] 趙倩雯. 利用DXU_LOG分析設備故障[Z]. 2011.
[3] 朱林鈞,邢洪波,黃頌. 基于基站臨界點故障的雷卡測試分析[J]. 移動通信, 2011(3): 99-101.
[4] 朱林鈞,邢洪波,鐘雪峰,等. 淺析雷卡測試與MRR功能指標體現(xiàn)[J]. 移動通信, 2010(8): 21-25.
[5] 劉韜,邢洪波. 基站健康檢查必要性及方法[J]. 電信工程技術與標準化, 2009(9): 73-76.★
作者簡介
答嘉曦:系統(tǒng)分析師,碩士畢業(yè)于華中科技大學,現(xiàn)任中國移動通信集團廣東有限公司網(wǎng)絡優(yōu)化中心中級網(wǎng)優(yōu)支撐主管,從事無線設備維護管理工作。
黃政力:高級工程師,MBA畢業(yè)于暨南大學,現(xiàn)任職于中國移動通信集團廣東有限公司網(wǎng)絡優(yōu)化中心,從事無線網(wǎng)絡維護管理工作。
楊炎坤:現(xiàn)任深圳市科虹通信有限公司工程部項目經(jīng)理,從事移動無線網(wǎng)絡維護管理工作。
endprint