[古秋錦]
在無線網(wǎng)絡(luò)優(yōu)化中場景中,導(dǎo)致用戶質(zhì)量感知投訴的原因是多樣的,主要包括覆蓋、容量、干擾、故障等。一般情況下,基站射頻設(shè)備、主控板、基帶板等硬件設(shè)備出現(xiàn)嚴(yán)重告警時,操作維護(hù)平臺都會及時發(fā)現(xiàn)并處理[1]。然而,對于這些硬件設(shè)備出現(xiàn)一些隱性故障時,將很難被發(fā)現(xiàn),直接導(dǎo)致無法及時修復(fù)故障問題,從而出現(xiàn)大面積用戶感知異常,一直以來都是一個網(wǎng)絡(luò)優(yōu)化研究的難點。
結(jié)合相關(guān)問題,現(xiàn)分別從單小區(qū)/整站共性問題確認(rèn)、傳輸問題排查、參數(shù)變更/故障原因排查、上/下行網(wǎng)絡(luò)鏈路問題確認(rèn)以及最終問題根因確定等5個步驟,介紹一種4G站點主控板隱性故障的排查方法[2]。
以 “深圳金鑾國際E-HLW”站點為例,根據(jù)主覆蓋區(qū)域用描述的無法進(jìn)行數(shù)據(jù)業(yè)務(wù)和語音業(yè)務(wù)情況,用五步法進(jìn)行排查。對問題小區(qū)進(jìn)行KPI指標(biāo)統(tǒng)計發(fā)現(xiàn):“深圳金鑾國際E-HLW-1”從4月10日開始,4G無線接通率、上行用戶平均體驗速率以及Volte丟包率明顯劣化,與投訴時間點相匹配[3],如表1所示。
結(jié)合相關(guān)問題,對“深圳金鑾國際E-HLW”站點開展單小區(qū)/整站共性問題確認(rèn)、傳輸問題排查、參數(shù)變更/故障原因排查、上/下行網(wǎng)絡(luò)鏈路問題確認(rèn)等排查,最終問題根因確定、五步法進(jìn)行排查[4]。
首先,統(tǒng)計“深圳金鑾國際E-HLW”整個站點所有小區(qū)4月初的“VoLTE上行丟包率”、“上行用戶平均體驗速率”明顯出現(xiàn)同步劣化。綜上,該投訴非單小區(qū)異常,屬于共站小區(qū)的共性問題[5],如圖1、圖2所示。
圖1 VoLTE上行丟包率變化
圖2 上行用戶平均體驗速率變化
接著,結(jié)合網(wǎng)管相關(guān)“E-RAB建立失敗”原因統(tǒng)計中,傳輸資源不足、傳輸層問題導(dǎo)致的次數(shù)都是0次,初步排除由于傳輸問題導(dǎo)致整站小區(qū)的劣化,如表2所示。
表2 深圳金鑾國際傳輸指標(biāo)變化
同步在網(wǎng)管確認(rèn),“深圳金鑾國際E-HLW”站點小區(qū)指標(biāo)劣化期間,無參數(shù)調(diào)整記錄、站點無影響業(yè)務(wù)的歷史告警。
結(jié)合問題小區(qū) RRC失敗的原因集中在“UE無應(yīng)答而導(dǎo)致RRC連接建立失敗次數(shù)”、“其它原因?qū)е碌腞RC連接建立被拒絕的次數(shù)”兩個原因值?!吧钲诮痂巼HE-HLW-1”小區(qū)RRC失敗和E-RAB失敗原因值統(tǒng)計[6],如表3所示。
表3 深圳金鑾國際接入指標(biāo)情況
空口“UE無應(yīng)答”信令跟蹤截圖,如圖3所示。
圖3 UE無應(yīng)答信令跟蹤
查詢“深圳金鑾國際E-HLW-1”小區(qū)“下行MR覆蓋”為98.60%左右,在指標(biāo)劣化情況時無明顯劣化情況,相關(guān)指標(biāo)如圖4所示。
圖4 深圳金鑾國際下行MR覆蓋
查詢“深圳金鑾國際E-HLW-1”小區(qū)“上行干擾平均值和最大值”在指標(biāo)劣化前后明顯發(fā)生變化,干擾變強(qiáng)了8 dB左右。相關(guān)指標(biāo)如圖5所示。
圖5 深圳金鑾國際上行干擾變化
綜上,初步判定空口“UE無應(yīng)答”信令主要由于終端收到RRC CONN SETUP消息,并發(fā)出RRC CONN SETUP CM消息后,由于上行質(zhì)量異常、基站側(cè)無法接收到相關(guān)消息,導(dǎo)致RRC連接“UE無應(yīng)答”超時[7]。
進(jìn)一步查詢,深圳金鑾國際E-HLW-1小區(qū)PUSCH上弱覆蓋占比、平均值、最大值等指標(biāo),在投訴出現(xiàn)前后均明顯劣化,如表4所示。
表4 深圳金鑾國際投訴前后指標(biāo)變化情況
從上/下行PRB利用率差值來看,“深圳金鑾國際E-HLW-1”小區(qū)上行質(zhì)量異常,導(dǎo)致上行數(shù)據(jù)重傳較多、上行PRB利用率明顯大于下行PRB利用率現(xiàn)象,如圖6所示。
圖6 深圳金鑾國際上/下行PRB差值
將“深圳金鑾國際E-HLW”站點的“時鐘檢測增強(qiáng)開關(guān)”設(shè)置為ON后,站點同步出現(xiàn)主控板(UMPT)單板硬件故障告警。詳細(xì)截圖如圖7所示。
圖7 深圳金鑾國際重要告警查詢結(jié)果
綜上,“深圳金鑾國際E-HLW”站點小區(qū)語音業(yè)務(wù)、數(shù)據(jù)業(yè)務(wù)使用異常的投訴,主要是由于主控板(UMPT)單板硬件故障,引起上行鏈路質(zhì)量突發(fā)劣化導(dǎo)致[8]。
4月24日,維護(hù)同事現(xiàn)場更換“深圳金鑾國際E-HLW”站點主控板后,整個站點小區(qū)“上行干擾電平”、“上行PRB與下行PRB差值變化”、“上行RTP丟包”、“無線接通率”和“上行速率指標(biāo)”等指標(biāo)均恢復(fù)到投訴出現(xiàn)之前的水平,達(dá)到預(yù)期優(yōu)化效果,回訪投訴用戶均得到數(shù)據(jù)業(yè)務(wù)和語音業(yè)務(wù)感知均恢復(fù)正常的回復(fù)[9],詳細(xì)優(yōu)化前/后各項指標(biāo)對比,如圖8、圖9、圖10、圖11、圖12所示。
圖8 上行平均值、最大值優(yōu)化對比
圖9 上行PRB與下行PRB差值變化對比
圖10 上行RTP丟包對比
圖11 無線接通率對比
圖12 上行速率變化
同類問題點如深圳南光城市花園,現(xiàn)場測試負(fù)1樓、負(fù)2樓停車場室內(nèi)4G小區(qū)占用“深圳南光城市花園E-HLW-1”,終端信號RSRP在-78~-92 dBm左右,下載速0.22 Mbit/s,上傳速率0.12 Mbit/s,上傳下載速率慢,無法正常通話,用戶感知差[10]。
按照 “五步排查法”進(jìn)行隱性故障分析,最終定位亦是由于站點“深圳南光城市花園E-HLW”主控板(UMPT)單板硬件故障,導(dǎo)致用戶上/下行速率感知異常引起投訴。經(jīng)更換板件后,“深圳南光城市花園E-HLW-1”小區(qū)各項感知指標(biāo)恢復(fù)正常,投訴問題得到解決,達(dá)到預(yù)期效果,如表5所示。
表5 深圳南光城市花園換板前后指標(biāo)
在無線網(wǎng)絡(luò)優(yōu)化中,若無線基站硬件設(shè)備出現(xiàn)一些隱性故障時,將很難被發(fā)現(xiàn),直接導(dǎo)致無法及時修復(fù)故障問題、出現(xiàn)大面積用戶感知異常,一直以來都是一個網(wǎng)絡(luò)優(yōu)化研究的難點。結(jié)合4G站點主控板存在隱性故障導(dǎo)致周邊用戶感知差投訴問題,針對性的從單小區(qū)/整站共性問題確認(rèn)、傳輸問題排查、參數(shù)變更/故障原因排查、上/下行網(wǎng)絡(luò)鏈路問題確認(rèn)以及最終問題根因確定等5個步驟,形成一種4G站點主控板隱性故障的排查方法。同時,同步對全網(wǎng)同類問題進(jìn)行排查和應(yīng)用,應(yīng)用效果明顯。