徐瑞宏
如果CPU各模塊負(fù)荷不均衡,需要進(jìn)行模塊間負(fù)荷調(diào)整。
如果CPU各模塊負(fù)荷已經(jīng)比較均衡且負(fù)荷都很高,需要進(jìn)行擴(kuò)容業(yè)務(wù)處理。
c、數(shù)據(jù)調(diào)整
關(guān)閉加密,鑒權(quán)次數(shù)減少直到關(guān)閉,關(guān)閉全網(wǎng)尋呼等,以減少信令流量。
二、典型場(chǎng)景分析
1 場(chǎng)景:大量用戶(hù)同時(shí)位置更新導(dǎo)致C/D接口擁塞
當(dāng)出現(xiàn)因A/Abis接口、C/D接口傳輸長(zhǎng)時(shí)間中斷或者呼叫處理模塊重啟等情況,導(dǎo)致較長(zhǎng)時(shí)間的業(yè)務(wù)中斷后,在系統(tǒng)恢復(fù)正常后,大量的用戶(hù)同時(shí)位置更新,造成C/D接口嚴(yán)重?fù)砣瑯I(yè)務(wù)受到較大影響。
1.1 界定方法:
1) 觀察是否有C/D口鏈路擁塞或者故障告警;
2) 觀察是否存在大量的位置更新操作超時(shí)統(tǒng)計(jì);
3) 觀察位置管理業(yè)務(wù)測(cè)量話統(tǒng),如果發(fā)現(xiàn)位置更新成功率顯著下降,遠(yuǎn)遠(yuǎn)低于平時(shí)的指標(biāo), 并且存在大量的位置更新操作超時(shí)的統(tǒng)計(jì),則確認(rèn)發(fā)生C/D接口發(fā)生擁塞。
1.2 應(yīng)急處理:
1) 第一時(shí)間關(guān)閉所有鑒權(quán)加密配置,減輕C/D口負(fù)荷。
2) 使用HLR HTR增強(qiáng)流控。
當(dāng)MSC到被監(jiān)控的HLR鏈路出現(xiàn)擁塞、難以到達(dá)(HTR)的現(xiàn)象時(shí),MSC自動(dòng)啟動(dòng)流控,根據(jù)擁塞情況按比例拒絕業(yè)務(wù),達(dá)到緩解鏈路擁塞的目的。 MSC根據(jù)當(dāng)前監(jiān)控周期內(nèi)的流控級(jí)別進(jìn)行過(guò)濾。
流控級(jí)別:0~15級(jí)。0級(jí)為不進(jìn)行流控。級(jí)別越高,被拒掉的請(qǐng)求越多,如級(jí)別為15級(jí),則每16個(gè)位置更新請(qǐng)求中會(huì)拒掉15個(gè),允許通過(guò)一個(gè)。MSC/VLR根據(jù)鏈路是否出現(xiàn)HTR來(lái)調(diào)整流控級(jí)別。
2 場(chǎng)景:尋呼成功率低
2.1 界定方法:
一般情況下,BSC每小時(shí)處理的尋呼請(qǐng)求次數(shù)在15-20萬(wàn)次以下。在BSC每小時(shí)處理的尋呼請(qǐng)求次數(shù)超過(guò)BSC尋呼處理能力,觀察“位置區(qū)話務(wù)量測(cè)量”話統(tǒng)中的尋呼次數(shù)、尋呼響應(yīng)次數(shù)。根據(jù)位置區(qū)和BSC的對(duì)應(yīng)關(guān)系,可以計(jì)算出發(fā)向某個(gè)BSC的尋呼次數(shù)和BSC響應(yīng)的尋呼響應(yīng)次數(shù)。如果尋呼成功率會(huì)大幅下降,需要啟動(dòng)尋呼策略調(diào)整。
2.2 預(yù)防處理:
話務(wù)高峰期間,建議提前評(píng)估,針對(duì)可能存在尋呼過(guò)載的BSC,提前修改尋呼策略:
1) 關(guān)閉系統(tǒng)中配置的全網(wǎng)尋呼;
2) 調(diào)整不合理的LAI-BSC配置:
2.3 應(yīng)急處理:
將部分業(yè)務(wù)比如短消息的尋呼次數(shù)減少為1次;
如果尋呼量遠(yuǎn)遠(yuǎn)大于BSC的處理能力,建議對(duì)于所有業(yè)務(wù)的尋呼都
修改為1次。
3 場(chǎng)景:大量短消息業(yè)務(wù)導(dǎo)致接通率低
3.1 界定方法:
1) 觀察短消息業(yè)務(wù)測(cè)量話統(tǒng),短消息的移動(dòng)始發(fā)短消息試發(fā)次數(shù),移動(dòng)終接短消息試發(fā)次數(shù)的數(shù)量大量增加;
2) 觀察局向出入局話統(tǒng),中繼局向出入局話統(tǒng),接通率明顯下降;
3) 觀察和短消息中心連接的鏈路的負(fù)荷,同時(shí)觀察到短消息中心的鏈路所在模塊的CPU的負(fù)荷情況;
4) 如果短消息的試發(fā)次數(shù)數(shù)量大量增加,并且觀察到接通率明顯下降,進(jìn)一步觀察到短消息中心連接的鏈路的負(fù)荷有較大增長(zhǎng),并且到短消息中心的鏈路所在模塊的CPU的負(fù)荷有較大增長(zhǎng),可以判斷由于大量短消息業(yè)務(wù)導(dǎo)致接通率低。
3.2 應(yīng)急處理:
啟動(dòng)業(yè)務(wù)流控,進(jìn)行終結(jié)短消息的流控。
4 場(chǎng)景:大量呼叫處理模塊WCCU過(guò)載
4.1 界定方法:
1) 觀察CPU占用率測(cè)量話統(tǒng);
2) 觀察是否出現(xiàn)單板CPU過(guò)載的告警;
3) 觀察各大局向的中繼局向話統(tǒng),分析局向話務(wù)統(tǒng)計(jì)情況;
4) 出現(xiàn)大量模塊頻繁過(guò)載時(shí),分析各個(gè)流向的話務(wù)量是否正常,確定系統(tǒng)處于正常過(guò)載還是異常過(guò)載。
4.2 預(yù)防處理:
啟動(dòng)業(yè)務(wù)流控:
首先查看業(yè)務(wù)流控的話統(tǒng)結(jié)果,在現(xiàn)網(wǎng)話統(tǒng)的基礎(chǔ)之上,綜合考慮模塊的CPU占用率情況,得出業(yè)務(wù)流控的合理閥值 ,進(jìn)行配置。
4.3 應(yīng)急處理
1) 對(duì)于正常過(guò)載,模塊CPU占用率穩(wěn)定在過(guò)載門(mén)限上下波動(dòng),接通話務(wù)量保持穩(wěn)定,對(duì)于此類(lèi)情況,建議不進(jìn)行處理;
2) 對(duì)于異常過(guò)載,需要使用業(yè)務(wù)流控降低話務(wù)量,保持CPU負(fù)荷的穩(wěn)定,并保證一定的接通話務(wù)量。
三、實(shí)例-四川移動(dòng)某局點(diǎn)512實(shí)施應(yīng)急保障方案后網(wǎng)絡(luò)運(yùn)行分析
1.1 512地震后采取的應(yīng)急措施
地震后當(dāng)天下午,試呼次數(shù)是平常的9倍,系統(tǒng)擁塞嚴(yán)重,立即采取了如下措施:
1) 關(guān)閉鑒權(quán)、加密;
2) 尋呼次數(shù)調(diào)整為1次,尋呼間隔7秒;
3) 關(guān)閉彩鈴功能;
4) 打開(kāi)業(yè)務(wù)流控,每個(gè)CCU模塊對(duì)始發(fā)呼叫MO和接收短信SMT進(jìn)行限制;MO每個(gè)模塊10-15次,SMT每個(gè)模塊20次;
5) 漫游號(hào)碼釋放時(shí)長(zhǎng)從90秒修改為7秒;