張延彬,杜潘峰,邢慶文
(中國移動通信集團設(shè)計院有限公司山東分公司,濟南 250001)
WLAN(Wireless Local Area Network, 無線局域網(wǎng))是計算機網(wǎng)絡(luò)和無線通信技術(shù)結(jié)合的產(chǎn)物,是固定局域網(wǎng)的一種延伸,WLAN具有組網(wǎng)靈活、成本低、擴容方便、隨時隨地使用等特點,目前WLAN主要采用的是802.11a/b/g/n的協(xié)議。
目前運營商的WLAN網(wǎng)絡(luò)的基本組成主要包括如下設(shè)備:AC(Access Controller,接入控制器)、AP(Access Point,無線接入點)、BRAS(Broadband Remote Access Server)、匯聚交換機、POE交換機等,網(wǎng)絡(luò)示意圖如圖1所示。
隨著大規(guī)模進行WLAN網(wǎng)絡(luò)建設(shè)以來,部分AP在運行過程中出現(xiàn)吊死現(xiàn)象,吊死是指AP設(shè)備在運行過程中的掛起、死機等情況,主要表現(xiàn)形式:在網(wǎng)管中查看AP的狀態(tài)是正常的,沒有發(fā)現(xiàn)異常的告警,但是在實際使用過程中無法連接AP并且獲取IP地址,導(dǎo)致用戶無法進行正常上網(wǎng),給用戶帶來極差的上網(wǎng)體驗及大量的用戶投訴。
根據(jù)某省客服投訴和網(wǎng)管統(tǒng)計的數(shù)據(jù)顯示,“吊死”現(xiàn)象占所有故障比例的5%左右,是僅次于“用戶多上網(wǎng)慢”、“POE交換機故障”、“覆蓋弱”等之后的又一主要故障類型。
圖1 WLAN網(wǎng)絡(luò)示意圖
通過對大量出現(xiàn)“吊死”現(xiàn)象的AP進行分析,總結(jié)了以下幾個典型場景AP“吊死”現(xiàn)象,通過探索提出了AP“吊死”現(xiàn)象的解決辦法。
AP指示燈狀態(tài)為藍(lán)色,能搜索到AP的SSID,但是用戶獲取不到IP地址,終端顯示連接受限或無連接,在AC上查看,AP的運行狀態(tài)為run,通過對AP的進程進行分析,發(fā)現(xiàn)AP的WTPD進程丟失,該WTPD的進程主要作用是管理用戶信息。
AP指示燈狀態(tài)為藍(lán)色時,搜索不到AP的SSID,在AC上查看,AP的運行狀態(tài)為quit,也通過對AP的進程進行分析,發(fā)現(xiàn)AP的BS進程丟失,該BS進程主要作用是管理射頻信息。
解決辦法:由于是軟件問題,可通過斷電重啟AP或者遠(yuǎn)程重啟AP,使失效進程生效,但這種故障遠(yuǎn)程重啟往往不起作用,對用戶的使用及維護都帶來較大的麻煩,最根本的解決辦法是通過升級AP的軟件版本來解決。
具體表現(xiàn)為AP的指示燈狀態(tài)為藍(lán)色,但是AP在一段時間內(nèi)工作正常,又在一段時間內(nèi)工作不正常,在AC上查看AP的運行狀態(tài)都是正常的,但是如果電源電壓不穩(wěn)定時,AP的狀態(tài)指示燈會出現(xiàn)紅藍(lán)交替的現(xiàn)象,通過分析發(fā)現(xiàn)主要是由于AP供電不足或者數(shù)據(jù)傳輸異常等問題造成的,而造成的供電不足原因是由于網(wǎng)線水晶頭未按照568B或568A的標(biāo)準(zhǔn)線序進行制作,數(shù)據(jù)傳輸異常是由于AP的射頻接口松動或者彎曲,造成AP與饋線連接不好,導(dǎo)致AP發(fā)射或者接收信號不正常,從而導(dǎo)致用戶獲取IP地址困難。
解決方法:加強提高施工質(zhì)量及施工工藝,規(guī)范驗收環(huán)節(jié)驗收內(nèi)容。施工和驗收時對網(wǎng)線長度、網(wǎng)線達(dá)到的性能、水晶頭達(dá)到的性能,施工注意事項落實情況都納入驗收環(huán)節(jié),施工隊伍在施工時也需要按照施工要求進行施工。
由于部分場景的AP功率大于12W,POE交換機端口最大輸出功率為15.4W,這就存在以下情況,網(wǎng)線長度過長或者網(wǎng)線質(zhì)量問題,會使交換機端口輸出功率與AP的功耗臨近一個閥值,很容易導(dǎo)致交換機下AP供電不足,觸發(fā)交換機POE端口保護,關(guān)閉該端口POE功能。
解決辦法:檢查 POE交換機是否具備這樣的功能,如果交換機的POE端口自動關(guān)閉并重新檢測PD設(shè)備,檢測成功后POE功能會自動打開。如果具有此功能此時AP就會重新啟動并恢復(fù)運行。如果沒有可對POE交換機的軟件版本進行升級。
在網(wǎng)管系統(tǒng)對AP的管理中,對如下的指標(biāo)進行分析有助于及早發(fā)現(xiàn)AP設(shè)備吊死現(xiàn)象。
(1)設(shè)備上線時長:對某一個AP來講,設(shè)備上線時長數(shù)據(jù)應(yīng)是逐步增大的,如果在一個較小的數(shù)值范圍內(nèi)波動時,就有可能是頻繁離線造成的。
(2)AP與AC的關(guān)聯(lián)狀態(tài):AP與AC關(guān)聯(lián),而業(yè)務(wù)數(shù)據(jù)量與正常業(yè)務(wù)使用時間(如學(xué)校的晚上時間)相比,較長時間沒有數(shù)據(jù)量或數(shù)據(jù)量較小,結(jié)合歷史數(shù)據(jù)判斷,就有可能出現(xiàn)了設(shè)備吊死現(xiàn)象。
(3)當(dāng)前與AP關(guān)聯(lián)的終端數(shù):在熱點區(qū)域,與AP連接的終端數(shù)長時間為0,結(jié)合歷史數(shù)據(jù)判斷,也有可能出現(xiàn)了設(shè)備吊死現(xiàn)象。
(4)關(guān)聯(lián)失敗總次數(shù):關(guān)聯(lián)失敗較多,說明設(shè)備不能正常接受用戶請求,有可能是設(shè)備吊死造成的。
(5)使用該信道的終端數(shù)、終端連接時長:在一個AP上的終端數(shù)或連接時長長時間為0,有可能是設(shè)備吊死導(dǎo)致終端無法連接。
(6)硬件模塊故障告警、無線鏈路中斷告警、AP無法增加新的移動用戶告警:可能出現(xiàn)管理通信正常而業(yè)務(wù)處理模塊故障,雖然網(wǎng)管數(shù)據(jù)正常,但不能提供用戶服務(wù)。
(7)AP重啟告警、AP下線告警:通信模塊出現(xiàn)故障,管理數(shù)據(jù)上傳不正常,也可以懷疑是設(shè)備吊死出現(xiàn)的告警。
伴隨著中國移動堅持快速、優(yōu)質(zhì)、低成本打造WLAN網(wǎng)絡(luò)建設(shè)的不斷推進,各種新的網(wǎng)絡(luò)難題不斷涌現(xiàn),為確保網(wǎng)絡(luò)建設(shè)質(zhì)量,增加網(wǎng)絡(luò)覆蓋,形成網(wǎng)絡(luò)競爭力,需要我們針對WLAN本身技術(shù)的弱點,研究更加高效、安全的網(wǎng)絡(luò)方案,提高WLAN電信級的運營能力。