劉天龍,王 振,任 帥
(中國移動網(wǎng)絡(luò)事業(yè)部基礎(chǔ)網(wǎng)絡(luò)維護室,北京 100033)
近年來網(wǎng)絡(luò)運營成本逐年上漲,降本增效壓力明顯增加;通信電源空調(diào)設(shè)施逐步老化,重大和重要故障數(shù)量持續(xù)增加,磷酸鐵鋰電池、高壓直流等技術(shù)不斷推廣;線上化、智能化的管理手段逐步應(yīng)用;數(shù)據(jù)中心、核心機樓、節(jié)點機房和末端站點的維護管理方式差異性顯著增加。本文將就以上內(nèi)容結(jié)合現(xiàn)網(wǎng)情況開展分析,共同探討維護方式智能化、維護能力專業(yè)化、維護體系差異化的發(fā)展趨勢。
隨著“動環(huán)設(shè)施集中運維管理平臺”上線,中國移動組織開發(fā)了“動環(huán)專業(yè)風險字典表”,各省發(fā)現(xiàn)的隱患根據(jù)預期損失(斷電、制冷中斷、監(jiān)控失效、高能耗)、隱患產(chǎn)生環(huán)節(jié)(設(shè)計規(guī)劃環(huán)節(jié)、設(shè)備采購環(huán)節(jié)、工程實施環(huán)節(jié)、運維環(huán)節(jié))、所屬系統(tǒng)等維度進行歸并,同時上報現(xiàn)場整改條件和預計完成日期,形成了有效的閉環(huán)管理,對于經(jīng)驗積累和分析提供了素材,保障了隱患排查工作系統(tǒng)性開展。
以往中國移動對于機房運行的分析主要局限于各省公司數(shù)據(jù)報送,時效性差、準確率不高,自2020年以來通過平臺抓取溫度、門禁、負載電流等數(shù)據(jù),對機房運行質(zhì)量進行分析。容量預警方面在系統(tǒng)內(nèi)固化不同架構(gòu)的數(shù)學模型,通過采集電流,自動計算負載容量比,實現(xiàn)全網(wǎng)容量預警監(jiān)測。溫度分析方面通過采集機房溫度數(shù)據(jù),對于過低和過高的情況進行自動識別,主動發(fā)掘溫控管理盲點。
傳統(tǒng)機房巡檢嚴重依賴人工,不少局站現(xiàn)場工作人員60%以上的工作時間都用在機房巡檢上。通過巡檢機器人、光纖測溫技術(shù),以及智能化平臺等手段,動態(tài)監(jiān)測機房溫濕度和煙感、局部熱點,以及人員出入管理等,極大地減少了現(xiàn)場運維人員的重復性工作。
多個省公司在數(shù)據(jù)中心引入巡檢機器人,智能規(guī)劃巡檢路線,動態(tài)監(jiān)測溫度、濕度、煙感、人員活動等信息,可在一定程度上替代人工巡檢。采用光纖測溫技術(shù)對電纜、高溫機柜等設(shè)施進行在線監(jiān)測,可實現(xiàn)大范圍、低成本、高可靠的溫度探測,對預防火災(zāi)和機房熱島防治有較好效果。在機房出入方面構(gòu)建線上管理系統(tǒng),實現(xiàn)機房出入申請、審批、安全教育、人臉識別開門端到端全流程電子化。
智能革命正在到來,將逐步重構(gòu)現(xiàn)有的運維方式。如同智能工業(yè)機器人對勞動密集型企業(yè)乃至整個產(chǎn)業(yè)競爭格局的重塑。在動環(huán)運維中引入智能化技術(shù),可大大簡化一線人員的重復性勞動,大幅降低人工參與環(huán)節(jié),提高工作效率,釋放更多的創(chuàng)新活力[1]。
傳統(tǒng)風冷空調(diào)系統(tǒng)構(gòu)成相對簡單,單臺空調(diào)自成一個循環(huán)系統(tǒng),維護壓力不大。數(shù)據(jù)中心及部分核心機樓采用水冷空調(diào)系統(tǒng),當前已經(jīng)投運的40余個大型數(shù)據(jù)中心園區(qū),近年來發(fā)生多起水冷空調(diào)系統(tǒng)故障。在故障分析中發(fā)現(xiàn),不少數(shù)據(jù)中心僅有1~2名自有人員對水冷系統(tǒng)有較為深入的理解,屬地維護人員對水冷系統(tǒng)的掌握程度不容樂觀。有的數(shù)據(jù)中心在BA系統(tǒng)未完成驗收情況下即投運,冷機工作在純手動狀態(tài)、寒冷季節(jié)仍采用冷機制冷。一旦發(fā)生意外,現(xiàn)場值守人員難以快速應(yīng)急處理。
空調(diào)群控系統(tǒng)作為空調(diào)系統(tǒng)的大腦,復雜度和重要性也在逐步提升,需要專業(yè)技術(shù)人員進行操作,目前也缺乏建設(shè)、驗收和維護標準,現(xiàn)網(wǎng)已發(fā)生多次故障案例。目前中國移動正在制定相關(guān)標準,近期將全網(wǎng)發(fā)布。
電源系統(tǒng)是設(shè)備類型最多的系統(tǒng),從功能上來講可以分為電源引入層、變配電層、不間斷電源層和末端配電層。自維設(shè)備主要包括發(fā)電機組、變壓器、高低壓配電系統(tǒng)、不間斷電源(UPS、高壓直流、-48V開關(guān)電源)和列頭柜。近年來部分數(shù)據(jù)中心自建自維110 kV/66 kV/35 kV變電站,全網(wǎng)大力推廣磷酸鐵鋰電池和高壓直流系統(tǒng),對電源專業(yè)人員的維護要求越來越高。通信電源專業(yè)特別是現(xiàn)場作業(yè)操作的安全對通信企業(yè)的安全生產(chǎn)有著至關(guān)重要的作用[2]。通過內(nèi)外部培訓、割接項目、擴容工程等方式,培養(yǎng)和提高電源維護人員的綜合素質(zhì),使其具備在各類設(shè)備單點故障的情況快速搶通的能力至關(guān)重要。
2015年中國移動開始了動環(huán)監(jiān)控系統(tǒng)集中采購,結(jié)束了各省公司“各自為戰(zhàn)”的局面。但是由于前期多年的獨立建設(shè)和分配廠家變動頻繁的原因,目前各省的動環(huán)監(jiān)控廠家數(shù)量過多、不同廠家對接困難等問題一直沒有完全解決,通過標準B接口構(gòu)建省動環(huán)監(jiān)控平臺直連FSU的二級架構(gòu)已經(jīng)越來越成為共識。隨著數(shù)據(jù)中心的建設(shè),園區(qū)級集中管理手段成為迫切的管理需求,通過DCIM系統(tǒng)對動環(huán)監(jiān)控系統(tǒng)、BA系統(tǒng)、供儲油控制系統(tǒng)、安防監(jiān)控系統(tǒng)等進行綜合管理已經(jīng)成為數(shù)據(jù)中心建設(shè)標準配置。
隨著動環(huán)監(jiān)控內(nèi)容的逐步擴充和系統(tǒng)復雜度的不斷升級,單純的查看告警、簡單的量化統(tǒng)計已經(jīng)難以發(fā)揮出系統(tǒng)的作用。如何發(fā)揮動環(huán)監(jiān)控系統(tǒng)的作用?水冷空調(diào)系統(tǒng)AI智能控制、多維度電源系統(tǒng)能效分析、自動化蓄電池放電管理等應(yīng)用正在“從夢想照進現(xiàn)實”。
“聞道有先后,術(shù)業(yè)有專攻”。電源、空調(diào)、動環(huán)監(jiān)控等無論是從技術(shù)原理還是設(shè)備系統(tǒng)均有很大差異,在規(guī)模越來越大、集中化程度越來越高的趨勢下,員工專業(yè)細分,選擇一個專業(yè)方向投入更多精力,鍛造更長的長板,是個人發(fā)展和公司人才培養(yǎng)的雙贏模式。
各省也應(yīng)不拘一格培養(yǎng)人才,大膽嘗試招聘相關(guān)專業(yè)人才、加強理論實操培訓等方式,保證員工在每個階段(崗前、在崗、后續(xù))都有對應(yīng)的培訓培養(yǎng)方案及跟蹤計劃[3]。用更加細化的分工來應(yīng)對大規(guī)模集中化,用更加專業(yè)化的技能來凸顯專業(yè)價值。
隨著中國移動3+3+X數(shù)據(jù)中心戰(zhàn)略的落地,不同類型局站所對應(yīng)的維護模式逐步形成了以少量技術(shù)、管理復合型人才自有人員為主,三方維護團隊協(xié)維的管理模式。數(shù)據(jù)中心一般設(shè)置三級部門機構(gòu),以10人以內(nèi)的自有團隊為核心,對數(shù)據(jù)中心運維進行全面管理。采用購買三方維護服務(wù)的方式開展日常運維,包括7×24小時值守、日常巡檢、維護作業(yè)等內(nèi)容。
核心機樓維護模式比較復雜,一般是沿用歷史維護模式,各省情況不盡相同。北方省份自維成分居多,南方省份協(xié)維成分居多。近年來隨著老員工的退休,全國范圍都開始逐步引入三方協(xié)維隊伍。
協(xié)維人員管理除了甄別資質(zhì)(高低壓特種操作證、制冷證)和技術(shù)能力,后期培養(yǎng)也至關(guān)重要。建議通過各種培訓、演練、操作等機會培養(yǎng)三方人員的安全責任意識和實際動手能力,中國移動也在2020年組織編制了《動環(huán)實操培訓教材》[4]。
鑒于目前自有人員數(shù)量和機房數(shù)量,匯聚機房和基站的維護應(yīng)全部劃入代維管理。這類站點分布在城市、鄉(xiāng)鎮(zhèn)、農(nóng)村等廣大地域上,依靠自有人員難以實現(xiàn)維護覆蓋。站點內(nèi)動環(huán)設(shè)備以開關(guān)電源、蓄電池和舒適型空調(diào)為主,技術(shù)要求相對較低、影響范圍可控,目前大多數(shù)省份是以代維為主,其他三方單位為輔,自有人員進行監(jiān)督檢查。
在維護人員和費用壓減的大背景下,各類站點的維護模式應(yīng)因地制宜,收斂和培養(yǎng)自有人員的核心管理、技術(shù)能力,將簡單、重復、技術(shù)含量較低的維護工作外包,并建立一套完善的入職測評、能力培養(yǎng)和定期考核制度。同時應(yīng)努力打造智能化監(jiān)控維護手段,減少人工工作量,向著自動駕駛網(wǎng)絡(luò)不斷邁進[5]。
通信電源空調(diào)維護應(yīng)該在維護規(guī)程指導下,充分結(jié)合本地配置架構(gòu)和業(yè)務(wù)要求,探索開展分類分級的維護服務(wù)。成本壓力的傳導會倒逼更加激進的探索和改革,通信電源空調(diào)維護依然任重道遠,廠家眾多、智能化程度較低、屬地化要求高等一系列問題都亟待解決。