徐 鐸
(中國移動通信集團河南有限公司,河南 鄭州 450000)
電源、空調等動環(huán)設備的穩(wěn)定運行,是保證網絡安全運行的基礎,其重要性不言而喻。網絡云大數據時代,動環(huán)可靠性保障要求更高,動力維護如履薄冰。數據中心動力設備眾多,傳統(tǒng)維護管理模式、傳統(tǒng)監(jiān)控支撐手段已不適應維護管理的需要,傳統(tǒng)動環(huán)網管成為高效管理的瓶頸[1]。AI與大數據技術迫切需求降本增效,向運維要效益,引入智能化管控新技術,探索高效又安全、節(jié)能又安全的運維新思路,勢在必行。
以數據中心動力設備安全穩(wěn)定運行為核心,圍繞“供電安全、節(jié)能降耗”兩大目標,以AI與大數據先進技術為支撐,加強巡檢管理、隱患管理、故障管理、負荷管理、能耗管理,達到強結構、控容量、保質量的目的,實現保障網絡供電安全,精細管控能耗,降本增效[2]。數據中心數智化維護體系模型如圖1所示。
通過引入“AI+大數據”,實現在管理理念、運維模式、技術手段、能力提升方面的全方位提高,達到提升數據中心動力維護管理能力的目的。
(1)管理理念創(chuàng)新:從以設備為中心轉向以系統(tǒng)為中心,系統(tǒng)隱患排查、系統(tǒng)負荷瓶頸管控。
(2)運維模式創(chuàng)新:從被動故障處理轉向主動識別,提前預警、提前發(fā)現。
(3)技術手段創(chuàng)新:從依賴人工經驗判斷分析轉向基于AI運維進行智能診斷分析,基于“AI+大數據”智能分析,實現空調節(jié)能、電池性能監(jiān)測。
(4)能力提升創(chuàng)新:碎片化數據的靜態(tài)分析轉向統(tǒng)一數據的動態(tài)迭代分析,建立電池容量計算模型、負荷管控模型、節(jié)能模型,并不斷訓練學習,實現網絡管理業(yè)界難題智能破解[3]。
完成動環(huán)監(jiān)控的兩級架構改造,實現省級動環(huán)監(jiān)控采集、處理、分析等集中化、規(guī)范化,為大數據關聯分析、智能化分析奠定堅實基礎,如圖2所示。
圖2 動環(huán)監(jiān)控架構改造演變
原有省采設備在老系統(tǒng),集采設備在新系統(tǒng),數據分散、數據格式不統(tǒng)一;現在統(tǒng)一平臺,標準一致,數據源規(guī)范。
應用“無線測溫”、“智能傳感器”等新技術、新手段,試點完成母排溫升、線井電纜溫升、高壓分路狀態(tài)等“啞設備”的實時監(jiān)測,變化預警,實現對安全隱患點的全覆蓋主動管控,如圖3所示。
圖3 啞設備管控方式
巡檢任務、設備預警自動推送至APP,實時提醒設備故障及性能劣化隱患的處理,保障動環(huán)設備安全穩(wěn)定運行。門禁+視頻授權,智能關聯巡檢掃碼權限,確保巡檢任務按人、按時、保質、保量完成[4]。同時將動環(huán)系統(tǒng)監(jiān)測與人工檢測數據進行實時對比和分析,協助維護人員分析判斷設備工作狀況,避免因數據采集不充分造成的分析誤差,通過巡檢數據和監(jiān)測數據分析,及早發(fā)現處理設備安全隱患,提高動環(huán)設備維護管理工作質量。智能化巡檢方式如圖4所示。
圖4 智能化巡檢方式
建立油機、變壓器、開關電源/UPS、列頭柜、設備機架的拓撲關系,實時呈現系統(tǒng)各環(huán)節(jié)設備的負荷,有效提前預警,發(fā)現負荷瓶頸,便于及時調整,確保機房供電安全、平穩(wěn),保障業(yè)務加電上線。系統(tǒng)化容量管控如圖5所示。
圖5 系統(tǒng)化容量管控
借助AI及大數據管理,對單體蓄電池的電壓、電流、溫度和內阻等各項數據進行實時在線監(jiān)測,結合電池特性參數,并通過軟件自學習,找出容量計算的智能算法,線性呈現后備容量[5]。根據放電數據,智能抓取壓降較快的單體電池,提醒維護人員第一時間處理落后電池,保障整組電池的放電性能,保證后備供電安全。電池性能管理如圖6所示。
圖6 電池性能管理
實時報警電壓落后電池、內阻異常電池、高溫電池、保障蓄電池后備供電安全。
借助“AI+大數據”節(jié)能平臺,建立智能化自學習節(jié)能機制,不斷優(yōu)化完善節(jié)能場景算法,智能管控系統(tǒng)、設備能耗,梳理建立八大場景節(jié)能規(guī)則算法,在保證供電、供冷安全的前提下,實現冷機、水泵、板式換熱器、風機、冷卻塔、蓄冷罐、末端空調的智能化聯動,并通過機器自學習,實現大幅節(jié)能效果??照{節(jié)能模型如圖7所示。
圖7 空調節(jié)能模型
通過試點測試,可借助節(jié)能報告,有效輔助現場優(yōu)化調整冷機、水泵、空調末端等設備的參數值。2021年上半年較2020年同比節(jié)能約16.25%,通過全面實施智能化節(jié)能措施,預計2021年可實現空調同比節(jié)能20%。
智能化巡檢維護,有效促進動環(huán)設備隱患排查處理,故障處理及時率提升至99.9%,避免網絡重大故障發(fā)生;智能化電池管理,有利于電池隱患的提前預警,準確把控放電容量,支撐應急保障和指揮調度;智能化節(jié)能管理,有效實現AI與大數據智慧節(jié)能,節(jié)能降耗得到切實落實,運維成本得到有效下降,為數據中心空調節(jié)能開展有益探索,為大園區(qū)數據中心運維積累經驗,是降本增效的重要舉措。動環(huán)數據資源的利用能力得到提升,群管群控、大數據挖掘、數據分析得到實踐驗證,為數智化轉型提供有效支撐。
以一個中等數據中心一年的維護巡檢為例,通過智能化巡檢、自動化管控等手段,可有效降低維護巡檢、日常抄表、隱患排查的人員數量,據保守統(tǒng)計,每棟樓可減少6人(高低壓2人、電力電池2人、空調2人),4棟樓可節(jié)省人力費用達192萬元;通過智能管控空調末端與水冷機組,初步預測空調節(jié)能費用達300萬元;且促進了安全隱患及時發(fā)現處理,提升動環(huán)供電安全能力,保障網絡安全,其效益巨大,無法具體估算。經后續(xù)不斷迭代優(yōu)化,將能形成強大的維護管理能力,發(fā)揮更大的經濟效益和社會效益。