摘 要:在物聯(lián)網(wǎng)和人工智能飛速發(fā)展的大背景下,針對高校網(wǎng)絡(luò)設(shè)備運維中存在的問題,基于物聯(lián)網(wǎng)和人工智能,從設(shè)計目標、系統(tǒng)架構(gòu)和應(yīng)用場景幾個方面對運維新方案進行闡述。方案依托自主研發(fā)的網(wǎng)絡(luò)設(shè)備管理器,獨立于需要維護的校園網(wǎng)絡(luò),無需改造現(xiàn)有校園網(wǎng)架構(gòu)和設(shè)備,成為高校網(wǎng)絡(luò)設(shè)備運維的一種新模式。
關(guān)鍵詞:物聯(lián)網(wǎng);網(wǎng)絡(luò)設(shè)備;運維方案;人工智能;高校;網(wǎng)絡(luò)設(shè)備管理器
中圖分類號:TP399 文獻標識碼:A 文章編號:2095-1302(2025)02-0-03
0 引 言
高校是一個高度依賴網(wǎng)絡(luò)的單位,其網(wǎng)絡(luò)組成又具有一定的復雜性。高校網(wǎng)絡(luò)一般由校園網(wǎng)絡(luò)、運營商網(wǎng)絡(luò)、各部門專網(wǎng)和托管網(wǎng)絡(luò)等構(gòu)成。網(wǎng)絡(luò)設(shè)備分布較松散,這給網(wǎng)絡(luò)設(shè)備運維帶來了較大的挑戰(zhàn)。鑒于當前物聯(lián)網(wǎng)技術(shù)已趨于成熟,本文將研究使用物聯(lián)網(wǎng)技術(shù)監(jiān)控和維護高校網(wǎng)絡(luò)設(shè)備。
1 高校網(wǎng)絡(luò)設(shè)備管理現(xiàn)狀
1.1 網(wǎng)絡(luò)設(shè)備管理方式
當前網(wǎng)絡(luò)設(shè)備運維方式主要分為:現(xiàn)場運維和遠程運維[1]?,F(xiàn)場運維時,工作人員需到現(xiàn)場并通過網(wǎng)絡(luò)設(shè)備調(diào)試接口對設(shè)備進行人為問題分析和處理。遠程運維指工作人員通過網(wǎng)絡(luò)設(shè)備自身提供的SSH、Telnet、Web等管理服務(wù)對設(shè)備進行維護。在此基礎(chǔ)上網(wǎng)絡(luò)設(shè)備廠商提供了集中管理設(shè)備的平臺,但這些平臺只局限于通過設(shè)備自身提供的服務(wù)和現(xiàn)有的網(wǎng)絡(luò)環(huán)境進行設(shè)備狀態(tài)的監(jiān)控和設(shè)備管理。
1.2 網(wǎng)絡(luò)設(shè)備管理中存在的問題
高校當前網(wǎng)絡(luò)設(shè)備管理中存在的問題如下:
(1)使用自身網(wǎng)絡(luò)環(huán)境運維自身網(wǎng)絡(luò)設(shè)備。在遠程運維環(huán)境下,如果用于進行設(shè)備管理的網(wǎng)絡(luò)環(huán)境已經(jīng)出現(xiàn)問題,工作人員無法通過現(xiàn)有遠程運維手段進行有效運維。
(2)網(wǎng)絡(luò)設(shè)備自身提供的網(wǎng)絡(luò)管理服務(wù)(SSH、Telnet、Web等)本就存在服務(wù)故障,而這些服務(wù)也占用了網(wǎng)絡(luò)設(shè)備的有限資源。
(3)現(xiàn)場運維人工成本逐年遞增。
針對上述存在的問題,需要尋求一種不依賴于自身網(wǎng)絡(luò)通信,并能很好接管現(xiàn)有網(wǎng)絡(luò)設(shè)備的遠程設(shè)備運維方案。
2 網(wǎng)絡(luò)設(shè)備運維方案
2.1 方案設(shè)計目標
本方案設(shè)計的目標是為了解決以下幾個問題:
(1)網(wǎng)絡(luò)設(shè)備運維使用外管模式。在外管模式下,網(wǎng)絡(luò)設(shè)備運維的通信環(huán)境不能依賴需要運維的設(shè)備,即不能使用設(shè)備自身的通信環(huán)境來運維設(shè)備。運維通信必須與需運維的設(shè)備通信環(huán)境獨立。
(2)不改變當前校園網(wǎng)絡(luò)結(jié)構(gòu)和架構(gòu),以一種較低成本的方式增強網(wǎng)絡(luò)運維能力。設(shè)備運維能力的增強不應(yīng)改變當前校園網(wǎng)絡(luò)的架構(gòu)。方案只是以最低的成本和在不改變現(xiàn)有網(wǎng)絡(luò)的基礎(chǔ)上增強網(wǎng)絡(luò)設(shè)備的運維能力。
(3)減少運維系統(tǒng)與校園網(wǎng)絡(luò)的關(guān)聯(lián)。當運維系統(tǒng)出現(xiàn)故障時,不會影響校園網(wǎng)絡(luò)的正常運行。
(4)方案應(yīng)考慮人工智能的應(yīng)用,以提供智能運維能力。
2.2 方案簡介
方案使用自主研發(fā)的網(wǎng)絡(luò)設(shè)備管理器(核心設(shè)備)。核心設(shè)備通過CONSOLE口連接網(wǎng)絡(luò)設(shè)備,并通過CONSOLE口對網(wǎng)絡(luò)設(shè)備進行監(jiān)控。核心設(shè)備基于多種物聯(lián)網(wǎng)通信協(xié)議與MQTT(Message Queuing Telemetry Transport)消息隊列通信。MQTT協(xié)議是一種基于發(fā)布/訂閱(Publish/Subscribe)模式的“輕量級”通信協(xié)議[2-3],該協(xié)議構(gòu)建于TCP/IP協(xié)議上。MQTT消息隊列集群主要負責核心設(shè)備與系統(tǒng)數(shù)據(jù)庫之間的信息(監(jiān)控信息)傳遞工作。系統(tǒng)數(shù)據(jù)庫采取多類型數(shù)據(jù)庫異構(gòu)集群的方式,通過異構(gòu)的方式充分發(fā)揮各數(shù)據(jù)庫的特性。方案具備設(shè)備故障預警、設(shè)備監(jiān)控儀表盤、設(shè)備遠程維護、設(shè)備環(huán)境監(jiān)測、設(shè)備故障預測、設(shè)備故障智能維護等功能。
2.3 系統(tǒng)架構(gòu)
運維系統(tǒng)由網(wǎng)絡(luò)設(shè)備接入層、異構(gòu)數(shù)據(jù)庫集群、傳統(tǒng)運維平臺和AI運維構(gòu)成。運維系統(tǒng)架構(gòu)如圖1所示。
2.3.1 網(wǎng)絡(luò)設(shè)備接入層
網(wǎng)絡(luò)設(shè)備接入層由核心設(shè)備、網(wǎng)關(guān)和MQTT集群組成。核心設(shè)備是管理網(wǎng)絡(luò)設(shè)備的設(shè)備。它通過RJ 45接口與網(wǎng)絡(luò)設(shè)備的CONSOLE口連接,通過RS 232通信方式監(jiān)控網(wǎng)絡(luò)設(shè)備。核心設(shè)備除了可以管理網(wǎng)絡(luò)設(shè)備外,還可以搭載設(shè)備環(huán)境傳感器。核心設(shè)備通過環(huán)境傳感器(如:溫度、濕度、氣體傳感器等[4])監(jiān)測網(wǎng)絡(luò)設(shè)備的存放環(huán)境。網(wǎng)絡(luò)設(shè)備真實的存放環(huán)境參數(shù)有溫度、濕度、有毒氣體體積分數(shù)、磁感應(yīng)強度等。這些參數(shù)能從物理參數(shù)的角度反映設(shè)備是否出現(xiàn)故障或出現(xiàn)故障的可能性。這是傳統(tǒng)網(wǎng)絡(luò)設(shè)備運維方案無法實現(xiàn)的。
核心設(shè)備選用國產(chǎn)ESP32S3芯片作為主控芯片。主控芯片通過UART1連接RS 232串口通信芯片,將網(wǎng)絡(luò)設(shè)備標準命令下發(fā)到網(wǎng)絡(luò)設(shè)備,并獲取網(wǎng)絡(luò)設(shè)備返回信息。主控芯片使用5G通信模塊或其他物聯(lián)網(wǎng)協(xié)議通信模塊與MQTT集群傳輸監(jiān)測信息。圖2所示為核心設(shè)備的硬件框架。
核心設(shè)備主要負責監(jiān)測網(wǎng)絡(luò)設(shè)備和控制網(wǎng)絡(luò)設(shè)備。核心設(shè)備工作流程如圖3所示。
2.3.2 異構(gòu)數(shù)據(jù)庫集群
異構(gòu)數(shù)據(jù)庫集群是系統(tǒng)數(shù)據(jù)庫和系統(tǒng)的數(shù)據(jù)核心。其用于存儲網(wǎng)絡(luò)設(shè)備輸出的原始監(jiān)控日志、通過AI模型處理后的向量數(shù)據(jù)、系統(tǒng)配置和顯示數(shù)據(jù)等。這些數(shù)據(jù)大部分不是傳統(tǒng)的關(guān)系型數(shù)據(jù),所以需要使用一種異構(gòu)的方式將非結(jié)構(gòu)化數(shù)據(jù)、向量數(shù)據(jù)和關(guān)系型數(shù)據(jù)存儲起來,發(fā)揮各類型數(shù)據(jù)庫的特長。
NoSQL(Not only SQL)是對不同于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)庫管理系統(tǒng)的統(tǒng)稱[5]。NoSQL的類型有:鍵值數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫、文檔數(shù)據(jù)庫、圖數(shù)據(jù)庫、向量數(shù)據(jù)庫和時間序列數(shù)據(jù)庫等。
方案將不同類型的非關(guān)系型數(shù)據(jù)存儲到對應(yīng)的NoSQL數(shù)據(jù)庫中。表1列舉了方案中主要的非關(guān)系型數(shù)據(jù)項和對應(yīng)的數(shù)據(jù)類型、數(shù)據(jù)庫。
2.3.3 傳統(tǒng)運維與AI運維平臺
設(shè)備運維平臺應(yīng)具備以下幾個主要功能:
(1)故障預警。故障發(fā)生時,第一時間將故障通知發(fā)送給管理和維護人員。
(2)設(shè)備狀態(tài)儀表盤。通過直觀的方式顯示各個被監(jiān)控設(shè)備的運行狀態(tài)。
(3)遠程維護。當故障發(fā)生時,能通過遠程方式恢復設(shè)備運行。
隨著人工智能的發(fā)展,從技術(shù)層面已具備將特定領(lǐng)域的大數(shù)據(jù)應(yīng)用到自然語言處理、機器學習模型和大語言模型中的能力,從而實現(xiàn)自動化執(zhí)行、簡化工作流程和預測的目的。實現(xiàn)網(wǎng)絡(luò)設(shè)備AI運維的總體思路如下:
(1)收集并匯總網(wǎng)絡(luò)設(shè)備的運行日志(特別是故障日志)、設(shè)備操作手冊、故障處理手冊等大數(shù)據(jù)。
(2)篩選清洗數(shù)據(jù),去除“噪聲”數(shù)據(jù)[7],識別與系統(tǒng)性和可能性問題相關(guān)的數(shù)據(jù),并標注數(shù)據(jù)。
(3)將篩選和標注后的大數(shù)據(jù)應(yīng)用到具體的AI模型中進行訓練。
(4)將訓練后的模型運用到實際的問題中,對比模型預測值和實際值,調(diào)整優(yōu)化模型參數(shù)和數(shù)據(jù),再訓練模型,直至模型能覆蓋絕大多數(shù)問題。
3 方案應(yīng)用場景及衍生和運維新模式
3.1 作為NMS的備用方案
網(wǎng)絡(luò)管理系統(tǒng)(Network Management System, NMS)的目的是管理網(wǎng)絡(luò),使網(wǎng)絡(luò)高效運行。各大廠商NMS有eSight(華為)、RIIL(銳捷)、iMC(H3C)等[8]。圖4描述了基于物聯(lián)網(wǎng)的網(wǎng)絡(luò)設(shè)備運維方案與傳統(tǒng)NMS管理手段的不同。本方案管理手段直接作用于網(wǎng)絡(luò)設(shè)備的物理層面,更加直接、高效和穩(wěn)定。本方案核心設(shè)備安裝方便,直接與網(wǎng)絡(luò)設(shè)備的CONSOLE口連接,無需配置和改造網(wǎng)絡(luò)設(shè)備。
傳統(tǒng)NMS是內(nèi)管模式。網(wǎng)絡(luò)設(shè)備使用自身的SNMP服務(wù)管理自身的控制接口。SNMP是廣泛應(yīng)用于TCP/IP網(wǎng)絡(luò)的網(wǎng)絡(luò)管理標準協(xié)議,該協(xié)議能夠支持網(wǎng)絡(luò)管理系統(tǒng),用以監(jiān)測連接到網(wǎng)絡(luò)上的設(shè)備是否有任何引起關(guān)注的情況[9]。網(wǎng)絡(luò)設(shè)備SNMP服務(wù)運行在很小的網(wǎng)絡(luò)設(shè)備上,常因設(shè)備資源不足而出現(xiàn)問題,如老舊網(wǎng)絡(luò)設(shè)備因SNMP版本過低而出現(xiàn)安全問題等。SNMP協(xié)議是基于TCP/IP協(xié)議研發(fā)的,即SNMP與NMS的通信基于自身網(wǎng)絡(luò)設(shè)備的網(wǎng)絡(luò)環(huán)境。如果網(wǎng)絡(luò)設(shè)備出現(xiàn)故障,且已經(jīng)影響SNMP的正常通信,那么必然導致NMS出現(xiàn)問題。在這種情況下,唯一的維護辦法是工作人員到設(shè)備現(xiàn)場通過控制口處理設(shè)備故障。而本方案使用外管模式。獨立的設(shè)備維護通信線路(物聯(lián)網(wǎng):4G、5G、 ZigBee、藍牙等[10])完全獨立于需要管理的網(wǎng)絡(luò)設(shè)備,管理服務(wù)也完全獨立于需要管理的網(wǎng)絡(luò)設(shè)備。本方案不論是作為傳統(tǒng)NMS的替代方案,還是作為一種備用方案都具有較好的可行性。
3.2 提供網(wǎng)絡(luò)設(shè)備云托管服務(wù)
網(wǎng)絡(luò)設(shè)備托管服務(wù)商可以向服務(wù)對象提供核心設(shè)備,通過4G或5G直接提供遠程運維服務(wù)。此應(yīng)用場景具有部署簡單,不影響服務(wù)對象現(xiàn)有設(shè)備、配置和網(wǎng)絡(luò)環(huán)境等優(yōu)勢。服務(wù)對象只需將需要托管的網(wǎng)絡(luò)設(shè)備接入核心設(shè)備即可,無需考慮VPN等隧道問題,維護人員可直接在場外維護高校的網(wǎng)絡(luò)設(shè)備。
3.3 網(wǎng)絡(luò)設(shè)備存放環(huán)境監(jiān)測
本方案提供了環(huán)境傳感器,可以將核心設(shè)備部署到需要檢測網(wǎng)絡(luò)設(shè)備存放環(huán)境的區(qū)域,用于檢測本區(qū)域的溫度、濕度、有毒氣體體積分數(shù)和磁感應(yīng)強度等物理參數(shù),將這些參數(shù)作為運維的輔助參考。
3.4 網(wǎng)絡(luò)設(shè)備運維新模式
本方案討論了一種建立在物聯(lián)網(wǎng)專網(wǎng)上的網(wǎng)絡(luò)設(shè)備運維模式。設(shè)備運維使用外管模式。外管模式指的是設(shè)備管理獨立于被管理設(shè)備本身和其運行環(huán)境。本方案中設(shè)備運維服務(wù)獨立于被管理設(shè)備,設(shè)備運維網(wǎng)絡(luò)獨立于被管理設(shè)備網(wǎng)絡(luò)。在外管模式下,網(wǎng)絡(luò)設(shè)備運維具有低依賴性、部署靈活、高擴展性和不影響原有網(wǎng)絡(luò)等特點。
4 結(jié) 語
本方案依托自研的核心設(shè)備,通過物聯(lián)網(wǎng)協(xié)議創(chuàng)建了網(wǎng)絡(luò)設(shè)備運維物聯(lián)專網(wǎng)。此專網(wǎng)獨立于需要維護的校園網(wǎng)絡(luò),無需改造現(xiàn)有校園網(wǎng)架構(gòu)和設(shè)備,部署方便快捷。本方案暫未對物聯(lián)網(wǎng)安全做出討論研究。
參考文獻
[1]王利平,龐曉艷,朱雨,等.基于物聯(lián)網(wǎng)和移動互聯(lián)的二次設(shè)備運維技術(shù)研究與應(yīng)用[J].中國電力,2019,52(3):177-184.
[2]姚丹,謝雪松,楊建軍,等.基于MQTT協(xié)議的物聯(lián)網(wǎng)通信系統(tǒng)的研究與實現(xiàn)[J].信息通信,2016(3):33-35.
[3]任亨,馬躍,楊海波,等.基于MQTT協(xié)議的消息推送服務(wù)器[J].計算機系統(tǒng)應(yīng)用,2014,23(3):77-82.
[4]錢志鴻,王義君.面向物聯(lián)網(wǎng)的無線傳感器網(wǎng)絡(luò)綜述[J].電子與信息學報,2013,35(1):215-227.
[5]申德榮,于戈,王習特,等.支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學報,2013,24(8):1786-1803.
[6]靳強勇,李冠宇,張俊.異構(gòu)數(shù)據(jù)集成技術(shù)的發(fā)展和現(xiàn)狀[J].計算機工程與應(yīng)用,2002(11):112-114.
[7]蒲天驕,喬驥,韓笑,等.人工智能技術(shù)在電力設(shè)備運維檢修中的研究及應(yīng)用[J].高電壓技術(shù),2020,46(2):369-383.
[8]段海新,楊家海,吳建平.基于Web和數(shù)據(jù)庫的網(wǎng)絡(luò)管理系統(tǒng)的設(shè)計與實現(xiàn)[J].軟件學報,2000(4):468-472.
[9]張杰.基于SNMP的網(wǎng)絡(luò)管理系統(tǒng)的研究與實現(xiàn)[D].上海:東華大學,2008.
[10]王保云.物聯(lián)網(wǎng)技術(shù)研究綜述[J].電子測量與儀器學報,2009,23(12):1-7.
作者簡介:程 通(1982—),男,四川成都人,碩士,工程師,研究方向為物聯(lián)網(wǎng)和系統(tǒng)設(shè)計。
收稿日期:2024-01-23 修回日期:2024-03-01