呂常勝
摘要:該文從氣象局域網(wǎng)監(jiān)控方面分析了當(dāng)前網(wǎng)絡(luò)方面存在的一些問題,并據(jù)此提出了改進(jìn)方案,設(shè)計了一套能夠?qū)崿F(xiàn)網(wǎng)絡(luò)實時監(jiān)控、設(shè)備故障自動檢測及處理、遠(yuǎn)程系統(tǒng)維護(hù)等功能的系統(tǒng)結(jié)構(gòu)及技術(shù)方案。
關(guān)鍵詞:局域網(wǎng);監(jiān)控;遠(yuǎn)程
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)01-0031-02
氣象中心自1997年安裝、運行氣象數(shù)據(jù)庫系統(tǒng)以來,便開始組建并逐步發(fā)展了氣象中心自己的局域網(wǎng)。目前,氣象中心大部分設(shè)備均已連入了局域網(wǎng),達(dá)到了資源的合理配置和資料的共享,并在此基礎(chǔ)上開發(fā)了氣象信息服務(wù)系統(tǒng),對外提供方便、快捷的氣象信息。但隨著網(wǎng)絡(luò)資源的擴(kuò)大和對外服務(wù)的延伸,期間相應(yīng)也暴露出了一些問題和安全隱患。目前,對設(shè)備故障及隱患的發(fā)現(xiàn)主要來源于兩個渠道:一是在設(shè)備值班人員的日常巡視時發(fā)現(xiàn);二是使用人員在使用過程中發(fā)現(xiàn)。通過這些渠道并不能保證對網(wǎng)絡(luò)上各個運行系統(tǒng)進(jìn)行實時、有效的監(jiān)控,對設(shè)備的故障及隱患不能及時發(fā)現(xiàn)并處理,導(dǎo)致設(shè)備正常運行率降低,乃至直接影響到安全生產(chǎn)。
1 系統(tǒng)主要功能
目前,氣象中心現(xiàn)有在線運行的設(shè)備包括氣象數(shù)據(jù)庫系統(tǒng)、自動填圖系統(tǒng),氣象衛(wèi)星接收系統(tǒng)、713雷達(dá)及數(shù)字化系統(tǒng)、自動觀測系統(tǒng)以及氣象信息對外服務(wù)系統(tǒng)等。各系統(tǒng)均通過以太網(wǎng)方式互相連接,構(gòu)成了氣象中心的局域網(wǎng)系統(tǒng)。運行的操作系統(tǒng)包括UNIX、WINDOW NT、WINDOW XP、DOS等;應(yīng)用的網(wǎng)絡(luò)協(xié)議有TCP/IP、NetBEUI、NFS等。
本系統(tǒng)(氣象網(wǎng)絡(luò)設(shè)備監(jiān)控系統(tǒng))基于氣象局域網(wǎng)的硬件、軟件平臺上開發(fā)設(shè)計,主要完成幾個方面的功能:
1)網(wǎng)絡(luò)實時監(jiān)控
2)設(shè)備故障自動檢測及處理
3)遠(yuǎn)程系統(tǒng)維護(hù)
2 系統(tǒng)技術(shù)方案
由于本系統(tǒng)基于氣象局域網(wǎng)開發(fā)設(shè)計,對所有網(wǎng)絡(luò)設(shè)備及在線各運行系統(tǒng)進(jìn)行監(jiān)控、管理。所以,應(yīng)在保證氣象局域網(wǎng)的硬件平臺及各運行系統(tǒng)均已安裝、設(shè)置、連接正常的情況下,方可實現(xiàn)本系統(tǒng)的各項功能。
根據(jù)以上該系統(tǒng)所要完成的各項功能,其實現(xiàn)方式及主要功能如下:
2.1 網(wǎng)絡(luò)實時監(jiān)控
針對所有網(wǎng)絡(luò)設(shè)備(包括路由器、終端服務(wù)器、打印服務(wù)器、服務(wù)器主機(jī)、工作站主機(jī)、各運行系統(tǒng)主機(jī)等)進(jìn)行實時監(jiān)控,通過收集各系統(tǒng)主機(jī)IP地址并形成一個Hosts文件。監(jiān)測服務(wù)器通過輪詢方式檢測各主機(jī)是否在線。各系統(tǒng)主機(jī)可運行定制的程序,采集系統(tǒng)的運行環(huán)境信息(如網(wǎng)絡(luò)資源的共享情況、硬盤空間的使用情況、CPU的利用率、內(nèi)存的使用情況等), 發(fā)往監(jiān)測服務(wù)器,若網(wǎng)絡(luò)發(fā)生問題、系統(tǒng)硬盤空間滿或接近100%等事件發(fā)生,監(jiān)測服務(wù)器可發(fā)出告警信息,提醒值班人員及時維護(hù)或維修。
2.2 設(shè)備故障自動檢測及處理
氣象局域網(wǎng)上各運行設(shè)備既相互獨立又通過各種方式連接在一起,該功能通過分布控制與集中管理的方式實現(xiàn)。
分布控制,即在各運行系統(tǒng)主機(jī)內(nèi)加入故障自動檢測、處理模塊,根據(jù)各運行系統(tǒng)特有的功能,編制相應(yīng)的檢測程序,若發(fā)現(xiàn)某一進(jìn)程在檢測時效內(nèi)沒有啟動或已經(jīng)掉下,可自動啟動相應(yīng)進(jìn)程,完成故障的自動恢復(fù)功能。若自動恢復(fù)功能失敗,則立即將故障信息發(fā)往監(jiān)測服務(wù)器,由監(jiān)測服務(wù)器負(fù)責(zé)處理。
集中管理,即故障監(jiān)測服務(wù)器集中收集、記錄各運行系統(tǒng)的故障信息,通過多種方式將故障信息通知給維護(hù)人員。信息提示方式可以包括屏幕顯示告警、聲音告警或通過連接MODEM和電話線路、以及手機(jī)短信的方式將故障信息傳送給異地維護(hù)人員的手機(jī)上,維護(hù)人員收到信息后,可大致判別故障位置、情況,通過遠(yuǎn)程維護(hù)系統(tǒng)進(jìn)行維護(hù)或直接返回故障現(xiàn)場排除故障,實現(xiàn)了設(shè)備故障的自動檢測、通知及遠(yuǎn)程維護(hù)的一整套功能,保證了在最短時間內(nèi)恢復(fù)設(shè)備的正常運行。
該項功能的原理圖如圖1所示。
2.3 遠(yuǎn)程系統(tǒng)維護(hù)
通過設(shè)置撥號服務(wù)器,遠(yuǎn)程用戶(包括中心領(lǐng)導(dǎo)、系統(tǒng)維護(hù)人員等)可通過連接MODEM和電話線路遠(yuǎn)程登錄到氣象局域網(wǎng)系統(tǒng),對氣象局域網(wǎng)內(nèi)的所有在線設(shè)備及各個運行系統(tǒng)進(jìn)行實時的遠(yuǎn)程監(jiān)控和遠(yuǎn)程維護(hù)。如系統(tǒng)故障時,正趕上該設(shè)備技術(shù)骨干不當(dāng)班或出差,即可通過這種方式進(jìn)行異地遠(yuǎn)程維護(hù),迅速排除故障。
3 系統(tǒng)設(shè)計、開發(fā)方面特點
1)充分、合理的利用現(xiàn)有網(wǎng)絡(luò)設(shè)備及資源;
2)采用模塊化設(shè)計,各模塊之間既相互獨立又可組合相連;
3)各模塊盡可能采用公共源碼程序,通過設(shè)置相應(yīng)的參數(shù)文件、數(shù)據(jù)文件,達(dá)到代碼的重復(fù)利用;
4)為系統(tǒng)的再開發(fā)預(yù)留接口,以便于擴(kuò)展;也可根據(jù)新增設(shè)備及設(shè)備改動等情況進(jìn)行適當(dāng)調(diào)整;
5)系統(tǒng)界面友好、美觀,操作方便、快捷。