劉振華
摘要:開源網(wǎng)絡(luò)監(jiān)控系統(tǒng)Zabbix在IT運維管理上得到了廣泛應(yīng)用,但是Zabbix自身所能監(jiān)控的粒度和深度都難以滿足IT運維管理的深層次需求,特別是對于數(shù)字校園應(yīng)用系統(tǒng)可用性的自動監(jiān)控方面存在較大的缺陷。在結(jié)合了學(xué)校具體應(yīng)用的實際情況后,通過對Zabbix監(jiān)控系統(tǒng)實施的二次開發(fā)和改造,實現(xiàn)了對部分應(yīng)用系統(tǒng)可用性狀態(tài)的實時監(jiān)控,并給出了具體的思路和方法。
關(guān)鍵詞: Zabbix;IT運維管理;數(shù)字校園應(yīng)用;自動監(jiān)控
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)32-7740-02
Abstract: Zabbix, as an open source network monitoring system, has been widely used in IT operation and management. However, it is hard for the Zabbixs monitoring granularity and profundity to meet the ITOMs deeper demends, especially for the defects existing in the automatic monitored control of the digital campus applications availability. The combinations with practice applications in CIET and secondary development and reform of the Zabbix monitoring system implementation make the real-time monitoring of part of applications availability come true and also bring up some specific thoughts and methods.
Key words:Zabbix; ITOM(IT Operation and Management); digital campus applications; automatic monitored control
Zabbix是一個基于WEB界面的提供分布式系統(tǒng)監(jiān)控以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級開源解決方案[1]。因為Zabbix部署的靈活性以及開源的特征,有很多學(xué)校和企業(yè)通過部署Zabbix來對自身的IT基礎(chǔ)設(shè)施的運行狀態(tài)進行實時監(jiān)控;學(xué)校也嘗試部署了Zabbix,目前已經(jīng)將大部分服務(wù)器和網(wǎng)絡(luò)設(shè)備納入了Zabbix監(jiān)控范圍,使Zabbix成為運維管理人員重要的故障監(jiān)控工具。
但是Zabbix只能對一些比較常規(guī)的CPU利用率、端口狀態(tài)、流量、進程使用等項目進行監(jiān)控,難以針對應(yīng)用服務(wù)進行實時監(jiān)控。而隨著各類應(yīng)用復(fù)雜性的提高,導(dǎo)致應(yīng)用出現(xiàn)故障的原因越來越難以排查,很多故障并不是CPU、內(nèi)存等一些常規(guī)問題所引起的,而有可能是系統(tǒng)自身的BUG或負(fù)載等一些隱秘的原因所引起的,所以有時候Zabbix顯示常規(guī)的監(jiān)控項目狀態(tài)都正常,但是應(yīng)用實際已經(jīng)不可用,這樣就失去了自動監(jiān)控的意義。
為了彌補Zabbix在應(yīng)用監(jiān)控方面的不足,對Zabbix監(jiān)控系統(tǒng)做了一些深入的研究,結(jié)合IT運維自動化的思想,在Zabbix系統(tǒng)的基礎(chǔ)上進行了二次開發(fā),能夠針對DHCP、Radius認(rèn)證、FTP及VPN系統(tǒng)等應(yīng)用實施可用的自動監(jiān)控。
1 系統(tǒng)設(shè)計思路
既然Zabbix常規(guī)監(jiān)控項目難以反映出應(yīng)用系統(tǒng)是否正常,只有親自使用系統(tǒng)才能真正判斷出應(yīng)用系統(tǒng)是否可用,但是要做到實時監(jiān)控,就必須用到運維自動化的相關(guān)技術(shù)了,否則單憑人工操作是無法保證監(jiān)控的時效性的。為了達(dá)到自動監(jiān)控的目的,采用腳本程序來模擬客戶端或用戶訪問應(yīng)用系統(tǒng)的流程,將該流程自動化、程序化,利用Zabbix監(jiān)控系統(tǒng)的接口將系統(tǒng)狀態(tài)傳遞給Zabbix,通過Zabbix系統(tǒng)的Trigger判斷,將應(yīng)用系統(tǒng)的可用狀態(tài)情況以頁面、郵件或者短信的方式展示給運維管理人員,以達(dá)到實時監(jiān)控的目的。
自動監(jiān)控系統(tǒng)可分為兩大模塊:模擬用戶行為模塊和應(yīng)用狀態(tài)感知模塊。這兩大模塊彼此關(guān)聯(lián)協(xié)作,模擬用戶行為模塊不斷循環(huán)獲取應(yīng)用系統(tǒng)的狀態(tài),然后將狀態(tài)信息傳遞給應(yīng)用狀態(tài)感知模塊,應(yīng)用狀態(tài)感知模塊經(jīng)過判斷,將狀態(tài)信息以多種方式展示給運維管理人員。
2 具體實現(xiàn)
系統(tǒng)目前已經(jīng)實現(xiàn)了對DHCP、Radius認(rèn)證、FTP及VPN等應(yīng)用系統(tǒng)的自動實時監(jiān)控,下面將使用DHCP、Radius和FTP為例給出具體的實現(xiàn)思路和方法。
2.1 DHCP應(yīng)用服務(wù)狀態(tài)的監(jiān)控
學(xué)校使用的DHCP服務(wù)是安裝的Linux服務(wù)器提供的,自動實時監(jiān)控DHCP服務(wù)的關(guān)鍵在于腳本需要不停去模擬用戶利用DHCP服務(wù)器獲取IP地址的過程,這個過程可以利用兩條命令"ipconfig /release"和"ipconfig /renew"來表示,即釋放IP和重新獲取IP,如果DHCP應(yīng)用出現(xiàn)故障,那么主機將無法在執(zhí)行上述兩條命令后獲取正確的IP地址,那么Zabbix監(jiān)控端也將無法ping通該主機。利用WIN 2003 SERVER服務(wù)器作為運行腳本程序的監(jiān)控主機,該程序采用BAT(批處理)腳本實現(xiàn),起到模擬用戶行為的作用。服務(wù)器設(shè)置每隔30秒執(zhí)行"ipconfig /release"和"ipconfig /renew"命令,重新從DHCP服務(wù)器去獲取IP地址,根據(jù)監(jiān)控主機能否獲得正確的IP地址代表了DHCP服務(wù)是否正常,下一步需要做的就是將該狀態(tài)信息傳遞給應(yīng)用狀態(tài)感知模塊,即Zabbix監(jiān)控系統(tǒng)。將此監(jiān)控主機納入Zabbix的監(jiān)控范圍,使用Zabbix的icmpping來確認(rèn)能否與該主機通訊,如果能夠ping通,則返回值為1,否則返回值為0 ;這樣就能判斷該主機是否獲得了正確的IP地址,也就實現(xiàn)了對于DHCP服務(wù)應(yīng)用狀態(tài)的實時監(jiān)控。
2.2 Radius認(rèn)證應(yīng)用服務(wù)狀態(tài)的監(jiān)控
Radius認(rèn)證服務(wù)在很多網(wǎng)絡(luò)環(huán)境有著廣泛應(yīng)用,用于其他應(yīng)用系統(tǒng)和設(shè)備登錄的認(rèn)證。學(xué)校Radius服務(wù)的一項重要應(yīng)用就是VPN和無線網(wǎng)絡(luò)設(shè)備的登錄認(rèn)證。實現(xiàn)Radius認(rèn)證應(yīng)用狀態(tài)的自動實時監(jiān)控的關(guān)鍵點仍然是提取出用戶使用Radius應(yīng)用的流程,然后以腳本程序去實現(xiàn)該流程,然后將檢測結(jié)果傳遞給Zabbix。采用基于SecureCRT平臺的VBScript語言編寫模擬用戶登錄城市熱點計費網(wǎng)關(guān)(Dr.com)行為的腳本程序,模擬提交登錄的用戶名和密碼,就可以根據(jù)登錄結(jié)果來判斷Radius服務(wù)的健康狀況。
2.3 FTP應(yīng)用服務(wù)狀態(tài)的監(jiān)控
FTP是學(xué)校重要的文件服務(wù)器,為全校師生提供文件存儲服務(wù)。實現(xiàn)FTP應(yīng)用服務(wù)狀態(tài)的自動實時監(jiān)控的關(guān)鍵也是模擬用戶登錄FTP系統(tǒng),并上傳一個測試文件,根據(jù)整個過程的狀態(tài)來判斷FTP應(yīng)用的存活度。腳本使用PHP的CURL來實現(xiàn)。
為了減少系統(tǒng)誤報的概率,可以在Zabbix里設(shè)置Trigger的值,實現(xiàn)連續(xù)兩次探測應(yīng)用服務(wù)的狀態(tài)結(jié)果作為依據(jù),達(dá)到系統(tǒng)監(jiān)控的有效性。
3 結(jié)束語
隨著數(shù)字校園建設(shè)的不斷推進和完善,IT運維管理自動化就顯得尤為重要。通過對開源網(wǎng)絡(luò)監(jiān)控系統(tǒng)Zabbix在應(yīng)用監(jiān)控方面的實踐改造,給出了Zabbix在應(yīng)用監(jiān)控方面的解決方案。目前該自動監(jiān)控系統(tǒng)已經(jīng)在學(xué)校進行應(yīng)用,支持對DHCP、Radius認(rèn)證、FTP及VPN等應(yīng)用系統(tǒng)狀態(tài)的實時監(jiān)控,計劃后期將持續(xù)改造該監(jiān)控系統(tǒng),盡可能將更多的應(yīng)用系統(tǒng)納入實時監(jiān)控的范圍。通過給出的思路和方法,可以結(jié)合自身的實際網(wǎng)絡(luò)環(huán)境對Zabbix進行二次開發(fā),建成一套符合實際需求的一體化自動監(jiān)控系統(tǒng)。
參考文獻(xiàn):
[1] zabbix 百度百科[EB/OL]. http://baike.baidu.com/view/1924617.htm.endprint
摘要:開源網(wǎng)絡(luò)監(jiān)控系統(tǒng)Zabbix在IT運維管理上得到了廣泛應(yīng)用,但是Zabbix自身所能監(jiān)控的粒度和深度都難以滿足IT運維管理的深層次需求,特別是對于數(shù)字校園應(yīng)用系統(tǒng)可用性的自動監(jiān)控方面存在較大的缺陷。在結(jié)合了學(xué)校具體應(yīng)用的實際情況后,通過對Zabbix監(jiān)控系統(tǒng)實施的二次開發(fā)和改造,實現(xiàn)了對部分應(yīng)用系統(tǒng)可用性狀態(tài)的實時監(jiān)控,并給出了具體的思路和方法。
關(guān)鍵詞: Zabbix;IT運維管理;數(shù)字校園應(yīng)用;自動監(jiān)控
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)32-7740-02
Abstract: Zabbix, as an open source network monitoring system, has been widely used in IT operation and management. However, it is hard for the Zabbixs monitoring granularity and profundity to meet the ITOMs deeper demends, especially for the defects existing in the automatic monitored control of the digital campus applications availability. The combinations with practice applications in CIET and secondary development and reform of the Zabbix monitoring system implementation make the real-time monitoring of part of applications availability come true and also bring up some specific thoughts and methods.
Key words:Zabbix; ITOM(IT Operation and Management); digital campus applications; automatic monitored control
Zabbix是一個基于WEB界面的提供分布式系統(tǒng)監(jiān)控以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級開源解決方案[1]。因為Zabbix部署的靈活性以及開源的特征,有很多學(xué)校和企業(yè)通過部署Zabbix來對自身的IT基礎(chǔ)設(shè)施的運行狀態(tài)進行實時監(jiān)控;學(xué)校也嘗試部署了Zabbix,目前已經(jīng)將大部分服務(wù)器和網(wǎng)絡(luò)設(shè)備納入了Zabbix監(jiān)控范圍,使Zabbix成為運維管理人員重要的故障監(jiān)控工具。
但是Zabbix只能對一些比較常規(guī)的CPU利用率、端口狀態(tài)、流量、進程使用等項目進行監(jiān)控,難以針對應(yīng)用服務(wù)進行實時監(jiān)控。而隨著各類應(yīng)用復(fù)雜性的提高,導(dǎo)致應(yīng)用出現(xiàn)故障的原因越來越難以排查,很多故障并不是CPU、內(nèi)存等一些常規(guī)問題所引起的,而有可能是系統(tǒng)自身的BUG或負(fù)載等一些隱秘的原因所引起的,所以有時候Zabbix顯示常規(guī)的監(jiān)控項目狀態(tài)都正常,但是應(yīng)用實際已經(jīng)不可用,這樣就失去了自動監(jiān)控的意義。
為了彌補Zabbix在應(yīng)用監(jiān)控方面的不足,對Zabbix監(jiān)控系統(tǒng)做了一些深入的研究,結(jié)合IT運維自動化的思想,在Zabbix系統(tǒng)的基礎(chǔ)上進行了二次開發(fā),能夠針對DHCP、Radius認(rèn)證、FTP及VPN系統(tǒng)等應(yīng)用實施可用的自動監(jiān)控。
1 系統(tǒng)設(shè)計思路
既然Zabbix常規(guī)監(jiān)控項目難以反映出應(yīng)用系統(tǒng)是否正常,只有親自使用系統(tǒng)才能真正判斷出應(yīng)用系統(tǒng)是否可用,但是要做到實時監(jiān)控,就必須用到運維自動化的相關(guān)技術(shù)了,否則單憑人工操作是無法保證監(jiān)控的時效性的。為了達(dá)到自動監(jiān)控的目的,采用腳本程序來模擬客戶端或用戶訪問應(yīng)用系統(tǒng)的流程,將該流程自動化、程序化,利用Zabbix監(jiān)控系統(tǒng)的接口將系統(tǒng)狀態(tài)傳遞給Zabbix,通過Zabbix系統(tǒng)的Trigger判斷,將應(yīng)用系統(tǒng)的可用狀態(tài)情況以頁面、郵件或者短信的方式展示給運維管理人員,以達(dá)到實時監(jiān)控的目的。
自動監(jiān)控系統(tǒng)可分為兩大模塊:模擬用戶行為模塊和應(yīng)用狀態(tài)感知模塊。這兩大模塊彼此關(guān)聯(lián)協(xié)作,模擬用戶行為模塊不斷循環(huán)獲取應(yīng)用系統(tǒng)的狀態(tài),然后將狀態(tài)信息傳遞給應(yīng)用狀態(tài)感知模塊,應(yīng)用狀態(tài)感知模塊經(jīng)過判斷,將狀態(tài)信息以多種方式展示給運維管理人員。
2 具體實現(xiàn)
系統(tǒng)目前已經(jīng)實現(xiàn)了對DHCP、Radius認(rèn)證、FTP及VPN等應(yīng)用系統(tǒng)的自動實時監(jiān)控,下面將使用DHCP、Radius和FTP為例給出具體的實現(xiàn)思路和方法。
2.1 DHCP應(yīng)用服務(wù)狀態(tài)的監(jiān)控
學(xué)校使用的DHCP服務(wù)是安裝的Linux服務(wù)器提供的,自動實時監(jiān)控DHCP服務(wù)的關(guān)鍵在于腳本需要不停去模擬用戶利用DHCP服務(wù)器獲取IP地址的過程,這個過程可以利用兩條命令"ipconfig /release"和"ipconfig /renew"來表示,即釋放IP和重新獲取IP,如果DHCP應(yīng)用出現(xiàn)故障,那么主機將無法在執(zhí)行上述兩條命令后獲取正確的IP地址,那么Zabbix監(jiān)控端也將無法ping通該主機。利用WIN 2003 SERVER服務(wù)器作為運行腳本程序的監(jiān)控主機,該程序采用BAT(批處理)腳本實現(xiàn),起到模擬用戶行為的作用。服務(wù)器設(shè)置每隔30秒執(zhí)行"ipconfig /release"和"ipconfig /renew"命令,重新從DHCP服務(wù)器去獲取IP地址,根據(jù)監(jiān)控主機能否獲得正確的IP地址代表了DHCP服務(wù)是否正常,下一步需要做的就是將該狀態(tài)信息傳遞給應(yīng)用狀態(tài)感知模塊,即Zabbix監(jiān)控系統(tǒng)。將此監(jiān)控主機納入Zabbix的監(jiān)控范圍,使用Zabbix的icmpping來確認(rèn)能否與該主機通訊,如果能夠ping通,則返回值為1,否則返回值為0 ;這樣就能判斷該主機是否獲得了正確的IP地址,也就實現(xiàn)了對于DHCP服務(wù)應(yīng)用狀態(tài)的實時監(jiān)控。
2.2 Radius認(rèn)證應(yīng)用服務(wù)狀態(tài)的監(jiān)控
Radius認(rèn)證服務(wù)在很多網(wǎng)絡(luò)環(huán)境有著廣泛應(yīng)用,用于其他應(yīng)用系統(tǒng)和設(shè)備登錄的認(rèn)證。學(xué)校Radius服務(wù)的一項重要應(yīng)用就是VPN和無線網(wǎng)絡(luò)設(shè)備的登錄認(rèn)證。實現(xiàn)Radius認(rèn)證應(yīng)用狀態(tài)的自動實時監(jiān)控的關(guān)鍵點仍然是提取出用戶使用Radius應(yīng)用的流程,然后以腳本程序去實現(xiàn)該流程,然后將檢測結(jié)果傳遞給Zabbix。采用基于SecureCRT平臺的VBScript語言編寫模擬用戶登錄城市熱點計費網(wǎng)關(guān)(Dr.com)行為的腳本程序,模擬提交登錄的用戶名和密碼,就可以根據(jù)登錄結(jié)果來判斷Radius服務(wù)的健康狀況。
2.3 FTP應(yīng)用服務(wù)狀態(tài)的監(jiān)控
FTP是學(xué)校重要的文件服務(wù)器,為全校師生提供文件存儲服務(wù)。實現(xiàn)FTP應(yīng)用服務(wù)狀態(tài)的自動實時監(jiān)控的關(guān)鍵也是模擬用戶登錄FTP系統(tǒng),并上傳一個測試文件,根據(jù)整個過程的狀態(tài)來判斷FTP應(yīng)用的存活度。腳本使用PHP的CURL來實現(xiàn)。
為了減少系統(tǒng)誤報的概率,可以在Zabbix里設(shè)置Trigger的值,實現(xiàn)連續(xù)兩次探測應(yīng)用服務(wù)的狀態(tài)結(jié)果作為依據(jù),達(dá)到系統(tǒng)監(jiān)控的有效性。
3 結(jié)束語
隨著數(shù)字校園建設(shè)的不斷推進和完善,IT運維管理自動化就顯得尤為重要。通過對開源網(wǎng)絡(luò)監(jiān)控系統(tǒng)Zabbix在應(yīng)用監(jiān)控方面的實踐改造,給出了Zabbix在應(yīng)用監(jiān)控方面的解決方案。目前該自動監(jiān)控系統(tǒng)已經(jīng)在學(xué)校進行應(yīng)用,支持對DHCP、Radius認(rèn)證、FTP及VPN等應(yīng)用系統(tǒng)狀態(tài)的實時監(jiān)控,計劃后期將持續(xù)改造該監(jiān)控系統(tǒng),盡可能將更多的應(yīng)用系統(tǒng)納入實時監(jiān)控的范圍。通過給出的思路和方法,可以結(jié)合自身的實際網(wǎng)絡(luò)環(huán)境對Zabbix進行二次開發(fā),建成一套符合實際需求的一體化自動監(jiān)控系統(tǒng)。
參考文獻(xiàn):
[1] zabbix 百度百科[EB/OL]. http://baike.baidu.com/view/1924617.htm.endprint
摘要:開源網(wǎng)絡(luò)監(jiān)控系統(tǒng)Zabbix在IT運維管理上得到了廣泛應(yīng)用,但是Zabbix自身所能監(jiān)控的粒度和深度都難以滿足IT運維管理的深層次需求,特別是對于數(shù)字校園應(yīng)用系統(tǒng)可用性的自動監(jiān)控方面存在較大的缺陷。在結(jié)合了學(xué)校具體應(yīng)用的實際情況后,通過對Zabbix監(jiān)控系統(tǒng)實施的二次開發(fā)和改造,實現(xiàn)了對部分應(yīng)用系統(tǒng)可用性狀態(tài)的實時監(jiān)控,并給出了具體的思路和方法。
關(guān)鍵詞: Zabbix;IT運維管理;數(shù)字校園應(yīng)用;自動監(jiān)控
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)32-7740-02
Abstract: Zabbix, as an open source network monitoring system, has been widely used in IT operation and management. However, it is hard for the Zabbixs monitoring granularity and profundity to meet the ITOMs deeper demends, especially for the defects existing in the automatic monitored control of the digital campus applications availability. The combinations with practice applications in CIET and secondary development and reform of the Zabbix monitoring system implementation make the real-time monitoring of part of applications availability come true and also bring up some specific thoughts and methods.
Key words:Zabbix; ITOM(IT Operation and Management); digital campus applications; automatic monitored control
Zabbix是一個基于WEB界面的提供分布式系統(tǒng)監(jiān)控以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級開源解決方案[1]。因為Zabbix部署的靈活性以及開源的特征,有很多學(xué)校和企業(yè)通過部署Zabbix來對自身的IT基礎(chǔ)設(shè)施的運行狀態(tài)進行實時監(jiān)控;學(xué)校也嘗試部署了Zabbix,目前已經(jīng)將大部分服務(wù)器和網(wǎng)絡(luò)設(shè)備納入了Zabbix監(jiān)控范圍,使Zabbix成為運維管理人員重要的故障監(jiān)控工具。
但是Zabbix只能對一些比較常規(guī)的CPU利用率、端口狀態(tài)、流量、進程使用等項目進行監(jiān)控,難以針對應(yīng)用服務(wù)進行實時監(jiān)控。而隨著各類應(yīng)用復(fù)雜性的提高,導(dǎo)致應(yīng)用出現(xiàn)故障的原因越來越難以排查,很多故障并不是CPU、內(nèi)存等一些常規(guī)問題所引起的,而有可能是系統(tǒng)自身的BUG或負(fù)載等一些隱秘的原因所引起的,所以有時候Zabbix顯示常規(guī)的監(jiān)控項目狀態(tài)都正常,但是應(yīng)用實際已經(jīng)不可用,這樣就失去了自動監(jiān)控的意義。
為了彌補Zabbix在應(yīng)用監(jiān)控方面的不足,對Zabbix監(jiān)控系統(tǒng)做了一些深入的研究,結(jié)合IT運維自動化的思想,在Zabbix系統(tǒng)的基礎(chǔ)上進行了二次開發(fā),能夠針對DHCP、Radius認(rèn)證、FTP及VPN系統(tǒng)等應(yīng)用實施可用的自動監(jiān)控。
1 系統(tǒng)設(shè)計思路
既然Zabbix常規(guī)監(jiān)控項目難以反映出應(yīng)用系統(tǒng)是否正常,只有親自使用系統(tǒng)才能真正判斷出應(yīng)用系統(tǒng)是否可用,但是要做到實時監(jiān)控,就必須用到運維自動化的相關(guān)技術(shù)了,否則單憑人工操作是無法保證監(jiān)控的時效性的。為了達(dá)到自動監(jiān)控的目的,采用腳本程序來模擬客戶端或用戶訪問應(yīng)用系統(tǒng)的流程,將該流程自動化、程序化,利用Zabbix監(jiān)控系統(tǒng)的接口將系統(tǒng)狀態(tài)傳遞給Zabbix,通過Zabbix系統(tǒng)的Trigger判斷,將應(yīng)用系統(tǒng)的可用狀態(tài)情況以頁面、郵件或者短信的方式展示給運維管理人員,以達(dá)到實時監(jiān)控的目的。
自動監(jiān)控系統(tǒng)可分為兩大模塊:模擬用戶行為模塊和應(yīng)用狀態(tài)感知模塊。這兩大模塊彼此關(guān)聯(lián)協(xié)作,模擬用戶行為模塊不斷循環(huán)獲取應(yīng)用系統(tǒng)的狀態(tài),然后將狀態(tài)信息傳遞給應(yīng)用狀態(tài)感知模塊,應(yīng)用狀態(tài)感知模塊經(jīng)過判斷,將狀態(tài)信息以多種方式展示給運維管理人員。
2 具體實現(xiàn)
系統(tǒng)目前已經(jīng)實現(xiàn)了對DHCP、Radius認(rèn)證、FTP及VPN等應(yīng)用系統(tǒng)的自動實時監(jiān)控,下面將使用DHCP、Radius和FTP為例給出具體的實現(xiàn)思路和方法。
2.1 DHCP應(yīng)用服務(wù)狀態(tài)的監(jiān)控
學(xué)校使用的DHCP服務(wù)是安裝的Linux服務(wù)器提供的,自動實時監(jiān)控DHCP服務(wù)的關(guān)鍵在于腳本需要不停去模擬用戶利用DHCP服務(wù)器獲取IP地址的過程,這個過程可以利用兩條命令"ipconfig /release"和"ipconfig /renew"來表示,即釋放IP和重新獲取IP,如果DHCP應(yīng)用出現(xiàn)故障,那么主機將無法在執(zhí)行上述兩條命令后獲取正確的IP地址,那么Zabbix監(jiān)控端也將無法ping通該主機。利用WIN 2003 SERVER服務(wù)器作為運行腳本程序的監(jiān)控主機,該程序采用BAT(批處理)腳本實現(xiàn),起到模擬用戶行為的作用。服務(wù)器設(shè)置每隔30秒執(zhí)行"ipconfig /release"和"ipconfig /renew"命令,重新從DHCP服務(wù)器去獲取IP地址,根據(jù)監(jiān)控主機能否獲得正確的IP地址代表了DHCP服務(wù)是否正常,下一步需要做的就是將該狀態(tài)信息傳遞給應(yīng)用狀態(tài)感知模塊,即Zabbix監(jiān)控系統(tǒng)。將此監(jiān)控主機納入Zabbix的監(jiān)控范圍,使用Zabbix的icmpping來確認(rèn)能否與該主機通訊,如果能夠ping通,則返回值為1,否則返回值為0 ;這樣就能判斷該主機是否獲得了正確的IP地址,也就實現(xiàn)了對于DHCP服務(wù)應(yīng)用狀態(tài)的實時監(jiān)控。
2.2 Radius認(rèn)證應(yīng)用服務(wù)狀態(tài)的監(jiān)控
Radius認(rèn)證服務(wù)在很多網(wǎng)絡(luò)環(huán)境有著廣泛應(yīng)用,用于其他應(yīng)用系統(tǒng)和設(shè)備登錄的認(rèn)證。學(xué)校Radius服務(wù)的一項重要應(yīng)用就是VPN和無線網(wǎng)絡(luò)設(shè)備的登錄認(rèn)證。實現(xiàn)Radius認(rèn)證應(yīng)用狀態(tài)的自動實時監(jiān)控的關(guān)鍵點仍然是提取出用戶使用Radius應(yīng)用的流程,然后以腳本程序去實現(xiàn)該流程,然后將檢測結(jié)果傳遞給Zabbix。采用基于SecureCRT平臺的VBScript語言編寫模擬用戶登錄城市熱點計費網(wǎng)關(guān)(Dr.com)行為的腳本程序,模擬提交登錄的用戶名和密碼,就可以根據(jù)登錄結(jié)果來判斷Radius服務(wù)的健康狀況。
2.3 FTP應(yīng)用服務(wù)狀態(tài)的監(jiān)控
FTP是學(xué)校重要的文件服務(wù)器,為全校師生提供文件存儲服務(wù)。實現(xiàn)FTP應(yīng)用服務(wù)狀態(tài)的自動實時監(jiān)控的關(guān)鍵也是模擬用戶登錄FTP系統(tǒng),并上傳一個測試文件,根據(jù)整個過程的狀態(tài)來判斷FTP應(yīng)用的存活度。腳本使用PHP的CURL來實現(xiàn)。
為了減少系統(tǒng)誤報的概率,可以在Zabbix里設(shè)置Trigger的值,實現(xiàn)連續(xù)兩次探測應(yīng)用服務(wù)的狀態(tài)結(jié)果作為依據(jù),達(dá)到系統(tǒng)監(jiān)控的有效性。
3 結(jié)束語
隨著數(shù)字校園建設(shè)的不斷推進和完善,IT運維管理自動化就顯得尤為重要。通過對開源網(wǎng)絡(luò)監(jiān)控系統(tǒng)Zabbix在應(yīng)用監(jiān)控方面的實踐改造,給出了Zabbix在應(yīng)用監(jiān)控方面的解決方案。目前該自動監(jiān)控系統(tǒng)已經(jīng)在學(xué)校進行應(yīng)用,支持對DHCP、Radius認(rèn)證、FTP及VPN等應(yīng)用系統(tǒng)狀態(tài)的實時監(jiān)控,計劃后期將持續(xù)改造該監(jiān)控系統(tǒng),盡可能將更多的應(yīng)用系統(tǒng)納入實時監(jiān)控的范圍。通過給出的思路和方法,可以結(jié)合自身的實際網(wǎng)絡(luò)環(huán)境對Zabbix進行二次開發(fā),建成一套符合實際需求的一體化自動監(jiān)控系統(tǒng)。
參考文獻(xiàn):
[1] zabbix 百度百科[EB/OL]. http://baike.baidu.com/view/1924617.htm.endprint