国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Zabbix 的Veritas Cluster Server集群管理系統(tǒng)的監(jiān)控技術(shù)

2023-11-29 11:26貴州省氣象信息中心金石聲白鐵男譚海波唐維堯
關(guān)鍵詞:拓?fù)鋱D觸發(fā)器管理軟件

貴州省氣象信息中心 金石聲 白鐵男 譚海波 唐維堯

本文基于開源架構(gòu)的Zabbix 監(jiān)控系統(tǒng),對省級氣象數(shù)據(jù)收發(fā)系統(tǒng)CTS(Collection and Transfer System)集群的管理軟件VCS(Veritas Cluster Server)所承載的各項業(yè)務(wù)進(jìn)行精細(xì)化監(jiān)控。系統(tǒng)從資源組層面實現(xiàn)了對CTS 集群業(yè)務(wù)運(yùn)行狀態(tài)的集約化監(jiān)控,并以拓?fù)鋱D的方式展示了各資源組的運(yùn)行狀態(tài),通過動態(tài)圖標(biāo)之間的連線直觀地了解資源組之間的業(yè)務(wù)依賴關(guān)系,在實際工作中精準(zhǔn)的定位故障,極大地提高了核心業(yè)務(wù)系統(tǒng)的運(yùn)行維護(hù)效率,符合氣象信息化和現(xiàn)代化的基本要求。

省級氣象數(shù)據(jù)收發(fā)系統(tǒng)CTS(Collection and Transfer System)。作為氣象資料交互的核心業(yè)務(wù)系統(tǒng),承擔(dān)著氣象資料的收集、處理、分發(fā)等業(yè)務(wù)。為了保證系統(tǒng)的高可用性,采用了VCS(Veritas Cluster Server)集群管理軟件對CTS 集群的應(yīng)用進(jìn)行管理[1]。VCS 集群管理軟件雖然提供了管理界面,但是界面過于簡單,只適用于對應(yīng)用進(jìn)行管理,不具有基本的告警展示、推送功能,無法滿足集約化監(jiān)控的要求[2]。為解決上述問題,基于開源架構(gòu)的Zabbix 監(jiān)控平臺自由度高、拓展性強(qiáng)的優(yōu)勢,通過梳理VCS 集群管理軟件上的資源組情況,設(shè)計并開發(fā)了專門針對CTS 的監(jiān)控系統(tǒng)。

1 架構(gòu)設(shè)計

如圖1 所示,CTS 系統(tǒng)集群由8 臺服務(wù)器組成,通過VCS 集群管理軟件對服務(wù)器和分布在服務(wù)器上的資源組進(jìn)行管理,資源組即相同類型應(yīng)用的集合。采用VCS提供的Hastatus 命令編寫Shell 腳本,定時對各資源組的運(yùn)行狀態(tài)進(jìn)行采集并寫入日志文件。Zabbix 通過SSH方式登錄指定服務(wù)器對運(yùn)行日志進(jìn)行采集和處理,再通過觸發(fā)器組件(Triger)和拓?fù)鋱D組件(Map)對日志內(nèi)容進(jìn)行告警和圖形化展示。各個業(yè)務(wù)運(yùn)行狀態(tài)在CTS 系統(tǒng)生成,Zabbix 對業(yè)務(wù)運(yùn)行狀態(tài)進(jìn)行采集、過濾、展示。資源組分布情況及負(fù)載類型如表1 所示。

表1 CTS 資源組進(jìn)程分布情況表(“parallel”代表并行,“failover”代表主備)Tab.1 Process distribution of the CTS resource group("parallel" represents parallel and "failover" represents active and standby)

圖1 系統(tǒng)架構(gòu)設(shè)計圖Fig.1 System architecture design diagram

2 功能實現(xiàn)

為實現(xiàn)其主要功能,系統(tǒng)包括信息采集模塊、告警模塊和監(jiān)控展示模塊[3,4]三個功能模塊,數(shù)據(jù)庫依托Zabbix 監(jiān)控系統(tǒng)的MySQL 數(shù)據(jù)庫。

2.1 信息采集模塊

腳本部分基于Linux 環(huán)境下的Shell 語言編寫,主要功能是通過VCS 集群管理提供的狀態(tài)采集命令Hastatus,將CTS 集群的運(yùn)行狀態(tài)打印并保存到指定的日志文件;監(jiān)控項部分基于Zabbix 系統(tǒng)采取SSH 遠(yuǎn)程協(xié)議類型實現(xiàn),主要功能是在服務(wù)器上獲取日志文件信息,采集腳本如下:

source /root/.bash_profile

file_dir="/root/hastatus/hastatus.log"

if [ -f "$file_dir" ]; then

rm $file_dir

fi

sleep 1

hastatus -sum >$file_dir

監(jiān)控項部分分為父監(jiān)控項和子監(jiān)控項,為了減少對CTS 的訪問,采用父監(jiān)控項采集日志文件內(nèi)的全部信息,采用子監(jiān)控項在父監(jiān)控項的基礎(chǔ)上通過正則表達(dá)式對信息進(jìn)行過濾[5],從而獲取具體每個資源組的運(yùn)行狀態(tài)信息。例如,對于AWS-PQC-grp 這個應(yīng)用的運(yùn)行狀態(tài)采集結(jié)果如下:

B AWS-PQC-grp begy-cts01 Y N OFFLINE

B AWS-PQC-grp begy-cts02 Y N ONLINE

則對應(yīng)的兩個子監(jiān)控項的正則表達(dá)式分別為:B.*(AWS-PQC-grp).*(begy-cts01).*([A-Z]+).*([A-Z]+).*([A-Z]+)和,B.*(AWS-PQCgrp).*(begy-cts02).*([A-Z]+).*([A-Z]+).*([A-Z]+),然后分別取出第5 個字段即表示該應(yīng)用在兩個節(jié)點(diǎn)上是否在線。

2.2 告警模塊

告警模塊的功能是通過Zabbix 系統(tǒng)觸發(fā)器組件實現(xiàn)。觸發(fā)器內(nèi)嵌有很多函數(shù),本系統(tǒng)使用str()函數(shù)來判斷監(jiān)控項采集的信息中是否包含有OFFLINE 的字符串[6],1 表示信息中能找到,0 表示信息中心未找到。對于并行應(yīng)用(parallel),每個應(yīng)用的狀態(tài)均是ONLINE 狀態(tài)則表示資源組運(yùn)行正常;對于主備應(yīng)用(failover),一個應(yīng)用ONLINE 狀態(tài)則表示對應(yīng)的資源組運(yùn)行正常。對于這兩種情況對應(yīng)觸發(fā)器里可以包含多個條件,根據(jù)資源組在服務(wù)器之間的負(fù)載類型,觸發(fā)器的條件由and 或者or 連接,當(dāng)負(fù)載類型是并行模式(parallel)時條件由and 連接;當(dāng)負(fù)載類型是主備模式(failover)時條件由or 連接,觸發(fā)器樣例如下:

parrallel 類負(fù)載觸發(fā)器

{xxzx_yxjkk_CTS05:begy-cts01-Scheduler-grp.str(ONLINE)}=0 and {xxzx_yxjkk_CTS05:begycts02-Scheduler-grp.str(ONLINE)}=0

failover 類負(fù)載觸發(fā)器

{xxzx_yxjkk_CTS05:begy-cts07-bstd-grp.str(ONLINE)}=0 or {xxzx_yxjkk_CTS05:begy-cts08-bstd-grp.str(ONLINE)}=0

2.3 監(jiān)控展示模塊

監(jiān)控展示模塊功能通過Zabbix 系統(tǒng)拓?fù)鋱D組件實現(xiàn),通過在拓?fù)鋱D畫布上添加“元素”,將CTS2 各資源組狀態(tài)以圖形的方式進(jìn)行直觀的展示,在資源組狀態(tài)異常時,觸發(fā)器就會根據(jù)負(fù)載類型來判斷是否告警,“元素”圖標(biāo)也會根據(jù)觸發(fā)器的狀態(tài)而發(fā)生變化[7]。通過“元素”之間添加連線可以清楚展示各資源組之間的依賴關(guān)系,在發(fā)生故障時根據(jù)發(fā)生異常的“元素”和“連線”可以快速、準(zhǔn)確地定位故障發(fā)生的資源組及依賴的資源組,提升了運(yùn)維效率,從而保障了數(shù)據(jù)服務(wù)能力[3],資源組依賴情況如圖2 所示。

圖2 資源組依賴圖Fig.2 Resource group dependency diagram

3 結(jié)語

本文依托開源架構(gòu)的監(jiān)控系統(tǒng)Zabbix[8],針對集群的管理軟件VCS 不能提供告警的業(yè)務(wù)難點(diǎn)展開研究,通過梳理VCS 集群管理軟件上的資源組情況,將資源組之間的依賴關(guān)系以及資源組在服務(wù)器之間的負(fù)載類型考慮進(jìn)來,實現(xiàn)了CTS 資源組狀態(tài)層面的集約化監(jiān)控,提升了監(jiān)控的精細(xì)性和準(zhǔn)確性,提高了核心業(yè)務(wù)系統(tǒng)CTS 的運(yùn)維能力,符合氣象信息化發(fā)展的需求。

猜你喜歡
拓?fù)鋱D觸發(fā)器管理軟件
低壓配網(wǎng)拓?fù)鋱D自動成圖關(guān)鍵技術(shù)的研究與設(shè)計
簡單拓?fù)鋱D及幾乎交錯鏈環(huán)補(bǔ)中的閉曲面
倉儲管理軟件在物流自動化解決方案中的應(yīng)用與發(fā)展
基于含圈非連通圖優(yōu)美性的拓?fù)鋱D密碼
項目法在工程造價管理軟件中的應(yīng)用
主從JK觸發(fā)器邏輯功能分析
共享電單車的管理軟件
使用觸發(fā)器,強(qiáng)化安全性
基于拓?fù)湟?guī)則Pb-S-O體系優(yōu)勢區(qū)圖的繪制與應(yīng)用
對觸發(fā)器邏輯功能轉(zhuǎn)換的分析
常州市| 台安县| 汉寿县| 中方县| 成武县| 兴安盟| 略阳县| 池州市| 蓝田县| 旌德县| 望城县| 乐至县| 霍州市| 永丰县| 合肥市| 建湖县| 南康市| 崇义县| 正蓝旗| 乐亭县| 喀什市| 陆河县| 松江区| 台北县| 沁阳市| 晋中市| 綦江县| 宁都县| 肃北| 垦利县| 本溪市| 广宁县| 太原市| 上栗县| 双桥区| 汉中市| 霍邱县| 金湖县| 呼伦贝尔市| 新余市| 秦皇岛市|