湯 寧,王 娟,汪 華
(貴州省氣象信息中心,貴州 貴陽 550002)
現(xiàn)有省級國內(nèi)通信系統(tǒng)硬件平臺使用共享磁盤陣列和Symantec Veritas CFS 共享文件系統(tǒng),為通信服務(wù)集群提供快速數(shù)據(jù)存儲服務(wù)。但從該業(yè)務(wù)運(yùn)行以來,由于通信系統(tǒng)負(fù)載重等原因,存在共享文件系統(tǒng)和磁盤陣列故障隱患。另一方面,對于省級實(shí)時(shí)通信業(yè)務(wù),由于不存在應(yīng)急備份環(huán)境,一旦出現(xiàn)問題無法及時(shí)恢復(fù)很容易對省級氣象通信業(yè)務(wù)造成嚴(yán)重影響。
為了解決上述問題,國家氣象信息中心結(jié)合省級國內(nèi)通信系統(tǒng)的實(shí)際情況,設(shè)計(jì)并準(zhǔn)備了省級國內(nèi)通信降級備份軟件。該軟件是基于省級國內(nèi)通信硬件平臺的實(shí)際情況,為省級通信業(yè)務(wù)構(gòu)造一個(gè)國內(nèi)通信系統(tǒng)的單機(jī)運(yùn)行的應(yīng)急備份環(huán)境;當(dāng)省級國內(nèi)通信業(yè)務(wù)系統(tǒng)發(fā)生故障的時(shí)候,臨時(shí)切換到該降級環(huán)境,以滿足最基本的國內(nèi)通信業(yè)務(wù)需求,包括國內(nèi)上行實(shí)時(shí)資料的實(shí)時(shí)收集、處理和上傳。該備份軟件的優(yōu)點(diǎn)是不需要另行準(zhǔn)備專用硬件平臺,只需要在現(xiàn)有硬件平臺上進(jìn)行部署;目前僅支持上行實(shí)時(shí)資料的通信業(yè)務(wù),不支持現(xiàn)有通信系統(tǒng)的前臺Web 功能,如實(shí)時(shí)監(jiān)視、統(tǒng)計(jì)分析等監(jiān)控功能,同時(shí)對于資料的業(yè)務(wù)檢查功能比較簡單。
我省使用NBU(NBU 是新一代國內(nèi)通信系統(tǒng)備份服務(wù)器)服務(wù)器進(jìn)行降級備份軟件的部署。該系統(tǒng)服務(wù)器是一臺SUSE 10 Linux 64 位版本操作系統(tǒng),此服務(wù)器連接在省級國內(nèi)通信系統(tǒng)的網(wǎng)絡(luò)環(huán)境中。
該服務(wù)器處于備份狀態(tài)時(shí)業(yè)務(wù)負(fù)載很輕,不承擔(dān)重要的業(yè)務(wù)或者任務(wù),當(dāng)省級國內(nèi)通信系統(tǒng)發(fā)生故障時(shí),能夠停止現(xiàn)有任務(wù),轉(zhuǎn)入應(yīng)急運(yùn)行狀態(tài)。服務(wù)器的管理需要和國內(nèi)通信系統(tǒng)業(yè)務(wù)用服務(wù)器一致,做到國內(nèi)通信系統(tǒng)故障時(shí),維護(hù)人員能夠迅速啟用降級備份環(huán)境。
2.2.1 時(shí)鐘設(shè)置 本系統(tǒng)服務(wù)器的時(shí)區(qū)時(shí)鐘設(shè)置,設(shè)置為國際標(biāo)準(zhǔn)時(shí)(UTC)。使用超級用戶在YaST管理界面中對日期與時(shí)間進(jìn)行設(shè)置修改,本系統(tǒng)還同時(shí)與業(yè)務(wù)系統(tǒng)NTP 做時(shí)間同步,本服務(wù)器啟動(dòng)了crond 定時(shí)作業(yè)來更新校準(zhǔn)系統(tǒng)時(shí)間:
在/etc/rc.d/rc.local 這個(gè)腳本的末尾加上:/sbin/service crond start 使系統(tǒng)開機(jī)時(shí)自動(dòng)啟動(dòng)該服務(wù)。(# chkconfig crond on)
以root 身份運(yùn)行crond 定時(shí)作業(yè):
輸入:crontab-e
添加以下內(nèi)容,每天15 時(shí)更新一下時(shí)間:
0 15 * * * ntpdate ntp_server //ntp_server 為所配時(shí)間服務(wù)器地址,可以根據(jù)實(shí)際情況來確定什么時(shí)間校時(shí)以及校時(shí)的頻率。
2.2.2 防火墻訪問控制 為實(shí)現(xiàn)正常狀態(tài)下和應(yīng)急狀態(tài)下備份系統(tǒng)均能與國家級國內(nèi)通信系統(tǒng)之間互相訪問,網(wǎng)絡(luò)管理員開通本省備份系統(tǒng)與國家級國內(nèi)通信系統(tǒng)間的訪問控制。
2.2.3 收集目錄組織結(jié)構(gòu) 我省按照業(yè)務(wù)系統(tǒng)省內(nèi)資料收集的目錄建立目錄結(jié)構(gòu),保證在應(yīng)急狀態(tài)下,從測站和地市收集的資料能透明的接入而不需要進(jìn)行修改。在超級用戶中執(zhí)行備份軟件腳本setup-ftp.sh 即可完成默認(rèn)組織結(jié)構(gòu)創(chuàng)建(見如下目錄結(jié)構(gòu))
/cccc/workdir/incoming
|——agm 農(nóng)氣資料
|——aws 自動(dòng)站資料(AWS_ST,AWS_PRF)
|——aws_new 新Z 自動(dòng)站資料(ST_NEW)
|——clim 氣候資料目錄
|——cawn 大氣成分資料目錄
|——gps GPS 探測資料目錄
|——grib 數(shù)值預(yù)報(bào)產(chǎn)品資料目錄
|——lpd 閃電定位資料目錄
|——mon 監(jiān)控信息資料目錄
|——msg 常規(guī)觀測資料目錄
|——nafp 長文件名命名格式的數(shù)值預(yù)報(bào)產(chǎn)品資料目錄
|——ocen 海洋資料目錄
|——othe 其它資料目錄
|——prog 指導(dǎo)預(yù)報(bào)資料目錄
|——qbzq 情報(bào)災(zāi)情資料目錄
|——qcdata 質(zhì)量控制反饋資料目錄
|——rad 雷達(dá)拼圖資料目錄
|——radi 氣象輻射資料目錄
|——radr 氣象雷達(dá)資料目錄
|——sand 沙塵暴資料目錄
|——sevp 氣象服務(wù)產(chǎn)品資料目錄
|——upar_temp 探空基數(shù)據(jù)資料目錄
|——wind 風(fēng)能探測資料目錄
2.2.4 配制文件和資料接入 使用cmss_bak 用戶進(jìn)行操作。在默認(rèn)的資料配置DIR_CONFIG.1(省級資料上行配置)中。對比現(xiàn)有通信系統(tǒng)的DIR_CONFIG.1 配置,降級備份系統(tǒng)不支持所有資料的格式檢查功能、存檔選項(xiàng)、格式轉(zhuǎn)換以及部分打包功能。
在默認(rèn)DIR_CONFIG.1 配置中,需要進(jìn)行本地化修改,以新Z 資料配置為例,其他資料類似:
默認(rèn)配置情況下,只有上行北京的DIR_CONFIG.1 配置,可以根據(jù)自身需求增加重要省內(nèi)用戶的推送服務(wù),如新增加DIR_CONFIG.n(n 代表序號,可以順序使用2,3,……),需要在AFD_CONFIG中增加DIR_CONFIG_NAME /home/cmss_bak/cma_afd/etc/DIR_CONFIG.n
在HOST_CONFIG 中增加對應(yīng)服務(wù)的主機(jī)別名。
目前,降級備份軟件不能支持CMACast 接收功能,并且本系統(tǒng)為做到資料范圍的盡量精簡,只首要保障核心上行業(yè)務(wù)的應(yīng)急備份傳輸。
2.2.5 資料接入 資料接收和上行目錄樹結(jié)構(gòu)必須與上述DIR_CONFIG 配置文件需要的目錄樹結(jié)構(gòu)相一致。本地資料接入目錄與現(xiàn)有通信系統(tǒng)接入目錄保持一致。省際資料直接接入通信系統(tǒng),將備份系統(tǒng)地址直接修改為原省級通信系統(tǒng)接入漂移地址;若省際資料接入由通信系統(tǒng)前置機(jī),在應(yīng)急狀態(tài)下,將資料接入地址改為降級備份系統(tǒng)的實(shí)IP 地址。
目前在HOST_CONFIG 中的默認(rèn)配置是國家局的上行地址10.1.X.X,備份系統(tǒng)已經(jīng)通過測試,指向國家局的地址與國內(nèi)新一代通信系統(tǒng)一樣,在正常運(yùn)行狀態(tài)中不必向備份系統(tǒng)發(fā)送數(shù)據(jù),一旦出現(xiàn)特殊情況,可以使用該系統(tǒng)傳輸。
2.2.6 應(yīng)急運(yùn)行狀態(tài)的啟動(dòng)和恢復(fù) ①應(yīng)急運(yùn)行狀態(tài)的啟動(dòng):第1 步,使用cmss_bak 帳戶登錄備份系統(tǒng)服務(wù)器;第2 步,使用如下命令啟動(dòng)降級備份系統(tǒng)的收發(fā)系統(tǒng):afd-a;第3 步,檢查確認(rèn)收發(fā)系統(tǒng)運(yùn)行正常;第4 步,確認(rèn)本省國內(nèi)通信系統(tǒng)服務(wù)地址10.X.X.30,停用后,將備份系統(tǒng)服務(wù)器IP 地址修改為本省國內(nèi)通信系統(tǒng)服務(wù)地址10.X.X.30。
②正常運(yùn)行狀態(tài)的恢復(fù):在檢查確認(rèn)省級國內(nèi)通信系統(tǒng)軟硬件環(huán)境一切正常后,可從應(yīng)急運(yùn)行狀態(tài)恢復(fù)至正常狀態(tài)?;謴?fù)時(shí)先將備份系統(tǒng)服務(wù)器IP 地址由10.X.X.30 修改為正常狀態(tài)的地址10.X.72.34(以NBU 做為備份系統(tǒng)為例),之后在省級國內(nèi)通信系統(tǒng)啟用服務(wù)地址10.X.X.30。
完成網(wǎng)絡(luò)調(diào)整后,首先使用cmss_bak 帳戶登錄備份系統(tǒng)服務(wù)器,關(guān)閉降級備份系統(tǒng)的收發(fā)系統(tǒng)運(yùn)行(執(zhí)行afd-s);隨后,即可啟動(dòng)本省省級國內(nèi)通信主系統(tǒng)(新一代)運(yùn)行。主系統(tǒng)啟動(dòng)運(yùn)行后,可再次檢查備份系統(tǒng)是否待發(fā)文件,如有,可手工送入主系統(tǒng)相應(yīng)接口目錄,由主系統(tǒng)完成后續(xù)處理和分發(fā)。
2.2.7 備份軟件目錄結(jié)果說明
$AFD_WORK_DIR/
|——etc 收發(fā)運(yùn)行配置文件存放目錄
|——archive 收發(fā)子系統(tǒng)發(fā)送存檔目錄
|——datarch 收集與存檔接口目錄
|——fifodir 系統(tǒng)用目錄,用于存放各類fifo文件等文件
|——files 系統(tǒng)用目錄,用于存放臨時(shí)文件和排隊(duì)信息
|——incoming 主動(dòng)獲取遠(yuǎn)程文件的臨時(shí)存放目錄
|——outgoing 文件分發(fā)目錄
|——pool 文件收集緩存目錄
|——time 文件時(shí)間檢查目錄
|——crc 用于文件重復(fù)檢查
|——store 用于文件重復(fù)檢查
|——log 系統(tǒng)日志目錄
|——messages 系統(tǒng)用目錄,存放分發(fā)任務(wù)編號(Job ID)等文件
2.2.8 常用維護(hù)工具介紹 ①指令工具(afdcmd)??梢允褂胊fdcmd 程序發(fā)送大部分命令。當(dāng)沒有設(shè)置任何參數(shù)時(shí)運(yùn)行afdcmd,它會自動(dòng)顯示使用幫助。
分發(fā)選項(xiàng),后跟分發(fā)目的主機(jī)別名:
接收選項(xiàng),后跟接收目錄別名:
全局選項(xiàng):
②啟動(dòng)和停止(afd)。
用法:afd[-w <AFD 工作目錄 >][-u[<用戶名>]][選項(xiàng)]
-a 僅啟動(dòng)AFD
-c 僅檢查AFD 是否在運(yùn)行
-C 檢查AFD 是否在運(yùn)行,如果沒有啟動(dòng)AFD
-h(huán) 僅檢查heartbeat
-H 檢查heartbeat 是否存在,如果沒有則啟動(dòng)AFD
-i 通過刪除先進(jìn)先出(FIFO)隊(duì)列,初始化AFD
-I 除etc 目錄外刪除所有內(nèi)容,初始化AFD
-s 停止(關(guān)閉)
用-i 選項(xiàng)初始化AFD,會刪除$AFD_WORK_DIR/fifodir的所有內(nèi)容,但不會刪除AFD 提交的任務(wù)和正在傳輸?shù)娜蝿?wù)。只有在AFD 沒有運(yùn)行時(shí)才會刪除這些內(nèi)容。
-I 選項(xiàng)會把AFD 恢復(fù)到第1 次運(yùn)行前的狀況,同時(shí)會刪除AFD 提交的任務(wù)和正在傳輸?shù)娜蝿?wù)。
如果AFD 運(yùn)行在共享硬盤或文件系統(tǒng)上,用-h(huán) 或-H 選項(xiàng)查看AFD 是否在活動(dòng)。
該系統(tǒng)運(yùn)行以來使國內(nèi)新一代通信數(shù)據(jù)傳輸有了應(yīng)急備份,從建立至今在國內(nèi)新一代通信系統(tǒng)維護(hù)和出現(xiàn)故障過程中,有力的保障了各類氣象數(shù)據(jù)的傳輸。