(中國民用航空飛行學(xué)院綿陽分院 四川 綿陽 621000)
民航氣象數(shù)據(jù)庫系統(tǒng)是依托民航ATM網(wǎng)絡(luò)建設(shè)的,綿陽機(jī)場(chǎng)氣象數(shù)據(jù)庫系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D如圖1所示:
圖1 氣象數(shù)據(jù)庫系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D
1.查看通信分系統(tǒng)進(jìn)程狀態(tài)及AB報(bào)數(shù)目、LB使用率執(zhí)行命令mmi1。
如進(jìn)程狀態(tài)為0FF,可以執(zhí)行命令inicold重啟通信分系統(tǒng),再觀察進(jìn)程狀態(tài)。一般情況下,通信機(jī)LB小于20%,AB報(bào)數(shù)小于500。
2.數(shù)據(jù)落地目錄檢查,進(jìn)入/home/mhdbs/data,執(zhí)行命令ll或者ls-l,查看子目錄修改時(shí)間,若沒有最近修改時(shí)間,說明沒有數(shù)據(jù)落地。
3.原始數(shù)據(jù)備份目錄檢查,進(jìn)入/home/mhdbs/trash,執(zhí)行命令ll或者ls-l,查看子目錄修改時(shí)間,若沒有最近修改時(shí)間,查看資料處理進(jìn)程是否正常工作。
4.定期檢查磁盤空間/home,/home/mhdbs/data/backup下面存放歸檔文件,系統(tǒng)每天執(zhí)行自動(dòng)歸檔,日積月累/home空間將不斷縮小??梢詧?zhí)行命令df-h察看磁盤空間使用率
5.磁盤空間/u0存放oracle軟件和oracle數(shù)據(jù)庫文件,資料分解并存入oracle數(shù)據(jù)庫,物理上保存在/u0/oracle/oradata/下的數(shù)據(jù)庫文件中。隨著資料不斷入庫,可能會(huì)造成/u0磁盤空間占滿的情況。Oracle的運(yùn)行文件也存在/u0下,oracle的異常信息也可能會(huì)使/u0空間占滿。若/u0使用率超過80%,但如果增長速度不快,通過管理子系統(tǒng)【數(shù)據(jù)庫監(jiān)控】功能,檢查表空間的浪費(fèi)率是否超過30%,如超過30%請(qǐng)及時(shí)進(jìn)行表空間回收。
6.自動(dòng)歸檔,自動(dòng)歸檔每天進(jìn)行,默認(rèn)對(duì)32個(gè)數(shù)據(jù)資料表的前一天數(shù)據(jù)進(jìn)行歸檔。以oracle登錄服務(wù)器cd/home/mhdbs/data/backup/當(dāng)天日期文件夾,或者在歸檔文件遷出功能中按日期檢索查看歸檔文件一共有多少個(gè),正常情況下應(yīng)該為32個(gè)后綴為.zip的文件。
7.進(jìn)程監(jiān)控,進(jìn)程監(jiān)控實(shí)現(xiàn)監(jiān)控、啟動(dòng)、停止12個(gè)入庫進(jìn)程。執(zhí)行命令mmsctl list all檢查mgeprd和mgetxt進(jìn)程狀態(tài)。
8.通道狀態(tài)檢查,執(zhí)行命令showchl,正常狀態(tài)應(yīng)顯示Running,若發(fā)送通道為其他狀態(tài),可執(zhí)行啟動(dòng)通道命令runmqchl c ZUMY.To.DBOO&進(jìn)行啟動(dòng)
9.隊(duì)列深度檢查,執(zhí)行命令showque,可查看local.txt和local.prd隊(duì)列積壓情況,多次執(zhí)行命令觀察深度變化,正常隊(duì)列深度應(yīng)有增有減。
10.執(zhí)行sh run命令可查詢cisco網(wǎng)絡(luò)設(shè)備配置信息,執(zhí)行sh ip int b命令可查看設(shè)備所有接口狀態(tài)信息,包括接口名稱.ip地址.協(xié)議狀態(tài)和物理狀態(tài)。
11.查看數(shù)據(jù)庫分系統(tǒng)資料處理進(jìn)程狀態(tài),執(zhí)行命令mmsctl list all,狀態(tài)為s表示數(shù)據(jù)庫進(jìn)程在運(yùn)行,也可以用數(shù)據(jù)庫管理子系統(tǒng)檢查進(jìn)程監(jiān)控。
1.2014年6月19日,當(dāng)時(shí)綿陽機(jī)場(chǎng)的數(shù)據(jù)庫系統(tǒng)還沒有直接從成都接過來,而是經(jīng)過廣漢機(jī)場(chǎng)轉(zhuǎn)接過來的,上午預(yù)報(bào)員反映報(bào)文收不到,檢查本地?cái)?shù)據(jù)庫服務(wù)器正常,也沒有出現(xiàn)堵報(bào)現(xiàn)象,查看線路也正常,后聯(lián)系廣漢,得知廣漢服務(wù)器報(bào)文堆積,下午2點(diǎn)廣漢氣象臺(tái)處理完堵報(bào)后,綿陽數(shù)據(jù)庫系統(tǒng)能正常收?qǐng)?bào)。
2.2015年5月6日,發(fā)現(xiàn)接收?qǐng)?bào)文不全,檢查服務(wù)器進(jìn)程和線路都正常,將服務(wù)器重啟后發(fā)現(xiàn)仍有部分報(bào)文收不到,后發(fā)現(xiàn)/home/mhdbs/data/cac里有堵報(bào),將/cac里的堵報(bào)刪除后恢復(fù)正常。
3.2017年7月11日,數(shù)據(jù)庫通信程序提示報(bào)文上傳本地服務(wù)器失敗,預(yù)報(bào)終端不能正常查詢報(bào)文。將數(shù)據(jù)庫服務(wù)器/cac文件夾下堵報(bào)刪除并重啟服務(wù)器,問題沒能解決,后來檢查發(fā)現(xiàn)cac文件夾權(quán)限不正確,將其權(quán)限改為mhdbs,組權(quán)限改為dba,服務(wù)器恢復(fù)正常。
4.2019年2月11日,氣象臺(tái)上午發(fā)現(xiàn)報(bào)文不全,檢查服務(wù)器正常,后發(fā)現(xiàn)ATM上幀中繼板卡未能供上電,重啟ATM仍未恢復(fù),初步懷疑該板卡故障。3月6日,向其他機(jī)場(chǎng)借了一塊板卡換上,換上后發(fā)現(xiàn)ATM上幀中繼板燈不正常,重啟ATM后狀態(tài)正常,然后發(fā)現(xiàn)通信機(jī)上DB00隊(duì)列壓報(bào)九萬多份,重啟通信機(jī),隊(duì)列開始正常入庫,但是仍查不到報(bào)文,最后做數(shù)據(jù)清理,并恢復(fù)留底文件,待到整點(diǎn)收?qǐng)?bào)正常。
本文主要介紹了氣象數(shù)據(jù)庫系統(tǒng)的日常維護(hù)和常見故障分析,作為一名從事氣象數(shù)據(jù)庫維護(hù)的工作人員,在以后的工作中,還需要更加努力學(xué)習(xí)相關(guān)技術(shù),不斷總結(jié),在設(shè)備出現(xiàn)故障時(shí)才能有條不紊的進(jìn)行處理。