摘要:民航氣象傳真廣播系統(tǒng)(簡稱氣象數(shù)據(jù)庫系統(tǒng))主要由通信分系統(tǒng)、數(shù)據(jù)庫分系統(tǒng)、預報平臺、服務平臺四部分組成,本文通過對幾起數(shù)據(jù)庫系統(tǒng)的故障分析,使大家能夠分享維護經(jīng)驗,更加掌握數(shù)據(jù)庫的數(shù)據(jù)流程,以便快速及時的解決故障。
關鍵詞:氣象數(shù)據(jù)庫 應用服務器 資料處理子系統(tǒng) 應用庫 歷史庫
1 引言
數(shù)據(jù)庫分系統(tǒng)處理的主要氣象資料包括:衛(wèi)星云圖資料,國家氣象局 9210 業(yè)務系統(tǒng)的氣象資料,世界區(qū)域預報系統(tǒng)發(fā)布的全球重要天氣預告資料,主要機場氣象臺的天氣雷達實時探測資料,各航站的自動觀測資料,機場例行觀測資料。
2 數(shù)據(jù)庫分系統(tǒng)的接口
數(shù)據(jù)庫分系統(tǒng)與通信分系統(tǒng)的接口是數(shù)據(jù)庫服務器和應用服務器上的 /home/mhdbs/data 目錄。通信分系統(tǒng)將接收到的氣象資料按類別存放在該目錄下的12個子目錄中。資料處理子系統(tǒng)對/home/mhdbs/data目錄下的12個子目錄進行監(jiān)控,當發(fā)現(xiàn)目錄下有氣象資料時,便會逐個對資料進行分析、分解,存入 Oracle 數(shù)據(jù)庫中,在對某個氣象資料處理完畢后將/home/mhdbs/data 下的該原始文件轉移到/home/mhdbs/trash中相對應的目錄中。預報平臺、服務平臺從Oracle數(shù)據(jù)庫中讀取所需信息。
3 數(shù)據(jù)庫分系統(tǒng)的資料處理流程
由于歸檔文件會占用一定的服務器存儲空間,即磁盤空間監(jiān)控/home的使用率日積月累不斷增長,因此為了更妥善的保存歸檔文件,系統(tǒng)提供歸檔文件遷入、遷出功能。資料文件的遷入遷出分為兩個部分,其中歸檔資料文件的遷入是指將保存在已安裝數(shù)據(jù)庫管理子系統(tǒng)客戶端的機器上的壓縮歸檔文件遷入到服務器,歸檔資料文件的遷出是指將服務器的壓縮歸檔文件遷出到已安裝數(shù)據(jù)庫管理子系統(tǒng)客戶端的機器上,并在遷出時對遷移文件的正確性和完整性進行檢查。
4 定期執(zhí)行的操作
4.1 定期檢查自動歸檔運行是否正常
以oracle登錄服務器cd /home/mhdbs/data/backup/當天日期 查看歸檔文件一共有多少個,正常情況下應該為33個后綴為.zip的文件。如果文件個數(shù)不符合,請下載/home/mhdbs/bin/log/oracle日志信息,將日志信息發(fā)回數(shù)據(jù)庫分系統(tǒng)廠商。
4.2 定期檢查進程運行是否正常
每天查看12個入庫進程的運行情況,如果發(fā)現(xiàn)異常,可以直接通過界面啟動。如果12個入庫進程異常終止,請將/home/mhdbs/bin/log下的日志發(fā)給數(shù)據(jù)庫聯(lián)系人。
4.3 定期檢查自動資料清除運行是否正常
(1)進入【日志和統(tǒng)計】--【資料處理日志瀏覽】。
(2)級別僅選擇error級別。
(3)若存在記錄,請登錄服務器下載/home/mhdbs/bin/log/dms文件夾下日志并發(fā)給數(shù)據(jù)庫分系統(tǒng)聯(lián)系人。
4.4 定期檢查磁盤空間監(jiān)控
若/home的磁盤利用率超過70%,建議利用數(shù)據(jù)庫管理子系統(tǒng)客戶端【資料處理】菜單下的【歸檔文件遷出】功能遷出歸檔文件。
磁盤空間監(jiān)控發(fā)現(xiàn)/u0的使用率超過70%,則點擊【系統(tǒng)監(jiān)控】--【數(shù)據(jù)庫監(jiān)控】--【存儲空間利用率】選項卡中的【回收空間】按鈕釋放空間。
5 案例分析
5.1 案例分析一
5.1.1 故障現(xiàn)場處置
最近一段時間,巡視數(shù)據(jù)庫服務器磁盤空間監(jiān)控時發(fā)現(xiàn)/home的使用率達到50%以上,有時甚至快達到60%。由于歸檔文件存放在/home/mhdbs/data/backup文件夾下,進一步檢查發(fā)現(xiàn),在/home/mhdbs/data/backup文件夾下,還有部分歸檔文件已經(jīng)遷移成功但未刪除,這樣就占用了部分磁盤空間。經(jīng)過對DB00和DB01數(shù)據(jù)庫遷出文檔保存文件夾對比檢查,未遷出的重新進行【歸檔文件遷出】工作,已經(jīng)遷出的運行命令:rm –r 文件目錄,進行歸檔文件刪除,只保留backup下2020年7月的歸檔文件。完成后/home的磁盤利用率降為35%。
另外/home/mhdbs/data/configtables下每隔五天保存一份配置文件備份,從2013年開始運行保存至今,雖然每份文件不大但日積月累也占用一定的磁盤空間。經(jīng)咨詢廠家工程師,可以刪除以前備份。運行命令:du –sm 目錄名稱,可以檢查目錄所占空間大小。在DB01數(shù)據(jù)庫/home/mhdbs下建立文件夾backup20200713,將2013年到2019年的配置文件備份先暫時遷移到此文件夾下,經(jīng)過一段運行確定未影響正常運行后再進行刪除。也可以釋放/home一部分空間。/trash目錄和日志未定時自動刪除也會占用/home空間,需定時檢查。至此大大降低了/home磁盤利用率。
5.1.2 故障原因分析
由于歸檔文件存放在/home/mhdbs/data/backup文件夾下,系統(tǒng)每天執(zhí)行的自動歸檔操作產(chǎn)生的歸檔文件將不斷的占用/home文件夾的使用空間,使得/home的磁盤利用率不斷增大,為了保證系統(tǒng)的穩(wěn)健運行,在每周五的周維護中,都會進行【歸檔文件遷出】工作,該功能可以將AIX服務器上存儲的歸檔文件遷移到安裝管理子系統(tǒng)客戶端的PC機保存,并將已經(jīng)遷移成功的歸檔文件從AIX服務器上刪除,以釋放/home的磁盤空間。
5.2 案例分析二
5.2.1 故障現(xiàn)場處置
3月09日,在檢查預報室區(qū)域預警與機場警報綜合處理軟件時,發(fā)現(xiàn)該軟件編發(fā)的機場警報(JJ)、終端區(qū)天氣預警(ZD)、話音方式航空器空中報告(AR)以及MDRS重要天氣概率預報(MR)在軟件自帶的本機數(shù)據(jù)庫以及上海民航氣象數(shù)據(jù)庫可查詢到相應產(chǎn)品,但在濟南民航氣象數(shù)據(jù)庫查詢不到。聯(lián)系區(qū)域預警與機場警報綜合處理軟件工程師協(xié)助排查原因,上述類型的預報產(chǎn)品,經(jīng)軟件處理后自動發(fā)送到通信服務器receive/forecastchart目錄下,由通信服務器根據(jù)BSB表完成上述產(chǎn)品通過數(shù)據(jù)庫服務器prog進程入本地數(shù)據(jù)庫IMAGE01_PROG數(shù)據(jù)表和轉發(fā)上海處理,經(jīng)查閱數(shù)據(jù)庫prog進程日志,發(fā)現(xiàn)上述產(chǎn)品在本地入庫時出現(xiàn)告警信息,導致未能入庫。
5.2.2 故障原因分析
數(shù)據(jù)庫服務器入庫控制參數(shù)-常規(guī)天氣圖標準設置過大(100)導致上訴預報產(chǎn)品文件出現(xiàn)FILE SIZE ERROR告警未能入庫,時間配置參數(shù)資料早到時間判定設置不合理(180)出現(xiàn)sendtime is too early告警導致產(chǎn)品文件未入庫。聯(lián)系太極工程師協(xié)助排查系統(tǒng)配置參數(shù)設置,打開數(shù)據(jù)庫管理客戶端,選擇系統(tǒng)配置->業(yè)務處理配置->時間配置,更改資料早到時間判定參數(shù)為1440。選擇系統(tǒng)配置->業(yè)務處理配置->入庫控制,更改常規(guī)天氣圖標準參數(shù)為0。
6 結束語
氣象數(shù)據(jù)庫系統(tǒng)在民航氣象情報交換中占有重要作用,保障整個數(shù)據(jù)庫系統(tǒng)正常運行尤為重要,了解數(shù)據(jù)的基本流轉流程,了解數(shù)據(jù)的整個架構,有助于維護維修人員快速的處理問題。隨著維護經(jīng)驗的不斷積累,對整個系統(tǒng)的保障技術會更加日益成熟,最大限度的保障設備的安全運行。
參考文獻:
[1]氣象信息系統(tǒng)基礎 崗前培訓教程
[2]余柏山,LINUX系統(tǒng)管理和網(wǎng)絡管理.北京:清華大學出版社.2005
[3]民航傳真廣播系統(tǒng)數(shù)據(jù)庫分系統(tǒng)使用手冊
[4]民航傳真廣播系統(tǒng)改造工程AIX操作系統(tǒng)培訓講義
作者簡介:張瑾,1972年5月,女,工程師,設備維護維修