徐立++段群
摘 要
本文介紹了民航氣象數(shù)據(jù)庫系統(tǒng)故障的維修方法。
【關鍵詞】民航氣象數(shù)據(jù)庫系統(tǒng) 故障 檢修方法
1 引言
本場使用的民航數(shù)據(jù)庫系統(tǒng)(簡稱為新621系統(tǒng)),主要由三部分組成:即通信子系統(tǒng)部分、數(shù)據(jù)庫子系統(tǒng)部分、氣象信息綜合處理系統(tǒng)部分。民航氣象數(shù)據(jù)庫系統(tǒng)是民航氣象部門重要的IT信息建設項目之一,是保障飛行安全的重要組成部分。鑒于此,本文將闡述民航數(shù)據(jù)庫系統(tǒng)中的通信機服務器、數(shù)據(jù)庫服務器、Web服務器典型故障及維修過程,總結故障維修經(jīng)驗,以提高民航氣象信息系統(tǒng)設備保障人員的技術保障能力,確保設備正常運行。
2 典型故障現(xiàn)象維修及排除
2.1 通信機服務器硬盤故障與系統(tǒng)恢復
故障現(xiàn)象:REDHAT LINUX6.2操作系統(tǒng)不能正常啟動,系統(tǒng)提示DIsk has many bad sectors,此時需要執(zhí)行FSCK命令檢查文件系統(tǒng)并嘗試修復錯誤,修復完畢后正常啟動,但是在備份系統(tǒng)文件的過程中宕機,重啟通信機后出現(xiàn)同樣情況,但已無法繼續(xù)修復,硬盤徹底損壞。
故障原因分析:由于通信機以往異常斷電使硬盤出現(xiàn)壞道,產(chǎn)生物理邏輯錯誤,致使硬盤損壞。
故障維修及排除過程:
(1)拆除故障硬盤,更換上和故障硬盤接口類型和容量大小相同的新硬盤。
(2)安裝Liunx操作系統(tǒng):安裝前請先準備好RHEL6.2 32位的光盤,將光盤放入光驅,設置為光驅啟動后,進入系統(tǒng)安裝界面,按照步驟提示安裝好Liunx操作系統(tǒng)。
(3)配置通信機服務器。如果在以往對通信機服務器的維護過程中未對系統(tǒng)做備份,就需要按照廠方技術手冊安裝步驟分別對MQ、MOXA卡驅動、Oracle 11gR2 clinet 、通信分系統(tǒng)軟件包進行安裝和配置。
由于本場所使用的通信機服務器已用tar命令方式進行備份過,因此,現(xiàn)介紹的是用tar命令備份和恢復Liunx系統(tǒng)文件及目錄的方法。日常維護中,在通信機服務器正常運行時,防止服務器系統(tǒng)和配置文件數(shù)據(jù)的丟失,可對服務器進行tar命令備份整個文件系統(tǒng)。備份方法如下:
以root用戶登錄通信機服務器,進入liunx系統(tǒng)根目錄,使用Bzip2壓縮備份整個文件系統(tǒng)命令為:#tar -cvpjf backup.tar.bz2 /
備份完成后,在文件系統(tǒng)的根目錄下將生成一個名為“backup.tar.bz2”的文件,可以把該文件放到移動硬盤或者其它存儲介質上去?;謴拖到y(tǒng)使用命令:#tar xvpfz backup.tar.bz2 -C / ,恢復過程中會用備份文件中的文件覆蓋分區(qū)上的所有文件,重啟服務器后,系統(tǒng)會恢復到當初創(chuàng)建備份時的樣子。
2.2 通信服務器中AB(民航氣象錯誤公報計數(shù))、AR(民航氣象錯誤報告計數(shù))數(shù)目過多的造成大量文件積壓的故障處理
故障現(xiàn)象:開機以comm用戶登錄通信服務器后,使用mmi1命令后顯示狀態(tài)信息中AB、AR兩項數(shù)目過大。
故障原因分析:由于長期未對業(yè)務進行配置和調整造成AB、AR數(shù)目大量劇增。
故障排除處理過程:使用to_bsb命令將所有不識別的報頭抽出,并自動制作BSB控制。為了使用to_bsb,首先請確認$home/utl 目錄下的model.bsb 文件,to_bsb 是以model.bsb 文件為制作控制數(shù)據(jù)的依據(jù),model.bsb 文件的第一項前兩個字母是報頭的TT,第三個字母用于說明國外報還是國內(nèi)報,C 表示國內(nèi)報,O 表示國外報,A 表示對所有報的處理。其余項的含義與BSB 的文本文件相同。使用方法如下:
(1)輸入mmi1 (1 可以是、2、3、4 中任一個)
(2)輸入fin,,,,,,u (統(tǒng)計接收的不認識的報頭)
(3)輸入qu (退出mmi 終端)
(4)to_bsb 1 (其中1 表示mmi 號,必需與第一條對應。)
to_bsb 執(zhí)行的結果是在$home/dat_bak 目錄下生成bsb.new 文本文件,再將該文件附加到你原來的bsb 文本文件后面,然后再執(zhí)行make_bsb 重新生成BSB 有關的控制數(shù)據(jù)并拷貝到$home/comm/msdat 目錄下,并執(zhí)行冷啟動。
2.3 數(shù)據(jù)庫服務器使用startup命令無法啟動故障與恢復
故障現(xiàn)象:開機以oracle用戶登錄數(shù)據(jù)庫服務器后,使用startup命令后啟動數(shù)據(jù)庫失敗。
故障原因分析:使用df -i命令查看了/dev/sdba分區(qū)的索引節(jié)點(Inode),發(fā)現(xiàn)已經(jīng)用滿(IUsed=100%),導致oracle軟件異常。
故障排除處理過程:刪除TRASH目錄下AWOS內(nèi)無用資料后,釋放出/dev/sdba分區(qū)的一部分inode后,使用startup命令啟動數(shù)據(jù)庫正常。
2.4 氣象信息綜合處理系統(tǒng)web網(wǎng)頁亂碼故障與修復
故障現(xiàn)象:打開瀏覽器輸入氣象信息綜合處理系統(tǒng)網(wǎng)址,登陸后頁面出現(xiàn)亂碼,無法正常顯示網(wǎng)頁內(nèi)容。
故障原因分析:由于tomcat服務異常導致網(wǎng)頁顯示亂碼。
故障排除過程:以root用戶登錄數(shù)據(jù)庫服務器,先使用 #service tomcat stop
命令停止服務,再用 #service tomcat start開啟服務,用命令 #service tomcat status 來查看tomcat是否已啟動,顯示Tocat(8080) is running為正常,退出登錄。重新刷新網(wǎng)頁,網(wǎng)頁內(nèi)容恢復正常顯示。
2.5 數(shù)據(jù)庫系統(tǒng)服務器用戶界面卡屏故障與系統(tǒng)恢復
故障現(xiàn)象:當用戶logout登出用戶時,有時會出現(xiàn)一閃變成黑屏,出現(xiàn)“假死機”情況。
故障原因分析:REDHAT LINUX6.2操作系統(tǒng)安裝的是KDE桌面環(huán)境,可能是系統(tǒng)軟件或是其它原因造成圖形界面顯示相關程序異常工作而導致故障。
故障排除過程:使用ctrl + Alt + BackSpace組合鍵后,成功回到用戶登錄界面。
3 結束語
民航數(shù)據(jù)庫系統(tǒng)故障現(xiàn)象為數(shù)不多,但導致故障的原因多種多樣,上述故障只是較為典型的實例,只要熟悉整個系統(tǒng),明確維修思路,掌握正確的維修方法,就可以大大縮短故障處理時間,提高故障恢復效率,更重要的是設備維護人員要嚴格遵守設備操作規(guī)程,避免人為的造成設備損壞,對無法排除的故障要及時上報,必要時還需尋求廠家技術支持。
參考文獻
[1]太極計算機股份有限公司.云南機場集團有限責任公司數(shù)據(jù)庫系統(tǒng)安裝手冊[Z].2012
[2]太極計算機股份有限公司.云南機場集團有限責任公司通信機安裝配置實施報告[Z].2012.
作者單位
云南機場集團有限責任公司西雙版納機場航務部氣象臺 云南省景洪市 666100