張云
摘 要 醫(yī)院信息系統(tǒng)是現(xiàn)代醫(yī)院重要的生產(chǎn)工具,為保障系統(tǒng)硬件平臺的正常運行,本文分析了醫(yī)院環(huán)境下常見硬件故障及原因,提出了故障排除模型及管理措施,以最大限度保障醫(yī)院信息系統(tǒng)正常工作。
【關鍵詞】醫(yī)院信息系統(tǒng) 硬件平臺 故障排除模型
1 引言
隨著計算機網(wǎng)絡技術的不斷發(fā)展,信息化已經(jīng)成為了現(xiàn)代醫(yī)院管理的重要標志。醫(yī)院信息系統(tǒng)加快了信息處理過程,優(yōu)化了就診流程,提高了醫(yī)療效率,是現(xiàn)代醫(yī)院重要的生產(chǎn)工具。
信息系統(tǒng)的基礎是硬件平臺,是應用系統(tǒng)功能得以實現(xiàn)的根本,也是應用系統(tǒng)能夠發(fā)揮效用的前提和保證。硬件平臺故障或者運行速度、效率下降時,將影響醫(yī)療業(yè)務執(zhí)行、造成負面影響。為保障醫(yī)療工作的正常進行,降低因硬件設備性能下降、故障和突發(fā)事件所造成的影響,降低故障發(fā)生率,縮短故障排除時間?;谀翅t(yī)院硬件平臺現(xiàn)狀,提出了硬件排除及管理方法。
2 硬件平臺常見故障及分析
醫(yī)院信息系統(tǒng)硬件平臺,由小型機、服務器、存儲陣列、交換機、網(wǎng)絡線路以及眾多的桌面終端設備組成。從運維監(jiān)管系統(tǒng)中查詢得到常見的硬件故障包括:小型機的電源、CPU風扇;服務器的風扇、內(nèi)存;存儲陣列的磁盤、電池;電腦的主板、內(nèi)存、硬盤、顯卡、網(wǎng)卡、主機開關;網(wǎng)絡的交換機風扇、端口、光纖模塊、網(wǎng)絡線纜、網(wǎng)絡環(huán)路;以及其他外部設備:打印機、鍵盤、鼠標、顯示器、讀卡器等。
在醫(yī)院信息系統(tǒng)持續(xù)運行和工作環(huán)境下,計算機硬件及其設備出現(xiàn)故障,通常有以下原因:
(1)使用者未按操作規(guī)程使用計算機及外設,造成硬件故障。如帶電插拔設備、強行關閉主機電源、設備間錯誤插接、過度用力使用鍵盤及鼠標、隨意改動配置參數(shù)或意外造成的硬件損壞;
(2)電子元器件自身老化、機械部件達使用年限,電子元器件存在質(zhì)量問題或生產(chǎn)工藝、材料不標準,以及計算機設備常年持續(xù)工作等;
(3)醫(yī)院環(huán)境每天進行物理或化學消毒,可導致環(huán)境溫度、濕度過高、化學腐蝕,以及灰塵;在大型醫(yī)療設備區(qū)域,存在電磁干擾、電壓不穩(wěn)定因素,使得設備性能降低、電路及元件損害;
(4)由于醫(yī)院業(yè)務的不斷增長,在工作區(qū)子系統(tǒng)采用不可網(wǎng)管的交換機進行端口擴充,破壞了原有網(wǎng)絡結構以及在開放環(huán)境下,可隨意改變網(wǎng)絡連接,導致網(wǎng)絡環(huán)路;維護人員錯誤使用網(wǎng)絡線纜檢測工具,導致交換機端口損壞。
3 故障排除方法與管理措施
3.1 事故等級定義
事故管理的主要目標是盡可能小地影響業(yè)務的情況下,盡可能快地將服務恢復到“正常狀態(tài)”。醫(yī)院業(yè)務具有明顯的時間規(guī)律,通常8:00-11:00(A)是業(yè)務高峰期,14:30-17:00(B)是業(yè)務次高峰期以及其他時段(C),結合醫(yī)院業(yè)務狀態(tài),根據(jù)在不同時段硬件故障對業(yè)務的影響程度,將硬件事故分為:1級(A\B\C):核心設備故障致全院應用癱瘓、2級(A\B\C):單個主要業(yè)務系統(tǒng)或網(wǎng)絡匯聚層故障致業(yè)務系統(tǒng)或整棟樓宇應用癱瘓、3級(A\B\C):輔助業(yè)務系統(tǒng)或網(wǎng)絡接入層故障致輔助業(yè)務系統(tǒng)或樓層網(wǎng)絡癱瘓、4級(A\B\C):單個終端設備或接入層交換機端口、網(wǎng)線故障
3.2 事故處理流程及方法
縮短硬件事故排除時間最好是采用系統(tǒng)化的處理方法。根據(jù)實踐和理論,給出了故障排除模型的系統(tǒng)化處理流程,如圖1所示。
在故障排除時,首先向受故障影響的用戶詢問詳細情況,從系統(tǒng)日志、診斷命令、軟件注釋信息、網(wǎng)絡管理系統(tǒng)等信息源收集有用的信息。其次遵循由外部到內(nèi)部的原則,即從主機外部設備向主機機箱內(nèi)或從內(nèi)外網(wǎng)邊界向內(nèi)網(wǎng);遵循由上到下的原則,即在外部設備檢測后,按應用軟件數(shù)據(jù)處理過程,從輸入到輸出或網(wǎng)絡協(xié)議的應用層到物理層,對可能出現(xiàn)的故障進行逐一排查。采用觀察法、測量法、最小化系統(tǒng)法、組件替換法、組件比較法[3]等方法,將收集到的信息加以利用,盡可能的縮小目標范圍從而制定出高效的行動計劃并實施。對于每個已經(jīng)解決的問題,記錄故障現(xiàn)象以及相應的解決方案,在今后類似故障排除時作為參考,從而極大降低故障排除時間,最小化對業(yè)務的負面影響。
3.3 管理措施
以能夠?qū)崿F(xiàn)最大限度保障業(yè)務系統(tǒng)正常工作作為硬件平臺維護管理的工作目標,通過分析整個信息系統(tǒng)的結構,評價影響系統(tǒng)正常運行的風險、隱患所在,做好人員、技術、工具和工作細節(jié)準備,保證工作目標得以實現(xiàn)。主要措施包括:
(1)建立人員管理體系:加強運維人員的理論與技術培訓,提高工作能力和工具使用的技能;對醫(yī)護人員開展計算機基礎理論及常規(guī)操作培訓,提高使用能力。
(2)建立健全管理制度及維護操作規(guī)程,做到職責到人并應用PDCA對制度及執(zhí)行持續(xù)改進。
(3)建立運維監(jiān)管系統(tǒng):對硬件平臺設備的性能、效率、利用率、狀況以及機房動力環(huán)境進行監(jiān)控;對信息資產(chǎn)的生命周期進行全面管理;應用運維過程控制,對運維工作進行跟蹤記錄,對運維過程中發(fā)現(xiàn)的故障隱患和故障處理操作過程及方法進行歸檔留存,形成特定的運維知識庫,以便發(fā)現(xiàn)存在的問題,并進行改進,避免不可預期故障的出現(xiàn),降低其損害和影響。
(4)建立備品備件庫:庫存物品建立臺帳,并進行必要的測試。保障運維和應急時的可用性、有效性。
(5)根據(jù)事故定義,制訂相應的應急預案和應急措施。
4 結語
總之,為保障系統(tǒng)硬件平臺的正常運行,對硬件平臺設備進行必要的日常檢查和預防性維護,監(jiān)控其運行狀態(tài)及運行效率,檢查相關的設備運行日志,對隨時可能出現(xiàn)的告警信息進行跟蹤、分析,做到出現(xiàn)問題及時解決,就能最大限度保障業(yè)務系統(tǒng)正常工作。
參考文獻
[1]薛玉林.計算機網(wǎng)絡系統(tǒng)在醫(yī)院管理中的應用[J].當代醫(yī)學,2009,15(04):23-24.
[2]劉道踐,李源,顧風軍.基于ITIL的醫(yī)院運維管理流程研究[J].中國數(shù)字醫(yī)學,2011,6(09):90-92.
[3]朱來友.淺談計算機硬件故障與維護[J].經(jīng)濟管理者,2012(10):388.
作者單位
昆明醫(yī)科大學第一附屬醫(yī)院信息中心 云南省昆明市 650032