楊國斌
南京軍區(qū)南京總醫(yī)院 醫(yī)務(wù)部江蘇 南京 210002
隨著醫(yī)院信息化的發(fā)展,計算機(jī)網(wǎng)絡(luò)規(guī)模不斷擴(kuò)展,原有數(shù)據(jù)中心的空間和設(shè)備性能已經(jīng)不能滿足現(xiàn)有和將來發(fā)展的需求。為此,我院在外科樓建立了新的網(wǎng)絡(luò)中心機(jī)房,對原有部分設(shè)備進(jìn)行更新擴(kuò)容,以滿足醫(yī)院業(yè)務(wù)系統(tǒng)的正常運轉(zhuǎn)。在網(wǎng)絡(luò)中心機(jī)房建成后,數(shù)據(jù)中心將實施搬遷工作,而醫(yī)院業(yè)務(wù)系統(tǒng)的特點是:數(shù)據(jù)集中、業(yè)務(wù)量大、業(yè)務(wù)連續(xù)性要求極高,因此,保證業(yè)務(wù)連續(xù)性和數(shù)據(jù)不丟失是數(shù)據(jù)中心遷移的核心要求。數(shù)據(jù)遷移過程中保證數(shù)據(jù)的安全并最大限度地降低對業(yè)務(wù)的影響就成為遷移技術(shù)選型、方案設(shè)計的依據(jù)。如果在方案實施中出現(xiàn)數(shù)據(jù)大量丟失或者業(yè)務(wù)長時間中斷將可能造成無可挽回的災(zāi)難性后果,因此要保證系統(tǒng)的平滑割接和業(yè)務(wù)的平穩(wěn)運行,這也是遷移方案設(shè)計的主要難點。
我院當(dāng)時要搬遷的服務(wù)器主要有數(shù)據(jù)庫服務(wù)器和應(yīng)用服務(wù)器,其中,數(shù)據(jù)庫服務(wù)器是遷移中的難點,主要有醫(yī)院信息系統(tǒng)(HIS)的數(shù)據(jù)庫服務(wù)器、門急診數(shù)據(jù)庫服務(wù)器以及實驗室信息系統(tǒng)(LIS)的數(shù)據(jù)庫服務(wù)器等。在需要搬遷的數(shù)據(jù)庫服務(wù)器中,有Oracle和MS SQL Server兩種數(shù)據(jù)庫系統(tǒng)。經(jīng)過調(diào)研論證,我們選用了EMC公司提供的AutoStart集群管理軟件來進(jìn)行數(shù)據(jù)遷移和系統(tǒng)切換。AutoStart軟件支持任何主流的數(shù)據(jù)庫,且高效穩(wěn)定,能保證主、備機(jī)數(shù)據(jù)的實時同步,根據(jù)需要或自動偵測相應(yīng)的軟硬件故障,并將相應(yīng)系統(tǒng)在另一臺服務(wù)器上重新啟動,從而保證整個應(yīng)用系統(tǒng)的7×24 h連續(xù)運行的能力,滿足業(yè)務(wù)系統(tǒng)不能中斷的要求[1]。
針對當(dāng)時數(shù)據(jù)中心遷移的實際情況,將需要解決的事情分為遷移、備份和應(yīng)急等三類工作。其中“遷移”指的是將數(shù)據(jù)庫服務(wù)器從老機(jī)房遷移到新機(jī)房;“備份”指的是數(shù)據(jù)庫的手工備份,以保證系統(tǒng)中原有數(shù)據(jù)的安全;“應(yīng)急”指的是當(dāng)主服務(wù)器發(fā)生故障時,如何能在短時間內(nèi)迅速啟動備用系統(tǒng),保證醫(yī)院業(yè)務(wù)的不中斷運行。在進(jìn)行服務(wù)器搬遷前,要先期備份服務(wù)器各項數(shù)據(jù),并檢驗備份的服務(wù)器各項數(shù)據(jù)是否完全能用[2-3]。同時成立專門的管理小組,制定應(yīng)急計劃,將各個產(chǎn)品供應(yīng)商和各相關(guān)科室納入統(tǒng)一管理,集中調(diào)度。
當(dāng)時,運行關(guān)鍵業(yè)務(wù)的HIS和門急診數(shù)據(jù)庫服務(wù)器已趨于飽和狀態(tài),并且過了維保期,而且面臨新內(nèi)科樓的啟用,在搬遷過程中可能存在一定的風(fēng)險。因此,我們新增兩臺PC服務(wù)器,分別用于HIS和門急診數(shù)據(jù)庫服務(wù)器,安裝在新的網(wǎng)絡(luò)中心機(jī)房,與原有的服務(wù)器通過雙機(jī)軟件組成雙機(jī)熱備系統(tǒng)。用于雙機(jī)熱備系統(tǒng)的兩臺服務(wù)器必須各有一塊網(wǎng)卡,以反絞線連接,作為數(shù)據(jù)鏡像的專用通道。用于鏡像上綁定的靜態(tài)IP地址與局域網(wǎng)的IP地址不能在同一子網(wǎng)。服務(wù)器可以是域模式,也可以是獨立 Server模式,也可以是“域+獨立Server模式”,但兩臺服務(wù)器必須在相同的網(wǎng)段內(nèi)。
在安裝服務(wù)器操作系統(tǒng)時,必須注意服務(wù)器分區(qū)類型、分區(qū)大小以及操作系統(tǒng)與數(shù)據(jù)分區(qū)的位置。AutoStart軟件對硬盤沒有特別的要求,一塊或多塊硬盤都能實現(xiàn)鏡像,支持任何Raid類型。但只有基本分區(qū)可以進(jìn)行數(shù)據(jù)實時同步、被保護(hù),而動態(tài)分區(qū)與該軟件不兼容,并且要求鏡像的數(shù)據(jù)分區(qū)不能與操作系統(tǒng)在同一個分區(qū),而且從服務(wù)器的數(shù)據(jù)分區(qū)不能比主服務(wù)器數(shù)據(jù)分區(qū)小[4]。在數(shù)據(jù)分區(qū)不能有任何系統(tǒng)文件,包括系統(tǒng)的頁面文件,并且必須將AutoStart軟件安裝在數(shù)據(jù)分區(qū)。
AutoStart雙機(jī)集群管理軟件的安裝分為Agent和Console兩部分,其中Agent安裝后以服務(wù)形式出現(xiàn),Agent安裝成功后需要重啟系統(tǒng)。每次系統(tǒng)啟動,Agent服務(wù)會自動啟動。Console只是一個管理界面的程序,安裝后無需重啟。在主服務(wù)器和備用服務(wù)器上都要安裝Agent和Console,可在任意一臺服務(wù)器先安裝AutoStart軟件。第一臺服務(wù)器的AutoStart軟件安裝成功后,通過Console,需要為第二臺服務(wù)器的AutoStart軟件的安裝做好準(zhǔn)備,才能在第二臺服務(wù)器上安裝AutoStart軟件。
在主機(jī)和備機(jī)上分別部署雙機(jī)軟件后,對雙機(jī)軟件進(jìn)行調(diào)試,期間需要重啟一次數(shù)據(jù)庫服務(wù)器,可以在夜間進(jìn)行。通過雙機(jī)軟件將數(shù)據(jù)庫磁盤從主機(jī)鏡像到備份服務(wù)器上,完成鏡像后主數(shù)據(jù)庫和備份數(shù)據(jù)庫的數(shù)據(jù)完全一致。然后,對備份服務(wù)器的數(shù)據(jù)庫進(jìn)行測試,判斷服務(wù)器是否正常。如果一切正常,主、備機(jī)即可進(jìn)行切換,啟用數(shù)據(jù)庫服務(wù),客戶端就可以訪問新的服務(wù)器,進(jìn)而把原有系統(tǒng)進(jìn)行斷電、搬遷,實現(xiàn)數(shù)據(jù)中心的遷移。在搬遷完成后,可以采用該雙機(jī)軟件部署一個實時同步的數(shù)據(jù)庫系統(tǒng),在主數(shù)據(jù)庫發(fā)生意外故障時,根據(jù)需要進(jìn)行切換。
為了保證數(shù)據(jù)中心搬遷工作順利進(jìn)行,在盡可能做好相應(yīng)準(zhǔn)備工作的同時,制定遇到緊急事件的應(yīng)急預(yù)案是必不可少的重要環(huán)節(jié)。我們制定的應(yīng)急預(yù)案包括:在系統(tǒng)切換不成功的情況下,實施回退方案或啟用備機(jī)方案。
(1)回退方案。在整個系統(tǒng)切換過程中,先保留主機(jī)數(shù)據(jù),確保主機(jī)在切換前是正常關(guān)閉數(shù)據(jù)庫。如果切換方案由于種種原因不能進(jìn)行正常切換,我們將采用回退機(jī)制,以保證業(yè)務(wù)系統(tǒng)可以正常使用。在切換到熱備份服務(wù)器的過程中若發(fā)生遷移失敗的情況,只需要重新恢復(fù)主機(jī)的IP地址即可,然后繼續(xù)使用切換前的主服務(wù)器,期間的數(shù)據(jù)不會有任何損失。然后進(jìn)行原因分析與排查,直至問題解決,再擇機(jī)進(jìn)行系統(tǒng)切換。
(2)備機(jī)方案。將備機(jī)先行遷移到新的網(wǎng)絡(luò)中心機(jī)房,將數(shù)據(jù)備份到備機(jī)上,在此期間,主數(shù)據(jù)庫服務(wù)器仍然正常服務(wù)。在短時間之內(nèi)回退方案如果確實存在問題,導(dǎo)致業(yè)務(wù)系統(tǒng)中斷,我們將啟用備機(jī)方案。暫停主服務(wù)器的對外服務(wù),利用歸檔重做日志將數(shù)據(jù)與備份服務(wù)器進(jìn)行同步,這個階段需要暫停服務(wù)較長時間[5-6]。然后,啟動備份服務(wù)器的數(shù)據(jù)庫,進(jìn)行測試,確保備份服務(wù)器的數(shù)據(jù)庫可以正常使用。接著,切換主服務(wù)器IP地址,客戶端即可訪問備用服務(wù)器,盡可能把對業(yè)務(wù)的影響降低到最小。
數(shù)據(jù)中心的遷移是一個精確的系統(tǒng)工程,要充分結(jié)合科學(xué)的管理以及專業(yè)的技術(shù)實現(xiàn),細(xì)化和監(jiān)控好每一個環(huán)節(jié),做好詳細(xì)的風(fēng)險預(yù)防計劃,才能保證方案的成功實施。針對我院實際情況,使用雙機(jī)熱備份系統(tǒng)并采用AutoStart集群管理軟件,從技術(shù)層面有效地保證了遷移的成功實施,還為以后的主、備機(jī)數(shù)據(jù)實時備份和主機(jī)的故障恢復(fù)提供了更好的保障,并兼顧了設(shè)備投資的長期和短期效益。將熱備份的數(shù)據(jù)分別存放在兩臺服務(wù)器的本地硬盤中,雙機(jī)中任何一臺機(jī)器發(fā)生故障,可以讓另一臺機(jī)器接管相應(yīng)的IP地址、主機(jī)名、數(shù)據(jù)庫服務(wù)及業(yè)務(wù)應(yīng)用,保證業(yè)務(wù)系統(tǒng)不中斷運行。實踐證明,在項目實施過程中要特別注意以下幾個方面:一是要正確選擇方案,盡可能縮短停機(jī)時間,保障業(yè)務(wù)系統(tǒng)的連續(xù)性;二是要詳細(xì)進(jìn)行測試,避免遷移過程中發(fā)生差錯;三是要做好數(shù)據(jù)備份,保證醫(yī)療數(shù)據(jù)的安全[7-8];四是要制定回退機(jī)制,保證整個遷移過程可控;五是要完善后繼工作,積累實踐知識、總結(jié)經(jīng)驗及完善文檔。
[1]趙春曉.醫(yī)院信息系統(tǒng)中的數(shù)據(jù)安全[J].醫(yī)療裝備,2010,23(2):31-32.
[2]翁盛鑫,黃影.安全數(shù)據(jù)備份系統(tǒng)的建設(shè)[J].醫(yī)療衛(wèi)生裝備,2009,30(11):54-56.
[3]葉俊,劉松林,陳健美,等.我院HIS數(shù)據(jù)備份與容災(zāi)技術(shù)方案[J].中國醫(yī)療設(shè)備,2008,23(1):37.
[4]馬錫坤,楊國斌.基于PC服務(wù)器非共享磁盤高可用系統(tǒng)的實現(xiàn)[J].中國醫(yī)療設(shè)備,2010,25(4):29-30.
[5]馮凱,崔毅,劉書占.軍隊醫(yī)院信息系統(tǒng)數(shù)據(jù)的備份與恢復(fù)案例[J].中國醫(yī)學(xué)教育技術(shù),2010,24(3):288-290.
[6]羅緋,李明,張安仁,等.醫(yī)院信息系統(tǒng)備份策略[J].西南國防醫(yī)藥,2010,20(11):1254-1255.
[7]李國亮.醫(yī)院網(wǎng)絡(luò)數(shù)據(jù)災(zāi)難恢復(fù)與備份[J].中國醫(yī)療設(shè)備,2011,26(2):87.
[8]姜瓊,張泉方.醫(yī)院信息管理中的數(shù)據(jù)備份研究[J].中國數(shù)字醫(yī)學(xué),2008,3(11):49-51。
[9]王學(xué)海.ORACLE數(shù)據(jù)庫備份及恢復(fù)[J].中國醫(yī)療設(shè)備,2012,27(6):57-58.