黃楠
摘要:該文在調(diào)研災備系統(tǒng)背景及原理的基礎上,闡述了交行卡中心虛擬機及網(wǎng)絡現(xiàn)狀,分析了目前交行卡中心虛擬機災備系統(tǒng)設計當中的相關難點問題并針對交行卡中心虛擬災備系統(tǒng)的建立提出了在數(shù)據(jù)復制方案以及網(wǎng)絡切換方案選擇上的對策方案。
關鍵詞:災備系統(tǒng);交行卡中心;數(shù)據(jù)復制;網(wǎng)絡切換方案;對策
中圖分類號:TP393? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)14-0240-03
1 緒論
1.1 研究背景
災備系統(tǒng)是保證企業(yè)業(yè)務正常運轉,為企業(yè)和用戶提供優(yōu)質(zhì)服務的重要組成部分。電子計算機技術的發(fā)展為更多的企業(yè)帶來業(yè)務上的發(fā)展機遇,但受限于機器設備的落后,在很大程度上影響了工作的正常運行,常常出現(xiàn)企業(yè)相關系統(tǒng)癱瘓的現(xiàn)象,一些企業(yè)的業(yè)務無法正常開展而使得企業(yè)遭受了巨大的損失。目前交行卡中心有A、B、C、D四級災備系統(tǒng),其中A級災備系統(tǒng)與B級災備系統(tǒng)在災備管理要求上一致,但是A級災備系統(tǒng)要求在實施之前必須先按照B級和C級的管理要求實施災備管理,在此基礎上為A級災備系統(tǒng)的實施提供數(shù)據(jù)、應用的技術信息支持。
1.2 災備系統(tǒng)原理
多個虛擬機如果要在一臺物理服務器上實現(xiàn)同時運行需要依托虛擬化技術為基礎的云平臺,依托虛擬化云平臺可以實現(xiàn)硬件設備與軟件系統(tǒng)之間的強耦合,同時帶來了封裝、分區(qū)及隔離等多方好處。災備系統(tǒng)很重要的一點就是虛擬機備份的問題,備份主要涉及虛擬存儲、虛擬機系統(tǒng)狀態(tài)等兩個方面的內(nèi)容,而內(nèi)存、虛擬磁盤及其他配置信息組成了虛擬機存儲。
2 交行卡中心虛擬機及網(wǎng)絡現(xiàn)狀
目前,交行卡中心已經(jīng)建立的虛擬機災備系統(tǒng)當中,包括兩個重要組成部分,虛擬機應用部分以及相應的網(wǎng)絡架構設置部分。通常情況下,災備系統(tǒng)當中,虛擬機實際上是作為信息備份、數(shù)據(jù)存儲的應用操作點,各地區(qū)之間的網(wǎng)絡架構通過各個點位連接在一起,使得虛擬機各個點位有效結合在一起,成為一套有機統(tǒng)一的災備系統(tǒng)。本文主要對交行卡中心虛擬機應用現(xiàn)狀以及網(wǎng)絡架構現(xiàn)狀兩個方面進行分析。
2.2 交行卡中心虛擬機現(xiàn)狀
虛擬機作為計算機平臺與用戶終端之間創(chuàng)建的一種聯(lián)系紐帶,可以讓用戶帶來操作軟件,也可以模擬硬件設備的實現(xiàn)。
目前,交行卡中心的災備系統(tǒng)使用的都是VMware虛擬機和SRM系統(tǒng)。該系統(tǒng)的總體架構共分為4層:第一層為數(shù)據(jù)存儲層,所有虛擬機都存放在數(shù)據(jù)存儲層中。第二層為物理機層,是所有虛擬機載體。第三層為虛擬機層,每臺虛擬機為一個單獨的業(yè)務系統(tǒng)。第四層為虛擬映射設備層,包括虛擬映射串口、虛擬映射USB等。
2.2 網(wǎng)絡現(xiàn)狀
交行卡中心主體網(wǎng)絡結構分為兩個部分,辦公測試網(wǎng)絡區(qū)域和生產(chǎn)網(wǎng)絡區(qū)域,兩個網(wǎng)絡區(qū)域依靠管理網(wǎng)絡、虛擬機交互網(wǎng)絡和VMotion網(wǎng)絡三部分來實現(xiàn)區(qū)域之間信息數(shù)據(jù)的交互傳遞。管理網(wǎng)絡主要是為了方便部門管理人員對兩個子網(wǎng)絡進行信息數(shù)據(jù)的查詢與監(jiān)管;虛擬機網(wǎng)絡和VMotion網(wǎng)絡則是實現(xiàn)異地的信息備份與復原。交行卡中心生產(chǎn)網(wǎng)絡區(qū)域的結構設置與XX企業(yè)生產(chǎn)區(qū)域核心機房的地理位置設置相類似。在交行卡中心辦公測試網(wǎng)絡區(qū)域之中,設置了辦公VCenter區(qū)域網(wǎng)絡以及測試PaaS VCenter兩個子網(wǎng)絡區(qū)域,而在交行卡中心生產(chǎn)網(wǎng)絡區(qū)域之中設置了生產(chǎn)VCenter、生產(chǎn)金京PaaS VCenter和生產(chǎn)富特PaaS VCenter三個子網(wǎng)絡區(qū)域。
3 災備方案流程及設計難點
3.1 設計方案流程
交行卡中心在建立整體災備方案之前,首先要明確構建災備系統(tǒng)的目標與原則;其次需要建立完善的災備中心,需要包含同城災備中心與異地災備中心;接著建立起重要業(yè)務恢復災備等級;最后建立災備系統(tǒng)的IT基礎架構。在建立網(wǎng)絡IT基礎架構方面,主要包含了三項內(nèi)容:(1)建立良好的存儲系統(tǒng);(2)建立性能完善網(wǎng)絡整體結構;(3)建立良好的數(shù)據(jù)庫系統(tǒng)。
3.2 設計難點
(1)同城、異地災備中心的網(wǎng)絡切換
在交行卡中心災備系統(tǒng)的建立過程中,由于不同的機房之間的網(wǎng)絡IP地址不同,因此要解決同城、異地災備情況下進行合適的網(wǎng)絡切換的問題。在進行網(wǎng)絡切換時,往往需要考慮的因素包含了從網(wǎng)絡層、存儲層、主機系統(tǒng)層三個層次的網(wǎng)絡切換問題。當選擇不同的災備方案時,具體的網(wǎng)絡切換需求也有所不同,也就是說當生產(chǎn)中心出現(xiàn)災難時,選擇同城災備與選擇異地災備時,會產(chǎn)生不同的網(wǎng)絡切換方案。
(2)不同機房的虛擬機之間的數(shù)據(jù)復制
在交行卡中心災備系統(tǒng)正常使用的過程之中,不同的虛擬機之間的數(shù)據(jù)需要進行復制,此復制過程關系到各個站點機房(生產(chǎn)中心、同城災備中心、異地災備中心)之間的數(shù)據(jù)信息能否正常且高效地傳遞,因為,良好穩(wěn)定的數(shù)據(jù)復制傳輸才可以有效保證虛擬機災備系統(tǒng)的正常運行,交行卡中心現(xiàn)有的災備系統(tǒng)中,虛擬機之間的位置關系、網(wǎng)絡架構較為復雜,因此就需要設計出完善的虛擬機數(shù)據(jù)復制過程。
4 虛擬機災備系統(tǒng)建立對策
4.1 數(shù)據(jù)復制方案的設計與實施
4.1.1 通過存儲進行復制
通過綜合考慮,我們選擇了通過存儲來實現(xiàn)進一步復制的方案,將所有需要災備管理的虛擬機所在的LUN通過存儲復制到災備端。正常工況下,災備端虛擬機的LUN呈現(xiàn)只讀的模式,會通過腳本的方式把所有虛擬機清單建立;非正常工況下,例如處于災備演練狀態(tài)或者主站點出現(xiàn)災難而需要進行災備管理的時候就需要通過腳本啟動虛擬機。
(1)方案拓撲
(2)災備流程
災備流程主要針對非正常工況下需要進行災備管理的狀態(tài),虛擬機會實現(xiàn)從主機房切換到災備機房,通過存儲復制方式,由腳本把虛擬災備機房掛載到災備的VCenter的清單中,然后開啟虛擬機,再通過腳本的方式配置IP地址、網(wǎng)關和DNS,然后進行應用驗證其是否正常,最后進行業(yè)務驗證。
(3)優(yōu)缺點分析
優(yōu)點是成本低,部署方便;缺點是恢復復雜,腳本套腳本,容易出錯,耗時長,RTO沒有保障。
4.1.2 通過SRM進行復制
交行卡中心虛擬機系統(tǒng)設計通過SRM進行VR復制,通過SRM進行調(diào)度恢復,在部署SRM服務器和vCenter、ESXi和VR版本實現(xiàn)兼容的前提下當遇到需要進行災備管理的情況時,故障主站點如果要實現(xiàn)切換到同城災備站點,只需要一個按鈕,就可以按事先的設置方案進行切換,無須人工和腳本干預,IP地址和DNS都會按事先的設置方案自動配置。
4.1.3 方案選擇
根據(jù)前期的調(diào)研和對比,我們使用SRM站點恢復管理軟件的方式來做虛擬機同城災備,因為需要災備的虛擬機有400多臺,后期可能因為系統(tǒng)的調(diào)整,需要做災備的虛擬機會越來越多,怎么在滿足監(jiān)管要求的同時,做到滿足業(yè)務的實際需求,做到操作便利都是需要進行考慮的問題。
4.2 網(wǎng)絡切換方案選擇
4.2.1 同城災備網(wǎng)絡切換
同城災備實施全網(wǎng)切換的時候需要考慮網(wǎng)絡層、存儲層以及主機系統(tǒng)層三個方面的切換。
網(wǎng)絡層:網(wǎng)絡層的主要作用是當生產(chǎn)中心網(wǎng)絡完全不可用的時候來實現(xiàn)所有分行的切換和連接。
存儲層:儲存層作為災備中心儲存數(shù)據(jù)的一層,當主機的存儲設備被控制或者同步數(shù)據(jù)復制鏈路被斷開后來進行自動切換。當同步數(shù)據(jù)復制鏈路恢復后,儲存層中更新的數(shù)據(jù)會自動復制回生產(chǎn)中心的存儲設備中。
主機系統(tǒng)層:同城災備系統(tǒng)使用的是DNS機制,因此,主機系統(tǒng)層的應用訪問可以平滑的在生產(chǎn)中心和同城災備中心間遷移,無須進行切換。
4.2.2 異地災備網(wǎng)絡切換
網(wǎng)絡層:當出現(xiàn)同城災備中心及生產(chǎn)中心網(wǎng)絡斷開而無法服務時,所有的網(wǎng)點切換、分行及外聯(lián)都由異地災備中心的網(wǎng)絡層進行連接。
存儲層:異地災備中心的主機持續(xù)進行遠程復制(CRR)災難恢復模式的時候,可對異地災備中心的存儲數(shù)據(jù)進行訪問。當停止對異地災備中心存儲的訪問的時候,再將全系統(tǒng)的同步數(shù)據(jù)復制關系進行重新恢復,來實現(xiàn)對更新的數(shù)據(jù)進行回切。等數(shù)據(jù)同步完成后通過對全系統(tǒng)的數(shù)據(jù)復制關系進行反轉,最后恢復到原生產(chǎn)模式。
主機系統(tǒng)層:異地災備的實現(xiàn)通過采用DNS訪問方案,對原有應用服務的訪問方式的IP地址進行修改實現(xiàn)。
4.2.3 DNS方案設計
本次DNS為硬件設備,DNS切換總體方案采用緩存遞歸和權威分離的架構,可以實現(xiàn)流量精細化的控制、區(qū)域之間的邊界安全策略、滿足客戶端和服務端快速查詢的需求以及分離DMZ區(qū)用于權威域名資產(chǎn)安全的管理。
本次部署的設備總計8臺,數(shù)據(jù)中心劃分為生產(chǎn)區(qū)、辦公區(qū)、測試區(qū)。每臺DNS設備生產(chǎn)端口均雙上聯(lián)交換,綁定模式為動態(tài)鏈路聚合,實現(xiàn)鏈路冗余。采用與負載均衡設備聯(lián)動方式進行部署,所有的DNS由SLB提供VS訪問入口,所有的服務端DNS主指向本區(qū)域SLB VS地址,備指向異地中心相同區(qū)域的SLB VS地址。
5 結束語
在災備方案設計當中會牽扯到各種各樣的虛擬化內(nèi)容,包括機房的建設、網(wǎng)絡方案的設計選擇、DNS方案的設計選擇、存儲方案的設計選擇等,這些內(nèi)容都需要虛擬化的災備和恢復方案。筆者在本次同城災備的研究之中從前期的準備到方案調(diào)研、IP地址的變換、使用DNS方式等過程都經(jīng)過了反復的論證最終得出適合交行卡中心的方案。在關于虛擬機災備方案的選擇之上,筆者以數(shù)據(jù)信息的復制與恢復、災備系統(tǒng)各模塊之間的關系、建立保護組等作為重點研究內(nèi)容,在確定好最終網(wǎng)絡方案后對其進一步做了實現(xiàn)。確保交行卡中心的虛擬機災備系統(tǒng)的建設能夠滿足監(jiān)管和實際業(yè)務的要求,當主機房發(fā)生故障時,可以快速切換到災備機房,為交行卡中心的同城災備系統(tǒng)的信息化、數(shù)字化、現(xiàn)代化建設,打下了良好的基礎。
參考文獻:
[1] 閆瑾,宮思明,姚丹,等.信息系統(tǒng)容災備份技術探討[J].信息與電腦(理論版),2020,32(12):46-48.
[2] 韓瑩利.數(shù)據(jù)同城災備系統(tǒng)的建設思考[J].數(shù)字技術與應用,2019,37(12):232,234.
【通聯(lián)編輯:代影】