胡穎亮
(國家稅務(wù)總局寧夏回族自治區(qū)稅務(wù)局信息中心 寧夏回族自治區(qū)銀川市 750200)
近年來,隨著以大數(shù)據(jù)、云計算為代表的新一代信息技術(shù)產(chǎn)業(yè)蓬勃發(fā)展,人類社會生產(chǎn)生活已然邁入了“互聯(lián)網(wǎng)”和“大數(shù)據(jù)”時代,數(shù)據(jù)安全已成為事關(guān)國家安全和經(jīng)濟社會發(fā)展的重要考量?!吨腥A人民共和國數(shù)據(jù)安全法》已于2021年9月1日起開始正式實施,這是我國第一部關(guān)于數(shù)據(jù)安全領(lǐng)域的基礎(chǔ)性法律,對各行業(yè)數(shù)據(jù)安全保護提出了更高的要求。作為稅務(wù)行業(yè),自國地稅征管體制改革以來,隨著社保費及非稅收入征管職能的劃轉(zhuǎn),稅費征管方式逐步從“線下”移至“線上”,稅務(wù)信息系統(tǒng)存儲的大量稅費信息數(shù)據(jù)也從“幕后”走向了“臺前”,這就對數(shù)據(jù)安全防護提出了更高的要求和挑戰(zhàn)。稅務(wù)行業(yè)各類信息系統(tǒng)存儲大量納稅人和繳費人稅費數(shù)據(jù),數(shù)據(jù)價值較高,在發(fā)生數(shù)據(jù)丟失的情況下,可以有效利用數(shù)據(jù)備份進行恢復(fù),對守好數(shù)據(jù)存儲安全的最后一道防線起到至關(guān)重要的作用。
數(shù)據(jù)備份及恢復(fù)系統(tǒng)的建設(shè),需要結(jié)合自身系統(tǒng)部署的實際情況和特點進行綜合考量,梳理出數(shù)據(jù)備份及恢復(fù)系統(tǒng)建設(shè)具體需求,針對系統(tǒng)建設(shè)中的重點和難點部分進行分析,為最終建設(shè)方案的制定,以及備份恢復(fù)軟硬件的選擇提供支撐。
具體可重點對以下幾個部分進行分析研究:
對目前運行的各類信息系統(tǒng)進行梳理統(tǒng)計,摸清系統(tǒng)類型、系統(tǒng)規(guī)模、部署方式、服務(wù)群體等信息,為最終確認系統(tǒng)是否需要備份,以及選擇什么樣的備份產(chǎn)品和策略提供參考。重點要對數(shù)據(jù)進行分類分級,對需要進行數(shù)據(jù)備份的應(yīng)用系統(tǒng)數(shù)據(jù)存儲的方式進行分析,確認各系統(tǒng)數(shù)據(jù)的重要級別。數(shù)據(jù)分類分級需重點對數(shù)據(jù)的生產(chǎn)方式、應(yīng)用場景、產(chǎn)生頻率、結(jié)構(gòu)化特征、存儲方式等內(nèi)容進行綜合評價,按照《中華人民共和國數(shù)據(jù)安全法》要求,將數(shù)據(jù)從低到高分成一般數(shù)據(jù)、重要數(shù)據(jù)、核心數(shù)據(jù)三個級別,不同級別的數(shù)據(jù)采用不同的備份方式和策略。如表1所示。
表1:數(shù)據(jù)安全基本分級規(guī)則及備份策略建議
(1)數(shù)據(jù)庫備份。數(shù)據(jù)庫中的數(shù)據(jù)往往是重要等級最高的,數(shù)據(jù)庫備份場景是整個備份恢復(fù)系統(tǒng)建設(shè)中最重要的一個部分。數(shù)據(jù)庫備份通常分為完全備份(Full Backup)、差異備份(Differential Backup)、增量備份(Incremental Backup)三種類型。當(dāng)然理想情況下,我們通常需要完全備份就夠了。但是實際情況而言,應(yīng)用系統(tǒng)無法做到固定的時間頻率停機來為數(shù)據(jù)備份提供窗口,也就是冷備份(cold backup)的條件通常無法滿足,只能進行熱備份(聯(lián)機備份)場景設(shè)計。因此,我們需要將完全備份、差異備份、增量備份結(jié)合起來使用,例如,以我們可以在周一進行一次全量備份,周二至周四進行差異或增量備份,再在周五進行一次全量備份,以此類推,達到熱備份(聯(lián)機備份)場景需要。
(2)虛擬化平臺備份。虛擬化技術(shù)的應(yīng)用,使得信息化發(fā)展進入了快車道,基礎(chǔ)設(shè)施建設(shè)和資源管理能力都得到了空前的提升。但是,虛擬化技術(shù)的發(fā)展帶來了一個最大的問題就是虛擬服務(wù)器的持續(xù)擴張,而持續(xù)增長的虛擬服務(wù)器體量為數(shù)據(jù)備份帶來了挑戰(zhàn)。提到虛擬化首先就會想到大名鼎鼎的VMware,虛擬化備份技術(shù)也是最早由VMware 提供和發(fā)起的,目前基于VMware 的備份恢復(fù)技術(shù),不管是Networker、NBU、CV 等主流備份軟件,還是像Avamar、Veeam 這種軟硬件結(jié)合的產(chǎn)品,都是通過部署Proxy(代理服務(wù))對接VMware 來實現(xiàn)備份和恢復(fù)的。如圖1所示。
圖1:基于VMware 虛擬化平臺備份原理
(3)文件系統(tǒng)備份。文件系統(tǒng)備份是指將存儲在本地或者異地操作系統(tǒng)(Linux 或windows)上的文件,通過復(fù)制等手段,存儲在其他存儲設(shè)備的過程。文件系統(tǒng)的備份是最基本,也是最方便、快捷的備份方式,例如人們會選擇將自己電腦上重要的文件復(fù)制一份到自己的U 盤上,這就是文件系統(tǒng)備份的典型案例。但是由于現(xiàn)在恢復(fù)的目標總是要在短時間內(nèi)恢復(fù)整個系統(tǒng)的可用性,不僅是要恢復(fù)數(shù)據(jù)文件,還要能使用這些數(shù)據(jù)文件,單純數(shù)據(jù)文件的恢復(fù)往往無法實現(xiàn)整個系統(tǒng)可用性的快速恢復(fù),因此目前文件系統(tǒng)備份常用作其他恢復(fù)場景的補充。但是,在一些特殊場景,文件系統(tǒng)備份尤為重要,比如:電子公文系統(tǒng)中的文本文件、電子檔案系統(tǒng)中的檔案文件、語音服務(wù)系統(tǒng)中的語音片段等場景,往往需要特別關(guān)注這類系統(tǒng)的文件備份。
數(shù)據(jù)備份的最終目的是為了恢復(fù),數(shù)據(jù)恢復(fù)是備份工作中最有價值的一部分。通常備份數(shù)據(jù)不會被經(jīng)常訪問,而一旦發(fā)生數(shù)據(jù)丟失、系統(tǒng)宕機或其他系統(tǒng)災(zāi)難性事件后,是否可以使用備份進行數(shù)據(jù)恢復(fù)變得至關(guān)重要。因此,在建設(shè)備份恢復(fù)系統(tǒng)的過程中,不能只關(guān)注數(shù)據(jù)備份指標,更應(yīng)重點關(guān)注數(shù)據(jù)恢復(fù)能力。
(1)數(shù)據(jù)的有效性。備份數(shù)據(jù)的有效性是備份恢復(fù)的基礎(chǔ)。通常情況下,我們每天都會進行數(shù)據(jù)備份,但是備份的數(shù)據(jù)是否有效就不得而知了。因此,定期進行數(shù)據(jù)的有效性校驗,就顯得十分重要。備份數(shù)據(jù)的有效性校驗沒有什么捷徑可走,就是要通過定期的恢復(fù)測試來實現(xiàn),定期的測試不僅可以測試數(shù)據(jù)的有效性,還能有效提升應(yīng)急處置能力,是數(shù)據(jù)安全管理中的重要一環(huán)。
(2)數(shù)據(jù)恢復(fù)效率。數(shù)據(jù)恢復(fù)效率是衡量備份系統(tǒng)恢復(fù)能力的一個最重要的指標,怎樣能在更短時間內(nèi)恢復(fù)更多的數(shù)據(jù)量,一直以來都是數(shù)據(jù)備份恢復(fù)系統(tǒng)的價值所在,也是備份技術(shù)發(fā)展的重點和難題。影響數(shù)據(jù)恢復(fù)效率的主要因素有:數(shù)據(jù)量、數(shù)據(jù)類型、系統(tǒng)架構(gòu)、硬件設(shè)備和網(wǎng)絡(luò)環(huán)境、備份恢復(fù)軟件、消重技術(shù)、備份參數(shù)及策略等。首先,排除數(shù)據(jù)量和數(shù)據(jù)類型影響因素,影響到數(shù)據(jù)恢復(fù)效率最重要的因素就是硬件設(shè)備和網(wǎng)絡(luò)環(huán)境,更高級的硬件設(shè)備、更快的網(wǎng)絡(luò)環(huán)境則備份恢復(fù)就越快。其次,在硬件設(shè)備和網(wǎng)絡(luò)環(huán)境、備份恢復(fù)軟件、系統(tǒng)架構(gòu)等相對固定,很難進行升級擴容的情況下,需要更多考慮對備份軟件參數(shù)及策略、數(shù)據(jù)庫參數(shù)、虛擬化平臺配置等方面進行優(yōu)化調(diào)整,通過不斷的恢復(fù)測試,找到恢復(fù)效率最大化的優(yōu)化方案,從而提高數(shù)據(jù)恢復(fù)效率。
(3)人員配置和技術(shù)能力。人員配置和技術(shù)能力也是衡量備份恢復(fù)能力的一個關(guān)鍵因素。備份恢復(fù)系統(tǒng)的運行維護人員和其他系統(tǒng)有很大區(qū)別,一名優(yōu)秀的備份工程師不僅需要精通數(shù)據(jù)備份恢復(fù)技術(shù),還需熟練掌握操作系統(tǒng)、云平臺、虛擬化、數(shù)據(jù)庫、計算存儲設(shè)備、網(wǎng)絡(luò)等眾多技術(shù)知識。因此,為保證備份系統(tǒng)可以持續(xù)提供數(shù)據(jù)安全保障,建議有條件的單位部門可以考慮購買專業(yè)的備份運維服務(wù)來提高人員配置和技術(shù)能力,從而提高備份恢復(fù)能力。
“金稅三期工程”是國家級信息系統(tǒng)工程,是國家電子政務(wù)“十二金”工程之一。稅務(wù)系統(tǒng)各類應(yīng)用收集、存儲、加工大量稅費數(shù)據(jù),無論從數(shù)據(jù)的重要級別,還是數(shù)據(jù)體量、類型等方面,在政府行業(yè)中的規(guī)模都處于前列。因此,深入研究數(shù)據(jù)備份及恢復(fù)技術(shù)在稅務(wù)系統(tǒng)的應(yīng)用情況,對各地稅務(wù)系統(tǒng)及其他行業(yè)數(shù)據(jù)備份系統(tǒng)建設(shè)有著很高的參考價值。下面,以國家稅務(wù)總局寧夏區(qū)稅務(wù)局數(shù)據(jù)備份及恢復(fù)系統(tǒng)部署為例,從系統(tǒng)概述、部署架構(gòu)、重復(fù)數(shù)據(jù)消除技術(shù)、異地備份、備份管理等方面具體介紹。
近年來,稅務(wù)系統(tǒng)各類數(shù)據(jù)資源的持續(xù)增長對數(shù)據(jù)資產(chǎn)保護提出了更高的要求,在物理、虛擬化和云計算背景下的數(shù)據(jù)保護是長期困擾各級稅務(wù)系統(tǒng)的痛點和難點。寧夏稅務(wù)局數(shù)據(jù)備份及恢復(fù)系統(tǒng)自2016年開始建設(shè),先后進行了2次較大規(guī)模擴容升級,歷經(jīng)5年多時間完成建設(shè),并探索形成了一套符合本地化實際的數(shù)據(jù)備份恢復(fù)管理體系。目前,寧夏稅務(wù)局數(shù)據(jù)中心共部署運行各類信息系統(tǒng)70 余個,相較2016年,數(shù)據(jù)量已增長了3 倍以上。從計算存儲硬件資源來看,共有PC 服務(wù)器設(shè)備500 余臺,小型機12 臺,存儲設(shè)備45 臺;從虛擬化平臺資源來看,共部署虛擬化平臺7 個,虛擬主機近1000 余臺,虛擬化存儲容量共509.18(TB),已分配使用387.05(TB),使用率76.0%;從系統(tǒng)軟件來看,共部署各類操作系統(tǒng)1500 余套,數(shù)據(jù)庫系統(tǒng)232 套(其中Oracle 數(shù)據(jù)庫177 個,占比76.3%),中間件軟件391 套。
寧夏稅務(wù)局備份恢復(fù)系統(tǒng)基于EMC Networker 軟件和EMC Data Domain 備份設(shè)備部署構(gòu)建,通過本地化深度集成,大幅提高了備份恢復(fù)效率,加速了備份恢復(fù)模式轉(zhuǎn)型,實現(xiàn)了數(shù)據(jù)備份恢復(fù)系統(tǒng)四個“全覆蓋”。一是實現(xiàn)業(yè)務(wù)網(wǎng)絡(luò)區(qū)域“全覆蓋”。在業(yè)務(wù)專網(wǎng)、互聯(lián)網(wǎng)、外聯(lián)網(wǎng)、異地網(wǎng)絡(luò)分別放置備份設(shè)備,實現(xiàn)備份恢復(fù)能力在所有網(wǎng)絡(luò)區(qū)域安全可達。二是實現(xiàn)系統(tǒng)備份需求場景“全覆蓋”。對稅務(wù)系統(tǒng)涉及的所有30 多套Oracle RAC 核心數(shù)據(jù)庫、1000 余臺虛擬機、20 余套文件系統(tǒng)等備份場景需求全部納入備份任務(wù)。三是實現(xiàn)備份恢復(fù)系統(tǒng)管理“全覆蓋”。通過部署一套備份恢復(fù)軟件,實現(xiàn)所有網(wǎng)絡(luò)區(qū)域、備份設(shè)備、備份策略、備份恢復(fù)等功能統(tǒng)一進行管理。四是實現(xiàn)備份數(shù)據(jù)恢復(fù)測試驗證“全覆蓋”。定期對數(shù)據(jù)庫、虛擬化平臺、文件系統(tǒng)進行全量數(shù)據(jù)恢復(fù)測試驗證。
寧夏稅務(wù)局備份恢復(fù)系統(tǒng)共部署EMC Data Domain 備份設(shè)備6 臺,其中EMC DD2500 中端備份設(shè)備3 臺、EMC DD6300 高端備份設(shè)備3 臺,分別部署于業(yè)務(wù)專網(wǎng)、互聯(lián)網(wǎng)、外聯(lián)網(wǎng)、異地(中衛(wèi))四個區(qū)域。部署一臺聯(lián)想System x3850 X6 物理服務(wù)器作為備份恢復(fù)系統(tǒng)集中管理主機,部署備份代理服務(wù)器17 臺,通過一套EMC NetWorker 備份管理軟件,對所有備份設(shè)備及備份策略進行統(tǒng)一管理,并與異地(中衛(wèi))備份設(shè)備實現(xiàn)底層數(shù)據(jù)復(fù)制,將備份數(shù)據(jù)傳送至異地(中衛(wèi))存儲。EMC Networker 利用的是一種客戶-服務(wù)器體系結(jié)構(gòu),由Client 、Storage Nodes 和Server 三個功能組件組成,通過LAN、WAN 或者SAN 網(wǎng)絡(luò),客戶端數(shù)據(jù)完全可以被備份到任何的Storage Nodes 或者服務(wù)器上。正是利用了這種體系結(jié)構(gòu),Networker 可為復(fù)雜程度最高的網(wǎng)絡(luò)中的數(shù)據(jù)保護和管理提供充分的能力和優(yōu)良的性能,同時還在大型數(shù)據(jù)中心或者遠程分支辦事處的環(huán)境配置方面提供著靈活的服務(wù)。如圖2所示。
圖2:寧夏稅務(wù)局備份系統(tǒng)部署架構(gòu)
重復(fù)數(shù)據(jù)消除技術(shù)是一種數(shù)據(jù)壓縮技術(shù),通過數(shù)據(jù)壓縮來減少數(shù)據(jù)存儲容量。在數(shù)據(jù)保護需求日益凸顯的今天,面對指數(shù)級的數(shù)據(jù)增長,以及不斷縮小的備份時間窗口,重復(fù)數(shù)據(jù)消除技術(shù)作為數(shù)據(jù)保護的關(guān)鍵技術(shù),為整個備份恢復(fù)系統(tǒng)帶來至關(guān)重要的優(yōu)勢。寧夏稅務(wù)備份恢復(fù)系統(tǒng)借助EMC NetWorker 和Data Domain Boost,形成了一個完整的軟、硬件結(jié)合的重復(fù)數(shù)據(jù)消除解決方案。
(1)更大的數(shù)據(jù)備份空間。在日常的數(shù)據(jù)備份過程中,往往備份的數(shù)據(jù)中存在大量的冗余數(shù)據(jù),尤其在數(shù)據(jù)庫、虛擬機、文件系統(tǒng)等場景下的全量備份。而通過重復(fù)數(shù)據(jù)消除技術(shù),可以實現(xiàn)在備份之前對已備份的數(shù)據(jù)進行校驗,在備份時只存儲差異部分的數(shù)據(jù)塊,這種備份方式可以保證唯一的數(shù)據(jù)塊只保留一份,從而有效降低了數(shù)據(jù)存儲容量,提高了數(shù)據(jù)備份空間。尤其以磁盤為介質(zhì)的備份設(shè)備具有很高的重復(fù)數(shù)據(jù)消除效率,如果備份頻率比較高,那么每次備份通常會節(jié)省95%以上的磁盤空間。
(2)更高的數(shù)據(jù)備份恢復(fù)水平。數(shù)據(jù)備份恢復(fù)時,無論是從本地還是異地執(zhí)行恢復(fù),都需要讀取大量的數(shù)據(jù)。隨著數(shù)據(jù)量的不斷增長,數(shù)據(jù)傳輸壓力也越來越大,通過重復(fù)數(shù)據(jù)消除技術(shù)可以在數(shù)據(jù)傳輸前檢測并有效刪除壓縮重復(fù)數(shù)據(jù),可以有效減少傳輸?shù)臄?shù)據(jù)量,提高數(shù)據(jù)傳輸速度,提供更高的數(shù)據(jù)備份和恢復(fù)水平。
(3)更好的數(shù)據(jù)持續(xù)驗證。更大的備份存儲空間和更高的備份恢復(fù)水平為數(shù)據(jù)恢復(fù)驗證提供了可能。如果沒有重復(fù)數(shù)據(jù)消除技術(shù),備份的數(shù)據(jù)量將是無法想象的,海量數(shù)據(jù)進行數(shù)據(jù)恢復(fù)驗證將非常困難,需要消耗占用大量資源,往往是無法承受的,數(shù)據(jù)恢復(fù)驗證工作將不再具有可行性。而重復(fù)數(shù)據(jù)消除技術(shù)的出現(xiàn),為常態(tài)化進行數(shù)據(jù)持續(xù)驗證提供了可能,在進行恢復(fù)時可以有效進行重復(fù)數(shù)據(jù)校驗,大大縮短恢復(fù)時間和減少磁盤開銷。
異地備份作為本地備份的有效補充,有效降低數(shù)據(jù)集中存放帶來的單節(jié)點風(fēng)險,當(dāng)本地數(shù)據(jù)中心發(fā)生自然災(zāi)害等極端情況時,可以利用異地災(zāi)備系統(tǒng)進行數(shù)據(jù)和業(yè)務(wù)恢復(fù),因此,目前越來越多的重要系統(tǒng)場景需同時建立異地災(zāi)備中心。寧夏稅務(wù)局在異地(距離銀川約200 公里)中衛(wèi)市稅務(wù)局數(shù)據(jù)中心機房放置了一臺EMC DD2500 備份設(shè)備,通過電信專線,點對點將本地備份的數(shù)據(jù)通過克隆技術(shù)復(fù)制傳輸至異地存放,從而實現(xiàn)異地災(zāi)備場景需求。
備份恢復(fù)系統(tǒng)架構(gòu)復(fù)雜性高,往往涉及備份存儲設(shè)備、網(wǎng)絡(luò)、服務(wù)器、虛擬化、數(shù)據(jù)庫、操作系統(tǒng)等重多環(huán)節(jié),系統(tǒng)內(nèi)耦合程度高且解耦較為困難,因此備份恢復(fù)系統(tǒng)故障率較高,尤其體現(xiàn)在軟件故障。當(dāng)軟件故障無法徹底消除時,需要建立較為完善的備份管理機制盡早發(fā)現(xiàn)并進行處置。一是建立日常巡檢機制。備份任務(wù)往往是每日都會進行,則需建立常態(tài)化系統(tǒng)巡檢機制,定期對系統(tǒng)進行巡檢,確??梢栽绨l(fā)現(xiàn)問題。二是加強故障處置。用戶往往都會期望備份的成功率越高越好,需要在每次備份失敗時進行補充備份,這就需要盡快的處置各類系統(tǒng)故障,確保備份成功率達到期望值。
近年來,隨著大數(shù)據(jù)、云計算、超融合等技術(shù)的全面應(yīng)用,核心業(yè)務(wù)的數(shù)據(jù)集中存儲模式(DAS、NAS、SAN)已不能適應(yīng)目前數(shù)據(jù)存儲需要,分布式存儲越來越多應(yīng)用于各行業(yè)核心業(yè)務(wù)。分布式存儲通過網(wǎng)絡(luò)將數(shù)據(jù)分別存儲于部署在相同或不同區(qū)域的每臺機器上的磁盤,并將這些分散存儲的數(shù)據(jù)資源構(gòu)成一個虛擬的存儲空間。分布式存儲擁有超規(guī)模的數(shù)據(jù)處置能力,無論在擴展性、高可用性、可靠性等方面,還是在使用建設(shè)成本上都具有明顯優(yōu)勢。目前,在云計算領(lǐng)域分布式存儲已逐漸取代集中式存儲成為首要選擇。
數(shù)據(jù)存儲技術(shù)的改變,為未來數(shù)據(jù)備份及恢復(fù)提出了新的課題。下一代數(shù)據(jù)存儲技術(shù)主要在存儲介質(zhì)、存儲架構(gòu)、存儲協(xié)議、應(yīng)用模式及運維模式等方面迭代創(chuàng)新的一系列技術(shù)合集,總體呈現(xiàn)出高性能、易擴展、服務(wù)化和智能化等特點。如表2所示。
表2:下一代數(shù)據(jù)存儲技術(shù)革新方向
隨著集中式存儲向分布式云存儲的轉(zhuǎn)變,為數(shù)據(jù)備份方式提供了新的形式,通過將數(shù)據(jù)分布存儲在本地或是云上,可以突破地域和設(shè)備的限制。分布式云存儲的優(yōu)勢主要有:一是備份場景多樣,集中管控,實現(xiàn)多臺云主機集中管控。相較集中存儲,有效降低了運維難度和管理成本。二是簡單易用,易于擴展??梢詫浞輸?shù)據(jù)多副本存儲在不同主機,無需擔(dān)心硬件配置、集群擴展等問題。三是經(jīng)濟效益高,往往云平臺軟件自帶備份恢復(fù)機制,無需單獨投入建設(shè)獨立的備份系統(tǒng)。四是高重刪壓縮比,備份服務(wù)采用重刪、壓縮技術(shù),可有效降低數(shù)據(jù)存儲空間,減少資金投入。
守土有責(zé)、守土盡責(zé),數(shù)據(jù)備份和恢復(fù)系統(tǒng)是數(shù)據(jù)安全保護的最后一道防線。本文結(jié)合數(shù)據(jù)備份恢復(fù)技術(shù)在寧夏稅務(wù)系統(tǒng)的應(yīng)用情況,從數(shù)據(jù)備份及恢復(fù)系統(tǒng)需求入手,深入分析研究了數(shù)據(jù)備份及恢復(fù)技術(shù)在省級稅務(wù)數(shù)據(jù)中心的應(yīng)用,并對數(shù)據(jù)備份技術(shù)的發(fā)展趨勢進行了初步探究,旨在為稅務(wù)系統(tǒng)及其他行業(yè)數(shù)據(jù)備份系統(tǒng)建設(shè)提供參考。