方銳 姚振 郭洋 吳躍
“十三五”以來(lái),隨著國(guó)網(wǎng)公司信息化進(jìn)程的不斷深入,在國(guó)家電網(wǎng)公司十三五發(fā)展戰(zhàn)略綱要中明確指出,到2020年建成國(guó)家電網(wǎng)企業(yè)資源計(jì)劃系統(tǒng)3.0(SGERP3.0),實(shí)現(xiàn)業(yè)務(wù)活動(dòng)動(dòng)態(tài)監(jiān)控與分析優(yōu)化、核心資產(chǎn)集中管理和在線監(jiān)控;進(jìn)一步替身信息存儲(chǔ)、傳輸、集成、共享水平。伴隨國(guó)網(wǎng)業(yè)務(wù)流程的運(yùn)轉(zhuǎn)越來(lái)越高度依賴于數(shù)據(jù),而數(shù)據(jù)的丟失必然會(huì)導(dǎo)致企業(yè)正常業(yè)務(wù)運(yùn)作中斷,僅僅是依靠傳統(tǒng)的災(zāi)難備份/恢復(fù)已經(jīng)滿足不了業(yè)務(wù)的需求,因此如何確保數(shù)據(jù)庫(kù)數(shù)據(jù)的快速可恢復(fù)性,顯得十分重要。
國(guó)網(wǎng)業(yè)務(wù)流程的運(yùn)轉(zhuǎn)越來(lái)越高度依賴于數(shù)據(jù),使得數(shù)據(jù)成為了支撐企業(yè)運(yùn)作的基石。而數(shù)據(jù)的丟失必然會(huì)導(dǎo)致企業(yè)正常業(yè)務(wù)運(yùn)作中斷,帶來(lái)巨大的經(jīng)濟(jì)損失、聲譽(yù)損失、以及客戶忠誠(chéng)度下降等各種損失。為了保證企業(yè)24*7連續(xù)運(yùn)營(yíng),對(duì)企業(yè)的IT建設(shè)提出了新的挑戰(zhàn),僅僅是依靠傳統(tǒng)的災(zāi)難備份/恢復(fù)已經(jīng)滿足不了業(yè)務(wù)的需求。因此,如何集中保護(hù)數(shù)據(jù)庫(kù)、確保數(shù)據(jù)庫(kù)可恢復(fù)性,顯得尤為重要。
隨著國(guó)網(wǎng)信息化進(jìn)程的不斷深入,數(shù)據(jù)已成為非常重要的資產(chǎn),如何確保數(shù)據(jù)庫(kù)數(shù)據(jù)準(zhǔn)確、可快速恢復(fù),顯得非常重要。
敏捷數(shù)據(jù)庫(kù)仿真平臺(tái)是一套集合了True-CDP備份,歷史數(shù)據(jù)秒級(jí)恢復(fù),災(zāi)備保護(hù)等功能的一體化云平臺(tái)。支持主流的Oracle、MySQL、MariaDB、SQLServer數(shù)據(jù)庫(kù),可同時(shí)對(duì)大量數(shù)據(jù)庫(kù)做集中式備份和管理,并對(duì)備份進(jìn)行持續(xù)校驗(yàn)以確保數(shù)據(jù)的可恢復(fù)性。此外,還可用于應(yīng)用測(cè)試、預(yù)發(fā)布、性能優(yōu)化,POC等諸多應(yīng)用場(chǎng)景。
敏捷數(shù)據(jù)庫(kù)仿真平臺(tái)的設(shè)計(jì)從以下幾個(gè)方面,提供更加便捷、可視化的管理。
軟件定義備份,智能管理工具:區(qū)別于傳統(tǒng)手工備份,原來(lái)DBA需要手設(shè)置備份策略,管理備份集。敏捷數(shù)據(jù)庫(kù)仿真平臺(tái)采用軟件定義備份,通過(guò)軟件整合底層物理資源,在高可用、高性能的物理平臺(tái)上,提供靈活的備份管理接口,一鍵式備份恢復(fù)管理,智能的備份策略。
化繁為簡(jiǎn),統(tǒng)一管理:對(duì)數(shù)據(jù)庫(kù)的備份,需要考慮的因素較多,很多企業(yè)內(nèi)部少則幾十套數(shù)據(jù)庫(kù),備份工作非常繁瑣而且工作量大。敏捷數(shù)據(jù)庫(kù)仿真平臺(tái),通過(guò)靈活的備份策略實(shí)現(xiàn)數(shù)據(jù)庫(kù)的自動(dòng)備份和集中管理,簡(jiǎn)化了備份的操作,降低了備份的管理成本。
資源虛擬化,資源分配靈活:通過(guò)虛擬化平臺(tái),實(shí)現(xiàn)物理資源的靈活分配和安全隔離。如果有新的備份需求,不需要單獨(dú)申請(qǐng)物理機(jī)資源,直接通過(guò)管理界面申請(qǐng)需要的資源,即可實(shí)現(xiàn)對(duì)現(xiàn)有數(shù)據(jù)庫(kù)的備份恢復(fù)。
備份可用性保證,實(shí)時(shí)驗(yàn)證:如何確保備份的物理文件在關(guān)鍵時(shí)刻能夠恢復(fù)可用。敏捷數(shù)據(jù)庫(kù)仿真平臺(tái)備份恢復(fù)方案,通過(guò)構(gòu)建“活”的備份,實(shí)現(xiàn)備份數(shù)據(jù)的實(shí)時(shí)驗(yàn)證,確保備份數(shù)據(jù)的可用性。
數(shù)據(jù)可追回,歷史狀態(tài)快速回溯:數(shù)據(jù)丟失或者誤刪除在眾多企業(yè)中屢見不鮮,如何找回丟失數(shù)據(jù)。敏捷數(shù)據(jù)庫(kù)仿真平臺(tái)可實(shí)現(xiàn)歷史數(shù)據(jù)的快速找回,通過(guò)存儲(chǔ)級(jí)別快照和日志應(yīng)用的方式可以實(shí)現(xiàn)精確到秒級(jí)的歷史時(shí)間點(diǎn)恢復(fù)。
如圖1所示,使用數(shù)據(jù)庫(kù)日志的增量傳輸來(lái)實(shí)現(xiàn)數(shù)據(jù)庫(kù)的持續(xù)備份。日志的傳輸通Oracle DataGurad/Mysql Replication方式進(jìn)行重做日志的實(shí)時(shí)傳輸,在保證主庫(kù)性能的情況下,盡量實(shí)現(xiàn)日志的實(shí)時(shí)傳輸。
如圖2所示,備份使用zfs文件系統(tǒng),對(duì)備份的數(shù)據(jù)進(jìn)行文件系統(tǒng)級(jí)別的快照備份,采用 ROW(redirect over write)技術(shù),實(shí)現(xiàn)數(shù)據(jù)的增量保存和快照功能。ROW方式的快照,沒有寫放大,對(duì)數(shù)據(jù)寫入性能沒有影響,支持大量快照并存,基于切片的快照,快照顆粒度小,空間占用小。
如圖3所示,采用KVM主機(jī)虛擬化技術(shù),對(duì)一套硬件資源進(jìn)行統(tǒng)一的管理,為虛擬機(jī)分配內(nèi)存和存儲(chǔ)資源,每一臺(tái)虛擬機(jī)用于一套數(shù)據(jù)庫(kù)的備份,實(shí)現(xiàn)資源的隔離和安全保護(hù)。
如圖4所示,備份節(jié)點(diǎn)自身通過(guò)Raid5做磁盤保護(hù),任意壞一塊盤,不影響備份可用性。如果對(duì)備份有更高的安全要求,可以采用敏捷數(shù)據(jù)庫(kù)仿真平臺(tái),通過(guò)zfs Raid Z保證數(shù)據(jù)的可靠性,任意一臺(tái)備份節(jié)點(diǎn)意外退出,不影響備份的可用性。
充分考慮備份和恢復(fù)的操作實(shí)用性,結(jié)合多名數(shù)據(jù)庫(kù)專家的運(yùn)維經(jīng)驗(yàn),自主研發(fā)的監(jiān)控管理平臺(tái),可進(jìn)行自動(dòng)化備份策略管理,降低了備份的難度,減輕了運(yùn)維人員的工作量,加強(qiáng)了對(duì)備份的管理和安全可控性,如圖5所示。
一是對(duì)數(shù)據(jù)庫(kù)進(jìn)行備份,保障數(shù)據(jù)的安全。解決現(xiàn)有備份方式對(duì)大數(shù)據(jù)量數(shù)據(jù)庫(kù)備份恢復(fù)風(fēng)險(xiǎn)大的問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)庫(kù)的實(shí)時(shí)備份。
二是備份環(huán)境可實(shí)現(xiàn)歷史回溯,臨時(shí)庫(kù)拉起操作,用于測(cè)試或者臨時(shí)庫(kù)創(chuàng)建。
三是采用X86化的解決方案,可大幅度降低硬件設(shè)備投入,同時(shí)可以實(shí)現(xiàn)分布式架構(gòu),在容量不足時(shí)可在線橫向擴(kuò)展。
四是備份在生產(chǎn)庫(kù)意外宕機(jī)時(shí),可臨時(shí)拉起承載業(yè)務(wù),縮短業(yè)務(wù)停機(jī)時(shí)間,減少經(jīng)濟(jì)損失。
五是通過(guò)統(tǒng)一的可視化管理界面,讓運(yùn)維變的更輕松,智能化運(yùn)維可以有效的減少運(yùn)維人員的投入。
通過(guò)敏捷數(shù)據(jù)庫(kù)仿真平臺(tái)的建設(shè),提高工作效率,減輕信息維護(hù)人員負(fù)擔(dān),為全力支撐公司建設(shè)“三型兩網(wǎng)”世界一流能源互聯(lián)網(wǎng)企業(yè)提供了必要的技術(shù)支撐。
通過(guò)敏捷數(shù)據(jù)庫(kù)仿真平臺(tái)的建設(shè),尋求新的技術(shù)解決方案,支撐經(jīng)營(yíng)策略、財(cái)務(wù)運(yùn)行機(jī)制和集團(tuán)管控模式優(yōu)化。通過(guò)優(yōu)化標(biāo)準(zhǔn)、創(chuàng)新技術(shù),支撐新型卓越資金管理體系、電費(fèi)結(jié)算、全面預(yù)算管理、資產(chǎn)全壽命周期管理、工程全過(guò)程、全面風(fēng)險(xiǎn)管理等財(cái)務(wù)業(yè)務(wù)管理優(yōu)化。隨業(yè)務(wù)發(fā)展,持續(xù)支撐多維精益管理體系變革,以一流的財(cái)務(wù)管理和經(jīng)營(yíng)業(yè)績(jī),保障國(guó)網(wǎng)三型兩網(wǎng)發(fā)展新戰(zhàn)略的全面實(shí)施。
作者單位:國(guó)網(wǎng)安徽省電力有限公司信息通信分公司