(三峽人壽保險(xiǎn)股份有限公司,重慶 401121)
數(shù)據(jù)是任何商業(yè)生命的根源,也是企業(yè)生存與發(fā)展的重要資源。隨著社會(huì)的快速發(fā)展,傳統(tǒng)數(shù)據(jù)庫(kù)運(yùn)維管理負(fù)載居高不下,以救火式運(yùn)維為主,一旦發(fā)生故障容易導(dǎo)致數(shù)據(jù)丟失或損壞將給企業(yè)造成嚴(yán)重的損失[1]。為此,有必要對(duì)數(shù)據(jù)庫(kù)運(yùn)維體系進(jìn)行改進(jìn)與優(yōu)化。本文以壽險(xiǎn)公司所使用的Oracle數(shù)據(jù)庫(kù)運(yùn)維監(jiān)控體系為例,論述了新時(shí)期數(shù)據(jù)庫(kù)運(yùn)維管理系統(tǒng)的構(gòu)建策略。
數(shù)據(jù)庫(kù)監(jiān)控分為實(shí)例監(jiān)控、schema監(jiān)控、告警三部分。實(shí)例監(jiān)控主要是針對(duì)參數(shù)、組件(redo、undo、control file)、表空間、會(huì)話、TOP SQL、阻塞、日志等對(duì)象。Schema監(jiān)控主要是對(duì)權(quán)限、對(duì)象進(jìn)行監(jiān)控,對(duì)象主要是指索引、分區(qū)表、大字段。通過(guò)對(duì)數(shù)據(jù)庫(kù)監(jiān)控采集的數(shù)據(jù)進(jìn)行匯總分析,可輸出性能、容量趨勢(shì)報(bào)告。
通過(guò)備份一體機(jī)實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)信息的備份管理。備份一體機(jī)具有數(shù)據(jù)零丟失、數(shù)據(jù)備份高安全性、不對(duì)生產(chǎn)系統(tǒng)有影響、支持任意時(shí)間點(diǎn)的數(shù)據(jù)恢復(fù)、提供數(shù)據(jù)云級(jí)保護(hù)等優(yōu)點(diǎn)。通過(guò)對(duì)重做日志進(jìn)行備份實(shí)現(xiàn)公司日常數(shù)據(jù)保護(hù),可讓數(shù)據(jù)庫(kù)得到秒級(jí)保護(hù)。在重做日志數(shù)據(jù)備份過(guò)程中每次只獲取增量數(shù)據(jù)即可。針對(duì)壽險(xiǎn)公司需要24×7的數(shù)據(jù)保護(hù)需求,數(shù)據(jù)庫(kù)備份一體機(jī)主要針對(duì)源生產(chǎn)數(shù)據(jù)庫(kù)的保護(hù),只需一次全備份,后續(xù)只需同步歸檔日志與REDO日志增量,從而明顯降低了備份對(duì)生產(chǎn)系統(tǒng)的影響。備份一體機(jī)可識(shí)別內(nèi)部Oracle數(shù)據(jù)庫(kù)塊格式,因而可支持深度數(shù)據(jù)驗(yàn)證。當(dāng)備份數(shù)據(jù)與重做塊被發(fā)送到備份一體機(jī)與自我復(fù)制時(shí)均會(huì)進(jìn)行自動(dòng)驗(yàn)證。磁盤上的備份塊也會(huì)定期驗(yàn)證,從而保證恢復(fù)操作始終恢復(fù)有效數(shù)據(jù)。
備份一體機(jī)可分為本地備份一體機(jī)和遠(yuǎn)程備份一體機(jī)。本地備份一體機(jī)上的備份可以輕松、快捷、安全地復(fù)制到遠(yuǎn)程備份一體機(jī)中,以防站點(diǎn)中斷和區(qū)域性災(zāi)難等問(wèn)題。例如,數(shù)據(jù)可以復(fù)制到遠(yuǎn)程備份一體機(jī)。遠(yuǎn)程備份一體機(jī)可以是物理機(jī)或運(yùn)行在云環(huán)境的虛擬機(jī)。復(fù)制過(guò)程僅復(fù)制更改的塊,從而極大地減少了WAN網(wǎng)絡(luò)占用。如果本地備份一體機(jī)不可用,可以直接從遠(yuǎn)程備份一體機(jī)運(yùn)行恢復(fù)操作,而不需要在本地暫存數(shù)據(jù)。
容災(zāi)、災(zāi)備管理包括容災(zāi)一體化監(jiān)控、一鍵容災(zāi)自動(dòng)切換、一鍵災(zāi)備自動(dòng)恢復(fù)功能。針對(duì)容災(zāi)、災(zāi)備提供了自動(dòng)化管理能力,可以極大的提升業(yè)務(wù)連續(xù)性。
(1)數(shù)據(jù)容災(zāi)一體化監(jiān)控。主要分為數(shù)據(jù)中心容災(zāi)拓?fù)?、鏈路監(jiān)控、容災(zāi)延遲監(jiān)控三部分。數(shù)據(jù)中心容災(zāi)拓?fù)浒鐢?shù)據(jù)中心容災(zāi)拓?fù)?、?jié)點(diǎn)數(shù)據(jù)庫(kù)容災(zāi)拓?fù)洹f溌繁O(jiān)控主要涉及到鏈路的可用性與傳輸流量。容災(zāi)延遲監(jiān)控可分析延遲時(shí)長(zhǎng)與延遲原因。
(2)一鍵數(shù)據(jù)庫(kù)容災(zāi)切換。一鍵數(shù)據(jù)庫(kù)容災(zāi)切換可在需要時(shí)一鍵實(shí)現(xiàn)主備庫(kù)的快速切換,可避免手動(dòng)進(jìn)行主備庫(kù)切換過(guò)程中的誤操作以提升業(yè)務(wù)連續(xù)性。
(3)一鍵數(shù)據(jù)庫(kù)災(zāi)備恢復(fù)。一鍵數(shù)據(jù)庫(kù)災(zāi)備恢復(fù)支持指定時(shí)間點(diǎn)數(shù)據(jù)恢復(fù)、全庫(kù)數(shù)據(jù)庫(kù)恢復(fù)以滿足不同的場(chǎng)景需要。
(4)告警。對(duì)相關(guān)參數(shù)設(shè)置閾值,參數(shù)值達(dá)到或超過(guò)閾值時(shí),自動(dòng)通過(guò)短信、郵件、微信的方式對(duì)相關(guān)人員發(fā)出告警。
SQL審核主要包括上線SQL審核、上線測(cè)試SQL審核、生產(chǎn)運(yùn)維SQL審核、工單系統(tǒng)四部分。上線SQL審核通過(guò)手動(dòng)上傳數(shù)據(jù)信息,由平臺(tái)自動(dòng)審核SQL語(yǔ)法、執(zhí)行計(jì)劃、運(yùn)行消耗等內(nèi)容。上線測(cè)試SQL審核可自動(dòng)捕獲相關(guān)信息,并自動(dòng)進(jìn)行審核。生產(chǎn)運(yùn)維SQL審核可自動(dòng)捕獲TOP Sql,并自動(dòng)完成審核工作。通過(guò)上述審核可預(yù)判執(zhí)行風(fēng)險(xiǎn)與問(wèn)題,對(duì)發(fā)現(xiàn)問(wèn)題SQL語(yǔ)句自動(dòng)發(fā)起工單提交開發(fā)代表,由工單系統(tǒng)對(duì)這些缺陷工單進(jìn)行處理。
數(shù)據(jù)庫(kù)安全管理是數(shù)據(jù)庫(kù)運(yùn)維管理中的重要組成部分,通過(guò)保護(hù)數(shù)據(jù)庫(kù)系統(tǒng)、數(shù)據(jù)庫(kù)服務(wù)器以及數(shù)據(jù)庫(kù)中的數(shù)據(jù)、相關(guān)網(wǎng)絡(luò)連接,防止數(shù)據(jù)庫(kù)系統(tǒng)及其數(shù)據(jù)遭到泄露、篡改或破壞,從而確保數(shù)據(jù)庫(kù)的正常運(yùn)行[2]。為統(tǒng)一管理,考慮將數(shù)據(jù)庫(kù)安全管理整合到統(tǒng)一的數(shù)據(jù)庫(kù)自動(dòng)化運(yùn)維管理平臺(tái),實(shí)現(xiàn)統(tǒng)一調(diào)度與管理。首先,由管理平臺(tái)自動(dòng)對(duì)數(shù)據(jù)庫(kù)漏洞進(jìn)行掃描,然后對(duì)數(shù)據(jù)庫(kù)進(jìn)行安全管理,包括數(shù)據(jù)加密、數(shù)據(jù)屏蔽、數(shù)據(jù)脫敏、訪問(wèn)審計(jì)等措施。構(gòu)建數(shù)據(jù)庫(kù)防火墻,進(jìn)一步確保數(shù)據(jù)庫(kù)的運(yùn)行安全。在數(shù)據(jù)庫(kù)自動(dòng)化運(yùn)維管理平臺(tái)中引入云技術(shù),具備自動(dòng)化部署功能,可實(shí)現(xiàn)一鍵數(shù)據(jù)庫(kù)安裝與一鍵數(shù)據(jù)恢復(fù)。對(duì)漏洞自行掃描,補(bǔ)丁可一鍵下載與安裝,讓數(shù)據(jù)庫(kù)運(yùn)維管理更加簡(jiǎn)單、便捷、智能化。
圖1 壽險(xiǎn)公司數(shù)據(jù)庫(kù)自動(dòng)化運(yùn)維管理平臺(tái)體系
總之,對(duì)于壽險(xiǎn)公司來(lái)說(shuō),如何管理好龐大的數(shù)據(jù)庫(kù)信息對(duì)公司的經(jīng)營(yíng)發(fā)展有著重要的意義,一旦數(shù)據(jù)信息丟失或損壞將直接給公司造成嚴(yán)重的經(jīng)濟(jì)損失。為此,必須加強(qiáng)對(duì)數(shù)據(jù)庫(kù)日常運(yùn)維管理,引入先進(jìn)的軟件技術(shù)提高數(shù)據(jù)庫(kù)的日常運(yùn)維水平,確保數(shù)據(jù)庫(kù)能夠正常運(yùn)行,這樣才能為壽險(xiǎn)公司的可持續(xù)發(fā)展做好堅(jiān)實(shí)的保障。