要想知道為何發(fā)生了宕機(jī),就要了解影響業(yè)務(wù)連續(xù)性的因素和場(chǎng)景是什么,自身所采取的容災(zāi)方案有什么問題。中亦科技黃遠(yuǎn)邦表示,影響業(yè)務(wù)連續(xù)性的因素和場(chǎng)景分別是組件單點(diǎn)、服務(wù)器單點(diǎn)、存儲(chǔ)單點(diǎn)、站點(diǎn)單點(diǎn)、人為錯(cuò)誤和IO丟失。
主流容災(zāi)技術(shù)包括數(shù)據(jù)庫(kù)邏輯復(fù)制、數(shù)據(jù)庫(kù)物理復(fù)制、逡輯卷復(fù)制、存儲(chǔ)級(jí)復(fù)制。然而基于存儲(chǔ)復(fù)制容災(zāi)方案無法校驗(yàn)數(shù)據(jù)庫(kù)的物理和邏輯壞塊,無法嚴(yán)格保證數(shù)據(jù)庫(kù)的一致性,投資回報(bào)率較低,切換測(cè)試較麻煩。
為解決這些問題,中亦科技提出了基于DataGuard實(shí)現(xiàn)容災(zāi)方案,黃遠(yuǎn)邦表示,該方案能夠適用于本地應(yīng)急和報(bào)表系統(tǒng),同城異地容災(zāi)方案以及遠(yuǎn)程數(shù)據(jù)容災(zāi)。保障7*24業(yè)務(wù)高可用性, 針對(duì)關(guān)鍵業(yè)務(wù)提供連續(xù)性保障,并且平戰(zhàn)結(jié)合,和硬件方案結(jié)合,提供更安全的數(shù)據(jù)保障,實(shí)現(xiàn)復(fù)制數(shù)據(jù)庫(kù)可用性,切換和反向回切。
對(duì)于一些大型機(jī)構(gòu),由于業(yè)務(wù)需要,需設(shè)立兩地三中心的架構(gòu),而傳統(tǒng)的架構(gòu)雖然可以保證數(shù)據(jù)庫(kù)在災(zāi)備端可以啟動(dòng),預(yù)防人為錯(cuò)誤,預(yù)防IO丟失,但仍然會(huì)出現(xiàn)丟失少量數(shù)據(jù),并且默認(rèn)配置無法快速應(yīng)對(duì)程序邏輯等錯(cuò)誤。因此,中亦科技推薦一種能夠用最小成本實(shí)現(xiàn)本地極致高可用的架構(gòu)(如圖1)。
圖1 可實(shí)現(xiàn)高可用性的架構(gòu)
然而,服務(wù)器高可用、存儲(chǔ)高可用、站點(diǎn)高可用等架構(gòu)可以解決所有業(yè)務(wù)連續(xù)性的問題么?其實(shí)并不是,因此需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行優(yōu)化。中亦科技提出通過X86分布式存儲(chǔ)對(duì)數(shù)據(jù)庫(kù) 進(jìn)行加速、解決IO瓶頸。該架構(gòu)使用SRP協(xié)議進(jìn)行存儲(chǔ)訪問以充分利用IB帶寬。SRP協(xié)議通過RDMA方式叏數(shù),相比其他協(xié)議,不需要CPU參不運(yùn)算,增強(qiáng)了數(shù)據(jù)傳輸能力,減少了時(shí)延。而通過ORACLE自帶的ASM來管理所有塊設(shè)備。ASM有成熟的冗余和IO分布機(jī)制,可以保證數(shù)據(jù)讀寫可以均勻地分布在各個(gè)存儲(chǔ)節(jié)點(diǎn)。
黃遠(yuǎn)邦表示,中亦科技希望能夠利用該方案,與客戶共建國(guó)產(chǎn)化自主可控的分布式存儲(chǔ),幫助客戶實(shí)現(xiàn)去SAN集中存儲(chǔ),提升IO性能,降低成本。