王越+孟粉霞+鄭江玲
摘 要:為提高西北核技術(shù)研究所檔案數(shù)字化管理和服務(wù)的高可靠性,研究分析集群及其關(guān)鍵技術(shù)原理,提出一種運(yùn)用集群模式規(guī)劃基于OA平臺(tái)的檔案數(shù)字化管理系統(tǒng)的架構(gòu), 采用集群熱備及鏡像關(guān)鍵技術(shù)提高系統(tǒng)和數(shù)據(jù)的冗余能力。應(yīng)用實(shí)例驗(yàn)證了體系架構(gòu)在實(shí)際應(yīng)用中的安全性、可靠性及有效性,對(duì)今后內(nèi)部應(yīng)用服務(wù)的可靠性設(shè)計(jì)有一定的參考價(jià)值。
關(guān)鍵詞:集群技術(shù);檔案管理;OA平臺(tái)
1 引言
目前,信息系統(tǒng)在日常辦公和業(yè)務(wù)信息管理中的重要性不斷加強(qiáng),同時(shí),信息安全等級(jí)保護(hù)規(guī)范針對(duì)涉密信息系統(tǒng)提出更高的要求,如要求應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器分離,系統(tǒng)需要有不間斷服務(wù)和容災(zāi)的能力等[1]。如何提高安全性和可靠性,保證信息系統(tǒng)的高可用性,是目前信息化系統(tǒng)建設(shè)中的主要問題之一。
由于本單位在線歸檔數(shù)量較多,均通過流程審批校驗(yàn)歸檔及時(shí)處理和查閱,要求在線服務(wù)不能間斷,且檔案的存儲(chǔ)安全級(jí)別較高,需要有完善的機(jī)制保證系統(tǒng)高可靠性和數(shù)據(jù)的安全性。
本文探討了雙機(jī)熱備及冗余技術(shù),重點(diǎn)闡述集群的概念和實(shí)現(xiàn)方法,特別針對(duì)西北核技術(shù)研究所數(shù)字化檔案在線管理具體應(yīng)用環(huán)境下的設(shè)計(jì)和實(shí)現(xiàn)方法。
2 需求分析和集群技術(shù)
檔案管理系統(tǒng)基于OA平臺(tái)開發(fā),辦公流程和業(yè)務(wù)管理系統(tǒng)依靠OA開發(fā)平臺(tái)的智能代碼產(chǎn)生,而應(yīng)用服務(wù)不間斷、數(shù)據(jù)可靠性、涉密資源的保護(hù)十分重要,所以方案設(shè)計(jì)重點(diǎn)考慮系統(tǒng)的穩(wěn)定性和數(shù)據(jù)存儲(chǔ)安全性。
檔案資料定位為涉密內(nèi)容,而涉密信息系統(tǒng)要求Web應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器相互分離,并且采用雙臺(tái)Web、雙臺(tái)數(shù)據(jù)庫(kù)服務(wù)器的熱備配置,而且為保證應(yīng)用服務(wù)不間斷,每對(duì)服務(wù)器向外提供虛擬IP,相互之間采用監(jiān)控應(yīng)用服務(wù)和心跳線的方法進(jìn)行監(jiān)控系統(tǒng)和應(yīng)用程序的運(yùn)行狀態(tài)。其次,要求服務(wù)器之間的切換不能影響數(shù)據(jù)的實(shí)時(shí)存儲(chǔ),而且數(shù)據(jù)存儲(chǔ)應(yīng)該保證可靠性和冗余性。
根據(jù)需求分析,重點(diǎn)在實(shí)現(xiàn)實(shí)時(shí)切換和數(shù)據(jù)存儲(chǔ)之間相互關(guān)系。目前,較為流行的實(shí)現(xiàn)方式應(yīng)該為集群模式。集群( Cluster)是指一組相互獨(dú)立的服務(wù)器在網(wǎng)絡(luò)中表現(xiàn)為單一的系統(tǒng),并以單一系統(tǒng)的模式加以管理。集群中的服務(wù)器(或稱節(jié)點(diǎn)服務(wù)器)不管從物理上講,還是從程序上講都是彼此相連的,均通過響應(yīng)客戶端請(qǐng)求時(shí)協(xié)調(diào)通信,重要的是節(jié)點(diǎn)服務(wù)器可以在硬件或應(yīng)用程序出現(xiàn)故障時(shí)提供冗余操作。因此,應(yīng)用集群增強(qiáng)了信息系統(tǒng)應(yīng)用服務(wù)器及存儲(chǔ)的可用性、可伸縮性和可管理性。
傳統(tǒng)雙機(jī)熱備模式通常需要開發(fā)程序在不同的服務(wù)器之間手動(dòng)或自動(dòng)切換,本地有自己的應(yīng)用程序或數(shù)據(jù)庫(kù),切換時(shí)需要人工進(jìn)行程序更新或數(shù)據(jù)庫(kù)同步,加之需要虛擬IP和程序切換,導(dǎo)致應(yīng)用服務(wù)切換時(shí)數(shù)據(jù)一致性程度不高或切換間隔較長(zhǎng)[2]。
集群技術(shù)目前通常采用封裝軟件HA(High Availability,高可用性)實(shí)現(xiàn)。相比傳統(tǒng)的雙機(jī)熱備模式,其集成了虛擬IP、監(jiān)控心跳和應(yīng)用、磁盤陣列柜等雙機(jī)熱備要素。集群中每臺(tái)服務(wù)器的操作系統(tǒng)存儲(chǔ)在其各自的本地儲(chǔ)存空間上,本機(jī)運(yùn)行計(jì)算,成為節(jié)點(diǎn)服務(wù)器,所有節(jié)點(diǎn)服務(wù)器運(yùn)行的服務(wù)均可以以虛擬IP地址提供服務(wù),多臺(tái)節(jié)點(diǎn)服務(wù)器擁有共享數(shù)據(jù)存儲(chǔ)空間,保存應(yīng)用程序及數(shù)據(jù)。任何服務(wù)器運(yùn)行應(yīng)用程序時(shí),應(yīng)用數(shù)據(jù)被存儲(chǔ)在共享的數(shù)據(jù)空間內(nèi),保證節(jié)點(diǎn)任何時(shí)刻的應(yīng)用和存儲(chǔ)數(shù)據(jù)一致[3]。
3 高可用服務(wù)器集群設(shè)計(jì)
根據(jù)以上需求和技術(shù)路線分析,檔案數(shù)字化管理系統(tǒng)采用集群方式進(jìn)行設(shè)計(jì)。該方案的雙機(jī)與磁盤陣列柜互聯(lián)結(jié)構(gòu)不采用內(nèi)存鏡像技術(shù),可以有效避免由于應(yīng)用程序自身的缺陷導(dǎo)致系統(tǒng)全部宕機(jī),同時(shí)由于所有的數(shù)據(jù)實(shí)時(shí)存貯在鏡像磁盤陣列柜中,當(dāng)監(jiān)控到主服務(wù)器節(jié)點(diǎn)出現(xiàn)故障時(shí),備份節(jié)點(diǎn)接替任務(wù),直接從鏡像磁盤陣列中讀取數(shù)據(jù),所以不會(huì)產(chǎn)生數(shù)據(jù)不同步的問題,不需要網(wǎng)絡(luò)鏡像同步,因此這種集群方案服務(wù)器的性能要比鏡像服務(wù)器結(jié)構(gòu)高出很多[3]。
其中節(jié)點(diǎn)服務(wù)器只安裝應(yīng)用系統(tǒng),數(shù)據(jù)都保存在磁盤陣列的鏡像分區(qū)內(nèi)。為避免當(dāng)磁盤陣列柜出現(xiàn)邏輯或物理故障時(shí),所有存貯的數(shù)據(jù)會(huì)全部丟失,將磁盤陣列通過RAID技術(shù)配置為分區(qū)并相互鏡像的模式:通過磁盤陣列控制卡將陣列柜中的硬盤配置成為邏輯盤陣,根據(jù)數(shù)據(jù)存儲(chǔ)量需要將磁盤陣列分為兩個(gè)邏輯分區(qū)(A分區(qū)和B分區(qū)),將A分區(qū)分給Web服務(wù)器操作系統(tǒng),將B分區(qū)分給數(shù)據(jù)庫(kù)服務(wù)器,在服務(wù)器系統(tǒng)分區(qū)直接指向磁盤陣列,保證主機(jī)節(jié)點(diǎn)和備機(jī)節(jié)點(diǎn)根據(jù)任務(wù)切換時(shí),準(zhǔn)確指向自己的分區(qū),同時(shí),兩臺(tái)存儲(chǔ)陣列配置成相互鏡像的存儲(chǔ)空間。集群體系設(shè)計(jì)結(jié)構(gòu)圖如圖1所示。
集群發(fā)布虛擬IP地址,并將該IP地址連接轉(zhuǎn)移到主服務(wù)器實(shí)際物理IP地址。 如主服務(wù)器發(fā)生故障, 虛擬IP的連接將轉(zhuǎn)移到備服務(wù)器上, 因此任意一臺(tái)服務(wù)器故障都不會(huì)導(dǎo)致連接虛擬IP地址的失效, 實(shí)現(xiàn)了從主服務(wù)器到備服務(wù)器切換不影響用戶訪問[4]。集群服務(wù)器節(jié)點(diǎn)之間通過串口進(jìn)行通訊,程序?qū)崿F(xiàn)邏輯主要有兩部分:監(jiān)控和切換。
程序首先進(jìn)入基于串口的心跳信號(hào)的循環(huán)監(jiān)視。此時(shí),程序處于活躍狀態(tài),每隔指定的時(shí)間從串口讀入數(shù)據(jù),如果讀取成功,則進(jìn)入下一次循環(huán),如果不成功,程序先檢測(cè)主備服務(wù)器之間的網(wǎng)絡(luò)連接狀況,串口鏈路出現(xiàn)故障,可以執(zhí)行切換程序;在備服務(wù)器連續(xù)監(jiān)測(cè)到指定數(shù)量的來自主服務(wù)器的接管請(qǐng)求,則刪除備服務(wù)器上綁定的虛擬IP,之后通知主服務(wù)器可以接管服務(wù),并由結(jié)束過渡狀態(tài)進(jìn)入活躍狀態(tài)。
通過熱備切換和數(shù)據(jù)鏡像存儲(chǔ)的冗余設(shè)計(jì),節(jié)點(diǎn)服務(wù)器的熱備切換都不會(huì)影響用戶訪問的數(shù)據(jù),保證節(jié)點(diǎn)切換時(shí)間短、數(shù)據(jù)一致性,進(jìn)而提高數(shù)據(jù)和應(yīng)用服務(wù)的安全性。
4 實(shí)現(xiàn)效果分析
在系統(tǒng)實(shí)施中,充分利用已有信息安全管理體系,使檔案在線管理系統(tǒng)符合涉密計(jì)算機(jī)系統(tǒng)聯(lián)網(wǎng)的保密要求:將開發(fā)的檔案在線管理系統(tǒng)服務(wù)器部署在防火墻和認(rèn)證網(wǎng)關(guān)之后,利用信息安全管理體系集中完成用戶身份認(rèn)證、訪問控制以及網(wǎng)絡(luò)加密傳輸。
各熱備子系統(tǒng)的服務(wù)器通過心跳信號(hào)、HBA與光纖網(wǎng)絡(luò)交換機(jī)連接成內(nèi)部網(wǎng),以SAN方式完成服務(wù)器和磁盤陣列相連,在各自系統(tǒng)上建立具有容錯(cuò)功能的共享磁盤。集群的心跳信號(hào)和內(nèi)部網(wǎng)用于數(shù)據(jù)交換,各節(jié)點(diǎn)服務(wù)器通過內(nèi)部局域網(wǎng)相互通訊,不影響服務(wù)器和用戶訪問之間的數(shù)據(jù)流通,不占用服務(wù)器和客戶機(jī)、服務(wù)器與磁盤陣列的通信資源,降低服務(wù)器節(jié)點(diǎn)的網(wǎng)絡(luò)負(fù)荷,大大提高了利用率。實(shí)現(xiàn)的集群結(jié)構(gòu)圖如圖2所示。
相比傳統(tǒng)的雙機(jī)熱備方法,集群技術(shù)有效保證兩方面的可靠性,即應(yīng)用服務(wù)和數(shù)據(jù)的安全性。集群技術(shù)通過冗余設(shè)計(jì),將故障點(diǎn)任務(wù)分散到內(nèi)部其他節(jié)點(diǎn)上,有效保證整個(gè)系統(tǒng)應(yīng)用服務(wù)的穩(wěn)定性;通過數(shù)據(jù)在磁盤陣列上鏡像的方式,保證數(shù)據(jù)在任意節(jié)點(diǎn)切換時(shí)數(shù)據(jù)的一致性。
形成統(tǒng)一基礎(chǔ)數(shù)據(jù)之后,需要建立數(shù)據(jù)應(yīng)用的安全管理和備份恢復(fù)機(jī)制,通過定時(shí)備份任務(wù)將鏡像磁盤的重要數(shù)據(jù)定時(shí)備份在其他分區(qū)。數(shù)據(jù)的集中管理也考慮了三員管理、日志審計(jì)和數(shù)據(jù)加密存儲(chǔ)的安全管理策略,符合系統(tǒng)安全等級(jí)評(píng)估的要求。
5 結(jié)語
本方案在設(shè)計(jì)和實(shí)現(xiàn)過程中,充分考慮了系統(tǒng)現(xiàn)有需求和可持續(xù)發(fā)展能力。該系統(tǒng)在西北核技術(shù)研究所運(yùn)行兩年以來,大大提高了歸檔的數(shù)量和質(zhì)量,且熱備切換和數(shù)據(jù)存儲(chǔ)管理均不需要人工干預(yù),不但提高系統(tǒng)穩(wěn)定性和可用性,也減少管理和數(shù)據(jù)備份的復(fù)雜度。
目前,系統(tǒng)還存在的不足是,系統(tǒng)沒有應(yīng)用負(fù)載均衡(LB)機(jī)制。在大量并發(fā)訪問時(shí)期,如果能利用上備份節(jié)點(diǎn)資源應(yīng)該更加完善。同時(shí),應(yīng)該考慮遠(yuǎn)程異地備份策略,以進(jìn)一步提高數(shù)據(jù)的安全級(jí)別[5]。