王越+孟粉霞+鄭江玲
摘 要:為提高西北核技術(shù)研究所檔案數(shù)字化管理和服務的高可靠性,研究分析集群及其關(guān)鍵技術(shù)原理,提出一種運用集群模式規(guī)劃基于OA平臺的檔案數(shù)字化管理系統(tǒng)的架構(gòu), 采用集群熱備及鏡像關(guān)鍵技術(shù)提高系統(tǒng)和數(shù)據(jù)的冗余能力。應用實例驗證了體系架構(gòu)在實際應用中的安全性、可靠性及有效性,對今后內(nèi)部應用服務的可靠性設計有一定的參考價值。
關(guān)鍵詞:集群技術(shù);檔案管理;OA平臺
1 引言
目前,信息系統(tǒng)在日常辦公和業(yè)務信息管理中的重要性不斷加強,同時,信息安全等級保護規(guī)范針對涉密信息系統(tǒng)提出更高的要求,如要求應用服務器和數(shù)據(jù)庫服務器分離,系統(tǒng)需要有不間斷服務和容災的能力等[1]。如何提高安全性和可靠性,保證信息系統(tǒng)的高可用性,是目前信息化系統(tǒng)建設中的主要問題之一。
由于本單位在線歸檔數(shù)量較多,均通過流程審批校驗歸檔及時處理和查閱,要求在線服務不能間斷,且檔案的存儲安全級別較高,需要有完善的機制保證系統(tǒng)高可靠性和數(shù)據(jù)的安全性。
本文探討了雙機熱備及冗余技術(shù),重點闡述集群的概念和實現(xiàn)方法,特別針對西北核技術(shù)研究所數(shù)字化檔案在線管理具體應用環(huán)境下的設計和實現(xiàn)方法。
2 需求分析和集群技術(shù)
檔案管理系統(tǒng)基于OA平臺開發(fā),辦公流程和業(yè)務管理系統(tǒng)依靠OA開發(fā)平臺的智能代碼產(chǎn)生,而應用服務不間斷、數(shù)據(jù)可靠性、涉密資源的保護十分重要,所以方案設計重點考慮系統(tǒng)的穩(wěn)定性和數(shù)據(jù)存儲安全性。
檔案資料定位為涉密內(nèi)容,而涉密信息系統(tǒng)要求Web應用服務器和數(shù)據(jù)庫服務器相互分離,并且采用雙臺Web、雙臺數(shù)據(jù)庫服務器的熱備配置,而且為保證應用服務不間斷,每對服務器向外提供虛擬IP,相互之間采用監(jiān)控應用服務和心跳線的方法進行監(jiān)控系統(tǒng)和應用程序的運行狀態(tài)。其次,要求服務器之間的切換不能影響數(shù)據(jù)的實時存儲,而且數(shù)據(jù)存儲應該保證可靠性和冗余性。
根據(jù)需求分析,重點在實現(xiàn)實時切換和數(shù)據(jù)存儲之間相互關(guān)系。目前,較為流行的實現(xiàn)方式應該為集群模式。集群( Cluster)是指一組相互獨立的服務器在網(wǎng)絡中表現(xiàn)為單一的系統(tǒng),并以單一系統(tǒng)的模式加以管理。集群中的服務器(或稱節(jié)點服務器)不管從物理上講,還是從程序上講都是彼此相連的,均通過響應客戶端請求時協(xié)調(diào)通信,重要的是節(jié)點服務器可以在硬件或應用程序出現(xiàn)故障時提供冗余操作。因此,應用集群增強了信息系統(tǒng)應用服務器及存儲的可用性、可伸縮性和可管理性。
傳統(tǒng)雙機熱備模式通常需要開發(fā)程序在不同的服務器之間手動或自動切換,本地有自己的應用程序或數(shù)據(jù)庫,切換時需要人工進行程序更新或數(shù)據(jù)庫同步,加之需要虛擬IP和程序切換,導致應用服務切換時數(shù)據(jù)一致性程度不高或切換間隔較長[2]。
集群技術(shù)目前通常采用封裝軟件HA(High Availability,高可用性)實現(xiàn)。相比傳統(tǒng)的雙機熱備模式,其集成了虛擬IP、監(jiān)控心跳和應用、磁盤陣列柜等雙機熱備要素。集群中每臺服務器的操作系統(tǒng)存儲在其各自的本地儲存空間上,本機運行計算,成為節(jié)點服務器,所有節(jié)點服務器運行的服務均可以以虛擬IP地址提供服務,多臺節(jié)點服務器擁有共享數(shù)據(jù)存儲空間,保存應用程序及數(shù)據(jù)。任何服務器運行應用程序時,應用數(shù)據(jù)被存儲在共享的數(shù)據(jù)空間內(nèi),保證節(jié)點任何時刻的應用和存儲數(shù)據(jù)一致[3]。
3 高可用服務器集群設計
根據(jù)以上需求和技術(shù)路線分析,檔案數(shù)字化管理系統(tǒng)采用集群方式進行設計。該方案的雙機與磁盤陣列柜互聯(lián)結(jié)構(gòu)不采用內(nèi)存鏡像技術(shù),可以有效避免由于應用程序自身的缺陷導致系統(tǒng)全部宕機,同時由于所有的數(shù)據(jù)實時存貯在鏡像磁盤陣列柜中,當監(jiān)控到主服務器節(jié)點出現(xiàn)故障時,備份節(jié)點接替任務,直接從鏡像磁盤陣列中讀取數(shù)據(jù),所以不會產(chǎn)生數(shù)據(jù)不同步的問題,不需要網(wǎng)絡鏡像同步,因此這種集群方案服務器的性能要比鏡像服務器結(jié)構(gòu)高出很多[3]。
其中節(jié)點服務器只安裝應用系統(tǒng),數(shù)據(jù)都保存在磁盤陣列的鏡像分區(qū)內(nèi)。為避免當磁盤陣列柜出現(xiàn)邏輯或物理故障時,所有存貯的數(shù)據(jù)會全部丟失,將磁盤陣列通過RAID技術(shù)配置為分區(qū)并相互鏡像的模式:通過磁盤陣列控制卡將陣列柜中的硬盤配置成為邏輯盤陣,根據(jù)數(shù)據(jù)存儲量需要將磁盤陣列分為兩個邏輯分區(qū)(A分區(qū)和B分區(qū)),將A分區(qū)分給Web服務器操作系統(tǒng),將B分區(qū)分給數(shù)據(jù)庫服務器,在服務器系統(tǒng)分區(qū)直接指向磁盤陣列,保證主機節(jié)點和備機節(jié)點根據(jù)任務切換時,準確指向自己的分區(qū),同時,兩臺存儲陣列配置成相互鏡像的存儲空間。集群體系設計結(jié)構(gòu)圖如圖1所示。
集群發(fā)布虛擬IP地址,并將該IP地址連接轉(zhuǎn)移到主服務器實際物理IP地址。 如主服務器發(fā)生故障, 虛擬IP的連接將轉(zhuǎn)移到備服務器上, 因此任意一臺服務器故障都不會導致連接虛擬IP地址的失效, 實現(xiàn)了從主服務器到備服務器切換不影響用戶訪問[4]。集群服務器節(jié)點之間通過串口進行通訊,程序?qū)崿F(xiàn)邏輯主要有兩部分:監(jiān)控和切換。
程序首先進入基于串口的心跳信號的循環(huán)監(jiān)視。此時,程序處于活躍狀態(tài),每隔指定的時間從串口讀入數(shù)據(jù),如果讀取成功,則進入下一次循環(huán),如果不成功,程序先檢測主備服務器之間的網(wǎng)絡連接狀況,串口鏈路出現(xiàn)故障,可以執(zhí)行切換程序;在備服務器連續(xù)監(jiān)測到指定數(shù)量的來自主服務器的接管請求,則刪除備服務器上綁定的虛擬IP,之后通知主服務器可以接管服務,并由結(jié)束過渡狀態(tài)進入活躍狀態(tài)。
通過熱備切換和數(shù)據(jù)鏡像存儲的冗余設計,節(jié)點服務器的熱備切換都不會影響用戶訪問的數(shù)據(jù),保證節(jié)點切換時間短、數(shù)據(jù)一致性,進而提高數(shù)據(jù)和應用服務的安全性。
4 實現(xiàn)效果分析
在系統(tǒng)實施中,充分利用已有信息安全管理體系,使檔案在線管理系統(tǒng)符合涉密計算機系統(tǒng)聯(lián)網(wǎng)的保密要求:將開發(fā)的檔案在線管理系統(tǒng)服務器部署在防火墻和認證網(wǎng)關(guān)之后,利用信息安全管理體系集中完成用戶身份認證、訪問控制以及網(wǎng)絡加密傳輸。
各熱備子系統(tǒng)的服務器通過心跳信號、HBA與光纖網(wǎng)絡交換機連接成內(nèi)部網(wǎng),以SAN方式完成服務器和磁盤陣列相連,在各自系統(tǒng)上建立具有容錯功能的共享磁盤。集群的心跳信號和內(nèi)部網(wǎng)用于數(shù)據(jù)交換,各節(jié)點服務器通過內(nèi)部局域網(wǎng)相互通訊,不影響服務器和用戶訪問之間的數(shù)據(jù)流通,不占用服務器和客戶機、服務器與磁盤陣列的通信資源,降低服務器節(jié)點的網(wǎng)絡負荷,大大提高了利用率。實現(xiàn)的集群結(jié)構(gòu)圖如圖2所示。
相比傳統(tǒng)的雙機熱備方法,集群技術(shù)有效保證兩方面的可靠性,即應用服務和數(shù)據(jù)的安全性。集群技術(shù)通過冗余設計,將故障點任務分散到內(nèi)部其他節(jié)點上,有效保證整個系統(tǒng)應用服務的穩(wěn)定性;通過數(shù)據(jù)在磁盤陣列上鏡像的方式,保證數(shù)據(jù)在任意節(jié)點切換時數(shù)據(jù)的一致性。
形成統(tǒng)一基礎數(shù)據(jù)之后,需要建立數(shù)據(jù)應用的安全管理和備份恢復機制,通過定時備份任務將鏡像磁盤的重要數(shù)據(jù)定時備份在其他分區(qū)。數(shù)據(jù)的集中管理也考慮了三員管理、日志審計和數(shù)據(jù)加密存儲的安全管理策略,符合系統(tǒng)安全等級評估的要求。
5 結(jié)語
本方案在設計和實現(xiàn)過程中,充分考慮了系統(tǒng)現(xiàn)有需求和可持續(xù)發(fā)展能力。該系統(tǒng)在西北核技術(shù)研究所運行兩年以來,大大提高了歸檔的數(shù)量和質(zhì)量,且熱備切換和數(shù)據(jù)存儲管理均不需要人工干預,不但提高系統(tǒng)穩(wěn)定性和可用性,也減少管理和數(shù)據(jù)備份的復雜度。
目前,系統(tǒng)還存在的不足是,系統(tǒng)沒有應用負載均衡(LB)機制。在大量并發(fā)訪問時期,如果能利用上備份節(jié)點資源應該更加完善。同時,應該考慮遠程異地備份策略,以進一步提高數(shù)據(jù)的安全級別[5]。