劉文靜
摘 要:AFC系統(tǒng)中的車站服務(wù)器(SC)是與終端設(shè)備緊密相連的設(shè)備,其主要功能是對車站終端設(shè)備進(jìn)行狀態(tài)監(jiān)控、收集終端產(chǎn)生的交易和審計(jì)數(shù)據(jù),規(guī)范系統(tǒng)的數(shù)據(jù)管理、運(yùn)營管理及系統(tǒng)維護(hù)管理的技術(shù)要求。服務(wù)中的車站服務(wù)器向下提供正確的服務(wù)模式、參數(shù)分發(fā)、時(shí)鐘同步等,向上提供交易數(shù)據(jù)、運(yùn)行狀態(tài)、客流報(bào)表等,起到了承上啟下的關(guān)鍵作用,所以,車站服務(wù)器的正常運(yùn)行是終端設(shè)備(TVM、GATE、POST)給乘客提供優(yōu)質(zhì)服務(wù)的保證。本文從增設(shè)硬件備份、應(yīng)用虛擬化技術(shù)、既有設(shè)備復(fù)用的不同實(shí)現(xiàn)方式進(jìn)行對比,研究了車站服務(wù)器在故障時(shí)如何能夠快速恢復(fù)其功能,保證車站前后臺正常運(yùn)行。
關(guān)鍵詞:AFC;SC;服務(wù)器;在線式容災(zāi)
中圖分類號:U231 文獻(xiàn)標(biāo)識碼:A
0 引言
隨著地鐵建設(shè)的發(fā)展,郊區(qū)線路的建設(shè),使得線路呈分散、里程增長的趨勢,在車站服務(wù)器出現(xiàn)故障時(shí)尤其在夜間,技術(shù)人員并不能夠在第一時(shí)間趕赴現(xiàn)場維修解決故障,加上故障類型的不確定性,影響數(shù)據(jù)采集的時(shí)效性和終端設(shè)備的穩(wěn)定性,基于此種情況,需研究SC故障后如何做到快速恢復(fù)其功能。為確保在車站服務(wù)器故障時(shí)終端設(shè)備能夠繼續(xù)為乘客提供服務(wù),南京地鐵準(zhǔn)備通過建立一套容災(zāi)備份系統(tǒng),在車站服務(wù)器無法正常工作時(shí)實(shí)現(xiàn)原服務(wù)器的部分功能,對終端設(shè)備進(jìn)行接管,確保終端設(shè)備繼續(xù)穩(wěn)定運(yùn)營。
1 實(shí)現(xiàn)方式探究
容災(zāi)系統(tǒng)是在各種災(zāi)難損害發(fā)生后, 仍然能夠最大限度地提供正常應(yīng)用服務(wù)的計(jì)算機(jī)信息系統(tǒng)。在發(fā)生災(zāi)難時(shí),為了能夠保證業(yè)務(wù)的連續(xù)性, 必須能夠?qū)崿F(xiàn)系統(tǒng)透明的遷移。國內(nèi)AFC系統(tǒng)普遍采用在車站機(jī)房放置一臺車站服務(wù)器的建設(shè)方式,通過星型網(wǎng)或者環(huán)網(wǎng)將SC與終端設(shè)備進(jìn)行連接,SC與線路中心通過通信上層網(wǎng)相連,見圖1AFC系統(tǒng)五層架構(gòu)。此種設(shè)計(jì)層次清晰,明確各個(gè)層級分工協(xié)作,能夠在線路里程不長的基礎(chǔ)上保證維護(hù)的高效性。但是,隨著城市軌道交通的發(fā)展以及郊區(qū)線路的建設(shè),運(yùn)營維護(hù)的問題逐步凸顯,當(dāng)SC出現(xiàn)故障,技術(shù)人員并不能夠在第一時(shí)間趕赴現(xiàn)場維修解決故障,影響設(shè)備監(jiān)控、實(shí)時(shí)客流數(shù)據(jù)等車站服務(wù)。
根據(jù)AFC系統(tǒng)五層架構(gòu),如果想實(shí)現(xiàn)SC在線式容災(zāi)備份系統(tǒng)的建立,可以采用以下兩種方式:一是SC采取雙機(jī)熱備。雙機(jī)熱備是應(yīng)用于服務(wù)器的一種解決方案,其主要實(shí)現(xiàn)方式是為服務(wù)器設(shè)置一主一備形式,主機(jī)和備機(jī)通過網(wǎng)絡(luò)連接,正常情況下主機(jī)處于工作狀態(tài),備機(jī)處于監(jiān)視狀態(tài),一旦主機(jī)出現(xiàn)異常,備機(jī)將會迅速代替主機(jī),完全實(shí)現(xiàn)主機(jī)的功能。這種形式確實(shí)可以解決SC故障時(shí)功能受到影響的問題,這就需要為每個(gè)車站的SC增加備機(jī),無疑要增加大量的硬件成本,性價(jià)比過低,這也是線路在設(shè)計(jì)和新建時(shí)期沒有采用雙機(jī)熱備形式的重要原因。二是應(yīng)用虛擬化技術(shù)。隨著信息化的飛速發(fā)展,IT方面的投入在不斷增加,服務(wù)器越來越多,機(jī)房空間越來越小,技術(shù)人員的管理難度也在不斷提升,傳統(tǒng)“一機(jī)一應(yīng)用”的模式已跟不上時(shí)代的步伐,迫切地需要通過更為高效的信息化手段來實(shí)現(xiàn)。虛擬化技術(shù)能有效地實(shí)現(xiàn)物理資源的整合,通過共享資源的模式提高現(xiàn)有資源的利用率,減少了數(shù)據(jù)中心的投入,減少了空間需求硬件投入。但是虛擬化技術(shù)的應(yīng)用通常適用于線路中心的各類服務(wù)器整合以取代原有的雙機(jī)熱備模式,若應(yīng)用在SC上需要改變既有的架構(gòu)設(shè)計(jì),在線路中心為各SC增設(shè)集中共享設(shè)備,還需要突破車站局域網(wǎng)的限制,存在帶來模式分發(fā)異常的隱患。
2 南京地鐵的實(shí)現(xiàn)路徑
通過上一章對SC容災(zāi)實(shí)現(xiàn)方式的分析,雙機(jī)熱備的形式無論對于既有運(yùn)營線路的改造還是新建都不太現(xiàn)實(shí),虛擬化技術(shù)作為新興技術(shù)也需要投入大量的硬件成本,后期還需要投入長期維護(hù)的成本,不適用于既有線路對SC進(jìn)行容災(zāi)??紤]到對乘客服務(wù)的優(yōu)質(zhì)要求及維護(hù)成本的控制,南京地鐵從不更改原有架構(gòu)設(shè)計(jì)、不花費(fèi)大量成本投入的角度,考慮通過設(shè)計(jì)一套AFC車站服務(wù)器在線式容災(zāi)備份系統(tǒng),在SC出現(xiàn)故障無法提供服務(wù)時(shí),實(shí)現(xiàn)SC功能的臨時(shí)接管。
(1)在線容災(zāi)系統(tǒng)的設(shè)計(jì)?;谝陨闲枨螅@就需要在既有架構(gòu)中尋求可以替代SC接管其功能的合適的設(shè)備,由于容災(zāi)備份系統(tǒng)的目的是臨時(shí)接替原SC的功能,因此對設(shè)備性能和長時(shí)間保存數(shù)據(jù)的要求相對較低,最終通過在車站工作站上安裝虛擬機(jī),在虛擬系統(tǒng)中部署容災(zāi)備份應(yīng)用的所有功能,形成一臺容災(zāi)系統(tǒng)計(jì)算機(jī)(如圖2)。這樣原工作站功能不受影響,并且應(yīng)用程序都可以在相互獨(dú)立的空間內(nèi)運(yùn)行而互不干擾,一旦SC發(fā)生故障,容災(zāi)備份系統(tǒng)可以立即接管,實(shí)現(xiàn)在線式容災(zāi)功能。
(2)容災(zāi)系統(tǒng)的切換。SC發(fā)生故障時(shí),技術(shù)人員只需遠(yuǎn)程斷開SC與AFC系統(tǒng)的連接,在替代工作站上啟動虛擬機(jī)業(yè)務(wù)接入AFC系統(tǒng),該工作站將全面接管故障SC的業(yè)務(wù)功能,實(shí)現(xiàn)設(shè)備監(jiān)控、客流監(jiān)控、交易管理、數(shù)據(jù)管理、通信服務(wù)、時(shí)鐘管理、參數(shù)管理、設(shè)備管理、日始日終管理,同時(shí)可以實(shí)現(xiàn)客流數(shù)據(jù)實(shí)時(shí)銜接、交易文件斷點(diǎn)續(xù)傳、監(jiān)控狀態(tài)瞬間切換,真正實(shí)現(xiàn)在線容災(zāi),為車站設(shè)備繼續(xù)提供后臺服務(wù)。設(shè)備故障時(shí),若存在部分交易文件未正常上傳的情況,容災(zāi)備份系統(tǒng)還對設(shè)備交易文件提供補(bǔ)傳機(jī)制,確保交易文件上傳。SC故障修復(fù)后,技術(shù)人員只需將在線式容災(zāi)系統(tǒng)斷開,SC開機(jī)后即可繼續(xù)工作,災(zāi)備系統(tǒng)轉(zhuǎn)正常系統(tǒng)進(jìn)行服務(wù)。若要保證SC交易文件和數(shù)據(jù)庫中交易的完整性,只需災(zāi)備系統(tǒng)在故障期間的交易恢復(fù)至SC,對原系統(tǒng)不產(chǎn)生影響。
(3)容災(zāi)系統(tǒng)的維護(hù)。在線容災(zāi)系統(tǒng)的日常維護(hù)至關(guān)重要,為了在SC故障時(shí)能順利接管,必須確保容災(zāi)系統(tǒng)中的業(yè)務(wù)功能與SC保持完全一致,這就需要在SC的業(yè)務(wù)軟件功能包括配置發(fā)生變化時(shí),容災(zāi)系統(tǒng)均需及時(shí)進(jìn)行相應(yīng)更新,與SC保持同步。而更新方式只需要遠(yuǎn)程連接容災(zāi)備份系統(tǒng)進(jìn)行文件的替換即可實(shí)現(xiàn),操作便捷。
3 結(jié)束語
通過研究SC在線式容災(zāi)系統(tǒng),實(shí)現(xiàn)了利用車站工作站接管故障SC所有業(yè)務(wù)功能的方式進(jìn)行容災(zāi)備份,確?,F(xiàn)場服務(wù)質(zhì)量和后臺數(shù)據(jù)統(tǒng)計(jì)不受影響,也為故障排查爭取足夠的時(shí)間,緩解了故障處置的壓力,真正實(shí)現(xiàn)了故障處理的“先通后復(fù)”,為“網(wǎng)絡(luò)化運(yùn)營”新形勢下SC故障快速搶修探索了一種的新模式。
參考文獻(xiàn):
[1]李輝.基于Vmware虛擬化技術(shù)的服務(wù)器集群的架構(gòu)與應(yīng)用[D].湖南大學(xué),2017.
[2]張金波.容災(zāi)備份與恢復(fù)平臺的設(shè)計(jì)與實(shí)現(xiàn)[D].大連理工大學(xué),2015.