諶力 熊華明
隨著證券企業(yè)數(shù)字化轉型不斷向縱深推進,保障信息系統(tǒng)穩(wěn)定運行和數(shù)據(jù)安全成為各家券商數(shù)字化轉型是否成功的基礎。紅塔證券在進行數(shù)據(jù)中心升級和改造時,精心設計技術方案來提升業(yè)務連續(xù)性,同時啟用了高價值的保險服務,服務包含了財產險、數(shù)據(jù)丟失、業(yè)務停機和信息泄露保障。該公司率先使用全行業(yè)內首款針對存儲設備和數(shù)據(jù)服務的正式保險服務,不僅在技術層面獲得了更高層次的數(shù)據(jù)可靠性,更從資金和法律的角度,為公司的數(shù)據(jù)與系統(tǒng)安全獲得了更全面、更完善的保障。
作為一家上市券商,紅塔證券自成立以來始終秉承“誠信、創(chuàng)新、多元”的理念,在穩(wěn)健經營的基礎上不斷開拓創(chuàng)新,取得了較好的經營業(yè)績。目前,已逐漸發(fā)展成為制度體系完善、風險管理嚴密、財務指標健康、資產質量良好的特色證券經營機構,也是業(yè)內為數(shù)不多的連續(xù)10多年實現(xiàn)盈利的券商之一。紅塔證券信息系統(tǒng)建設如何支撐業(yè)務增長?在數(shù)字化轉型方面有哪些優(yōu)秀實踐?記者采訪了紅塔證券股份有限公司的專責人士。
以提高業(yè)務連續(xù)性為目標升級基礎架構
紅塔證券經營的業(yè)務品種齊全。公司早在2012年就選擇了虛擬化這種更加敏捷的部署方式,建立起了公司信息系統(tǒng)整個技術架構。隨著業(yè)務越上越多,原有架構難以滿足新的形勢任務需求,2019年公司對整個信息系統(tǒng)基礎架構進行了調整。
“證券行業(yè)相比于其他行業(yè)來說,對業(yè)務連續(xù)性的要求非常高,按中國證監(jiān)會的要求,券商的核心業(yè)務不得中斷超過五分鐘,一旦中斷必須在五分鐘之內恢復。”紅塔證券專業(yè)人士接受記者采訪時說,這是一個監(jiān)管上的強制性要求,也是他們進行技術架構升級、改造的出發(fā)點和目標。
紅塔證券主動適應嚴格的監(jiān)管要求,對原有的體系架構進行拆分,把原來單一的大計算資源池,按照多節(jié)點多活的方式,拆成了多個小型計算資源池,并采用多跑道設計,確保在任何一個節(jié)點出現(xiàn)問題的時候,可以迅速切換到多活的第二或者第三個節(jié)點上。為了安全起見,紅塔證券還在昆明建了一個災備機房,以私有云和多活的方式,在主機房、災備機房中做了同樣的兩個資源池,如果主機房發(fā)生異常情況,很短時間內就可以切到災備機房里面。除了數(shù)據(jù)庫之外,其他資源是靈活的方式,保證在任何一邊切換的時候,只要切掉數(shù)據(jù)庫,其他資源就自動接進。
調整后的架構都是基于監(jiān)管規(guī)則設計的,包括應用中間件全部是多活方式,全部在集群里,運行環(huán)境相對簡單。紅塔證券一些最核心的生產系統(tǒng),比如滬深交易和融資融券,通過多活的方式將幾個集群搭起來,同時在災備機房也建了一個相同的集群,以滿足隨時切換的需要。數(shù)據(jù)架構同時配套基礎架構調整做了新的設計,通過數(shù)據(jù)庫的多活機制產生了非常多的副本,任何一個地方一旦出問題,其他地方可以快速地響應。為了提高切換效率,紅塔證券在主要的集群里都采用單機的方式,因為利用集群的時候,單一應用跑在一個單機上其實效率更高。集群技術的單節(jié)點也在集群上跑,如果單機出現(xiàn)問題就能夠以最快的方式在集群上切換,因為單機最大的好處就是故障特別明確,出問題后立刻可以切到第二個集群或第三個集群,后面這兩個集群相當于多應用跑在上面。
紅塔證券在基礎架構調整時沒有使用超融合技術,而是選擇對虛擬化技術進行升級優(yōu)化,專業(yè)人士表示一方面是基于性價比,這樣做避免了通過硬件采購方式重新構建系統(tǒng),解決了效率不高、時間流程長的問題。從敏捷部署的角度講,他們更看中虛擬化或私有云,對公司業(yè)務拓展更有利。
運用保險增值服務對沖風險
作為數(shù)據(jù)的承載者,核心存儲系統(tǒng)容易受到包括災害事故、人為因素在內多方面的可靠性挑戰(zhàn),面臨包括系統(tǒng)宕機、數(shù)據(jù)丟失和信息泄露等風險。這些風險一旦發(fā)生,將給企業(yè)帶來不可估量的經濟損失。
“紫光旗下新華三集團聯(lián)合誠泰保險及中國人保推出的IT保險產品,讓我們對新華三的存儲產品使用更放心?!痹搶I(yè)人士告訴記者,新華三的存儲設備有更多的增值服務,堅定了他們的最終選擇。這款IT保險產品的產生過程,其實就是一個存儲產品風險嚴格評估的過程。人保云南分公司創(chuàng)新實驗室為開發(fā)IT保險產品,與新華三展開合作,收集了大量存儲設備數(shù)據(jù),通過分析數(shù)據(jù)丟失、停機事故發(fā)生概率和平均故障率,經過一系列評估后最終做了一個試點,推出了這款基于數(shù)據(jù)的保險產品,涵蓋的內容主要包括:一是用戶發(fā)生停機,超過一定時間就會給客戶相應的補償;二是數(shù)據(jù)丟失,根據(jù)丟失數(shù)據(jù)的多少給用戶相應的補償;三是信息泄密,也會給用戶相應的補償;四是針對以上情形所帶來的部分附帶經濟損失,如訴訟費、通知費、公告費等。
雖然紅塔證券調整后的整體架構非常穩(wěn)定,切換也非???,但從全局來看,比如說主機房要切災備機房,中間依然還會有一個時間差,還是會產生比如數(shù)據(jù)上或者交易上某個時間點,即RPO和RTO概念的一點點丟失。公司通過科學測試得知,切換機房的情況下,任務切換時間是2分14秒,丟失的委托訂單在一個極限的情況下不超過10筆。如果出現(xiàn)這樣的情況,與這10筆交易相關聯(lián)的數(shù)據(jù)丟失可能產生的財務損失需要賠償,保險的價值就體現(xiàn)出來了。
損失賠償在證券行業(yè)是很少發(fā)生的個別情況,紅塔證券堅持用戶至上的服務理念,只要有發(fā)生的可能,就要把所有風險都考慮周全,這也是該公司成為新華三集團存儲設備保險產品第一個用戶的原因。
“有了這份保險托底,無論是對產品本身的信任,還是對客戶的保障,我們都更有信心。” 該專業(yè)人士說,完全依賴于簡單的設備或者一個數(shù)據(jù)的保險想把證券公司信息系統(tǒng)的風險全部覆蓋掉也是不可能的,他們已通過體系架構避免大規(guī)模風險出現(xiàn)的可能,如果真有小概率的賠償發(fā)生,就可以用這個補償機制來對沖風險。
借助智能平臺感知運維態(tài)勢
紅塔證券在原有技術架構基礎上構建新的系統(tǒng)架構,因為要考慮新舊各種因素,這個系統(tǒng)架構也就變得非常復雜,單純依靠人工運維,不僅成本高昂,發(fā)生問題的風險也會升高。公司一方面攜手新華三集團研究開發(fā)態(tài)勢感知監(jiān)控系統(tǒng),對存儲設備、服務器和網(wǎng)絡、軟件運維狀態(tài)全部實現(xiàn)實時感知,一方面引進新華三的Primera,將產品運行情況納入InfoSight智能管理平臺中,享受端到端的數(shù)字化服務。
“Primera的著眼點主要是兩方面,一是穩(wěn)定性比原來更高,我們現(xiàn)在可以保證提供100%的數(shù)據(jù)可靠性,二是適應自動化運維的潮流,不必專門增加存儲管理人員?!?新華三集團存儲產品總監(jiān)張穎向記者介紹,只要存儲系統(tǒng)開啟InfoSight智能管理平臺,就能實現(xiàn)自動化、智能化運維,即使用戶將來在存儲設備增加的情況下,也不用專門增加管理人員。
紅塔證券存儲系統(tǒng)搭載的這套智能管理平臺具有下面幾個功能:
第一,預防故障的發(fā)生。以往都是被動地響應故障,故障發(fā)生以后,一線、二線、三線的工程師去解決這個問題。而InfoSight平臺通過人工智能的學習,只要以往發(fā)生過這種情況,智能管理平臺就可以智能地預判會發(fā)生什么樣的故障,從而在故障發(fā)生之前幫助客戶把問題解決掉。
第二,可以預測容量和性能。很多時候用戶出現(xiàn)的問題,是他們對存儲容量和性能的整體預判不夠,存儲滿了會發(fā)生問題,系統(tǒng)性能不夠也會發(fā)生問題,通過人工智能的運算可以預判多長時間以后整個容量或者系統(tǒng)的性能達到飽和,提前提醒用戶去做相應的調整,不管是采購還是平衡到其他機器上面去。
第三,可以做到感知應用端。如果沒有應用端感知的話,應用端發(fā)生的問題存儲端往往是不知道的,但有人工智能端到端打通了以后,就可以更好地為應用服務,讓用戶能更好地去管理存儲,用更少的人去管理存儲。
“要確保系統(tǒng)架構安全和數(shù)據(jù)的高度可靠,除了進行人工智能運維外,我們還會及時升級軟件版本,積極改進硬件設備,持續(xù)不斷為系統(tǒng)的可靠性做努力?!?該專業(yè)人士告訴記者,證券市場業(yè)務創(chuàng)新快、業(yè)務種類多、業(yè)務流程長,如果科技創(chuàng)新步伐跟不上業(yè)務創(chuàng)新的步伐,將會制約企業(yè)的進一步發(fā)展。今后公司將積極適應業(yè)務發(fā)展需要,不斷采購或升級一些穩(wěn)定性更高的產品,為公司業(yè)務創(chuàng)新提供技術支撐。同時,也會依據(jù)中國證監(jiān)會關于數(shù)據(jù)治理要求,形成數(shù)據(jù)治理和數(shù)字挖掘的公司標準,合法合規(guī)地進行大數(shù)據(jù)分析,了解客戶的交易偏好和交易風險承受能力,滿足客戶的偏好一些條件,為客戶提供更準確優(yōu)質的服務。