本文由北京市社會科學(xué)基金項目(16YJC039)支持。
摘要:隨著信息技術(shù)的發(fā)展,企業(yè)對其IT系統(tǒng)依賴度越來越高。當(dāng)企業(yè)的核心業(yè)務(wù)都運行在IT系統(tǒng)之上時,企業(yè)的業(yè)務(wù)連續(xù)性管理成為其IT治理中的重要課題。目前,針對高實時性IT系統(tǒng)的業(yè)務(wù)連續(xù)性在企業(yè)中的實踐方法研究并不多,各類型企業(yè)都結(jié)合自身業(yè)務(wù)模式和IT系統(tǒng)架構(gòu)制定各自的風(fēng)險事件應(yīng)急管理策略和措施。本文旨在針對高實時性IT系統(tǒng)的業(yè)務(wù)連續(xù)性管理的內(nèi)容進行探索,尤其在風(fēng)險事件的應(yīng)急管理方面,給出在企業(yè)在實際操作中的一些經(jīng)驗。
關(guān)鍵詞:業(yè)務(wù)連續(xù)性;風(fēng)險事件;應(yīng)急管理
IT系統(tǒng)業(yè)務(wù)連續(xù)性管理近年來受到越來越多企業(yè)的關(guān)注。2012 年5月15日ISO 正式頒布了 ISO 22301:2012,ISO 22301:2012 致力于提高組織彈性,其管理體系框架能夠幫助組織制定一套一體化的管理流程計劃,使企業(yè)對潛在的災(zāi)難加以辨識,幫助其確定可能發(fā)生的沖擊及對企業(yè)運作造成的威脅,并提供一個有效的管理機制來阻止或抵消這些威脅,減少災(zāi)難事件帶來的損失。
隨后,我國頒布了GB/T30146-2013《公共安全業(yè)務(wù)連續(xù)性管理體系要求》。這份國家標準等同采用國際標準ISO22301:2012。該標準的出臺旨在推動我國組織業(yè)務(wù)連續(xù)性管理體系的建立及與國際接軌,這為我國組織業(yè)務(wù)連續(xù)性管理體系獲得國際廣泛認可提供了保障。
因此,企業(yè)開始根據(jù)自身IT系統(tǒng)技術(shù)架構(gòu),結(jié)合業(yè)務(wù)運作模式,著手思考和落實業(yè)務(wù)連續(xù)性標準在企業(yè)實際的IT系統(tǒng)管理工作中進行落地實施的問題。
一、業(yè)務(wù)連續(xù)性管理和風(fēng)險事件應(yīng)急管理
在我國,企業(yè)引入IT系統(tǒng)業(yè)務(wù)連續(xù)性管理是近幾年的事情。對IT系統(tǒng)業(yè)務(wù)連續(xù)性管理的探索和實踐工作,也隨著企業(yè)的IT系統(tǒng)運行的規(guī)模不斷擴大,對IT系統(tǒng)運行依賴程度越來越高而不斷深入。
IT系統(tǒng)業(yè)務(wù)連續(xù)性管理是一項綜合管理策略和措施,它使企業(yè)識別出潛在的風(fēng)險和可能造成的影響。在此基礎(chǔ)上,制訂業(yè)務(wù)連續(xù)性的應(yīng)對策略和恢復(fù)計劃,其總體目標是為了提高企業(yè)的風(fēng)險防范能力,以有效地應(yīng)對非計劃的風(fēng)險事件,并降低受到不良影響。
IT系統(tǒng)業(yè)務(wù)連續(xù)性管理的理念即是為了應(yīng)對各類風(fēng)險事件對企業(yè)的業(yè)務(wù)運行造成影響以至中斷的問題。業(yè)務(wù)連續(xù)性管理是識別對組織的潛在威脅以及威脅一旦發(fā)生可能對業(yè)務(wù)運行帶來的影響一整套管理過程,該過程為組織建立有效應(yīng)對威脅和自我恢復(fù)能力提供了框架,以保護關(guān)鍵相關(guān)方的利益、聲譽、品牌和創(chuàng)造價值的活動。
IT系統(tǒng)業(yè)務(wù)連續(xù)性管理的內(nèi)容其實比較豐富。根據(jù)ISO22301-2012的標準,企業(yè)的業(yè)務(wù)連續(xù)性管理按照PDCA的思路,構(gòu)建相對完整的業(yè)務(wù)連續(xù)性管理系統(tǒng),業(yè)務(wù)連續(xù)性管理系統(tǒng)是經(jīng)常進行的活動的集合,業(yè)務(wù)連續(xù)性管理支持企業(yè)業(yè)務(wù)連續(xù)性管理活動,也支持技術(shù)災(zāi)難恢復(fù)活動。這些可以包括項目規(guī)劃和管理、人員配備、計劃、預(yù)測、預(yù)算編制、研究和開發(fā)、資源管理、通信、會議、教育活動、宣傳等。
根據(jù)CMI組織近年對英國國內(nèi)全行業(yè)的BCM開展情況的調(diào)查,發(fā)現(xiàn):已有85%的銀行業(yè)、保險業(yè)機構(gòu)采用了業(yè)務(wù)連續(xù)性管理(BCM)理念管理企業(yè)運營中斷風(fēng)險。其中69%的企業(yè)采用了業(yè)務(wù)影響分析(BIA)作為BCM的基礎(chǔ),81%的受訪經(jīng)理表示業(yè)務(wù)連續(xù)性管理以及BCP的建立對其企業(yè)的穩(wěn)定運營有極大的幫助運營,且BCM在中斷事件時發(fā)揮的減損效益大于其實施成本。
早在2001年“9.11”事件時,摩根斯坦利銀行和德意志銀行就創(chuàng)造了世界金融界的兩個奇跡,摩根斯坦利銀行第二天宣布重新全線營業(yè)。德意志銀行更是在2001年9月11日當(dāng)天就完成了3000億美元以上的巨額交易,這兩家銀行當(dāng)時能迅速化解災(zāi)難,正是源于完善的業(yè)務(wù)連續(xù)性管理中的災(zāi)難備份系統(tǒng)。他們迅速恢復(fù)營業(yè)的能力,既增強了投資者的信心,又為企業(yè)樹立了優(yōu)良的形象。而同樣位于世貿(mào)大廈的某銀行由于數(shù)據(jù)中心位于現(xiàn)場附近,進而造成了連續(xù)性的業(yè)務(wù)中斷,據(jù)其聲明,恐怖襲擊破壞了其部分計算機系統(tǒng),一些分支機構(gòu)被迫關(guān)閉,其第三季度的利潤因此下降了33%。
二、風(fēng)險事件管理的幾個方面
之所以提出“風(fēng)險事件”這個概念,是為了與日常IT管理中經(jīng)常會出現(xiàn)的“事件“做區(qū)別。事件出現(xiàn)的概率相對較高,而并不是所有的事件都會對業(yè)務(wù)系統(tǒng)運行產(chǎn)生影響(因為一般企業(yè)中IT系統(tǒng)架構(gòu)中都做了相對充分的冗余設(shè)計,某單一節(jié)點的失效不會引起整體業(yè)務(wù)系統(tǒng)運行)。而風(fēng)險事件專指已經(jīng)或如延誤處置將對企業(yè)IT系統(tǒng)業(yè)務(wù)運行產(chǎn)生影響,對企業(yè)客戶產(chǎn)生影響的事件。
在企業(yè)中,針對風(fēng)險事件管理,都會制定應(yīng)急管理管理制度規(guī)范,主要應(yīng)包括以下內(nèi)容:
1.應(yīng)急組織體系
應(yīng)急組織體系是指企業(yè)內(nèi)部,根據(jù)其IT系統(tǒng)架構(gòu),設(shè)定專門負責(zé)風(fēng)險事件應(yīng)急管理組織人員團隊,需要明確到具體的人員,而不僅僅是崗位角色。
一般地,企業(yè)風(fēng)險事件應(yīng)急管理組織由企業(yè)的高級管理人員掛帥,擔(dān)任組織的業(yè)務(wù)連續(xù)性管理的第一責(zé)任人。然后,由企業(yè)核心業(yè)務(wù)部門、IT技術(shù)部門、辦公室及后勤部門等組成應(yīng)急組織體系。其中,核心業(yè)務(wù)部門的職責(zé)為在風(fēng)險事件出現(xiàn)時,采取必要的業(yè)務(wù)應(yīng)急措施,組織業(yè)務(wù)應(yīng)急處置;IT技術(shù)部門的職責(zé)為采取必要的IT技術(shù)措施,組織IT技術(shù)應(yīng)急處置;辦公室和后勤部門的職責(zé)為負責(zé)風(fēng)險事件的報告,組織包括人員、場地、交通、通訊、應(yīng)急資金和應(yīng)急物資準備。此外,如有必要,還需組織信息披露和媒體溝通等事宜。
2.應(yīng)急管理流程
應(yīng)急管理流程是指企業(yè)內(nèi)部以及所可能涉及到的外部組織,在風(fēng)險事件出現(xiàn)時,應(yīng)急體系中各人有按照既定的角色和職責(zé),開展應(yīng)急處置工作的預(yù)定流程。一般的風(fēng)險事件的應(yīng)急管理流程應(yīng)包括從風(fēng)險事件的發(fā)現(xiàn)、報告、判斷、報告、技術(shù)診斷與處置、業(yè)務(wù)處置和風(fēng)險事件關(guān)閉等關(guān)鍵環(huán)節(jié)。此外,還可以包括媒體輿情監(jiān)控、與外部組織互動等輔助性環(huán)節(jié)。
在應(yīng)急處置中,業(yè)務(wù)處置和技術(shù)處置是同時開展的。業(yè)務(wù)處置主要面對公司的客戶,利用有效的備份手段,確保企業(yè)業(yè)務(wù)能夠順利進行。如果對客戶產(chǎn)生影響,需要組織對客戶的安撫工作,避免或減少影響范圍的進一步擴大。業(yè)務(wù)處置主要是IT技術(shù)部門的職責(zé),此時應(yīng)以快速恢復(fù)業(yè)務(wù)為原則,采取必要的技術(shù)手段(如主備切換等)。
在應(yīng)急管理流程中,特別要注意風(fēng)險事件的上報工作。一般的企業(yè)往往注重風(fēng)險事件的處置,而忽略上報的環(huán)節(jié)。而實際工作中,風(fēng)險事件的上報和處置一樣重要。其原因在于,一方面,風(fēng)險事件出現(xiàn)時,往往存在客戶、技術(shù)、指揮和后勤等多現(xiàn)場。如果各現(xiàn)場的處置人員不能有效的將各個現(xiàn)場的情況進行上報,則經(jīng)常會出現(xiàn)信息不對稱的情況。應(yīng)急管理總指揮應(yīng)該在充分了解各現(xiàn)場的情況后,綜合的判斷,給出應(yīng)急處置指揮方法。
3.應(yīng)急預(yù)案和應(yīng)急演練
風(fēng)險事件出現(xiàn)時,都是計劃外的事情,往往是在企業(yè)按部就班的進行日常業(yè)務(wù)時,突然出現(xiàn)。一旦出現(xiàn)后,對處置時間的要求非常緊迫。因此,如果業(yè)務(wù)系統(tǒng)運行實時要求高的企業(yè),需要事先制定好各類應(yīng)急預(yù)案。在風(fēng)險事件出現(xiàn)時,能夠按照既定的應(yīng)急預(yù)案開展處置工作。
風(fēng)險事件的處置包括業(yè)務(wù)處置和IT系統(tǒng)技術(shù)處置,應(yīng)急預(yù)案也需要分成業(yè)務(wù)處置應(yīng)急預(yù)案和IT系統(tǒng)技術(shù)處置應(yīng)急預(yù)案。應(yīng)急預(yù)案的內(nèi)容,應(yīng)該以出現(xiàn)的風(fēng)險事件可能性場景為導(dǎo)向,針對不同場景采取必要的和既定的措施。必要時,企業(yè)可以結(jié)合實際情況制定輿情監(jiān)控應(yīng)急預(yù)案和后勤保障應(yīng)急預(yù)案。
有了應(yīng)急預(yù)案后,如果不組織必要的應(yīng)急演練,則真正出現(xiàn)風(fēng)險事件時,預(yù)案的指導(dǎo)性依然不足。企業(yè)應(yīng)組織整個應(yīng)急組織體系中的各個部門,進行聯(lián)動式的應(yīng)急演練工作。通過應(yīng)急演練,一方面使各個角色對應(yīng)急處置的各部分內(nèi)容更加熟悉,另一方面也驗證應(yīng)急預(yù)案的有效性。因此,應(yīng)急演練工作重要性很高。在證券行業(yè)中,我國證監(jiān)會已經(jīng)明確要求各證券公司每年至少組織兩次IT系統(tǒng)應(yīng)急演練工作。其目的就是確保各證券公司的核心業(yè)務(wù)系統(tǒng)在出現(xiàn)風(fēng)險事件時,能夠有效的按照既定的應(yīng)急管理辦法和預(yù)案,有效的開展處置工作,并將風(fēng)險事件情況上報到監(jiān)管部門。
4.風(fēng)險事件總結(jié)
在完成了風(fēng)險事件處置后,企業(yè)應(yīng)該組織專門性的風(fēng)險事件總結(jié)工作。工作總結(jié)的內(nèi)容包括對風(fēng)險事件的定級、評估風(fēng)險事件造成的損失,確定風(fēng)險事件的根本原因,分析產(chǎn)生風(fēng)險事件和處置風(fēng)險事件過程中的各方面責(zé)任,必要時采取一定的管理處罰手段。最后,形成專門的風(fēng)險事件報告。
三、高實時性信息系統(tǒng)應(yīng)對風(fēng)險事件時的管理方法實踐
上述給出了企業(yè)在IT系統(tǒng)業(yè)務(wù)連續(xù)性管理中,組織風(fēng)險事件管理時所作的一些典型的、具體的和普遍的內(nèi)容。在不同業(yè)務(wù)類型的企業(yè)中,都需要結(jié)合其業(yè)務(wù)運作模式和企業(yè)組織架構(gòu)進行有效落地實施。然而,很多企業(yè)或組織的業(yè)務(wù)運行對信息系統(tǒng)依賴程度很高,IT系統(tǒng)運行的實時性也很高。在我國,銀行核心系統(tǒng)、證券交易系統(tǒng)、海關(guān)的報關(guān)系統(tǒng)等,都是業(yè)務(wù)高度依賴信息系統(tǒng),運行實時性很高的業(yè)務(wù)場景的典型代表。這種信息系統(tǒng)的運行一般是集中式部署,客戶分布廣泛,并發(fā)交易量非常大。其核心后臺系統(tǒng)一旦出現(xiàn)故障,就很有可能發(fā)生風(fēng)險事件,在很短時間內(nèi),企業(yè)的客戶就會面臨非常大的業(yè)務(wù)影響。以證券行業(yè)為例,證監(jiān)會對事件應(yīng)急處置的時長已經(jīng)給出明確的要求:證券公司的核心交易業(yè)務(wù)系統(tǒng),中斷2小時以上,則定義為特別重大事件;中斷30分鐘到2小時之間,則定義為重大事件;中斷5分鐘到30分鐘之間,則定義為較大事件;中斷5分鐘以下,則定義為一般事件。當(dāng)出現(xiàn)較大及以上事件時,證券公司將面臨著監(jiān)管處罰。按照上述規(guī)定,證券公司的核心交易系統(tǒng)的業(yè)務(wù)連續(xù)性指標RTO(業(yè)務(wù)恢復(fù)時間目標)均按照5分鐘來進行設(shè)計。除了核心交易業(yè)務(wù)系統(tǒng)架構(gòu)要支持5分鐘的故障切換外,其應(yīng)急處置能力也需要在5分鐘內(nèi)保障業(yè)務(wù)的恢復(fù)。因此,高實時性信息系統(tǒng)如果在較短時間內(nèi),有效的應(yīng)對風(fēng)險事件,成為了企業(yè)業(yè)務(wù)連續(xù)性管理的重要課題。
在這種類型的企業(yè)組織架構(gòu)中,一般按照職能型設(shè)置。業(yè)務(wù)部門、IT技術(shù)部門、辦公室及后勤部門等隸屬于不同的管理條線。一般性管理事宜,需要先按照其現(xiàn)有的組織架構(gòu)內(nèi)部層級進行匯報,到了部門負責(zé)人層級后,再進行部門之間的橫向通報。這種匯報途徑,在出現(xiàn)風(fēng)險事件時,將很難滿足短時間內(nèi)的恢復(fù)業(yè)務(wù)的要求。建立有效的風(fēng)險事件應(yīng)急管理組織體系、管理流程、準備應(yīng)急預(yù)案并演練等工作是基礎(chǔ),還需要在短時間內(nèi)的聯(lián)動開展應(yīng)急處置工作。對業(yè)務(wù)運行實時性要求高的企業(yè)風(fēng)險事件應(yīng)急管理的組織架構(gòu),可以風(fēng)險事件應(yīng)急處置總指揮為核心,構(gòu)建“星”型應(yīng)急組織結(jié)構(gòu)和應(yīng)急處置聯(lián)動機制,突破職能型組織結(jié)構(gòu)的溝通壁壘。
很多業(yè)務(wù)系統(tǒng)運行模式是7×24小時,因此在應(yīng)急處置總指揮的人員配備上,需要考慮實際人員的輪班值守的事情。應(yīng)急處置往往是高強度、高壓力、多人員的團隊協(xié)作,企業(yè)實際工作中的多人輪班值守的方法非常有效。輪班值守要做好排班工作和各班之間的交接工作。
四、總結(jié)
企業(yè)的IT系統(tǒng)業(yè)務(wù)連續(xù)性管理越來越受到重視,國際和國內(nèi)的標準也都先后頒布。而在實際企業(yè)組織中,需要結(jié)合標準和行業(yè)監(jiān)管要求等,將業(yè)務(wù)連續(xù)性管理具體落地,在風(fēng)險事件出現(xiàn)時,能夠有效組織應(yīng)急處置工作,避免或減少風(fēng)險事件對企業(yè)業(yè)務(wù)和客戶的影響。這些具體的工作需要結(jié)合企業(yè)具體組織和管理工作開展。有效的應(yīng)急處置組織體系是基礎(chǔ),流程和應(yīng)急預(yù)案需要進行演練而增強其實用性。針對高實時性業(yè)務(wù)系統(tǒng),為了短時間內(nèi)恢復(fù)業(yè)務(wù),就要打破職能部門之間溝通的壁壘,按照“星”型架構(gòu)快速開展應(yīng)急處置工作,將人員、流程和技術(shù)等核心要素爛熟于胸。
參考文獻
[1]宋勁松.英國應(yīng)急管理中的業(yè)務(wù)連續(xù)性管理及啟示,學(xué)術(shù)交流[J], 2011,(4):90-93.
[2]呂丹. 金融機構(gòu)的業(yè)務(wù)連續(xù)性管理,首席財富官[J],2015,(4):66-69
[3]喬海曙.賀凌華. 中國銀行業(yè)應(yīng)急管理問題與對策,金融論壇[J],2008,(11):33-38
作者簡介:武劍鋒(1981-),女,山西省壽陽縣人,博士,北京第二外國語學(xué)院國際商學(xué)院講師,主要研究方向是公司治理。