楊亞菲,賀媛婧
(國家開放大學(xué),北京100039)
隨著互聯(lián)網(wǎng)技術(shù)信息化的推進,各行各業(yè)的業(yè)務(wù)工作已離不開信息系統(tǒng)的支撐。由于運行與維護是軟件全生命周期中持續(xù)時間最長的階段,也是最重要的階段,因此用戶對信息系統(tǒng)使用滿意度一定程度上取決于信息系統(tǒng)上線運行后的運維服務(wù),提供高質(zhì)量、高效率的IT 運維服務(wù)是保障數(shù)據(jù)存儲持久性、保證業(yè)務(wù)連續(xù)性、保障設(shè)備可用性以及確保網(wǎng)絡(luò)安全性的關(guān)鍵。隨著信息系統(tǒng)數(shù)量增多以及規(guī)模擴大,IT 服務(wù)的不健全現(xiàn)象以及運維難題逐漸暴露出來。如何提供高質(zhì)量、高效率的IT運維服務(wù)是目前企業(yè)在IT 運維管理相關(guān)領(lǐng)域一直探索的問題。
此外,國家發(fā)布的《關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》《關(guān)于促進大數(shù)據(jù)發(fā)展行動綱要的通知》《國家信息化發(fā)展戰(zhàn)略綱要》《“十三五”國家信息化規(guī)劃》等良好的政策環(huán)境為IT 運維管理提供了更好的發(fā)展機會,將信息化建設(shè)提升到了戰(zhàn)略高度。與此同時,這些政策也對IT 運維管理提出了更高的要求,使運維管理工作在相關(guān)政策的引導(dǎo)下與大數(shù)據(jù)、區(qū)塊鏈以及5G 等新技術(shù)結(jié)合,實現(xiàn)IT 運維管理新形勢。
ITSS (Information Technology Service Standards,信息技術(shù)服務(wù)標(biāo)準(zhǔn)) 是我國主導(dǎo)下研制的一套IT服務(wù)領(lǐng)域的標(biāo)準(zhǔn)庫和一套提供IT 服務(wù)的方法論。其主要是圍繞人員、過程、技術(shù)、資源四個服務(wù)要素開展IT 服務(wù)的規(guī)劃設(shè)計、部署實施、運營、持續(xù)改進和監(jiān)督管理等生命周期活動。此外,規(guī)劃設(shè)計、部署實施以及運營階段是按照順序推進的,而持續(xù)改進和監(jiān)督管理都是貫穿于整個IT 服務(wù)生命周期。具體如圖1 所示。
IT 服務(wù)具體指滿足用戶IT 需求的服務(wù)產(chǎn)品與服務(wù)過程,其中服務(wù)過程指IT 需求得以滿足的全過程,而信息系統(tǒng)運維服務(wù)屬于IT 服務(wù)的重要組成部分。對于服務(wù)要素,其中人員要素是IT 服務(wù)過程中所有滿足要求的人員;資源要素是IT 服務(wù)過程中需要的服務(wù)工具、服務(wù)臺、備件庫及知識庫等資源;技術(shù)要素是IT 服務(wù)過程中使用到的各種具體技術(shù);過程要素是IT 服務(wù)過程中發(fā)生的有規(guī)律的活動。ITSS 整體生命周期包括規(guī)劃設(shè)計、部署實施、運營、持續(xù)改進和監(jiān)督管理各個階段。①
規(guī)劃設(shè)計階段主要了解客戶需求并對其進行全面需求分析,以實現(xiàn)對服務(wù)要素、服務(wù)模式和服務(wù)方案的具體設(shè)計。整個階段圍繞新服務(wù)、服務(wù)連續(xù)性保障、服務(wù)水平的滿足、對標(biāo)準(zhǔn)和規(guī)則的遵從以及在服務(wù)生命周期過程中為保持和增加服務(wù)價值所做的必要變更等方面開展服務(wù)需求識別、服務(wù)目錄設(shè)計、服務(wù)方案設(shè)計(包括服務(wù)模式設(shè)計、服務(wù)級別設(shè)計、服務(wù)要素設(shè)計)、服務(wù)成本評估和服務(wù)級別協(xié)議設(shè)計等活動,最終生成服務(wù)級別協(xié)議、運營級別協(xié)議或支持合同等服務(wù)方案。
部署實施階段使用標(biāo)準(zhǔn)化的方法管理人員、資源、技術(shù)和過程等服務(wù)要素,將規(guī)劃設(shè)計階段的所有服務(wù)要素完整地導(dǎo)入生產(chǎn)環(huán)境,為運營打下穩(wěn)定的基礎(chǔ)。具體對于人員要素的實施包括崗位外部招聘和內(nèi)部調(diào)崗、建立培訓(xùn)知識庫以及知識轉(zhuǎn)移方法;具體對于資源要素的實施包括初始化知識庫內(nèi)容、建立工具部署和使用手冊與相關(guān)制度、建立備件庫與測試可用性以及初始化服務(wù)臺管理制度;具體對于技術(shù)要素的實施包括轉(zhuǎn)移知識、制定與演練應(yīng)急響應(yīng)預(yù)案、編寫SOP 標(biāo)準(zhǔn)操作規(guī)范、發(fā)布技術(shù)手冊以及搭建測試環(huán)境;具體對于過程要素實施包括發(fā)布過程與制度、電子化過程和初始化數(shù)據(jù)以及體系試運行。
運營階段主要是通過對人員要素、資源要素、技術(shù)要素以及過程要素進行有效管控以提供低成本、高質(zhì)量的IT 服務(wù)。在此階段可以適當(dāng)控制客戶預(yù)期并引導(dǎo)客戶在服務(wù)過程中的配合程度以有效地達(dá)成客戶滿意度。具體對于人員要素的管理包括人員儲備和連續(xù)性管理、人員能力評價與管理、人員績效管理以及人員培訓(xùn)計劃執(zhí)行;具體對于資源要素的管理包括服務(wù)工具基本運營以及淘汰管理、服務(wù)臺管理與評價、備品備件管理以及知識管理;具體對于技術(shù)要素的管理包括技術(shù)研發(fā)規(guī)劃、技術(shù)研發(fā)預(yù)算以及技術(shù)成果的運用與改進;具體對于過程要素的管理是對整個服務(wù)過程中的服務(wù)報告、服務(wù)級別、問題、事件、發(fā)布、安全、變更、配置、容量以及可用性和連續(xù)性進行管理。
在持續(xù)改進階段,為了適應(yīng)不斷變化的業(yè)務(wù)需求,通過持續(xù)的識別改進機會并實施改進活動以滿足不斷變化的業(yè)務(wù)需求,并依次開展服務(wù)測量、服務(wù)回顧以及服務(wù)改進各個階段的活動。此階段貫穿于IT 運維服務(wù)的整個生命周期中各個環(huán)節(jié),與IT 服務(wù)的規(guī)劃設(shè)計、部署實施、運營以及監(jiān)督管理各個階段沒有先后順序關(guān)系。具體細(xì)節(jié)本文后續(xù)予以介紹。
監(jiān)督管理階段圍繞質(zhì)量管理、風(fēng)險管理以及信息安全管理三個方面對服務(wù)供方提供的服務(wù)過程、交付成果及服務(wù)成果開展績效評估,對IT 服務(wù)全生命周期各個階段的過程和質(zhì)量進行度量和評價,對服務(wù)提供方服務(wù)交付結(jié)果實施監(jiān)理以及績效評估以確定預(yù)期的服務(wù)質(zhì)量。其中質(zhì)量管理是根據(jù)安全性、可靠性、響應(yīng)性、有形性以及友好型等質(zhì)量屬性通過確定需求、指標(biāo)選型、實施評價以及評價結(jié)果對服務(wù)質(zhì)量評價,進而開展運維服務(wù)質(zhì)量策劃、運維服務(wù)質(zhì)量檢查以及運維服務(wù)質(zhì)量改進。IT 服務(wù)風(fēng)險管理針對IT 服務(wù)進行風(fēng)險管理計劃、風(fēng)險識別、風(fēng)險定性分析、風(fēng)險定量分析、風(fēng)險處置計劃、風(fēng)險監(jiān)控以及風(fēng)險跟蹤。信息安全管理是對整個IT 服務(wù)過程根據(jù)信息安全策略進行安全風(fēng)險評估并確定管理目標(biāo)和實施管理措施。
在IT 服務(wù)生命周期中,各個階段都是必不可少的,其中持續(xù)改進至關(guān)重要。通過對IT 服務(wù)進行持續(xù)改進可有效定位管控層和執(zhí)行層的關(guān)鍵績效指標(biāo),不斷適應(yīng)業(yè)務(wù)需求的變化,提升服務(wù)團隊的客戶響應(yīng)速度和業(yè)務(wù)熟練程度,規(guī)范化和制度化服務(wù)管理的流程,提高客戶對運維服務(wù)的滿意度,穩(wěn)步提升IT 服務(wù)管理水平。
持續(xù)改進過程貫穿整個IT 服務(wù)生命周期,該過程以滿足不斷變化的業(yè)務(wù)需求為目標(biāo),通過不斷識別改進機會并實施改進活動來提高IT 服務(wù)質(zhì)量。IT 服務(wù)改進方法圍繞PDCA 循環(huán)在服務(wù)測量、服務(wù)回顧以及服務(wù)改進三個過程規(guī)定了識別改進戰(zhàn)略、識別測量內(nèi)容、收集數(shù)據(jù)、處理數(shù)據(jù)、分析信息和數(shù)據(jù)、展示并回顧有關(guān)內(nèi)容、實施改進方案7 個過程步驟,[1]具體如圖2 所示。
“識別改進戰(zhàn)略”是在業(yè)務(wù)角度識別業(yè)務(wù)目標(biāo)以及業(yè)務(wù)級別,進而明確IT 服務(wù)改進活動的目標(biāo)和方向;“識別測量內(nèi)容”是在技術(shù)角度分析可以測量的數(shù)據(jù)以及指標(biāo),尋找差距以確定服務(wù)改進的可能性;“收集數(shù)據(jù)”根據(jù)規(guī)定的目標(biāo)收集數(shù)據(jù)并適當(dāng)?shù)乇O(jiān)控服務(wù)、過程和工具的應(yīng)用效果以保證服務(wù)質(zhì)量;“處理數(shù)據(jù)”對收集到的各種數(shù)據(jù)進行對比和處理;“分析信息和數(shù)據(jù)”對數(shù)據(jù)的上下文關(guān)系和聯(lián)系進行分析,并獲取潛在的關(guān)聯(lián)和隱含信息;“展示并使用信息”按照業(yè)務(wù)需要的方式對獲取的數(shù)據(jù)與信息進行展示;“實施改進”利用獲取的信息對服務(wù)進行改進、提高和優(yōu)化。
按照上面步驟展開IT 運維服務(wù)持續(xù)改進,在務(wù)管理流程和制度,使得在用戶提出運維服務(wù)請求開始到運維請求得到響應(yīng),再到系統(tǒng)相關(guān)問題或解決故障的整個過程無章可循,效率低下,如機房巡檢流程有待完善,終端回收流程有待改進。系統(tǒng)更新版本管理不當(dāng)以致于版本混亂,過程KPI服務(wù)測量工作中需要定義好對項目有針對性的服務(wù)測量框架,分析干系人聚焦的服務(wù)績效指標(biāo)。此外,進行任何一項活動都需要獲取管理層支持,還需注意利用相關(guān)機制管理技術(shù)部門與業(yè)務(wù)部門進行有效溝通與協(xié)調(diào)。在服務(wù)回顧工作中服務(wù)回顧報告以滿足業(yè)務(wù)與客戶需求為出發(fā)點進行調(diào)整和改進,服務(wù)回顧的更新需滿足業(yè)務(wù)和客戶對IT 能力的需求同時,還要確保相關(guān)干系人的認(rèn)同感。在服務(wù)改進工作中必須明確服務(wù)改進的動機,改進結(jié)果應(yīng)具備可測量和可追溯的特性,此外還需保證相關(guān)干系人的參與度較高。
從IT 運維管理角度講,在提供信息系統(tǒng)IT 運維服務(wù)的過程中人員、過程、技術(shù)以及資源四個服務(wù)要素方面經(jīng)常出現(xiàn)諸多問題,這些問題直接關(guān)系著信息系統(tǒng)的響應(yīng)請求的速度、系統(tǒng)業(yè)務(wù)連續(xù)性、不同角色用戶使用體驗以及運維服務(wù)需方滿意度。
在人員要素方面,存在的問題有運維團隊人員數(shù)量不足和缺乏技術(shù)經(jīng)驗,現(xiàn)場響應(yīng)慢,解決過程冗長;現(xiàn)場人員響應(yīng)方式不及時,遠(yuǎn)程響應(yīng)解決不了故障,運維人員職責(zé)邊界不明確,以致于收到運維服務(wù)請求沒有清晰的人員指向;甚至由于運維事件的不斷增加及人員流動造成人均工作負(fù)荷較重,造成團隊成員離職以致于出現(xiàn)內(nèi)部管理和服務(wù)效率低下。
在過程要素方面,缺乏規(guī)范且健全的運維服指標(biāo)未明確或KPI 信息來源不準(zhǔn)確導(dǎo)致過程評估評價不科學(xué),缺少與運行維護服務(wù)要求一致的信息安全策略、方針措施等。
在技術(shù)要素方面,運維監(jiān)控平臺技術(shù)相對落后,監(jiān)控指標(biāo)過于簡單,設(shè)備監(jiān)控不準(zhǔn)確難以支撐實際需求;給IT 服務(wù)供方與需方提供的技術(shù)標(biāo)準(zhǔn)不一致,應(yīng)急響應(yīng)預(yù)案內(nèi)容不夠完善;技術(shù)研發(fā)計劃不夠全面;對各類IT 服務(wù)所需技術(shù)缺乏統(tǒng)一管理,對成熟技術(shù)推廣不及時不到位,對于新技術(shù)的研發(fā)不夠重視,運維服務(wù)過程中產(chǎn)生的技術(shù)成果有待優(yōu)化。
在資源要素方面,缺乏有效的知識積累與共享,沒有健全的知識庫。在日常解決信息系統(tǒng)故障問題的時候運維人員沒有記錄、總結(jié)的意識,會造成解決類似事件效率低下,以及當(dāng)運維關(guān)鍵技術(shù)人員請假或離職等情況出現(xiàn)時,由于缺少原有人員經(jīng)驗和運維事件處理方法未落實到書面,會造成大量IT 運維知識資產(chǎn)和IT 運維經(jīng)驗流失,必然產(chǎn)生一定的時間成本和學(xué)習(xí)成本,新入職人員對原有運維流程和常見問題的處理操作生疏,造成客戶滿意度下降。
應(yīng)用基于ITSS標(biāo)準(zhǔn)的IT服務(wù)持續(xù)改進方法解決以上運維服務(wù)中識別的問題,需從服務(wù)測量、服務(wù)回顧以及服務(wù)改進三個維度開展工作。
服務(wù)測量是為了獲得與運維服務(wù)相關(guān)的各類數(shù)據(jù)和運維服務(wù)改進活動中所需的原始資料,通過監(jiān)測、測量和評審運維工作以及運維管理目標(biāo)的完成情況等一系列活動分析與運維服務(wù)計劃的差距,為運維服務(wù)改進提供依據(jù)。服務(wù)測量主要工作是圍繞人員、資源、技術(shù)、過程四個服務(wù)要素對其技術(shù)指標(biāo)、過程指標(biāo)和服務(wù)指標(biāo)展開測量。
服務(wù)人員測量需要對提供IT 服務(wù)的人員圍繞崗位職責(zé)管理、儲備管理、績效管理以及培訓(xùn)管理等方面進行測量。具體測量的內(nèi)容包括人員招聘情況是否與崗位需求相匹配,現(xiàn)有運維工程師的備份滿足度和可用性,運維人員的技能資質(zhì),運維工作量與飽和度測評,崗位職責(zé)具體更新情況,運維團隊工作狀態(tài),人員績效考核是否符合SMART原則,培訓(xùn)的應(yīng)用效果等。
服務(wù)資源測量需要對提供運維服務(wù)用到的服務(wù)工具、服務(wù)臺、備件庫和知識庫進行測量。具體測量的內(nèi)容包括服務(wù)工具的匹配度、可用性、可操作性和穩(wěn)定性,服務(wù)臺的接聽率、派單準(zhǔn)確率、錄單率以及解決問題的通話時間,備件庫中備件資產(chǎn)、備件損壞率、備件命中率以及備件復(fù)用率,知識庫的知識積累數(shù)量、知識利用率、知識更新率以及各類知識比例等。
服務(wù)技術(shù)測量需要對應(yīng)用到的運維技術(shù)進行測量。具體測量內(nèi)容包括運維服務(wù)技術(shù)規(guī)劃的完整性和落實情況,各種技術(shù)對運維業(yè)務(wù)的實際應(yīng)用效果和實用性,運維團隊是否利用有效的自動化運維工具,新技術(shù)在運維服務(wù)提供過程中使用情況,針對特殊事項實施應(yīng)急響應(yīng)預(yù)案的執(zhí)行效果等。
服務(wù)過程測量需要在技術(shù)視角和用戶視角分別對運維服務(wù)過程細(xì)節(jié)和運維服務(wù)成果進行考量。如在運維服務(wù)過程方面對服務(wù)等級協(xié)議(SLA)、重大事項、人員績效、用戶滿意度等相關(guān)指標(biāo)進行分析,在運維服務(wù)成果方面對事件、問題、變更、發(fā)布等進行統(tǒng)計分析。
服務(wù)回顧類似于滿意度調(diào)查或客戶回訪,只依靠對現(xiàn)在運維服務(wù)情況的測量是有局限的,還需要通過客戶回顧、項目內(nèi)部會議、視頻會議、運維服務(wù)報告、第三方機構(gòu)意見收集等方式對歷史運維服務(wù)情況進行回顧。
基于以上服務(wù)回顧形式可以借鑒業(yè)內(nèi)最佳實踐的四級回顧機制,第一級回顧是與服務(wù)主體針對重大事件、特殊事件如服務(wù)內(nèi)容變更和客戶投訴等進行不定期溝通;第二級回顧是召開項目月度例會,向服務(wù)主體匯報當(dāng)月服務(wù)情況如SLA 達(dá)成率,服務(wù)量等;第三級回顧是項目季度會,向服務(wù)主體匯報當(dāng)季項目運營情況如數(shù)據(jù)分析,客戶滿意度等;第四級回顧是項目年度回顧,向服務(wù)主體匯報項目整體實施交付情況。
服務(wù)回顧主要針對客戶回顧和運維團隊內(nèi)部回顧兩個方面明確具體回顧內(nèi)容。對于客戶回顧方面主要側(cè)重服務(wù)合同執(zhí)行情況、服務(wù)目標(biāo)達(dá)成情況、服務(wù)績效以及成果、客戶滿意度調(diào)查、客戶業(yè)務(wù)需求的變化、服務(wù)中存在的問題、上次會議制定計劃的進展以及下一步行動計劃等內(nèi)容。對于運維團隊內(nèi)部回顧方面主要側(cè)重上一周期工計劃回顧、本周期特殊或疑難工單、本周期未解決工單、各小組當(dāng)前周期工作簡報、本周期運維工程師KPI 總結(jié)、下一周期工作計劃等內(nèi)容。
根據(jù)以上服務(wù)測量得出的相關(guān)數(shù)據(jù)和關(guān)鍵績效指標(biāo)以及服務(wù)回顧收集的客戶和團隊內(nèi)部相關(guān)情況,進行最重要的一步即服務(wù)改進。服務(wù)改進圍繞人員、資源、過程及技術(shù)服務(wù)要素先后按照服務(wù)改進設(shè)計、服務(wù)改進實施、服務(wù)改進驗證三個階段開展。
服務(wù)改進設(shè)計根據(jù)服務(wù)改進目標(biāo)如提高用戶響應(yīng)速度、提升業(yè)務(wù)連續(xù)性,結(jié)合服務(wù)測量、服務(wù)回顧、客戶需求以及IT 業(yè)界標(biāo)準(zhǔn)等依據(jù),制定服務(wù)改進計劃。服務(wù)改進計劃內(nèi)容需要根據(jù)具體運維情況明確改進活動基本信息,如服務(wù)改進范圍描述,圍繞4 個服務(wù)要素的改進方案,相關(guān)干系人的職責(zé)與角色等內(nèi)容。服務(wù)改進計劃是服務(wù)改進階段的工作依據(jù)和工作指南,所以此文件需要具有科學(xué)性、針對性和客觀性。
服務(wù)改進實施需要運維服務(wù)團隊根據(jù)已經(jīng)制定好的服務(wù)改進計劃以及具體方案圍繞人員、資源、技術(shù)、過程四要素進行服務(wù)改進實施。人員要素在提高人員素質(zhì)、調(diào)整人員儲備比例、調(diào)整人員崗位結(jié)構(gòu)、改善績效考核方案等幾方面改進。資源要素在保障資源對業(yè)務(wù)的完整覆蓋和支撐、完善IT 工具、優(yōu)化服務(wù)臺管理制度、改進知識庫和備件庫等幾個方面改進。技術(shù)要素在技術(shù)研發(fā)計劃重新規(guī)劃與改進、技術(shù)成果優(yōu)化改進、完善技術(shù)文檔、改進應(yīng)急預(yù)案、更新監(jiān)控與閾值等幾方面改進。過程要素在完善現(xiàn)有運維過程和建立新服務(wù)管理過程等方面改進。
服務(wù)改進驗證需要在服務(wù)改進實施后,對照改進目標(biāo)和改進計劃發(fā)起回顧會議,核對指標(biāo)完成情況,并在服務(wù)改進控制表中記錄結(jié)果。對未達(dá)標(biāo)項目組織分析原因并制定改進措施。最后將服務(wù)改進驗證結(jié)果形成書面統(tǒng)計分析和改進報告,上報質(zhì)量管理部門以及主管領(lǐng)導(dǎo)。
隨著互聯(lián)網(wǎng)的發(fā)展,信息系統(tǒng)已經(jīng)成為人們業(yè)務(wù)工作和日常生活不可或缺的信息載體。而隨著各類業(yè)務(wù)的信息系統(tǒng)大量涌現(xiàn),我們逐漸意識到科學(xué)規(guī)范的運維服務(wù)管理對信息系統(tǒng)整個過程的應(yīng)用起著至關(guān)重要的作用。為改變當(dāng)前被動管理的局面,有效地提升人員、資源、技術(shù)、過程管控能力,以形成主動管理的態(tài)勢,我們需要在IT 服務(wù)過程中踐行ITSS 系列標(biāo)準(zhǔn)和方法,持續(xù)不斷的循環(huán)評估和改進信息系統(tǒng),以做到建立健全的IT 運維服務(wù)管理制度,提升IT 的服務(wù)管理水平,滿足用戶相關(guān)服務(wù)請求有條不紊地得到響應(yīng),做到問題高效率高質(zhì)量得到解決,提高客戶的滿意度。
【注釋】
①GB/T28827.1-2012 《信息技術(shù)服務(wù) 運行維護 第1 部分:通用要求》。