張云霞,宋宇博,史百戰(zhàn)
(1.蘭州交通大學機電技術研究所, 蘭州730070 ;2.甘肅聯合大學,蘭州730070)
隨著貨運站信息化建設的不斷深入,所擁有的計算機、服務器、網絡設備以及應用系統等IT資源越來越多,IT系統也越來越復雜。PC機品牌多樣、操作系統各不相同、分布于各個部門;服務器數量雖少但它們的品牌及操作系統亦不盡相同;而服務器與PC機又通過各種網絡設備連接在一起;同時運行在這些異構系統構成的硬件平臺之上的應用系統有貨運信息管理系統(CMS)、設備監(jiān)控系統(EMS)、設備控制系統(ECS)、企業(yè)資源規(guī)劃(ERP)和客戶關系管理(CRM),這些應用系統中的不同業(yè)務服務依賴于不同的PC機、服務器、網絡設備,與應用系統相關聯的PC機、服務器、網絡設備的運行狀態(tài)將直接或間接影響該系統業(yè)務服務的可用性,進而會影響到貨運站的總體收益。
鑒于以上貨運站IT資源的特點,不難發(fā)現以下幾個有待解決的問題:
(1)如何對貨運站的這些IT資源進行全面而有效地管理,使管理者對企業(yè)的IT資源有個宏觀的把握。
(2)如何對這些IT資源進行動態(tài)管理,使管理人員及時地掌握資源的使用情況、運行狀況,從而進行整體、科學的規(guī)劃。
(3)如何使業(yè)務服務、管理流程與資源使用相關聯,使得業(yè)務服務的故障與中斷可以做到有因可查、有根可究,方便IT運維管理人員及時解決問題、排除故障,從而得以高效利用這些IT資源。
對于貨運站來說,貨物處理的快速性、及時性將影響其業(yè)務水平,因此建立貨運站IT服務管理系統來解決上述幾個有待解決的問題,從而提高貨運站的業(yè)務水平十分必要。
ITSM(Information Technology Service Management,IT服務管理)是一套幫助企業(yè)對IT系統的規(guī)劃、研發(fā)、實施和運營進行有效管理的高質量方法。IT服務管理基本原理如圖1。
IT服務管理系統是集IT設備狀態(tài)監(jiān)控、系統平臺監(jiān)控和關鍵應用運行監(jiān)控于一體,結合IT服務管理庫,兼顧基礎環(huán)境管理,全面實現企業(yè)級IT服務監(jiān)、管、控三維一體的綜合管理平臺[1]。
目前IT服務管理系統主要應用于政府、電信行業(yè)和金融行業(yè),中小企業(yè)尚未廣泛應用。文章探討貨運站IT 服務管理系統的系統架構、功能模塊以及關鍵技術。
圖1 IT服務管理基本原理圖
依據某貨運站的網絡拓撲圖和分層架構思想可得貨運站IT服務管理系統的整體框架,如圖2。
(1)被監(jiān)控對象層:位于底層,它包括網絡拓撲圖中所有的硬件設備,以及企業(yè)所有的應用系統,如服務器、網絡設備、現場設備、ECS等。
(2)數據采集層:用于采集被監(jiān)控資源各項指標的數據,并將采集的初始數據存放在配置數據庫和性能數據庫。
(3)數據集成與處理層:將采集的初始數據標準化后存入數據庫中,以供系統的調用。
(4)業(yè)務邏輯處理層:依據ITIL(IT基礎信息架構庫)和ITSM,進行系統的業(yè)務邏輯處理。
(5)系統展現層:采用圖形化的方法展現采集的監(jiān)控數據以及業(yè)務邏輯處理后的報警等;與用戶互動,響應用戶的操作和設定;集成第3方監(jiān)控產品等。
(1)基礎架構管理:對各種IT資源進行管理,實現添加、刪除、修改和查詢。并對其基本信息進行維護。
(2)過程管理模塊:該模塊又包括配置管理、問題管理、變更管理、幫助平臺管理、知識庫管理、事件/故障管理、性能/預測管理以及輸出管理8個子模塊。
配置管理:實現各種IT資源配置的自動獲取,以及手動添加、刪除、修改和查詢。
問題管理:問題管理是指負責解決IT服務運營過程中遇到的所有問題的流程。問題管理的主要活動實質上就是分析以被列出問題的事件的根本原因,找出解決方案,把事件的影響最小化,并通過找到已發(fā)生事件或潛在事故的根本原因來減少事件的數量或消除事件的再次發(fā)生。
變更管理:變更管理是要確保在IT服務變動的過程中能夠有標準的方法,有效監(jiān)控這些變動,降低或消除因為變動所造成的問題。它的目的并不是控制和限制變更的發(fā)生,而是對業(yè)務中斷進行有效管理,確保變更有序進行。
幫助平臺管理:IT資源管理人員信息的公布,以及處理故障能力的評價,便于在出故障時第1時間找到處理故障的合適人選。
知識庫管理:對故障管理、問題管理進行記錄和積累,通過對以往故障、問題處理過程和結果專門的整理和審核,總結出解決一批故障的方案存入知識庫,以便解決新故障、新問題。
事件/故障管理:事件管理指的是突發(fā)事件/故障管理,處理IT的危機并要從中恢復運轉。即在出現事件/故障的時候,能夠盡可能地恢復服務的正常運作,避免業(yè)務中斷,以確保最佳的服務可用性級別。
性能/預測管理:設置IT資源性能報警的各個級別的閾值,根據不同的閾值生成不同的可用性報告。
輸出管理:根據系統登錄人員的不同及其關注信息的不同,生成不同的首頁。
(3)數據集成模塊:將采集的初始數據按照統一的格式標準化后存入數據庫中,以供核心程序的調用。
(4)數據采集:采集被監(jiān)控資源各項指標的數據。
使用Agent分布式方法去采集配置和性能信息。Agent的研究起源于人工智能領域,它是一個具有自適應性和智能性的軟件實體,能代表用戶或其它程序,以主動服務的方式完成一項工作。這里所使用的Agent是一個用C語言設計,一個基于CIP協議、TCP/IP協議方法和Socket類的一個主動獲取現場設備及終端的信息的小型程序,它包括Server Agent 和 Client Agent。其中發(fā)送的數據在應用層采用CIP協議格式,在傳輸層依據TCP協議封裝,在網絡層依據IP協議封裝。大多數平臺和系統都支持C程序運行,這就保證了Agent的跨平臺性。在每個IT資源上都安裝一個簡單的Client Agent,并讓它自主運作,它可以實時跟蹤所需信息的更改,并通過與Server Agent會話及時把變化后的信息傳輸到數據采集中心服務器。采用Agent的分布式數據采集方法符合貨運站現場采用以太網的數據采集的實際需求。
過程管理模塊和基礎架構管理模塊中各個子模塊的管理流程需依據ITIL(IT基礎架構知識庫)來實現,下面以故障管理為例來說明。
所謂故障是任何已經引起或可能引起服務中斷和服務質量下降的故障。故障管理的目的就是在出現故障的時候,工作人員能夠盡快地恢復服務的正常運行,避免業(yè)務中斷,以確保最佳的服務可用性級別。故障管理與其余各個模塊之間的關系較為緊密,如圖3。故障處理流程如圖4。
故障管理流程重點如下。
(1)故障歸類
圖4 故障處理流程
一般來說,當出現故障時,首先在運行維護平臺記錄與故障相關的提交人的信息,如姓名、工作地點和聯系電話、故障癥狀描述、相關的配置項等,而有關故障信息的詳細記錄是由處理人員完成的。但故障處理人員在記錄相關信息和確認故障后,接下來要做的并不是立即解決故障,而應是根據已有的知識和經驗對故障進行大致的劃分,以便采取相應的措施先對故障進行“歸類”,然后再進行初步處理。這里采取的措施和行動不以根本上解決故障為目標,主要目的是確保業(yè)務的持續(xù)運作。如果不能較快找到根本性解決方案,支持人員就要盡快找到臨時性解決方法。
(2)區(qū)分故障優(yōu)先級
在對故障進行歸類后,如果沒有成功地將故障與知名錯誤進行匹配,下一步就是確定故障的優(yōu)先級。
當支持人員必須同時處理數個故障,但受時間、資源和人力等的限制無法實現時,就要排定故障處理的先后次序,即確定每個故障的優(yōu)先級。
確定故障處理優(yōu)先級及相應所需的資源需要綜合考慮故障對業(yè)務的影響情況、恢復服務對業(yè)務的緊迫性、故障的大小、范圍和復雜程度以及當前可供選擇的資源。綜合考慮所有情況,可以用一個公式來計算:優(yōu)先級=影響度×緊迫性。其中,影響度是衡量故障影響業(yè)務大小程度的指標,通常相當于故障影響服務質量的程度。緊迫性是評價故障和問題危機程度的指標,是根據客戶的業(yè)務需求和故障或問題的影響制定的;而優(yōu)先級是根據影響程度和緊急程度而制定的故障和問題的處理順序。
為達到實時管理與人性化管理的目標,同時借鑒機場EMS設備監(jiān)控系統設備圖形化監(jiān)控系統的成功經驗,構建一個統一的人性化的圖形展現平臺,支撐統一的應用于展現界面、綜合的實時監(jiān)管、工單與維護作業(yè)以及統計分析。圖5為主機監(jiān)控界面。
圖5 主機監(jiān)控界面
貨運站IT服務管理系統可以從根本上解決IT資源的管理問題,提高IT資源的利用率,使得貨運站的吞吐量得以提高,貨物得以快速進出站,具有實際應用價值。
[1] 蔡雯瑛,鄭駿. 基于SNMP的IT服務管理系統的架構設計[J] .計算機應用與軟件,2007(5):178-180.
[2] 李佳. IT管理系統中采集管理子系統的設計與實現[D] .北京:北京郵電大學,2006.
[3] 冉崇善,趙萍. 基于ITlL的企業(yè)IT資源服務系統設計.信息與管理工程版[J] . 武漢理工大學學報,2006,28(5):80-83.
[4] 趙銘,方翎,王俏文,羅光磊.電力企業(yè)IT服務管理實踐[J] . 電力信息化,2007,5(9):34-37.
[5] 袁紅軍,肖漢. 基于ITIL的虛擬參考咨詢服務管理系統的設計與實現探究[J] . 計算機系統應用,2007(12):7-10.
[6] 胡波,詹瑾. 淺析IT服務管理系統的構建[J] . 廣東技術師范學院學報,2007(10):12-13.
[7] 肖君. 基于ITIL的教育資源庫服務質量管理系統的設計和應用[J] . 教育傳播與技術,2007(3):46-49.理