李 明
(魯能集團科信部,山東 濟南 250001)
信息化是實現(xiàn)管理標準化的重要手段,是保證魯能集團公司正常運營的重要工具。魯能集團公司信息系統(tǒng)運維由信息中心負責(zé),包括網(wǎng)絡(luò)系統(tǒng)運維組和應(yīng)用系統(tǒng)運維組。網(wǎng)絡(luò)系統(tǒng)運維組工作內(nèi)容是負責(zé)本公司所有網(wǎng)絡(luò)、安全、服務(wù)器、機房監(jiān)控等系統(tǒng)的運維;應(yīng)用系統(tǒng)運維組工作內(nèi)容是負責(zé)ERP、協(xié)同辦公、辦公自動化等各個業(yè)務(wù)應(yīng)用系統(tǒng)運維。
魯能集團公司目前在線運行有30多個業(yè)務(wù)系統(tǒng),包括已經(jīng)投運的、正在建設(shè)的、未移交運維的,應(yīng)用范圍涉及多個專業(yè)領(lǐng)域,包括房地產(chǎn)業(yè)、新能源產(chǎn)業(yè)、酒店商貿(mào)業(yè)、煤電產(chǎn)業(yè)、電工電氣、控股公司等業(yè)務(wù),專業(yè)多、門類廣,給運維人員做好各個業(yè)務(wù)系統(tǒng)的運維接口工作帶來了一定難度。
首先,做好運維溝通會議,把所有的業(yè)務(wù)系統(tǒng)進行匯總,列出清單,重點說明實施項目廠家聯(lián)系方式。其次是把各個業(yè)務(wù)系統(tǒng)按照運維響應(yīng)優(yōu)先級別進行歸類,分成一、二、三類,采取平衡分配方法分配到每一個運維人員。
每個運維人員,根據(jù)平衡分配方法,把負責(zé)的各個業(yè)務(wù)系統(tǒng)進行梳理,尤其是實施廠家的聯(lián)系方式,索要系統(tǒng)自建設(shè)到投運以來的系統(tǒng)設(shè)計方案、系統(tǒng)部署方案、用戶操作手冊、系統(tǒng)管理員手冊、應(yīng)急預(yù)案、系統(tǒng)驗收等相關(guān)資料,資料應(yīng)盡量詳細。
對照所收集的資料進行認真梳理,進一步了解業(yè)務(wù)系統(tǒng),同時,聯(lián)系業(yè)務(wù)對口部門就業(yè)務(wù)系統(tǒng)應(yīng)用情況進行回訪,了解整個業(yè)務(wù)系統(tǒng),認真分析收集的資料,把重要的資料篩選出來。
根據(jù)資料收集和業(yè)務(wù)系統(tǒng),形成系統(tǒng)運維手冊。應(yīng)結(jié)合運維實踐,寫出大綱具體內(nèi)容,大綱包括:系統(tǒng)概況、部署方式、系統(tǒng)備份和恢復(fù)策略、性能監(jiān)控與調(diào)整、升級管理、接口集成情況、系統(tǒng)角色管理、日常運維常見問題、應(yīng)急預(yù)案等。
以ESB(企業(yè)服務(wù)總線)應(yīng)用集成系統(tǒng)為例,由搜集資料、梳理資料、結(jié)合實際清理資料,編制運維手冊。
2.4.1 系統(tǒng)概況
系統(tǒng)概述。ESB(企業(yè)服務(wù)總線)是國家電網(wǎng)公司統(tǒng)一選型的產(chǎn)品,在公司搭建應(yīng)用集成平臺,為各業(yè)務(wù)應(yīng)用提供統(tǒng)一的基礎(chǔ)接入通道、服務(wù)共享平臺和流程協(xié)作平臺。通過系統(tǒng)整合簡化集成關(guān)系,綜合利用各種手段全面推進,實現(xiàn)信息系統(tǒng)的橫向集成。
應(yīng)用情況。魯能集團ESB應(yīng)用集成實施完成了應(yīng)用集成平臺的搭建,該系統(tǒng)目前有13個業(yè)務(wù)模塊68個業(yè)務(wù)接口,實現(xiàn)了電網(wǎng)ERP與招投標管理、物資管理系統(tǒng)、人資管理系統(tǒng)、法律事務(wù)管理、主數(shù)據(jù)類、憑證類、財務(wù)調(diào)考、專利管理系統(tǒng)、財務(wù)類等業(yè)務(wù)應(yīng)用集成。
目前各業(yè)務(wù)接口都運轉(zhuǎn)良好,實現(xiàn)了“信息一次錄入、重復(fù)利用”的預(yù)定目標。該系統(tǒng)于2010年12月開始實施,2011年5月服務(wù)器上架,目前業(yè)務(wù)系統(tǒng)運維工作由實施廠商負責(zé),硬件系統(tǒng)運維由信息中心負責(zé)。
2.4.2 系統(tǒng)部署
技術(shù)架構(gòu)。國家電網(wǎng)公司應(yīng)用集成建設(shè),采用SOA思想設(shè)計,基于服務(wù)總線技術(shù)構(gòu)架應(yīng)用集成平臺,業(yè)務(wù)應(yīng)用采用標準WEB服務(wù)封裝接口,通過應(yīng)用集成平臺統(tǒng)一管理、調(diào)用實現(xiàn)數(shù)據(jù)的共享和流程的互通。魯能集團ESB應(yīng)用集成系統(tǒng)為二級部署,見圖1和圖2。
圖1 兩層集成平臺級聯(lián)架構(gòu)
圖2 應(yīng)用集成部署架構(gòu)
開發(fā)服務(wù)器。服務(wù)總線的開發(fā)環(huán)境,進行單元測試和初級集成測試,進行產(chǎn)品測試,模擬測試和性能測試。
運行服務(wù)器。企業(yè)信息服務(wù)總線的運行環(huán)境集群。除了服務(wù)總線,還部署有全局服務(wù)目錄。服務(wù)總線運行服務(wù)器集群可根據(jù)實際業(yè)務(wù)量進行擴展,增加新的處理服務(wù)器。
2.4.3 系統(tǒng)環(huán)境
系統(tǒng)環(huán)境以表格形式列出,如表1所示。
表1 系統(tǒng)環(huán)境表
2.4.4 備份恢復(fù)策略
文件備份。登錄進入ESB控制臺,用戶名為:weblogic,密碼為 ********,點擊 System Administration(系統(tǒng)管理)→Export Resources(導(dǎo)出資源)→選擇需要導(dǎo)出的項目→點擊Export(導(dǎo)出)→輸入密碼→點擊完成導(dǎo)出并保存,將導(dǎo)出的數(shù)據(jù)保存到指定的位置,可以將導(dǎo)出的文件刻錄到其它保存處,如光盤,U盤等。
文件恢復(fù)。如遇文件損壞,可將備份文件重新導(dǎo)入,進入到ESB控制臺,點擊System Administration(系統(tǒng)管理),先點擊Create按鈕→點擊瀏覽→找到要導(dǎo)入的文件→點擊next→需要輸入導(dǎo)出時設(shè)置的密碼→導(dǎo)入文件→點擊Submint按鈕,完成導(dǎo)入。
2.4.5 性能監(jiān)控與調(diào)整。
平臺監(jiān)控。登陸sbconsole控制臺,點擊頁面的Server Health→AdminServer,可以查看服務(wù)的具體配置情況。
日志監(jiān)控。后臺日志地址:D:eauser_projectsdomainsase_domainase_domainserversAdmin-Serverlogs。在此目錄下有很多日志文件,可以根據(jù)日期,查看最近的日志輸出。
2.4.6 升級管理
目前此軟件不需要升級,如果需要升級,廠商會通知客戶并安排實施人員到現(xiàn)場完成應(yīng)用集成系統(tǒng)軟件的升級操作。
2.4.7 系統(tǒng)權(quán)限管理
系統(tǒng)只對外開放一個用戶,即系統(tǒng)管理員用戶,用于日常查看系統(tǒng)運行情況、性能,以及項目的備份與還原操作。
2.4.8 接口集成情況
目前已在正式服務(wù)器上運行的接口有:財務(wù)管控與ERP系統(tǒng)接口、物資模塊與經(jīng)法系統(tǒng)接口、物資模塊與招標系統(tǒng)接口、總部人資與直屬單位人資系統(tǒng)接口、ERP賬號與門戶系統(tǒng)接口、專利管理系統(tǒng)與套裝軟件之間知識產(chǎn)權(quán)信息接口等。
2.4.9 應(yīng)急預(yù)案
應(yīng)用集成系統(tǒng)故障定位方法。登陸應(yīng)用集成系統(tǒng)首頁,若能正確顯示登陸頁面,使用正確的用戶名密碼登錄系統(tǒng),進入系統(tǒng)管理界面,如果頁面打開緩慢甚至無法打開時,ping應(yīng)用集成系統(tǒng)IP地址(10.*.*.*),看是否 ping通,若能 ping 通,則網(wǎng)絡(luò)連接無問題,否則聯(lián)系應(yīng)用集成運維人員,確定應(yīng)用集成服務(wù)運行是否正常。
故障快速定位流程圖如圖3所示。
圖3 故障快速定位流程圖
2.4.10 常見問題
1)ESB非正常關(guān)閉。解決方法:系統(tǒng)啟動包括三種方式,方式一:至目錄%DOMAIN_HOME%in,執(zhí)行 startWebLogic.cmd;方式二:點擊桌面ESB服務(wù)啟動圖標;方式三:點擊計算機左下角的開始,點擊所有程序,找到Oracle Weblogic,UserProjects,base_domain,點 擊 Start Server for oracle Service bus domain。系統(tǒng)關(guān)閉包括兩種方式,方式一:直接關(guān)掉服務(wù)窗口;方式二:點擊計算機左下角的開始,點擊所有程序,找到Oracle Weblogic,UserProjects,base_domain,點擊 StopServer。
2)ESB無法啟動。若無法正常啟動企業(yè)服務(wù)總線,則可能內(nèi)部出現(xiàn)了無法修復(fù)的錯誤,此時需要重新配置域,并將備份項目導(dǎo)入到新的域中。登錄到應(yīng)用集成系統(tǒng)應(yīng)用服務(wù)器桌面,打開域創(chuàng)建所在的目錄 D:eawlserver_10.3commonin,找到config.exe文件→雙擊執(zhí)行→選擇Create a new WebLogic domain(創(chuàng)建一個新域)→點擊Next→選中Oracle Service Bus→點擊Next→輸入用戶名和密碼→點擊Next→輸入域的名稱與路徑→點擊Create→創(chuàng)建完成。然后參考2.4.3備份恢復(fù)策略之文件恢復(fù)。
3)應(yīng)用集成系統(tǒng)頁面無法打開。一般有兩種原因,即應(yīng)用服務(wù)異常和網(wǎng)絡(luò)故障。對于應(yīng)用服務(wù)異常,參考系統(tǒng)啟動方式。對于網(wǎng)絡(luò)故障,聯(lián)系網(wǎng)絡(luò)相關(guān)負責(zé)人,查看網(wǎng)絡(luò)故障的原因,如果是服務(wù)器硬件壞掉,聯(lián)系設(shè)備廠商在最短的時間內(nèi)進行維系或更換;如果是網(wǎng)絡(luò)不通,則請網(wǎng)絡(luò)負責(zé)人開通網(wǎng)絡(luò)。
4)應(yīng)用集成系統(tǒng)啟動異常。一般是應(yīng)用集成系統(tǒng)域文件損壞造成,通過應(yīng)用集成系統(tǒng)域的創(chuàng)建與配置來解決。
5)應(yīng)用集成系統(tǒng)項目文件損壞。項目文件大多數(shù)是人為造成的損壞,如誤刪除等操作,參考備份恢復(fù)策略來解決。
完成業(yè)務(wù)系統(tǒng)梳理工作、形成系統(tǒng)運維手冊,這些工作僅僅是運維管理梳理工作的開始。由于各個業(yè)務(wù)模塊實施廠家提供材料不統(tǒng)一、不全面,所以運維手冊內(nèi)容未必完善。在此,可以形成規(guī)范管理制度,比如在字體上、格式上、提綱方面要求統(tǒng)一規(guī)范,進一步完善,切合實際形成適合運維人員使用的系統(tǒng)運維操作手冊等,用以指導(dǎo)規(guī)范運維工作。
實施廠家運維手冊通常是通用型的,但是未必是適合自己的運維手冊,畢竟各個網(wǎng)省的信息系統(tǒng)運行環(huán)境不同。對于未移交運維工作的業(yè)務(wù)系統(tǒng),即目前由實施廠家運維的業(yè)務(wù)系統(tǒng),運維手冊可能不全面或者不完善,應(yīng)結(jié)合自己的運維經(jīng)驗、工作實際情況來完善符合己方的系統(tǒng)運維手冊。在移交運維工作前完全可以要求實施廠家完成符合己方的運維手冊。
對于在建系統(tǒng),運維人員應(yīng)當滲透到業(yè)務(wù)整個建設(shè)周期進行管理,按照統(tǒng)一的規(guī)范與標準,運維工作不應(yīng)該在業(yè)務(wù)接手時就開始考慮,要做好業(yè)務(wù)系統(tǒng)的運維工作,應(yīng)從業(yè)務(wù)系統(tǒng)的設(shè)計開始接觸。