陳瀚
隨著信息化建設(shè)不斷地發(fā)展進(jìn)步,無(wú)論是企事業(yè)單位還是學(xué)校、政府機(jī)關(guān)都開(kāi)始運(yùn)用信息系統(tǒng)進(jìn)行日常管理。
眾所周知,信息系統(tǒng)是一個(gè)復(fù)雜龐大的工程,無(wú)論設(shè)計(jì)和建設(shè)時(shí)思慮周全,在實(shí)際的應(yīng)用場(chǎng)景和運(yùn)行過(guò)程中信息系統(tǒng)還是會(huì)存在這樣那樣的問(wèn)題。無(wú)論信息系統(tǒng)運(yùn)行過(guò)程中出現(xiàn)了硬件還是軟件的問(wèn)題,都需要運(yùn)維工程師及時(shí)發(fā)現(xiàn)問(wèn)題所在并快速準(zhǔn)確的將故障排除,保證整套系統(tǒng)正常平穩(wěn)運(yùn)行。
運(yùn)維工程師該如何高效的處理各種問(wèn)題,做好系統(tǒng)運(yùn)維?筆者認(rèn)為應(yīng)該在平時(shí)做好優(yōu)化,同時(shí)面對(duì)還沒(méi)出現(xiàn)的問(wèn)題未雨綢繆地做好對(duì)策。下文將就信息系統(tǒng)運(yùn)維模式及其優(yōu)化對(duì)策進(jìn)行簡(jiǎn)單的闡述。
(一)系統(tǒng)故障由運(yùn)維工程師解決(被動(dòng)式運(yùn)維模式)
在平時(shí)的運(yùn)維過(guò)程中,有一種最普遍的運(yùn)維模式,那就是被動(dòng)式運(yùn)維。這種被動(dòng)式運(yùn)維在故障處理中是最為常見(jiàn)的一種。
通常,這種運(yùn)維模式是由使用者發(fā)現(xiàn)系統(tǒng)故障,使用者聯(lián)系運(yùn)維工程師,運(yùn)維工程師對(duì)故障進(jìn)行處理,最終解決問(wèn)題完成該次信息系統(tǒng)的運(yùn)維動(dòng)作。這樣的運(yùn)維模式和解決方法最直觀,但是卻是一種效率低下的被動(dòng)式運(yùn)維模式。
因?yàn)檫@樣的運(yùn)維模式“反射弧”太長(zhǎng),面對(duì)故障的響應(yīng)時(shí)間存在延遲。從發(fā)現(xiàn)問(wèn)題到解決問(wèn)題的過(guò)程往往拖沓耗時(shí),甚至可能因此直接影響到整個(gè)信息系統(tǒng)的正常運(yùn)轉(zhuǎn)。在這種運(yùn)維模式中,系統(tǒng)出現(xiàn)了問(wèn)題和故障且具體影響到系統(tǒng)使用或正常生產(chǎn)活動(dòng)。這時(shí),相關(guān)使用者發(fā)現(xiàn)后,才將其上報(bào)給運(yùn)維工程師,運(yùn)維工程師再對(duì)問(wèn)題和故障進(jìn)行處理。
其實(shí)這個(gè)問(wèn)題和故障可能早就顯現(xiàn),也可能更快更高效的解決掉。因?yàn)?,在系統(tǒng)發(fā)生某些嚴(yán)重的問(wèn)題和故障前,可能早就已經(jīng)已經(jīng)存在某些小的問(wèn)題,但由于并沒(méi)有影響到具體使用,于是作為非專業(yè)人員的使用者,對(duì)此類故障一般不會(huì)注意到或是得過(guò)且過(guò)的忽略掉這些問(wèn)題。須知,千里之堤毀于蟻穴,正是這些被忽視的小問(wèn)題,不斷累積放大,最終發(fā)展成為影響正常使用的故障。
(二)系統(tǒng)故障由使用者和運(yùn)維工程師共同解決(干預(yù)式運(yùn)維模式)
隨著各類信息化系統(tǒng)的應(yīng)用日益廣泛和普及,使用者在使用的過(guò)程中或多或少地接觸過(guò)故障,甚至解決過(guò)簡(jiǎn)單的系統(tǒng)問(wèn)題和故障;亦或通過(guò)自身學(xué)習(xí)進(jìn)而掌握了部分故障的處理方法。于是,在工作時(shí)發(fā)現(xiàn)系統(tǒng)中的小故障以后,使用者會(huì)先嘗試自行處理和解決,在解決問(wèn)題和故障的同時(shí)進(jìn)行上報(bào)知會(huì)運(yùn)維工程師。如故障無(wú)法解決時(shí),運(yùn)維工程師已經(jīng)有了前期的報(bào)備和了解,再進(jìn)行處理會(huì)減少故障處理的延遲。
這樣的模式,筆者稱之為干預(yù)式運(yùn)維模式:由接觸系統(tǒng)最多的相關(guān)使用者作為最早發(fā)現(xiàn)系統(tǒng)問(wèn)題和故障的“前端運(yùn)維工程師”。作為第一線的系統(tǒng)使用者,面對(duì)系統(tǒng)中存在的問(wèn)題和故障會(huì)比運(yùn)維工程師發(fā)現(xiàn)得更早更快,由他們?cè)诔跗趯?duì)問(wèn)題和故障進(jìn)行處理大大縮短了故障解決的響應(yīng)時(shí)間。
這樣的模式要比傳統(tǒng)的動(dòng)式運(yùn)維模式高效,也容易將小的問(wèn)題和故障扼殺在搖籃里,提高整個(gè)系統(tǒng)的健康度和運(yùn)維效率。
(三)系統(tǒng)故障由監(jiān)控報(bào)警運(yùn)維工程師第一時(shí)間解決(預(yù)警式運(yùn)維模式)
如果想要比人更快發(fā)現(xiàn)問(wèn)題和故障,那么就需要在系統(tǒng)本身上做文章。一套成熟的監(jiān)控系統(tǒng)在信息系統(tǒng)運(yùn)維過(guò)程中至關(guān)重要!
為了解決故障發(fā)現(xiàn)到解決的時(shí)效性的問(wèn)題,通常會(huì)開(kāi)發(fā)相關(guān)監(jiān)控系統(tǒng)配合主系統(tǒng)運(yùn)行,這套監(jiān)控系統(tǒng)會(huì)實(shí)時(shí)監(jiān)控主系統(tǒng)中部分關(guān)鍵項(xiàng)目,一旦發(fā)現(xiàn)故障和問(wèn)題的端倪立刻記錄并報(bào)警。這樣的報(bào)警監(jiān)控系統(tǒng)會(huì)讓運(yùn)維工程更快獲取到故障信息,縮短故障處理的時(shí)長(zhǎng)。而這樣的運(yùn)維方法可以稱之為預(yù)警式運(yùn)維模式。
筆者根據(jù)自身在工作中的經(jīng)驗(yàn)和不斷的學(xué)習(xí)歸納出了一些想法和優(yōu)化策略。主要從以下這些方面完善和優(yōu)化。
(一)轉(zhuǎn)換思想,從保姆式管理(被動(dòng)式)向主動(dòng)干預(yù)式管理轉(zhuǎn)變
很多公司的管理層對(duì)運(yùn)維的理解比較單一,他們認(rèn)為運(yùn)維就是:使用者在工作中使用系統(tǒng)時(shí)出現(xiàn)了問(wèn)題,進(jìn)行匯報(bào),隨后由運(yùn)維工程師進(jìn)行處理。殊不知,這樣的思想和運(yùn)維模式最容易在使用者中滋生出坐、等、靠的不良習(xí)慣。只要是系統(tǒng)出現(xiàn)的問(wèn)題,不管問(wèn)題多小多簡(jiǎn)單,都必須由運(yùn)維來(lái)處理。甚至有的員工因此產(chǎn)生惰性,滋生“系統(tǒng)出現(xiàn)問(wèn)題剛好可以磨洋工,等待運(yùn)維解決期間趁機(jī)休息偷懶”的不良現(xiàn)象。
雖然,運(yùn)維解決單個(gè)簡(jiǎn)單問(wèn)題的時(shí)間不會(huì)太長(zhǎng),但隨著網(wǎng)點(diǎn)數(shù)量增加、故障上報(bào)數(shù)量也會(huì)隨之增加、造成的單據(jù)排隊(duì)等待解決的狀況將不可避免,直接導(dǎo)致等待時(shí)長(zhǎng)的大幅增加。這樣的結(jié)果就是:正常業(yè)務(wù)運(yùn)行受到影響、問(wèn)題等待處理時(shí)長(zhǎng)增加、運(yùn)維工程師資源浪費(fèi);進(jìn)而造成一線網(wǎng)點(diǎn)顧客(或相關(guān)人員)投訴事件增多(直接影響公司、單位的美譽(yù)度和口碑)、對(duì)員工上班熱情和積極性產(chǎn)生不良影響。
要改變這一現(xiàn)象,筆者認(rèn)為,應(yīng)當(dāng)由上至下進(jìn)行思想轉(zhuǎn)變。首先,我們可以將簡(jiǎn)單的、不涉及到經(jīng)營(yíng)基礎(chǔ)數(shù)據(jù)的故障處理方法教給使用者,讓其自行排查解決。同時(shí)為了避免使用者的不專業(yè)造成“越幫越忙,越修越亂”的狀況,對(duì)系統(tǒng)使用者進(jìn)行適當(dāng)?shù)呐嘤?xùn)。
具體方案是組織力量,將簡(jiǎn)單故障處理的方法以文檔、視頻等方式進(jìn)行匯編、培訓(xùn),切實(shí)提升使用者處理問(wèn)題的能力。 不再做使用者的保姆,事無(wú)巨細(xì)什么都出手;而是讓他們成為“第一線的前端運(yùn)維工程師”,及時(shí)發(fā)現(xiàn)問(wèn)題,一邊解決一邊報(bào)備,實(shí)在解決不了再由運(yùn)維工程師出手解決。
(二)轉(zhuǎn)變管理,做好主動(dòng)運(yùn)維
俗話說(shuō)得好,“進(jìn)攻是最好的防守”,面對(duì)問(wèn)題主動(dòng)出擊,將小問(wèn)題和故障扼殺在搖籃里,無(wú)疑是提高運(yùn)維效率的捷徑;而對(duì)于信息系統(tǒng)中的問(wèn)題和故障,比使用者更清楚的是“系統(tǒng)自己”。
在監(jiān)控系統(tǒng)方面,首先,運(yùn)維團(tuán)隊(duì)可以從日常故障中總結(jié)、歸納出隱患型故障,針對(duì)這些隱患項(xiàng),有的放矢的開(kāi)發(fā)監(jiān)控平臺(tái)或監(jiān)控手段。同時(shí)完善工作職責(zé),將監(jiān)控與故障隱患報(bào)警處理合并,首問(wèn)負(fù)責(zé),這樣更有利于高效徹底地處理每一條報(bào)警信息涉及的故障隱患。
其次,建立健全數(shù)據(jù)備份機(jī)制,對(duì)于關(guān)鍵數(shù)據(jù)、軟件、甚至服務(wù)器配置等,要盡可能做到實(shí)時(shí)備份。只要我們做到了這兩步,就是對(duì)系統(tǒng)故障和問(wèn)題最有力的防守,這種以攻代守的主動(dòng)防御模式會(huì)在問(wèn)題出現(xiàn)前就“解決問(wèn)題”或是做好準(zhǔn)備。而且,完善的備份機(jī)制是應(yīng)對(duì)突發(fā)災(zāi)難性故障的重要保障。
(三)利用機(jī)器學(xué)習(xí)技術(shù),實(shí)現(xiàn)智能運(yùn)維
隨著科技的不斷發(fā)展與進(jìn)步,各個(gè)領(lǐng)域都有了革命性的變革。對(duì)于系統(tǒng)運(yùn)維來(lái)說(shuō)更是科技的前沿和尖端。這個(gè)時(shí)代,各個(gè)企業(yè)的服務(wù)器規(guī)模、虛擬化節(jié)點(diǎn)、計(jì)算存儲(chǔ)性能都在成百倍的增長(zhǎng)。在這種情況下,但靠傳統(tǒng)的人工運(yùn)維,越來(lái)越無(wú)法滿足運(yùn)維需求。
這時(shí)候,利用機(jī)器學(xué)習(xí)技術(shù),實(shí)現(xiàn)智能運(yùn)維把AI帶入運(yùn)維里是未來(lái)最高效的運(yùn)維方式和途徑。就拿監(jiān)控的報(bào)警信息來(lái)舉例,傳統(tǒng)的逐個(gè)遠(yuǎn)程處理已遠(yuǎn)遠(yuǎn)不能滿足需求,未來(lái),運(yùn)維工程師們應(yīng)針對(duì)報(bào)警處理方式進(jìn)行探索,利用機(jī)器學(xué)習(xí)等技術(shù)、實(shí)現(xiàn)故障自動(dòng)診斷自動(dòng)處理以及風(fēng)險(xiǎn)操作遠(yuǎn)程觸發(fā)處理等,只有這樣才能適應(yīng)現(xiàn)代企業(yè)信息化高速發(fā)展的腳步。
讓機(jī)器學(xué)習(xí)的目的就是實(shí)現(xiàn)“智”。怎么樣讓機(jī)器獲得這個(gè)“智”呢?在系統(tǒng)運(yùn)行中,故障和問(wèn)題會(huì)以各種千奇百怪的方式出現(xiàn),我們首先可以通過(guò)不斷地對(duì)歷史數(shù)據(jù)中的故障場(chǎng)景分類和詳細(xì)標(biāo)注讓機(jī)器進(jìn)行學(xué)習(xí),當(dāng)機(jī)器能自主進(jìn)行較細(xì)致的劃分和標(biāo)注后我們可以讓其不停地在這種模塊化的數(shù)據(jù)中進(jìn)一步識(shí)別和學(xué)習(xí)運(yùn)維工程師的處理方式。之后再讓機(jī)器在各種新發(fā)事件中尋得一次次耦合,完成其判斷體系最終讓機(jī)器可以自行做出精準(zhǔn)的判斷和處理。
這就是未來(lái)最高效的運(yùn)維模式。弱化對(duì)運(yùn)維工程師的需求,增強(qiáng)機(jī)器的能力,讓機(jī)器做到面對(duì)故障和問(wèn)題精準(zhǔn)的做出自我判斷和解決處理方案。
信息系統(tǒng)作為輔助工具,已日益深入各行各業(yè)的生產(chǎn)經(jīng)營(yíng)活動(dòng)中,運(yùn)維工作也將成為一個(gè)炙手可熱的職業(yè)。在這樣良好的環(huán)境中,運(yùn)維工程師需要立足自身、不斷學(xué)習(xí)、勇于創(chuàng)新、推進(jìn)產(chǎn)業(yè)與技術(shù)的相互融合才能有力的推動(dòng)信息系統(tǒng)業(yè)務(wù)應(yīng)用更上一層樓。讓信息系統(tǒng)的運(yùn)維工作越來(lái)越優(yōu)質(zhì)是每一個(gè)運(yùn)維工程師的光榮使命!
作者單位:中國(guó)石油天然氣股份有限公司廣西銷售分公司