国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

探討維護(hù)應(yīng)用系統(tǒng)的解決方案

2019-04-22 07:09周宇
科技視界 2019年5期
關(guān)鍵詞:解決方案

周宇

【摘 要】文章從維護(hù)部門(mén)的角度,主要討論應(yīng)用系統(tǒng)維護(hù)所遇到的問(wèn)題,分析問(wèn)題的一些管理解決方案、制度。并探討發(fā)展科學(xué)系統(tǒng)的應(yīng)用系統(tǒng)維護(hù)解決方法。

【關(guān)鍵詞】應(yīng)用系統(tǒng)維護(hù);解決方案;操作規(guī)則

中圖分類(lèi)號(hào): TP311.52 文獻(xiàn)標(biāo)識(shí)碼: A文章編號(hào): 2095-2457(2019)05-0160-004

1 應(yīng)用系統(tǒng)維護(hù)的問(wèn)題

隨著當(dāng)今社會(huì)技術(shù)的迭代更新,數(shù)據(jù)機(jī)房IDC化、數(shù)據(jù)應(yīng)用云網(wǎng)化,網(wǎng)絡(luò)條件的大幅度提升,應(yīng)用系統(tǒng)維護(hù)員不再是僅僅面對(duì)一兩臺(tái)設(shè)備的管理,而是要面對(duì)的許多不同類(lèi)型、不同型號(hào)的設(shè)備,甚至是云化的設(shè)備集群。此時(shí),一個(gè)高技術(shù)應(yīng)用系統(tǒng)維護(hù)人員不可能把精力平等的分給所有的設(shè)備,有時(shí)候甚至是不夠時(shí)間來(lái)照看所有的設(shè)備。

而與此同時(shí),高技術(shù)的應(yīng)用系統(tǒng)維護(hù)人員需要全面的技術(shù)培訓(xùn)以及長(zhǎng)時(shí)間的經(jīng)驗(yàn)積累。特別是高級(jí)別的技術(shù)專(zhuān)家、熟練的維護(hù)人員,一旦發(fā)生人員變更,對(duì)整個(gè)應(yīng)用系統(tǒng)的穩(wěn)定性和持久性,都將會(huì)有巨大的挑戰(zhàn)。

2 應(yīng)用系統(tǒng)維護(hù)的問(wèn)題分析

現(xiàn)有應(yīng)用系統(tǒng)地維護(hù),已經(jīng)不是僅僅依靠個(gè)人或一個(gè)團(tuán)隊(duì)的技術(shù)就能長(zhǎng)期地防控風(fēng)險(xiǎn)地發(fā)生,只能暫時(shí)性地維護(hù)并保持一個(gè)應(yīng)用系統(tǒng)的正常運(yùn)行。文章認(rèn)為造成這個(gè)問(wèn)題地根本原因,是維護(hù)部門(mén)和團(tuán)隊(duì),一直以來(lái)只是從技術(shù)的角度來(lái)看待對(duì)于應(yīng)用系統(tǒng)地維護(hù),只是針對(duì)一個(gè)個(gè)孤立的故障案例來(lái)進(jìn)行技術(shù)分析處理,缺少一個(gè)整體性的解決發(fā)難。

應(yīng)用系統(tǒng)維護(hù)應(yīng)該是一整套的體系、制度來(lái)對(duì)應(yīng)用系統(tǒng)維護(hù)進(jìn)行控制,這也是文章所探討的主題。

3 應(yīng)用系統(tǒng)維護(hù)的解決方案

如上所說(shuō),現(xiàn)在技術(shù)更新迭代的速度越來(lái)越快,軟件及硬件更新也越來(lái)越快,往往老的技術(shù)還沒(méi)有全部掌握,新的技術(shù)就已經(jīng)出現(xiàn)了;另外,設(shè)備、軟件功能類(lèi)型日益分工專(zhuān)業(yè)化,僅應(yīng)用系統(tǒng)所承載的服務(wù)器分類(lèi)就有許多種,例如:IBM公司的aix,HP公司的hp-ux,SUN公司的Solaris,Linux不同的變種,windows系列等等。同一種系統(tǒng)在不同的階段還有不同的版本。技術(shù)的更新,類(lèi)型的多樣,還有版本問(wèn)題,這些都是應(yīng)用系統(tǒng)維護(hù)人員的噩夢(mèng)。雖然私有云、公有云等云化的架構(gòu),可以使得應(yīng)用管理人員對(duì)硬件設(shè)備透明,但對(duì)于云系統(tǒng)的提供商來(lái)說(shuō),這些問(wèn)題依舊存在。而且針對(duì)各類(lèi)中間件、開(kāi)發(fā)平臺(tái)、系統(tǒng)接口,同樣的問(wèn)題依舊存在。同時(shí)每個(gè)人的精力都是有限的,如果需要應(yīng)用系統(tǒng)維護(hù)人員對(duì)上面所說(shuō)的每種設(shè)備都能輕松應(yīng)對(duì),那幾乎是不可能的,即使有,也只是極少數(shù)。同時(shí),現(xiàn)在許多應(yīng)用系統(tǒng)維護(hù)的軟件,也只是提供了一種可視化的、集成的、圖形管理的工具,只能相應(yīng)減少應(yīng)用系統(tǒng)維護(hù)的工作,并不能真正的解決現(xiàn)階段的問(wèn)題。

所以,現(xiàn)在的應(yīng)用系統(tǒng)維護(hù)已經(jīng)不僅僅是技術(shù)領(lǐng)域的范疇,而是應(yīng)該從一個(gè)更高更大的層次上來(lái)提供解決方案。即建立一整套應(yīng)用系統(tǒng)維護(hù)的體系,真正的從管理的角度來(lái)管理系統(tǒng),而不是從技術(shù)上來(lái)管理系統(tǒng)。在此稱(chēng)之為應(yīng)用系統(tǒng)維護(hù)的解決方案。

3.1 解決方案的核心

解決方案的核心:使系統(tǒng)在可控制的情況下,平穩(wěn)運(yùn)行盡可能長(zhǎng)的時(shí)間。

這個(gè)也就是應(yīng)用系統(tǒng)維護(hù)的根本目的??梢苑譃閮蓚€(gè)部分來(lái)看

3.1.1 使系統(tǒng)在可控制的情況中

首先,系統(tǒng)需要處于可控制的情況中,這個(gè)是指應(yīng)用系統(tǒng)維護(hù)人員應(yīng)處于能對(duì)設(shè)備進(jìn)行操作、管理的情況中;因?yàn)楝F(xiàn)在由于網(wǎng)絡(luò)十分發(fā)達(dá),機(jī)房往往位于不同的地方,應(yīng)用系統(tǒng)維護(hù)員也可能只在遠(yuǎn)程操控;而一旦設(shè)備當(dāng)機(jī),無(wú)法啟動(dòng),或者由于網(wǎng)絡(luò)問(wèn)題管理員無(wú)法連接到設(shè)備,那么技術(shù)再高的人也沒(méi)有辦法了。所以,必須確保管理人員能連接上設(shè)備,或者通過(guò)虛擬設(shè)備漂移等技術(shù)手段,實(shí)現(xiàn)設(shè)備容災(zāi)冗余。

3.1.2 平穩(wěn)運(yùn)行盡可能長(zhǎng)的時(shí)間

對(duì)于系統(tǒng)來(lái)說(shuō),經(jīng)常有升級(jí)補(bǔ)丁等需要,那么作為應(yīng)用系統(tǒng)維護(hù)員是否需要經(jīng)常安裝這些呢?為了確保系統(tǒng)能正常安全,首先考慮的應(yīng)該是系統(tǒng)穩(wěn)定。因?yàn)榘惭b補(bǔ)丁程序,本身就是一項(xiàng)增加風(fēng)險(xiǎn)的操作。所以,平穩(wěn)是先決條件,新形成的系統(tǒng)都是不平穩(wěn)的,只有經(jīng)過(guò)時(shí)間考驗(yàn)的,才能認(rèn)為是平穩(wěn)的。因此對(duì)于核心部分的設(shè)備,補(bǔ)丁升級(jí)一定需要兼顧系統(tǒng)穩(wěn)定性及系統(tǒng)安全性。

3.2 解決方案的規(guī)則

有了核心之后,需要制定一個(gè)整體的規(guī)則,以可以稱(chēng)之為步驟,來(lái)確保核心的實(shí)現(xiàn),這里稱(chēng)之為解決方案的規(guī)則。主要有三個(gè):

3.2.1 用數(shù)據(jù)找出缺陷

首先,需要先確定一個(gè)概念:缺陷是指存在于系統(tǒng)中,未被發(fā)現(xiàn)的,可能造成故障或?yàn)?zāi)難的地方。好的應(yīng)用系統(tǒng)維護(hù)員可以依靠自己的經(jīng)驗(yàn),找出系統(tǒng)中存在的缺陷,但是,正如前面所說(shuō)的,如果是對(duì)于不同的系統(tǒng),那么技術(shù)再高的應(yīng)用系統(tǒng)維護(hù)員也往往束手無(wú)策。

所以,應(yīng)該通過(guò)數(shù)據(jù)積累,從數(shù)據(jù)上的增長(zhǎng)趨勢(shì)和不正常的變化,來(lái)找出潛在的缺陷。首先,對(duì)需要監(jiān)控的系統(tǒng),實(shí)行定點(diǎn)定時(shí)的數(shù)據(jù)采集、性能采集,然后根據(jù)得到的數(shù)據(jù),建立系統(tǒng)的基準(zhǔn)線;然后根據(jù)基準(zhǔn)線的趨勢(shì),預(yù)測(cè)今后可能發(fā)生的上限、下限和峰值。當(dāng)某時(shí)刻的數(shù)據(jù)發(fā)生了突變,就預(yù)示著缺陷的存在和發(fā)生。如下圖所示:

12日的CPU使用率接近峰值,有可能造成系統(tǒng)崩潰。這樣,管理員就需要察看當(dāng)日的系統(tǒng)上運(yùn)行了什么軟件或應(yīng)用,有什么人員登陸,然后分析得出造成該現(xiàn)象的具體原因;那在以后進(jìn)行同樣操作的時(shí)候,就可以事先預(yù)知系統(tǒng)的承載能力,而將其它的事務(wù)(如ORACLE數(shù)據(jù)庫(kù)的導(dǎo)出備份等)分派到其他的時(shí)段,以避免CPU的超負(fù)載。

當(dāng)數(shù)據(jù)積累到了一定的程度,基準(zhǔn)線和上、下限也得到了比較正確的數(shù)值的時(shí)候,應(yīng)用系統(tǒng)維護(hù)員就能將各階段、各日期、格時(shí)段的風(fēng)險(xiǎn)值以散列圖的方式展現(xiàn)出來(lái),這樣就能在高風(fēng)險(xiǎn)的時(shí)候更多的注意需要照顧的系統(tǒng)。

比如在月初或月末,由于系統(tǒng)需要出帳,系統(tǒng)的風(fēng)險(xiǎn)值就會(huì)明顯上升,在這段時(shí)間內(nèi),管理員對(duì)系統(tǒng)需要進(jìn)行全面的監(jiān)控。也許這不是一個(gè)最好的辦法,隨著時(shí)間的積累,數(shù)據(jù)的精確性會(huì)不斷的上升,而應(yīng)用系統(tǒng)維護(hù)所需的穩(wěn)定性也會(huì)隨之上升。

另一個(gè)優(yōu)勢(shì)在于,一個(gè)新上任的應(yīng)用系統(tǒng)維護(hù)員可以在很短的時(shí)間內(nèi),了解一個(gè)新系統(tǒng)的基本運(yùn)行情況、需要關(guān)注的時(shí)間段以及需要特別注意的某個(gè)操作。

3.2.2 用制度防范風(fēng)險(xiǎn)

作為規(guī)則的第一步,通過(guò)數(shù)據(jù)的收集、分類(lèi)、整理,應(yīng)用系統(tǒng)維護(hù)就面臨著如何運(yùn)用這些數(shù)據(jù),如何通過(guò)建立完善的制度來(lái)將存在的風(fēng)險(xiǎn)轉(zhuǎn)移出去。

正如前面所說(shuō)的,應(yīng)用系統(tǒng)維護(hù)是一項(xiàng)需要時(shí)間培養(yǎng)的工作,但是通過(guò)制度的制定,可以讓?xiě)?yīng)用系統(tǒng)維護(hù)人員的培養(yǎng)變得有章可循,也可以讓?xiě)?yīng)用系統(tǒng)維護(hù)工作真正做到具體化、細(xì)致化。

如上圖顯示:

原應(yīng)用系統(tǒng)維護(hù),主要取決于個(gè)人的技術(shù)和操作,這樣就會(huì)導(dǎo)致每個(gè)應(yīng)用系統(tǒng)維護(hù)員都有自己的一套應(yīng)用系統(tǒng)維護(hù)方法,當(dāng)發(fā)生人員、技術(shù)甚至系統(tǒng)發(fā)生變化的時(shí)候,就可能導(dǎo)致在管理工作的延續(xù)上發(fā)生斷層,與此同時(shí)的系統(tǒng)的平穩(wěn)性也受到威脅。

而解決方案,則是采用通過(guò)數(shù)據(jù)—〉制度—〉系統(tǒng),不同的應(yīng)用系統(tǒng)維護(hù)人員可以通過(guò)不同的方法、經(jīng)驗(yàn)采集數(shù)據(jù),但必須通過(guò)建立制度來(lái)對(duì)系統(tǒng)進(jìn)行管理,這樣就可以避免人員的變動(dòng)造成管理的混亂,因?yàn)樾氯蔚墓芾砣藛T可以按部就班的根據(jù)以往的制度來(lái)繼續(xù)原先的管理步驟;然后根據(jù)自己的經(jīng)驗(yàn),對(duì)數(shù)據(jù)的收集方式、收集量進(jìn)行調(diào)整,然后優(yōu)化制度;最后通過(guò)優(yōu)化后的制度來(lái)管理系統(tǒng),以便提供更全面的數(shù)據(jù)。

這樣就形成了一個(gè)封閉的循環(huán),可以不斷的改善應(yīng)用系統(tǒng)維護(hù)的方式方法和制度,并令系統(tǒng)的平穩(wěn)狀況得到更好的保證。

3.2.3 用技術(shù)解決故障

根據(jù)前兩步的操作,應(yīng)用系統(tǒng)維護(hù)人員已經(jīng)建立了可以不斷完善的體制來(lái)預(yù)防、分解存在的缺陷風(fēng)險(xiǎn);但是,對(duì)于突發(fā)故障(比如,掉電造成的系統(tǒng)當(dāng)機(jī)、文件系統(tǒng)的負(fù)載過(guò)高、人為操作的失誤等)的發(fā)生,應(yīng)用系統(tǒng)維護(hù)面對(duì)的就不僅僅是靠制度能解決的問(wèn)題了,這是就需要依賴(lài)技術(shù)層面來(lái)解決問(wèn)題;當(dāng)遇到無(wú)法解決的問(wèn)題時(shí),可以提供進(jìn)一步的咨詢(xún)方案,并實(shí)施保護(hù)數(shù)據(jù)的措施,將損失、停機(jī)時(shí)間控制在最小的范圍之內(nèi)。

綜上所述,經(jīng)過(guò)三個(gè)步驟:用數(shù)據(jù)找出缺陷、用制度防范風(fēng)險(xiǎn)、用技術(shù)解決故障;這樣就能形成一個(gè)應(yīng)用系統(tǒng)維護(hù)步驟的封閉環(huán)。

3.3 解決方案的具體操作建議

經(jīng)過(guò)上面兩部分關(guān)于解決方案的核心和規(guī)則的討論,已經(jīng)有了一個(gè)相對(duì)較為清晰的管理模式,或者稱(chēng)為解決方案,就如一棟大廈的主體結(jié)構(gòu),已經(jīng)初步呈現(xiàn)。下面討論得如何運(yùn)用這核心、規(guī)則,建立起一套真正的制度,對(duì)應(yīng)用系統(tǒng)維護(hù)進(jìn)行可操作的應(yīng)用。也就是從細(xì)微處著手,給大廈進(jìn)行裝修,使之成為可以生活、生產(chǎn)的地方。

3.3.1 用數(shù)據(jù)找出缺陷

缺陷采集主要通過(guò)三個(gè)方面來(lái)實(shí)現(xiàn),即性能收集、故障收集和數(shù)據(jù)收集;

性能收集方面,首先,在各類(lèi)應(yīng)用上,各個(gè)應(yīng)用時(shí)間點(diǎn)和各類(lèi)硬件設(shè)備上,對(duì)cpu、memory、文件系統(tǒng)、輸入輸出和進(jìn)程等性能方面的數(shù)據(jù)進(jìn)行收集。

其次,當(dāng)發(fā)生故障的時(shí)候同樣收集各類(lèi)數(shù)據(jù)形成故障報(bào)表;

最后,通過(guò)性能報(bào)表、故障報(bào)表生成相應(yīng)的數(shù)據(jù)庫(kù),形成圖形的數(shù)據(jù)報(bào)表;

3.3.2 用制度防范風(fēng)險(xiǎn)

(1)必須給所有的系統(tǒng)劃分等級(jí),有限的精力不可能平均的分配到所有的設(shè)備上,所以只有給系統(tǒng)劃分等級(jí)之后,合理分配應(yīng)用系統(tǒng)維護(hù)人員的時(shí)間和精力;

(2)根據(jù)分級(jí)定期收集察看系統(tǒng)日志;系統(tǒng)日志的重要性是不可忽視的;一般的系統(tǒng)告警,都會(huì)在系統(tǒng)日志重有所表現(xiàn);對(duì)于日志的收集也能為系統(tǒng)以后的診斷提供幫助;

(3)根據(jù)分級(jí)定期備份系統(tǒng)級(jí)重要文件;當(dāng)系統(tǒng)發(fā)生不可預(yù)見(jiàn)的問(wèn)題之后,這些重要文件的存檔,可以幫助應(yīng)用系統(tǒng)維護(hù)縮短系統(tǒng)故障的時(shí)間;

(4)登陸用戶(hù)分級(jí)并各自進(jìn)行記錄;

(5)日常操作必須規(guī)范,管理員的每個(gè)操作都應(yīng)該進(jìn)行日志記錄;

(6)風(fēng)險(xiǎn)管理;進(jìn)行對(duì)系統(tǒng)可能產(chǎn)生重大影響的操作之前,可以通過(guò)系統(tǒng)全鏡像并單獨(dú)隔離的方法來(lái)實(shí)現(xiàn)對(duì)現(xiàn)有系統(tǒng)的存檔;當(dāng)操作的結(jié)果穩(wěn)定之后,再回復(fù)同步鏡像;對(duì)于長(zhǎng)期的風(fēng)險(xiǎn),可以通過(guò)風(fēng)險(xiǎn)累計(jì)的方式,令各系統(tǒng)的風(fēng)險(xiǎn)值根據(jù)不同的應(yīng)用、運(yùn)行時(shí)間而不斷變化,然后按風(fēng)險(xiǎn)值進(jìn)行從高到低的排序,排列出風(fēng)險(xiǎn)值最高的一個(gè)或幾個(gè)系統(tǒng),對(duì)風(fēng)險(xiǎn)清單設(shè)備加強(qiáng)監(jiān)控;通過(guò)故障表的統(tǒng)計(jì),得出何鐘應(yīng)用的系統(tǒng)在風(fēng)險(xiǎn)值為多大的時(shí)候可能引發(fā)缺陷,從而得出具體峰下那閥值,便于監(jiān)控那些風(fēng)險(xiǎn)值高于閥值的那些系統(tǒng);

3.3.3 用技術(shù)解決故障

(1)應(yīng)用系統(tǒng)維護(hù)人員對(duì)于不同的故障應(yīng)采取不同的措施;對(duì)于那些小故障,應(yīng)用系統(tǒng)維護(hù)員應(yīng)該有能力去解決,對(duì)于諸如硬件等重大故障,應(yīng)用系統(tǒng)維護(hù)員應(yīng)該快速定位故障信息,并實(shí)施保護(hù)數(shù)據(jù)等措施;

(2)知識(shí)庫(kù)、經(jīng)驗(yàn)庫(kù)、技術(shù)文檔、技術(shù)論壇共享,電話支持

(3)實(shí)驗(yàn)環(huán)境的組建

(4)人員培訓(xùn)

4 應(yīng)用系統(tǒng)維護(hù)解決方案圖示

5 結(jié)論部分

對(duì)于大量的系統(tǒng)需要管理時(shí),就應(yīng)該通過(guò)建立科學(xué)的體制來(lái)進(jìn)行管理,通過(guò)對(duì)于數(shù)據(jù)的采集來(lái)進(jìn)行優(yōu)化已有的制度,運(yùn)用技術(shù)來(lái)解決已發(fā)生的故障;通過(guò)類(lèi)似方法論的方式,從理論的角度令管理人員理解如何解決問(wèn)題,而不是單從技術(shù)角度進(jìn)行維護(hù)管理。

【參考文獻(xiàn)】

[1]張巨儉,甘仞初.管理信息系統(tǒng)的發(fā)展方向及實(shí)現(xiàn)技術(shù)[J].計(jì)算機(jī)應(yīng)用研究,2003,1.

[2]穆緒濤,穆建華,鄒微,孫志紅.管理信息系統(tǒng)的作用及應(yīng)用[J].現(xiàn)代情報(bào),2005,10.

猜你喜歡
解決方案
艾默生自動(dòng)化解決方案
解決方案和折中方案
簡(jiǎn)潔又輕松的Soundbar環(huán)繞聲解決方案
ABS塑件的常見(jiàn)缺陷及解決方案
通信用UPS電源常見(jiàn)問(wèn)題及解決方案
5G高頻室內(nèi)覆蓋解決方案研究
您的理念 我們的解決方案
您的理念 我們的解決方案
4G LTE室內(nèi)覆蓋解決方案探討
電脫插應(yīng)用中的問(wèn)題及解決方案