錢軍 刁志堅(jiān)
摘 要:隨著國(guó)家中小企業(yè)信息化產(chǎn)業(yè)建設(shè)不斷的飛速發(fā)展,隨之帶來的就是中小企業(yè)用戶信息化建設(shè)的發(fā)展,用戶的網(wǎng)絡(luò)規(guī)模日益增長(zhǎng),網(wǎng)絡(luò)結(jié)構(gòu)日益復(fù)雜。因此,IT運(yùn)維對(duì)于用戶尤為重要。到了今天,單一的網(wǎng)絡(luò)管理維護(hù)已經(jīng)無法滿足用戶對(duì)于信息化穩(wěn)定性的需要,整體的IT運(yùn)維已經(jīng)取代了過去單一的網(wǎng)絡(luò)維護(hù),網(wǎng)管員的工作已經(jīng)升級(jí)到了IT管理者的層次。
關(guān)鍵詞:信息化建;中小企業(yè);網(wǎng)絡(luò)管理;IT運(yùn)維
1 企業(yè)運(yùn)維的主要難題
1.1 IDC服務(wù)商的選擇
服務(wù)器增多,就要找好的IDC運(yùn)營(yíng)商;不然會(huì)出現(xiàn)服務(wù)器裝錯(cuò)、域名白名單取消、機(jī)柜的帶寬流量無法實(shí)時(shí)監(jiān)控、CDN效果不佳等問題。
1.2 服務(wù)器提供商和型號(hào)的選擇
例如出現(xiàn)DELL R410固件問題,每當(dāng)服務(wù)器高流量的時(shí)候,服務(wù)器網(wǎng)卡會(huì)自動(dòng)斷流,需要手動(dòng)重啟網(wǎng)卡,到最后也未能完全解決;之前還遇到過內(nèi)存,主板故障等問題,服務(wù)器的硬件一旦出現(xiàn)問題,就意味著停機(jī)檢修,服務(wù)自然要中斷。所以在服務(wù)器的選擇上也要慎重,而不是只考慮價(jià)格問題。
1.3 負(fù)載均衡和故障轉(zhuǎn)移
流量大了,或者業(yè)務(wù)重要性高,就要求最大可能提供服務(wù)器的高可用性和數(shù)據(jù)容災(zāi),自然要部署負(fù)載均衡和故障轉(zhuǎn)移;是采用硬件F5,cisco還是軟件lvs,keepalvie,heartbeat,nginx方式實(shí)現(xiàn),效果如何?都需要去考量。
1.4 運(yùn)維團(tuán)隊(duì)和人才的培養(yǎng)
對(duì)于中小企業(yè)來講,IT運(yùn)維人才的流失是比較可惜的,如何去留住一批優(yōu)秀的運(yùn)維人才也是企業(yè)需要考慮的問題。其實(shí)不只運(yùn)維,企業(yè)要想有長(zhǎng)遠(yuǎn)的發(fā)展都應(yīng)當(dāng)想方設(shè)法留住人才,控制公司的人員流失率,要讓員工有歸屬感和榮譽(yù)感,而不是只有赤裸裸的雇傭關(guān)系;企業(yè)應(yīng)該著重培養(yǎng)一支高素質(zhì),高凝聚力的運(yùn)維團(tuán)隊(duì),而不是只當(dāng)運(yùn)維是業(yè)務(wù)部門和程序部門間的夾心餅,里外不是人,這樣的環(huán)境和團(tuán)隊(duì)是留不住人才的。
2 企業(yè)運(yùn)維人員的工作職責(zé)
2.1 保證服務(wù)器上正常的運(yùn)行
怎么樣才能算正常的運(yùn)行呢?論壇卡,服務(wù)器慢,網(wǎng)站打不開之類的問題,出問題的有可能是服務(wù)器,也可能是用戶端或者就是中間的網(wǎng)絡(luò)傳輸問題,在中國(guó)最典型的就是南北互通的問題,因?yàn)檫@種問題很難判斷,所以一般管理者會(huì)要求運(yùn)維每年的故障時(shí)間不能超過一定的值,說7*24*365服務(wù)不間斷運(yùn)行,但是總會(huì)有各種各樣的問題,無論你用了什么負(fù)載均衡,故障轉(zhuǎn)移技術(shù),服務(wù)臨時(shí)中斷也是避免不了的,運(yùn)維的價(jià)值在于在縮短服務(wù)中斷后的MTTR時(shí)間,可見運(yùn)維的壓力是很大的。
2.2 備份關(guān)鍵數(shù)據(jù),及時(shí)處理各種故障,保證服務(wù)器安全
備份是為了恢復(fù),一般想到或者用到備份的時(shí)候,都是出現(xiàn)麻煩的時(shí)候,所以平常工作中對(duì)備份一定要足夠的重視,尤其是數(shù)據(jù)庫(kù),在某些時(shí)候,看起來多年前的備份可能會(huì)給你的恢復(fù)工作帶來意想不到的作用;服務(wù)器的安全部分又是復(fù)雜的概念,因?yàn)榘踩旧砭褪窍鄬?duì)的,而且安全和性能,用戶體驗(yàn)之間是成反比的,運(yùn)維在很多時(shí)候都是犧牲安全來?yè)Q取性能和更好的用戶體驗(yàn),等將來安全上出現(xiàn)問題的時(shí)候再調(diào)整。
2.3 及時(shí)調(diào)整服務(wù)器各項(xiàng)設(shè)定滿足業(yè)務(wù)需要
框架定了,服務(wù)器選了,一般是不會(huì)輕易改動(dòng)的,但設(shè)置服務(wù)器的工作卻是每天都有的。程序有時(shí)需要部署個(gè)memcache,有時(shí)需要個(gè)中文分詞系統(tǒng),有時(shí)需要加個(gè)虛擬主機(jī)。運(yùn)維人員在做這類工作的時(shí)候不能像應(yīng)付任務(wù)那樣,但求過關(guān)即可,否則日積月累下來,服務(wù)器會(huì)出現(xiàn)意想不到的情況。在處理這類工作上運(yùn)維人員應(yīng)當(dāng)做到規(guī)范和文檔記錄,長(zhǎng)期做下來,不但自己的運(yùn)維專業(yè)水平會(huì)提高,對(duì)于后期的維護(hù)也會(huì)起到良性循環(huán)作用。
2.4 記錄服務(wù)器維護(hù)日志和技術(shù)文檔
這點(diǎn)都是在處理完問題后記錄下,方便加快日后處理同類問題的速度和效率;至于技術(shù)文檔,身為運(yùn)維人員一定要認(rèn)真編寫,寫的很糟糕的文檔會(huì)給人誤導(dǎo)作用,internet上這類文章不在少數(shù),本身IT這個(gè)行業(yè)就是很浮躁的,如果不能靜下心來好好整理知識(shí),總有一天會(huì)被淘汰的;對(duì)于過去整理的文檔要定期的去溫習(xí),有錯(cuò)的要及時(shí)更正。
3 企業(yè)運(yùn)維工具的選擇
隨著企業(yè)的業(yè)務(wù)對(duì)IT的依賴越來越多,企業(yè)的服務(wù)器的架構(gòu)規(guī)模不斷擴(kuò)展,為了更有效率的執(zhí)行任務(wù),為了我們運(yùn)維人員不再像流水線上的一名工人一樣不斷重復(fù)的做著同樣的工作,我們將會(huì)用一類工具,這類工具是可編程的,我們只是需要寫上一些代碼就可以幫我們自動(dòng)完成所有的工作。很公司用的是瑞寧CAM,集中審計(jì)管控系統(tǒng),除了能完成自動(dòng)化運(yùn)維的工作,比如系統(tǒng)安裝、系統(tǒng)升級(jí)、批量修改密碼、主機(jī)名規(guī)范、終端資源監(jiān)控、批量配置管理、終端批量實(shí)時(shí)操控等等,還有事后審計(jì)回放的功能,對(duì)于事后總結(jié)自己的工作,查找錯(cuò)誤點(diǎn)非常有幫助。此外常見的運(yùn)維工具還有:ickstart、Chef、Nagios、Cobbler、ControlTier、OpenNMS、OpenQRM、Func、Zabbix、Spacewalk、Puppet、Cacti等。
[參考文獻(xiàn)]
[1]付資亮.K公司IT運(yùn)維管理研究[D].華南理工大學(xué).2011年.
[2]王艷君.淺析IT運(yùn)維的現(xiàn)狀與對(duì)策[J].中小企業(yè)管理與科技(下旬刊).2011年03期.
[3]唐琳,李偉.基于用戶體驗(yàn)的“主動(dòng)式”信息運(yùn)維管理實(shí)踐[J].電力信息化.2013年03期.
[4]丁云成,王必榮,孫靜.基于ITIL的IT服務(wù)管理系統(tǒng)的應(yīng)用[J].電腦知識(shí)與技術(shù).2008年07期.