陳昊
摘要
隨著信息網(wǎng)絡(luò)技術(shù)在各個領(lǐng)域的應(yīng)用,數(shù)據(jù)信息逐漸呈現(xiàn)形式多樣、信息量大、更新迅速、可利用價值高等特點,幫助協(xié)調(diào)整個社會的經(jīng)濟生產(chǎn)模式,使得原有運維管理方式遭受較大的沖擊,本文將介紹大數(shù)據(jù)時代的概況,并針對大數(shù)據(jù)時代運維管理模式進行優(yōu)化分析,探究如何在大數(shù)據(jù)時代發(fā)展新的自動化運維管理方式,目的是提高韻味管理效率,進一步創(chuàng)造大數(shù)據(jù)時代下的運維價值。
【關(guān)鍵詞】大數(shù)據(jù)時代 自動化運維 配制構(gòu)架發(fā)展策略
信息網(wǎng)絡(luò)技術(shù)的應(yīng)用不僅提高了我國經(jīng)濟運轉(zhuǎn)的智能化程度,更以高速生成的數(shù)據(jù)顯示了人們的日常生產(chǎn)生活方式。在這種大數(shù)據(jù)時代下,傳統(tǒng)管理模式企業(yè)面臨機遇和挑戰(zhàn),一方面企業(yè)能夠通過建立運維管理平臺收集數(shù)據(jù)進行自動化管理,降低傳統(tǒng)管理模式出現(xiàn)人為差錯的風(fēng)險,另一方面,通過先進的運維思想和完善的基礎(chǔ)配置可以進一步提高數(shù)據(jù)平臺運維處理能力,從而使運維管理在自動化的基礎(chǔ)上更加完善化,工作量增加也能確保運維管理效率。
1 大數(shù)據(jù)時代自動化運維管理思路
1.1 完善基礎(chǔ)配置管理
大數(shù)據(jù)時代下數(shù)據(jù)信息傳輸量不斷增加,通過構(gòu)建自動化運維管理平臺,以計算機程序代替人為操作進行指令的下達,會大大降低出現(xiàn)故障的概率,但計算機等基礎(chǔ)設(shè)施中硬軟件配置關(guān)系到數(shù)據(jù)集群的梳理,因此需要建立一定的關(guān)系來進行基礎(chǔ)配置中CI的設(shè)計管理,以此來梳理不同集群數(shù)據(jù)的運維關(guān)系,從而為實現(xiàn)自動化運維奠定基礎(chǔ)。這個過程中需要利用數(shù)據(jù)業(yè)務(wù)聯(lián)系設(shè)計配置,幫助創(chuàng)建以CI配置關(guān)系為基礎(chǔ)的運維模式圖。
1.2 結(jié)合基礎(chǔ)構(gòu)架進行日志分析
配置管理無論是對于傳統(tǒng)數(shù)據(jù)運維管理還是對于自動化運維管理模式的構(gòu)建都需要將不同的配置中的CI聯(lián)系在一起,但后者需要利用日志數(shù)據(jù)進行CI的聯(lián)系,如圖1所示。
接收數(shù)據(jù)信息后,CI配置依照設(shè)計關(guān)系規(guī)則進行數(shù)據(jù)信息篩選,篩選出的信息以日志的形式就在服務(wù)器中,方便進行后續(xù)流計算平臺的運維分析,數(shù)據(jù)信息分析結(jié)果將會儲存在運維數(shù)據(jù)庫中,如圖2所示,這種日志分析結(jié)構(gòu)的利用能夠有效規(guī)避傳統(tǒng)運維管理中難以進行數(shù)據(jù)排查的情況,迅速實現(xiàn)數(shù)據(jù)信息的查找分析,且處理分析過程能夠?qū)⒊霈F(xiàn)的問題及時顯現(xiàn)出來,快速進行解決。
1.3 日常自動化變更
傳統(tǒng)運維管理模式中如果需要進行日常變更,首先需要制定變更方案,然后通過層層審核最終確定執(zhí)行,這種情況下往往會使變更過程存在安全風(fēng)險,一方面無法預(yù)知變更發(fā)布后可能出現(xiàn)的數(shù)據(jù)隱患,另一方面可能會引起大規(guī)模的連鎖工作變更。在這種形勢下可以嘗試引入工作流平臺,將日常變更進行自動化歸類,針對數(shù)據(jù)集群遷移等較為穩(wěn)定的日??梢赃M行自動化變更,也可利用工作流平臺進行快捷的審核和執(zhí)行其他類型的變更,快速、精準(zhǔn)的實現(xiàn)自動化變更,規(guī)避變更風(fēng)險。
1.4 硬件架構(gòu)排查
與傳統(tǒng)運維管理模式相比,自動化運維管理也會存在數(shù)據(jù)河北硬件問題,出現(xiàn)問題就需要檢查和維修,傳統(tǒng)運維管理模式采用人工檢修的方式對硬件設(shè)備進行系統(tǒng)的排查,并需要制定周期定時對硬件設(shè)備進行管理,如果發(fā)現(xiàn)設(shè)備存在問題就需要進行大規(guī)模數(shù)據(jù)遷移避免發(fā)生信息故障,整個過程既繁瑣也容易出現(xiàn)二次故障。進行自動化運維模式管理改進可以考慮在閾值外進行自動化檢查和監(jiān)控,即通過配置架構(gòu)和邏輯關(guān)系進行實時系統(tǒng)排查,及時預(yù)警硬件故障,操作工程師可以快速定向進行異常硬件問題處理。
1.5 硬軟件交付檢查
數(shù)據(jù)集群信息的傳輸和交流需要硬軟件系統(tǒng)的配合交付,首先可以使用工作流平臺對基礎(chǔ)硬件配置如硬盤、網(wǎng)卡、CPU等進行軟件交付檢查,具體檢查方式是依照具有一定強度梯度的讀寫壓力來衡量硬盤工作狀態(tài)是否保持穩(wěn)定;綁定局部CPU對兀值進行運算試驗,依據(jù)運算時間分布曲線來衡量CPU的性能指標(biāo)等。其次,在硬軟件交付檢查中出現(xiàn)客觀影響因素導(dǎo)致對硬件系統(tǒng)的誤判是不可避免的,應(yīng)不斷完善交付檢查知識庫,針對歷次檢查過程進行持續(xù)分析和記錄,不斷優(yōu)化硬軟件交付檢查的可靠性。
2 大數(shù)據(jù)時代自動化運維管理發(fā)展策略
結(jié)合傳統(tǒng)運維管理模式與大數(shù)據(jù)時代自動化運維管理模式的對比可以總結(jié)出,自動化運維管理模式更側(cè)重于對大規(guī)模數(shù)據(jù)集群的把握分析,基礎(chǔ)配置架構(gòu)越完善,邏輯設(shè)計分析越嚴(yán)謹(jǐn),運維管理工作效率越高,越能夠進行數(shù)據(jù)的分析處理,同時以豐富的數(shù)據(jù)信息進行反饋調(diào)度,實現(xiàn)數(shù)據(jù)資源的有效管理,因此對于大數(shù)據(jù)時代自動化運維管理模式的優(yōu)化,工程人員需要不斷優(yōu)化平臺設(shè)計,提高平臺的數(shù)據(jù)信息管理能力,同時通過管理平臺的邏輯性排查規(guī)避硬件系統(tǒng)對工作臺的影響,降低人工維護成本。
除此之外,自動化運維管理平臺進行數(shù)據(jù)的分析利用目的是提高運維管理平臺的安全性和穩(wěn)定性,以此為基礎(chǔ)向用戶提供更良好的體驗,但在此過程中運維管理平臺可能出現(xiàn)成本與資源分配不合理的問題,影響實際運營效率。鑒于此,運維管理平臺需要吸收日常運維管理工作中的經(jīng)驗,開發(fā)數(shù)據(jù)日志信息的更多功能,提高知識庫的穩(wěn)定性,從而使運維管理水平不斷提升。
3 結(jié)束語
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)信息成為人們?nèi)粘Ia(chǎn)和生活不可分割的一部分,傳統(tǒng)運維管理模式急需進行革新優(yōu)化,運維管理平臺需要結(jié)合自身基礎(chǔ)配置情況進行工作流平臺的改進,開發(fā)利用日志的問題排查功能,不斷提高數(shù)據(jù)測試檢查和日常自動化變更的效率,最終實現(xiàn)大數(shù)據(jù)時代的運維管理轉(zhuǎn)型。
參考文獻
[1]劉洋.數(shù)據(jù)中心自動化運維平臺設(shè)計與實現(xiàn)[J].現(xiàn)代商貿(mào)工業(yè),2018,39(20):195-198.
[2]夏薇.企業(yè)信息系統(tǒng)相關(guān)自動化運維工具研究[J].電腦知識與技術(shù),2018,14(07):90-91.