陳中元
(廣西民族大學(xué)相思湖學(xué)院 廣西 南寧 530008)
在信息化時(shí)代,信息系統(tǒng)作用的大小將決定社會(huì)生產(chǎn)環(huán)節(jié)的快慢。而智能化運(yùn)維系統(tǒng)其實(shí)就是將大數(shù)據(jù)與云計(jì)算技術(shù)兩者進(jìn)行結(jié)合,并以此為基礎(chǔ),這樣能夠有效地解決這種傳統(tǒng)模式下IT運(yùn)維服務(wù)的表現(xiàn)方式,在實(shí)際操作中就可以發(fā)揮大數(shù)據(jù)智能運(yùn)維系統(tǒng)對(duì)網(wǎng)絡(luò)實(shí)時(shí)監(jiān)控的有效性,同時(shí)其還具有對(duì)大數(shù)據(jù)進(jìn)行分析的能力。這就使其能夠從根源上發(fā)現(xiàn)問(wèn)題并發(fā)出警報(bào),隨后進(jìn)行自我調(diào)整,同時(shí)將各種危機(jī)狀況化險(xiǎn)為夷。
和傳統(tǒng)的運(yùn)維系統(tǒng)相比,這種將大數(shù)據(jù)和智能技術(shù)應(yīng)用在運(yùn)維系統(tǒng)中,就可以使其擁有對(duì)數(shù)據(jù)大規(guī)模進(jìn)行搜索、快速進(jìn)行處理以及大量開(kāi)展業(yè)務(wù)等功能,使其起著非常關(guān)鍵性的作用。這種新型的大數(shù)據(jù)智能運(yùn)維系統(tǒng),在傳統(tǒng)的自動(dòng)化基礎(chǔ)上實(shí)現(xiàn)了智能化,使其在應(yīng)用過(guò)程中既減少了運(yùn)維資金,又能夠提高對(duì)客戶的服務(wù)質(zhì)量以及服務(wù)體驗(yàn)。由于其將智能混合技術(shù)合理地應(yīng)用,從而使其擁有了對(duì)各種工作進(jìn)行動(dòng)態(tài)化的管理及對(duì)內(nèi)存的合理計(jì)算調(diào)節(jié)和全方位的調(diào)控等,用通俗的話來(lái)說(shuō),就是其可以將資源的利用達(dá)到最大化,從而節(jié)省對(duì)初期資金的預(yù)算[1]。
在大數(shù)據(jù)運(yùn)維系統(tǒng)中,只需要我們對(duì)大數(shù)據(jù)技術(shù)進(jìn)行簡(jiǎn)單的基礎(chǔ)操作,就可以使各項(xiàng)運(yùn)維工作達(dá)到各方面的基本指標(biāo),從而實(shí)現(xiàn)對(duì)每個(gè)服務(wù)器運(yùn)行的數(shù)據(jù)進(jìn)行實(shí)時(shí)動(dòng)態(tài)管控。并且,其可以對(duì)運(yùn)行日志統(tǒng)一進(jìn)行收集,憑借著對(duì)不同非關(guān)系類型數(shù)據(jù)庫(kù)的有效借助,從而實(shí)現(xiàn)對(duì)各類數(shù)據(jù)進(jìn)行多樣化存儲(chǔ)的功能。基于這項(xiàng)基礎(chǔ),在Hadoop數(shù)據(jù)的集群當(dāng)中,同一時(shí)間輸入每項(xiàng)所收集到的數(shù)據(jù)情況,就能夠使大數(shù)據(jù)技術(shù)對(duì)這些收集到的數(shù)據(jù)情況進(jìn)行全方位的離線分析,并且同時(shí)生成相應(yīng)數(shù)據(jù)的曲線圖。另外,可以將其和預(yù)先設(shè)定的相關(guān)數(shù)據(jù)做對(duì)比,在與監(jiān)控報(bào)警系統(tǒng)進(jìn)行合理關(guān)聯(lián)后,就能夠?qū)崿F(xiàn)對(duì)目標(biāo)數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)控,除此之外,還需要根據(jù)時(shí)代的發(fā)展趨勢(shì)進(jìn)行有效分析??梢愿鶕?jù)之前收集到的有關(guān)數(shù)據(jù)和算法,就能夠使預(yù)算模型獲取相應(yīng)的應(yīng)用基礎(chǔ)。此外,還需要觀察其運(yùn)行狀況,從而合理地對(duì)未來(lái)服務(wù)器進(jìn)行預(yù)測(cè),運(yùn)維人員可以針對(duì)這些所獲得的數(shù)據(jù)信息,從而提前對(duì)系統(tǒng)及硬件進(jìn)行調(diào)整以及遷移。
就現(xiàn)如今的信息系統(tǒng)運(yùn)維來(lái)看,將面臨著一個(gè)新的巨大挑戰(zhàn)——云計(jì)算技術(shù)。云計(jì)算技術(shù)在應(yīng)用過(guò)程中,通常會(huì)以能量分散、管理集中的方式進(jìn)行,從而就會(huì)對(duì)信息系統(tǒng)的整體架構(gòu)以及運(yùn)營(yíng)模式產(chǎn)生巨大的影響。然而,對(duì)于傳統(tǒng)運(yùn)維系統(tǒng)來(lái)說(shuō),想要把虛擬技術(shù)作為核心是一個(gè)巨大的挑戰(zhàn),這主要是因?yàn)槿粝胱屵\(yùn)維系統(tǒng)能夠正常地運(yùn)轉(zhuǎn),只運(yùn)用傳統(tǒng)的監(jiān)控以及數(shù)據(jù)分析是遠(yuǎn)遠(yuǎn)不足的[2]。從根本上來(lái)講,其主要存在著以下兩方面的問(wèn)題。
在傳統(tǒng)的監(jiān)控防護(hù)中,大多數(shù)監(jiān)控都是按照發(fā)生問(wèn)題-發(fā)現(xiàn)問(wèn)題的位置-通告運(yùn)維人員-運(yùn)維人員處理問(wèn)題的流程進(jìn)行的。換句話來(lái)說(shuō),就是當(dāng)出現(xiàn)了預(yù)警的聲音,就代表監(jiān)控的相關(guān)工作人員已經(jīng)發(fā)現(xiàn)了問(wèn)題所在,這時(shí)候就需要將這個(gè)信息進(jìn)行傳遞,合理展開(kāi)控制和管理等相關(guān)工作。當(dāng)然,能夠在這種環(huán)境工作的相關(guān)運(yùn)維人員,其自身的專業(yè)素質(zhì)也都是非常高的。因?yàn)?,若其自身專業(yè)素質(zhì)過(guò)低,發(fā)生問(wèn)題的時(shí)候,就不能在第一時(shí)間找到問(wèn)題根源,那么帶來(lái)的后果是不可估量的。
在大數(shù)據(jù)的環(huán)境中,指數(shù)式增長(zhǎng)就是其數(shù)據(jù)特征之一。在海量的數(shù)據(jù)面前,頻繁地運(yùn)用相對(duì)傳統(tǒng)的運(yùn)維手段,這樣就易發(fā)生在工作當(dāng)中出現(xiàn)死角的現(xiàn)象,既降低工作效率又沒(méi)能確保運(yùn)維工作是否能夠正常完成。與此同時(shí),在傳統(tǒng)的運(yùn)維模式當(dāng)中,沒(méi)有對(duì)管理人員以及業(yè)務(wù)人員進(jìn)行多維度分析相關(guān)數(shù)據(jù)的工具配備,從而使這些運(yùn)維人員無(wú)法針對(duì)這些大量的運(yùn)維數(shù)據(jù),合理開(kāi)展運(yùn)維方面的相關(guān)工作,從而導(dǎo)致問(wèn)題沒(méi)能在第一時(shí)間得到有效處理,造成巨大的損失。
大數(shù)據(jù)智能運(yùn)維系統(tǒng)其智能預(yù)警功能就是把監(jiān)控對(duì)象的歷史數(shù)據(jù)以及此對(duì)象的走勢(shì)作為基礎(chǔ),對(duì)統(tǒng)計(jì)學(xué)原理基礎(chǔ)充分利用,對(duì)被監(jiān)控對(duì)象使用大數(shù)據(jù)技術(shù)進(jìn)行詳細(xì)的了解并分析,從而可以有效地對(duì)被監(jiān)控對(duì)象的平穩(wěn)性做出準(zhǔn)確的判斷。同時(shí),其還可以對(duì)業(yè)務(wù)形態(tài)和時(shí)間范圍進(jìn)行查看并分析,從而知道被監(jiān)控對(duì)象之間存在的差異性。最終形成一個(gè)動(dòng)態(tài)閾值,在不同的時(shí)間對(duì)業(yè)務(wù)進(jìn)行實(shí)時(shí)勘測(cè),通過(guò)利用這種動(dòng)態(tài)閾值,就可以使性能監(jiān)測(cè)機(jī)制得到進(jìn)一步的提升,對(duì)傳統(tǒng)的預(yù)警監(jiān)測(cè)進(jìn)行改良,從而使其在動(dòng)態(tài)上以及實(shí)時(shí)勘測(cè)上有著明顯的優(yōu)勢(shì)。這樣一來(lái),無(wú)效預(yù)警的出現(xiàn)概率就會(huì)大幅度降低,從而就可以使用戶更精確地感知系統(tǒng)中的性能是否存在異常狀況。
分析預(yù)測(cè)智能化,用通俗的話來(lái)說(shuō),就是在服務(wù)器當(dāng)中對(duì)SAMATR信息和sysolg信息等一些不相同的信息進(jìn)行基礎(chǔ)應(yīng)用。與此同時(shí),還應(yīng)當(dāng)做好相關(guān)的監(jiān)督工作和對(duì)各種例子的模擬等。在進(jìn)行一些特殊的場(chǎng)景時(shí),若能夠?qū)BDT模型合理地引入或者借助LR,這樣就能夠有效地對(duì)服務(wù)器內(nèi)部反復(fù)使用多次的部件出現(xiàn)故障的概率預(yù)測(cè)以及出現(xiàn)該故障的具體時(shí)間進(jìn)行準(zhǔn)確的,同時(shí)會(huì)采用相對(duì)應(yīng)的措施,有效地對(duì)故障做出預(yù)防,從整體上來(lái)看,增強(qiáng)了IT架構(gòu)的時(shí)效性以及可用性。另外,就產(chǎn)品和定制而言,利用智能技術(shù)對(duì)產(chǎn)品標(biāo)準(zhǔn)的準(zhǔn)確預(yù)測(cè)及對(duì)方式的開(kāi)發(fā),能夠?qū)?dòng)態(tài)閾值、瓶頸點(diǎn)獲取進(jìn)行預(yù)測(cè)及分析,這些都是需要以IT系統(tǒng)能夠準(zhǔn)確對(duì)容量進(jìn)行預(yù)測(cè)為基礎(chǔ)。除此,通過(guò)智能預(yù)測(cè)對(duì)方式的定制開(kāi)發(fā)的使用,就可以通過(guò)針對(duì)數(shù)據(jù)中心以及其余鏈路設(shè)計(jì)出一種全新的預(yù)測(cè)技術(shù),從而對(duì)網(wǎng)絡(luò)流量實(shí)現(xiàn)針對(duì)性地預(yù)測(cè),將其快速地作為決策依據(jù),進(jìn)而為流量數(shù)據(jù)的調(diào)度工作提供有效幫助。
根因定位智能化其實(shí)就是根據(jù)故障發(fā)生的原因,從而對(duì)發(fā)生故障的地方進(jìn)行精確定位,該功能的工作原理就是將專家知識(shí)庫(kù)作為基礎(chǔ),該功能通常會(huì)應(yīng)用在相對(duì)困難的IT故障場(chǎng)景之中。與此同時(shí),該功能也還可以對(duì)故障發(fā)生的位置做一些基礎(chǔ)的運(yùn)算,可以有效算出該故障地方所影響的范圍以及對(duì)故障進(jìn)行自動(dòng)化修理的功能。
在能耗的智能化管控過(guò)程中,就需要對(duì)服務(wù)器數(shù)據(jù)以及運(yùn)行的能耗進(jìn)行全方位的采集,將集群和業(yè)務(wù)作為基礎(chǔ),通過(guò)歷史數(shù)據(jù)的比對(duì)分析服務(wù)器的能耗狀況,同時(shí)與云平臺(tái)的業(yè)務(wù)調(diào)度機(jī)制相結(jié)合,通過(guò)使用powercapping、powersaving等相關(guān)的技術(shù),從而使業(yè)務(wù)系統(tǒng)能耗得到明顯的優(yōu)化,進(jìn)而使其能耗最大化減少的同時(shí)又保障了其系統(tǒng)正常的運(yùn)轉(zhuǎn)。
從大數(shù)據(jù)智能運(yùn)維系統(tǒng)的整體來(lái)看,其主要包含著四大邏輯性各不相同的模塊,分別是采集器、存儲(chǔ)數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行分析以及展示數(shù)據(jù)的模塊。這4個(gè)模塊表示著從開(kāi)始直至展示的過(guò)程,其中所謂的采集器模塊就非常高效地運(yùn)用分布式來(lái)實(shí)現(xiàn)數(shù)據(jù)動(dòng)態(tài)化進(jìn)行采集目標(biāo)的,這種采集目標(biāo)的方法在保障對(duì)數(shù)據(jù)資源高效采集的同時(shí),又可以切實(shí)保障相關(guān)任務(wù)的完成效率。比如,主機(jī)、虛擬機(jī)、存儲(chǔ)和網(wǎng)絡(luò)等相關(guān)的數(shù)據(jù)都可以利用此技術(shù)進(jìn)行采集。當(dāng)然,在采集器當(dāng)中,所有的節(jié)點(diǎn)的地位也都是平級(jí)的,只是在執(zhí)行相關(guān)采集任務(wù)的時(shí)候會(huì)有所不同。當(dāng)其中的某一項(xiàng)功能出現(xiàn)故障,導(dǎo)致停止運(yùn)轉(zhuǎn),那么控制中心就會(huì)像我們?nèi)松眢w中的白細(xì)胞受到指揮時(shí)的情形一樣,第一時(shí)間去查看發(fā)生事故的根本原因,隨后,控制中心就會(huì)將出現(xiàn)故障地方的相關(guān)采集任務(wù)分配給其他節(jié)點(diǎn),從而減少數(shù)據(jù)采集過(guò)程中受到的干擾,以保證其完整性[3]。
大部分的系統(tǒng)當(dāng)中都會(huì)有兩大數(shù)據(jù)模塊,他們就是擁有結(jié)構(gòu)化的MYSQL數(shù)據(jù)庫(kù)和沒(méi)有結(jié)構(gòu)化的MongoDB數(shù)據(jù)庫(kù)。其中,擁有結(jié)構(gòu)化的MYSQL數(shù)據(jù)庫(kù)擁有相對(duì)較強(qiáng)的穩(wěn)定性以及數(shù)據(jù)總量并不是非常龐大的特點(diǎn)。而沒(méi)有擁有結(jié)構(gòu)化的MobgoDB數(shù)據(jù)庫(kù)主要擁有較好的更新頻率以及實(shí)時(shí)性,并且它的數(shù)據(jù)結(jié)構(gòu)相對(duì)來(lái)說(shuō)較為簡(jiǎn)單。將這兩種數(shù)據(jù)庫(kù)合理地應(yīng)用,那么若想存儲(chǔ)系統(tǒng)內(nèi)全部的數(shù)據(jù)類型也不再是特別困難的事。
在大數(shù)據(jù)智能運(yùn)維系統(tǒng)的運(yùn)行中,數(shù)據(jù)分析模塊在其中起到的作用是非常重要的,其主要的功能就是對(duì)收集到的數(shù)據(jù)快速匹配相對(duì)應(yīng)的任務(wù)進(jìn)行分析,檢測(cè)此項(xiàng)數(shù)據(jù)完成的是否合格,將檢測(cè)合格的數(shù)據(jù)用最快的速度存儲(chǔ)在數(shù)據(jù)庫(kù)內(nèi)部,從而降低計(jì)算機(jī)重復(fù)計(jì)算相同數(shù)據(jù)任務(wù)的概率。
展示模塊其實(shí)就是在我們運(yùn)用圖表工具的基礎(chǔ)上,根據(jù)所收集到的相關(guān)信息做出圖形化處理的方式,將那些抽象的運(yùn)維數(shù)據(jù)用直觀的數(shù)據(jù)圖進(jìn)行展示,隨后將這些直觀的數(shù)據(jù)圖給相關(guān)操作人員進(jìn)行查看,操作人員根據(jù)數(shù)據(jù)圖很快就能夠看出其運(yùn)行狀況以及對(duì)應(yīng)的相關(guān)結(jié)果,進(jìn)而就可以提高工作效率。
綜上所述,在當(dāng)今這個(gè)時(shí)代,隨著大數(shù)據(jù)、人工智能、云計(jì)算等技術(shù)的迅速發(fā)展,許多企業(yè)也開(kāi)始跟隨時(shí)代的步伐,把智能運(yùn)維系統(tǒng)的建立作為企業(yè)的發(fā)展方向,這源于智能化運(yùn)維系統(tǒng)的便捷以及對(duì)各項(xiàng)業(yè)務(wù)的效率有著促進(jìn)作用的緣故。與此同時(shí),智能運(yùn)維系統(tǒng)擁有著強(qiáng)大的技術(shù)基礎(chǔ),當(dāng)我們?cè)谔幚磉\(yùn)維系統(tǒng)中一些較為困難的問(wèn)題時(shí),可以為我們提供一條全新的解決思路。