臧洪睿 遲克寒 馬旭東 楊婷婷
摘要:隨著數(shù)據(jù)庫種類和數(shù)量的不斷增加以及IT架構(gòu)復(fù)雜性增長,運(yùn)維人員疲于應(yīng)付巡檢和故障檢修,從而使得數(shù)據(jù)庫的故障處理難度急劇增長。為了提升數(shù)據(jù)庫缺陷分析和故障處置能力,本文將基于ISAM研究數(shù)據(jù)庫的監(jiān)控閾值的智能化設(shè)定和調(diào)整算法,以此可以運(yùn)用機(jī)器學(xué)習(xí)算法智能化判斷數(shù)據(jù)庫異常情況,并動(dòng)態(tài)設(shè)定告警閾值。
關(guān)鍵詞:數(shù)據(jù)庫;ISAM;檢測算法
中圖分類號:TP393? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號:1009-3044(2020)35-0030-02
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Analysis on the principle of Intelligent Setting and Adjusting of Database Monitoring Threshold Based on ISAM Algorithm
ZANG Hong-rui, CHI Ke-han, MA Xu-dong, YANG Ting-ting
(Information and Communication Company of State Grid Jilin Electric Power Co., Ltd., Changchun 130000,China)
Abstract:With the increasing types and number of databases and the increasing complexity of IT architecture, the operation and maintenance personnel are struggling to cope with inspection and troubleshooting, which makes the difficulty of database fault processing increase rapidly. In order to improve the ability of database defect analysis and fault handling, this paper will study the intelligent setting and adjustment of database monitoring threshold based on ISAM algorithm, so that the machine learning algorithm can be used to intelligently judge the abnormal situation of the database, and set the alarm threshold dynamically.
Key words:database;ISAM;,detection algorithm
在當(dāng)前信息化技術(shù)高速發(fā)展的大背景下,信息系統(tǒng)所承接的業(yè)務(wù)也越來越多元化、復(fù)雜化,更新速度更加頻繁。而信息系統(tǒng)中的數(shù)據(jù)庫作為重要的存儲(chǔ)保障,是海量業(yè)務(wù)數(shù)據(jù)的重要儲(chǔ)存站,因此,數(shù)據(jù)庫的安全穩(wěn)定也直接影響著信息系統(tǒng)的穩(wěn)定運(yùn)行。然而數(shù)據(jù)庫種類和數(shù)量隨著業(yè)務(wù)的增加而不斷增加,再加上IT架構(gòu)的復(fù)雜性不斷增長,這就導(dǎo)致了信息系統(tǒng)的運(yùn)維人員對數(shù)據(jù)庫的巡檢和故障檢修等工作的工作量加大,對運(yùn)維專業(yè)性要求也增強(qiáng)。從而使得運(yùn)維人員在對數(shù)據(jù)庫的故障處理過程中的難度急劇增長,一定程度上造成了數(shù)據(jù)庫運(yùn)維的安全隱患。
為了提升數(shù)據(jù)庫缺陷分析和故障處置能力,需要基于數(shù)據(jù)庫自動(dòng)化運(yùn)維工具所采集的數(shù)據(jù)庫指標(biāo)(日志信息、監(jiān)控信息、主機(jī)信息等)通過機(jī)器學(xué)習(xí)的方式來進(jìn)一步解決自動(dòng)化運(yùn)維沒辦法解決的問題。智能化系統(tǒng)能夠全面地分析數(shù)據(jù)庫缺陷,并能夠在復(fù)雜環(huán)境下實(shí)現(xiàn)問題的快速發(fā)現(xiàn)甚至提前預(yù)判。從而實(shí)現(xiàn)故障的快速診斷和精確定位,最大限度降低故障對業(yè)務(wù)運(yùn)轉(zhuǎn)的影響,提升運(yùn)維人員工作效率和質(zhì)量,提升運(yùn)維能力的自動(dòng)化、智能化技術(shù)水平,實(shí)現(xiàn)信息系統(tǒng)運(yùn)維工作由被動(dòng)式的修復(fù)向主動(dòng)預(yù)防調(diào)整的運(yùn)維模式轉(zhuǎn)變。
1 基于ISAM的數(shù)據(jù)庫監(jiān)控閾值智能化設(shè)定和調(diào)整算法
ISAM(Intelligent setting and adjustment of database monitoring threshold)即數(shù)據(jù)庫監(jiān)控閾值智能化設(shè)定和調(diào)整算法。由于在信息系統(tǒng)數(shù)據(jù)庫中的受監(jiān)控的數(shù)據(jù)具有強(qiáng)烈震動(dòng)的特性,若利用線性回歸模型對數(shù)據(jù)進(jìn)行擬合分析會(huì)導(dǎo)致誤差偏高,得不到準(zhǔn)確的數(shù)據(jù),進(jìn)而影響數(shù)據(jù)庫的運(yùn)維工作。因此這里可對震動(dòng)的數(shù)據(jù)采用分段分析的模式,即將數(shù)據(jù)序列分為若干段,將每段定義為一個(gè)模式,對每個(gè)模式取其特征值進(jìn)行描述,并進(jìn)行映射操作而得到特征向量,并將這些模式映射到二維空間上,每個(gè)模式可視為空間上的一個(gè)點(diǎn),而不同模式點(diǎn)之間的距離就是模式距離。
2 ISAM相關(guān)統(tǒng)計(jì)名詞
在此將時(shí)間設(shè)為t,則時(shí)間序列為[T=
(1)模式及模式特征:將序列劃分成若干段,把每段子序列定義為一個(gè)模式,對每個(gè)模式取其特征向量進(jìn)行描述,表示為模式特征。
(2)模式特征處理:在劃分若干模式取其模式特征時(shí),每個(gè)模式特征可能不在一個(gè)數(shù)量級上,因此需要對這些模式特征進(jìn)行規(guī)范化處理,做到統(tǒng)一:
[norm(ti)=ti-min(T)max(T)-min(T)]
(3)模式特征距離:即對每個(gè)模式特征進(jìn)行規(guī)范化處理后,將每個(gè)模式特征視為二維空間上的一點(diǎn),點(diǎn)與點(diǎn)之間的距離被稱為模式特征距離。
(4)相關(guān)系數(shù)設(shè)定:在模式集中選取k個(gè)模式,計(jì)算每個(gè)模式與其他模式之間的距離 ,然后將k個(gè)模式的計(jì)數(shù)增加1,設(shè)為[k_count],則認(rèn)定當(dāng)前模式可以達(dá)到k個(gè)模式。通過反復(fù)測試可知,當(dāng)k為模式數(shù)量的三分之一時(shí),為最佳系數(shù)。
(5) 影響系數(shù):對[k_count]進(jìn)行歸一化處理:
[effect=k_count-min(k_count)max(k_count)-min(k_count)]
(6)異常系數(shù):異常系數(shù)用來描述模式的異常程度。假設(shè)某個(gè)模式點(diǎn)可到達(dá)其他模式點(diǎn)的數(shù)量為n,則該點(diǎn)的異常系數(shù)為:
[exception=1-i=1neffectin]
(7)擬合誤差:將時(shí)間序列L(t)經(jīng)過線性差值后所得到的時(shí)間序列設(shè)為[Tc=
[E=i=1n(ti-tci)2]
3 ISAM算法流程
在面對數(shù)據(jù)庫中強(qiáng)烈震蕩的監(jiān)控?cái)?shù)據(jù)時(shí),本文提出了模式檢測算法。該算法將震蕩數(shù)據(jù)進(jìn)行分段處理,劃分為若干段,每段被認(rèn)為是一個(gè)模式單元。針對每個(gè)模式單元取其特征值進(jìn)行描述,形成特征向量。然后對每個(gè)模式的特征向量進(jìn)行計(jì)算,在得到最接近的k個(gè)模式后,將其加入該模式集中。接著將所有模式的相關(guān)模式集的大小和該模式的影響系數(shù)結(jié)合在一起,計(jì)算得到異常程度。以此類推,當(dāng)模式達(dá)到一定規(guī)模后,可以發(fā)現(xiàn)模式間的差異,從而找到異常的模式區(qū)間。
(1)將數(shù)據(jù)序列劃分為若干子序列,定義為模式,每個(gè)模式指定長度為d,并針對每個(gè)模式取其特征值。
(2)對每個(gè)模式的特征值進(jìn)行歸一化處理,得到特征向量;將這些模式特征向量的集合設(shè)定為List
(3)for(Patern pl:list);
(4)for(Patern p2:list);
(5)distance =getdistance(pl,p2);
(6)distances.add(distance);
(7)for(PatternP:list);
(8)neighbour = P.getTopK(distances);
(9)//獲取距離 TopK 的模式,構(gòu)成集合 neighbour
(10)for(Paternpk:neighbour);
(11)pk.neighbour.add(p);
(12)pk.neigh len+ ;//將鄰居節(jié)點(diǎn)加入集合
(13)for(PatternP:list);
(14)最終計(jì)算得出影響系數(shù)和異常系數(shù);
(15)若符合連續(xù)n個(gè)模式的異常系數(shù)大于k個(gè)模式,則將該模式區(qū)間以及異常系數(shù)列出來。
綜上所述,通過獲取模式特征,將各個(gè)模式序列映射為特征向量,然后進(jìn)行歸一化處理,從而得到更加適應(yīng)性的算法數(shù)據(jù)。而各個(gè)模式序列的特征向量之間的聯(lián)系可通過計(jì)算向量節(jié)點(diǎn)建的距離來衡量。
4總結(jié)
本文通過采用了ISAM數(shù)據(jù)庫監(jiān)控閾值智能化設(shè)定和調(diào)整算法,來實(shí)現(xiàn)對數(shù)據(jù)庫運(yùn)行狀態(tài)異常檢測。基于動(dòng)態(tài)基線的原理,將數(shù)據(jù)庫震蕩數(shù)據(jù)進(jìn)行分段分析,進(jìn)行模式化處理,獲得每個(gè)模式的特征向量,計(jì)算每個(gè)模式節(jié)點(diǎn)間的距離。最終計(jì)算得到影響系數(shù)和異常系數(shù),并列舉出來,從而發(fā)現(xiàn)數(shù)據(jù)庫當(dāng)中的異常數(shù)據(jù)。隨之,運(yùn)維人員可快速定位異常位置并及時(shí)處理。
參考文獻(xiàn):
[1] 武文斌.Oracle數(shù)據(jù)庫性能優(yōu)化及監(jiān)控系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2019,15(7):3-4.
[2] 信俊昌,王國仁,公丕臻,等. 不確定數(shù)據(jù)庫中的閾值輪廓查詢處理[A]. 中國計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫專業(yè)委員會(huì).第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C].中國計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫專業(yè)委員會(huì),2009:7.
[3] 胡雪梅.數(shù)據(jù)庫的閾值管理[J].四川通信技術(shù),2000(01):50-51.
[4] 張浩.網(wǎng)絡(luò)數(shù)據(jù)庫中異常數(shù)據(jù)檢測優(yōu)化仿真研究[J].電腦與電信,2019(11):32-35.
[5] 李宇明.數(shù)據(jù)庫系統(tǒng)性能評測與質(zhì)量管理[D].上海:華東師范大學(xué),2019.
【通聯(lián)編輯:光文玲】