裘明華
(浙江頤川科技有限公司,杭州 310000)
隨著科技進(jìn)步,全世界已經(jīng)步入信息時(shí)代,水利行業(yè)亦開(kāi)始大規(guī)模應(yīng)用計(jì)算機(jī)網(wǎng)絡(luò)、現(xiàn)代通信、智能控制以及數(shù)據(jù)挖掘等新興技術(shù),來(lái)實(shí)現(xiàn)高效管理水利工程的目的[1-3]。
數(shù)據(jù)挖掘技術(shù)最早是應(yīng)用于商業(yè)管理領(lǐng)域,隨著信息化的發(fā)展,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于水利工程的研究成為未來(lái)水利行業(yè)信息化發(fā)展的一個(gè)重要趨勢(shì)。付曉旭、韓紅旗、李瓊等[4-6]展開(kāi)對(duì)數(shù)據(jù)挖掘技術(shù)在水利工程信息化管理應(yīng)用中的可行性。許惠君、張弛等[7-8]深入探討數(shù)據(jù)挖掘技術(shù)在水庫(kù)調(diào)度與防洪過(guò)程中的應(yīng)用。此外,數(shù)據(jù)挖掘技術(shù)在我國(guó)水利工程安全管理中也逐漸得到重視。阿米娜古[9]指出,水利工程安全管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)數(shù)據(jù),能夠?qū)崿F(xiàn)水利工程中數(shù)據(jù)的高效篩選與合理分析,實(shí)現(xiàn)水利工程的科學(xué)化、專(zhuān)業(yè)化、信息化、高效化、自動(dòng)化。楊獻(xiàn)志等[10]深入探討了水利工程管理中數(shù)據(jù)挖掘技術(shù)應(yīng)用可行性及前景,并指出數(shù)據(jù)挖掘技術(shù)能夠使得水利工程項(xiàng)目管理更加科學(xué)化。
綜上所述,現(xiàn)有的關(guān)于我國(guó)水利工程安全監(jiān)測(cè)與管理的研究主要是從管理制度或方向方面提出,而缺乏對(duì)新型技術(shù)引用的研究。數(shù)據(jù)挖掘技術(shù)是基于某大數(shù)據(jù)庫(kù)發(fā)掘有效有價(jià)值的數(shù)據(jù)并加以利用的新型技術(shù),目前被廣泛應(yīng)用到各個(gè)領(lǐng)域中。因此,發(fā)展數(shù)據(jù)挖掘技術(shù)在水利工程安全維護(hù)管理中的應(yīng)用,對(duì)于促進(jìn)我國(guó)水利工程管理現(xiàn)代化、建設(shè)高效暢通的安全管理體系具有十分重要的意義。
田家灣水庫(kù)位于浙江省湖州市田家灣村,項(xiàng)目區(qū)冬季寒冷干燥,春季濕潤(rùn)多風(fēng),夏季高溫多雨,秋季旱澇無(wú)常。水庫(kù)工程屬長(zhǎng)江流域支流水利工程,水庫(kù)控制流域面積為97 km2,總庫(kù)容為942.5×104m3。根據(jù)現(xiàn)場(chǎng)調(diào)查結(jié)果,由于水庫(kù)大壩工程年久失修,因此部分溢洪道泄洪能力出現(xiàn)問(wèn)題,不能滿(mǎn)足下游山西省高校新校區(qū)防洪的限泄要求。因此,展開(kāi)對(duì)該水利工程的安全監(jiān)測(cè)、管理與風(fēng)險(xiǎn)評(píng)價(jià)具有重要意義。為合理布置實(shí)施田家灣水庫(kù)除險(xiǎn)加固工程,現(xiàn)需要對(duì)該水庫(kù)各溢洪道的實(shí)際情況展開(kāi)監(jiān)測(cè)與安全管理。見(jiàn)圖1。
圖1 田家灣水庫(kù)
傳統(tǒng)的信息處理側(cè)重于關(guān)鍵詞查詢(xún)與關(guān)鍵信息統(tǒng)計(jì)分析,而對(duì)一些“次要”的指標(biāo)所隱含的信息則選擇忽略。數(shù)據(jù)挖掘即指從長(zhǎng)時(shí)間所堆積的大量歷史數(shù)據(jù)中提取人們有興趣、有價(jià)值的數(shù)據(jù)知識(shí)的過(guò)程。這些數(shù)據(jù)不僅包括關(guān)鍵的、重要的信息,同時(shí)也包括大量數(shù)據(jù)中所隱含的信息,這些信息對(duì)管理措施決策可能具有重要意義。數(shù)據(jù)挖掘是通過(guò)對(duì)某個(gè)數(shù)據(jù)庫(kù)中的每個(gè)數(shù)據(jù)展開(kāi)分析,從而探索獲得大量數(shù)據(jù)中基礎(chǔ)規(guī)律的技術(shù)。數(shù)據(jù)挖掘技術(shù)主要包括數(shù)據(jù)準(zhǔn)備、規(guī)律探尋以及規(guī)律確定這3個(gè)項(xiàng)目。數(shù)據(jù)挖掘技術(shù)主要方法見(jiàn)表1。
表1 數(shù)據(jù)挖掘技術(shù)主要方法
由于現(xiàn)場(chǎng)數(shù)據(jù)具有完整性差、噪點(diǎn)多等劣勢(shì),從設(shè)計(jì)監(jiān)理單位所獲取的數(shù)據(jù)不全為有效數(shù)據(jù),因此需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理以獲得真實(shí)有效的數(shù)據(jù),使得試驗(yàn)研究樣本更加真實(shí),以保證數(shù)據(jù)挖掘的正確性。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)篩選、數(shù)據(jù)補(bǔ)充及數(shù)據(jù)整合標(biāo)準(zhǔn)化3個(gè)步驟。在對(duì)數(shù)據(jù)展開(kāi)聚類(lèi)分析時(shí),通常采用分類(lèi)統(tǒng)計(jì)量距離來(lái)描述不同數(shù)據(jù)之間的相似度。常見(jiàn)的距離統(tǒng)計(jì)量有以下幾種:Manhattan距離、Euclidean距離以及Chebychev距離。本次研究采用Manhattan距離(也稱(chēng)絕對(duì)值距離)進(jìn)行距離計(jì)算及相似度分析,假設(shè)某個(gè)樣本中具有n個(gè)樣品,其基本計(jì)算方法如下:
(1)
采用K-means聚類(lèi)算法進(jìn)行計(jì)算,其基本原則是優(yōu)化初始聚類(lèi)中心,使選取的初始聚類(lèi)中心的距離盡量遠(yuǎn)[11-12]。本次研究采用“聚類(lèi)-分級(jí)”的層次聚類(lèi)分析方法(圖2)來(lái)處理水庫(kù)不同安全監(jiān)測(cè)點(diǎn)的分級(jí)管理問(wèn)題。
圖2 AGNES層次聚類(lèi)分析法
其具體實(shí)現(xiàn)過(guò)程主要分為4個(gè)步驟:
1)獲取水庫(kù)溢洪道安全相關(guān)監(jiān)測(cè)點(diǎn)的具體數(shù)據(jù)并進(jìn)行預(yù)處理,以得到真實(shí)、有效的數(shù)據(jù)。
2)認(rèn)為設(shè)定K值,基于改進(jìn)的K-means算法將安全因素分為K個(gè)簇(K即為期望劃分的等級(jí)數(shù)),計(jì)算簇間距離并得到劃分為K個(gè)簇的數(shù)據(jù)庫(kù)。
3)計(jì)算聚類(lèi)后的每個(gè)簇內(nèi)數(shù)據(jù)的總均值Sj,Sj值可由下式計(jì)算:
(2)
式中:i為監(jiān)測(cè)點(diǎn)編號(hào)(1,2,…,n);j為簇?cái)?shù)編號(hào)(1,2…,k);Q為溢洪道在的安全效能值;R為監(jiān)測(cè)點(diǎn)風(fēng)險(xiǎn)因素修復(fù)率,%;N為監(jiān)測(cè)點(diǎn)沉降量,mm;E為監(jiān)測(cè)點(diǎn)偏移量,m。
4)根據(jù)Sj的值,按照大小順序?qū)⒈O(jiān)測(cè)點(diǎn)的效能劃分為k個(gè)等級(jí)。
經(jīng)過(guò)現(xiàn)場(chǎng)觀察和調(diào)查,田家灣水庫(kù)溢洪道存在一定的安全風(fēng)險(xiǎn),主要表現(xiàn)在溢洪道不同部位出現(xiàn)混凝土破裂,上覆土層位移變形,嚴(yán)重影響溢洪道工作效率。為合理分析溢洪道不同部位的安全運(yùn)行,本次研究選取田家灣水庫(kù)中溢洪道20個(gè)安全監(jiān)控點(diǎn)的數(shù)據(jù)作為樣本進(jìn)行研究,經(jīng)過(guò)預(yù)處理得到基本數(shù)據(jù),見(jiàn)表2。
表2 田家灣水庫(kù)20個(gè)安全監(jiān)測(cè)點(diǎn)數(shù)據(jù)
按照上節(jié)所述具體流程與步驟,選定分級(jí)簇總數(shù)k為4;再利用Matlab等數(shù)據(jù)分析軟件,最終得到基于數(shù)據(jù)挖掘技術(shù)的分級(jí)結(jié)果見(jiàn)表3。
表3 基于改進(jìn)K-means算法的分級(jí)結(jié)果
綜上可知,按照4個(gè)等級(jí)機(jī)制,則該水庫(kù)中按次序每個(gè)等級(jí)安全監(jiān)測(cè)點(diǎn)的數(shù)目分別為2、10、3和5個(gè)。由此可見(jiàn),該水庫(kù)溢洪道安全監(jiān)測(cè)點(diǎn)中有8個(gè)監(jiān)測(cè)點(diǎn)反映出安全性較低(Ⅲ、Ⅳ級(jí)),需要進(jìn)行修復(fù)或更換。根據(jù)K-means算法輸出結(jié)果,可以得到Ⅲ、Ⅳ級(jí)需要修復(fù)的監(jiān)測(cè)點(diǎn)編號(hào),其中Ⅲ級(jí)的有監(jiān)測(cè)點(diǎn)2號(hào)、4號(hào)和11號(hào),Ⅳ級(jí)的有1號(hào)、7號(hào)、8號(hào)、10號(hào)和16號(hào),因此需要采取措施針對(duì)對(duì)應(yīng)編號(hào)尤其是Ⅳ級(jí)簇內(nèi)的監(jiān)測(cè)點(diǎn)展開(kāi)及時(shí)的修復(fù)。
為研究數(shù)據(jù)挖掘技術(shù)在水利工程安全監(jiān)測(cè)管理中的應(yīng)用,本文基于數(shù)據(jù)挖掘技術(shù)建立了水利工程溢洪道安全等級(jí)劃分基本方法,并以我國(guó)浙江省田家灣灣水庫(kù)為例開(kāi)展了深入研究。主要結(jié)論如下:
1)基于數(shù)據(jù)挖掘技術(shù)中的聚類(lèi)分析法,并采用改進(jìn)的K-means算法建立水利工程安全監(jiān)測(cè)管理等級(jí)劃分基本方法,該方法具有高效、可處理復(fù)雜數(shù)據(jù)的優(yōu)勢(shì),能夠適用于我國(guó)水利工程安全監(jiān)測(cè)管理工作中。
2)基于水利工程溢洪道等級(jí)劃分基本方法,得到田家灣水庫(kù)溢洪道安全監(jiān)測(cè)點(diǎn)中按次序每個(gè)等級(jí)的監(jiān)測(cè)點(diǎn)數(shù)目分別2、10、3和5個(gè),且能夠快速確定每個(gè)等級(jí)的對(duì)應(yīng)序號(hào)。其中,等級(jí)為Ⅲ、Ⅳ級(jí)的安全監(jiān)測(cè)點(diǎn)反映出嚴(yán)重問(wèn)題,需要及時(shí)進(jìn)行修復(fù)或更換,該區(qū)域需要修復(fù)的位置總數(shù)為8個(gè)。