国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

K-means++和LSTM模型在大壩監(jiān)測(cè)資料分析中的應(yīng)用

2021-07-12 03:55:32牛志偉齊慧君
關(guān)鍵詞:壩段輪廓大壩

張 進(jìn) 牛志偉,2 齊慧君 晁 陽(yáng)

(1.河海大學(xué) 水利水電學(xué)院,南京 210098;2.水安全與水科學(xué)協(xié)同創(chuàng)新中心,南京 210098)

大壩安全監(jiān)測(cè)是了解大壩運(yùn)行性態(tài)、認(rèn)識(shí)大壩變形規(guī)律的重要非工程措施[1].在大壩長(zhǎng)期服役的過(guò)程中,積累了大量的安全監(jiān)測(cè)數(shù)據(jù),其蘊(yùn)含了豐富的反映壩體性態(tài)的信息[2].隨著大數(shù)據(jù)分析技術(shù)的發(fā)展,已有很多學(xué)者將機(jī)器學(xué)習(xí)引入到監(jiān)測(cè)資料分析中,如遺傳算法[3]、隨機(jī)森林算法[4]、人工神經(jīng)網(wǎng)絡(luò)[5]等,但以上模型大多以單維度分析為主,未能充分考慮各個(gè)測(cè)點(diǎn)之間在空間維度上的相關(guān)性,且大壩變形監(jiān)測(cè)數(shù)據(jù)為復(fù)雜的非線性序列,監(jiān)測(cè)數(shù)據(jù)在時(shí)間維度上的相關(guān)性也欠考慮.K-means++聚類算法是機(jī)器學(xué)習(xí)中經(jīng)典的劃分聚類算法,該算法能有效地挖掘時(shí)空數(shù)據(jù),研究空間相似點(diǎn)的分布情況,在工業(yè)[6]、天文學(xué)[7]、電力[8]等領(lǐng)域已得到一定的應(yīng)用,但在大壩監(jiān)測(cè)資料分析中尚未得到應(yīng)用.在挖掘長(zhǎng)時(shí)間序列數(shù)據(jù)關(guān)聯(lián)性方面,LSTM深度學(xué)習(xí)模型有很大的優(yōu)勢(shì),此模型在電力諧波監(jiān)測(cè)[9]、GPS變形監(jiān)測(cè)[10]、滑坡位移[11]預(yù)測(cè)等方面均取得了較好的應(yīng)用.

本文以某碾壓混凝土重力壩為例,首先將K-means++聚類方法應(yīng)用到該大壩沉降變形空間分析中,并選取出關(guān)鍵測(cè)點(diǎn).然后選用關(guān)鍵測(cè)點(diǎn)的沉降變形數(shù)據(jù)為代表,運(yùn)用LSTM模型進(jìn)行變形預(yù)測(cè),并與SVM模型結(jié)果對(duì)比分析,評(píng)價(jià)模型在預(yù)測(cè)時(shí)間序列相關(guān)性的精度,以期為大壩監(jiān)測(cè)數(shù)據(jù)分析提供高效、便捷的新方法.

1 K-means++和LSTM模型基本原理

1.1 K-means++聚類算法

K-means++聚類算法以K-means算法為基礎(chǔ),改進(jìn)了初始聚類中心點(diǎn)選取方式,在選擇第n(n∈[2,k],k為簇群數(shù)量)個(gè)初始聚類中心時(shí),距離前(n-1)個(gè)聚類中心越遠(yuǎn)的數(shù)據(jù)點(diǎn)被選中的概率會(huì)越高.基本原理如下[12]:

(1)

(2)

按照輪盤法選出下一類聚類中心,重復(fù)上述步驟至選出k個(gè)聚類中心.在此基礎(chǔ)上,計(jì)算樣本數(shù)據(jù)集中每個(gè)樣本數(shù)據(jù)點(diǎn)xi與每個(gè)聚類中心的歐幾里德距離d,按照距離最近準(zhǔn)則將該樣本數(shù)據(jù)劃分到與之最近的聚類中心所在的簇類中,將每個(gè)簇類中的所有樣本點(diǎn)的均值作為聚類中心,通過(guò)不斷地更新聚類中心,運(yùn)用公式(3)計(jì)算簇內(nèi)誤差平方和ISSE,直到聚類中心不發(fā)生改變或誤差平方和最小為止.

(3)

在K-means++算法中,選定不同的簇類數(shù)量k,可以獲得不同的聚類,能夠直觀地了解總體樣本集合中數(shù)據(jù)的分類情況.為確定最佳簇類數(shù)量,本文應(yīng)用輪廓系數(shù)和肘部法則綜合評(píng)定.

輪廓系數(shù)St是用來(lái)衡量聚類的密集度和離散度的綜合指標(biāo),其指所有樣本點(diǎn)輪廓系數(shù)的平均值,計(jì)算見(jiàn)公式(4).輪廓系數(shù)St介于0~1之間,輪廓系數(shù)越大,表明類別內(nèi)部樣本之間密集度越高,類與類之間數(shù)目樣本離散度越高,聚類效果越好.

(4)

式中:Si指樣本集合中任一點(diǎn)xi的輪廓系數(shù),可依據(jù)公式(5)獲得.

(5)

式中:p(xi)為點(diǎn)xi到其所在簇類其他樣本點(diǎn)的平均距離;q(xi)為點(diǎn)xi到其他簇類中所有點(diǎn)的平均距離的最小值.

就肘部法則而言,其基本思想是將每個(gè)簇的質(zhì)點(diǎn)與簇內(nèi)樣本點(diǎn)的平方距離誤差和(ISSE)稱為畸變程度,畸變程度越低,代表簇內(nèi)成員越緊密,反之則簇內(nèi)結(jié)構(gòu)越松散.畸變程度會(huì)隨著類別的增加而降低,對(duì)于有一定區(qū)分度的數(shù)據(jù),在達(dá)到某個(gè)臨界點(diǎn)時(shí)畸變程度會(huì)得到極大改善,這個(gè)臨界點(diǎn)即為聚類性能較好的點(diǎn).選用不同的k值進(jìn)行K-means++算法分析,通過(guò)輪廓系數(shù)和肘部法則兩個(gè)指標(biāo)綜合選定最佳簇類數(shù)量k,使分類的保證度更高.

1.2 LSTM模型

LSTM模型主要由一個(gè)或多個(gè)記憶細(xì)胞Ct(Memory Cell)、一個(gè)輸入門It(Input Gate)、一個(gè)遺忘門Ft(Forget Gate)、一個(gè)輸出門Ot(Output Gate)組成,其結(jié)構(gòu)如圖1所示.LSTM模型主要分為3個(gè)階段[13]:

一般服務(wù)支持估計(jì)(GSSE)衡量政府財(cái)政對(duì)整個(gè)農(nóng)業(yè)部門的補(bǔ)貼支持水平,GSSE針對(duì)整個(gè)農(nóng)業(yè)部門,而非具體生產(chǎn)者或者消費(fèi)者,因此不影響農(nóng)業(yè)收入或消費(fèi)支出。一般服務(wù)支持估計(jì)百分比(%GSSE)是GSSE占農(nóng)業(yè)支持總量(TSE)的比重,%GSSE的數(shù)值越大則說(shuō)明政府提出的相關(guān)支持政策對(duì)農(nóng)戶個(gè)體行為產(chǎn)生的影響較小,對(duì)市場(chǎng)環(huán)境產(chǎn)生的作用較弱。2006-2016年各國(guó)一般服務(wù)支持估計(jì)總量見(jiàn)表4,2006-2016年各國(guó)一般服務(wù)支持估計(jì)百分比見(jiàn)表5。

圖1 LSTM模型結(jié)構(gòu)圖

1)忘記階段:該階段主要由遺忘門決定應(yīng)從上一狀態(tài)中丟棄或保留哪些信息.遺忘門Ft根據(jù)上一時(shí)段的輸出Yt-1和當(dāng)前記憶細(xì)胞輸入Ct,激活sigmoid函數(shù),輸出結(jié)果與上一時(shí)刻的記憶細(xì)胞狀態(tài)Ct-1相乘,產(chǎn)生一個(gè)0~1之間的數(shù)字,其中0表示完全舍棄上一狀態(tài)信息,1表示完全保留上一狀態(tài)信息,遺忘門Ft計(jì)算輸出見(jiàn)公式(6).

Ft=σ(Wf·[Yt-1,Xt]+bf)

(6)

It=σ(Wi·[Yt-1,Xt]+bi)

(7)

(8)

(9)

3)輸出階段:由輸出門Ot確定記憶細(xì)胞Ct狀態(tài)的輸出,與忘記階段類似,與sigmoid函數(shù)相乘確定記憶細(xì)胞中哪些信息需要被輸出.將輸出門Ot輸出結(jié)果與激活函數(shù)tan h相乘,得到最終輸出結(jié)果Yt,輸出門Ot和輸出結(jié)果Yt計(jì)算公式見(jiàn)(10)~(11).

Ot=σ(Wo·[Yt-1,Xt]+bo)

(10)

Yt=Ot·tanh(Ct)

(11)

式中:b為偏執(zhí)矢量;σ為sigmoid激活函數(shù);tanh為雙曲線正切激活函數(shù).

2 實(shí)例應(yīng)用

2.1 工程概況

某水電站大壩樞紐工程由碾壓混凝土重力壩、壩頂5孔泄水閘、PH3發(fā)電廠房和開關(guān)站等組成.壩頂高程153 m,壩底高程41 m,最大壩高112 m.初期蓄水監(jiān)測(cè)結(jié)果表明壩體和壩基垂直位移較為顯著,故對(duì)其沉降變形展開監(jiān)測(cè)尤為重要.該大壩采用埋設(shè)水準(zhǔn)點(diǎn)方式進(jìn)行沉降變形監(jiān)測(cè),分別在壩體不同高程和不同壩段埋設(shè)水準(zhǔn)點(diǎn),各監(jiān)測(cè)儀器布置如圖2所示.

圖2 監(jiān)測(cè)儀器布置圖

2.2 聚類分析

選取碾壓混凝土重力壩沉降變形監(jiān)測(cè)資料中由2011年12月31日至2020年1月28日期間的42個(gè)水準(zhǔn)點(diǎn)監(jiān)測(cè)數(shù)據(jù)作為樣本數(shù)據(jù)集合,利用K-means++聚類法進(jìn)行分析,挖掘監(jiān)測(cè)資料中沉降變形的空間分布特征,其中沉降變形以下沉為正,上抬為負(fù).

為確定達(dá)到最佳分類效果,假定簇群數(shù)量k變化范圍為[1,10],訓(xùn)練使用K-means++模型,計(jì)算其相應(yīng)簇群數(shù)量下的輪廓系數(shù)St及簇內(nèi)樣本點(diǎn)的平方距離誤差和(ISSE),計(jì)算結(jié)果如圖3所示.

圖3 不同簇群數(shù)量k值對(duì)應(yīng)的輪廓系數(shù)與誤差平方和

由圖3(a)可知,在簇群數(shù)量k=5時(shí),輪廓系數(shù)St為最大值0.70;當(dāng)k由2增至10時(shí),輪廓系數(shù)St均小于k=5所對(duì)應(yīng)的時(shí)輪廓系數(shù)值,且隨著簇群數(shù)量的增加,輪廓系數(shù)逐漸下降,均顯著小于k=5時(shí)的輪廓系數(shù)值.因此,當(dāng)k=5時(shí),類別內(nèi)部樣本內(nèi)聚度高、分離度小,可初步確定k=5為最佳簇群數(shù)量.

由圖3(b)可知,在簇群數(shù)量k=2時(shí),簇內(nèi)樣本點(diǎn)的平方距離誤差和最大,即畸變程度最高,表明簇內(nèi)結(jié)構(gòu)最為松散;當(dāng)簇群數(shù)量達(dá)到臨界點(diǎn)k=5時(shí),畸變程度得到極大改善;此外,隨著簇群數(shù)量的增加,畸變程度緩慢下降,該臨界點(diǎn)k=5可確定為聚類性能較好的點(diǎn).

綜合所述,選定k=5作為最終聚類數(shù)量,將該碾壓混凝土重力壩沉降變形監(jiān)測(cè)42個(gè)靜力水準(zhǔn)點(diǎn)劃分到5個(gè)簇群中,5類沉降變形測(cè)點(diǎn)的空間分布情況如圖4所示,其中Ⅰ類測(cè)點(diǎn)位于河床壩段靠近壩踵附近,Ⅱ類測(cè)點(diǎn)靠近壩趾,Ⅲ類、Ⅳ類測(cè)點(diǎn)分別為右岸和左岸壩段、Ⅴ類測(cè)點(diǎn)位于河床壩段中上部.

圖4 測(cè)點(diǎn)分類空間分布圖

在大壩長(zhǎng)期運(yùn)行的過(guò)程中,碾壓混凝土重力壩沉降變形整體以下沉為主,壩體下部變形應(yīng)大于壩體上部變形,河床壩段變形略大于岸坡壩段變形,河床壩段壩趾處變形大于壩踵處變形,左岸壩段出現(xiàn)上抬現(xiàn)象,右岸壩段相對(duì)比較穩(wěn)定.該規(guī)律出現(xiàn)的主要原因是:壩體下部沉降主要受地基的影響,壩體上部沉降是地基沉降變形、水壓力、自重等綜合作用疊加后的結(jié)果;河床壩段相比與岸坡壩段受壩體水壓作用變形較為明顯;且在蓄水后壩趾壓力增大,壩踵壓力減小,壩趾處沉降量出現(xiàn)略微增長(zhǎng),左岸壩段出現(xiàn)上抬主要與左岸地質(zhì)構(gòu)造有關(guān).從圖4測(cè)點(diǎn)聚類結(jié)果來(lái)看,K-means++聚類算法劃分出來(lái)的5類水準(zhǔn)點(diǎn)測(cè)點(diǎn)空間分布情況與碾壓混凝土重力壩沉降變形規(guī)律基本一致,說(shuō)明該聚類算法在挖掘監(jiān)測(cè)數(shù)據(jù)空間維度上的相關(guān)性具有一定的合理性.

3 關(guān)鍵點(diǎn)預(yù)測(cè)分析

當(dāng)樣本點(diǎn)的輪廓系數(shù)越大,簇群內(nèi)聚度和分離度都相對(duì)較優(yōu),故針對(duì)上述5類靜力水準(zhǔn)的分類結(jié)果,選取每一類中輪廓系數(shù)St最大值樣本點(diǎn)最為關(guān)鍵測(cè)點(diǎn)進(jìn)行預(yù)測(cè)分析,分別為EM4-2(Ⅰ類)、EM6-2(Ⅱ類)、EM1-11(Ⅲ類)、EM1-1(Ⅳ類)、EM1-6(Ⅴ類).各關(guān)鍵測(cè)點(diǎn)的空間分布情況為:EM1-1、EM1-6、EM1-11分別位于壩頂左岸1號(hào)壩段、壩頂河床中部5號(hào)壩段、壩頂右岸9號(hào)壩段,EM4-2和EM6-2分別位于河床中部5號(hào)壩段壩踵和壩址,該5類關(guān)鍵測(cè)點(diǎn)所在區(qū)域基本代表沉降變形的整體規(guī)律.選取關(guān)鍵測(cè)點(diǎn)從2011年12月31日至2020年1月28日的2529組沉降變形監(jiān)測(cè)數(shù)據(jù)作為原始樣本,建立LSTM模型進(jìn)行大壩沉降變形預(yù)測(cè)分析.LSTM將時(shí)間序列的概念引入模型結(jié)構(gòu)中,考慮大壩變形過(guò)程中的漸變性,充分挖掘變形監(jiān)測(cè)數(shù)據(jù)在長(zhǎng)時(shí)間序列中的關(guān)聯(lián)性.為進(jìn)一步驗(yàn)證LSTM模型運(yùn)用于大壩變形預(yù)測(cè)的合理性和優(yōu)越性,將預(yù)測(cè)結(jié)果與SVM模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析.

基于Python的機(jī)器學(xué)習(xí)庫(kù)TensorFlow,建立LSTM模型預(yù)測(cè)大壩沉降變形.設(shè)定LSTM模型的初始學(xué)習(xí)率為0.006,輸入層節(jié)點(diǎn)為11,隱含層節(jié)點(diǎn)為20,輸出層節(jié)點(diǎn)為1,正切函數(shù)為隱藏層激活函數(shù),MSE函數(shù)為損失函數(shù),模型訓(xùn)練周期設(shè)置為1 000.為評(píng)估模型的預(yù)測(cè)精度和誤差效果,圖5分別給出兩種模型的預(yù)測(cè)結(jié)果對(duì)比圖與殘差對(duì)比圖,選用均方根誤差(ERMSE)與平均絕對(duì)誤差(EMAE)作為預(yù)測(cè)精度評(píng)價(jià)指標(biāo)值,結(jié)果見(jiàn)表1.

表1 LSTM、SVM模型預(yù)測(cè)精度評(píng)價(jià)指標(biāo)值

圖5 LSTM、SVM模型預(yù)測(cè)值及殘差對(duì)比圖

結(jié)合表1分析,LSTM模型與SVM模型相比預(yù)測(cè)精度指標(biāo)均方根誤差ERMSE和平均絕對(duì)誤差EMAE最高分別提高了84.61%和86.47%(EM1-6),LSTM模型整體預(yù)測(cè)精度高于SVM模型.具體分析如下:

1)在各模型預(yù)測(cè)值對(duì)比圖(圖5(a)、5(c)、5(e)、5(g)、5(i))中,LSTM模型預(yù)測(cè)變化趨勢(shì)與實(shí)際監(jiān)測(cè)值的變化趨勢(shì)吻合程度高,與真實(shí)值最為接近,而SVM的預(yù)測(cè)結(jié)果與實(shí)際監(jiān)測(cè)值變化趨勢(shì)基本一致,預(yù)測(cè)結(jié)果值偏離實(shí)際監(jiān)測(cè)值較大.

2)結(jié)合各模型殘差對(duì)比圖(圖5(b)、5(d)、5(f)、5(h)、5(j)),在整個(gè)長(zhǎng)時(shí)間序列中,LSTM模型預(yù)測(cè)殘差均小于SVM預(yù)測(cè)殘差值,且模型預(yù)測(cè)殘差值正負(fù)分布均勻.

3)隨著預(yù)測(cè)時(shí)間序列的增長(zhǎng),LSTM模型表現(xiàn)良好,預(yù)測(cè)結(jié)果整體在真實(shí)值附近上下波動(dòng),SVM模型預(yù)測(cè)結(jié)果則逐漸與真實(shí)值偏離.

4)Ⅲ類、Ⅳ類和Ⅴ類關(guān)鍵測(cè)點(diǎn)沉降位移實(shí)際監(jiān)測(cè)值隨時(shí)間變化幅度較小,峰值不突出(5(e)、5(g)、5(f)),此情況下LSTM模型很大程度上提高了預(yù)測(cè)精度,與SVM模型相比預(yù)測(cè)精度評(píng)價(jià)指標(biāo)RMSE值和MAE值精度提高值均大于70%;Ⅰ類和Ⅱ類沉降位移實(shí)際監(jiān)測(cè)值隨時(shí)間變化幅度較大,峰值突出(5(a)、5(c)),LSTM模型預(yù)測(cè)精度略下降,但預(yù)測(cè)精度仍高于SVM模型.

綜上可知:LSTM模型預(yù)測(cè)精度明顯高于SVM模型預(yù)測(cè)精度,該模型在挖掘長(zhǎng)時(shí)間跨度數(shù)據(jù)的關(guān)聯(lián)性顯示出較大的優(yōu)勢(shì).

4 結(jié) 論

本文綜合利用K-means++和LSTM模型,對(duì)某碾壓混凝土重力壩沉降變形資料在空間和時(shí)間維度上的相關(guān)性進(jìn)行分析,得到以下結(jié)論:

1)利用K-means++聚類方法,分析大壩監(jiān)測(cè)點(diǎn)的空間聚集狀態(tài),確定出關(guān)鍵的大壩沉降監(jiān)測(cè)點(diǎn).該方法在反映大壩空間維度上的相關(guān)性具有一定的合理性,且選取關(guān)鍵測(cè)點(diǎn)進(jìn)行分析在一定程度上減少了工作人員的工作量,有利于及時(shí)掌握大壩運(yùn)行狀態(tài).

2)結(jié)合關(guān)鍵測(cè)點(diǎn)的沉降變形監(jiān)測(cè)數(shù)據(jù),建立LSTM模型預(yù)測(cè)大壩變形,挖掘變形監(jiān)測(cè)數(shù)據(jù)在時(shí)間維度上的相關(guān)性.與SVM模型預(yù)測(cè)結(jié)果相比,LSTM模型預(yù)測(cè)精度指標(biāo)均方根誤差ERMSE和平均絕對(duì)誤差EMAE最高分別提高了84.61%和86.47%,表明該模型預(yù)測(cè)精度較高,在長(zhǎng)時(shí)間序列關(guān)聯(lián)性的挖掘中具有一定的優(yōu)勢(shì).但該模型在處理復(fù)雜的非線性問(wèn)題時(shí),對(duì)數(shù)據(jù)在時(shí)間序列上的依存性和隨機(jī)干擾的情況下的波動(dòng)性方面考慮尚不充分,需要做進(jìn)一步的研究.

猜你喜歡
壩段輪廓大壩
基于CATIA 的重力壩自動(dòng)化裝配設(shè)計(jì)及工程應(yīng)用
人民黃河(2023年6期)2023-06-08 09:15:26
OPENCV輪廓識(shí)別研究與實(shí)踐
白石水庫(kù)壩體結(jié)構(gòu)穩(wěn)定性計(jì)算評(píng)價(jià)
蘇阿皮蒂水利樞紐大壩泄流底孔壩段混凝土入倉(cāng)方式研究
基于實(shí)時(shí)輪廓誤差估算的數(shù)控系統(tǒng)輪廓控制
大壩:力與美的展現(xiàn)
幫海貍建一座大壩
大壩
烏拉泊水庫(kù)副壩段除險(xiǎn)加固前后滲流監(jiān)測(cè)資料分析
在線學(xué)習(xí)機(jī)制下的Snake輪廓跟蹤
大竹县| 延寿县| 朝阳市| 海晏县| 淮南市| 温泉县| 襄城县| 闽清县| 清苑县| 乐陵市| 高雄市| 诸暨市| 安化县| 梁平县| 中西区| 常山县| 河北省| 沁源县| 乌恰县| 太白县| 大足县| 鹰潭市| 三门县| 保山市| 罗源县| 勐海县| 闽侯县| 手游| 云浮市| 宁河县| 双鸭山市| 蒙自县| 将乐县| 扶绥县| 外汇| 建阳市| 武夷山市| 湖北省| 巴里| 永清县| 榆中县|