国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于PSO-XGBoost 的礦井突水水源快速判識模型

2023-08-29 02:24:00董東林張隴強張恩雨傅培祺陳宇祺林新棟李慧哲
煤炭科學(xué)技術(shù) 2023年7期
關(guān)鍵詞:突水含水層水源

董東林 ,張隴強 ,張恩雨 ,傅培祺 ,陳宇祺 ,林新棟 ,李慧哲

(中國礦業(yè)大學(xué)(北京) 地球科學(xué)與測繪工程學(xué)院, 北京 100083)

0 引 言

煤炭作為我國短時間內(nèi)不可替代的穩(wěn)定主體能源,煤炭資源的安全、清潔、高效開采關(guān)乎我國能源安全和經(jīng)濟的健康可持續(xù)發(fā)展[1-3]。然而,我國煤礦水文地質(zhì)條件異常復(fù)雜,煤層在開采過程中水害頻發(fā)[4],不僅長期制約著我國煤炭資源的安全開采,還嚴重威脅著井下礦工的生命安全。礦井發(fā)生突水后,快速、準(zhǔn)確地判識突水水源是礦井水害治理的關(guān)鍵[5-6]。傳統(tǒng)的礦井突水水源判識法主要有水位動態(tài)觀測[7]、水溫、水化學(xué)[8-9]、同位素示蹤[8-10]及基于GIS[11-12]等方法。地下水化學(xué)能真實反應(yīng)地下水中不同離子的本質(zhì)特征[13],眾多學(xué)者基于水化學(xué)參數(shù)分析,以不同離子作為主要判別指標(biāo),建立相應(yīng)的突水水源識別模型[14],為基于水化學(xué)判識突水水源奠定了深厚基礎(chǔ)。常見的突水水源判識模型大體分為基于數(shù)學(xué)方法(多元統(tǒng)計[15-16]、模糊數(shù)學(xué)法[17]、灰色系統(tǒng)法[18])和結(jié)合計算機技術(shù)(神經(jīng)網(wǎng)絡(luò)[19]、SVM法[20]、可拓識別法[21])兩大類。這些方法在提高礦井突水水源判別準(zhǔn)確性的同時,還推動了礦井防治水理論的發(fā)展,然而這些方法在應(yīng)用過程中仍舊存在局限和不足。比如,基于水化學(xué)參數(shù)的判別模型雖然性能較為穩(wěn)定,但識別時間長,效率低,較難適應(yīng)礦井突水的實時監(jiān)測[22],不宜在短時間內(nèi)快速開展礦井突水災(zāi)害防治;神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力、自學(xué)習(xí)能力和容錯性,但對訓(xùn)練樣本要求較高,樣本選擇的合適與否將直接影響到最終的判識結(jié)果[23];模糊數(shù)學(xué)和灰色數(shù)學(xué)法較難確定因子權(quán)重和隸屬度[24];可拓識別法在處理差異較小的樣本數(shù)據(jù)時容易造成誤判。近年來,紫外?可見分光光度法被廣泛應(yīng)用于醫(yī)學(xué)、環(huán)境、化工、地質(zhì)學(xué)等諸多領(lǐng)域,但鮮有文獻報道利用該技術(shù)方法來識別礦井突水水源的應(yīng)用研究。紫外可見分光技術(shù)憑借時間響應(yīng)快、精度高和抗干擾等特點,為礦井突水水源判識提供新的思路和方法。

光譜數(shù)據(jù)承載著測試水源的重要特征信息[25],因此,基于光譜數(shù)據(jù)的突水水源判別是高維數(shù)據(jù)的多分類問題。常見分類算法有決策樹(DT)、隨機森林(RF)、BP 神經(jīng)網(wǎng)絡(luò)、支持向量機(SVM)、XGBoost 等。決策樹算法易于理解和解釋,但如果樹深度過大,會導(dǎo)致過擬合問題,此外,決策樹算法對于連續(xù)性變量處理較為困難[26]。隨機森林算法雖然改善了決策樹容易過擬合的缺陷[27],但該算法在解決不平衡數(shù)據(jù)集分類精度方面仍有待進一步提高。BP 神經(jīng)網(wǎng)絡(luò)基于反向誤差傳播原理,網(wǎng)絡(luò)訓(xùn)練耗時長,且需多次訓(xùn)練才能獲取較為穩(wěn)定的模型。SVM分類適合于處理高維模式下的小樣本數(shù)據(jù)[28],但受參數(shù)影響明顯,對于噪聲和異常值較敏感[29]。XGBoost 算法是一種提升樹模型,基于對GBDT 算法的高效改進,兼具對高維數(shù)據(jù)集的規(guī)模求解和精準(zhǔn)分類,并且該算法引入正則項技術(shù)避免了過擬合情況,有效提高了模型分類識別的泛化能力。

研究基于遼寧撫順煤田老虎臺礦不同類型水樣的40 組光譜數(shù)據(jù),采用XGBoost 模型進行礦井突水水源識別研究,并利用粒子群優(yōu)化算法(PSO)對XGBoost 模型的學(xué)習(xí)率(learning rate)、隨機采樣率、最小葉子節(jié)點樣本權(quán)重(min child weight)和樹最大深度(max depth)等7 項參數(shù)進行優(yōu)化,建立PSOXGBoost 分類識別模型,以實現(xiàn)對礦井突水水源的精準(zhǔn)高效預(yù)測,為礦井突水水源識別提供新的思路與方法。

1 PSO-XGBoost 模型基本原理及構(gòu)建

1.1 XGBoost 算法基本原理

XGBoost 是基于 Gradient Boosting Decision Tree(GBDT)算法高效改進而來,兼具良好的分類性能和運行速度[30]。相較于Boosting 庫,XGBoost 算法通過對損失函數(shù)二階泰勒展開,并引入正則項以實現(xiàn)整體最優(yōu)解,以此來控制模型整體復(fù)雜度,從而有效提高了算法的泛化能力。此外,為防止出現(xiàn)過擬合問題,該算法采用同時對特征選擇并行處理的方法,使得該算法運行速度更快,且結(jié)果更具有可解釋性。

假設(shè)給定包含n個樣本數(shù)量的數(shù)據(jù)集D={(xi,yi)|xi∈Rm,yi∈R,i=1,2,···,n}由m個特征組成,共n個樣本,其中Rm和R分別為m維實數(shù)向量數(shù)據(jù)集和實數(shù)集合。

式中:fk為一棵回歸樹;K為回歸樹的總數(shù)目;F為回歸樹空間。

目標(biāo)函數(shù)Obj為

式中:l為損失函數(shù),用來衡量分類預(yù)測值和真實值之間的誤差;為分類預(yù)測值;yi為真實值;?(fk)為正則項。

XGBoost 算法采用梯度提升迭代運算,每經(jīng)過一次迭代過程,將添加新的回歸樹,則第t次迭代運算結(jié)果為:

將式(3)代入式(2),計算出第t次迭代的目標(biāo)函數(shù)表達式為Obj(t):

式中:σ為常數(shù)項。

將式(4)二階泰勒展開,并加入正則項?(fk)防止出現(xiàn)過擬合現(xiàn)象。

式中:γ為葉子樹懲罰系數(shù);T為樹葉子節(jié)點數(shù)目;ω為葉子權(quán)重;λ為權(quán)重懲罰系數(shù);|| ||為對ω2進行正則運算。

由于XGBoost 算法中參數(shù)較多,調(diào)參過程隨機性大,需要通過參數(shù)尋優(yōu)來提高模型的分類預(yù)測精度。因此選用處理多參數(shù)優(yōu)化問題效果顯著的PSO算法優(yōu)化模型參數(shù),通過減少參數(shù)選取的隨機性,以此來提高模型的分類預(yù)測性能。

1.2 粒子群優(yōu)化算法(PSO)

粒子群優(yōu)化算法(PSO)是一種基于模仿鳥群覓食行為構(gòu)建起來的群智能算法[31-32]。相比于蟻群、遺傳和模擬退火等智能優(yōu)化算法,該算法完善了蟻群算法收斂速度慢和遺傳算法、模擬退火算法易陷入局部最優(yōu)解等缺陷[33]。PSO 算法憑借參數(shù)少、結(jié)構(gòu)簡單、效率高、容易實現(xiàn)以及能解決非凸問題等優(yōu)點,已被廣泛用來解決支持向量機(SVM)[34]、BP 神經(jīng)網(wǎng)絡(luò)[35]、極限學(xué)習(xí)(ELM)等算法的優(yōu)化問題,并且優(yōu)化效果顯著。PSO 算法將優(yōu)化問題的解定義為在有限維度空間內(nèi)搜索粒子,每個粒子由一個位置矢量和速度矢量組成,所有粒子共同合作擇優(yōu),通過自身最優(yōu)值和粒子群的最優(yōu)值向更好的位置搜索。每個粒子通過適應(yīng)度函數(shù)計算適應(yīng)值來衡量自身位置的優(yōu)劣,同時粒子群中所有粒子都追隨當(dāng)前最優(yōu)粒子在解空間中位置進行搜索。

假設(shè)有一個D維的搜索空間,群中粒子總數(shù)為m,第i個粒子的位置表示為向量Xi=[xi1,xi2,···,xiD]T,速度向量表示為Vi=[Vi1,Vi2,···,ViD]T,該粒子自身搜索到的最優(yōu)位置為Pi=[Pi1,Pi2,···,PiD]T,整個種群搜索到的最優(yōu)位置表示為Pg=[Pg1,Pg2,···,PgD]T,這里g為粒子編號,g∈(1,2,3,···,m)。初始化粒子群后PSO 算法將計算每個粒子的適應(yīng)值,通過不斷更新迭代來搜索最優(yōu)解。每進行一次迭代,粒子Xi通過個體最優(yōu)值Pi和群體最優(yōu)值Pg來更新自身的位置和速度,迭代公式如下:

式中:k為迭代次數(shù);ω為慣性系數(shù),用來控制算法的收斂和搜索能力;r1、r2為[0,1]之間的隨機數(shù);c1和c2分別為加速因子,表示將粒子推向個體最優(yōu)值Pi和群體最優(yōu)值Pg的加速項權(quán)重。

1.3 PSO-XGBoost 模型構(gòu)建

基于XGBoost 原理與PSO 算法理論,將PSO 應(yīng)用于XGBoost 分類器的參數(shù)尋優(yōu),構(gòu)建PSO-XGBoost礦井突水水源光譜分類預(yù)測模型(圖1),流程為:

圖1 礦井突水水源識別模型流程Fig.1 Flow of mine water inrush source identification model

1)對測量得到的光譜數(shù)據(jù)進行多元散射校正、平滑去噪及標(biāo)準(zhǔn)化預(yù)處理;

2)對預(yù)處理后的光譜數(shù)據(jù)進行主成分分析,依照累計貢獻率選取若干主成分,根據(jù)主成分分析結(jié)果重新計算數(shù)據(jù)集,以此來實現(xiàn)數(shù)據(jù)集降維;

3)按照7∶3 的比例劃分訓(xùn)練集與測試集,設(shè)定適當(dāng)?shù)倪m應(yīng)度函數(shù)并初始化粒子個體最優(yōu)值和全局最優(yōu)值,對learning_rate、max_depth 等參數(shù)進行尋優(yōu);

4)迭代更新粒子速度與位置,通過計算其適應(yīng)度值,不斷更新個體最優(yōu)值與全局最優(yōu)值至達到迭代終止條件;

5)選取最優(yōu)參數(shù)值,構(gòu)建參數(shù)優(yōu)化的XGBoost 分類模型,導(dǎo)入訓(xùn)練集進行模型訓(xùn)練學(xué)習(xí)。

1.4 模型評價指標(biāo)

研究選擇判識正確率和對數(shù)損失值對模型的分類判識效果進行評價。其中正確率A計算公式為

其中:np為模型正確分類樣本個數(shù);n為樣本總個數(shù)。模型正確分類的樣本數(shù)越多,正確率越高,模型分類效果越好。

對數(shù)損失值類似于邏輯回歸中的損失函數(shù)值,通過對錯誤分類結(jié)果的懲罰修正,實現(xiàn)對分類器的分類效果量化,其計算公式為:

其中,Y為輸出變量;X為輸入變量;L為損失函數(shù);N為輸入樣本量;M為分類類別數(shù);yij用于表示類別j是否是輸入實例xi的真實類別;pij為模型輸入實例xi屬于類別j的概率。對數(shù)損失值越接近0,表示損失越小,模型分類效果也就越好。

2 PSO-XGBoost 模型應(yīng)用

2.1 礦區(qū)概況

老虎臺煤礦開采于1907 年,位于遼寧省撫順煤田中部,井田東西部分別與龍鳳礦報廢井田和西露天礦井田相鄰,南至煤層露頭,北至最終開采境界線,面積約為6.88 km2(圖2)。礦區(qū)整體地勢南高北低,南部最高為老虎臺山,中部礦區(qū)地勢平坦,渾河從礦區(qū)北部由東向西流過,是礦區(qū)水系的主干流。

圖2 研究區(qū)位置Fig.2 Location of the study area

礦區(qū)共發(fā)育4 個含水層,自上而下依次為:第四系沖積砂及礫石孔隙含水層、古近系西露天組泥灰?guī)r裂隙含水層、古近系栗子溝組和老虎臺組凝灰?guī)r、玄武巖弱含水層和白堊系龍鳳坎組砂礫巖含水層,其中第四系沖積砂、礫石含水層為主要含水層,其余為弱含水層(圖3)。各含水層水文地質(zhì)特征如下:

圖3 含隔水層垂向示意Fig.3 Vertical of aquifer layer

1)第四系沖積砂及礫石孔隙含水層。第四系沖積層位于基巖剝蝕面之上,厚度4~24.3 m,由粗細不等的砂卵石組成。含水層上部為黃色亞粘土及砂土覆蓋,底部為卵石, 單位涌水量q=0.841~4.12 L/(s·m),滲透系數(shù)k=10.27~92.8 m/d。該層受大氣降水補給,富水性強,是礦井主要含水層,水質(zhì)類型為HCO3-Ca-Mg 型。

2)古近系西露天組泥灰?guī)r裂隙含水層。該層全區(qū)發(fā)育,屬泥灰?guī)r綠色頁巖系,為綠色含鈣質(zhì)頁巖及綠色石灰?guī)r互層,其單位涌水量q=0.07l L/(s·m),滲透系數(shù)k=0.065 m/d,水質(zhì)類型為SO4-HCO3-Ca-Mg型,屬弱礦化淡水。

3)古近系栗子溝組和老虎臺組凝灰?guī)r、玄武巖弱含水層。由淺灰綠?暗灰綠色凝灰?guī)r及橄欖玄武巖組成,位于煤層底板以下,弱含水。單位涌水量q=0.516~0.000 015 l L/(s·m),滲透系數(shù)k=1.178~0.228 m/d。該層在煤層露頭接受大氣降水和第四紀沖積層孔隙水補給,采掘工作面揭露時,局部表現(xiàn)為滴水和淋水,有的地點為裂隙水。

4)白堊系龍鳳坎組砂礫巖含水層。該層分布在井田西部,由不同巖石的角礫組成,巖石主要為花崗片麻巖,石英及玄武巖,微弱含水,其單位涌水量為0.001 89~0.002 47 L/(s·m),滲透系數(shù)為0.000 462 3~0.007 84 m/d,平均水位標(biāo)高76.20 m。

2.2 數(shù)據(jù)采集與處理

在老虎臺煤礦防治水專業(yè)人員的指導(dǎo)下,依據(jù)礦井突(淋)水特點和以往突水情況,科學(xué)選取了地表水體、第四系沖積砂及礫石孔隙含水層、古近系西露天組泥灰?guī)r裂隙含水層和老虎臺礦東部龍鳳井田老空積水4 種水樣類型。每種類型水單獨采集10 組,總計40 組水樣,水樣信息及編號見表1,對采取的水樣進行密封、避光運輸和保存。采用DR-3900 型分光光度計對采集到的水樣進行紫外-可見光光譜測量,波長范圍設(shè)置為320~1 100 nm,采樣間隔為1 nm,在測量前用靜置10 min 的超純水作為參比溶液進行基線校準(zhǔn),最終測得40 組光譜數(shù)據(jù),各水樣光譜曲線如圖4 所示。

表1 水樣信息及編號Table 1 Water sample information and number

圖4 原始水樣光譜曲線Fig.4 Spectral curve of the original water sample

圖4 顯示光譜數(shù)據(jù)測量波段內(nèi)的最大值均集中在紫外光區(qū),符合物質(zhì)對光的波長選擇性吸收的原理。由于本次研究集中在紫外?可見光波段,因此只選取320~700 nm 的波段測量值作研究數(shù)據(jù)集。在光譜測量過程中,可能受到光源不穩(wěn)定性、光路衰減和末端吸收、電路噪聲及外界雜散光等多種因素的影響,使得光譜圖像受到噪聲干擾。對此選用平滑去噪和多元散射校正法對光譜數(shù)據(jù)進行預(yù)處理,以增強光譜數(shù)據(jù)特征并消除干擾。平滑去噪選用Savitzky-Golay 卷積平滑法,先從4 類水樣中各取一組樣本計算不同窗口寬度和多項式階數(shù)取值下的均方差值(MSE),確定出最佳的S-G 法參數(shù)取值,得到的評價見表2。綜合來看,當(dāng)窗口寬度取5,多項式階數(shù)取3 時有最小的MSE 值,采用該參數(shù)組合對數(shù)據(jù)集進行去噪處理。

表2 Savitzky-Golay 卷積平滑評價指標(biāo)Table 2 Evaluation indexes of Savitzky-Golay convolution smoothing

對去噪后的數(shù)據(jù)集進行多元散射校正處理,減少由于水樣散射水平不同導(dǎo)致的光譜差異,將同一類水樣的譜線進行聚攏,最終預(yù)處理完成得到的水樣光譜曲線如圖5 所示。經(jīng)過光譜預(yù)處理后,各水樣光譜圖像之間的差異得到了顯著增強,譜線的靈敏度也有所提高,更易于后續(xù)模型的分類識別。

圖5 預(yù)處理后的水樣光譜曲線Fig.5 Spectral curve of pretreatment water samples

對預(yù)處理后的光譜數(shù)據(jù)min-max 標(biāo)準(zhǔn)化處理,并采用主成分分析法(PCA)對其進行特征提取。低維度的數(shù)據(jù)能加快識別算法的運算速度,同時讓數(shù)據(jù)的特征更明顯,提升識別準(zhǔn)確度。設(shè)置累計貢獻率為90%,獲取5 個主成分,其累計貢獻率見表3,降維處理后的各主成分荷載得分如圖6 所示。主成分分析后的總數(shù)據(jù)點數(shù)從15 240 個減少到200 個,數(shù)據(jù)量減少了98.69%,極大地簡化了數(shù)據(jù)處理工作量?;赑CA 得到的特征向量重新計算并劃分數(shù)據(jù)集,考慮到樣本數(shù)量較少,采用隨機劃分訓(xùn)練集、測試集的方式不能保證數(shù)據(jù)分布的一致性,因此采用分層隨機抽樣的方法按照比例7∶3 將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。

表3 主成分及其累計貢獻率Table 3 Cumulative contribution of principal components

圖6 主成分荷載得分Fig.6 Plot of principal component load scores

2.3 水源判別結(jié)果

對訓(xùn)練集運用PSO 算法對XGBoost 分類器的參數(shù)進行尋優(yōu),并將適應(yīng)度判斷標(biāo)準(zhǔn)設(shè)定為每次迭代中模型經(jīng)過15 次交叉驗證得到的平均準(zhǔn)確率,同時設(shè)置輸出迭代過程中相應(yīng)的對數(shù)損失值進行輔助判別。本次需要優(yōu)化的參數(shù)有7 類:包括learning_rate、n_estimators、max_depth、min_child_weight、gamma、subsample 和colsample_bytree,其中l(wèi)earning_rate 為學(xué)習(xí)率,控制每次迭代更新權(quán)重時的步長;n_estimators 代表樹(弱分類器)的數(shù)量;max_depth用于指定樹的最大深度;min_child_weight 用于指定葉子節(jié)點最小權(quán)重和;gamma 值表示節(jié)點分裂所需的最小損失函數(shù)下降值;subsample 用于控制每棵樹隨機采樣的比例;colsample_bytree 用于控制每棵樹隨機采樣的列數(shù)占比。經(jīng)過100 次的迭代尋優(yōu)運算,PSO 算法的準(zhǔn)確率迭代至最大值0.924,相應(yīng)輸出的對數(shù)損失值也達到最小值0.427 6,并且在迭代18 次時收斂,最優(yōu)參數(shù)迭代尋優(yōu)過程如圖7 所示,最終尋優(yōu)得到的最佳參數(shù)取值如下:

基于最優(yōu)參數(shù)組合建立PSO-XGBoost 分類預(yù)測模型,在訓(xùn)練集學(xué)習(xí)后對測試集進行分類判識,分類結(jié)果如圖8a 所示。通過圖8a 得出,PSO-XGBoost 算法分類性能良好,12 組測試集判別正確11 組,僅在對第九份樣本分類時將泥灰?guī)r裂隙水誤判為了地表水,模型的分類準(zhǔn)確率達到了91.67%。表明PSO-XGBoost 模型對于水源光譜曲線有很好的分類性能。

圖8 3 種不同算法測試集判識結(jié)果Fig.8 Three different algorithm test sets to identify the results

3 不同模型判識結(jié)果對比

為進一步驗證PSO-XGBoost 算法模型在突水水源識別研究中的優(yōu)越性,在測試集上分別選擇PSO 優(yōu)化后的支持向量機(PSO-SVM)和隨機森林(PSO-RF)兩種不同分類方法與PSO-XGBoost 進行對比,各模型的迭代尋優(yōu)過程如圖9 所示。相較于PSO-XGBoost 模型的尋優(yōu)迭代過程,PSO-RF 模型在第28 次迭代時收斂,最大準(zhǔn)確率91.8%,最小對數(shù)損失值0.488 4;PSO-SVM 模型在第18 次迭代收斂,最大準(zhǔn)確率89.3%,最小對數(shù)損失值0.650 5。綜合判識準(zhǔn)確率和對數(shù)損失值得出,PSO-XGBoost 的迭代尋優(yōu)結(jié)果最好。其中PSO-SVM 模型中核函數(shù)選擇為多項式核Poly,優(yōu)化后的參數(shù)取值為C=9.18,degree=6.67;PSO-RF 模型優(yōu)化參數(shù)取值為n_estimators=129,max_depth=3.86,min_samples_splits=6,min_samples_leaf=6,max_features=0.8。最終3 組對比算法得到的測試集分類結(jié)果如圖8 所示,其中PSO-SVM模型判錯2 組,準(zhǔn)確率83.33%,PSO-RF 模型判錯一組,準(zhǔn)確率和PSO-XGBoost 模型相同,達到91.67%。

圖9 3 種不同算法迭代尋優(yōu)結(jié)果Fig.9 Iterative optimization search results of three different algorithms

為消除訓(xùn)練集、測試集劃分時存在的潛在特殊性和偶然性,同時更客觀地評估模型的泛化能力,采用100 次重復(fù)交叉驗證的方法按照8:2 比例的重新劃分訓(xùn)練集、測試集, 并選擇平均準(zhǔn)確率和平均對數(shù)損失值作為評價指標(biāo)。首先將未優(yōu)化的XGBoost 模型與PSO-XGBoost 模型進行對比,未優(yōu)化的XGBoost 模型參數(shù)設(shè)為默認參數(shù):n_estimators=300,max_depth=5,learning_rate=0.1,subsample=1,min_child_weight=1,colsampe-bytree=1,對比結(jié)果如圖10 所示??梢钥闯觯?jīng)過參數(shù)尋優(yōu)后的PSO-XGBoost 模型平均準(zhǔn)確率93.18%,高于未優(yōu)化XGBoost 模型平均準(zhǔn)確率87.76%,PSO-XGBoost 模型的平均對數(shù)損失值為0.462 5,低于XGBoost 模型的0.545 3。此外,PSOXGBoost 模型在判識平均準(zhǔn)確率和平均對數(shù)損失值上的變化幅度更小,穩(wěn)定性更好,表明PSO-XGBoost 判識模型穩(wěn)定性良好,PSO 優(yōu)化效果顯著。

圖10 優(yōu)化前后準(zhǔn)確率對比結(jié)果Fig.10 Comparison results of accuracy before and after optimization

進一步對PSO-XGBoost、PSO-SVM、PSO-RF 3種預(yù)測分類模型的準(zhǔn)確性和對數(shù)損失值進行比較,對比結(jié)果見表4,對3 種不同模型進行100 次重復(fù)交叉驗證結(jié)果如圖11 所示。PSO-SVM 模型平均準(zhǔn)確率87.56%,平均對數(shù)損失值為0.546 0,且穩(wěn)定性最差;PSO-RF 模型雖然在測試集預(yù)測分類中得到了與PSO-XGBoost 模型相同的準(zhǔn)確率,但在重復(fù)多次交叉驗證評價的平均準(zhǔn)確率為90.63%,平均對數(shù)損失值為0.562 3,綜合判識效果低于PSO-XGBoost 的93.18%和0.453 4,表明PSO-RF 模型的穩(wěn)定性不如PSO-XGBoost 模型。通過對比得出,PSO-XGBoost模型平均準(zhǔn)確率達到三者中的最大值93.18%,平均損失值也最小,證明該模型不但具有較強的分類預(yù)測和泛化能力,而且還具有良好的穩(wěn)定性。因此,通過對比不同分類算法得出,基于PSO-XGBoost 的礦井突水水源模型是高效可行的。

表4 不同分類模型的性能對比Table 4 Performance comparison of different classification models

圖11 三種算法測試分類準(zhǔn)確率比較Fig.11 Comparison of classification accuracy of s algorithms

4 結(jié) 論

1)基于水樣光譜數(shù)據(jù),結(jié)合XGBoost 原理與PSO 理論,構(gòu)建適用基于光譜數(shù)據(jù)的礦井突水水源分類預(yù)測的PSO-XGBoost 模型,為礦井突水水源判識提供了新思路。

2)選用PSO 對XGBoost 算法參數(shù)尋優(yōu),選取最優(yōu)參數(shù)組合,模型優(yōu)化前后的分類準(zhǔn)確率分別為87.76%和93.18%,對數(shù)損失值分別為0.545 3 和0.462 5,PSO-XGBoost 模型相較于優(yōu)化前的XGBoost 具有更高的預(yù)測精度和更好的穩(wěn)定性結(jié)果,表明PSO 能顯著提升XGBoost 模型的分類性能。

3)測試結(jié)果表明,將PSO-XGBoost 模型與PSORF 和PSO-SVM 分類學(xué)習(xí)模型進行對比,測試集在PSO-SVM、PSO-RF、PSO-XGBoost 三類模型的平均判識準(zhǔn)確率分別為83.33%、91.67%和91.67%,在多次交叉驗證測試評價中,3 類模型的平均判識準(zhǔn)確率分別為87.56%、90.63%、93.18%,平均對數(shù)損失值分別為0.546 0、0.562 3、0.453 4。對比結(jié)果表明PSOXGBoost 模型在分類預(yù)測精度和泛化能力方面明顯優(yōu)于其他2 種模型,因此,基于PSO-XGBoost 模型判識礦井突水水源的方法是高效可行的。

猜你喜歡
突水含水層水源
全球多個含水層里的水正快速流失
保護水源
品牌研究(2022年18期)2022-06-29 05:33:24
礦井突水水源的判別方法
礦井滯后突水機理探討
南水源頭清如許
李雅莊礦滯后突水主控因素分析
美國西部奧加拉拉含水層水位下降原因初探
尋找水源
大相嶺隧道高壓突水機理與預(yù)測分析
全球地下含水層下降驚人:要被抽干了
嘉鱼县| 谢通门县| 灵璧县| 胶州市| 环江| 昔阳县| 峨山| 宾阳县| 开鲁县| 剑川县| 五原县| 兰溪市| 十堰市| 贵阳市| 和田县| 博客| 和平区| 博野县| 视频| 巴青县| 高陵县| 山丹县| 凌源市| 宽甸| 广南县| 龙川县| 乳山市| 朝阳县| 哈巴河县| 玉溪市| 顺昌县| 石柱| 延吉市| 宜宾县| 邯郸县| 洞口县| 若羌县| 乐都县| 威远县| 杂多县| 会宁县|