高佳南,馬樂(lè)天,白金陽(yáng),田皓天,黃曾寧,梁春燕,康 杰
(西安科技大學(xué)安全科學(xué)與工程學(xué)院,陜西 西安 710054)
隨著淺部煤炭資源的大規(guī)模開(kāi)發(fā),未來(lái)淺部資源勢(shì)必開(kāi)采殆盡,煤礦將走向深部生產(chǎn),由深部高地溫引起的高溫?zé)岷?wèn)題將不可避免[1-3]。井下風(fēng)流是供工作人員呼吸、稀釋排出有害氣體、改善作業(yè)場(chǎng)所氣候條件的基礎(chǔ),因此,準(zhǔn)確預(yù)測(cè)井巷風(fēng)溫對(duì)于研究井下風(fēng)流熱力狀態(tài)參數(shù)變化、科學(xué)評(píng)價(jià)礦井熱害狀況、合理制定熱害防治方案、改善井下高溫氣候環(huán)境具有重要意義。
礦井進(jìn)風(fēng)井筒井底風(fēng)溫的準(zhǔn)確計(jì)算對(duì)全礦井巷道風(fēng)溫的精準(zhǔn)預(yù)測(cè)至關(guān)重要。對(duì)于有淋水的井筒,井筒風(fēng)流與淋水水滴混合流的熱濕交換為復(fù)雜的熱力動(dòng)態(tài)變化過(guò)程,井筒風(fēng)溫與其影響因素之間多為某種非線性關(guān)系,因此,淋水井筒風(fēng)溫解析計(jì)算較為復(fù)雜[4]。隨著我國(guó)煤礦通風(fēng)向信息化、智能化升級(jí),機(jī)器學(xué)習(xí)模型廣泛應(yīng)用于煤礦通風(fēng)安全領(lǐng)域,如通風(fēng)網(wǎng)絡(luò)故障智能診斷[5]、通風(fēng)阻力系數(shù)確定[6]、通風(fēng)系統(tǒng)可靠性評(píng)價(jià)[7]等。近些年來(lái)部分學(xué)者已通過(guò)機(jī)器學(xué)習(xí)算法開(kāi)展了井巷風(fēng)溫預(yù)測(cè)探究性研究。如紀(jì)俊紅等[8]采用網(wǎng)格搜索結(jié)合K 折交叉驗(yàn)證對(duì)XGBoost的參數(shù)尋優(yōu),建立礦井井底風(fēng)溫GSK-XGBoost 預(yù)測(cè)模型;張翔等[9]建立了井底風(fēng)溫PSO-BP 預(yù)測(cè)模型;呂品等[10]建立了井底風(fēng)溫BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型;馬恒等[11]建立了淋水的井筒溫度T-S 模糊神經(jīng)網(wǎng)絡(luò)計(jì)算模型。同時(shí),上述文獻(xiàn)研究結(jié)果也均表明,礦井井底風(fēng)溫機(jī)器學(xué)習(xí)預(yù)測(cè)模型具有適應(yīng)性強(qiáng)、預(yù)測(cè)精度較高等優(yōu)點(diǎn),基于此,本文在文獻(xiàn)[10]和文獻(xiàn)[11]的基礎(chǔ)上,利用皮爾遜相關(guān)系數(shù)分析各項(xiàng)特征參數(shù)與淋水井筒井底風(fēng)溫的相關(guān)性,剔除特征參數(shù)集中相關(guān)性弱或不相關(guān)的特征,提取主要特征參數(shù)作為構(gòu)建淋水井筒風(fēng)溫預(yù)測(cè)模型的輸入變量,利用遺傳算法(GA)優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,建立參數(shù)優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)模型(GA-BP 神經(jīng)網(wǎng)絡(luò))進(jìn)行淋水井筒風(fēng)溫預(yù)測(cè),提高模型預(yù)測(cè)精度和特征參數(shù)獲取效率。
皮爾遜相關(guān)系數(shù)為一種線性相關(guān)系數(shù),其絕對(duì)值越大,兩變量相關(guān)性越強(qiáng),即相關(guān)性系數(shù)越接近1或者-1,相關(guān)度越強(qiáng);越趨于0,則相關(guān)度越弱。皮爾遜相關(guān)系數(shù)法篩選特征變量步驟如下所述。
步驟一:數(shù)據(jù)初始無(wú)量綱化。不同的特征變量綱不同,在皮爾遜相關(guān)系數(shù)分析時(shí),應(yīng)首先對(duì)影響淋水井筒風(fēng)溫的特征變量進(jìn)行無(wú)量綱化,具體計(jì)算見(jiàn)式(1)。
式中:i為不同特征變量;k為不同特征變量參數(shù)值。
步驟二:分別計(jì)算變量離均差平方和、變量離均差積和。變量X的離均差平方和見(jiàn)式(2)。
變量Y的離均差平方和見(jiàn)式(3)。
變量X與變量Y的離均差積和見(jiàn)式(4)。
步驟三:計(jì)算兩個(gè)變量之間的皮爾遜相關(guān)系數(shù),計(jì)算公式見(jiàn)式(5)。
按照以上步驟計(jì)算變量之間的皮爾遜相關(guān)系數(shù),并對(duì)相關(guān)系數(shù)進(jìn)行排序。
BP 神經(jīng)網(wǎng)絡(luò)是一種經(jīng)典的有監(jiān)督學(xué)習(xí)方法,通過(guò)輸入信息的前向計(jì)算和輸出誤差信息的后向傳遞實(shí)現(xiàn)訓(xùn)練過(guò)程,具有強(qiáng)大的自學(xué)習(xí)、自適應(yīng)和解決任意非線性映射問(wèn)題的特點(diǎn)[12]。典型的三層BP 神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)如圖1 所示,輸入層為接收特征變量,隱含層負(fù)責(zé)計(jì)算,輸出層決策模型輸出結(jié)果。
圖1 典型BP 神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)示意圖Fig.1 Schematic diagram of the basic structure of a typical BP Neural Network
BP 神經(jīng)網(wǎng)絡(luò)類(lèi)比人類(lèi)大腦神經(jīng)元突觸結(jié)構(gòu)來(lái)處理信息,通過(guò)輸入層與隱含層、多層隱含層、隱含層與輸出層間互聯(lián)互通,由前向計(jì)算和誤差反向傳播信息,其中,前向計(jì)算是由輸入數(shù)據(jù)沿著神經(jīng)網(wǎng)絡(luò)逐層向前計(jì)算傳遞信息,當(dāng)輸出層誤差大于設(shè)定期望誤差時(shí)進(jìn)行誤差反向傳遞,并逐層調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值,重復(fù)上述過(guò)程至輸出誤差大于設(shè)定期望誤差。
遺傳算法是一種高效的啟發(fā)式搜索、并行隨機(jī)全局優(yōu)化搜索算法,廣泛應(yīng)用于優(yōu)化機(jī)器學(xué)習(xí)參數(shù)和求解最優(yōu)值方面[13]。BP 神經(jīng)網(wǎng)絡(luò)模型所涉及的權(quán)值和閾值等參數(shù)對(duì)模型訓(xùn)練結(jié)果有較大影響,通常,建立傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)模型是取參數(shù)為[-0.5,0.5]的隨機(jī)數(shù),閾值與權(quán)值的適應(yīng)度大小直接影響B(tài)P 神經(jīng)網(wǎng)絡(luò)模型的收斂速度,并且BP 神經(jīng)網(wǎng)絡(luò)容易陷入局部最小值[14]。因此,本次研究應(yīng)用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值,算法流程如圖2 所示,以提高BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果的準(zhǔn)確性。
圖2 遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)模型算法流程Fig.2 Genetic algorithm optimization of BP Neural Network model algorithm process
遺傳算法優(yōu)化步驟如下所述。步驟一:對(duì)BP 神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值實(shí)數(shù)串進(jìn)行編碼生成初始種群;步驟二:通過(guò)適應(yīng)度函數(shù)計(jì)算比較初始種群中每個(gè)個(gè)體的適應(yīng)度值;步驟三:選擇具有較高適應(yīng)度值的個(gè)體作為父代進(jìn)入下一階段的交叉運(yùn)算;步驟四:交換父代個(gè)體編碼鏈中的部分基因產(chǎn)生新的個(gè)體;步驟五:以一定概率改變被隨機(jī)選中的個(gè)體某些基因座上的值;步驟六:通過(guò)判定誤差限或最大迭代次數(shù)獲得權(quán)值和閾值最優(yōu)解。
對(duì)于淋水井筒風(fēng)溫預(yù)測(cè)回歸模型的預(yù)測(cè)結(jié)果,采用平均絕對(duì)誤差MAE、平均絕對(duì)百分比誤差MAPE等統(tǒng)計(jì)量對(duì)其預(yù)測(cè)效果進(jìn)行評(píng)價(jià)。其中,平均絕對(duì)誤差MAE計(jì)算見(jiàn)式(6)。
平均絕對(duì)百分比誤差MAPE計(jì)算見(jiàn)式(7)。
式中:f(xi)為預(yù)測(cè)值,℃;yi為觀測(cè)值,℃。
井筒圍巖與風(fēng)流間熱交換是引起井筒風(fēng)溫變化的重要因素,它與井筒圍巖熱物性、圍巖原始溫度、風(fēng)流溫濕度等有關(guān)。此外,風(fēng)流壓縮熱也是導(dǎo)致井筒風(fēng)溫增大的關(guān)鍵因素,其主要受井口大氣壓力和井筒深度的影響。由于恒溫帶以下深度地溫梯度的存在,井筒圍巖溫度隨深度逐漸增加,因此,地溫分布不易測(cè)量。另外,煤系地層為沉積巖,井筒圍巖是非均質(zhì)各向異性介質(zhì),熱物性差別較大,也不易測(cè)量。參考淋水井筒溫度預(yù)測(cè)研究文獻(xiàn),結(jié)合礦井現(xiàn)場(chǎng)情況,選取影響淋水井筒風(fēng)溫的井口風(fēng)流溫度、井口風(fēng)流相對(duì)濕度、井口大氣壓力及井筒深度等易測(cè)特征變量作為預(yù)測(cè)模型輸入?yún)?shù)預(yù)測(cè)井底風(fēng)溫,選用50組數(shù)據(jù)作為建模樣本,部分樣本數(shù)據(jù)見(jiàn)表1。綜合分析井口風(fēng)流參數(shù)及井筒深度與淋水井筒風(fēng)溫進(jìn)行皮爾遜相關(guān)性分析,選取其中相關(guān)性較大的指標(biāo)。皮爾遜系數(shù)的相關(guān)性絕對(duì)值直接體現(xiàn)了影響因素與結(jié)果之間的關(guān)聯(lián)程度,其絕對(duì)值越接近于1 表明指標(biāo)間相關(guān)性越強(qiáng);相關(guān)系數(shù)絕對(duì)值越接近0,相關(guān)性越弱。一般情況下,變量的相關(guān)強(qiáng)度按照以下取值范圍進(jìn)行判斷:相關(guān)系數(shù)絕對(duì)值在[0.8,1.0]之間為非常強(qiáng)相關(guān);在[0.6,0.8)之間為強(qiáng)相關(guān);在[0.4,0.6)之間為中等相關(guān);在[0.2,0.4)之間為弱相關(guān);在[0.0,0.2)之間為非常弱相關(guān)或不相關(guān)。
表1 部分樣本數(shù)據(jù)Table 1 Partial sample data
根據(jù)皮爾遜相關(guān)系數(shù)計(jì)算步驟分析了淋水井筒井底風(fēng)溫與井口氣候參數(shù)及井筒深度的相關(guān)性,結(jié)果見(jiàn)表2。由表2 可知,經(jīng)相關(guān)性分析后,井口風(fēng)流溫度對(duì)淋水井筒井底風(fēng)溫有顯著影響,井口風(fēng)流相對(duì)濕度及井筒深度與淋水井筒井底風(fēng)溫為弱相關(guān),井口大氣壓力與淋水井筒井底風(fēng)溫相關(guān)系數(shù)接近0,相關(guān)性非常弱。因此,選取井口風(fēng)流溫度、井口風(fēng)流相對(duì)濕度及井筒深度等三項(xiàng)指標(biāo)作為輸入變量。
表2 皮爾遜系數(shù)相關(guān)性結(jié)果Table 2 Pearson coefficient correlation results
依據(jù)皮爾遜相關(guān)系數(shù)分析結(jié)果,井口風(fēng)流溫度、井口風(fēng)流相對(duì)濕度及井筒深度構(gòu)成預(yù)測(cè)模型輸入特征變量,預(yù)測(cè)模型輸出變量為井底風(fēng)溫。隨機(jī)選取80%的樣本數(shù)據(jù)量作為模型訓(xùn)練集,用于構(gòu)建模型;20%作為模型測(cè)試集,檢驗(yàn)?zāi)P偷念A(yù)測(cè)效果。
構(gòu)建全部特征變量輸入和特征變量篩選輸入的BP 神經(jīng)網(wǎng)絡(luò)模型與GA-BP 神經(jīng)網(wǎng)絡(luò)模型,淋水井筒風(fēng)溫GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型中,交叉概率取0.8,變異概率取0.2,訓(xùn)練次數(shù)取1 000,學(xué)習(xí)速率取0.01,訓(xùn)練目標(biāo)取0.000 1,初始種群規(guī)模取10,最大進(jìn)化代數(shù)取30。預(yù)測(cè)結(jié)果見(jiàn)表3,不同模型預(yù)測(cè)值與實(shí)際值比較見(jiàn)表4,預(yù)測(cè)值與實(shí)際值對(duì)比曲線如圖3 所示。
表3 模型預(yù)測(cè)結(jié)果Table 3 Model prediction results
表4 不同模型預(yù)測(cè)結(jié)果比較Table 4 Comparison of prediction results of different models
圖3 不同模型預(yù)測(cè)值與實(shí)際值的對(duì)比曲線Fig.3 Comparison curves between predicted values and actual values of different models
由表3、表4 和圖3 可知,對(duì)于全部特征變量輸入,標(biāo)準(zhǔn)BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的井底風(fēng)溫絕對(duì)誤差最大為0.77 ℃,相對(duì)誤差最大為2.67%,平均絕對(duì)誤差為0.347 3 ℃,平均相對(duì)誤差為1.25%;GA 優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的井底風(fēng)溫絕對(duì)誤差最大為1.12 ℃,相對(duì)誤差最大為3.86%,平均絕對(duì)誤差為0.2703 ℃,平均相對(duì)誤差為0.97%。對(duì)于特征變量篩選輸入,標(biāo)準(zhǔn)BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的井底風(fēng)溫絕對(duì)誤差最大為1.88 ℃,相對(duì)誤差最大為6.50%,平均絕對(duì)誤差為0.650 1 ℃,平均相對(duì)誤差為2.33%;GA 優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的井底風(fēng)溫絕對(duì)誤差最大為1.74 ℃,相對(duì)誤差最大為6.01%,平均絕對(duì)誤差為0.615 1 ℃,平均相對(duì)誤差為2.21%。全部特征變量輸入和特征變量篩選輸入的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型均能夠獲得滿意的預(yù)測(cè)結(jié)果,GA 優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型多數(shù)數(shù)據(jù)的絕對(duì)誤差和相對(duì)誤差、平均絕對(duì)誤差、平均相對(duì)誤差均小于標(biāo)準(zhǔn)BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,表明在淋水井筒風(fēng)溫預(yù)測(cè)中GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有更好的預(yù)測(cè)效果,優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)參數(shù)能夠提高淋水井筒風(fēng)溫預(yù)測(cè)精度。
1)結(jié)合皮爾遜相關(guān)系數(shù)、GA 和BP 神經(jīng)網(wǎng)絡(luò),建立了基于特征變量篩選輸入的淋水井筒風(fēng)溫GABP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。
2)基于全部特征變量輸入與特征變量篩選輸入條件下,標(biāo)準(zhǔn)BP 神經(jīng)網(wǎng)絡(luò)淋水井筒風(fēng)溫預(yù)測(cè)模型和GA-BP 神經(jīng)網(wǎng)絡(luò)淋水井筒風(fēng)溫預(yù)測(cè)模型均具有較好的預(yù)測(cè)效果,淋水井筒風(fēng)溫GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型預(yù)測(cè)精度高于標(biāo)準(zhǔn)BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。
3)基于特征變量篩選輸入的標(biāo)準(zhǔn)BP 神經(jīng)網(wǎng)絡(luò)淋水井筒風(fēng)溫預(yù)測(cè)模型和GA-BP 神經(jīng)網(wǎng)絡(luò)淋水井筒風(fēng)溫預(yù)測(cè)模型既保持了較高的預(yù)測(cè)精度,又降低了建模特征變量維度,提高了模型預(yù)測(cè)效率。