汪金花, 張 博, 吳 兵, 郭云飛
(1.華北理工大學(xué) 礦業(yè)工程學(xué)院,河北 唐山 063210; 2.中煤航測遙感集團(tuán)有限公司,陜西 西安 710199)
地磁定位具有全天時(shí)、全天候、無源、無福射等優(yōu)點(diǎn),近幾年地磁高精度的定位技術(shù)在室內(nèi)、地下工程等領(lǐng)域的基礎(chǔ)研究發(fā)展迅速,成為多學(xué)科交叉研究的熱點(diǎn)之一。地下工程地磁精確定位是依據(jù)通行路線的實(shí)測地磁序列與地磁基準(zhǔn)數(shù)據(jù)的匹配計(jì)算來實(shí)現(xiàn)的,其定位精度受到區(qū)域地磁基準(zhǔn)圖、載體實(shí)時(shí)測量地磁序列、地磁匹配算法及區(qū)域適配性等因素影響。地磁適配性評價(jià)是對區(qū)域地磁空間分布特征強(qiáng)弱的綜合分析,是地磁定位導(dǎo)航的基礎(chǔ)和前提。關(guān)于地磁定位適配性研究,國內(nèi)外已有一些基礎(chǔ)研究成果。文獻(xiàn)[1]結(jié)合地磁紋理特征提出基于地磁共生矩陣的算法用于水下地磁適配區(qū)的選擇,得出水下匹配區(qū)域適配性與地磁共生矩陣反演的地磁角二階矩、熵、對比度及相關(guān)性這些指標(biāo)吻合度較高;文獻(xiàn)[2]提出一種基于基因表達(dá)式編程的算法用于水下地磁進(jìn)化合成特征的構(gòu)建,得到了穩(wěn)健性更好的綜合適配特征;文獻(xiàn)[3]提出基于地磁特征參數(shù)信息熵的適配區(qū)選擇方法用于海域地磁適配區(qū)的選擇,得出基于地磁特征參數(shù)信息熵的適配區(qū)選擇方法更有效,更適合作為適配區(qū)的選擇標(biāo)準(zhǔn);文獻(xiàn)[4]針對空域地磁場的特點(diǎn)利用主成分分析(principal component analysis,PCA)結(jié)合后向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)的方法對基本地磁特征參數(shù)進(jìn)行分析,得到了更好的分類精度;文獻(xiàn)[5]提出基于BP神經(jīng)網(wǎng)絡(luò)的地形適配/誤配區(qū)劃分方法用于分析水域地磁場統(tǒng)計(jì)參量與匹配精度間的關(guān)系,得出該方法的分類精度高出傳統(tǒng)分類方法分類結(jié)果正確率10%以上;文獻(xiàn)[6]將改進(jìn)的信息熵作為特征指標(biāo)對航拍圖片進(jìn)行適配性分析與選擇,在景象匹配制導(dǎo)中得到了較高的自匹配概率和較小的匹配誤差;文獻(xiàn)[7]采用矢量分析的方法構(gòu)建地磁綜合評價(jià)值輔助慣導(dǎo)系統(tǒng)進(jìn)行水下定位導(dǎo)航,結(jié)果表明綜合評價(jià)值可作為選擇合適地磁輔助導(dǎo)航匹配區(qū)適宜性的定量指標(biāo);文獻(xiàn)[8]采用免疫粒子群優(yōu)化算法在水下地磁基準(zhǔn)圖中智能選擇最優(yōu)匹配區(qū)域,結(jié)果表明,匹配概率與匹配區(qū)域選擇策略具有良好的一致性。這些適配性評價(jià)的研究大部分是構(gòu)建新型的特征指標(biāo)、引入BP算法或人工智能分析來改進(jìn)適配性評價(jià)方法,評價(jià)精度提升明顯,主要是應(yīng)用于水下地磁定位區(qū)域適配性評價(jià),關(guān)于地下工程小范圍適配評價(jià)方法的研究很少。
前期大量試驗(yàn)結(jié)果表明,雖然地下工程空間小,巷道之間主要是線性連接方式,但是環(huán)境附加磁場的空間分布變化復(fù)雜,有些區(qū)域磁場變化大,空間分布特征明顯,有些區(qū)域磁場變化平緩,空間分布差異不明顯。由于不同地段地磁空間分布得不規(guī)律,需要一種有效快捷的適配性評價(jià)模型來綜合評價(jià)。本文針對于地下工程地磁空間分布的特點(diǎn),利用回歸分析方法確定特征參數(shù)的貢獻(xiàn)因子,改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的輸入權(quán)值,建立了基于貢獻(xiàn)因子BP神經(jīng)網(wǎng)絡(luò)的適配性評價(jià)模型,可為地磁輔助定位適配性評價(jià)提供參考。
地下工程實(shí)際測量的地磁場數(shù)值中包含地磁穩(wěn)定場與異常場及環(huán)境磁場的綜合疊加影響。實(shí)測地磁數(shù)據(jù)通常是地球基本磁場和周圍環(huán)境附加磁場疊加作用的結(jié)果,即除了實(shí)際地理位置基礎(chǔ)地磁場外,還疊加了周圍鐵軌、通風(fēng)管道、排污管道、通信設(shè)施等產(chǎn)生的附加磁場,井下地磁數(shù)據(jù)具有分布特點(diǎn)不一致、空間分布復(fù)雜的特點(diǎn)。例如,有些區(qū)域地磁緩變,幾十米巷道的磁異常只圍繞著幾百至幾千nT變動(dòng);有些區(qū)域擾動(dòng)較大,兩點(diǎn)相距僅僅幾米,地磁值陡增到104nT。因此,需要量化計(jì)算巷道的地磁空間分布特征具體數(shù)值,進(jìn)行適配性評定。
從已有研究文獻(xiàn)[9-12]來看,表征地磁特征的參數(shù)較多,如地磁場均值、標(biāo)準(zhǔn)差、粗糙度、粗糙方差比、地磁熵、相關(guān)系數(shù)、分形維數(shù)、累加梯度、相關(guān)距離、地磁費(fèi)歇信息量、地磁編碼失真量、坡度標(biāo)準(zhǔn)差等,多達(dá)十幾種。根據(jù)地下工程的地磁空間分布特點(diǎn),本文選取地磁標(biāo)準(zhǔn)差δ(相應(yīng)的地磁空間特征因子用F1表示,下同)、峰態(tài)系數(shù)Ce(F2)、偏態(tài)系數(shù)Cf(F3)、地磁粗糙度r(F4)、粗糙方差比o(F5)、地磁信息熵G(F6)及相關(guān)系數(shù)t(F7)7個(gè)地磁空間分布特征參數(shù),其表達(dá)式和意義見表1所列。
表1 區(qū)域磁場基本適配特征因子
這7個(gè)參數(shù)分別從地磁分布的宏觀特征、微觀特征以及相似特征3個(gè)層次反映地磁空間分布特征,但是對于井下小區(qū)域,每個(gè)參數(shù)貢獻(xiàn)率不同。由表1公式可知,F2反映數(shù)值的集中程度,數(shù)值越大,數(shù)據(jù)在均值附近集中程度越高,特征性不強(qiáng),不利于地磁匹配定位;F6反映區(qū)域信息量大小,數(shù)值越小,表明地磁變化越獨(dú)特,有利于地磁匹配定位。分別選取F2、F62類試驗(yàn)數(shù)據(jù)進(jìn)行特征統(tǒng)計(jì),每類數(shù)據(jù)各有8個(gè)測區(qū),F2、F6與匹配概率的相關(guān)性如圖1所示。
圖1 F2、F6與匹配概率的相關(guān)性
從圖1可以看出,隨著F2、F6增大,其地磁匹配概率逐漸降低,說明地磁空間匹配概率與F2、F6的統(tǒng)計(jì)特征關(guān)聯(lián)性較強(qiáng)。每個(gè)測區(qū)地磁空間特征各異,統(tǒng)計(jì)的特征參數(shù)也大小不一,每個(gè)特征因子對匹配概率的影響也是不同的,因此需要在適配性評價(jià)之前,確定7個(gè)特征因子在適配性評價(jià)過程中的貢獻(xiàn)因子大小,從而加強(qiáng)模型自動(dòng)收斂的速度以及避免陷入局部最優(yōu)。
為了研究地磁空間分布特征因子與匹配概率之間關(guān)系,可以先進(jìn)行其相關(guān)性回歸分析[13],確定其關(guān)聯(lián)程度。7個(gè)特征因子與匹配概率的回歸方程模型為:
P(F)=B0+B1F1+B2F2+…+B7F7
(1)
其中,P(F)為區(qū)域地磁匹配概率;FI(I=1,2,3,…,7)為地磁特征因子;BI(I=1,2,3,…,7)為回歸系數(shù);B0為常數(shù)。
一般情況下,回歸系數(shù)大小可以間接反映該因子在適配性評價(jià)中的影響程度。當(dāng)F2、F6較大時(shí),說明該區(qū)域特征相似區(qū)段較多,地磁匹配時(shí)易出現(xiàn)模糊匹配,表明其適配性差;當(dāng)F1、F3、F4、F7的數(shù)值較大時(shí),說明空間分布獨(dú)特性較強(qiáng),適配性也較好。
地磁適配性的評價(jià)是對井下所有巷道進(jìn)行地磁空間特征的豐富度評價(jià),可以分為定性和定量2種評價(jià)方式。定性評價(jià)是評價(jià)該區(qū)域地磁定位的適配程度,分為不適配、弱適配、適配及強(qiáng)適配4個(gè)等級,采用基于多屬性決策判別方法,如線性距離判別、貝葉斯判別、決策樹判別、BP神經(jīng)網(wǎng)絡(luò)等[14-16];定量評價(jià)是對待匹配區(qū)進(jìn)行匹配概率的量化評價(jià),從匹配實(shí)用性和準(zhǔn)確率上進(jìn)行評價(jià),采用的算法有互相關(guān)算法、均方差算法、歸一化積相關(guān)算法及平均絕對差(mean absolute devition,MAD)[17-19]算法等。
結(jié)合7個(gè)特征因子,以BP神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型為基礎(chǔ),設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)的地磁適配性評價(jià)模型為7-h-1的網(wǎng)絡(luò)結(jié)構(gòu),如圖2所示。
圖2 地磁適配性評價(jià)的BP神經(jīng)網(wǎng)絡(luò)模型
圖2中,輸入層為表1中7個(gè)地磁空間分布特征因子,輸入層初始權(quán)為F1~F7的貢獻(xiàn)因子wI;隱藏層主要包含更新權(quán)值wIJ、偏置b′以及激活函數(shù)f;輸出層為適配性評價(jià)等級y。從圖2可以看出,BP神經(jīng)網(wǎng)絡(luò)精度和實(shí)際匹配效率受到多種因素影響,主要因素有神經(jīng)元的數(shù)目、激活函數(shù)類型以及貢獻(xiàn)因子wI。其中,神經(jīng)元的數(shù)目、激活函數(shù)類型可以通過反復(fù)訓(xùn)練對比得出最佳結(jié)果,而貢獻(xiàn)因子wI需要根據(jù)輸入層結(jié)構(gòu)和相關(guān)性來設(shè)定。
(1) 歸一化處理模型。由于采集的地磁空間分布特征參數(shù)量綱不統(tǒng)一,需將采集的樣本數(shù)據(jù)進(jìn)行歸一化處理。將7個(gè)輸入向量歸一化處理為0~1之間的數(shù)值;設(shè)x=(x1,x2,…,xm),建立一個(gè)映射f′:
(2)
其中,k=1,2,…,m;xk為需要?dú)w一化處理的樣本原始數(shù)值;xmin為樣本數(shù)據(jù)中最小值;xmax為樣本數(shù)據(jù)中最大值。
(2) 貢獻(xiàn)因子wI。對于(1)式,一般情況下,模型識別精度主要受到與匹配概率相關(guān)性較強(qiáng)的特征因子的影響較大,如F3、F4等。由于地磁適配性評價(jià)的樣本較少,且在隱藏層中各個(gè)特征因子分別給予了等價(jià)權(quán),因而可能引起網(wǎng)絡(luò)無法收斂或陷入局部最優(yōu)。為了提高模型的收斂性和達(dá)到全局最優(yōu),需要對樣本特征因子的初始權(quán)進(jìn)行預(yù)處理,即設(shè)定貢獻(xiàn)因子wI。預(yù)處理過程采用最小二乘線性回歸的方法進(jìn)行參數(shù)估計(jì),得出每個(gè)樣本特征因子的貢獻(xiàn)權(quán)w。預(yù)處理數(shù)學(xué)模型為:
(3)
(4) 激活函數(shù)f。3種常見激活函數(shù)的對比見表2所列。通過反復(fù)試驗(yàn)確定最佳的激活函數(shù)。
表2 3種激活函數(shù)的對比
(5) 輸出層定義。通過前向傳播輸出模型的計(jì)算結(jié)果,反向傳播中通過設(shè)置對應(yīng)的期望值y進(jìn)行迭代訓(xùn)練。本文根據(jù)MAD算法,計(jì)算各個(gè)樣本區(qū)域的磁場匹配概率,并根據(jù)不同的匹配概率劃分適配性的期望值,不同期望值對應(yīng)的磁場區(qū)域匹配概率見表3所列,期望值數(shù)值為適配標(biāo)簽。
表3 不同期望值對應(yīng)的匹配概率
(1) 試驗(yàn)數(shù)據(jù)。選取45個(gè)3 m左右的人防工程小區(qū)域,每個(gè)區(qū)域內(nèi)布設(shè)3條控制線,控制線間隔為1 m,每條線上采樣點(diǎn)間隔為1 m。使用FVM400磁通門計(jì)進(jìn)行磁場數(shù)據(jù)采集,該磁通門計(jì)的參數(shù)見表4所列。
表4 FVM400磁通門計(jì)參數(shù)
每個(gè)點(diǎn)位采集5次數(shù)據(jù),取其平均值作為最終的磁場數(shù)據(jù),并根據(jù)MAD算法計(jì)算各個(gè)區(qū)域的匹配概率,剔除可能存在誤差的4個(gè)區(qū)域,將余下的41個(gè)區(qū)域磁場特征因子與對應(yīng)的匹配適配標(biāo)簽制作成訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,分別見表5、表6所列。
表5 磁場特征訓(xùn)練數(shù)據(jù)集
續(xù)表
表6 磁場特征測試數(shù)據(jù)集
(2) 數(shù)據(jù)處理。在獲得歸一化地磁特征的7個(gè)參數(shù)后,將7個(gè)特征因子與對應(yīng)的匹配概率進(jìn)行基于最小二乘回歸分析,根據(jù)回歸結(jié)果確定7個(gè)地磁特征因子的貢獻(xiàn)因子,將貢獻(xiàn)因子設(shè)置為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)進(jìn)行網(wǎng)絡(luò)訓(xùn)練。數(shù)據(jù)處理的流程如圖3所示。
圖3 數(shù)據(jù)處理流程
BP神經(jīng)網(wǎng)絡(luò)試驗(yàn)采用目前最先進(jìn)的TensorFlow平臺進(jìn)行編程和優(yōu)化。TensorFlow是谷歌基于DistBelief進(jìn)行研發(fā)的第2代人工智能學(xué)習(xí)系統(tǒng),為開源機(jī)器學(xué)習(xí)框架,具有快速、靈活并適合大規(guī)模應(yīng)用等特點(diǎn),能夠解決各種機(jī)器學(xué)習(xí)任務(wù)。傳統(tǒng)的判別方法采用基于Matlab的編程實(shí)現(xiàn),最終將兩者進(jìn)行對比。
根據(jù)(2)式歸一化地磁特征因子得到:
(4)
將F1~F7的取值代入(1)式計(jì)算可得:
P(F)=1.260-0.427F1-0.273F2-0.559F3+0.819F4-0.187F5-0.109F6-0.128F7
(5)
則有:
由(3)式可得:
(6)
由(6)式可得7個(gè)特征因子的wI,見表7所列。
表7 7個(gè)地磁特征因子對應(yīng)的wI
從表7可以看出,在描述井下地磁特征的7個(gè)特征因子中,F3、F4對匹配概率的影響較大,其wI分別為22.3%、32.7%;F5、F6、F7對匹配概率的影響較小,wI均不到10.0%;F1、F2的wI分別為17.1%、10.9%。
設(shè)置激活函數(shù)為relu函數(shù),將隱藏層個(gè)數(shù)h分別設(shè)定為10、12、14、16、18進(jìn)行對比試驗(yàn),試驗(yàn)結(jié)果見表8所列。
表8 不同h下網(wǎng)絡(luò)的準(zhǔn)確率 %
由表8可知,隨著h增加,模型在測試數(shù)據(jù)集上的準(zhǔn)確率逐漸提高,在h=14、h=16時(shí)網(wǎng)絡(luò)的準(zhǔn)確率一樣,而在h=16時(shí)出現(xiàn)拐點(diǎn),因此初步確定h為14或16;在訓(xùn)練數(shù)據(jù)集上,隨著h增加,模型的準(zhǔn)確率逐漸提高,h=16時(shí)網(wǎng)絡(luò)的準(zhǔn)確率高于h=14時(shí)的網(wǎng)絡(luò)。綜合分析以上結(jié)果,設(shè)置h=16。
設(shè)定h=16,對比sigmoid、tanh、relu 3種激活函數(shù)下網(wǎng)絡(luò)訓(xùn)練的準(zhǔn)確率,結(jié)果見表9所列。從表9可以看出,3種激活函數(shù)對訓(xùn)練集和測試集數(shù)據(jù)的識別準(zhǔn)確率是不同的。采用sigmoid函數(shù)的網(wǎng)絡(luò)幾乎不具備識別能力;采用tanh函數(shù)的網(wǎng)絡(luò)識別能力一般;而采用relu函數(shù)的網(wǎng)絡(luò)性能最好,其在訓(xùn)練數(shù)據(jù)集上的準(zhǔn)確率高達(dá)95.0%,在測試數(shù)據(jù)集上的準(zhǔn)確率達(dá)到了72.7%,試驗(yàn)結(jié)果充分證明了relu函數(shù)在該模型中的優(yōu)勢。
表9 3種激活函數(shù)下網(wǎng)絡(luò)的準(zhǔn)確率 %
對試驗(yàn)數(shù)據(jù)分別采用傳統(tǒng)貝葉斯判別、線性距離判別、二次函數(shù)判別以及普通BP神經(jīng)網(wǎng)絡(luò)和基于貢獻(xiàn)因子BP神經(jīng)網(wǎng)絡(luò)進(jìn)行適配性評價(jià),將2種BP神經(jīng)網(wǎng)絡(luò)均隨機(jī)訓(xùn)練5次,計(jì)算其平均準(zhǔn)確率以減小網(wǎng)絡(luò)陷入局部最優(yōu)對識別準(zhǔn)確率的影響,訓(xùn)練樣本和測試樣本的評價(jià)結(jié)果對比見表10所列。
表10 5種方法的適配性評價(jià)結(jié)果
由表10可知,在對地磁適配性評價(jià)中,二次函數(shù)判別法的識別準(zhǔn)確率最低,訓(xùn)練數(shù)據(jù)準(zhǔn)確率不到80%,測試數(shù)據(jù)準(zhǔn)確率僅為45%左右;基于傳統(tǒng)貝葉斯判別、線性距離判別的準(zhǔn)確率較為接近,訓(xùn)練數(shù)據(jù)準(zhǔn)確率均為80%左右,測試數(shù)據(jù)準(zhǔn)確率僅為50%左右;基于貢獻(xiàn)因子BP神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率最高,訓(xùn)練數(shù)據(jù)準(zhǔn)確率達(dá)到了95%,測試數(shù)據(jù)準(zhǔn)確率接近73%,優(yōu)勢明顯。相比于普通BP神經(jīng)網(wǎng)絡(luò),改進(jìn)后的網(wǎng)絡(luò)能一定程度上避免陷入局部最優(yōu)從而達(dá)到較高的識別精度,網(wǎng)絡(luò)的收斂速度也有明顯提升,但是基于貢獻(xiàn)因子BP神經(jīng)網(wǎng)絡(luò)分析時(shí),訓(xùn)練前期工作較多,工作量較大。
(1) 圍繞地下工程地磁定位的區(qū)域適配性評價(jià)問題,綜合分析了區(qū)域磁場空間特征因子與匹配概率相關(guān)性。根據(jù)地下工程的地磁空間分布特點(diǎn),確立了地磁標(biāo)準(zhǔn)差、峰態(tài)系數(shù)、偏態(tài)系數(shù)、地磁粗糙度、粗糙方差比、地磁信息熵及相關(guān)系數(shù)7個(gè)地磁空間分布特征參數(shù)。
(2) 在BP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,設(shè)計(jì)了基于貢獻(xiàn)因子BP神經(jīng)網(wǎng)絡(luò)適配性評價(jià)流程,建立7-h-1結(jié)構(gòu)的地磁適配性BP神經(jīng)網(wǎng)絡(luò),提出了貢獻(xiàn)因子的計(jì)算方法?;谪暙I(xiàn)因子BP神經(jīng)網(wǎng)絡(luò)的輸入層為7個(gè)地磁空間分布特征因子,其初始權(quán)為回歸分析后的貢獻(xiàn)因子;輸出層為按照匹配概率劃分的適配等級,即強(qiáng)適配、適配、弱適配、不適配。
(3) 將貢獻(xiàn)因子賦值為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)進(jìn)行訓(xùn)練,使網(wǎng)絡(luò)能夠快速收斂并具有較高的識別精度。但是在實(shí)際應(yīng)用中,樣本數(shù)量和貢獻(xiàn)因子計(jì)算需要進(jìn)一步優(yōu)化,模型的泛化能力也需要進(jìn)一步提高。