,
(沈陽工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院, 沈陽 110870)
長輸管道是石油、天然氣運(yùn)輸?shù)闹饕绞?。對油氣管道輸送的基本要求是安全、高效。隨著管道在役時間的增加,腐蝕、磨損、意外損傷等因素導(dǎo)致的管道泄漏風(fēng)險(xiǎn)也隨之增加。管道泄漏一旦發(fā)生,會帶來嚴(yán)重的后果。為了確保管道的安全運(yùn)行,定期對管道進(jìn)行檢測和維護(hù)非常重要。漏磁檢測作為無損檢測[1-2]的一種方法,被廣泛應(yīng)用于鋼鐵管道的檢測中,可為管道的安全評價、壽命預(yù)測、檢修維護(hù)等提供可靠依據(jù)。
在漏磁檢測中,根據(jù)測量到的漏磁信號精確重建缺陷的輪廓是非常重要的。由于缺陷漏磁場分布的不均勻性和求解的復(fù)雜性,目前缺陷的重構(gòu)算法中,二維重構(gòu)算法占了絕大多數(shù),這是因?yàn)榇盆F沿著軸向或者徑向磁化石油管道的管壁時,傳感器陣列(線或面)隨著管道機(jī)器人前進(jìn),最容易采集到長度和深度或者寬度和深度的信息。例如,當(dāng)管道機(jī)器人沿著軸向磁化管壁時,磁場沿著管道的方向傳遞,在缺陷處產(chǎn)生漏磁場,這樣傳感器陣列中的某一路所采集到的信號實(shí)質(zhì)上只是包含了該處的長度和深度信息,并不包含寬度信息,所以如何準(zhǔn)確地求解寬度已成為重構(gòu)算法的一個難點(diǎn),確定出缺陷的長度、寬度和深度信息,實(shí)際上就是知道了缺陷的長方體形輪廓,也就是實(shí)現(xiàn)了缺陷的三維重構(gòu)。
目前為了重建缺陷輪廓,已經(jīng)提出了多種方法。紀(jì)鳳珠等[3]提出了應(yīng)用支持向量機(jī)對二維缺陷重構(gòu)的新方法, 建立了由缺陷的漏磁信號到缺陷二維輪廓的映射關(guān)系。苑希超等[4]提出基于遞推貝葉斯估計(jì)的漏磁缺陷重構(gòu)算法,建立了缺陷輪廓與漏磁信號的狀態(tài)空間模型,將反演問題描述為基于狀態(tài)和觀測方程的典型的離散時間跟蹤問題。韓文花等[5]將局部最優(yōu)解和全局最優(yōu)解引入到人工蜂群算法(Artificial Bee Colony Algorithm,ABC)中,提出了一種基于改進(jìn)人工蜂群算法的缺陷重構(gòu)模型。朱紅運(yùn)等[6]提出了一種基于徑向基神經(jīng)網(wǎng)絡(luò)的缺陷輪廓重構(gòu)方法,該方法可以降低網(wǎng)絡(luò)結(jié)構(gòu)對重構(gòu)結(jié)果的影響,采用主成分分析法對網(wǎng)絡(luò)隱層應(yīng)選擇的最少節(jié)點(diǎn)數(shù)進(jìn)行計(jì)算,進(jìn)而確定了較合理的網(wǎng)絡(luò)結(jié)構(gòu)。
然而上述文獻(xiàn)僅考慮了二維缺陷重構(gòu)方法,沒有進(jìn)一步介紹三維重構(gòu)方法。實(shí)際上,無論對于缺陷可視化展示還是缺陷的尺寸評估,缺陷的三維重構(gòu)都十分重要。筆者基于長輸管道漏磁內(nèi)檢測數(shù)據(jù)提出了一種基于偏差估計(jì)的隨機(jī)森林缺陷三維輪廓重構(gòu)方法。該方法利用隨機(jī)森林建立偏差估計(jì)模型,以漏磁信號偏差作為輸入,重構(gòu)輪廓偏差作為輸出,根據(jù)估計(jì)偏差更新估計(jì)輪廓,并且在多種條件下驗(yàn)證了所提方法的有效性。
對缺陷參數(shù)精確量化的關(guān)鍵是盡可能全面準(zhǔn)確地獲取缺陷漏磁場的大小及其分布特征[7]。
管道漏磁內(nèi)檢測的主要依據(jù)是:通過霍爾傳感器檢測出缺陷處被磁化材料表面泄漏出來的漏磁通量,如圖1所示。
圖1 管道漏磁檢測原理示意
管壁中若存有缺陷,缺陷處磁導(dǎo)率會發(fā)生改變。若缺陷處的磁導(dǎo)率很小,磁阻很大,則磁通回路的磁通發(fā)生畸變,磁感應(yīng)線的傳播方向發(fā)生改變,其中一部分磁通會脫離管壁,通過空氣這一傳導(dǎo)介質(zhì)繞過缺陷再次進(jìn)入管壁,在管壁的缺陷處形成漏磁場。磁通通常分為3部分:一部分直接穿過缺陷;一部分在管壁內(nèi)部迂回,通過缺陷周圍的鐵磁材料繞過缺陷;還有一部分磁通則會脫離管壁表面,通過空氣繞過缺陷再次進(jìn)入管壁。
圖1中泄漏出的磁通量即為漏磁通。若管道出現(xiàn)缺陷,缺陷處的漏磁通量會增大,在管道的內(nèi)部和外部均有漏磁通量的產(chǎn)生。霍爾傳感器可以檢測到泄漏出來的磁通量,還會發(fā)出與之相對應(yīng)的檢測信號,即缺陷漏磁報(bào)警信號。缺陷漏磁信號提供了缺陷信息,通過分析檢測信號,可推斷出缺陷尺寸等各項(xiàng)參數(shù)信息。管道漏磁內(nèi)檢測器的基本結(jié)構(gòu)如圖2所示。
管道漏磁內(nèi)檢測器的基本結(jié)構(gòu)如圖2所示。當(dāng)漏磁檢測器在管道內(nèi)運(yùn)行時,必須要保證其能夠順利地在管道內(nèi)部穿過。由于復(fù)雜的地勢及外部環(huán)境,長輸油氣管道不是一條直管線,在管道內(nèi)的轉(zhuǎn)彎處會有彎頭連接兩個相鄰管段。為了保證檢測器可以順利通過彎頭,需要將漏磁檢測器分解成若干節(jié),每節(jié)之間采用軟連接,以便漏磁檢測器可以大角度地轉(zhuǎn)過彎頭處。在實(shí)際的管道檢測過程中,一般將漏磁檢測器分為測量節(jié)、計(jì)算機(jī)節(jié)和電池節(jié)3節(jié)。每節(jié)前后都裝有橡皮碗支撐在管道內(nèi)表面上,節(jié)間通過萬向節(jié)進(jìn)行連接[8]。
圖2 管道漏磁內(nèi)檢測器基本結(jié)構(gòu)示意
缺陷輪廓三維重構(gòu)算法的最終目標(biāo)是找到與實(shí)際給定信號最接近的估計(jì)輪廓。估計(jì)的輪廓(EP)和相應(yīng)的信號(ES)可由式(1)表示。
(1)
實(shí)際輪廓(RP)和相應(yīng)的信號(RS)可由式(2)表示。
(2)
式中:x×y為輪廓矩陣和信號矩陣的尺寸。
由于估計(jì)輪廓和實(shí)際輪廓的差異程度等價于相應(yīng)信號之間的差異,因此缺陷三維輪廓估計(jì)問題轉(zhuǎn)化為求取估計(jì)信號和真實(shí)信號偏差最小的問題,即
(3)
(4)
式中:E為真實(shí)信號與重構(gòu)信號的誤差;ES*為最終最優(yōu)估計(jì)信號;EP*為最終重構(gòu)三維輪廓矩陣;argmin為尋優(yōu)函數(shù)。
在對管道漏磁場進(jìn)行正演建模時,通常先假定管體上存在某一特定缺陷,然后經(jīng)過三維的有限元[9]仿真分析,得到缺陷漏磁場的分布規(guī)律。
麥克斯韋方程組被用來描述漏磁檢測系統(tǒng)的檢測行為。 由于所有涉及的過程是靜態(tài)的或僅由非常低的頻率組成,故可得出結(jié)論,靜磁模型可以描述得足夠準(zhǔn)確,由下式表示
(5)
式中:H為磁場強(qiáng)度矢量;B為磁通密度;J為電流密度。
通常,磁通密度B和H之間的關(guān)系是
B=μH
(6)
式中:μ為空間磁導(dǎo)率。
盡管建立了相應(yīng)的數(shù)學(xué)模型,但是很難獲得分析解。 有限元方法(FEM)是一種用于分析電磁問題的有效數(shù)值方法,可為上述數(shù)學(xué)模型提供滿意的數(shù)值解。該方法可將復(fù)雜的模型分解成無數(shù)個可以計(jì)算的單元,對每個單元進(jìn)行物理計(jì)算,再將所有的單元整合,對于不規(guī)則幾何形狀、復(fù)雜邊界條件、多種介質(zhì)、非均勻介質(zhì)等問題有良好的解決能力。使用有限元仿真的方法模擬和計(jì)算石油管道缺陷處的漏磁場是完全可行的,實(shí)際上它求解的就是工程意義上的數(shù)值解[10]。
首先,有限元法將求解微分方程的問題轉(zhuǎn)化為相應(yīng)的變分問題;再將計(jì)算的區(qū)域劃分為有限數(shù)量的元素;然后,變分問題被離散化為找到多變量函數(shù)極值的問題;最后,采用離散形狀函數(shù)將問題重寫為一組代數(shù)方程
K·A=f
(7)
式中:K為有限元剛度矩陣;f為包含源項(xiàng)的列向量;該代數(shù)方程A的解表示感興趣區(qū)域內(nèi)的離散點(diǎn)處的磁矢量勢。
最后,可以根據(jù)以下表達(dá)式獲得磁通密度[11]。
B=×A
(8)
在文章中,有限元模型被用作正演模型,以產(chǎn)生具有特定缺陷輪廓的漏磁檢測信號。漏磁檢測信號的軸向分量被選擇作為重建的目標(biāo)。
缺陷漏磁場的反演[12]求解是一種典型的非線性映射問題,其本質(zhì)就是根據(jù)所測漏磁場的大小及其分布特征來評價缺陷的幾何參數(shù)。
隨機(jī)森林是由LEO B與ADELE C于19世紀(jì)90年代提出的一種機(jī)器學(xué)習(xí)方法,是一個以決策樹為基礎(chǔ)分類器的集成分類器。隨機(jī)森林比單棵決策樹更穩(wěn)健,泛化性能更好。在BREIMAN提出的隨機(jī)森林中使用的是CART決策樹[13-14]。
隨機(jī)森林是一個非常直觀的分類器,由任意規(guī)模的決策樹構(gòu)成,其構(gòu)造過程并不復(fù)雜。首先,通過給定的訓(xùn)練集多次隨機(jī)可重復(fù)采樣得到多個bootstrap數(shù)據(jù)集,每個bootstrap數(shù)據(jù)集是每棵決策樹的全部訓(xùn)練數(shù)據(jù)。接著將每個bootstrap 數(shù)據(jù)集構(gòu)造成一棵決策樹,通過一系列迭代測試分割一個決策樹節(jié)點(diǎn)的效果,利用信息增量指標(biāo)來量化分割一個決策樹節(jié)點(diǎn)帶來的提升效果,選擇最大化信息增量的節(jié)點(diǎn)分割方式構(gòu)造決策樹。然后,根據(jù)訓(xùn)練集中分類標(biāo)簽的直方圖,估計(jì)此節(jié)點(diǎn)上的類分布。而迭代訓(xùn)練將會在遇到最大深度設(shè)定值或不能經(jīng)過繼續(xù)分割獲得更大的信息增益時停止[15]。
fn(v)>tn
(9)
式中:f為分割函數(shù);t為閾值(分割函數(shù)的主要參數(shù)值);n為分支節(jié)點(diǎn)的序號;v為樣本值。
作為隨機(jī)森林中最重要的組成部分之一,式(9)的分割函數(shù)在很大程度上決定一個隨機(jī)森林的特性和表現(xiàn)。從式(9)中可以看出,經(jīng)典隨機(jī)森林的一個特點(diǎn)是某個特定樣本的分類決策僅僅由自身的特征值決定,而與其周圍的樣本無關(guān)。
隨機(jī)森林訓(xùn)練中的隨機(jī)性體現(xiàn)在兩個方面:一是每次迭代時,對原始數(shù)據(jù)進(jìn)行二次抽樣來獲得不同的訓(xùn)練數(shù)據(jù);二是對于每個樹節(jié)點(diǎn),考慮不同的隨機(jī)特征子集來進(jìn)行分裂。
在隨機(jī)森林中,每棵決策樹都將算法作用到數(shù)據(jù)集上,隨機(jī)森林對應(yīng)的實(shí)例空間劃分本質(zhì)上是集成模型中每棵決策樹對實(shí)例空間劃分結(jié)果的交集。在分類預(yù)測階段,通過式(10)平均每棵樹的葉節(jié)點(diǎn)上的分類分布可以得到整個隨機(jī)森林的對此輸入樣本的分類結(jié)果
(10)
式中:T為森林中樹的數(shù)目;c為某一特定的類;P為概率函數(shù)[16]。
隨機(jī)森林有許多良好的特性,可歸納為:具有較好的準(zhǔn)確率;能夠處理具有高維特征的輸入樣本,而且不需要降維;計(jì)算成本較低。
由于使用了CART決策樹作為基礎(chǔ)分類器,經(jīng)典隨機(jī)森林除了能作為分類器,也可以簡單地以模型預(yù)測值取代分類值實(shí)現(xiàn)回歸分析[17-18]。
在通過有限元模擬或試驗(yàn)獲得一對(RP,RS)之后,必須將其轉(zhuǎn)換成一對訓(xùn)練數(shù)據(jù)(e,η)。e為估計(jì)信號和實(shí)際信號之間的偏差,η為相應(yīng)的誤差向量, 其變換過程如下。
首先,隨機(jī)生成估計(jì)分布x,然后通過有限元計(jì)算相應(yīng)的漏磁檢測信號y,如式(11)所示。
y=F(x)
(11)
式中:F為用于表示有限元過程的函數(shù)。
下一步,計(jì)算估計(jì)信號和實(shí)際信號之間的差值
e=RS-ES
(12)
然后根據(jù)式(13)計(jì)算誤差向量的每個分量
(13)
式中:ηi為誤差向量的第i項(xiàng)。
這樣就得到了隨機(jī)森林算法的誤差樣本。
基于隨機(jī)森林的輪廓重構(gòu)迭代算法的流程如圖3所示,進(jìn)行缺陷三維輪廓重構(gòu)時,首先要隨機(jī)初始化缺陷的原始輪廓,然后利用有限元模型計(jì)算出相應(yīng)的漏磁檢測信號。通過計(jì)算估計(jì)信號和真實(shí)信號的偏差進(jìn)而確定是否進(jìn)行下一次迭代。如果截止條件不滿足,估計(jì)輪廓將會被更新。
(14)
式中:k為當(dāng)前迭代次數(shù);η為隨機(jī)森林算法的輸出。
圖3 基于隨機(jī)森林的輪廓重構(gòu)迭代算法的流程圖
基于偏差估計(jì)的隨機(jī)森林輪廓重構(gòu)算法的具體步驟如下所述。
步驟1:隨機(jī)初始化缺陷原始估計(jì)輪廓;
步驟2:利用有限元網(wǎng)絡(luò)計(jì)算相應(yīng)的漏磁信號;
步驟3:根據(jù)公式(3)估計(jì)信號誤差;
步驟4:確定截止條件是否滿足,如果條件不滿足,執(zhí)行下一個步驟,否則輸出輪廓;
步驟5:計(jì)算估計(jì)信號和真實(shí)信號的偏差,并通過隨機(jī)森林網(wǎng)絡(luò)輸出輪廓估計(jì)偏差;
步驟6:根據(jù)估計(jì)偏差更新估計(jì)輪廓。
為了說明所提出的基于偏差估計(jì)的隨機(jī)森林缺陷三維輪廓重構(gòu)算法的進(jìn)度和效果,訓(xùn)練和測試數(shù)據(jù)集用ANSYS有限元仿真軟件獲得。
通過有限元模擬產(chǎn)生相應(yīng)的一組2 000個缺陷漏磁信號。根據(jù)檢測精度與原理要求,仿真缺陷長度從10 mm變化到60 mm,寬度從10 mm變化到60 mm,深度從0.5 mm變化到9 mm,信噪比從-20 dB 變化到60 dB。其中訓(xùn)練集和測試集的比例為4∶1。在Windows 7 64位操作系統(tǒng)@Inter(R) Core(TM) i5-4460處理器、8GB內(nèi)存的PC,MATLABR2015a的開發(fā)環(huán)境下進(jìn)行試驗(yàn)仿真,對算法的相關(guān)性能進(jìn)行試驗(yàn)驗(yàn)證和分析。
圖4 缺陷真實(shí)輪廓及其重構(gòu)仿真結(jié)果
圖4所示為基于文章方法的缺陷輪廓重構(gòu)仿真效果。其中,仿真缺陷的尺寸(長×寬×深,下同)大小為32 mm×24 mm×5 mm,尺寸隨機(jī)選取,且輪廓不含噪聲。如圖4(b)所示,輪廓尺寸估計(jì)結(jié)果為30 mm×23 mm×5.2 mm。結(jié)果表明:基于偏差估計(jì)的隨機(jī)森林缺陷輪廓重構(gòu)方法在不含噪聲的仿真信號中重構(gòu)效果良好。
然而,實(shí)際漏磁信號中經(jīng)常由于現(xiàn)場條件以及腐蝕的存在而包含大量噪聲。因此,對包含噪聲的漏磁信號進(jìn)行分析是十分必要的。圖5所示為矩形缺陷的真實(shí)輪廓與2個不同信噪比水平的輪廓重構(gòu)效果,可見,由于噪聲的存在,輪廓估計(jì)結(jié)果和實(shí)際輪廓之間的誤差仍在可接受的范圍內(nèi)。為了進(jìn)一步估計(jì)實(shí)際輪廓和估計(jì)輪廓的偏差,重構(gòu)偏差E定義如下
(15)
測試幾種不同信噪比缺陷的重構(gòu)偏差,結(jié)果如圖6所示。為了增加結(jié)果的可視化程度,相同條件下對測試集進(jìn)行了4次重構(gòu)試驗(yàn),結(jié)果表明:重建精度和信噪比之間有很強(qiáng)的關(guān)聯(lián),信噪比越高,精度越高,也就是說重構(gòu)偏差越小。
圖5 不同信噪比水平的矩形缺陷輪廓
圖6 不同信噪比水平的重構(gòu)偏差
圖7 試驗(yàn)平臺和漏磁檢測裝置
為了進(jìn)一步評估所提出的基于偏差估計(jì)的隨機(jī)森林缺陷三維輪廓重構(gòu)算法的進(jìn)度和效果,對真實(shí)缺陷的輪廓重構(gòu)效果進(jìn)行驗(yàn)證。真實(shí)缺陷數(shù)據(jù)來源于試驗(yàn)管道,試驗(yàn)平臺和漏磁檢測裝置如圖7所示,其由繞組發(fā)動機(jī)、發(fā)射器、接收器和表面含人造缺陷的可替換管道組成。
試驗(yàn)共采集了500個缺陷信號,同仿真試驗(yàn)一樣,訓(xùn)練集與測試集樣本比例為4∶1。現(xiàn)場檢測的真實(shí)缺陷如圖8(a)所示,其真實(shí)尺寸為20 mm×10 mm×3 mm 。真實(shí)輪廓以及估計(jì)輪廓如圖8(b),(c)所示,其中估計(jì)輪廓尺寸為18 mm×11 mm×3.1 mm。重構(gòu)結(jié)果表明:估計(jì)輪廓能夠很好地接近真實(shí)輪廓,估計(jì)輪廓誤差在允許范圍之內(nèi)。
圖8 管道真實(shí)缺陷及其重構(gòu)效果
圖9 測試集尺寸偏差統(tǒng)計(jì)結(jié)果
為了使試驗(yàn)結(jié)果具有統(tǒng)計(jì)性,增加結(jié)果的可信服性,筆者對試驗(yàn)中100個測試集缺陷信號進(jìn)行重構(gòu),并分別統(tǒng)計(jì)長度、寬度以及深度的重構(gòu)尺寸偏差Dr,以及輪廓重構(gòu)誤差。值得注意的是:重構(gòu)尺寸偏差為真實(shí)尺寸與估計(jì)尺寸偏差的絕對值。測試集尺寸偏差統(tǒng)計(jì)結(jié)果如圖9所示,結(jié)果顯示:深度偏差全部在1 mm以內(nèi),長度偏差在5 mm以內(nèi),寬度偏差基本保持在10 mm以內(nèi)。輪廓誤差統(tǒng)計(jì)結(jié)果如圖10所示,100個測試缺陷的輪廓誤差均值為0.46,少量樣本的輪廓誤差超過1。
圖10 測試集輪廓誤差統(tǒng)計(jì)結(jié)果
為了進(jìn)一步驗(yàn)證方法的有效性,對試驗(yàn)場的測試數(shù)據(jù)集進(jìn)行了評估,并分別與經(jīng)典重構(gòu)算法作比較,試驗(yàn)以所有測試樣本的平均水平作為結(jié)果。表1顯示了遺傳算法(GA),神經(jīng)網(wǎng)絡(luò)(BP)算法與文章方法的對比結(jié)果。對比結(jié)果顯示:三種重構(gòu)算法都有很高的精度,誤差在檢測精度允許范圍內(nèi);文章所提方法的輪廓重構(gòu)精度高于GA和BP算法的精度,且計(jì)算時間最短。
表1 三種不同重構(gòu)算法結(jié)果的對比
針對長輸油管道的缺陷輪廓反演問題,提出了一種基于偏差估計(jì)的隨機(jī)森林缺陷三維輪廓重構(gòu)方法。該方法通過有限元方法建立正演模型,利用缺陷的信號偏差估計(jì)輪廓偏差,并通過偏差更新缺陷輪廓。試驗(yàn)結(jié)果表明:
(1) 隨著缺陷信號信噪比逐漸增加,輪廓重構(gòu)誤差逐漸下降;
(2) 試驗(yàn)中,真實(shí)管道數(shù)據(jù)深度偏差小于1 mm,長度偏差小于5 mm,寬度偏差基本小于10 mm;
(3) 相比于經(jīng)典重構(gòu)算法BP和GA,提出的方法表現(xiàn)出良好的缺陷三維輪廓重構(gòu)精度以及重構(gòu)速度。