王偵倪,高煒欣,湯 楠
(1.西安石油大學(xué) 陜西省油氣井測(cè)控技術(shù)重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710065;2.西安石油大學(xué) 光電油氣測(cè)井與檢測(cè)教育部重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710065)
焊縫檢測(cè)的方法有很多,其中,基于X射線圖像的缺陷檢測(cè)是目前應(yīng)用最為廣泛的無(wú)損檢測(cè)方法[1]。多數(shù)算法都是先提取焊縫圖像,根據(jù)圖像處理的方法判別缺陷圖像類型。在已有的研究中,文獻(xiàn)[2]使用一種基于水平集[3]的主動(dòng)輪廓模型 Chan-Vese模型[4]對(duì)焊縫缺陷進(jìn)行分割,這種方法對(duì)對(duì)比度明顯的缺陷圖像有較好的判斷效果,但不能準(zhǔn)確判斷不明顯的缺陷。文獻(xiàn)[5]提出先確定焊縫圖像位置,然后利用形態(tài)學(xué)對(duì)焊縫圖像進(jìn)行缺陷檢測(cè)的方法,提高了判別的準(zhǔn)確性。文獻(xiàn)[6]指出利用部分缺陷的方法,在觀察到存在缺陷的位置采取分水嶺變換和子束變換分割出焊縫缺陷。文獻(xiàn)[7]在檢查較厚的器件時(shí)發(fā)現(xiàn)器件不能及時(shí)同步且存在噪聲較大等干擾因素,利用消除法和波形分析法檢測(cè)出焊縫缺陷。文獻(xiàn)[8]在對(duì)缺陷類型識(shí)別之前,對(duì)采集到的圖像首先處理模糊邊緣,采用了傳統(tǒng)的圖像分割方法(如邊緣檢測(cè)法和閾值分割法)。文獻(xiàn)[9]指出文獻(xiàn)[8]提取真實(shí)邊沿比較困難,基于文獻(xiàn)[8]的問(wèn)題,文獻(xiàn)[9]提出基于支持向量機(jī)的焊縫缺陷檢測(cè)方法,這種方法是先對(duì)樣本進(jìn)行訓(xùn)練,針對(duì)所得模型分割缺陷圖像。
從現(xiàn)有的研究可以看出,大多數(shù)缺陷識(shí)別都要首先將缺陷進(jìn)行分割,根據(jù)分割后缺陷幾何或紋理特征判斷缺陷的類別。但焊縫圖像具有較高的噪聲,缺陷對(duì)比度較差,清晰度較低,為實(shí)現(xiàn)缺陷的準(zhǔn)確分割帶來(lái)困難進(jìn)而影響到缺陷特征的準(zhǔn)確求取。針對(duì)以上問(wèn)題,許多學(xué)者提出了很多解決方法。Zapata[10]等人提出一種基于自適應(yīng)網(wǎng)絡(luò)的模糊推理系統(tǒng)(ANFIS)。利用缺陷形狀與主方向特征等12個(gè)幾何特征并使用ANFIS進(jìn)行缺陷分類。Zhao[11]等人對(duì)缺陷提取了隨機(jī)分布三角形特征,并使用稀疏表示分類器(SRC)進(jìn)行缺陷分類,相比SVM,有更好的識(shí)別率。這些方法在一定程度上可以從缺陷圖像中檢測(cè)出缺陷,但這些方法幾乎都是對(duì)焊縫缺陷圖像進(jìn)行分割,獲得閾值判斷缺陷類型。因?yàn)楝F(xiàn)場(chǎng)提取的 X射線焊縫圖像本身辨別度不高、灰度較為分散,焊縫缺陷邊沿不明確,而且由于噪聲的干擾,這些都增大了閾值準(zhǔn)確分割的難度。為了避免缺陷圖像的分割,簡(jiǎn)化識(shí)別過(guò)程,提高判別的精確度,本文基于稀疏描述的原理[12],提出一種缺陷識(shí)別的方法,通過(guò)模式識(shí)別,將現(xiàn)場(chǎng)提取的原始圖像分為有、無(wú)缺陷圖像并作為樣本,對(duì)待檢測(cè)圖像進(jìn)行線性組合,通過(guò)系數(shù)向量分析直接判斷缺陷和噪聲,避免了特征值計(jì)算,達(dá)到良好的識(shí)別效果。
現(xiàn)場(chǎng)提取的實(shí)際焊縫圖像及焊縫整體灰度直方圖如圖1所示。通常情況下,原始焊縫圖像主要存在圖像較小和噪聲影響兩方面的問(wèn)題。造成這類問(wèn)題通常有2個(gè)原因:第一,檢測(cè)的焊縫圖像是制件的焊縫經(jīng)過(guò) X射線透視后,在膠卷上感受光產(chǎn)生陰影,轉(zhuǎn)化為數(shù)字圖像文件后,存在灰度較為聚集、對(duì)比度不高且缺陷特征被淹沒(méi)等問(wèn)題。第二,處理圖像的每一個(gè)過(guò)程及處理結(jié)果都要受到噪聲的影響。由圖像的灰度直方圖可以看出圖像是否清晰,由圖1可知,完整的焊縫圖像灰度直方圖偏向于右邊一側(cè),圖像較為明亮,且直方圖較為集中,說(shuō)明圖像本身對(duì)比度不高,存在的缺陷將難以被肉眼識(shí)別?;谝陨蠁?wèn)題,本文引用疑似局部圖像的概念,如圖2所示為疑似缺陷外切矩形。圖3為分割出的SDR及灰度直方圖,該直方圖相比于圖1灰度勻稱分布,圖像清晰,易于判斷。本文采用模式識(shí)別的方法,通過(guò)研究模板圖像,根據(jù)“疑似局部圖像”判別,增大了判斷的準(zhǔn)確率,避免了缺陷圖像的準(zhǔn)確分割和特征值的計(jì)算。
圖1 X射線焊縫圖像及灰度直方圖Fig.1 X-ray weld image and grayscale histogram
圖2 疑似局部圖像定義Fig.2 Suspected local image definition
圖3 缺陷圖像及灰度直方圖Fig.3 Defect image and grayscale histogram
基于小波分析理論,Mallat 和 Zhang 在1993年首次解釋了信號(hào)在過(guò)完備基上分解的構(gòu)想[13]。在現(xiàn)場(chǎng)提取未經(jīng)處理的圖像數(shù)據(jù)較大,而將圖像進(jìn)行稀疏表示能夠壓縮圖像,加快計(jì)算過(guò)程,所以在圖像處理領(lǐng)域得到了廣泛應(yīng)用。
圖像信號(hào)主要包括兩種稀疏模型(合成稀疏模型和分析稀疏模型),本文中圖像信號(hào)模型為合成稀疏模型,這種模型是指對(duì)于給定的一組信號(hào)都可以在過(guò)完備字典的基元張成的空間下表示,其系數(shù)只有少數(shù)的非零元素,大部分系數(shù)值都相對(duì)較小,接近為零,這樣可以認(rèn)為信號(hào)在該字典下能夠稀疏表示。未經(jīng)處理的自然信號(hào)一般情況下在時(shí)域內(nèi)都是非稀疏的,數(shù)據(jù)量大,增加了圖像處理的難度,但是這些信號(hào)可以通過(guò)某些變換域成為稀疏信號(hào),通過(guò)稀疏表示原始圖像的信息,降低了計(jì)算的難度。由調(diào)和理論可知,用向量f表示一維離散時(shí)間信號(hào),它的長(zhǎng)度為N,用一組標(biāo)準(zhǔn)正交基的線性組合可以表示f:
(1)
圖像識(shí)別是先將訓(xùn)練樣本進(jìn)行k類標(biāo)記,將采集到的原始圖像與訓(xùn)練樣本比對(duì),然后判斷待檢圖像是否符合樣本的所屬類型。設(shè)待檢測(cè)圖像和樣本圖像的分辨率為h×w,將每幅圖像的像素點(diǎn)按照列優(yōu)先的原則變換成為一個(gè)列向量f∈Rm,m=h×w,那么n個(gè)訓(xùn)練圖像組成字典矩陣(也稱基矩陣)
A=[f1,f2,…fn] ∈Rm×n。
在壓縮傳感理論中,矩陣A被稱為字典矩陣。假定字典矩陣A對(duì)應(yīng)的合成矩陣為ψ,則超完備稀疏表示就是從所有表示中找出分解系數(shù)最為稀疏的一個(gè),即:
(2)
在稀疏表示的框架下,當(dāng)有足夠多的樣本圖像時(shí),焊縫圖可由樣本圖像線性組合。設(shè)y為待檢測(cè)圖像,則將y表示為
y=a1f1+a2f2+…+anfn。
(3)
其中,ai∈R為實(shí)系數(shù)。
本文從數(shù)據(jù)庫(kù)中采集了部分管道焊縫的SDR圖像,將圖像分類為圓形缺陷樣本、線形缺陷樣本和噪聲樣本,如圖4所示。從圖4可以看出,X射線檢測(cè)出的焊縫圖像無(wú)論缺陷或是噪聲都具有一定的相似性。本文將樣本圖像進(jìn)行分類排列,分為“正?!焙汀叭毕荨眱深?。設(shè)“正?!眻D像有k個(gè),“缺陷”圖像有n-k個(gè),則將A向量按照下式重新排列。
A={f1,f2,…fk,fk+1,…fn}。
(4)
該分解過(guò)程借助字典A,對(duì)于一組給定的圖像向量化信號(hào)y,考慮其為字典A中少數(shù)基元的線性組合,其線性方程為:
y=A·x。
(5)
圖4 缺陷及噪聲樣本Fig.4 Defect and noise samples
為了獲取較好的重建結(jié)果,本文提出了通過(guò)學(xué)習(xí)獲得字典矩陣實(shí)現(xiàn)優(yōu)化。在基于過(guò)完備稀疏表示的圖像處理中,刪除相關(guān)性較大的SDR圖像,由某種特定字典稀疏表示特定種類的SDR圖像。利用字典矩陣向量的相關(guān)性,即通過(guò)求解
(6)
構(gòu)建焊縫缺陷字典矩陣學(xué)習(xí)模型。式中,ψi為字典矩陣ψ第i列元素。式(6)的求解式目標(biāo)是通過(guò)求解各列的相關(guān)性,以相關(guān)性最小為原則構(gòu)造字典矩陣模型。
圖5 SDR相關(guān)性統(tǒng)計(jì)曲線Fig.5 SDR correlation statistic curve
由圖5拐點(diǎn)位置可知,總樣本數(shù)量在40~100之間即可滿足要求。本文提出利用貪心算法確定最佳的樣本數(shù)量及對(duì)應(yīng)的字典矩陣。即通過(guò)求解式(6)完成樣本選擇。
貪心求解策略描述如下:
(1)將每個(gè)圓形SDR、線形SDR、噪聲SDR依次掃描,將圖像的像素點(diǎn)按照列優(yōu)先的原則逐個(gè)變換成一個(gè)列向量,最后生成3個(gè)樣本矩陣;
(3)首先選取相關(guān)性最小的兩列為局部最優(yōu)解,然后由小到大依次選取,重復(fù)此過(guò)程,刪除重復(fù)選取列,直到滿足最優(yōu)樣本數(shù)量組成全局最優(yōu)解,算法結(jié)束。
若將大部分的信號(hào)進(jìn)行變換,則信號(hào)可以稀疏表示,所以為了得到信號(hào)y在A上的稀疏系數(shù)向量,求解該問(wèn)題可以化為零范數(shù)最小化問(wèn)題。即有
(7)
零范數(shù)問(wèn)題可以看成是線性規(guī)劃問(wèn)題,近期的研究理論表明只要信號(hào)是稀疏的,可以采用凸-凹優(yōu)化技術(shù)實(shí)現(xiàn)對(duì)優(yōu)化問(wèn)題的求解,即可以通過(guò)求解凸優(yōu)化問(wèn)題準(zhǔn)確地表示信號(hào)。零范數(shù)最小化問(wèn)題是非凸問(wèn)題,很難求解,因此本文引入如下g(x)函數(shù):
(8)
其中Δ為歸一化系數(shù)。式(8)的曲線如圖6所示。
由于凸優(yōu)化的良好性能,所以判斷函數(shù)是否為凸函數(shù)成為解決優(yōu)化問(wèn)題的關(guān)鍵。通過(guò)計(jì)算可知,g(x)為下凸函數(shù)。
判定算法的流程圖如圖7所示。
圖6 g(x)函數(shù)值Fig.6 g(x) function
圖7 g(x)判定算法的過(guò)程流程Fig.7 Process of g(x) decision algorithm
g(x)為光滑連續(xù)函數(shù),可以求導(dǎo)。因此,可以通過(guò)引入g(x),將式(7)轉(zhuǎn)化為
(9)
其中,K為懲罰項(xiàng)系數(shù),求解式(9)可以方便地獲得系數(shù)向量。
采用最速下降法求解式(9),步驟如下:
Step1: 選取初始點(diǎn)x0∈Rn,允許誤差0<ε<1,令迭代次數(shù)p=200。
Step3:令αp=0.000 1,計(jì)算xp+1=xp+αpdp,轉(zhuǎn)Step2。
實(shí)驗(yàn)從數(shù)據(jù)庫(kù)一共選取缺陷SDR和噪聲SDR各60張,再另選100張真實(shí)缺陷和100張?jiān)肼昐DR作為待檢測(cè)圖像,如圖8所示。首先將樣本圖像轉(zhuǎn)化為灰度圖,由于圖像大小不一樣,實(shí)驗(yàn)通過(guò)選擇不同的歸一化尺寸將圖像大小統(tǒng)一化,然后采用列首尾相接方式把每副圖像重排為列向量,再將所有列向量組合為樣本矩陣A,按上述方法待檢測(cè)圖像組成列向量。本文與傳統(tǒng)算法不同,直接研究樣本圖像判斷缺陷。
在進(jìn)行實(shí)驗(yàn)前,首先建立混淆矩陣,格式見(jiàn)表1。
圖8 100組缺陷圖像和100組噪聲圖像Fig.8 Images of 100 groups of defects and noise
檢測(cè)為有缺陷檢測(cè)為無(wú)缺陷存在缺陷圖片(真正,true positive,TP)(假負(fù),false negative,FN)未存在缺陷圖片(假正,false positive,FP)(真負(fù),true negative,TN)
由混淆矩陣得出敏感度和特異度公式如下:
(10)
(11)
由于噪聲圖像和缺陷圖像的大小不同,不能直接運(yùn)用到求解過(guò)程。而且圖像的大小影響缺陷特征的清晰度、對(duì)比度,當(dāng)尺寸選擇較小時(shí),圖像特征不明顯,尺寸選擇較大會(huì)導(dǎo)致缺陷邊緣模糊,選擇合適的尺寸對(duì)提高焊縫缺陷識(shí)別的準(zhǔn)確率具有重要意義。因而在對(duì)焊縫缺陷圖像進(jìn)行檢測(cè)與識(shí)別之前,對(duì)圖像大小歸一化是必不可少的步驟。圖9為經(jīng)過(guò)不同的歸一化的圖像對(duì)比。實(shí)驗(yàn)首先研究了取不同歸一化圖像尺寸對(duì)識(shí)別結(jié)果的影響,然后在分析尺寸影響的基礎(chǔ)上,選擇最優(yōu)尺寸建立樣本矩陣與測(cè)試矩陣完成識(shí)別過(guò)程。其次選取不同的懲罰項(xiàng)系數(shù)K,在分析其對(duì)識(shí)別結(jié)果的影響的基礎(chǔ)上,確定最優(yōu)系數(shù)。綜上,可以通過(guò)減少樣本數(shù)量,簡(jiǎn)化計(jì)算過(guò)程,在確定最優(yōu)尺寸及最優(yōu)系數(shù)后,分析不同的樣本數(shù)量對(duì)分類準(zhǔn)確性的影響。
圖9 樣本歸一化圖像Fig.9 Normalized images of sample
(1) 尺度歸一化影響
實(shí)驗(yàn)選取了5組尺寸數(shù)據(jù)對(duì)圖像歸一化,所得的混淆矩陣如表2所示。由表選取20*20是最佳歸一化尺寸。
表2 歸一化計(jì)算結(jié)果Tab.2 Normalized calculation result
(2)懲罰項(xiàng)系數(shù)K的影響
實(shí)驗(yàn)確定歸一化大小為20*20,隨機(jī)選取5組懲罰系數(shù),判斷懲罰系數(shù)的大小是否會(huì)對(duì)缺陷的識(shí)別產(chǎn)生影響。識(shí)別準(zhǔn)確率見(jiàn)表3。
表3 K值計(jì)算結(jié)果Tab.3 Calculation results of K
由表3可見(jiàn),懲罰項(xiàng)系數(shù)對(duì)焊縫缺陷識(shí)別的準(zhǔn)確率沒(méi)有影響。
(3)樣本數(shù)量的影響
根據(jù)上述實(shí)驗(yàn)結(jié)果,本文將SDR歸一化為20*20的模板,確定懲罰項(xiàng)系數(shù)K=5。在原有的樣本的基礎(chǔ)上,通過(guò)貪心算法把樣本數(shù)量分別減少為40,60,80,100,識(shí)別效果見(jiàn)表4。
表4 樣本數(shù)計(jì)算結(jié)果Tab.4 Sample number calculation result
由表4可知,當(dāng)選擇樣本總數(shù)為80,即包括20張圓形缺陷,20張線形缺陷,40張?jiān)肼昐DR時(shí),識(shí)別準(zhǔn)確率達(dá)到最高。所以減少樣本數(shù)量不僅能夠簡(jiǎn)化算法,還能提高判斷的準(zhǔn)確率。故本文最終選用80張SDR構(gòu)成字典矩陣。
本文提出了基于稀疏描述的焊縫缺陷識(shí)別的方法,首先通過(guò)壓縮感知傳感技術(shù)對(duì)圖像進(jìn)行處理,采用罰函數(shù)法求解零范數(shù),求解結(jié)果為一組系數(shù),分析系數(shù)組合判斷缺陷。相比于其他識(shí)別方法而言,避免了特征值的計(jì)算,通過(guò)貪心算法選取最優(yōu)樣本數(shù)量既簡(jiǎn)化了計(jì)算過(guò)程,又提高了識(shí)別的準(zhǔn)確性。
西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版)2018年5期