國網(wǎng)天津城東供電公司 李博彤 畢海巖 賈 宓 劉 偉
對訓練素材進行預處理可有效提升圖像識別準確率。圖片需要進行預處理的原因:適應神經(jīng)網(wǎng)絡結構。因為網(wǎng)絡結構能夠接收的數(shù)據(jù)格式一般來說比較固定,因此在訓練模型前,一般要提前將訓練樣本預處理,使之轉換為可讀格式;訓練樣本提純。本文的訓練樣本中一般可能有垃圾數(shù)據(jù),預處理后這部分數(shù)據(jù)被干凈的清理,這樣他們的影響就會消失;數(shù)據(jù)增強。預處理的樣本增加了數(shù)據(jù)本身的多樣性。利用旋轉、鏡像等方法來表現(xiàn)圖像的空間多樣性?;谶@一原理,該模型具有更強的魯棒性;歸一化處理。預處理的形式很多,不同規(guī)格的數(shù)據(jù)經(jīng)過轉換后,成為規(guī)格相同的實證數(shù)據(jù),圖片的歸一化就是最為典型的案例;數(shù)據(jù)體積壓縮。處理后可以減小尺寸,如果原始數(shù)據(jù)的尺寸是FHD,經(jīng)過壓縮可后可以達到VGA,從而就會減少降低數(shù)據(jù)體積。
計算機圖像識別技術在應用過程中存在一些缺陷,在一定程度上阻礙了智能化技術的發(fā)展[1]。計算機圖像識別要求系統(tǒng)高效準確地進行圖像識別,智能化處理方法的應用可顯著提升計算機圖像識別的性能,提升其識別的準確性及效率[2]。由于地下管線外破事件圖片在拍攝提取過程中,容易受到光線強弱、有無陰影、拍攝角度的影響,因此需在識別前對圖像進行標準化的預處理,并使用平移、旋轉和縮放等幾何變換選取一個共同點作為參照點統(tǒng)一規(guī)范化圖像。在此過程中還可通過幾何仿射的幾種變換方式(例如移位,旋轉和縮放)對地下管線外破事件圖像進行幾何規(guī)范化處理,仿射變化的公式為:
在這里(u,v)具體表示所輸入圖像的實際像素,而(x,y)坐標表示的是輸出圖像中的像素的坐標。將上式展開可得x=a11u+a21v+a31,y=a12u+a22v+a32。平移變換得具體步驟是給所有點坐標都加上同樣的Δu 和Δv,具體的表達式可以轉換為:
旋轉的步驟如下:所有點的坐標是相對于原點,進行θ 角的逆時針旋轉,具體表達式為:
縮放變化是指在同比例縮小與放大,當r>1時圖像是完全可以被放大的,當0<r<1時,圖像就是會被縮小,其中具體的數(shù)據(jù)變換表達方式如下列公式為:
2.2.1 圖像平滑化
圖像需要保證平滑,目的在于能顯著提高圖像質(zhì)量。它可以在空間域和頻率域中實現(xiàn)。一般常用的方法包括相鄰區(qū)域平均值濾波、空間濾波和中值濾波。相鄰區(qū)域平均值濾波是局部空間處理方法,使用像素附近的每個像素的平均灰度值來實現(xiàn)圖像的平滑度而不是像素的原始灰度值。
無論是直接獲取的灰度圖像,還是由彩色圖像轉變得到的灰度圖像,這里面都會有噪聲的存在,噪聲對圖像質(zhì)量有很大的影響。進行中值濾波不僅可以去除孤點噪聲,而且還能夠完美保留邊緣特征。它不會導致圖像明顯模糊,更適合于實驗中電網(wǎng)設備的缺陷圖像的處理。
中值濾波的步驟如下:在模板中讓圖像進行漫游,并將模板的中心與圖中某個確定的像素點重合;讀取對應像素的灰度值;這些灰度值從小到大排列;在中間找出一個對應值;將中間值分配給到對應的模板中心像素。從上述步驟可看出,中心濾波的主要功能是讓與周圍像素和灰度值之間的差異過大的像素點改為與周圍像素接近的值,所以對孤立的噪聲像素具備極強的消除能力,而這種能力也經(jīng)常被用于人像美化中。由于它的原理不是簡單取均值,因此產(chǎn)生的模糊性較小。換句話說,中值濾波可以消除噪聲卻又可以保留圖像的細節(jié)。
2.2.2 高斯濾波
在高斯濾波器中,高斯函數(shù)用來檢查輸入陣列中每個像素的卷積,并將卷積設置為輸出像素值。g 函數(shù)可對輸出像素的相鄰區(qū)域賦予不同的權值:,這里h 被稱為過濾器的核心功能,即權重值。高斯函數(shù)有五個重要屬性,特別適用于早期圖像處理。這些特性使得高斯濾波器成為空間域和頻域中非常有效的低通濾波器,很多工程師將它用于早期的圖像處理中。
高斯濾波的主要特點如下:二維高斯函數(shù)具有旋轉對稱性,因此高斯濾波器在各個方向上的平滑度都是相同的,在后續(xù)的邊緣檢測中不會出現(xiàn)偏向于某一方向的情況;由于高斯濾波器的原理是將某一像素點鄰域的權值替換該點的像素值,且距離越遠的點的權重值越低,這樣就能有效區(qū)分出圖像邊緣,使圖像能高保真;由于高斯濾波的傅里葉變換頻譜為單瓣,因此可以過濾大部分高頻干擾信號;由于高斯濾波器的寬度可人為設定,因此可將圖像在過平滑和欠平滑間進行切換,并取得最適合的中間值;由于高斯函數(shù)具備可分離性,二維高斯函數(shù)的計算量隨模板寬度成線性增長,而不是與模板寬度的平方成正相關,這樣能在很大程度上減少高斯濾波器的復雜程度。
2.2.3 均值濾波
均值濾波也稱為線性濾波,主要方法是取相鄰區(qū)域像素平均值。首先計算模板中所有像素的平均值,然后再將該平均值給予當前像素點(x,y),則該均值即為濾波后該點圖像上的灰度值g(x,y)=1/m ∑f(x,y)。均值濾波可有效地去除圖像中的附加噪聲,但實質(zhì)上它有一個十分明顯的缺點,即無法保護圖像的細節(jié),利用這種方法去除噪聲時很大概率上會破壞原始圖像。均值濾波器可更好地抑制高斯噪聲和均勻分布噪聲,但不影響椒鹽噪聲。當噪聲降低時整個圖像變得模糊,并且噪聲仍然存在。
均值濾波通常包括算術均值濾波、幾何均值濾波、諧波均值濾波和逆諧波均值濾波。這幾種濾波方式里,幾何平均濾波的平滑度可與算術平均濾波的平滑度相媲美,但濾波中丟失的圖像細節(jié)卻很小。逆諧波均值濾波器特別適用于脈沖噪聲的處理,但需提前知道噪聲點是暗噪聲還是亮噪聲,以便于選擇正確的濾波器階數(shù)符號,否則將嚴重影響濾波效果。當階數(shù)為正時,逆諧波均值濾波器對“胡椒”噪聲有較好的濾波效果,當階數(shù)為負時,逆諧波均值濾波器對“鹽”噪聲有較好的濾波效果。然而,逆諧波均值濾波器不能同時濾除“胡椒”噪聲和“鹽”噪聲。
2.2.4 直方圖均衡化
灰度直方圖直接反映不同層級灰度以及對應出現(xiàn)頻率之間的關系,可表示為P(rk)=nk/N,其中r表示第K 個灰度級,nk為第k 級灰度的像素數(shù),N為當前圖像的像素總數(shù)。
灰度直方圖被認為是圖像的重要統(tǒng)計特征,并且灰度直方圖可被視為不同灰度概率密度的近似值,因此灰度直方圖的均衡化就相當于是圖像灰度分布的一種均衡化過程。對于尺寸嬌小的圖像而言,其灰度直方圖散落在某一較小區(qū)間內(nèi),均衡化后其所有灰度出現(xiàn)的頻率相同,此時圖像包含的信息量將達到最大值。現(xiàn)在以r 和s 分別表示經(jīng)過歸一化處理的原始圖像灰度值和經(jīng)過均衡化后的圖像灰度值,T(r)為變換函數(shù),則在區(qū)間[0,1]隨機一個r 經(jīng)過變換后都會對應一個s,即s=T(r)。T(r)應滿足2個條件:s 在[0,1]的區(qū)間內(nèi)為單調(diào)遞增函數(shù);調(diào)遞增函數(shù)為在[0,1]區(qū)間內(nèi)也存在反變換的r=T-1(s)。
條件1能保證灰度級從黑變白的順序,條件2保證變換后的像素灰度在允許的范圍內(nèi)。根據(jù)概率論,將隨機的變量r 的概率密度函數(shù)設置為Pr(r),如果設置的隨機變量s 是r 的函數(shù),那么隨機變量s 的概率密度函數(shù)Ps(s)可以由Pr(r)求出。假設隨機變量s 的分布函數(shù)Fs(s),可得出公式,將上式兩邊對s 求導得。
綜上所示,變換函數(shù)T(r)控制了圖像灰度的概率密度,因為Ps(s)=1,則ds=Pr(r)dr=d[T(r)],雙邊的積分得出。由上式可知,該函數(shù)為原始圖像直方圖的累積值。如果圖像為灰度值離散狀態(tài)的數(shù)字圖像,則可選擇用頻率來代替概率,因此變換函數(shù)T(r)可以表示為式中0≤rk≤1,k=0,1,2…L-1,L,L 為灰度級數(shù)目。
2.2.5 灰度變換
灰度變換中最基本的方式叫做灰度拉伸,又叫做對比度拉伸,它使用了非常簡單的分段變換函數(shù),將原來圖像的亮度范圍線性拓展到新的動態(tài)范圍。其主要思想是通過提升圖像的對比度擴大圖像色彩動態(tài)范圍,尤其適用于低對比度圖像的預處理,其過程包括兩個基本操作:利用灰度直方圖統(tǒng)計的方式確定圖像對比度拉伸過程中的兩個拐點;根據(jù)上一階段確定的拐點,利用分段變換函數(shù)進行灰度值的變換。
該種變換方式可使得低對比度的圖片細節(jié)變得更加明顯和突出。這種通過灰度轉換將不同圖像的灰度分布參數(shù)調(diào)整為預定值的過程,稱為灰度歸一化,通常調(diào)整后的圖像灰度分布的均值和均方差取0和1。假設一個尺寸為M×N 的圖像,它的灰度分布可用矩陣I(i,j)表示,且1≤i ≤M;1≤J ≤N,那么矩陣每個元素值都是該點像素值,其灰度值概率密度函數(shù)的均值和均方差則為:
在轉換和傳輸數(shù)字圖像后一定會產(chǎn)生模糊的情況。銳化圖像的主要目的是補償圖像邊緣的輪廓,強調(diào)圖像的細節(jié)信息,使圖像更加生動并與人類的視覺習慣相匹配。經(jīng)過平滑處理過的圖像之所以變得模糊,主要原因在于取了平均值或做了積分運算,如果想要圖片再次變清晰,可選擇對應的逆運算過程。而對于那些通過濾波器處理過的圖像而言,變模糊的原因在于高頻分量被過濾太多,針對于這種類型的圖片可選擇高通濾波器進行銳化處理。常見的銳化方式可分為一階微分銳化和二階微分銳化。一階微分銳化中又分為單方向一階銳化和無方向一階銳化,前一種方式對規(guī)則物體具有很好的銳化功能,但無法完成不規(guī)則物體的銳化,在城市配電網(wǎng)設備缺陷檢測中,絕大多數(shù)設備缺陷的二維圖像為不規(guī)則物體。常見銳化方式有Sobel 算子銳化、Prewitt 算子銳化、LOG 算子銳化等方法,由于篇幅有限在此不再贅述。
圖像處理中的重要步驟是噪聲的消除與圖像的增強,主要的目的是為提高圖像的質(zhì)量,它通常被稱為圖像預處理。圖像增強的主要目的是突出顯示圖像的有用部分中的信息并減少圖像中部分的無效的信息。圖像的噪聲消除的目的是為盡最大的能力去將噪聲的干擾點,得到圖像本來的樣子。
本文分析了幾種常見的圖像預處理技術,有效的圖像與處理手段,不但能最大程度保留圖像的有用信息,還能降低后續(xù)圖像學習、檢測、識別的難度,并最終轉化為識別準確率的提升。對于后續(xù)卷及神經(jīng)網(wǎng)絡模型的訓練而言,一個好的圖像預處理技術能從根本上改變模型的訓練特性,如何開發(fā)出一款更加優(yōu)秀的圖像預處理函數(shù),也是本項研究后期需要重點開展的工作。