田中旭,趙娟,李奇彥,王川,侯璋天
(上海海洋大學(xué) 工程學(xué)院,上海 201306)
曲軸是柴油機(jī)系統(tǒng)中最為核心的運(yùn)動(dòng)部件之一,曲軸的運(yùn)動(dòng)可靠性取決于曲軸的疲勞強(qiáng)度特性,進(jìn)行船用柴油機(jī)曲軸疲勞強(qiáng)度校核時(shí),大多數(shù)計(jì)算參數(shù)都采用圖片方式呈現(xiàn),如彎曲應(yīng)力集中系數(shù)、扭轉(zhuǎn)應(yīng)力集中系數(shù)、結(jié)構(gòu)細(xì)節(jié)的影響系數(shù)等,因此,為船級(jí)社數(shù)據(jù)的后期分析處理帶來了很多不便之處[1]。運(yùn)用圖像處理技術(shù),結(jié)合嶺回歸、lasso回歸等曲線擬合方法,構(gòu)建能反映計(jì)算參數(shù)性質(zhì)的經(jīng)驗(yàn)公式,對(duì)于研究曲軸疲勞強(qiáng)度計(jì)算軟件開發(fā)是非常重要的。
目前,對(duì)于復(fù)雜曲線數(shù)據(jù)提取問題,文獻(xiàn)[2]從打印的圖形中提取曲線數(shù)據(jù)的方法,采用區(qū)域插值的方法來去除曲線中的一些間斷點(diǎn),但是提取出的曲線僅有一條。文獻(xiàn)[3]對(duì)于電磁兼容圖片測試曲線中的數(shù)據(jù)提取,建立一種關(guān)于像素坐標(biāo)和坐標(biāo)軸的分布的數(shù)學(xué)關(guān)系,遍歷掃描圖片坐標(biāo)軸內(nèi)有效區(qū)域的每一個(gè)像素點(diǎn),從而實(shí)現(xiàn)數(shù)據(jù)的提取,但是此方法提到曲線提取對(duì)于數(shù)據(jù)量大的復(fù)雜曲線,其不能很好實(shí)現(xiàn)精準(zhǔn)提取。文獻(xiàn)[4]提出了一種針對(duì)兩條曲線的識(shí)別提取算法和一種針對(duì)多條彩色曲線的識(shí)別提取算法,針對(duì)不同曲線運(yùn)用插值法,但是提取出的數(shù)據(jù)精度不高。文獻(xiàn)[5]、文獻(xiàn)[6]主要利用Hough變換,研究了有曲線方程的圓、橢圓曲線的識(shí)別,而對(duì)于曲線方程未知的一般性非參數(shù)平面曲線,其識(shí)別與提取就無法實(shí)現(xiàn)了。
本文考慮圖像干擾多,多曲線等因素,根據(jù)曲線本身的特性,提出了一種曲線數(shù)據(jù)提取的方法,利用像素點(diǎn)的位置關(guān)系對(duì)曲線圖片進(jìn)行數(shù)據(jù)遍歷掃描,避免繁瑣的操作,獲取初步的曲線數(shù)據(jù)表,然后通過比較多種數(shù)據(jù)擬合方法,選擇最大擬合優(yōu)度的回歸算法得出擬合經(jīng)驗(yàn)公式,再做誤差分析,符合標(biāo)準(zhǔn)提取出曲線數(shù)據(jù)。
曲軸疲勞強(qiáng)度計(jì)算參數(shù)表是以圖片形式呈現(xiàn)的,可能包含一些背景網(wǎng)格和水印,這些都會(huì)對(duì)圖片造成干擾。所以,為方便人工取點(diǎn)與降低干擾,先對(duì)圖1進(jìn)行圖像降噪。
圖1 特征原始圖
本文所采用的是像素值法,即根據(jù)該點(diǎn)的像素值,為此來判斷該點(diǎn)是否為曲線上的有效點(diǎn),再將圖片轉(zhuǎn)化為只有黑白兩色的灰度圖有助于像素點(diǎn)數(shù)值的迅速判別[3]。處理的關(guān)鍵是通過閾值來判斷,f(ek,ω)曲線灰度圖的主要構(gòu)成是背景色和曲線兩種顏色,而且呈現(xiàn)出的圖像兩部分的差別非常大,將部分目標(biāo)錯(cuò)判成背景或者將部分背景錯(cuò)分成目標(biāo)都會(huì)導(dǎo)致兩部分差別變小,為此本文采用大津法來進(jìn)行處理[7]。再利用深度學(xué)習(xí)對(duì)原始圖像進(jìn)行去除復(fù)雜圖像水印和內(nèi)部的網(wǎng)格線,需要先通過對(duì)大量訓(xùn)練圖片樣本測試,保留曲線部分以及坐標(biāo)軸的邊界線,再通過高斯濾波消除噪音,為了更好的平滑圖像質(zhì)量,使用高斯濾波器與圖片進(jìn)行卷積,以此來減少邊緣檢測器上面明顯的噪聲影響。高斯濾波的計(jì)算滿足式(1):
通過高斯濾波器降噪后的圖2為方便后續(xù)數(shù)據(jù)處理。
圖2 待提取數(shù)據(jù)的曲線
為了將復(fù)雜曲線分離,提取圖形數(shù)據(jù),先讓該圖像顯示最大化,便于取點(diǎn)。這里取到的坐標(biāo)是像素坐標(biāo),將像素坐標(biāo)值存放在數(shù)組xp,yp中,將取得的點(diǎn)像素坐標(biāo)依據(jù)坐標(biāo)軸的像素坐標(biāo)進(jìn)行轉(zhuǎn)換,得到曲線上點(diǎn)的真實(shí)坐標(biāo)。再將真實(shí)坐標(biāo)存放在數(shù)組xc,yc,中。其中像素坐標(biāo)與真實(shí)坐標(biāo)的轉(zhuǎn)換滿足式(2)和式(3):
取點(diǎn)后,再通過公式將像素坐標(biāo)與實(shí)際坐標(biāo)進(jìn)行轉(zhuǎn)換后,提取出ω=0.38、ω=0.36、ω=0.25的部分坐標(biāo)值如表1所示。
表1 曲線上提取的數(shù)據(jù)點(diǎn)
曲線擬合是指根據(jù)獲取的部分?jǐn)?shù)據(jù)點(diǎn)的數(shù)據(jù)集,構(gòu)造一個(gè)新的函數(shù)解析式,使其部分?jǐn)?shù)據(jù)點(diǎn)盡可能接近擬合出的值。
目前,常用的擬合方法有二次函數(shù)擬合、拋物線擬合、指數(shù)式擬合等,根據(jù)曲線線條樣式,該曲線采用高次冪數(shù)據(jù)擬合。首先建立數(shù)學(xué)模型:
則根據(jù)高次冪數(shù)據(jù)擬合原理有:
令k1,k2,...,kn合理取值,使得M的取值最小。則滿足式(5)的函數(shù)f(x),求高次冪擬合曲線的解。
函數(shù)類型的選取決定擬合優(yōu)度,只有選取合適的函數(shù)類型,才能得到合適的擬合曲線。常用的函數(shù)有多項(xiàng)式函數(shù)、冪函數(shù)、傅立葉函數(shù)、高斯函數(shù)等。本文以多項(xiàng)式高次冪函數(shù)為力對(duì)曲線進(jìn)行擬合。高次冪多項(xiàng)式擬合公式為:
滿足式(7)的fm(x)就是高次冪的擬合多項(xiàng)式。公式中的α0,α1,...,αm的多項(xiàng)式系數(shù),根據(jù)多項(xiàng)式極值存在的必要條件,可求得:
式(8)中,j=0,1,…,m。
將式(9)轉(zhuǎn)換成矩陣的形式:
可以證明式(9)的系數(shù)矩陣是一個(gè)對(duì)稱正定矩陣,所以存在唯一解。根據(jù)上式可以求解得到多項(xiàng)式系數(shù)矩陣。
此時(shí),高次冪數(shù)據(jù)擬合完成,取ω=0.35這個(gè)數(shù)值的數(shù)據(jù),得到擬合曲線計(jì)算數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的差值如圖3所示。
圖3 曲線計(jì)算數(shù)據(jù)多元圖
曲線數(shù)據(jù)擬合的方法有很多,以下針對(duì)四種擬合方法普通最小二乘法[6]、多項(xiàng)式回歸[7]、嶺回歸[8](ridge regression)、Lasso回歸[9]進(jìn)行比較分析。普通最小二乘法又稱高斯法,通過N個(gè)不同的數(shù)據(jù)點(diǎn)擬合出我們?cè)O(shè)定函數(shù)的未知參數(shù)的過程。多項(xiàng)式回歸將會(huì)對(duì)連續(xù)性的數(shù)據(jù)做出預(yù)測,從數(shù)據(jù)里求出回歸方程。嶺回歸(ridge regression)是加了二階正則項(xiàng)的最小二乘,嶺回歸用于處理變量間存在共線性。Lasso回歸是通過拉格朗日乘數(shù)法原理,擬合出回歸曲線,對(duì)于參數(shù)w增加一個(gè)限定條件,能到達(dá)和嶺回歸一樣的效果。如圖4所示為各算法對(duì)擬合優(yōu)度的影響曲線。
圖4 各算法擬合優(yōu)度影響曲線
此時(shí),各算法擬合優(yōu)度的比較,取多項(xiàng)式回歸是最理想化的擬合方法,它得到的擬合曲線優(yōu)度最接近1,說明此方法擬合的曲線是最接近目標(biāo)曲線。
多項(xiàng)式曲線擬合回歸模型有一次擬合、二次多項(xiàng)式擬合、三次多項(xiàng)式擬合、四次多項(xiàng)式擬合,在實(shí)驗(yàn)過程中,要根據(jù)不同次冪擬合優(yōu)度和均方誤差等方法進(jìn)行比較,選擇最適合曲線擬合模型次數(shù),才能得到最合理的經(jīng)驗(yàn)公式。圖5為各次冪對(duì)擬合優(yōu)度的影響,圖6為各次冪對(duì)絕對(duì)值誤差的影響,圖7為各次冪對(duì)均方誤差(MSE)的影響。
圖5 各次冪對(duì)擬合優(yōu)度的影響
圖6 各次冪對(duì)絕對(duì)值誤差的影響
圖7 各次冪對(duì)均方誤差(MSE)的影響
擬合優(yōu)度R2的值約接近1,說明回歸直線對(duì)預(yù)測值的擬合程度越好,反之,R2的值越小,說明擬合程度越差,圖5當(dāng)多項(xiàng)式擬合次數(shù)達(dá)到四次時(shí),擬合優(yōu)度幾乎接近1,就是最滿意的擬合程度。絕對(duì)值誤差(MAE)用來評(píng)估回歸模型,圖6的絕對(duì)值誤差都接近1,說明改變次數(shù)對(duì)改變絕對(duì)值誤差的影響不大。均方誤差(MSE)是指參數(shù)估計(jì)值與真實(shí)值之差平方的期望值,MSE是評(píng)價(jià)數(shù)據(jù)變化程度較方便的方法,圖7的MSE值越小,說明預(yù)測模型描述擬合數(shù)據(jù)具有更好的精確度,由圖知四次冪擬合具有更好的精度。以上回歸模型的評(píng)估指標(biāo)得出擬合的經(jīng)驗(yàn)公式如式(10)所示:
式(10)中的n=4時(shí)滿足評(píng)估指標(biāo)最優(yōu)化,根據(jù)多項(xiàng)式極值存在的必要條件,可求得式(11)的經(jīng)驗(yàn)公式系數(shù)矩陣值:
上述方法只是對(duì)圖像中的數(shù)據(jù)進(jìn)行了提取,并不能說明此方法的準(zhǔn)確性,為了說明該提取數(shù)據(jù)方法的準(zhǔn)確性,要對(duì)提取出的結(jié)果進(jìn)行誤差分析。
曲線數(shù)據(jù)可以根據(jù)曲線經(jīng)驗(yàn)公式得到的,現(xiàn)在根據(jù)誤差分析公式,通過擬合所得到的數(shù)據(jù)與原始數(shù)據(jù)進(jìn)行對(duì)比來獲得誤差的大小。誤差的計(jì)算公式為:
求得與原始提取數(shù)據(jù)的誤差率分別如表2所示。
表2 曲線誤差分析數(shù)據(jù)表
柴油機(jī)疲勞強(qiáng)度分析過程中,校核強(qiáng)度過程中需要對(duì)參數(shù)進(jìn)行查表,五條擬合曲線的誤差率都在誤差范圍之內(nèi),說明此方法擬合曲線數(shù)據(jù)滿足柴油機(jī)查表數(shù)據(jù)要求。根據(jù)得到的經(jīng)驗(yàn)公式得到相應(yīng)的數(shù)據(jù)集,再通過數(shù)據(jù)集開發(fā)查表分析軟件,可以直接通過輸入數(shù)值得到查表后的參數(shù)值,節(jié)省了查表的人力和時(shí)間,使得操作更方便。
通過檢測系統(tǒng)的運(yùn)行,表明柴油機(jī)曲軸疲勞計(jì)算曲線數(shù)據(jù)提取與擬合方法研究,具有結(jié)果穩(wěn)定、準(zhǔn)確的優(yōu)點(diǎn),適用于柴油機(jī)疲勞強(qiáng)度分析過程中計(jì)算參數(shù)的查找,同時(shí)該高次冪曲線擬合效果明顯,實(shí)現(xiàn)了自動(dòng)、快速查找系數(shù),具有較高的研究價(jià)值。對(duì)于類似的曲線提取,可以對(duì)不清晰,干擾大的圖像先進(jìn)行圖像預(yù)處理,可以通過高斯濾波、二值化、閾值化等方法初步去除噪聲等干擾。確定圖像中坐標(biāo)軸位置與坐標(biāo)刻度,使圖像中的像素坐標(biāo)轉(zhuǎn)換為真實(shí)坐標(biāo)。在曲線上進(jìn)行取點(diǎn),對(duì)于取到的坐標(biāo)點(diǎn)進(jìn)行多種方法曲線數(shù)據(jù)擬合,分析比較擬合優(yōu)度和均方誤差,找到一條擬合優(yōu)度最接近1的擬合方法,求解擬合經(jīng)驗(yàn)公式。通過本方法得到的曲線與原始曲線相比,數(shù)據(jù)非常吻合,誤差也相對(duì)較小。