張向良
摘 要:鈑金件成型的過程中,彎邊處會(huì)出現(xiàn)回彈現(xiàn)象,如果在工裝的幾何形狀上補(bǔ)償相應(yīng)的角度,就可以減少回彈帶來的影響。本文將以歷史數(shù)據(jù)為素材,利用機(jī)器學(xué)習(xí)的方法建立補(bǔ)償角度預(yù)測(cè)模型。本文將首先對(duì)學(xué)習(xí)任務(wù)進(jìn)行分析,然后使用交叉驗(yàn)證的方法審察多種模型在訓(xùn)練數(shù)據(jù)集上的表現(xiàn),根據(jù)相關(guān)性能指標(biāo)選取合適的模型進(jìn)行訓(xùn)練,最后在測(cè)試數(shù)據(jù)集上驗(yàn)證模型的性能。最終模型可以通過給定參數(shù)預(yù)測(cè)回彈補(bǔ)償角度,為后續(xù)的工裝設(shè)計(jì)提供數(shù)據(jù)依據(jù)。
關(guān)鍵詞:鈑金;回彈;機(jī)器學(xué)習(xí);回歸;模型審查
中圖分類號(hào):V262 文獻(xiàn)標(biāo)志碼:A
0 引言
鈑金件成型的過程中,由于材料發(fā)生的形變中會(huì)殘留一部分彈性形變,卸除壓力后彈性形變會(huì)恢復(fù)原狀(即回彈)。如果在設(shè)計(jì)工裝時(shí)將彎邊向內(nèi)偏移相應(yīng)的補(bǔ)償角度,就可以減少甚至消除回彈帶來的影響,進(jìn)而免去后續(xù)的人工敲修步驟,提高生產(chǎn)效率。
為了預(yù)測(cè)鈑金件成型的補(bǔ)償角度,需要探索零件的各項(xiàng)參數(shù)與補(bǔ)償角度之間的關(guān)系。本文將通過機(jī)器學(xué)習(xí)的方法,利用已有的數(shù)據(jù)訓(xùn)練回彈補(bǔ)償角度預(yù)測(cè)模型。本文假定補(bǔ)償角度被且僅被材料厚度、彎曲內(nèi)半徑和彎曲角度確定。由于篇幅所限,本文所用的數(shù)據(jù)集未給出。
1 任務(wù)分析
本任務(wù)是給定材料厚度、彎曲內(nèi)半徑、彎曲角度,預(yù)測(cè)回彈補(bǔ)償角度,是一個(gè)回歸任務(wù)。在使用數(shù)據(jù)訓(xùn)練模型之前,有必要對(duì)數(shù)據(jù)有一個(gè)大致的了解。觀察數(shù)據(jù)集(見表1)可知,3個(gè)輸入特征均為數(shù)值特征,但所用的尺度不同;另外,特征的一些統(tǒng)計(jì)信息見表1。
可以看出3個(gè)輸入特征的分布與離散速度都非常均勻,這是因?yàn)閿?shù)據(jù)集的特征值是正交實(shí)驗(yàn)中人為選定的,而非在某一固定規(guī)律的影響下自然生成。對(duì)任務(wù)和數(shù)據(jù)有了一定的了解之后,下一步將選取合適的模型,以挖掘數(shù)據(jù)中蘊(yùn)含的規(guī)律。
2 模型審查
機(jī)器學(xué)習(xí)中有多種回歸模型,應(yīng)選擇適合本任務(wù)的一個(gè)進(jìn)行訓(xùn)練。根據(jù)上一節(jié)的內(nèi)容,對(duì)可能適用的模型作出推測(cè):
(1)數(shù)據(jù)集中的特征都是數(shù)值特征,幾何模型可能會(huì)普遍地適用。
(2)由于相似的特征取值會(huì)帶來相似的結(jié)果,如δ=1.8、R=4.5、α=90時(shí)與δ=2、R=4、α=95時(shí)Δα均為2.8,所以基于距離的模型可能會(huì)有較好的表現(xiàn)。
(3)由于數(shù)據(jù)的特征值是人為選定的,所以一些邏輯模型(如樹模型)可能會(huì)有較好的表現(xiàn)。
(4)某些集成模型可能會(huì)有較好的表現(xiàn),但隨之而來的是模型的復(fù)雜性。
選擇模型時(shí),除在訓(xùn)練集上的表現(xiàn)外,還需要關(guān)注模型的泛化能力。本文將使用10折交叉驗(yàn)證對(duì)下列5種模型在訓(xùn)練數(shù)據(jù)集上的均方誤差(MSE)進(jìn)行審查:線性回歸(LR)、支持向量機(jī)(SVM)、K近鄰(KNN)、決策樹(DT)和梯度提升決策樹(GBDT)。在交叉驗(yàn)證之前,會(huì)分離出數(shù)據(jù)集的20%作為測(cè)試數(shù)據(jù)集。
通過交叉驗(yàn)證得到5種模型的均方誤差(取負(fù)),并使用線箱圖表示,如圖1所示。
可以看出,支持向量機(jī)、K近鄰和梯度提升決策樹的均方誤差較小,分布也比較集中。其中K近鄰的表現(xiàn)最好,但與其余兩者的差距并不大。由此產(chǎn)生的問題是:這種較小的性能差異是否意味著應(yīng)當(dāng)選擇K近鄰而拋棄另兩者。由于復(fù)雜的學(xué)習(xí)策略通常意味著較差的泛化能力,本文將優(yōu)先考慮支持向量機(jī)和K近鄰這兩個(gè)相對(duì)簡(jiǎn)單的模型。
下面通過配對(duì)t檢驗(yàn)來判定兩模型均方誤差的差異是否顯著。具體評(píng)分見表2。
定義零假設(shè)為:支持向量機(jī)與K近鄰在上述交叉驗(yàn)證中的均方誤差總體而言沒有差異。取顯著性指標(biāo)a=0.05。檢驗(yàn)結(jié)果為t=-0.2845,p=0.7824,不拒絕零假設(shè),即兩模型均方誤差的差異無統(tǒng)計(jì)學(xué)意義。本文選擇支持向量機(jī)進(jìn)行訓(xùn)練。
3 性能驗(yàn)證
為了驗(yàn)證模型的性能,需要使用它對(duì)已知結(jié)果的數(shù)據(jù)進(jìn)行預(yù)測(cè),將預(yù)測(cè)結(jié)果與已知結(jié)果作比較。使用訓(xùn)練數(shù)據(jù)集對(duì)支持向量機(jī)進(jìn)行訓(xùn)練后,對(duì)測(cè)試數(shù)據(jù)集進(jìn)行預(yù)測(cè),結(jié)果見表3。
該次預(yù)測(cè)的均方誤差為0.0166。這與交叉驗(yàn)證得到的中位值(約0.02)比較相符。注意第4條記錄的預(yù)測(cè)結(jié)果與已知結(jié)果偏差較大,實(shí)際上這是數(shù)據(jù)集的誤差所致,此處的預(yù)測(cè)結(jié)果反而更符合常理。這說明了此模型有著一定的健壯性。
結(jié)論
本文使用包括材料厚度、彎曲內(nèi)半徑、彎曲角度和補(bǔ)償角度4個(gè)特征的數(shù)據(jù)集,通過交叉驗(yàn)證的方法,對(duì)線性回歸、支持向量機(jī)、K近鄰、決策樹和梯度提升決策樹5個(gè)模型的均方誤差進(jìn)行了審查,最終選定了性能理想的支持向量機(jī)進(jìn)行訓(xùn)練,得到了回彈補(bǔ)償角度的預(yù)測(cè)模型。該模型在測(cè)試數(shù)據(jù)集上擁有符合預(yù)期的性能指標(biāo),并表現(xiàn)出了一定的健壯性,達(dá)到了研究的目的。
參考文獻(xiàn)
[1][英]彼得·弗拉赫. 段菲譯.機(jī)器學(xué)習(xí)[M].北京:人民郵電出版社,2016.
[2][美]彼得·哈林頓. 李銳等譯.機(jī)器學(xué)習(xí)實(shí)戰(zhàn)[M].北京:人民郵電出版社,2013.
[3][美]杰克·萬托布拉斯. 陶俊杰等譯.Python數(shù)據(jù)科學(xué)手冊(cè)[M].北京:人民郵電出版社,2018.