錢慶杰,余軍合,戰(zhàn)洪飛,王瑞,胡健
(1.寧波大學(xué) 機(jī)械工程與力學(xué)學(xué)院,浙江 寧波 315211;2.中機(jī)中聯(lián)工程有限公司第一工業(yè)設(shè)計(jì)研究院,重慶 400039)
注塑成型加工是制造塑料產(chǎn)品最為廣泛的工藝之一,其具有生產(chǎn)效率和自動(dòng)化程度高的優(yōu)點(diǎn),適用于加工需求大、形狀復(fù)雜的產(chǎn)品[1].注塑成型過(guò)程是復(fù)雜的非線性生產(chǎn)過(guò)程,注塑件質(zhì)量易受到工藝參數(shù)、設(shè)備和模具狀態(tài)等諸多因素的影響[2].目前注塑件質(zhì)量檢驗(yàn)采用首末巡檢的方式,多數(shù)依靠人工檢測(cè),檢驗(yàn)成本高且效率低下.巡檢對(duì)缺陷產(chǎn)品處理具有一定的滯后性,出現(xiàn)產(chǎn)品質(zhì)量問(wèn)題無(wú)法及時(shí)停止生產(chǎn),造成生產(chǎn)浪費(fèi)現(xiàn)象頻頻發(fā)生,如何在線監(jiān)測(cè)和判斷注塑件質(zhì)量尤為重要.
目前已經(jīng)有學(xué)者使用機(jī)器學(xué)習(xí)的方法建立注塑件質(zhì)量預(yù)測(cè)模型.Ogorodnyk等[3-4]使用多層感知器和決策樹算法預(yù)測(cè)高密度聚乙烯樣品的拉伸強(qiáng)度,并從預(yù)測(cè)零件尺寸的準(zhǔn)確性和預(yù)測(cè)方法的可解釋性角度進(jìn)行探討.Yin等 [5]提出基于主要工藝參數(shù)的反向傳播神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)和優(yōu)化注塑件的翹曲邊問(wèn)題.Gulcur等[6]使用模腔、系統(tǒng)壓力和注射活塞位置參數(shù)來(lái)預(yù)測(cè)微注射成型部件的質(zhì)量.宋建等[7-8]通過(guò)對(duì)LightGBM算法進(jìn)行改進(jìn)和集成,并融合成型機(jī)狀態(tài)數(shù)據(jù)和模腔壓力溫度傳感器高頻數(shù)據(jù)的統(tǒng)計(jì)特征作為模型輸入,實(shí)現(xiàn)對(duì)注塑件尺寸的預(yù)測(cè).上述預(yù)測(cè)方法主要考慮成型機(jī)狀態(tài)特征和傳感器高頻數(shù)據(jù)的統(tǒng)計(jì)特征(如中位數(shù)、最大值和最小值等),但因聚合物熔體在模腔中的流動(dòng)具有復(fù)雜、動(dòng)態(tài)、非線性等特性,無(wú)法充分體現(xiàn)聚合物熔體在模腔中的流動(dòng)狀態(tài),導(dǎo)致預(yù)測(cè)準(zhǔn)確性不高[9].Huang[10]使用模腔壓力和溫度傳感器監(jiān)控聚合物熔體在模腔內(nèi)的流動(dòng)狀態(tài),通過(guò)分析傳感器數(shù)值變動(dòng)判斷注塑件的質(zhì)量.Farahani等[11]使用模腔內(nèi)傳感器的數(shù)值變動(dòng)對(duì)注塑件的質(zhì)量進(jìn)行實(shí)時(shí)監(jiān)控.
以上注塑件質(zhì)量預(yù)測(cè)方法在前期須進(jìn)行大量的特征和數(shù)據(jù)篩選,易造成重要特征流失.使用傳感器高頻數(shù)據(jù)的統(tǒng)計(jì)特征,無(wú)法充分利用傳感器的高頻時(shí)序特征,從而影響模型的預(yù)測(cè)精度.在多特征融合方面,Hotait等[12]提出實(shí)時(shí)監(jiān)測(cè)(IRT-OPTICS)的方法,通過(guò)融合時(shí)間、頻率和尺度特征來(lái)檢測(cè)滾動(dòng)軸承的缺陷.Chen等[13]提出基于長(zhǎng)短期記憶網(wǎng)絡(luò)和注意力機(jī)制的多特征融合框架,顯著提高了航空發(fā)動(dòng)機(jī)壽命預(yù)測(cè)的精度.Feng等[14]提出基于時(shí)空注意機(jī)制驅(qū)動(dòng)的多特征融合方法用于刀具磨損監(jiān)測(cè)和剩余壽命預(yù)測(cè).
針對(duì)注塑過(guò)程傳感器高頻數(shù)據(jù)的統(tǒng)計(jì)特征無(wú)法準(zhǔn)確表征聚合物熔體在模腔中的流動(dòng)狀態(tài)的問(wèn)題,利用深度學(xué)習(xí)模型具有復(fù)雜特征自動(dòng)提取、適應(yīng)性好的優(yōu)點(diǎn),提出基于雙層雙向門控循環(huán)單元網(wǎng)絡(luò)(double-layer bidirectional gated cyclic unit network,DL-BiGRU)的多特征融合深度學(xué)習(xí)模型,對(duì)注塑件尺寸進(jìn)行預(yù)測(cè).通過(guò)DL-BiGRU時(shí)間序列網(wǎng)絡(luò)提取傳感器的高頻時(shí)序特征,并構(gòu)建多特征融合的深度學(xué)習(xí)框架.在注塑成型數(shù)據(jù)集上,對(duì)所提出模型進(jìn)行模型驗(yàn)證和穩(wěn)定性分析,驗(yàn)證所提出方法的有效性.
注塑成型是指將粒狀或粉狀的原材料加入到注射料斗中,原材料經(jīng)加熱熔化呈流動(dòng)狀態(tài),在螺桿或活塞推動(dòng)下,經(jīng)噴嘴和模具的澆注系統(tǒng)進(jìn)入模具型腔,在模具型腔內(nèi)冷卻硬化定型的加工過(guò)程.在注塑件成型過(guò)程中,膜腔內(nèi)的傳感器感知的瞬時(shí)物理量變動(dòng)也是須重點(diǎn)考慮的因素[15].如圖1所示為注塑加工過(guò)程數(shù)據(jù)采集的主要傳感器位置分布圖.
圖1 注塑加工過(guò)程數(shù)據(jù)采集的主要傳感器位置分布圖Fig.1 Main sensor position distribution diagram of data acquisition for injection molding process
實(shí)驗(yàn)數(shù)據(jù)選用第4屆工業(yè)大數(shù)據(jù)創(chuàng)新競(jìng)賽中的注塑成型尺寸預(yù)測(cè)數(shù)據(jù)集,數(shù)據(jù)來(lái)源于富士康工業(yè)互聯(lián)網(wǎng)股份有限公司發(fā)布的加工數(shù)據(jù),共16 600個(gè)數(shù)據(jù)樣本,數(shù)據(jù)記錄了每模次對(duì)應(yīng)產(chǎn)品的3個(gè)尺寸參數(shù)、成型機(jī)狀態(tài)數(shù)據(jù)和傳感器高頻數(shù)據(jù),數(shù)據(jù)具有維度高、數(shù)據(jù)多的特點(diǎn).
注塑產(chǎn)品尺寸數(shù)據(jù)記錄每模次注塑件的3個(gè)尺寸數(shù)據(jù)(size1、size2、size3),具體尺寸范圍及公差如表1所示.表中,Dmax為尺寸上限,Dmin為尺寸下限,T為尺寸公差.
表1 注塑件尺寸范圍及公差Tab.1 Dimension range and tolerance of injection molded part
注塑過(guò)程傳感器高頻數(shù)據(jù)主要來(lái)自模溫機(jī)和模具傳感器,單件注塑產(chǎn)品加工周期為37~43 s,采樣頻率為20、50 Hz 2種,共24個(gè)傳感器采集數(shù)據(jù),為高頻次時(shí)間序列數(shù)據(jù),主要包括模具內(nèi)壓力、模具內(nèi)溫度、噴嘴頭的射出壓力等.成型機(jī)的傳感器高頻采樣數(shù)據(jù)的部分特征字段名及對(duì)應(yīng)的含義如表2所示.
表2 傳感器高頻字段對(duì)應(yīng)的特征Tab.2 Corresponding features of sensor high-frequency field
注塑成型機(jī)狀態(tài)數(shù)據(jù)來(lái)自成型機(jī)機(jī)臺(tái),直接采集成型機(jī)上的狀態(tài)數(shù)據(jù),數(shù)據(jù)維度為86維,主要包括保壓時(shí)間、后冷卻時(shí)間、切換位置等.成型機(jī)狀態(tài)數(shù)據(jù)的部分特征字段名及對(duì)應(yīng)含義如表3所示.
表3 成型機(jī)狀態(tài)字段對(duì)應(yīng)的特征Tab.3 Corresponding features of forming machine status field
在注塑件加工過(guò)程中模具內(nèi)部壓力和溫度曲線記錄著其從原材料到成品的變化狀態(tài),過(guò)程曲線反映熔體從噴嘴頭進(jìn)入澆口、流道,最后注入模腔后的情況[16].在某產(chǎn)品生產(chǎn)過(guò)程中,對(duì)注塑件的傳感器高頻數(shù)據(jù)進(jìn)行可視化分析,隨機(jī)抽取3個(gè)模次的關(guān)鍵傳感器參數(shù)繪制出高頻時(shí)序數(shù)據(jù)曲線圖,具體如圖2所示.圖中,p為近澆口壓力,D為實(shí)際螺桿位置,T為加工時(shí)間.以模具內(nèi)的近澆口壓力和實(shí)際螺桿位置為例,根據(jù)加工階段劃分(每個(gè)數(shù)值為一個(gè)加工階段,如注射、保壓、冷卻等),對(duì)注塑件成型過(guò)程中的高頻時(shí)序數(shù)據(jù)做進(jìn)一步分析.
圖2 注塑件3個(gè)模次的關(guān)鍵傳感器高頻時(shí)序數(shù)據(jù)曲線圖Fig.2 Data curve of high frequency time sequence of key sensor for injection parts with three production cycles
點(diǎn)A到點(diǎn)B為初始化準(zhǔn)備階段,此時(shí)螺桿位置和模具內(nèi)壓力不變;點(diǎn)B到點(diǎn)C為注射填充階段,螺桿按照給定速度開始移動(dòng),熔體由噴嘴頭快速進(jìn)入澆口,因澆口處于封閉狀態(tài),熔體進(jìn)入模腔后開始充滿模腔,模腔內(nèi)壓力傳感器數(shù)值開始變動(dòng);點(diǎn)C到點(diǎn)D為保壓階段,螺桿以給定速度和壓力慢速移動(dòng),因塑料受模壁冷卻固化導(dǎo)致模腔內(nèi)阻力較大,材料密度持續(xù)增大,產(chǎn)品逐漸成型,模內(nèi)壓力在前半段呈現(xiàn)出曲線上升.當(dāng)保壓壓力到達(dá)最大設(shè)定壓力后,螺桿停止移動(dòng)直至保壓結(jié)束,模內(nèi)壓力開始呈現(xiàn)下降趨勢(shì);點(diǎn)D到點(diǎn)E為冷卻階段,隨著保壓階段結(jié)束,澆口附近的熔體逐漸冷卻固化,直到澆口全部封閉,注塑件冷卻成型,模腔壓力也下降至大氣壓,螺桿也退回至初始位置為下一個(gè)循環(huán)加工做好準(zhǔn)備.
圖中3個(gè)模次的尺寸分別為299.975、299.981、300.370 mm.分析3個(gè)模次的近澆口壓力變化趨勢(shì),其數(shù)值僅在保壓的前半段波動(dòng)較大,其余部分趨勢(shì)變化基本相同.模次2比模次1的尺寸大0.006 mm,因尺寸相差較小,兩模次的壓力曲線僅在保壓的前半段有較小的差異,其余部分的壓力曲線基本重合.模次3比模次1尺寸大0.395 mm,相較于模次1、2,尺寸相差較大,從填充到冷卻階段,模次3在保壓的前半段有數(shù)值波動(dòng),其余部分從尺寸差異的變化趨勢(shì)來(lái)看,模次3在模次1的基礎(chǔ)上產(chǎn)生一定數(shù)值的偏置,但制造過(guò)程的壓力曲線趨勢(shì)基本相同.分析同一時(shí)刻不同模次的傳感器數(shù)值,即傳感器高頻瞬時(shí)數(shù)據(jù),如:3個(gè)模次在20 s時(shí),尺寸差較小的模次數(shù)值相差小,尺寸差較大的模次數(shù)值相差大.同理,3個(gè)模次的實(shí)際螺桿位置差異如圖2所示,其數(shù)值差異也和注塑件尺寸密切相關(guān).
從上述分析可以看出關(guān)鍵傳感器高頻數(shù)據(jù)曲線的變化直觀反映出注塑件在注塑過(guò)程中熔體的變化狀態(tài),高頻瞬時(shí)數(shù)據(jù)的數(shù)值會(huì)影響到注塑件尺寸.注塑件成型過(guò)程數(shù)據(jù)與注塑件尺寸直接相關(guān),利用成型過(guò)程中的傳感器高頻數(shù)據(jù)和瞬時(shí)數(shù)據(jù)獲取特征,有利于評(píng)估注塑件尺寸的變化和波動(dòng)趨勢(shì).
注塑件在模腔成型的過(guò)程是從液體到固體轉(zhuǎn)變的過(guò)程,會(huì)有體積收縮變化,注塑件成型過(guò)程高度耦合,影響注塑件尺寸.從注塑模腔內(nèi)采集到的高頻時(shí)間序列數(shù)據(jù)也是耦合的,須從雙向來(lái)提取注塑過(guò)程特征.
隨著LSTM在時(shí)間序列中的廣泛應(yīng)用,LSTM網(wǎng)絡(luò)訓(xùn)練時(shí)間長(zhǎng)、內(nèi)部參數(shù)多的缺點(diǎn)亟待解決.Cho等[17]提出LSTM的變體即GRU模型,僅由更新門和重置門組成.GRU模型結(jié)合LSTM的優(yōu)點(diǎn),結(jié)構(gòu)更簡(jiǎn)單、參數(shù)更少、收斂性更好.BiGRU網(wǎng)絡(luò)能夠同時(shí)考慮過(guò)去和未來(lái)的信息,更加準(zhǔn)確地捕捉時(shí)序數(shù)據(jù)中的特征信息.本研究選取BiGRU模型來(lái)處理成型過(guò)程傳感器高頻時(shí)序數(shù)據(jù).BiGRU將相同的輸入序列分別連接成前向和后向2個(gè)GRU單元,然后將2個(gè)網(wǎng)絡(luò)的隱含層連接到輸出層進(jìn)行預(yù)測(cè)[18].2個(gè)隱層在每個(gè)時(shí)刻接收相同的輸入,但在方向上是相反的,這加強(qiáng)了時(shí)間序列前向和后向特征提取.BiGRU網(wǎng)絡(luò)的原理可以用以下等式來(lái)解釋:
式中:GRU函數(shù)為輸入時(shí)間序列數(shù)據(jù)的非線性變換,xt為t時(shí)刻的輸入,為t時(shí)刻前向隱藏狀態(tài)的輸出,為t時(shí)刻反向隱藏狀態(tài)的輸出,wt為t時(shí)刻前向隱藏狀態(tài)對(duì)應(yīng)的權(quán)重,vt為t時(shí)刻反向隱藏狀態(tài)對(duì)應(yīng)的權(quán)重,bt為t時(shí)刻BiGRU的2個(gè)隱藏狀態(tài)對(duì)應(yīng)的偏置.
Han等[19]指出多層網(wǎng)絡(luò)結(jié)構(gòu)對(duì)輸入信息具有更強(qiáng)的特征提取能力,隱藏層是用來(lái)處理層與層之間的關(guān)系,但隱含層過(guò)多會(huì)導(dǎo)致網(wǎng)絡(luò)計(jì)算量增大和訓(xùn)練時(shí)間長(zhǎng),還有可能導(dǎo)致過(guò)擬合和預(yù)測(cè)能力降低.由于單一隱層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)擬合能力強(qiáng),但對(duì)主要信息的特征提取能力較差,于志剛等[20]使用雙層GRU模型對(duì)輸入的時(shí)序信息進(jìn)行特征提取,并驗(yàn)證了雙層GRU模型的特征提取的能力優(yōu)于單層GRU結(jié)構(gòu).
為了提高模型對(duì)注塑過(guò)程傳感器高頻特征的提取能力和預(yù)測(cè)精度,綜合BiGRU和雙層網(wǎng)絡(luò)的特性,提出DL-BiGRU網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示.將傳感器高頻時(shí)序特征作為輸入,經(jīng)過(guò)第1層BiGRU網(wǎng)絡(luò)對(duì)時(shí)序數(shù)據(jù)進(jìn)行初步特征提取.因注塑過(guò)程中前后數(shù)據(jù)耦合較強(qiáng),選擇BiGRU網(wǎng)絡(luò)加強(qiáng)傳感器時(shí)序數(shù)據(jù)前后特征提取能力.為了彌補(bǔ)單一隱層對(duì)主要特征提取能力差的問(wèn)題,采用雙隱層結(jié)構(gòu),在第1層BiGRU網(wǎng)絡(luò)的基礎(chǔ)上再堆疊第2層BiGRU網(wǎng)絡(luò),對(duì)第1層輸出的特征進(jìn)行進(jìn)一步提取.
圖3 DL-BiGRU結(jié)構(gòu)Fig.3 DL-BiGRU structure
為了充分利用注塑件成型過(guò)程中的所有特征參數(shù),提出DL-BiGRU多特征融合尺寸預(yù)測(cè)模型,從傳感器感知數(shù)據(jù)中提煉成型機(jī)成型過(guò)程模腔內(nèi)的高頻時(shí)序特征、瞬時(shí)特征和成型機(jī)狀態(tài)特征,構(gòu)建多特征融合模型來(lái)預(yù)測(cè)注塑件尺寸.在注塑件成型過(guò)程中,高頻數(shù)據(jù)記錄熔體的成型過(guò)程,提煉成型過(guò)程高頻時(shí)序特征作為注塑件尺寸預(yù)測(cè)重要特征.傳感器高頻瞬時(shí)特征是指把一個(gè)周期內(nèi)采集的傳感器數(shù)值轉(zhuǎn)化為非序列特征.成型機(jī)狀態(tài)特征是指直接讀取每個(gè)模次的成型機(jī)上各傳感器的數(shù)據(jù).
如圖4所示為提出的基于DL-BiGRU多特征融合的注塑件尺寸預(yù)測(cè)模型,模型主要包含6個(gè)部分.
圖4 基于DL-BiGRU多特征融合的注塑件尺寸預(yù)測(cè)模型Fig.4 Dimension prediction model of injection molded part based on multi-feature fusion of DL-BiGRU
1)輸入層:包括傳感器高頻時(shí)序特征數(shù)據(jù)x、瞬時(shí)特征數(shù)據(jù)y和成型機(jī)狀態(tài)特征數(shù)據(jù)z.高頻時(shí)序特征數(shù)據(jù)是模腔內(nèi)采集的成型過(guò)程的高頻時(shí)序數(shù)據(jù),表征成型的過(guò)程變化特征.模腔成型過(guò)程瞬時(shí)狀態(tài)特征可以通過(guò)平均所有時(shí)序特征數(shù)據(jù)獲取,也可以通過(guò)采樣不同時(shí)刻數(shù)據(jù)進(jìn)行展成平鋪獲取.成型機(jī)狀態(tài)特征數(shù)據(jù)通過(guò)每個(gè)模次采樣一次直接獲取.注塑過(guò)程中高頻數(shù)據(jù)量大,為了減少模型訓(xùn)練的超參數(shù),對(duì)傳感器高頻時(shí)序數(shù)據(jù)和瞬時(shí)數(shù)據(jù)可以采用間隔采樣的操作以減少數(shù)據(jù)量.
2)時(shí)序處理層:將傳感器高頻數(shù)據(jù)按時(shí)間序列的順序輸入到第1層BiGRU網(wǎng)絡(luò)中進(jìn)行時(shí)序特征學(xué)習(xí),學(xué)習(xí)到的時(shí)序特征作為第2層BiGRU網(wǎng)絡(luò)的輸入,以便充分學(xué)習(xí)傳感器高頻數(shù)據(jù)的內(nèi)在時(shí)序特征.
3)單特征提取層:經(jīng)過(guò)DL-BiGRU網(wǎng)絡(luò)處理過(guò)的時(shí)序特征,通過(guò)全連接層hx進(jìn)一步訓(xùn)練,充分挖掘更抽象的特征.將傳感器的瞬時(shí)特征和成型機(jī)狀態(tài)特征分別連接到各自的全連接層(hy,hz)中以充分挖掘特征內(nèi)部的抽象特征.經(jīng)各自網(wǎng)絡(luò)提取3種輸入數(shù)據(jù)的特征,得到影響注塑件尺寸的表征特征.
4)多特征融合層:采用一個(gè)多特征融合層將3種類型的特征經(jīng)過(guò)各自網(wǎng)絡(luò)處理后輸出的表征特征拼接起來(lái),組成一個(gè)多特征融合的表征特征H,多特征融合的特征具體表達(dá)式如下:
5)多特征提取層:將多特征融合層中的所有特征連接一個(gè)全連接層,對(duì)融合的表征特征進(jìn)行深度特征提取,挖掘不同特征的關(guān)聯(lián)關(guān)系.
6)輸出層:多特征提取層的輸出經(jīng)過(guò)全連接回歸層的學(xué)習(xí)將特征維度降至1,完成注塑件尺寸預(yù)測(cè)結(jié)果的輸出.
為了驗(yàn)證所提方法的預(yù)測(cè)效果,采用注塑成型數(shù)據(jù)集進(jìn)行模型驗(yàn)證,將其分為訓(xùn)練集和測(cè)試集2部分,使用80%的數(shù)據(jù)(13 280個(gè)樣本)用于模型訓(xùn)練,其余的數(shù)據(jù)(3 320個(gè)樣本)用于測(cè)試.通過(guò)消融實(shí)驗(yàn)驗(yàn)證所提出模型網(wǎng)絡(luò)結(jié)構(gòu)對(duì)于提高模型預(yù)測(cè)精度的有效性,并繪制誤差箱型圖來(lái)評(píng)估模型的穩(wěn)定性.將所提方法與常用的一些產(chǎn)品尺寸預(yù)測(cè)方法以及同類文獻(xiàn)進(jìn)行對(duì)比,并使用相同的數(shù)據(jù)和指標(biāo)對(duì)模型進(jìn)行分析.
實(shí)驗(yàn)設(shè)置不同迭代次數(shù)(Epoch)、BiGRU層數(shù)量和全連接層(FC)的神經(jīng)元數(shù)量,在特定的范圍內(nèi)對(duì)模型進(jìn)行訓(xùn)練測(cè)試和結(jié)果分析對(duì)比.如表4所示為模型參數(shù)設(shè)置和效果優(yōu)化參數(shù)取值.
表4 實(shí)驗(yàn)?zāi)P蛥?shù)設(shè)置Tab.4 Parameters table of experimental model
模型采用Adam優(yōu)化方法計(jì)算每個(gè)參數(shù)的自適應(yīng)學(xué)習(xí)率,根據(jù)誤差梯度優(yōu)化每層的模型參數(shù).所提出的多特征融合深度學(xué)習(xí)框架是端到端可訓(xùn)練架構(gòu),所有模型參數(shù)可以被聯(lián)合訓(xùn)練.為了防止深度學(xué)習(xí)模型中的過(guò)擬合問(wèn)題,在全連接層后使用Dropout解決模型過(guò)擬合問(wèn)題,Dropout的概率設(shè)為0.5.預(yù)測(cè)注塑件尺寸和原始尺寸間的誤差,計(jì)算訓(xùn)練數(shù)據(jù)上的均方誤差損失函數(shù),并將其反向傳播以生成每層(如BiGRU層、全連接層)的誤差梯度.
注塑件尺寸預(yù)測(cè)是典型的回歸問(wèn)題,為了評(píng)估注塑件尺寸預(yù)測(cè)的性能,選用在回歸預(yù)測(cè)上廣泛使用的2個(gè)評(píng)估標(biāo)準(zhǔn),即均方誤差(MSE)和平均絕對(duì)誤差(MAE)作為評(píng)分函數(shù),對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)估,計(jì)算式如下:
為了評(píng)估所提出的DL-BiGRU和多特征融合模型的有效性,對(duì)所提出的模型結(jié)構(gòu)進(jìn)行消融研究.消融模型主要有以下幾種:使用單一種類特征預(yù)測(cè),包括成型機(jī)狀態(tài)特征和高頻傳感器時(shí)序特征;使用多特征融合模型預(yù)測(cè),包括傳感器高頻時(shí)序特征、瞬時(shí)特征(GP)和成型機(jī)狀態(tài)特征(SPC),分別使用原始的GRU、DL-GRU、BiGRU模型與所提出的模型進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)研究結(jié)果如表5所示.表中,F(xiàn)C、RG、DL分別表示全連接層、回歸層、雙層結(jié)構(gòu),MSE、MAE分別表示模型的均方誤差、平均絕對(duì)誤差.
表5 不同消融模型的預(yù)測(cè)誤差Tab.5 Prediction error of different ablation models
以表5中的size1為例,MSE作為評(píng)分函數(shù),雙層GRU、BiGRU和DL-BiGRU多特征融合模型比原始的GRU模型的MSE分別降低了9.69%、8.78%、13.7%,優(yōu)于原始的GRU模型.上述結(jié)果表明雙層和雙向網(wǎng)絡(luò)的預(yù)測(cè)效果要比單層網(wǎng)絡(luò)、單向網(wǎng)絡(luò)的預(yù)測(cè)效果更優(yōu).另外,DL-BiGRU多特征融合模型比單獨(dú)使用成型機(jī)狀態(tài)數(shù)據(jù)和傳感器高頻時(shí)序數(shù)據(jù)預(yù)測(cè)模型的MSE分別降低了56.7%、63.8%.表明使用多特征融合模型預(yù)測(cè)性能提升明顯,具有更高的預(yù)測(cè)精度.通過(guò)消融實(shí)驗(yàn),證實(shí)了所提出模型能夠充分學(xué)習(xí)傳感器高頻時(shí)序特征、瞬時(shí)特征和成型機(jī)狀態(tài)特征,在真實(shí)注塑生產(chǎn)數(shù)據(jù)集上的預(yù)測(cè)精度和效果方面比同類消融模型更佳.
深度學(xué)習(xí)模型通常須進(jìn)行穩(wěn)定性測(cè)試,為了驗(yàn)證所提出DL-BiGRU多特征融合模型的穩(wěn)定性,對(duì)消融模型進(jìn)行多次訓(xùn)練和測(cè)試,并繪制消融模型的誤差箱型圖,如圖5所示.以size1為例,所提出的DL-BiGRU模型預(yù)測(cè)結(jié)果的MSE誤差波動(dòng)范圍為1.7×10-5mm2,為10-5mm2量級(jí).所提出模型的誤差波動(dòng)比GRU、DL-GRU和BiGRU分別降低了92.5%、92.4%、92.1%.由上述分析可得,所提出的模型具有更小的誤差波動(dòng)和更高的穩(wěn)定性.
圖5 不同消融模型的誤差箱型圖Fig.5 Error boxplots for different ablation models
為了驗(yàn)證所提出模型在注塑件尺寸預(yù)測(cè)上的效果,將所提出方法和常用的尺寸預(yù)測(cè)方法如淺層學(xué)習(xí)(SVR、XGB、LGB)、深度學(xué)習(xí)(MLP、LSTM、GRU)進(jìn)行對(duì)比,如表6所示為上述方法在注塑成型數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果.表中,IMP為所提出模型相對(duì)于次優(yōu)模型的相對(duì)提升效果.
表6 常用尺寸預(yù)測(cè)模型和DL-BiGRU模型的預(yù)測(cè)誤差對(duì)比Tab.6 Comparison of prediction errors between commonly used dimension prediction models and DL-BiGRU models
以MSE為評(píng)估標(biāo)準(zhǔn)對(duì)所提出模型和對(duì)比模型在3個(gè)尺寸的預(yù)測(cè)結(jié)果進(jìn)行分析.在淺層學(xué)習(xí)的3個(gè)預(yù)測(cè)模型中,XGB模型在3個(gè)尺寸中的預(yù)測(cè)效果均為最優(yōu),所提出模型比XGB模型的MSE分別降低64.7%、42.1%、44.9%.在深度學(xué)習(xí)的3個(gè)預(yù)測(cè)模型中,MLP模型在size1和size2中預(yù)測(cè)效果最優(yōu),所提出模型比MLP模型的MSE分別降低57.7%、44.9%;GRU模型在size3中預(yù)測(cè)效果最優(yōu),所提出模型比GRU模型的MSE降低49.6%.所提出模型在3個(gè)尺寸上的平均均方誤差為4.7×10-4mm2,預(yù)測(cè)性能比次優(yōu)模型分別提升57.7%、42.1%、44.9%,預(yù)測(cè)效果提升明顯.
所提出模型的預(yù)測(cè)結(jié)果如圖6所示.圖中,D為產(chǎn)品尺寸,藍(lán)線為產(chǎn)品真實(shí)尺寸,紅線為產(chǎn)品預(yù)測(cè)尺寸.在2條紅虛線之間的尺寸為合格品,在2條紅虛線之外的尺寸為不合格品.由圖6可知,模型的預(yù)測(cè)尺寸與實(shí)際尺寸分布趨勢(shì)相近.對(duì)比使用相同數(shù)據(jù)集文獻(xiàn)方法的預(yù)測(cè)效果,本研究比文獻(xiàn)[8]在MAE上降低了58.9%.并且,當(dāng)注塑件尺寸變化較大時(shí),所提出模型對(duì)尺寸的預(yù)測(cè)更加敏感和準(zhǔn)確,在預(yù)測(cè)趨勢(shì)上提升明顯.因?qū)Ρ任墨I(xiàn)僅使用高頻數(shù)據(jù)的統(tǒng)計(jì)特征和成型機(jī)狀態(tài)特征,并對(duì)淺層學(xué)習(xí)的3種模型進(jìn)行集成,未深度挖掘高頻數(shù)據(jù)間的關(guān)聯(lián)關(guān)系.本研究采用DL-Bi-GRU網(wǎng)絡(luò)學(xué)習(xí)傳感器高頻特征,并結(jié)合傳感器瞬時(shí)特征和成型機(jī)狀態(tài)特征構(gòu)建多特征融合的深度學(xué)習(xí)模型,實(shí)驗(yàn)結(jié)果表明所提出模型的預(yù)測(cè)精度優(yōu)于上述對(duì)比模型.
圖6 注塑成型數(shù)據(jù)集中DL-BiGRU模型的預(yù)測(cè)值與真實(shí)值效果對(duì)比圖Fig.6 Comparison graph of predicted values and ground truth in injection molding dataset using DL-BiGRU model
針對(duì)注塑件尺寸預(yù)測(cè)問(wèn)題,提出基于注塑過(guò)程數(shù)據(jù)的DL-BiGRU多特征融合深度學(xué)習(xí)尺寸預(yù)測(cè)模型.通過(guò)實(shí)驗(yàn)研究和對(duì)比分析發(fā)現(xiàn)模型具有更高的預(yù)測(cè)精度和穩(wěn)定性,對(duì)尺寸超差情況的預(yù)測(cè)更加敏感和準(zhǔn)確,為注塑件尺寸及質(zhì)量預(yù)測(cè)提供了啟發(fā)并具備一定的工程應(yīng)用價(jià)值.主要結(jié)論如下.
(1)分析注塑件制造過(guò)程中傳感器高頻時(shí)序特征和瞬時(shí)特征用于注塑件尺寸預(yù)測(cè)的可行性.為了充分考慮傳感器高頻時(shí)序特征和瞬時(shí)特征對(duì)注塑件尺寸的影響,提出用DL-BiGRU網(wǎng)絡(luò)從模腔內(nèi)采集到的高頻時(shí)序數(shù)據(jù)中自動(dòng)提取時(shí)序特征,將傳感器高頻瞬時(shí)特征和成型機(jī)狀態(tài)特征作為補(bǔ)充特征,提升模型預(yù)測(cè)效果.
(2)提出多特征融合的深度學(xué)習(xí)注塑件尺寸預(yù)測(cè)模型,并通過(guò)消融研究驗(yàn)證模型的有效性和穩(wěn)定性.所提模型比單獨(dú)使用成型機(jī)狀態(tài)數(shù)據(jù)和傳感器高頻時(shí)序數(shù)據(jù)預(yù)測(cè)模型的MSE分別降低56.7%、63.8%;所提模型的誤差波動(dòng)MSE范圍為1.7×10-5mm2,為10-5mm2量級(jí),誤差波動(dòng)比GRU、DL-GRU和BiGRU模型分別降低92.5%、92.4%、92.1%.結(jié)果表明,所提方法的性能提升明顯,具有更高的預(yù)測(cè)精度和穩(wěn)定性.
(3)將所提方法和常用的一些尺寸預(yù)測(cè)方法進(jìn)行比較分析,所提模型在3個(gè)尺寸上的平均均方誤差為4.7×10-4mm2,預(yù)測(cè)性能比次優(yōu)模型的分別提升57.7%、42.1%、44.9%,比對(duì)比文獻(xiàn)在MAE上降低58.9%;當(dāng)注塑件尺寸變化較大時(shí),所提模型對(duì)尺寸的預(yù)測(cè)更加敏感和準(zhǔn)確,在預(yù)測(cè)趨勢(shì)上提升明顯.
深度學(xué)習(xí)往往需要足夠數(shù)量的樣本用于模型的訓(xùn)練,在多品種小批量生產(chǎn)背景下很多生產(chǎn)訂單的數(shù)量無(wú)法滿足模型訓(xùn)練要求.本研究為下一步小樣本注塑件尺寸預(yù)測(cè)提供基礎(chǔ)模型,以后可以嘗試將本數(shù)據(jù)集作為遷移學(xué)習(xí)的源域,研究基于遷移學(xué)習(xí)的小樣本數(shù)據(jù)注塑件尺寸預(yù)測(cè)方法.