周可杰 吳豐順 楊卓坪 周龍早
(華中科技大學材料科學與工程學院 材料加工與模具技術國家重點實驗室,湖北 武漢 430074)高團芬
(華宇華源電子科技(深圳)有限公司,廣東 深圳 518118)
在多層印制板(MPB)的制造過程中,由于銅箔、環(huán)氧樹脂、玻璃纖維布的膨脹系數(shù)的各不相同,以及MPB的排版結構、補償方式、壓板工藝參數(shù)、開料方式等多種因素的作用,導致在層壓過程中內(nèi)應力的平衡被破壞,基材出現(xiàn)收縮變形,造成基材上的內(nèi)層線路圖形失真。為此,需要設置合理的補償系數(shù)以實現(xiàn)對圖形轉移媒介照相底版的預放大,從而實現(xiàn)對板料收縮引起的圖形失真量的補償。
PCB傳統(tǒng)的修改照相底版漲縮系數(shù)的做法有基于經(jīng)驗的方法[1]、數(shù)值計算方法[2][3]和統(tǒng)計學方法[2][4]。汕頭超聲印制板公司的朱秀峰[1]簡要歸納了影響印制電路板尺寸漲縮的因素,并通過人工填寫的照相底版漲縮系數(shù)表來指導生產(chǎn)。鄧丹[2][3]等人提出了采用數(shù)值計算的方法對照相底板補償系數(shù)進行計算,得到了其數(shù)值計算公式。任小浪[5]等人采用微分的方法對漲縮進行數(shù)理分析,對漲縮數(shù)據(jù)進行了微分計算。隨著PCB制程對尺寸精度及對位精度的要求的提高,影響因素將會隨之增多[6],上述計算照相底板漲縮補償系數(shù)的方法更是難以適應。目前,PCB企業(yè)完備的信息管理系統(tǒng)詳細記錄了生產(chǎn)過程中“人、機、物、法、環(huán)”等方面大量的生產(chǎn)數(shù)據(jù),有較好的信息化基礎,但由于從業(yè)人員精力有限,無法對數(shù)據(jù)進行細致的數(shù)據(jù)清洗和分析,導致企業(yè)陷入了“數(shù)據(jù)爆炸,有效利用匱乏”的困境[7]。機器學習算法的興起,將從海量數(shù)據(jù)集中積累經(jīng)驗的任務交給了計算機。因此,設計高效準確的補償系數(shù)預測算法,對降低報廢率,減少生產(chǎn)成本,幫助PCB企業(yè)實現(xiàn)技術升級具有重要意義[8][9]。
影響PCB漲縮的魚骨圖如圖1所示,其中對PCB漲縮影響較大的因素主要有PCB板結構、材料,以及生產(chǎn)工藝(見圖1所示)。
生產(chǎn)新型號產(chǎn)品時,負責照相底版漲縮控制的工程師根據(jù)新型號產(chǎn)品的結構與工藝,查詢補償系數(shù)表,根據(jù)經(jīng)驗確定相應的補償系數(shù)值,按照流程進行小批量的生產(chǎn),通過X-Ray對PCB的靶位孔或鉚釘打靶,判斷靶距是否超出工藝標準范圍,若超出了范圍,則需要將照相底版系數(shù)進行回調(diào),適當?shù)姆糯蠡蛘呖s小照相底版漲縮系數(shù)。照相底版漲縮補償系數(shù)采用式(1)來表示預測。
式中,為初始預估補償系數(shù),通過人工經(jīng)驗值確定,主要受芯板厚度,銅厚,層數(shù)等PCB結構與工藝特征影響;為板材漲縮修正量,是X-Ray鉆靶機測量的數(shù)據(jù);y為實際投產(chǎn)采用的補償系數(shù)。
實際生產(chǎn)中,需要對照相底版的預測公式(1)改進,引入修正經(jīng)驗系數(shù),該系數(shù)取值需要根據(jù)工廠生產(chǎn)條件取值,取值范圍為0.6~0.7,得到補償系數(shù)常用公式(2)。
將照相底版漲縮系數(shù)預測問題,分解為對PCB生產(chǎn)條件的初始預估補償系數(shù)的r與漲縮修正量兩個關鍵系數(shù)進行建模求解。算法的設計思路示意圖如圖2所示。
圖1 PCB漲縮影響因素魚骨圖
圖2 算法的設計思路示意圖
針對初始預估補償系數(shù)預測模型,其建模步驟為將現(xiàn)有的數(shù)據(jù)集進行清洗與整理,采用多種機器學習算法進行訓練,將均方誤差(MSE)作為評價指標,評價模型的預測準確率與訓練時間,選取合適的算法模型。再通過漲縮量修正模型,結合實際板料的漲縮量,對預估補償系數(shù)預測模型的預測結果進行修正。
根據(jù)已有的數(shù)據(jù)集,本文采用了5種機器學習常用預測方法,包括線性回歸,多元線性回歸(MLR),支持向量回歸(SVR),神經(jīng)網(wǎng)絡(NN),以及基于梯度提升決策樹(GBDT)的LightGBM,分別構建機器學習模型,然后對比各模型的準確率,選擇合適的模型,預測指標補償系數(shù)值為數(shù)值類型,采用式(3)的均方誤差(MSE)作為模型的評價指標。
數(shù)據(jù)處理與特征工程是機器學習建模中必不可少的步驟,由于計算機內(nèi)存與效率的限制,對數(shù)據(jù)進行全量分析不可能實現(xiàn),也沒有必要,因此需要先在生產(chǎn)小數(shù)據(jù)集上進行數(shù)據(jù)處理,并進行模型訓練,再推廣到全量數(shù)據(jù)進行驗證維護。
照相底版漲縮系數(shù)的數(shù)據(jù)集主要為預估補償系數(shù)數(shù)據(jù)集與漲縮量數(shù)據(jù)集,其中預估補償系數(shù)數(shù)據(jù)集來自企業(yè)的ERP(企業(yè)資源規(guī)劃)數(shù)據(jù)庫或企業(yè)相關文檔。漲縮量數(shù)據(jù)集來自打靶機,打靶機中保存的數(shù)據(jù)集記錄的是板料長短邊的實際漲縮量,對應式(2)中的漲縮修正量,實際上受到多因素影響,可將分解為其中包括板料種類帶來的產(chǎn)品穩(wěn)定性漲縮,季節(jié)因素帶來的生產(chǎn)實際漲縮,以及其他多種因素帶來的偏差。
將實際生產(chǎn)過程中,企業(yè)的ERP系統(tǒng)中保存有各批次的PCB的生產(chǎn)資料,包含每批產(chǎn)品的生產(chǎn)時間、板料種類、銅厚、芯板厚度、壓合板厚、經(jīng)緯向、層壓參數(shù)等多種參數(shù)。設計合適的數(shù)據(jù)抽取接口,從ERP數(shù)據(jù)庫獲取數(shù)據(jù),形成數(shù)據(jù)集并整合建模。(設計合適的數(shù)據(jù)抽取接口,將實際生產(chǎn)過程中,企業(yè)的ERP系統(tǒng)中保存有各批次的PCB板的生產(chǎn)資料,包含每批產(chǎn)品的生產(chǎn)時間、板料種類、銅厚、芯板厚度、壓合板厚、經(jīng)緯向、層壓參數(shù)等多種參數(shù)提取形成數(shù)據(jù)集并整合建模。)
將數(shù)據(jù)集DataA1與DataB1進行數(shù)據(jù)分析后,對異常值與空缺值進行數(shù)據(jù)預處理和填充,并采用數(shù)據(jù)標準化處理,加快模型收斂,提升模型精度,得到可以直接用于建模的數(shù)據(jù)集DataA2與DataB2。其中,標準化公式如式(4)。
x*為標準化前的樣本數(shù)據(jù),x*為標準化后的樣本數(shù)據(jù),為樣本均值,σ為樣本標準差。
將預處理后的預估補償系數(shù)數(shù)據(jù)集DataA2和DataB2進行建模分析,對比多元線性回歸、多項式回歸、支持向量回歸、神經(jīng)網(wǎng)絡和LightGBM五種機器學習模型,采用十折交叉驗證的方式驗證模型,設置損失函數(shù)為均方誤差(MSE),比較各模型的預測準確率、穩(wěn)定性與泛化能力。
將DataA2和DataB2數(shù)據(jù)集劃分為訓練集與預測集,在訓練集上將模型進行訓練,分別得到相應的預測模型,將各預測模型根據(jù)式(2)線性組合,可得到最終的預測補償系數(shù)的模型。
打靶機中記錄的數(shù)據(jù)集包含板料漲縮的時間序列,當某型號的PCB結構、工藝參數(shù)確定時,該數(shù)據(jù)可以反映板料生產(chǎn)過程中的季節(jié)漲縮規(guī)律,因此以板料季節(jié)性漲縮的影響為實例,按照圖2的算法建模流程進行建模。
表1為從照相底版漲縮系數(shù)表收集的初始預估數(shù)據(jù)集,數(shù)據(jù)樣本構成的初始預估補償系數(shù)預測數(shù)據(jù)集DataA1共3200組,特征參量具體為:芯板厚度、層數(shù)、銅厚、板料種類、經(jīng)緯向、銅層圖形,共計六個關鍵的特征參數(shù)。
表1 照相底版漲縮系數(shù)預估數(shù)據(jù)
將數(shù)據(jù)集DataA1進行數(shù)據(jù)處理與特征工程后,得到建模數(shù)據(jù)集DataA2。以DataA2建模為例,分析圖3為各模型訓練集與驗證集的均方誤差對比圖。LightGBM在預測集與訓練集上的性能最優(yōu)異,其均方誤差均小于其他模型,其性能顯著強于其他模型。
圖3 各模型均方誤差
將預測準確率作為模型的評價指標,其結果如圖4所示。LightGBM模型與線性回歸模型相比,其準確率提升將近20%,在照相底版漲縮系數(shù)預測問題上有著巨大的潛力。
圖4 各模型準確率
在實際工業(yè)項目中,由于工業(yè)數(shù)據(jù)集數(shù)據(jù)量巨大,因此模型的選取不僅考慮預測準確率的影響,還需要綜合考慮訓練的時間成本。因將數(shù)據(jù)集進行擴充,將數(shù)據(jù)集擴充到50 000行,對模型訓練進行壓力測試,模擬實際生產(chǎn)過程中可能存在的情況。同樣采用五折交叉驗證的方法,對數(shù)據(jù)集進行建模分析,得到各模型訓練時間表如表2所示。
表2 各模型建?;ㄙM時間表
線性回歸模型建模快速,但是在預測過程中,擬合效果較差,準確率較低。而準確率較高的支持向量回歸模型與多項式回歸模型時間成本較高,尤其是支持向量回歸SVR,無法適應大數(shù)據(jù)的處理過程。因此綜合考慮,最終預測模型選擇為基于GBDT的LightGBM模型。
將初始預估補償系數(shù)數(shù)據(jù)集在訓練集上將數(shù)據(jù)進行訓練,采用基于交叉驗證的GridSearchCV的網(wǎng)格搜索的方法對模型進行確定最優(yōu)化超參數(shù),預估補償系數(shù)預測模型ModelA。
算法建模的過程中,對數(shù)據(jù)集的分析與理解可以決定模型預測的上限。機器學習照相底版漲縮系數(shù)預測過程中,對數(shù)據(jù)集的數(shù)據(jù)分析同樣能夠給企業(yè)生產(chǎn)提供指導意見。而通過季節(jié)漲縮模型來優(yōu)化預測結果,更多的是對根據(jù)漲縮數(shù)據(jù)表確定的結果進行“補救”,因此需要企業(yè)優(yōu)化生產(chǎn)工藝,盡可能減少季節(jié)修正模型的補償需求。通過對季節(jié)漲縮數(shù)據(jù)集進行數(shù)據(jù)分析,有助于理解季節(jié)漲縮機器學習模型,幫助企業(yè)工程師更好管理生產(chǎn)流程。設計程序將X-Ray打靶機中保存的csv格式的數(shù)據(jù)進行收集整理,刪除數(shù)據(jù)集中大部分的無用數(shù)據(jù),得到如表3所示的3165組板材長短邊漲縮量數(shù)據(jù)集DataB1。
表3 X-Ray打靶機實測漲縮量數(shù)據(jù)
對于季節(jié)漲縮數(shù)據(jù)集DataB1中,在打靶機中保存的數(shù)據(jù)為板料實際打靶靶距,根據(jù)公式(5),計算其長短邊的超差比例,得到該板料的長短邊的實際漲縮修正量
對數(shù)據(jù)集進行可視化分析,圖5為產(chǎn)品X在半年的時間段內(nèi)漲縮變化箱式圖,圖6為產(chǎn)品X在半年內(nèi)的漲縮方差變化柱狀圖。
根據(jù)箱式圖與柱狀圖,該型號的產(chǎn)品X總體漲縮量穩(wěn)定性較好,且漲縮系數(shù)選擇準確,基本未出現(xiàn)明顯的偏差。但是從圖6的方差分析上可以看出,該產(chǎn)品在短邊的穩(wěn)定性明顯差于長邊,其短邊的漲縮量的平均方差水平比長邊高出0.259。而在季節(jié)性的周期波動中,冬季與夏季的尺寸波動性相對較大,漲縮量處于+1.52的水準,可以適當?shù)卣{(diào)小照相底版漲縮系數(shù)來對下一次生產(chǎn)進行補償。因此該型號的PCB總體穩(wěn)定性較好,但是也需要關注短邊的生產(chǎn)情況,以及在夏季與冬季需要適當對漲縮系數(shù)進行補償。
企業(yè)對該板料,應在冬季與夏季時注意生產(chǎn)儲存環(huán)境的監(jiān)測,盡可能保證尺寸的穩(wěn)定性。而若存在四季穩(wěn)定性都較差的板料時,需要考慮更換板料生產(chǎn)廠家,提高產(chǎn)品穩(wěn)定性。
完成對數(shù)據(jù)集的數(shù)據(jù)分析后,將數(shù)據(jù)集中的缺失數(shù)據(jù)填充,刪除異常點,再進行標準化處理,得到可以直接用于建模的漲縮修正數(shù)據(jù)集DataB2。
將修正數(shù)據(jù)集DataB2按照時間序列的預測方法劃分為訓練集與數(shù)據(jù)集,將實測漲縮量作為修正模型的預測目標,同樣采用LightGBM的回歸算法,訓練并優(yōu)化模型,得到機器學習漲縮量修正模型ModelB。
圖5 某種板料的季節(jié)漲縮箱型圖
圖6 某種板料的長短邊漲縮方差柱狀圖
將獲得的模型部署為可執(zhí)行的預測軟件,模型ModelA為照相底版漲縮系數(shù)預測模型,模型ModelB漲縮量修正模型,根據(jù)式(2)將模型ModelA與ModelB進行線性組合,得到最終的預測模型,并將數(shù)據(jù)的預處理與特征工程算法寫入軟件。
圖7為開發(fā)的照相底版漲縮系數(shù)預測界面,當有新的預測的需求時,將數(shù)據(jù)填入圖8的圖形界面中,程序將對輸入的數(shù)據(jù)同樣采用合適的處理方法,將其輸入模型中,機器學習模型將根據(jù)輸入的數(shù)據(jù)進行預測,并將結果進行輸出,輸出結果將在界面上顯示。經(jīng)驗證,模型能夠穩(wěn)定運行,算法預測結果準確,可以提供生產(chǎn)指導意義。
圖7 封裝的照相底版漲縮預測軟件界面
圖8 封裝的數(shù)據(jù)輸入界面
基于機器學習算法的PCB照相底版補償系數(shù)漲縮預測系統(tǒng),與現(xiàn)有的人工的漲縮系數(shù)預測方法相比更為高效準確。模型采用的LightGBM的機器學習算法,建立PCB照相底版漲縮系數(shù)預測模型。再以季節(jié)漲縮為例,對打靶機數(shù)據(jù)集進行分析建模,得到最終的預測模型。通過對機器學習方法對數(shù)據(jù)集的分析,可以優(yōu)化企業(yè)對生產(chǎn)條件的管控,進一步減少由于環(huán)境帶來的PCB報廢的成本損失。企業(yè)可以憑借搭建完備的數(shù)據(jù)分析平臺與預測系統(tǒng),發(fā)揮PCB制造企業(yè)特有的數(shù)據(jù)優(yōu)勢,加速企業(yè)信息化轉型。