胡敏
中船第九設(shè)計(jì)研究院工程有限公司 上海 200090
加快船舶制造智能化升級(jí),為智能制造在我國(guó)船舶工業(yè)的深化發(fā)展提供有力支撐,實(shí)現(xiàn)船舶精益生產(chǎn),是國(guó)內(nèi)船舶企業(yè)的共同目標(biāo)[1]。當(dāng)前,在我國(guó)船舶管件加工制造行業(yè)中已經(jīng)引入了數(shù)字化制造協(xié)同管理技術(shù),其能夠?qū)㈨?xiàng)目管理、計(jì)劃管理、物料管理、生產(chǎn)準(zhǔn)備、作業(yè)管理、質(zhì)量管理、系統(tǒng)管理等集成為一體化管理平臺(tái),為船舶管件的加工制造過程提供系統(tǒng)化管理服務(wù)。然而,船舶行業(yè)受市場(chǎng)周期性波動(dòng)和勞務(wù)成本增加的影響,工種的穩(wěn)定性有所下降,部分工種甚至出現(xiàn)短缺[2];與此同時(shí),行業(yè)的發(fā)展與擴(kuò)張又使得生產(chǎn)部門面臨著巨大的生產(chǎn)壓力。因此如何高效地利用現(xiàn)有的資源與生產(chǎn)條件來(lái)最大化地提高生產(chǎn)效率是船舶管件加工生產(chǎn)行業(yè)的共同難點(diǎn)問題[3]。
智能化派工系統(tǒng)在一些行業(yè)已經(jīng)得到了運(yùn)用,比如電力行業(yè),但是船舶行業(yè)還在探索中[4]。本文設(shè)計(jì)一種適用于船舶加工行業(yè)的智能化派工系統(tǒng)。基于船舶管件加工制造行業(yè)現(xiàn)有的數(shù)字化制造協(xié)同管理平臺(tái),本文研究開發(fā)了基于機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)算法的智能化派工系統(tǒng)。該系統(tǒng)是基于生產(chǎn)部門的最大產(chǎn)能、車間效率,以及管件特征,將需要加工生產(chǎn)的管件任務(wù)自動(dòng)推薦派送給相應(yīng)的部門。該系統(tǒng)的建立過程可分為以下三步:第一步,利用過去船舶管件加工生產(chǎn)的各部門各車間產(chǎn)能數(shù)據(jù),以及相應(yīng)的設(shè)備信息結(jié)合機(jī)器學(xué)習(xí),使模型學(xué)習(xí)到各部門各車間的產(chǎn)能邊界。其次建立強(qiáng)化學(xué)習(xí)模型,結(jié)合產(chǎn)能邊界條件值、管件特征、各部門車間當(dāng)前正在進(jìn)行的作業(yè)狀態(tài)等信息建立強(qiáng)化學(xué)習(xí)模型。第三步,實(shí)現(xiàn)智能派工。根據(jù)當(dāng)前環(huán)境的變化,做出相應(yīng)變化的動(dòng)態(tài)學(xué)習(xí)模型,智能推薦最佳的派工任務(wù)。
本文根據(jù)船廠管件加工制造流程以及任務(wù)派工特點(diǎn),通過在原有的數(shù)字化制造協(xié)同管理平臺(tái)的基礎(chǔ)之上添加智能化派工系統(tǒng)模塊。該模塊能夠通過機(jī)器學(xué)習(xí)算法對(duì)過去車間生產(chǎn)數(shù)據(jù)進(jìn)行學(xué)習(xí)得到各個(gè)車間的產(chǎn)能邊界,結(jié)合當(dāng)前生產(chǎn)狀態(tài),以及過去生產(chǎn)加工的管件信息等數(shù)據(jù)進(jìn)行強(qiáng)化學(xué)習(xí)模型的訓(xùn)練,最終在輸入待生產(chǎn)加工的管件信息后,該智能化派工系統(tǒng)能夠結(jié)合數(shù)字化制造協(xié)同管理平臺(tái)中各車間的當(dāng)前生產(chǎn)狀態(tài)自動(dòng)將新的待生產(chǎn)加工任務(wù)派發(fā)到特定的生產(chǎn)車間,以此能夠保證各車間生產(chǎn)加工任務(wù)的最優(yōu)效率。該系統(tǒng)框架圖1所示:
圖1 船舶管件智能派工系統(tǒng)總體設(shè)計(jì)
現(xiàn)有的生產(chǎn)管控系統(tǒng)數(shù)據(jù)直接獲取當(dāng)前各部門的生產(chǎn)狀態(tài)數(shù)據(jù),以及待加工生產(chǎn)的任務(wù)信息數(shù)據(jù),提取派工模型所涉及的變量,主要包括兩類:第一類是各部門的作業(yè)狀態(tài)信息、第二類是系統(tǒng)已派發(fā)任務(wù)信息。部分變量如下:
表1 變量信息表
為了獲取現(xiàn)有的船舶各車間生產(chǎn)狀態(tài)的規(guī)律,本文運(yùn)用機(jī)器學(xué)習(xí)模型,學(xué)習(xí)生產(chǎn)的規(guī)律,并確定產(chǎn)能邊界。在機(jī)器學(xué)習(xí)中,有很多涉及監(jiān)督學(xué)習(xí)的算法,本文選擇了4種算法,其中自適應(yīng)增強(qiáng)學(xué)習(xí)算法[5]是集成算法boosting的典型代表,而隨機(jī)森林[6]算法則是集成算法bagging的典型代表,其次還有以傳統(tǒng)統(tǒng)計(jì)學(xué)為基礎(chǔ)的邏輯斯蒂回歸。這4種算法都適合于做分類算法,但在不用的類型的樣本數(shù)據(jù)和不同行業(yè)中,由于樣本的分布有很大差異,因此這4種算法的表現(xiàn)效果上總有差異。
以管件生產(chǎn)為例。本文選擇隨機(jī)森林進(jìn)行生產(chǎn)特征重要度計(jì)算。其主要思想為利用每個(gè)特征在隨機(jī)森林中的每棵樹上所做貢獻(xiàn)的平均值進(jìn)行對(duì)比,計(jì)算方法為利用平均不純度的減少,測(cè)量方式為計(jì)算分支前某一節(jié)點(diǎn)與分支后兩個(gè)節(jié)點(diǎn)gini指數(shù)的變化量。例如選擇為“管型”、“管線”、“品名”、“規(guī)格”、“校管”、“焊接”、“表面處理”、“上架”等八個(gè)特征進(jìn)行重要度計(jì)算,同時(shí)可以使用其他選擇或是車間構(gòu)造新的特征組合進(jìn)行計(jì)算。結(jié)果如圖2。
圖2 船舶管件生產(chǎn)環(huán)節(jié)重要度排序圖
船舶生產(chǎn)系統(tǒng)的生產(chǎn)數(shù)據(jù)量巨大,憑經(jīng)驗(yàn)很難高效地派工。本文強(qiáng)化學(xué)習(xí)的任務(wù)可以用馬爾科夫決策過程(Markov Decision Process,MDP)來(lái)描述,機(jī)器處于環(huán)境E中,狀態(tài)空間為X,其中每個(gè)狀態(tài) 是機(jī)器感知到的環(huán)境的描述,如在車間生產(chǎn)任務(wù)上這就是當(dāng)前生產(chǎn)狀態(tài)的描述;模型能采取的動(dòng)作構(gòu)成了動(dòng)作空間A,如生產(chǎn)過程中有多種管件加工工藝類型、不同時(shí)間段的多個(gè)加工任務(wù)等多種可供選擇的動(dòng)作;若某個(gè)動(dòng)作 作用在當(dāng)前狀態(tài)x上,則潛在的轉(zhuǎn)移函數(shù)P將使得環(huán)境從當(dāng)前狀態(tài)按某種概率轉(zhuǎn)移到另一個(gè)狀態(tài)。如有兩個(gè)加工任務(wù),一個(gè)是要求在3天后交貨,一個(gè)是要求在10天后交貨,若選擇動(dòng)作是3天后交貨的加工任務(wù),則生10天后交貨的生產(chǎn)任務(wù)有2種可能,一種是逾期交貨,一種的如期交貨;在轉(zhuǎn)移到另一個(gè)狀態(tài)的同時(shí),環(huán)境會(huì)根據(jù)潛在的“獎(jiǎng)賞”(reward)函數(shù)R反饋給模型一個(gè)獎(jiǎng)賞,如保證一個(gè)任務(wù)都如期交貨則+1,兩個(gè)生產(chǎn)任務(wù)都逾期則-10,最終兩個(gè)任務(wù)都如期交貨+100。綜合起來(lái),強(qiáng)化學(xué)習(xí)任務(wù)對(duì)應(yīng)了四元組 ,其中 指定了狀態(tài)轉(zhuǎn)移概率。 指定了獎(jiǎng)賞[7]。
令 表示從狀態(tài)x出發(fā)使用策略 作所帶來(lái)累積獎(jiǎng)賞;函數(shù) 表示從狀態(tài)x出發(fā),執(zhí)行動(dòng)作 后再使用策略 所帶來(lái)的累積獎(jiǎng)賞。由累積獎(jiǎng)賞的定義,有狀態(tài)值函數(shù):
表示起始狀態(tài), 表示起始狀態(tài)上采取的第一個(gè)動(dòng)作;對(duì)于T步累積獎(jiǎng)賞,用下標(biāo)t表示后續(xù)執(zhí)行的步數(shù)。我們有狀態(tài)動(dòng)作值函數(shù):
由于MDP具有馬爾可夫性質(zhì),即系統(tǒng)下一時(shí)刻的狀態(tài)僅由當(dāng)前時(shí)刻的狀態(tài)決定,不依賴于以往任何狀態(tài),于是值函數(shù)有很簡(jiǎn)單的遞歸形式。對(duì)于T步累積獎(jiǎng)賞有:
類似的,對(duì)于折扣累積獎(jiǎng)賞有:
綜上,我們根據(jù)最終的策略函數(shù)作為最優(yōu)化求解,就可以建立一個(gè)基于馬爾科夫決策的強(qiáng)化學(xué)習(xí)模型,對(duì)與不同狀態(tài)下船舶生產(chǎn)部門通過對(duì)過去數(shù)據(jù)的學(xué)習(xí)就可以得到一個(gè)產(chǎn)能邊界信息數(shù)據(jù)。具體部門的工作情況及產(chǎn)能邊界信息展示如熱力圖,圖3所示(因保密要求隱去具體派工數(shù)據(jù)):
圖3 2020年管加二部作業(yè)對(duì)派工計(jì)劃表
船舶管件智能派工系統(tǒng)設(shè)計(jì)時(shí)采用msSQL 2016作為數(shù)據(jù)庫(kù)服務(wù)器,并使用ABP開發(fā)框架進(jìn)行服務(wù)端開發(fā),以此提高服務(wù)端的穩(wěn)定性和功能完整性。系統(tǒng)模塊功能如表2所示。
表2 船舶管件智能派工系統(tǒng)模塊說明
為保證系統(tǒng)在最復(fù)雜的情況下,能夠做出最合理的派工。我們利用歷史生產(chǎn)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練后,選擇2020年6月的116條生產(chǎn)任務(wù)數(shù)據(jù)輸入至模型中。模型精確地給出了的派工結(jié)果能夠保證98%的任務(wù)在上架日期內(nèi)完成,即逾期率只有2%。而2020年實(shí)際當(dāng)月的生產(chǎn)任務(wù)有26%的逾期。另外,由數(shù)字化制造協(xié)同管理平臺(tái)生產(chǎn)管控系統(tǒng)中2020年6月兩部門的工作情況,我們發(fā)現(xiàn)兩部門工作符合存在明顯的差異,顯然是生產(chǎn)任務(wù)沒有進(jìn)行合理的派發(fā)所導(dǎo)致,而根據(jù)智能派工系統(tǒng)所推薦的派工結(jié)果來(lái)看各部門的工作負(fù)荷也有所改觀,116條任務(wù)中管加二部工派發(fā)了61條生產(chǎn)加工任務(wù),管二大連派發(fā)了55生產(chǎn)條加工任務(wù)。這證明我們的智能化派工系統(tǒng)能夠輸出合理的派工信息,提升部門的生產(chǎn)效率。
表3 智能派工系統(tǒng)派工結(jié)果
本文為了提高船舶制造過程中管件的管理效率,設(shè)計(jì)實(shí)現(xiàn)了船舶管件生產(chǎn)加工任務(wù)的智能化派工系統(tǒng)。首先采用機(jī)器學(xué)習(xí)技術(shù)對(duì)各生產(chǎn)加工部門歷史生產(chǎn)數(shù)據(jù)進(jìn)行學(xué)習(xí),獲得其動(dòng)態(tài)產(chǎn)能邊界,在此基礎(chǔ)上結(jié)合待派發(fā)的生產(chǎn)加工任務(wù)信息以及各部門的當(dāng)前生產(chǎn)狀態(tài)信息建立強(qiáng)化學(xué)習(xí)預(yù)測(cè)模型,將新的加工任務(wù)輸入模型即可輸出應(yīng)該承擔(dān)該生產(chǎn)任務(wù)的部門;較好地實(shí)現(xiàn)了船舶管件加工生產(chǎn)任務(wù)的智能派工,極大地減少了工作人員的工作負(fù)擔(dān),很好地提升了各部門的效率。