姚遠遠 葉春明
上海理工大學管理學院,上海,200093
薄膜晶體管液晶顯示器(thin-film transistor-liquid crystal display,TFT-LCD)的制造過程主要包括三個階段:TFT陣列/彩色濾光制程、液晶成盒、模塊組裝制程[1]。為了減少在制品數(shù)量、縮短生產周期,企業(yè)通常在陣列制程的每個工位放置多臺并行機器。TFT-LCD面板陣列制程的生產過程可歸結為可重入混合流水車間(reentrant hybrid flow shop,RHFS)問題,即所有工件在各工位之間具有相同的加工路徑,并按照相同的加工順序重復多次,且至少有一個工位有多臺機器。RHFS調度問題是經典的混合流水車間調度與可重入調度的合成體,已被證明是NP難題[2],不能用傳統(tǒng)的數(shù)學模型方法求解,因此,開發(fā)針對該問題的高效智能優(yōu)化算法研究是車間調度領域的熱點,具有重要的理論意義和實用價值。
CHOI等[3]將TFT-LCD制造簡化為兩階段的RHFS調度問題并構建數(shù)學模型,以滿足最大允許交貨期的條件下使最大完工時間最短為調度目標,提出一種分枝定界算法和三種改進的啟發(fā)式算法(Johnson、CDS和NEH)進行求解。CHOI等[4]研究了需要同時滿足系統(tǒng)產出最大,平均運行時間、平均延誤時間、總誤工工件數(shù)最小的多個優(yōu)化目標的實時動態(tài)RHFS調度問題,采用一種基于決策樹的實時調度機制來選擇合適的調度規(guī)則,并將其成功用于實際的TFT-LCD面板生產線。DUGARDIN等[5]提出了一種基于Lorenz支配的多目標遺傳算法,求解了以最大化瓶頸機器利用率、最小化最大完工時間為目標的RHFS問題。為求解優(yōu)化目標是最小化最大完工時間和總拖期時間的RHFS調度問題,CHO等[6]提出了Pareto遺傳算法,YING等[7]提出了迭代Pareto貪婪算法,SHEN等[8-9]提出了改進教與學優(yōu)化算法、基于Pareto的離散和聲搜索算法。CHO等[10]針對雙目標RHFS調度問題,提出一種雙層生產計劃與調度方法,并將其用于求解隨機生成的問題和真實TFT-LCD生產案例。
目前,針對RHFS調度問題的研究方法主要是精確方法、啟發(fā)式算法和現(xiàn)代元啟發(fā)式算法。精確算法在理論上能保證獲得最優(yōu)解,但對問題的建模要求很高,受時間復雜度和空間復雜度的限制,僅適用于小規(guī)模問題,且求解效率低。啟發(fā)式算法基于調度規(guī)則構造解,能夠保證解的可行性與產生過程的快速性,但求解質量難以保證。元啟發(fā)式算法能夠在合理的計算時間內高效獲得滿意解,廣泛用于各種車間調度問題的求解。盡管各種不同的智能優(yōu)化算法已經被用于求解RHFS調度問題,但是“沒有免費午餐定理”[11]指出不存在一種算法能夠解決所有的優(yōu)化問題。因此,本文采用一種新型的智能優(yōu)化算法對RHFS調度問題進行求解。
高效的優(yōu)化調度方法能夠有效提高經濟效益,實現(xiàn)節(jié)能、減排、降耗、降成本,減少對環(huán)境的影響,取得經濟指標和綠色指標的協(xié)同優(yōu)化[12]。LU等[13]考慮機器調整安裝時間和運輸時間,構建以最大完工時間和總耗能為目標的數(shù)學模型,采用一種混合多目標回溯搜索算法求解考慮節(jié)能的置換流水車間調度問題。LEI等[14]提出一種混合蛙跳算法,解決考慮能耗指標、以最小化工作負荷均衡和總耗能為優(yōu)化目標的柔性作業(yè)車間調度問題。DENG等[15]提出一種競爭文化基因算法來求解以最小化最大完工時間和總碳排放量為優(yōu)化目標的分布式置換流水車間低碳調度問題,并對該問題的性質進行了分析。
TFT-LCD制造企業(yè)作為能耗大戶,存在較大的節(jié)能空間,節(jié)能減排工作非常迫切[16],因此,筆者采用多目標樽海鞘群算法(multi-objective salp swarm algorithm,MSSA)[17]對考慮節(jié)能的TFT-LCD面板陣列制程調度問題進行求解,提出一種改進多目標樽海鞘群算法(improved MSSA,IMSSA),并通過與基本多目標樽海鞘群算法、多目標粒子群優(yōu)化(MOPSO)算法以及快速非支配排序遺傳算法(NSGA-Ⅱ)的數(shù)值實驗對比,驗證了IMSSA解決該問題的有效性。
TFT-LCD面板的陣列制程可抽象為RHFS調度問題,具體描述如下:有n個工件需要在s個串行工位上進行加工;工位i有mi(mi≥1)臺相同的并行機器;每道工序可以在每個工位的任何一臺機器上以相同的加工時間完成,由于具有可重入特點,所以同一工件可能多次訪問某個工位。實際生產過程中,TFT-LCD制造企業(yè)既要考慮工件工期、拖期、加工成本等多種經濟指標,又要考慮能耗、碳排放等綠色指標。某些經濟指標與綠色指標往往相互沖突,因此,本文考慮節(jié)能的TFT-LCD面板陣列制程調度問題屬于多目標優(yōu)化問題。本文選取3個優(yōu)化目標:最大完工時間、總拖期時間和總耗能,其中,最大完工時間為所有工件全部工序的最終完成時間;交付期是企業(yè)對客戶訂單的承諾交付時間;降低總耗能有助于企業(yè)節(jié)能、減排、降成本,減小對環(huán)境的影響,本文只考慮機器的加工耗能和空轉耗能。
模型包含的基本約束條件和假設有:①所有工件和機器在零時刻均準備就緒;②全部機器在零時刻啟動并在所有工件完成加工后關閉,不考慮停開機耗能;③在任意時刻,每臺機器最多加工1個工件,每個工件也最多只能被1臺機器加工;④所有工件之間互不影響,工件之間的加工順序沒有先后約束,每個工件的所有工序有先后約束;⑤每個工件的可重入次數(shù)、各道工序的加工時間、每個工件的交付期,以及每個工位上機器的單位時間加工耗能和空轉耗能是已知且固定的;⑥任意兩個連續(xù)工位之間的緩沖區(qū)容量無限;⑦不允許搶占,工件一旦開始加工,則不能被中斷;⑧不考慮機器故障和機器調整安裝時間。
本文在文獻[6,8]的研究基礎之上,給出如下的多目標混合整數(shù)規(guī)劃模型。
目標函數(shù):
minCmax=maxCj
(1)
(2)
minTec=Pec+Sec
(3)
式中,Cmax為最大完工時間目標;Cj為工件j的完工時間,j=1,2,…,n;n為工件總數(shù);Ttd為總拖期時間;dj為工件j的交付期;Tec為總耗能目標,本文所有耗能單位都是kgce,表示千克標準煤當量;Pec為加工總耗能;Sec為空轉總耗能。
約束條件:
(4)
(5)
M(2-rijkl-rij′k′l)+M(1-Zjkj′k′)+(Sj′k′-Sjk)≥pjk
(6)
?i,j M(2-rijkl-rij′k′l)+MZjkj′k′+(Sjk-Sj′k′)≥pj′k′ (7) ?i,j M(2-rijkl-rijk′l)+(Sjk′-Sjk)≥pjk (8) ?i,k Sjk≥0 ?j,k (9) (10) Cj≤Cmax?j (11) (12) (13) ?i,j,k,l 式中,i為工位序號,i=1,2,…,s;s為工位總數(shù);l為工位i中的機器序號,l=1,2,…,mi;k為工件j的工序序號,k=1,2,…,Nj;Nj為工件j的工序總數(shù);Ojk表示工件j的第k道工序;pjk為工序Ojk的加工時間;Sjk為工序Ojk的加工開始時間;Ui為在工位i中加工的所有工序的集合,由于允許可重入,因此同一工件可能在Ui中出現(xiàn)多次;M為一個足夠大的正數(shù);Pil為工位i中第l臺機器單位時間的加工耗能;Sil為工位i中第l臺機器單位時間的空轉耗能。 式(1)~式(3)分別表示需要優(yōu)化的最小化最大完工時間、總拖期時間和總耗能;式(4)確保工序Ojk+1的加工開始時間不早于工序Ojk的加工完成時間;式(5)保證每道工序只能在相應工位中的一臺機器上加工;式(6)~式(8)確保每臺機器在同一時刻最多加工一道工序;式(9)規(guī)定工序Ojk的加工開始時間為非負數(shù);式(10)、式(11)定義了最大完工時間目標;式(12)、式(13)定義了加工總耗能和空轉總耗能。 MIRJALILI等[17]提出了樽海鞘群算法(salp swarm algorithm,SSA),并給出了該算法的單目標和多目標的求解方法。SSA將樽海鞘鏈分成領導者(前半部分)和追隨者(后半部分),將搜索空間中的食物源F作為群體的搜索目標。本文對多目標SSA(multi-objective SSA,MSSA)進行改進,以解決離散的TFT-LCD面板陣列制程調度問題。 由于SSA的個體位置為連續(xù)值矢量,無法實現(xiàn)工件排序的更新,因此采用基于升序排列的隨機鍵編碼規(guī)則,構造從個體位置到工件排序的恰當映射,然后按照文獻[6-7]的PS方法進行解碼,從而計算出個體位置對應調度方案的目標值。這種轉化無需修改算法的進化操作,能夠保證調度方案的可行性。 本文選取TFT-LCD面板陣列制程的一個小規(guī)模測試問題實例進行解釋說明。該測試問題中,3個工件(共14道工序)需要經過陣列制程的2個工位(共3臺機器)的加工。第一個工位有1臺機器,該工位機器單位時間的加工耗能即能源消耗量的換算指標(千克標準煤當量,kgce)為8 kgce/min,空轉耗能為2 kgce/min;第二個工位有2臺同速并行機器,每臺機器的單位時間加工耗能為7 kgce/min,空轉耗能為1 kgce/min。工件1~3的交付期分別是7.5 min、11.5 min和16.0 min。每個工件的各道工序在對應工位上的加工時間如表1所示,如果某次可重入該工件不在此工位上加工,則加工時間用“-”表示。 表1 一個小規(guī)模的TFT-LCD陣列制程實例 Tab.1Asmall-sizedTFT-LCDarrayprocesscasemin 加工時間首次加工路徑第1次可重入第2次可重入工位1工位2工位1工位2工位1工位2工件12132--工件2222222工件32322-- 樽海鞘的個體位置采用基于隨機鍵的編碼,個體長度等于工件總數(shù),各元素在0~1內任意取值,如圖1所示,這種編碼方式能夠有效降低算法求解難度,提高求解效率。假設某個樽海鞘的個體位置向量為(0.814 7, 0.127 0, 0.632 4),通過對各位置元素進行升序排列得到對應的工件排序(2, 3, 1),即工件加工順序為2-3-1。接著采用PS方法將該工件排序解碼成一個可行調度方案,圖2為得到的甘特圖。通過解碼過程為每道工序在每個工位選取1臺合適的機器進行加工,確定每臺機器的加工順序、工序開始時間,求得目標函數(shù)值。圖2中,首先將工件2的所有工序安排在能最早加工完成的機器上;接著對工件3進行排序,將工件3的各道工序安排在能最早加工完成的機器上,在所分配的機器上,如果工件3的某道工序的加工完成時間不超過已安排工件工序的最早加工開始時間,則將工件3的這道工序安排在已排序工件工序的位置之前,否則將其安排在已排序工件工序的后面,例如工件3的第1道工序(301)安排在工序203之前,工序303安排在工序205的后面;然后依此類推,將工件1的所有工序安排在各臺機器上。該調度方案求得的目標函數(shù)值為Cmax=17 min,Ttd=10 min,Tec=242 kgce。 圖1 樽海鞘個體的表示Fig.1 Representation of salp individual 時間t/min圖2 小規(guī)模TFT-LCD陣列制程實例的甘特圖Fig.2 Gantt chart of a small-sized TFT-LCD array process case 領導者個體的位置更新只與食物源位置相關,由于SSA的領導者個體位置更新方式是為連續(xù)函數(shù)優(yōu)化問題設計的,無法直接用于離散問題求解,因此對領導者個體的位置更新方式進行改進: (14) c=2exp(-(4t/tmax)2) (15) i=1,2,…,N/2j=1,2,…,D 其中,xi,j為第i個樽海鞘個體位置的第j維變量值;Fj為食物源位置的第j維變量值;r是0~1之間的隨機數(shù),r<0.5時,xi,j向Fj的方向靠近,否則遠離Fj;相關系數(shù)c是SSA中最重要的參數(shù),用于平衡全局探索和局部開發(fā),隨著迭代過程從2遞減到0,大約第60次迭代時,c接近為0。t為當前迭代次數(shù),tmax為種群的最大迭代次數(shù)。假設種群中有N個樽海鞘個體,每個個體有D(工件個數(shù))維變量。L為Lévy飛行步長[18],可有效防止算法早熟收斂,計算方法如下: L=u/|v|1/β (16) σv=1 式中,β為1~2之間的一個參數(shù)。 樽海鞘鏈的后半部分個體為追隨者,追隨者的個體位置更新只與它前面的樽海鞘個體位置相關: xi,j=(xi,j+xi-1,j)/2 i=N/2+1,N/2+2,…,N 在MSSA中,引入一個外部檔案Archive存儲當前種群獲得的所有最優(yōu)非支配解集,為了找到更好的Pareto最優(yōu)前沿,本文對Archive中的每個個體執(zhí)行變鄰域搜索操作,變鄰域搜索的最大迭代次數(shù)用ls表示。具體操作方法是:對Archive中的每個個體的每維元素以1/D的概率進行變異。變異操作公式如下: Al′,j=Al,j+εRK 其中,Al,j為Archive中第l個非支配個體位置的第j維變量;Al′,j為變異操作后的Al,j;ε是一個很小的正數(shù),經過測試,ε=0.01算法的尋優(yōu)效果較好;R是一個服從標準正態(tài)分布的隨機數(shù);r是0~1之間的隨機數(shù),r<1/D時,K為1,否則為0。 如果變異操作后的新個體Al′支配Al,則保留新個體Al′并將其存入Archive中,舍棄原個體Al;否則不保留Al′。每個個體執(zhí)行l(wèi)s次變鄰域搜索操作。 本文在MSSA基礎上,引入針對可重入混合流水車間調度問題的編碼和解碼機制,改進了領導者個體的位置更新方式,并對Archive中的非支配個體進行變鄰域搜索操作,設計出一種改進多目標樽海鞘群算法(improved multi-objective salp swarm algorithm,IMSSA),如圖3所示。 圖3 IMSSA算法圖Fig.3 Diagram of IMSSA 為驗證IMSSA求解TFT-LCD面板陣列制程調度問題的有效性,將其與MSSA、多目標粒子群優(yōu)化(MOPSO)算法[19]和快速非支配排序遺傳算法(NSGA-Ⅱ)[20]進行對比。實驗仿真環(huán)境如下:操作系統(tǒng)為Windows 7,處理器為Intel i5-4210M @2.60GHz,內存4G,采用MATLAB R2015b實現(xiàn)算法編程。 根據(jù)本文模型所提出的假設,所有工件完成加工所需的加工總耗能是固定值,主要由所有機器的空轉總耗能的變化決定,因此為了簡化計算,對所有機器的空轉總耗能進行研究,分析不同調度方案對所有機器的空轉總耗能的影響。本文在文獻[6]設計的RHFS調度問題的測試算例基礎上,增加機器的單位時間空轉耗能,以驗證IMSSA解決考慮節(jié)能的TFT-LCD面板陣列制程調度問題的性能。文獻[6]設計了2種類型測試問題——小規(guī)模和大規(guī)模算例,并在算例設計時考慮了最大完工時間和總拖期時間的相互沖突。本文從小規(guī)模測試問題中隨機選擇12個用于測試,各個算例的交付期的寬松程度不同,數(shù)據(jù)取整并服從均勻分布,其中,工件數(shù)在10~20內取值,工位數(shù)在5~10內取值,可重入次數(shù)取值范圍為1~2,每個工位的并行機器數(shù)在1~2內取值,工序加工時間在1~10內取值,每個工位上機器的單位時間空轉耗能取值范圍在1~5之間。 最大完工時間、總拖期時間和總耗能的度量單位不同,為了更合理地對各種算法的性能指標進行評價,采用min-max標準化方法對各個目標值進行數(shù)據(jù)歸一化處理,然后將歸一化之后的數(shù)據(jù)參與性能評價指標計算。本文選取了3個性能評價指標:空間度量指標S、世代距離DG和反向世代距離DIG,其中,S和DG參考文獻[20]。由于所測試問題的真實最優(yōu)Pareto前沿未知,因此將4種算法的全部結果中的非支配解近似作為最優(yōu)Pareto前沿。 S用于衡量所得Pareto前沿上非劣解分布的均勻性,其計算方法為 i,j=1,2,…,FP DG用來評價所得Pareto前沿與最優(yōu)Pareto前沿之間的逼近程度,其計算公式為 其中,bi為所得Pareto前沿上第i個解與最優(yōu)Pareto前沿中最近解之間的歐氏距離。DG越小,算法的收斂性越好。DG的最小取值為0,表示所得Pareto前沿中的所有非劣解均包含在最優(yōu)Pareto前沿里。 DIG是DG的一種變形,但該指標更具綜合性,能夠同時評價所得Pareto前沿的收斂性和非劣解的多樣性,其計算公式為 參數(shù)設置對元啟發(fā)式算法的性能有很大影響,本文所設計的IMSSA主要涉及三個關鍵參數(shù):種群規(guī)模N、Lévy飛行步長中的參數(shù)β、變鄰域搜索的最大迭代次數(shù)ls。為了獲得最佳的因子水平組合,使用田口方法進行實驗設計,研究算法參數(shù)對調度結果的影響,將Sproblem-06-11問題作為測試算例。每個參數(shù)設置4個因子水平,如表2所示。根據(jù)實驗的組數(shù)、實驗因子數(shù)、因子水平數(shù),采用L16(43)的直交表,通過較少的實驗研究更多的因子。對于直交表中的每個因子水平組合,IMSSA獨立運行20次,并記錄所得到的非支配解集。由于DIG能夠同時評價所得Pareto前沿的收斂性和非劣解的多樣性,因此使用DIG表示響應特征值VR,實驗結果如表3所示,VR越小,該實驗參數(shù)組合性能越好。另外,響應特征平均值VAR和每個參數(shù)的重要性排序如表4所示。表4中,Δ=max(VAR) -min(VAR);排序值即按Δ從大到小的順序,為Δ最大的因子分配秩1,為Δ第二大的因子分配秩2,依此類推。 表2 因子水平設置 表3 直交表和響應特征值 表4 響應表 從表4中可以看出,種群大小N最為顯著。N過大,會導致算法收斂非常緩慢;N過小,可能引起算法早熟收斂。β影響Lévy飛行的步長,顯著性次之。變鄰域搜索的最大迭代次數(shù)ls的顯著性水平最低,ls過大,會導致計算量過大;ls過小,會使局部搜索不充分。根據(jù)上述的實驗結果分析,將IMSSA的參數(shù)N=150,β=1.9,ls=5作為最佳的因子水平組合進行接下來的計算實驗。另外,將其他相關參數(shù)設置如下:最大迭代次數(shù)tmax=100,外部檔案大小為100。 本文選取12個測試問題來比較4種多目標優(yōu)化算法,針對每個算例,每種算法各獨立運行20次,每運行一次都能獲得一個S、DG、DIG的組合。表5統(tǒng)計了每種算法20次運行后各個評價指標的均值和標準偏差,每個指標的最優(yōu)結果用粗體標出。從表5中可以看出,對于DG和DIG,IMSSA所得Pareto前沿上非劣解的收斂性和多樣性均是最優(yōu)的,NSGA-Ⅱ效果次之,接著是MSSA,MOPSO算法性能最差。然而,對于S,各個算法的優(yōu)勢不明顯,就所有測試問題而言,MOPSO算法所得Pareto前沿上非劣解分布的均勻性最好。 表5 不同算法得到的三個評價指標結果 均值和標準偏差只能從宏觀上展現(xiàn)各個算法的求解效果,為了更深入地判斷算法之間是否具有顯著差異,采用相關樣本的Wilcoxon符號秩檢驗方法。針對所有測試問題的3個評價指標,分別將IMSSA與其他3種算法進行兩兩比較。Wilcoxon符號秩檢驗結果如表6所示,其中P表示假設概率,即在原假設為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率,P<0.05表明兩種算法的優(yōu)化性能之間具有顯著差異。從表6中的結果可以看出,就DG和DIG而言,IMSSA明顯優(yōu)于其他幾種算法;對于S,IMSSA與MSSA、MOPSO和NSGA-Ⅱ沒有顯著性差異,因此這4種算法的分布性水平差異不大。3個評價指標箱線圖(圖4)進一步驗證了該結論。圖4中,*表示異常值(遠離其他數(shù)據(jù)值的數(shù)據(jù)值),處于1.5~3倍的四分位數(shù)間距之間的異常值在圖中常用○表示。因此綜上所述可以得出結論,本文所設計的IMSSA能有效解決考慮節(jié)能的TFT-LCD面板陣列制程調度問題。具體而言,在Pareto前沿上非劣解的收斂性和多樣性方面,IMSSA明顯優(yōu)于其他幾種算法;在非劣解分布的均勻性方面,4種算法的分布性水平差不多。 表6 Wilcoxon符號秩檢驗 注:顯著性水平設為0.05,sgn(P<0.05)判斷P是否小于0.05。 Sproblem-06-11測試問題中,19個工件在13臺機器上加工,可重入1次,共有9個加工工位,第1~9個工位上的同速并行機器數(shù)量分別是1、1、2、2、1、2、2、1、1,第1~9個工位上機器的單位時間空轉耗能分別是4、2、3、3、1、2、1、1、2(單位kgce/min)。4種算法的Pareto前沿如圖5所示,可以看出,對于所研究的問題,IMSSA的收斂性最好,NSGA-Ⅱ效果次之,接著是MSSA,而MOPSO收斂性最差。由圖5a可以看出,針對所研究的問題,最大完工時間和空轉總耗能成正比的線性關系,即要想實現(xiàn)節(jié)能目標,就要盡量縮短最大完工時間;最大完工時間縮短時,總拖期時間就會急劇延長,進而影響交貨時間和客戶滿意度水平,三者之間相互沖突,需要企業(yè)決策者合理權衡。 (a) S指標 (b) DG指標 (c) DIG指標 (1)將TFT-LCD面板陣列制程抽象為可重入混合流水車間調度問題,以最大完工時間、總拖期時間和總耗能作為優(yōu)化目標,構建了多目標混合整數(shù)規(guī)劃模型。 (2)對多目標樽海鞘群算法(MSSA)進行了一系列改進操作:設計了針對可重入混合流水車間調度問題的編碼和解碼機制;基于Lévy飛行,對領導者的個體位置更新方式進行了改進;對外部檔案中的非支配個體的變鄰域進行搜索操作。 (3)通過對一些測試問題的數(shù)值實驗,將本文改進的MSSA算法(IMSSA)與基本MSSA、多目標粒子群優(yōu)化(MOPSO)算法和快速非支配排序遺傳算法(NSGA-Ⅱ)進行對比研究,結果表明,IMSSA能有效解決考慮節(jié)能的TFT-LCD面板陣列制程調度問題。在非劣解的收斂性和多樣性方面,IMSSA明顯優(yōu)于其他幾種算法;在非劣解分布的均勻性方面,4種算法的分布性水平差不多。 (a)最大完工時間和空轉總耗能 (b)最大完工時間和總拖期時間 (c)總拖期時間和空轉總耗能 未來將進一步對本文的模型假設進行調整,例如假設同工位的并行機器是異質的,機器具有多種轉速,或考慮機器的啟停操作等,通過具體的實際生產策略達到降低能耗的目的。在綠色生產指標方面,不僅僅只局限于能耗指標,也可以延伸到對碳排放和污染物排放等指標的優(yōu)化。2 改進多目標樽海鞘群算法
2.1 編碼和解碼機制
2.2 領導者和追隨者的個體位置更新方式
2.3 外部檔案個體變鄰域搜索操作
2.4 IMSSA算法流程
3 數(shù)值實驗
3.1 實驗設置
3.2 測試問題
3.3 性能評價指標
3.4 參數(shù)設置
3.5 實驗結果與分析
4 結論