蘇 晴, 張崇岐
(廣州大學 經(jīng)濟與統(tǒng)計學院, 廣東 廣州 510006)
混料試驗設計具有特殊的研究意義:單獨使用某種要素的效果不如(或優(yōu)于)幾個要素一起使用產(chǎn)生的效果[1].這幾種要素可以被認為是幾種特性指標,根據(jù)它們的作用效果不同稱幾種要素間有對抗(或協(xié)同)作用,而這些特性指標與混料試驗中的混料占比息息相關[2].在混料試驗中響應指標只與各成分在配方中所占比例有關而與總量無關.混料試驗的目的是考察各成分所占比例對響應指標的影響,從而找到最優(yōu)的配方比例.
混料試驗在實際生活和工業(yè)領域應用廣泛,在農(nóng)業(yè)上,李紅偉等[3]在磷酸鹽對肉制品持水力影響的研究中通過混料試驗設計進行研究,王鑫系[4]運用混料模型研究西瓜包膜控釋尿素配比的問題,王晨光等[5]在做超微粉碎預處理沙柳原料酶解條件優(yōu)化中同樣運用了混料試驗.在工業(yè)上,黃壘等[6]進行了鐵基金剛石鉆頭胎體配方的混料試驗研究,賈春林等[7]研究了基于混料試驗優(yōu)化煤氣化復配助熔劑的問題,王大成等[8]基于混料的理論建立了混合垃圾燃燒試驗及活化能回歸方程的建立.在理論研究中,張崇岐等[9]對混料試驗的變量選擇AIC準則進行了研究,李光輝等[10]研究了具有復雜約束混料試驗的漸進D-最優(yōu)設計,燕飛[11]將混料模型結合組合投資進行了研究.
混料試驗設計在傳統(tǒng)的求最優(yōu)的過程中有不足之處,或是優(yōu)化的效率較低,或是獲得的最優(yōu)解為局部最優(yōu)解等現(xiàn)象.按照最優(yōu)化的結果,可把最優(yōu)化方法分為局部最優(yōu)和全局最優(yōu).在實際問題中,所要求得的最優(yōu)解常為全局最優(yōu)解.為了彌補這一類的情況發(fā)生,從20世紀50年代起進化算法得到了發(fā)展.通常情況下,進化算法被認為是由遺傳算法、進化規(guī)劃和進化策略組成的[12].本文主要研究遺傳算法,首先介紹了混料模型的基礎知識并說明混料模型使用遺傳算法求解的基本原理,然后通過實例分析說明運用遺傳算法求解混料的最優(yōu)設計的過程,并驗證運用遺傳算法求解混料試驗模型是具有可行性且獲得的結果是較優(yōu)的,最后進行了總結與展望.
一般混料模型為
y=βTf(x)+ε,x∈,
其中,y為響應變量,x=(x1,x2,…,xq),β為未知參數(shù)組成的d維列向量,f(x)為x∈χ上給定的d維函數(shù)列向量,χ為一個封閉緊集,ε是均值為0方差為常數(shù)的隨機誤差.每個分量都必須表示成混料的百分比.對于q分量的混料試驗設計,各分量比例x1,x2,…,xq需要滿足基本約束條件
從而由各分量構成了(q-1)維正規(guī)單純形
在實際應用中,混料試驗往往還受其他約束條件的限制,此時混料試驗域可表示為
其中,C′s為附加的約束條件.常見的附加約束條件主要有三種形式[13]:
(1)兼有上、下界約束的條件
SCCs:0≤ai≤xi≤bi≤1,j=1,2,…,q;
(2)線性約束條件
(3)非線性約束條件
NCCs:aj≤φj(x1,x2,…,xq)≤bj≤1,j=1,2,…,l,
其中,aj,bj都為已知的常數(shù),φj(x1,x2,…,xq)是各變量的非線性函數(shù).
混料模型因其特殊的試驗域,若使用常規(guī)的完全多項式模型,無論試驗設計如何,其信息矩陣總是退化的.因此,在一般混料試驗設計中常選擇Scheffé規(guī)范多項式模型,常用的q分量m階混料規(guī)范多項式形式如下:
當m=1時,
當m=2時,
當m=3時,
由上可知,模型參數(shù)個數(shù)會隨著分量q和模型階數(shù)m的增加而快速增加.
遺傳算法是一種模擬生物界的自然選擇機制和仿照自然界的遺傳機制的隨機搜索算法,其本質特征在于群體搜索的策略和簡單的遺傳算子[14].群體搜索策略可以實現(xiàn)整個解空間上的分布式信息采集和探索,遺傳算子可以降低一般啟發(fā)式算法在搜索過程中對人機交互的依賴性[14].
基于遺傳算法求混料模型最優(yōu)的基本步驟如下:
(1)編碼.將一個混料試驗設計的試驗域轉換到遺傳算法所能處理的搜索空間;
(2)選擇.在混料試驗域轉換到的搜索空間中選擇適應度較強的個體,從而產(chǎn)生新的群體;
(3)交叉.在混料試驗域轉換的搜索空間中,進行兩組試驗點的選擇,然后交換選擇出來的兩組試驗點的某個或某些混料分量.其中,交叉算子的設計需要考慮兩方面:如何確定交叉點位置和如何進行部分基因的交換;
(4)變異.以較小的概率對混料試驗點的某個或部分混料分量值進行改變.變異可以避免混料模型得到的最優(yōu)解為局部最優(yōu)解,并防止早熟現(xiàn)象的出現(xiàn);
(5)適應度函數(shù).是度量在混料試驗域轉換的搜索空間中個體適應度的函數(shù).該函數(shù)基于實例情況中的目標函數(shù)所確定,主要作用是區(qū)分群體中個體的好壞;
(6)結合混料模型和實際情況選擇控制的參數(shù).該參數(shù)的選擇會影響算法的收斂性,混料模型中的群體規(guī)模大小會對收斂性和計算效率兩個方面有所影響;
(7)根據(jù)模型需求分析出滿足實際的約束條件并加以處理.
在實際運用的過程中,通過遺傳算法求混料模型最優(yōu)的工作流程[12]如下:
迭代開始:
t=0,
初始化:
P(0)={a1(0),a2(0),…,an(0)},
適應性評價:
P(0)={f(a1(0)),f(a2(0)),…,f(an(0))},
循環(huán)條件:
T(P(t))≠truedo,
選擇:
P′(t)=s(P(t),ps),
交叉:
P″(t)=c(P′(t),pc),
變異:
P?(t)=m(P″(t),pm),
新一代群體:
P(t+1)=P?(t),t=t+1,
適應性評價:
P(t+1)={f(a1(t+1)),f(a2(t+1)),…,f(an(t+1))},
結束.
由混料試驗設計的基本約束條件可知,其中的各個分量最小值為0,即在單純形格子設計中,絕大多數(shù)的試驗點混料的分量都有一個或者多個的分量為0.但在實際應用和試驗中,很多情況下是不允許大多數(shù)的分量為0的,否則就會失去該模型的意義[15].為更清晰地說明運用遺傳算法獲得混料模型最優(yōu)設計的方法,結合實例加以分析.
數(shù)據(jù)來源于文獻[16],摘取該文獻中研究煤矸石與不同基質不同配比下小白菜生長的研究的部分數(shù)據(jù).原數(shù)據(jù)作者旨在研究煤矸石與壤土、煤矸石與沙土的混合基質,分別對小白菜生長的平均株高的影響.為了優(yōu)化試驗,本次試驗的目的是研究同時含有煤矸石、壤土和沙石三種成分的混合基質對小白菜生長的平均株高的影響,并且尋求達到小白菜最優(yōu)生長的平均株高時煤矸石、壤土和沙石的比例.原始數(shù)據(jù)來源于三個表格:供試基質及其配比比例、煤矸石與壤土不同比例對小白菜種子出苗率的影響和煤矸石與沙土不同比例對小白菜種子出苗率的影響.
本例共有20組數(shù)據(jù).由于實例問題為研究三種不同物質的共同作用,所以該混料試驗模型選定為3分量規(guī)范混料模型,x1、x2和x3分別對應煤矸石、壤土和沙土的混料分量,小白菜的平均株高為響應值y.經(jīng)過處理后的數(shù)據(jù)表1滿足混料試驗模型的要求.
表1 混料模型試驗點坐標值與對應的響應值
結合數(shù)據(jù)來源的實際應用情況以及本次試驗的目的,該模型的混料分量需滿足以下的約束條件:
在此前提下進行模型擬合,尋找其最優(yōu)設計.
使用表1的數(shù)據(jù),選擇3分量3階混料規(guī)范多項式擬合得到如下:
y=8.258 52x1+4.511 83x2+4.361 07x3-
3.497 32x1x2-3.617 26x1x3-
1.437 71x1x2(x1-x2)-1.549 70x1x3(x1-x3)
(1)
并繪制該混料規(guī)范多項式的三維響應曲面圖(左)和預測響應(右)等值線圖如圖1.
圖1 三維響應曲面圖(左)和預測響應等值線圖(右)
為驗證該模型的擬合程度,通過方差分析表進行檢驗(表2).
表2 方差分析表
觀察表2可知,該模型的P<0.000 1,說明該混料試驗模型表示變量間的關系是顯著的,通過了F檢驗,認為式(1)能夠合理地描述此混料試驗.
使用遺傳算法求得本例模型的最優(yōu)設計.由于最優(yōu)設計的試驗目的是求得目標函數(shù)的最大值,且Matlab中函數(shù)優(yōu)化是使適應度函數(shù)最小化,需設適應度函數(shù)為f=-y,并對遺傳算法中所要用到的參數(shù)進行初始設定如表3所示.
表3 算法參數(shù)的初始值
運行程序,遺傳算法的輸出結果停留在第163代,此時x1=0.600、x2=0.298和x3=0.102時,適應度函數(shù)為最小值f=-5.780.最佳適應度值隨著遺傳算法的代數(shù)不斷增加而趨于一個穩(wěn)定情況.每代原始得分對應的期望值隨著每代原始得分的不斷增加而不斷降低,并且從集中分布趨于分散分布.每代個體的范圍由初始范圍[-10,10]開始一直逐漸減小并趨于穩(wěn)定,除了70代到90代區(qū)間有明顯的波動趨勢,90代以后穩(wěn)定于-5.790左右.遺傳個體的譜系圖(圖2)展現(xiàn)了其中父輩的個體數(shù)和子代的個體數(shù)比例差異,并且可以發(fā)現(xiàn),該比例是較為穩(wěn)定的.
圖2 算法的輸出結果
因此,在混合基質同時含有三種成分的前提下,當煤矸石、壤土和沙石三種成分所占比例分別為60.00%,29.80%和10.20%時,小白菜達到最優(yōu)生長的平均株高5.78 cm.
本文給出使用遺傳算法求混料模型最優(yōu)設計的實證分析.混料試驗模型最傳統(tǒng)獲取其最優(yōu)解的方式是通過觀測等值線圖獲取,但由于人為觀測的不準確性,容易造成較大誤差.在理論研究和工農(nóng)業(yè)應用中,混料模型的試驗域通常情況下不是標準的單純形,而是不規(guī)則的試驗域,這使得通過觀測等值線圖獲取最優(yōu)解的方法更困難.該情況下,凸顯了遺傳算法的優(yōu)勢所在,遺傳算法在保證混料試驗模型滿足已知的約束條件情況下,通過群體搜索與遺傳算子的交叉變異和不斷的迭代,獲取混料試驗模型的最優(yōu)設計,且該算法計算速度較快,獲得的結果較為準確,說明使用遺傳算法獲得混料模型最優(yōu)設計的方法值得推廣.