陳嘉麗, 張崇岐
(廣州大學(xué) 經(jīng)濟(jì)與統(tǒng)計(jì)學(xué)院, 廣東 廣州 510006)
混料試驗(yàn)設(shè)計(jì)[1-3]被廣泛應(yīng)用于食品加工、化工、醫(yī)藥、農(nóng)業(yè)等行業(yè),越來越受到大家的關(guān)注. 怎樣保證估計(jì)量在精確性方面具有某種優(yōu)良性質(zhì)并且使試驗(yàn)成本較低,從而更有效地選取設(shè)計(jì)點(diǎn),是混料試驗(yàn)設(shè)計(jì)的研究范疇. 目前的混料試驗(yàn)設(shè)計(jì)多是建立在線性模型上,如Fedorov[4]、Cornell[5]、Mandal等[6]和 Sinha等[7],這些模型可以用q變量系統(tǒng)的q階多項(xiàng)式模型來表示[8-9]:
β12…qx1x2…xq,
目前學(xué)者對線性混料模型研究甚多,研究手法較為成熟. 但實(shí)際應(yīng)用中很多問題用線性模型去擬合總存在一定誤差. 因此,對非線性混料模型[10-11]的最優(yōu)設(shè)計(jì)問題進(jìn)行研究十分必要.由于非線性混料模型信息矩陣的逆求解過于復(fù)雜,從而衍生出的一種方法是將原本的非線性模型進(jìn)行泰勒展開,使其轉(zhuǎn)化成常見的冪函數(shù)的線性模型. 此做法本質(zhì)上解決的仍是線性問題,難免會產(chǎn)生一定的誤差,因此,有必要對非線性混料模型進(jìn)行更為深入的探討. 2012年朱志彬等[12]基于becker模型提出了非線性分式混料模型, 并研究了二分量模型的 D-最優(yōu)設(shè)計(jì). 2015年張崇岐等[13]提出了一類含常數(shù)項(xiàng)的混料指數(shù)模型, 并直接在單純形格子點(diǎn)上研究了模型的D-最優(yōu)設(shè)計(jì). 本文提出一類特殊的混料指數(shù)模型, 通過在試驗(yàn)域內(nèi)多次迭代得到模型的D-最優(yōu)設(shè)計(jì),并用等價(jià)定理來證明該設(shè)計(jì)的D-最優(yōu)性.
實(shí)際生活中很多產(chǎn)品都是由多種物質(zhì)混合制作而成的,如面包、藥品和飲料等. 不同成分之間占比的變化將會影響最終產(chǎn)品的質(zhì)量. 為了生產(chǎn)出質(zhì)量更佳的產(chǎn)品,得到最優(yōu)的配料比例,減少成本,需要尋找最優(yōu)混料試驗(yàn)設(shè)計(jì).
假設(shè)某產(chǎn)品有q種成分,它們在生產(chǎn)中的比例分別為x1,…,xq,顯然x1≥0,…,xq≥0,且x1+…+xq=1.故混料的試驗(yàn)區(qū)域?yàn)?/p>
Sq-1={(x1,…,xq)|xi≥0,i=1,…,q,x1+…+xq=1}.
考慮一般的線性回歸模型,其基本形式為
y=βTf(x)+ε,
其中,y是響應(yīng)變量,ε是隨機(jī)誤差,β=(β1,β2,…,βk)T是k維未知參數(shù)向量,f(x)=(f1(x),f2(x),…,fk(x))T為已知的關(guān)于設(shè)計(jì)點(diǎn)x=(x1,x2,…,xq)∈Sq-1的實(shí)值函數(shù)向量.一般假設(shè)
E(ε)=0,Var(ε)=δ2.
與線性回歸模型不同的是,非線性回歸模型G(x,β)的一般表達(dá)式如下:
y=G(x,β)+ε.
目前國內(nèi)對非線性混料模型的研究較少,常見的非線性混料模型包括非線性混料指數(shù)模型和非線性分式可加混料模型,其中以非線性混料指數(shù)模型更為常見.
現(xiàn)考慮二分量非線性混料指數(shù)模型
實(shí)踐教學(xué)內(nèi)容體系(表1)三個(gè)層次中,第一層次是基礎(chǔ)層次:通過英語聽說訓(xùn)練,學(xué)生能熟練地運(yùn)用英語進(jìn)行簡單的英語交流;通過計(jì)算機(jī)實(shí)訓(xùn),讓學(xué)生掌握計(jì)算機(jī)的基本操作,能夠運(yùn)用計(jì)算機(jī)進(jìn)行單據(jù)的制作和文件處理。在學(xué)生學(xué)習(xí)專業(yè)課之前,帶領(lǐng)學(xué)生參觀當(dāng)?shù)氐耐赓Q(mào)企業(yè),也可以邀請企業(yè)人士到學(xué)校為學(xué)生作報(bào)告,使學(xué)生對外貿(mào)業(yè)務(wù)流程有一個(gè)大體的認(rèn)識,激發(fā)學(xué)生的學(xué)習(xí)熱情。
η=β1x1+β2eαx2+ε
(1)
其中,η是響應(yīng)變量,β1,β2和α是待估參數(shù),ε是均值為0、方差為σ2的隨機(jī)誤差,x1+x2=1.不失一般性,本文考慮當(dāng)α=1時(shí)的情況:
η=β1x1+β2ex2+ε
(2)
就模型(2)討論它的D-最優(yōu)性,顯然模型具有兩個(gè)未知參數(shù),因此,必須找到一個(gè)兩點(diǎn)設(shè)計(jì)使其滿足D-最優(yōu)性. 設(shè)在試驗(yàn)區(qū)域X中的一個(gè)設(shè)計(jì)ξ為
其中,x1=(x11,x12),x2=(x21,x22)為不同的支撐點(diǎn),0≤λ1,λ2≤1,λ1+λ2=1.記f(x)=(x1,ex2))T.
設(shè)計(jì)ξ所對應(yīng)的信息矩陣M(ξ)為
且與模型η相對應(yīng)的方差函數(shù)為
d(x,ξ)=fT(x)M-1(ξ)f(x).
在混料試驗(yàn)設(shè)計(jì)中,若存在設(shè)計(jì)ξ*使得信息矩陣的M(ξ)的行列式最大化,即
|M(ξ*)|=max|M(ξ)|,
稱ξ*為D-最優(yōu)設(shè)計(jì).
由等價(jià)定理可知,對連續(xù)回歸模型與緊致空間而言,ξ*稱為模型η的D-最優(yōu)設(shè)計(jì)當(dāng)且僅當(dāng)ξ*滿足
根據(jù)D-最優(yōu)準(zhǔn)則可知,D-最優(yōu)設(shè)計(jì)是最小化|M-1(ξ)|或最大化|M(ξ)|的設(shè)計(jì).首先計(jì)算出模型(2)在設(shè)計(jì)ξ下的信息矩陣
其次,計(jì)算設(shè)計(jì)ξ在模型(2)下的信息矩陣行列式
(λ1x11ex12+λ2x21ex22)2=
(λ1λ2)(x11ex22-x21ex12)2.
由約束條件λ1+λ2=1進(jìn)一步可得
因此有
x21ex12)2.
表1 f(x1,x2)函數(shù)的10組不同初始值計(jì)算結(jié)果
從表1可以知道,10組不同初始值對應(yīng)的最終值都是(0,1),且(x11ex22-x21ex12)2=1,迭代次數(shù)在20次左右,顯然另一設(shè)計(jì)點(diǎn)為(1,0).
此外,根據(jù)方程f(x1,x2)=(x1ex2-x2ex1)2,在區(qū)域0≤x1≤1,0≤x2≤1,用MATLAB畫出對應(yīng)的三維立體圖形,從圖1中也可以得到在(0,1)和(1,0)時(shí),max((x1ex2-x2ex1)2)=1.
圖1 f(x1,x2)函數(shù)的三維圖Fig.1 The three-dimensional graph of the function f(x1,x2)
由此可以得到模型(2)的D-最優(yōu)設(shè)計(jì)
對于模型(2),證明所得的設(shè)計(jì)ξ*是設(shè)計(jì)域上的D-最優(yōu)設(shè)計(jì).該設(shè)計(jì)的信息矩陣M(ξ)與它的逆M-1(ξ)
由此可得方差函數(shù)
d(x;ξ*)=fT(x)M-1(ξ)f(x)=
其中,0≤x1,x2≤1,x1+x2=1,通過MATLAB畫出d(x;ξ*)在區(qū)間[0,1]范圍的曲線圖,如圖2.
圖2 d(x;ξ*)的曲線圖Fig.2 The curve graph of d(x;ξ*)
在各種不同的混料模型中,非線性混料模型因其在實(shí)際生活中存在廣泛的應(yīng)用價(jià)值而成為當(dāng)前研究熱點(diǎn). 由于該模型計(jì)算非常復(fù)雜,算法效率低,沒有一套相對完善的理論,因此,需要進(jìn)一步的深入研究. 本文以二分量非線性混料指數(shù)模型為基礎(chǔ),通過多次迭代得到該模型的D-最優(yōu)設(shè)計(jì),并用等價(jià)定理來證明該設(shè)計(jì)的D-最優(yōu)性. 在未來的研究中,可以考慮對更高階的非線性混料指數(shù)模型的最優(yōu)設(shè)計(jì)問題做出進(jìn)一步探討.