国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Kullback-Leibler距離離散度的加權(quán)代理模型

2019-06-19 02:08:16段曉君劉博文
國防科技大學學報 2019年3期
關(guān)鍵詞:權(quán)函數(shù)高斯方差

晏 良,段曉君,劉博文,徐 琎

(國防科技大學 文理學院, 湖南 長沙 410073)

在工程研究中,利用計算機通過仿真試驗可對真實復雜系統(tǒng)進行高精度的模擬,從而分析該系統(tǒng)的相關(guān)特性[1]。然而,單次高精度仿真試驗通常面臨計算效率低、時間成本大等問題,因此諸如可靠性評估、失效概率驗證等需要大規(guī)模仿真的任務在實際操作中很難完成。代理模型由于其計算復雜度低、數(shù)學表達明晰等特點,在計算機仿真試驗中得到了廣泛應用[2-3]。實際上,代理模型重點關(guān)注輸入和輸出之間的數(shù)學關(guān)系。給定試驗設計及觀測數(shù)據(jù),代理模型通過回歸或插值等方法擬合觀測數(shù)據(jù),可給出相應的預測均值、方差等統(tǒng)計量。

常用的代理模型構(gòu)造方法有很多,例如:多項式響應曲面(Polynomial Response Surface, PRS)[4]、多元自適應回歸樣條(Multivariate Adaptive Regression Splines, MARS)[5]、高斯過程(Gaussian Process, GP)[6],等等。針對不同的模型特點(如光滑、線性、非線性)和數(shù)據(jù)特征(噪聲、異常值),通常會選用不同的代理模型。

事實上,除了以上文獻所提供的經(jīng)驗,基于一些準則可以對代理模型進行篩選。經(jīng)典的模型選擇準則[7]包括:基于擬合優(yōu)度(Goodness of Fit, GoF)、基于預測誤差(Prediction Error, PE)或者模型誤差(Model Error, ME)、基于概率分布距離(Distributional Discrepancy, DD)、基于后驗概率(Posterior Probability, PP)等。然而,基于上述準則需要對每類候選模型進行計算,會增加較多的計算量;另外,從所有候選模型中僅挑選單個最優(yōu)模型,不考慮其他模型也在一定程度上造成了信息的浪費。出于上述考慮,一些研究[8-10]也側(cè)重于利用所有的候選模型,即構(gòu)造加權(quán)代理模型。

此外,構(gòu)造加權(quán)代理模型有利于減小不確定性。加權(quán)模型由于考慮了所有不同類型的代理模型,因此在一定程度上增加了該模型的穩(wěn)健性。同時,加權(quán)模型在構(gòu)造的同時充分考慮到各模型的優(yōu)勢,因此其精度也能得到保證。

經(jīng)典的加權(quán)模型方法往往從兩個指標考慮:一是考慮模型預測的方差大小,通常情況下,預測方差越小,則認為模型越準確;二是考慮模型的預測精度,即預測均值與真實值之間的偏差,加權(quán)的主要目的在于降低加權(quán)模型與真實模型之間的偏差。然而在實際應用中,預測精度高(即偏差小)的代理模型,其預測方差可能較大,或者預測方差小的代理模型,其與真實值之間的偏差比較大。本文基于以上問題,提出了基于KL(Kullback-Leibler)距離離散度的加權(quán)方法,直接對預測的分布入手,同時考慮預測的均值和方差,在兼顧預測精度的同時,降低預測模型與真實模型之間的分布差異。本文考慮兩類子代理模型,一類為線性回歸模型,另一類為高斯回歸模型。

1 代理模型簡介

1.1 線性回歸模型

線性回歸模型假設響應y是一類基函數(shù)(basis)的線性組合:

y=[f(x)]Tβ+

(1)

其中,x=(x1,…,xd)T為d維變量,f(x)為p維向量函數(shù),其中每一項是關(guān)于x的基函數(shù)。通常在一類模型中基函數(shù)是給定的,因此構(gòu)造線性回歸模型重點在于求解未知參數(shù)β。一般假設為零均值的隨機誤差,因此[f(x)]Tβ實際上表示響應y的期望值。

給定N個觀測(Xi,Yi),i=1,…,N,即試驗設計(X,Y),根據(jù)式(1)可以得到:

Y=Fβ+

(2)

其中,F(xiàn)∈RN×p為設計矩陣,=(1,…,N)T為觀測誤差。由于~N(0,σ2I),可得參數(shù)β的最優(yōu)線性無偏估計(Best Linear Unbiased Estimate, BLUE)為:

(3)

(4)

(5)

1.2 高斯回歸模型

高斯回歸模型是一類典型的非線性模型。與線性回歸模型指定基函數(shù)不同,高斯回歸模型建立在響應y服從某一個確定的高斯過程基礎之上,即:y~GP(0,k(x,x)+σ2),其中k(x,x)為核函數(shù)。具體來說,給定試驗設計(X,Y),則有如下似然函數(shù):

Y|X~N(0,k(X,X)+σ2I)

(6)

記K=k(X,X)∈RN×N,由高斯過程假設以及式(6),可得預測均值和方差分別為:

(7)

(8)

其中,K*=k(X,x)∈RN×1,K**=k(x,x)∈R。實際上,高斯過程的預測能力由核函數(shù)所決定。一般來說,針對似然函數(shù)式(6)進行優(yōu)化可以得到關(guān)于核函數(shù)參數(shù)的相關(guān)估計。

2 加權(quán)代理模型

不同的代理模型其性能也有所不同,因此在加權(quán)代理模型中的權(quán)重也會隨之改變。加權(quán)代理模型的一般表達式為:

(9)

2.1 基于預測誤差的權(quán)函數(shù)構(gòu)造

(10)

由此可求解權(quán)函數(shù)如下:

(11)

2.2 基于交叉驗證均方誤差和均方根誤差的權(quán)函數(shù)構(gòu)造

Goel[9]等選擇泛化交叉驗證均方誤差(Generalized Mean Square cross validation Error, GMSE)作為衡量各子代理模型精度的重要參數(shù),構(gòu)造權(quán)函數(shù)如下:

(12)

其中,α<1、β<0為引入的尺度變換參數(shù),Gi為第i個子代理模型的GMSE,即:

(13)

(14)

GMSE反映了代理模型在所對應試驗設計點上的平均誤差,GMSE越小,說明模型在該試驗設計上越穩(wěn)定,即模型與試驗設計相適應;而RMSE反映了代理模型在測試集上的預測與真實值的誤差,與GMSE相比,其在一定程度上更關(guān)注模型在全局上的預測性能,RMSE越小,其預測精度越高。同時注意到,與式(11)不同,基于GMSE(RMSE)的權(quán)函數(shù)在模型定義域上是常值,因此權(quán)函數(shù)代表各子模型整體預測性能的比重。

此外,由于GMSE對每個子模型都需要計算N次,因此會增加較大的計算量。一般情況下,可以進行并行處理或者進行k(≤10)折交叉驗證。然而,針對線性回歸模型,GMSE的計算可以直接進行簡化,參見文獻[7]第12章。對于RMSE來說,則需要增加Nv個觀測,對于復雜系統(tǒng)來說,這會成為主要制約因素。

2.3 基于優(yōu)化加權(quán)模型誤差的權(quán)函數(shù)構(gòu)造

Acar[10]等在前述誤差的基礎上,提出了基于優(yōu)化誤差的權(quán)函數(shù)構(gòu)造方法,即求解如下最優(yōu)化問題:

2012年黨的十八大以來,以習近平同志為核心的黨中央堅定不移地堅持高舉改革開放旗幟、推進全面深化改革、擴大對外開放的戰(zhàn)略決策部署,展現(xiàn)了黨中央將改革開放進行到底的政治魄力和堅定決心。

(15)

其中,Err[·]表示誤差函數(shù),如RMSE或GMSE。對于式(15)的求解分為兩步,首先針對試驗設計構(gòu)造各子代理模型,其次將各子代理模型代入式(15)求解該約束優(yōu)化問題。與基于PE(RMSE, GMSE) 的方法相比,其計算量主要增加在求解最優(yōu)化問題式(15),當子模型數(shù)量M較大時,很難求得全局最優(yōu)解。

3 Kullback-Leibler距離離散度加權(quán)方法

以上三類經(jīng)典加權(quán)模型方法基于誤差函數(shù),往往只考慮代理模型預測的某一方面,如預測方差或偏差。本文從代理模型的預測分布入手,同時考慮這兩類因素,利用Kullback-Leibler距離[11]構(gòu)造權(quán)函數(shù),從而降低預測總體分布的不確定性。

與式(9)直接假設加權(quán)模型為各模型預測值的加權(quán)不同,本文假設加權(quán)模型在各點的預測概率密度函數(shù)為各子代理模型預測概率密度函數(shù)的加權(quán),即:

(16)

(17)

(18)

(19)

其中,DKL為通常意義下的Kullback-Leibler距離。對于本文中的兩類模型,其在各點的分布服從高斯分布,同時各模型之間相互獨立,因此概率密度函數(shù)p=N(μp,σp)和q=N(μq,σq)的Kullback-Leibler距離可以計算如下:

(20)

從式(20)可以看出,該距離包含預測均值和方差兩種參數(shù)。基于距離的權(quán)重函數(shù)構(gòu)造方法有多種,如基于反函數(shù)和減函數(shù)等特殊函數(shù)。本文擬采用高斯核函數(shù),基于DSKL可定義權(quán)函數(shù)如下:

(21)

(22)

此外,尺度參數(shù)ρ可以選取為全體分布的平均離散度,即各分布之間的平均距離為:

(23)

將式(22)和式(23)代入式(21)中,并對其進行歸一化可以得到最終的權(quán)函數(shù)如下:

(24)

4 算例分析

本節(jié)首先針對兩個測試函數(shù)對基于Kullback-Leibler距離離散度的加權(quán)代理模型進行分析,其函數(shù)表達式如下:

f1(x)=(10cos2x+15-5x+x2)/50

(25)

(26)

其中,f1是Viana函數(shù),f2為Rastrigin函數(shù),且觀測誤差均為~N(0,0.1)。

其次,本文考慮5類子代理模型及其加權(quán)模型,其中2類屬于線性回歸模型,3類屬于高斯回歸模型。子代理模型的具體形式如表1所示。

因此,給定試驗設計(X,Y),本文比較了9類代理模型,即5類子代理模型M1~M5(如表1所示);基于PE的加權(quán)模型M6;基于GMSE的加權(quán)模型M7;基于優(yōu)化GMSE的加權(quán)模型M8;本文方法M9。同時,對于每個算例,均隨機生成包含10 000個樣本點的測試集(Xv,Yv),并基于測試集比較兩種指標:RMSE和經(jīng)驗累積分布函數(shù)(Empirical Cumulative Distribution Function,ECDF)。具體計算結(jié)果如下。

表1 5類子代理模型

4.1 Viana函數(shù)

假設x~N(0,1),則利用拉丁超立方體抽樣方法(Latin Hypercube Sampling, LHS)生成包含7個樣本的試驗設計(X,Y)。對每類代理模型總共進行50次獨立試驗,則其RMSE對比如圖1所示。

圖1 9類代理模型RMSE對比Fig.1 Comparison of RMSE of 9 surrogate models

由圖1可以看出,對于5類子代理模型來說,M4的逼近精度最高;對于4類加權(quán)模型來說,本文方法,即M9的逼近精度也是最高的;總體上,本文方法的精度與M4精度相近。圖2利用1000個樣本的測試集生成經(jīng)驗累積分布函數(shù)。

圖2中可以看到,對比于各子模型,加權(quán)模型的ECDF都能夠較好地反映真實響應的分布情形。同樣地,可以看出M9與真實響應之間的差距更小,在y>5的區(qū)域上基本與真實ECDF重疊。

圖2 9類代理模型ECDF對比Fig.2 Comparison of ECDF of 9 surrogate models

4.2 Rastrigin函數(shù)

假設xi~N(0,1),i=1,2,同樣利用拉丁超立方體抽樣方法(Latin Hypercube Sampling, LHS)生成包含20個樣本的試驗設計(X,Y),并對每類代理模型總共進行50次獨立試驗,則其RMSE對比如圖3所示。

由圖3可以看出,對于5類子代理模型來說,除了M1以外,M2~M5逼近精度類似,其中M2,M3的整體預測性能更加穩(wěn)定;對于4類加權(quán)模型來說,其預測性能與M2~M5相當,M9的逼近精度略高,在某些試驗設計條件下具有最高的精度。圖4與圖2類似,同樣利用1000個樣本的測試集生成經(jīng)驗累積分布函數(shù),其結(jié)果如圖4所示。

圖3 9類代理模型RMSE對比Fig.3 Comparison of RMSE of 9 surrogate models

圖4 9類代理模型ECDF對比Fig.4 Comparison of ECDF of 9 surrogate models

由圖4可以看出,除了M1,M9以外,其他代理模型對真實響應分布逼近并不理想。同時注意到,對這些模型,其數(shù)據(jù)分布集中在y=8.4附近;作為對比,M9仍然能夠較好地還原真實響應的分布。

最后對一個具體的案例進行測試,即懸臂梁(cantilever beam)問題[12],如圖5所示。

圖5 懸梁臂問題Fig.5 Cantilever beam problem

其中,w和t分別代表橫截面的寬度和厚度,Y表示垂直載荷,X表示水平載荷,L代表長度。對于懸臂梁問題來說,總共有兩個響應,即位移D(x)和應力S(x)。具體數(shù)學表達式如下:

(27)

式中總共有三個自變量,即楊氏模量(Young′s modulus)E~N(2.9×107, 1.45×106),垂直載荷Y~N(1000,100),水平載荷X~N(500,100)。令w=4,t=2,同樣利用LHS方法生成包含36個樣本的試驗設計,并對9類代理模型總共進行50次獨立試驗,則對于應力響應來說,其RMSE對比如圖6所示。

由圖6可以看出,對于5類子代理模型來說,M4、M5的預測精度較低,其RMSE遠遠大于200,因此未在圖中展示。對于加權(quán)模型來說,M6、M7的效果同樣較差,M8、M9的逼近性能相當,與最佳子模型M2的精度也在同一量級。對于ECDF來說,同樣利用1000個樣本的測試集生成經(jīng)驗累積分布函數(shù),其結(jié)果如圖7所示。

圖6 應力RMSE對比Fig.6 Comparison of RMSE of stress

事實上,由圖7可以看出,子模型M4、M5對本問題及試驗設計的應用效果較差,而M1~M3均能夠較好地估計應力的分布。對于加權(quán)模型來說,其對各子模型的“平均”作用都能使得模型更加穩(wěn)健,如M6、M7,一定程度上還原了真實分布,但在性能上有著較大差異。M8、M9能夠極大地利用“好”模型(M1~M3)的信息,從而其對ECDF的逼近效果也是最好的。對于位移D(x)來說,由于M3不能應用在該模型之上,因此本文僅比較其余8類代理模型。注意到此時加權(quán)模型為M1、M2、M4、M5四類模型的加權(quán)。使用與應力相同的試驗設計,得到關(guān)于位移的RMSE如圖8所示。

圖7 應力ECDF對比Fig.7 Comparison of ECDF of stress

由圖8可以看出,對于4類子代理模型來說,M4~M5其預測精度同樣較低,因此也未在圖中展示。對于加權(quán)模型來說,M6的效果最差,M7、M8、M9的逼近性能依次遞增,一般情況下,M9的效果要比單獨的代理模型都要好。利用1000個測試樣本生成相關(guān)的ECDF,其對比如圖9所示。

圖9與圖7類似,對比于各子模型,加權(quán)模型至少避免了類似M4、M5的模型選擇錯誤,其在一定程度上能夠較為穩(wěn)健地逼近原模型。在所有加權(quán)類型中,本文方法與M8對ECDF的逼近是最準確的。

圖8 位移RMSE對比圖Fig.8 Comparison of RMSE of Displacement

圖9 位移ECDF對比Fig.9 Comparison of ECDF of displacement

5 結(jié)論

與通常加權(quán)模型選擇降低加權(quán)模型精度不同,本文針對預測分布構(gòu)造權(quán)函數(shù),引入Kullback-Leibler距離刻畫模型與模型之間預測分布的差異性。為了克服真實分布無法獲得的問題,本文利用各模型之間的離散度來表征各模型的預測能力。算例分析表明,本文方法在兼顧模型預測精度的同時,也能夠較好地還原真實響應的分布。

猜你喜歡
權(quán)函數(shù)高斯方差
小高斯的大發(fā)現(xiàn)
方差怎么算
基于改進權(quán)函數(shù)的探地雷達和無網(wǎng)格模擬檢測混凝土結(jié)構(gòu)空洞缺陷工程中的數(shù)學問題
一類廣義的十次Freud-型權(quán)函數(shù)
概率與統(tǒng)計(2)——離散型隨機變量的期望與方差
異徑電磁流量傳感器權(quán)函數(shù)分布規(guī)律研究*
天才數(shù)學家——高斯
計算方差用哪個公式
方差生活秀
兩類ω-超廣義函數(shù)空間的結(jié)構(gòu)表示
郑州市| 哈巴河县| 田林县| 辽宁省| 忻州市| 陆良县| 安塞县| 巨野县| 读书| 凭祥市| 铁岭市| 武汉市| 镇雄县| 霍城县| 禹州市| 洛隆县| 昭平县| 保靖县| 临沧市| 紫阳县| 平南县| 泸西县| 崇文区| 响水县| 松江区| 台北县| 墨脱县| 广东省| 鄂托克前旗| 夏津县| 阿勒泰市| 江油市| 宜黄县| 科技| 惠来县| 乌兰浩特市| 连南| 盐山县| 法库县| 南京市| 涟水县|