□ 邱榮英 □ 李鉬石 □ 劉 釗
1.泛亞汽車技術(shù)中心有限公司 上海 200120
2.上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院 上海 200240
3.上海交通大學(xué) 設(shè)計(jì)學(xué)院 上海 200240
超材料具有介觀結(jié)構(gòu)的幾何特征及傳統(tǒng)材料無法獲取的特殊力學(xué)性能,超材料的特性可以通過改變介觀結(jié)構(gòu)單胞的設(shè)計(jì)來調(diào)整,超材料的增材制造為開發(fā)下一代輕質(zhì)功能性汽車部件開辟了新的機(jī)會(huì)。超材料填充結(jié)構(gòu)具有兩種尺度的幾何特征,如圖1所示。在介觀尺度下,每個(gè)超材料單胞被設(shè)計(jì)用于實(shí)現(xiàn)特殊的局部特性。在宏觀尺度上,通過組裝超材料細(xì)胞來創(chuàng)建結(jié)構(gòu)產(chǎn)品。
圖1 超材料填充結(jié)構(gòu)
為了達(dá)到超材料的最優(yōu)表現(xiàn),如比剛度最大、吸能最大的最佳力學(xué)性能,散熱最快的最佳熱力學(xué)性能,最佳聲學(xué)性質(zhì)等,需要在兩個(gè)尺度上定義設(shè)計(jì)變量,以優(yōu)化系統(tǒng)性能。在現(xiàn)有技術(shù)中,均質(zhì)化法和固體各向同性材料懲罰模型等拓?fù)鋬?yōu)化已被用于生成宏觀尺度結(jié)構(gòu),其中包含各種密度水平的灰色單元,灰色單元被轉(zhuǎn)換為預(yù)定義模式的介觀結(jié)構(gòu)。然而,相同密度水平的不同介觀結(jié)構(gòu)設(shè)計(jì)可能具有非常不同的性能。為了解決這個(gè)問題,學(xué)者們已經(jīng)開發(fā)出了一種參數(shù)化水平集方法來同時(shí)優(yōu)化結(jié)構(gòu)和填充超材料單胞。上述方法依賴于基于梯度的優(yōu)化算法,考慮到?jīng)_擊、碰撞、爆炸等瞬態(tài)非線性行為,解析梯度無法用于結(jié)構(gòu)優(yōu)化,因?yàn)閿?shù)值和物理噪聲及分岔會(huì)加劇瞬態(tài)動(dòng)態(tài)模擬的高非線性程度??紤]到傳統(tǒng)的預(yù)測(cè)方法存在明顯的局限性,學(xué)者們提出使用數(shù)據(jù)驅(qū)動(dòng)的方法來提升超材料力學(xué)性能的預(yù)測(cè)效率與準(zhǔn)確性。
顯然,數(shù)據(jù)驅(qū)動(dòng)設(shè)計(jì)效果的優(yōu)劣取決于數(shù)據(jù)保真度與數(shù)據(jù)量,其中保真度指數(shù)據(jù)或模型與客觀規(guī)律的相似程度。已有研究中,超材料力學(xué)性能數(shù)據(jù)有物理試驗(yàn)與仿真分析兩種獲取方式。物理試驗(yàn)數(shù)據(jù)采集過程復(fù)雜,人力、時(shí)間成本耗費(fèi)大,難以達(dá)到滿足建模精度的數(shù)據(jù)量。隨著超算應(yīng)用的普及,仿真數(shù)據(jù)的獲取成本大幅降低,短時(shí)間即可生成十萬甚至百萬量級(jí)的數(shù)據(jù),但仿真數(shù)據(jù)和試驗(yàn)相比往往存在一定的誤差,基于仿真數(shù)據(jù)的優(yōu)化設(shè)計(jì)效果會(huì)具有一定的局限性。由此,僅使用單一來源的數(shù)據(jù)難以滿足超材料力學(xué)性能優(yōu)化設(shè)計(jì)對(duì)數(shù)據(jù)保真度與數(shù)據(jù)量的需求。工業(yè)設(shè)計(jì)領(lǐng)域中,學(xué)者們常常使用多保真度代理模型融合不同來源的數(shù)據(jù)集構(gòu)建模型來解決類似問題。遺憾的是,由于超材料具有力學(xué)性能數(shù)據(jù)輸入變量多、非線性強(qiáng)、不同來源數(shù)據(jù)成本差異極大的特點(diǎn),已有的多保真度代理模型構(gòu)建方法擬合效果較差。
為解決上述問題,筆者提出一種基于神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)思想的多保真度代理模型構(gòu)建方法,基于此方法構(gòu)建多保真度神經(jīng)網(wǎng)絡(luò)的超材料力學(xué)性能預(yù)測(cè)框架??蚣茚槍?duì)超材料力學(xué)性能預(yù)測(cè)問題與多保真度代理模型的特性,對(duì)傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)框架進(jìn)行改進(jìn)與完善,提升設(shè)計(jì)精度與效率。筆者以具體工程問題為例,闡明方法的效果與優(yōu)勢(shì)。
神經(jīng)網(wǎng)絡(luò)是許多個(gè)神經(jīng)元按一定的層次結(jié)構(gòu)連接組成的機(jī)器學(xué)習(xí)模型,最基本成分神經(jīng)元模型具體形式如圖2所示。其中,xi表示第i個(gè)輸入變量,wi表示第i個(gè)輸入變量的權(quán)重,b表示神經(jīng)元的偏置,f()表示神經(jīng)元的激活函數(shù),y表示神經(jīng)元的輸出。
圖2 神經(jīng)元模型具體形式
作為工程問題中常用的代理模型,具有多層神經(jīng)元的神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的數(shù)據(jù)擬合能力。給定訓(xùn)練數(shù)據(jù)集后,各個(gè)神經(jīng)元的權(quán)重與偏置可以通過訓(xùn)練獲得。誤差逆?zhèn)鞑ニ惴ㄊ悄壳白畛S玫挠?xùn)練方法,具體流程為:首先將輸入提供給輸入層神經(jīng)元,逐層將信號(hào)前傳,直到產(chǎn)生輸出層結(jié)果;然后計(jì)算輸出層的誤差,將誤差逆?zhèn)鞑ブ粮鲗由窠?jīng)元;最后根據(jù)各層神經(jīng)元的誤差來對(duì)各個(gè)神經(jīng)元的權(quán)重與偏置進(jìn)行調(diào)整。迭代過程循環(huán)進(jìn)行,直至達(dá)到停止條件,即可獲得預(yù)測(cè)精度較高的神經(jīng)網(wǎng)絡(luò)。
遷移學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)重要分支,是解決小樣本問題的重要手段,廣泛應(yīng)用于圖像識(shí)別、自然語言處理等領(lǐng)域。遷移學(xué)習(xí)的基本思想為:當(dāng)兩個(gè)模型描述的問題不同但相關(guān),且兩個(gè)模型的形式與結(jié)構(gòu)一致時(shí),他們的模型參數(shù)也存在相似性;如果構(gòu)建其中一個(gè)模型所需的數(shù)據(jù)不足,模型參數(shù)可以通過對(duì)另一個(gè)模型的參數(shù)進(jìn)行微調(diào)獲得。
在本研究中,神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)思想被應(yīng)用于多保真度代理模型的構(gòu)建。擬合低保真度數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)與擬合高保真度數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)間必然存在相似性,通過控制訓(xùn)練過程的方式,可以人為將相似性集中于神經(jīng)網(wǎng)絡(luò)的前幾層,稱為通用特征層,并在后幾層,稱為特定特征層,體現(xiàn)出差異性。由此,大量的低保真度數(shù)據(jù)可以被應(yīng)用于保證兩個(gè)神經(jīng)網(wǎng)絡(luò)前幾層的有效性,只需要少量高保真度數(shù)據(jù),即可完成對(duì)擬合高保真度數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。
針對(duì)現(xiàn)有技術(shù)存在的不足,本研究提出一種基于遷移學(xué)習(xí)-多保真度建模的介觀結(jié)構(gòu)件力學(xué)性能預(yù)測(cè)方法,使用低保真度數(shù)據(jù)訓(xùn)練低保真度神經(jīng)網(wǎng)絡(luò),基于遷移學(xué)習(xí)中的微調(diào)方法,使用高保真度數(shù)據(jù)重訓(xùn)練低保真度神經(jīng)網(wǎng)絡(luò),獲得最終的多保真度神經(jīng)網(wǎng)絡(luò)模型,多保真度神經(jīng)網(wǎng)絡(luò)可以以較高的精度預(yù)測(cè)介觀結(jié)構(gòu)件對(duì)應(yīng)的力學(xué)性能。預(yù)測(cè)流程如圖3所示。這一方法可融合不同保真度數(shù)據(jù)進(jìn)行建模,并且相比傳統(tǒng)的協(xié)同克里金算法對(duì)高保真度數(shù)據(jù)需求量較少,降低了介觀力學(xué)性能的預(yù)測(cè)成本。預(yù)測(cè)框架包括如下步驟:
圖3 預(yù)測(cè)流程
(1) 初始化多保真度神經(jīng)網(wǎng)絡(luò),即定義多保真度神經(jīng)網(wǎng)絡(luò)的輸入與輸出,并定義多保真度神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu);
(2) 重復(fù)進(jìn)行拉丁超立方采樣,對(duì)訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集中樣本點(diǎn)的輸入進(jìn)行設(shè)計(jì),訓(xùn)練數(shù)據(jù)集包含低保真度數(shù)據(jù)集與高保真度數(shù)據(jù)集兩個(gè)子集,用于訓(xùn)練多保真度神經(jīng)網(wǎng)絡(luò),測(cè)試數(shù)據(jù)集用于計(jì)算多保真度神經(jīng)網(wǎng)絡(luò)的精度;
(3) 基于有限元仿真獲取訓(xùn)練數(shù)據(jù)集與驗(yàn)證數(shù)據(jù)集中樣本點(diǎn)的輸出;
(4) 基于多保真度訓(xùn)練數(shù)據(jù)集,結(jié)合遷移學(xué)習(xí)思想,構(gòu)建多保真度神經(jīng)網(wǎng)絡(luò);
(5) 基于多保真度神經(jīng)網(wǎng)絡(luò),測(cè)試樣本集中樣本點(diǎn)的輸出,并計(jì)算R2參數(shù),表征預(yù)測(cè)精度,判斷是否達(dá)到精度要求;
(6) 根據(jù)獲得的多保真度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行力學(xué)性能預(yù)測(cè)。
R2參數(shù)是一種用于評(píng)估回歸模型擬合優(yōu)度的統(tǒng)計(jì)量,表示因變量的方差中可由自變量解釋部分所占的比例。
多保真度神經(jīng)網(wǎng)絡(luò)架構(gòu)如圖4所示,包含輸入層、通用特征層、兩組具有相同架構(gòu)的特定特征層、輸出層。一組數(shù)據(jù)經(jīng)輸入層進(jìn)入網(wǎng)絡(luò),首先經(jīng)由通用特征層得到一組維度與通用特征層最后一層中神經(jīng)元數(shù)量一致的輸出,即通用特征輸出。接著將通用特征輸出作為輸入,分別輸入兩組特定特征層,經(jīng)由這兩組特定特征層的變換后得到對(duì)應(yīng)保真度的輸出。面向不同的數(shù)據(jù)集時(shí),多保真度神經(jīng)網(wǎng)絡(luò)具體架構(gòu)的超參數(shù)會(huì)存在差異,如通用特征層數(shù)量、特定特征層數(shù)量、各隱藏層中的神經(jīng)元數(shù)量等。
圖4 多保真度神經(jīng)網(wǎng)絡(luò)架構(gòu)
為了訓(xùn)練多保真度神經(jīng)網(wǎng)絡(luò),提出一個(gè)新的損失函數(shù):
Loss=Loss1+αLoss2
(1)
損失函數(shù)的核心思想為使訓(xùn)練過程中特定特征層的參數(shù)只受對(duì)應(yīng)數(shù)據(jù)集預(yù)測(cè)精度的影響,通用特征層參數(shù)受兩個(gè)數(shù)據(jù)集預(yù)測(cè)精度的共同影響,以此控制神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的通用特征最大化。
多保真度神經(jīng)網(wǎng)絡(luò)比傳統(tǒng)多保真度代理模型精度更高,更適用于超材料力學(xué)性能預(yù)測(cè),這主要有兩點(diǎn)原因。一是神經(jīng)網(wǎng)絡(luò)的基本原理為空間變換,由于神經(jīng)網(wǎng)絡(luò)的層次結(jié)構(gòu),這種空間變換是逐層實(shí)現(xiàn)的,數(shù)據(jù)每經(jīng)過一層神經(jīng)元都是一次空間變換,擬合低保真度數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)與擬合高保真度數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)間必然存在相似性,通過控制訓(xùn)練過程的方式,可以人為將相似性集中于神經(jīng)網(wǎng)絡(luò)的前幾層,以最大化利用不同保真度數(shù)據(jù)集,從而顯著提升多保真度代理模型的精度。二是神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法為分批次訓(xùn)練的方式,這樣的方式不會(huì)受到數(shù)據(jù)量的影響,而使用過大的數(shù)據(jù)訓(xùn)練以傳統(tǒng)的協(xié)同克里金算法等模型為基底的多保真度代理模型時(shí),容易出現(xiàn)內(nèi)存溢出、擬合失敗的情況。
為研究涉及的介觀單胞結(jié)構(gòu),三種不同的單胞具有不同的楊氏模量與泊松比,如圖5所示。介觀結(jié)構(gòu)網(wǎng)格如圖6所示,加載工況如圖7所示。筆者以此為例,驗(yàn)證所提出框架的有效性。在矩形設(shè)計(jì)網(wǎng)格中填充3×4個(gè)介觀結(jié)構(gòu)單元,構(gòu)建二維矩形板。為采集不同保真度的數(shù)據(jù)集,建立兩種不同精度的有限元模型。高保真度有限元模型具有足夠高的分辨率,因此可以捕獲每個(gè)單元的介觀結(jié)構(gòu)幾何特征。基礎(chǔ)材料鋼的屬性被分配給高保真度有限元模型的每個(gè)網(wǎng)格單元,基礎(chǔ)材料的楊氏模量為210 000 MPa,泊松比為0.3,密度為7.9 g/cm3。在低保真度有限元模型中,每個(gè)介觀結(jié)構(gòu)細(xì)胞由一個(gè)網(wǎng)格單元表示,并賦予每個(gè)網(wǎng)格相應(yīng)介觀結(jié)構(gòu)單胞的均質(zhì)化等效泊松比與彈性模量。加載工況下,介觀結(jié)構(gòu)件為一邊固定邊界、兩邊自由邊界、一邊受5 000 N均布力壓縮。研究的目標(biāo)是預(yù)測(cè)在加載工況下介觀結(jié)構(gòu)件頂端中點(diǎn)的位移。
圖5 三種介觀單胞結(jié)構(gòu)
圖6 介觀結(jié)構(gòu)網(wǎng)格
圖7 加載工況
本研究的高低保真度數(shù)據(jù)集自動(dòng)化構(gòu)建采集流程如圖8所示。
圖8 高低保真度數(shù)據(jù)集采集流程
(1) 根據(jù)超材料結(jié)構(gòu)預(yù)測(cè)的任務(wù)要求,確定設(shè)計(jì)變量、設(shè)計(jì)空間,設(shè)定初始樣本點(diǎn)數(shù)為400,并令迭代計(jì)數(shù)參數(shù)i為1。
(2) 當(dāng)i為1時(shí),進(jìn)行初始樣本點(diǎn)設(shè)計(jì),采用拉丁超立方試驗(yàn)設(shè)計(jì)方法在設(shè)計(jì)空間內(nèi)獲得400個(gè)初始試驗(yàn)樣本點(diǎn)輸入值,保存為StaticDOE.mat。
(3) 應(yīng)用MATLAB 軟件讀取StaticDOE.mat中樣本點(diǎn)輸入值,并依此編輯文本進(jìn)行參數(shù)化建模,建立介觀結(jié)構(gòu)靜態(tài)仿真模型inp文件,命名為i_struct_case1.inp和i_struct_case2.inp,分別對(duì)應(yīng)靜態(tài)壓縮載荷和剪切載荷下的仿真模型。inp文件中聲明了結(jié)構(gòu)的節(jié)點(diǎn)編號(hào)、節(jié)點(diǎn)集合、單元編號(hào)、單元集合、材料屬性、邊界條件、加載方式。
(4) 應(yīng)用MATLAB 軟件調(diào)用命令行cmd.exe,將i_struct_case1.inp和i_struct_case2.inp分別提交至ABAQUS求解器進(jìn)行計(jì)算,生成相應(yīng)的輸出場(chǎng)文件i_struct_case1.odb和i_struct_case2.odb。
(5) 應(yīng)用MATLAB 軟件調(diào)用Python程序post_process.py,提取出輸出場(chǎng)文件i_struct_case1.odb和i_struct_case2.odb中最后一個(gè)框架對(duì)應(yīng)的結(jié)構(gòu)件上端中點(diǎn)的位移,并保存為文本文件NodeDisp.txt。
(6) 迭代參數(shù)i加1,重復(fù)步驟(3)至步驟(5),獲取不同樣本點(diǎn)的相應(yīng)響應(yīng)值,并輸出為文本文件。
經(jīng)過上述循環(huán)計(jì)算,構(gòu)建本研究使用的高保真度與低保真度數(shù)據(jù)集,為基于遷移學(xué)習(xí)的多保真度建模提供支撐。
本研究的超材料介觀結(jié)構(gòu)件包含12個(gè)介觀單胞結(jié)構(gòu),令多保真度神經(jīng)網(wǎng)絡(luò)的輸入X為[x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12]。介觀結(jié)構(gòu)件力學(xué)性能為加載工況下介觀結(jié)構(gòu)件頂端中點(diǎn)的位移。令多保真度神經(jīng)網(wǎng)絡(luò)的輸入為Y,多保真度神經(jīng)網(wǎng)絡(luò)包含輸入層、隱藏層、輸出層,輸入層數(shù)量為1,層內(nèi)包含與輸入X維度相等數(shù)量的神經(jīng)元。隱藏層分為通用特征層與特定特征層,通用特征層數(shù)量為2,每層包含16個(gè)神經(jīng)元,特定特征層數(shù)量為1,層內(nèi)包含16個(gè)神經(jīng)元。輸出層數(shù)量為1,層內(nèi)包含1個(gè)神經(jīng)元。
訓(xùn)練數(shù)據(jù)集包含低保真度數(shù)據(jù)集與高保真度數(shù)據(jù)集兩個(gè)子集,分別包含PTL與PTH個(gè)樣本點(diǎn)。測(cè)試數(shù)據(jù)集包含PV個(gè)樣本點(diǎn)。其中,訓(xùn)練數(shù)據(jù)集用于訓(xùn)練多保真度神經(jīng)網(wǎng)絡(luò),測(cè)試數(shù)據(jù)集用于計(jì)算多保真度神經(jīng)網(wǎng)絡(luò)的精度?;谟邢拊抡娅@取訓(xùn)練數(shù)據(jù)集與驗(yàn)證數(shù)據(jù)集中樣本點(diǎn)的輸出為Y1與Y2。低保真度數(shù)據(jù)集的輸出由粗糙網(wǎng)格有限元仿真獲得,即將介觀結(jié)構(gòu)件劃分為12個(gè)殼單元網(wǎng)格,為每個(gè)殼單元賦予介觀單胞結(jié)構(gòu)對(duì)應(yīng)的楊氏模量與泊松比。高保真度數(shù)據(jù)集的輸出由精細(xì)網(wǎng)格有限元仿真獲得,即將介觀結(jié)構(gòu)件粗糙網(wǎng)格中12個(gè)殼單元網(wǎng)格分別替換為對(duì)應(yīng)介觀單胞結(jié)構(gòu)真實(shí)結(jié)構(gòu)的精細(xì)網(wǎng)格,并為每一個(gè)精細(xì)網(wǎng)格殼單元賦予介觀結(jié)構(gòu)件材料自身的楊氏模量與泊松比。粗糙網(wǎng)格如圖9所示,精細(xì)網(wǎng)格如圖10所示。
圖9 粗糙網(wǎng)格
圖10 精細(xì)網(wǎng)格
基于訓(xùn)練數(shù)據(jù)集中的低保真度數(shù)據(jù)集訓(xùn)練低保真度神經(jīng)網(wǎng)絡(luò),訓(xùn)練優(yōu)化器為Adam算法,損失函數(shù)為均方誤差,均方誤差損失函數(shù)具體表達(dá)式為:
(2)
凍結(jié)低保真度神經(jīng)網(wǎng)絡(luò)的通用特征層,微調(diào)獲得多保真度神經(jīng)網(wǎng)絡(luò)之后,計(jì)算R2參數(shù),表征預(yù)測(cè)精度。R2參數(shù)表達(dá)式為:
(3)
本文方法的預(yù)測(cè)精度與傳統(tǒng)協(xié)同克里金算法的比較見表1。
表1 預(yù)測(cè)精度比較
在三種不同的高保真度數(shù)據(jù)樣本量的測(cè)試中,本文方法相比傳統(tǒng)協(xié)同克里金算法預(yù)測(cè)精度提升20個(gè)百分點(diǎn)以上,即相同的成本下,本文方法的預(yù)測(cè)精度顯著優(yōu)于傳統(tǒng)方法。另一方面,本文方法在PTL為20時(shí)的預(yù)測(cè)精度為56.1%,與傳統(tǒng)方法在PTL為40時(shí)的預(yù)測(cè)精度接近,說明達(dá)到相同預(yù)測(cè)精度水平,本文方法的所需成本顯著低于傳統(tǒng)方法。
筆者提出一種超材料力學(xué)性能預(yù)測(cè)框架,可以用于超材料填充結(jié)構(gòu)多尺度設(shè)計(jì)優(yōu)化,通過集成多保真度神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)算法,提高預(yù)測(cè)效率與精度。
這一方法平衡了單一來源數(shù)據(jù)在精度與開發(fā)成本上的矛盾,提高了超材料力學(xué)性能預(yù)測(cè)的效率,在實(shí)際應(yīng)用中可擴(kuò)展至沖擊、碰撞、爆炸等瞬態(tài)非線性行為的預(yù)測(cè)。
面向超材料力學(xué)性能預(yù)測(cè)問題具有的高維、強(qiáng)非線性特點(diǎn),提出基于神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)思想的多保真度神經(jīng)網(wǎng)絡(luò)。應(yīng)用案例的測(cè)試結(jié)果表明,所提出的多保真度神經(jīng)網(wǎng)絡(luò)對(duì)高成本數(shù)據(jù)的需求顯著降低,且精度顯著優(yōu)于同樣數(shù)據(jù)成本構(gòu)建的其它模型。