国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應(yīng)用GPU求解的實(shí)時子結(jié)構(gòu)試驗(yàn)架構(gòu)與性能驗(yàn)證

2022-04-04 16:48董曉輝唐貞云李振寶杜修力
振動工程學(xué)報 2022年1期

董曉輝 唐貞云 李振寶 杜修力

摘要:使用圖形處理器( GPU)代替?zhèn)鹘y(tǒng)中央處理器(CPU)作為數(shù)值求解硬件,建立基于LABVIEWMATLAB-GPU的實(shí)時子結(jié)構(gòu)試驗(yàn)架構(gòu)。以土結(jié)相互作用系統(tǒng)為載體,通過數(shù)值仿真與試驗(yàn)對該架構(gòu)的性能進(jìn)行驗(yàn)證。試驗(yàn)與仿真結(jié)果表明,本文方法將實(shí)時子結(jié)構(gòu)試驗(yàn)中數(shù)值子結(jié)構(gòu)求解自由度提高到27000,提升了數(shù)值模型求解規(guī)模,拓展了實(shí)時子結(jié)構(gòu)試驗(yàn)應(yīng)用范圍。

關(guān)鍵詞:實(shí)時子結(jié)構(gòu)試驗(yàn);圖形處理器;數(shù)值積分算法;振動臺;有限元模擬

中圖分類號:TU311.3;TU352.1

文獻(xiàn)標(biāo)志碼:A

文章編號:10044523( 2022)01-006408

DOI: 10.1638 5/j .cnki.issn.10044523.2022.01.007

引言

實(shí)時子結(jié)構(gòu)試驗(yàn)[1]是一種結(jié)合物理試驗(yàn)與數(shù)值計算的試驗(yàn)方法,該方法將需要重點(diǎn)研究及難以建模的部分進(jìn)行物理試驗(yàn),其他部分采用數(shù)值建模的方式進(jìn)行仿真,兩部分之間數(shù)據(jù)實(shí)時交互傳輸,使得對大型復(fù)雜結(jié)構(gòu)進(jìn)行大尺寸試驗(yàn)成為可能[2]。在實(shí)時子結(jié)構(gòu)試驗(yàn)中,為了保證求解實(shí)時性,數(shù)值子結(jié)構(gòu)求解通常采用諸如中小差分法等求解效率高的顯式積分算法,顯式積分算法的缺點(diǎn)是條件穩(wěn)定性,為了保證求解穩(wěn)定,積分步長(△t)越小越好[3]。過小的積分步長限制了數(shù)值子結(jié)構(gòu)計算規(guī)模,無法滿足實(shí)際試驗(yàn)研究需求[4]。為了解決上述問題,可行的手段主要包括:改進(jìn)數(shù)值求解算法[5]和提高數(shù)值求解效率[6]。

在算法研究方面,Chang等[7]、Nakashima等[8]分別研究了無條件穩(wěn)定的擬動力顯式算法,此方法在實(shí)時子結(jié)構(gòu)試驗(yàn)中為隱式方法。Wu等[9]將上述方法擴(kuò)展成為了適于實(shí)時子結(jié)構(gòu)試驗(yàn)的無條件顯式方法?;诩扔蟹e分方法,Nakashima等[10]提出將數(shù)值求解分為模型動力分析(RAT)與信號處理生成(SGT)兩部分,實(shí)現(xiàn)了△t=330 ms條件下10自由度或△t=500 ms條件下12自由度結(jié)構(gòu)實(shí)時子結(jié)構(gòu)試驗(yàn)。Cheng等[11]結(jié)合MATLAB軟件開發(fā)“Hy-bridFEM”程序,將有限元與實(shí)時子結(jié)構(gòu)試驗(yàn)技術(shù)相結(jié)合,實(shí)現(xiàn)了△t=10 ms條件下122自由度結(jié)構(gòu)實(shí)時混合試驗(yàn)。Chae等[12]使用Hybrid-FEM技術(shù)開展了△t=10 ms條件下514自由度結(jié)構(gòu)實(shí)時混合試驗(yàn)。Saouma等”開發(fā)了在實(shí)時硬件上運(yùn)行的Mercury軟件,完成了△t=10 ms條件下405自由度的高度非線性模型實(shí)時混合試驗(yàn)。Zhu等[4]實(shí)現(xiàn)了△t=20 ms條件下1240自由度結(jié)構(gòu)實(shí)時混合試驗(yàn)。綜上所述,算法的研究及有限元技術(shù)的發(fā)展,提升了數(shù)值子結(jié)構(gòu)實(shí)時求解能力,但目前的求解規(guī)模仍在2000以內(nèi)。

傳統(tǒng)的數(shù)值子結(jié)構(gòu)計算是基于電腦的中央處理器(CPU)運(yùn)算,由于硬件架構(gòu)不同,在大規(guī)模數(shù)值計算時使用圖形處理器(GPU)更有優(yōu)勢。在土木T程領(lǐng)域,GPU技術(shù)也得到應(yīng)用。Durand等[14]基于GPU并行使用離散元的方法計算模擬巖石與混凝土接觸問題,相比CPU,計算速度提高了30倍。解琳琳等15基于GPU對城市地震災(zāi)害模擬,對建筑結(jié)構(gòu)非線性分析,相比CPU,計算速度提升了39倍。綜上可見,GPU在土木工程領(lǐng)域具有很好的發(fā)展前景。這為通過改善硬件能力來提高實(shí)時子結(jié)構(gòu)試驗(yàn)系統(tǒng)中數(shù)值求解效率創(chuàng)造了條件?;诖耍疚奶岢隽嘶贕PU計算的實(shí)時子結(jié)構(gòu)試驗(yàn)系統(tǒng)架構(gòu),分別從數(shù)值仿真與實(shí)時子結(jié)構(gòu)試驗(yàn)兩方面討論了該試驗(yàn)架構(gòu)的可能性與實(shí)際性能。

1 試驗(yàn)系統(tǒng)架構(gòu)

在基于GPU求解的實(shí)時子結(jié)構(gòu)試驗(yàn)系統(tǒng)中,用GPU代替?zhèn)鹘y(tǒng)CPU作為數(shù)值子結(jié)構(gòu)求解硬件。為建立基于GPU求解的試驗(yàn)系統(tǒng),有兩個問題需要解決:其一,如何實(shí)現(xiàn)GPU求解的數(shù)值子結(jié)構(gòu)與試驗(yàn)子結(jié)構(gòu)之間信號實(shí)時交互;其二,如何使用GPU求解大規(guī)模的數(shù)值子結(jié)構(gòu)模型。

1.1 試驗(yàn)系統(tǒng)架構(gòu)組成

基于GPU求解的實(shí)時子結(jié)構(gòu)試驗(yàn)系統(tǒng)包括如圖1所示的三個部分,分別是數(shù)值子結(jié)構(gòu)、信號傳輸和試驗(yàn)子結(jié)構(gòu)。數(shù)值子結(jié)構(gòu)求解環(huán)節(jié)基于GPU硬件實(shí)現(xiàn)對數(shù)值子結(jié)構(gòu)模型動力響應(yīng)的實(shí)時計算。快速準(zhǔn)確的數(shù)值模型動力求解是實(shí)時子結(jié)構(gòu)試驗(yàn)的必要條件,因此要滿足GPU數(shù)值子結(jié)構(gòu)模型求解實(shí)時性和求解過程穩(wěn)定的要求。解決GPU求解實(shí)時性的方法可分為軟件實(shí)時和硬件實(shí)時兩種方法。軟件實(shí)時方法是通過LABVIEW等軟件的定時循環(huán)結(jié)構(gòu)控制每一步動力求解所需時間固定,或使用SIMULINK仿真軟件環(huán)境控制數(shù)值求解的時間。硬件實(shí)時方法是在例如dSPACE,Speedgoat等硬件實(shí)時系統(tǒng)中編寫數(shù)值模型動力分析程序,實(shí)時性高,數(shù)值求解高效穩(wěn)定。

信號傳輸部分的作用在于確保(JPU求解的數(shù)值子結(jié)構(gòu)與試驗(yàn)子結(jié)構(gòu)之間數(shù)據(jù)實(shí)時通訊。兩部分之間可通過數(shù)字信號或電信號模擬量通訊。數(shù)字信號通訊的方法可選用共享內(nèi)存卡、TCP/IP或UDP等方法實(shí)現(xiàn)兩部分之間數(shù)字信號傳輸,此方法抗干擾能力較強(qiáng),對實(shí)驗(yàn)環(huán)境要求較低;使用電信號模擬量通訊須將數(shù)值求解計算機(jī)的發(fā)出數(shù)字信號轉(zhuǎn)換為電信號模擬量傳輸?shù)皆囼?yàn)子結(jié)構(gòu)部分。此方法易于操作,但易受到試驗(yàn)環(huán)境干擾的影響。

試驗(yàn)子結(jié)構(gòu)部分對試驗(yàn)試件物理加載,其功能與傳統(tǒng)基于CPU的混合試驗(yàn)方式相同。實(shí)時子結(jié)構(gòu)試驗(yàn)時,信號傳輸部分將數(shù)值求解所得界面響應(yīng)傳輸給加載系統(tǒng)控制器,而后控制加載系統(tǒng)將界面響應(yīng)施加給物理子結(jié)構(gòu)。通過傳感器測得試驗(yàn)子結(jié)構(gòu)對數(shù)值子結(jié)構(gòu)的反作用響應(yīng),并通過信號傳輸部分傳輸?shù)綌?shù)值子結(jié)構(gòu)。

1.2

GPU求解方法

目前具有GPU求解功能的軟件有ABAQUS,OpenSEES,ANSYS等有限元軟件以及MATLAB等數(shù)學(xué)計算軟件。實(shí)現(xiàn)基于GPU求解數(shù)值模型,還可使用Python,C++等編程語言編寫動力分析程序。使用例如ABAQUS有限元軟件時,需要對試驗(yàn)?zāi)P驼w建模,在作業(yè)設(shè)置中設(shè)置GPU并行計算。試驗(yàn)時將整體試驗(yàn)?zāi)P偷囊徊糠肿鳛樵囼?yàn)子結(jié)構(gòu),利用軟件提供的接口程序與OpenFresco等軟件交互,實(shí)現(xiàn)與物理試驗(yàn)設(shè)備的交互[16-17]。使用MATLAB軟件時可利用Parallel Compuring Tool-box (PCT)工具箱,PCT 工具箱支持多核CPU及GPU并行計算功能,在大型矩陣運(yùn)算時使用GPU并行能顯著提升計算效率。在MATLAB軟件中編寫動力分析程序,利用例如LABVIEW,dSPACE等即可與物理試驗(yàn)系統(tǒng)數(shù)據(jù)交互。使用C++等語言編寫程序時,可利用NVIDIA公司推出的CUDA并行計算架構(gòu),編寫動力分析程序,并添加數(shù)據(jù)通訊接口功能。其中在大規(guī)模矩陣計算時利用CUDA庫函數(shù)實(shí)現(xiàn)GPU并行求解,可顯著提升求解效率。

2 基于MATLAB的GPU求解性能

如前述可知,可采用GPU進(jìn)行動力求解的軟件較多,本文選擇MATLAB作為數(shù)值求解T具驗(yàn)證基于(JPU的實(shí)時子結(jié)構(gòu)試驗(yàn)架構(gòu)的可行性。應(yīng)用MATLAB軟件的PCT 工具箱,調(diào)用GPU代替CPU進(jìn)行數(shù)值子結(jié)構(gòu)動力分析。使用GPU與CPU對相同模型進(jìn)行動力時程分析,驗(yàn)證MATLAB軟件基于GPU求解的性能。

2.1 實(shí)施方案

不同于商用有限元軟件具有前處理功能,采用MATLAB進(jìn)行動力求解前需要建立數(shù)值子結(jié)構(gòu)動力方程,數(shù)值子結(jié)構(gòu)的剛度和質(zhì)量矩陣往往借助商用有限元軟件的前處理功能得到。在MATLAB軟件中使用GPU求解時,需將剛度、質(zhì)量及阻尼矩陣等數(shù)據(jù)使用gpuArray函數(shù)初始化為GPU格式,同時將數(shù)據(jù)保存于GPU顯存中。使用GPU對數(shù)值子結(jié)構(gòu)動力分析時,求解過程的程序與使用CPU計算相同。數(shù)值模型動力分析完成后,將數(shù)值子結(jié)構(gòu)與物理子結(jié)構(gòu)接觸點(diǎn)的交互值傳輸?shù)叫盘杺鬏敳糠郑枰褂胓ather函數(shù)將交互值轉(zhuǎn)化為普通格式的數(shù)據(jù)。使用MATLAB-GPU進(jìn)行實(shí)時子結(jié)構(gòu)試驗(yàn)時數(shù)值子結(jié)構(gòu)部分流程圖如圖2所示。圖2中左側(cè)部分為在CPU硬件上的工作,右側(cè)部分為GPU硬件上的工作,主要計算求解在GPU硬件上進(jìn)行。

為了快速建立數(shù)值子結(jié)構(gòu)動力方程,本文使用ABAQUS有限元軟件完成數(shù)值子結(jié)構(gòu)前處理。通過改變模型網(wǎng)格間距調(diào)整模型白由度數(shù),及數(shù)值子結(jié)構(gòu)求解規(guī)模。完成前處理后,在模型參數(shù)文件中添加模型參數(shù)矩陣輸出代碼,重新提交作業(yè)后即可得到模型的質(zhì)量、剛度矩陣。從ABAQUS有限元軟件中僅能提取質(zhì)量及剛度參數(shù),模型的阻尼采用如下式所示的瑞利阻尼,通過剛度和質(zhì)量矩陣構(gòu)建阻尼矩陣:

C= a0M+ a1K

(l)式中 C為阻尼矩陣,M為質(zhì)量矩陣,K為剛度矩陣,a0和a1是兩個比例參數(shù),根據(jù)前兩階模態(tài)頻率確定。

2.2 仿真參數(shù)

為驗(yàn)證本文采用的基于MATLAB-GPU求解數(shù)值模型方案的可行性,采用如圖3所示的三維土一結(jié)相互作用系統(tǒng)作為算例,其中上部結(jié)構(gòu)作為物理子結(jié)構(gòu),土體作為數(shù)值子結(jié)構(gòu)。本文重點(diǎn)研究GPU對數(shù)值求解的加速效果,選用求解效率高的中心差分法作為動力分析算法。為滿足中心差分法收斂條件,對數(shù)值子結(jié)構(gòu)土體模型參數(shù)進(jìn)行調(diào)整。數(shù)值模型尺寸為30 m×30 m×15 m,密度為1×10 4 kg/m3,彈性模量為2.11×10 8 Pa,泊松比為0.33,阻尼比為0.05,通過對模型四周與底面節(jié)點(diǎn)設(shè)置彈簧及阻尼器模擬遠(yuǎn)場土體邊界條件。邊界節(jié)點(diǎn)法向彈簧剛度為20000 N/m,法向阻尼器阻尼值為1.437×10 6 N/( m/s),切向彈簧剛度為10000 N/m,切向阻尼器阻尼值為9.45×10 6 N/( m/s)。在ABAQUS軟件中對土體有限元模型劃分網(wǎng)格,每個節(jié)點(diǎn)有3個白由度,通過改變網(wǎng)格間距的大小控制數(shù)值子結(jié)構(gòu)模型白由度數(shù),即數(shù)值求解計算量大小。本節(jié)的目的在于討論GPU的數(shù)值求解性能,僅對數(shù)值子結(jié)構(gòu)進(jìn)行動力分析。模型荷載為El-Centro波,加速度時程幅值為0.48g,結(jié)構(gòu)動力分析方法為中心差分法。

為了對比基于MATLAB的GPU和CPU求解性能,分別使用裝有消費(fèi)級GPU的筆記本電腦(PC)和裝有專業(yè)計算級GPU的服務(wù)器對比,PC與服務(wù)器硬件配置參數(shù)如表1所示。

2.3 仿真結(jié)果

為了對比CPU與GPU計算效率,需要在計算過程中記錄各白的耗時情況。試驗(yàn)中在動力分析算法開始部分添加函數(shù)tic,結(jié)束部分添加函數(shù)toc,記錄求解所用的時間。仿真中數(shù)值模型白由度分別取3888白由度、6591白由度及27000白由度。使用PC及服務(wù)器計算,對比分別使用GPU及CPU求解時每一步長的平均用時,對比結(jié)果如表2所示。表中SR (Speedup Ratio)為加速比,加速比計算公式如下:

SR =TCPU/TGPU

(2)

式中 TCPU為使用CPU求解每一積分步長平均所用時間;TGPU為使用GPU求解每一積分步長平均所用時間。

分析表2中的時間對比,當(dāng)模型白由度為3888時,使用PC與服務(wù)器CPU求解所用時間近似,說明在較小計算量運(yùn)算時,無法發(fā)揮服務(wù)器的性能。當(dāng)使用GPU求解時,服務(wù)器的GPU求解速度遠(yuǎn)超PC的GPU求解速度,且此時相比服務(wù)器CPU求解達(dá)到8.5倍的加速效果。當(dāng)模型白由度為6591時,使用PC的GPU求解達(dá)到MATLAB軟件求解上限。此時CPU計算一個步長需要68 ms,而GPU只需要21 ms,GPU的求解能力更適于實(shí)時子結(jié)構(gòu)試驗(yàn)需求。

使用服務(wù)器GPU求解時,MATLAB軟件求解上限白由度為27000。此時每個步長所需計算時長為17 ms,說明使用本文配置服務(wù)器的GPU基于MATLAB軟件最高可實(shí)現(xiàn)27000白由度數(shù)值模型的實(shí)時子結(jié)構(gòu)試驗(yàn)。此時服務(wù)器GPU相比服務(wù)器CPU求解可達(dá)到55倍的加速效果,使用GPU進(jìn)行數(shù)值模型求解的優(yōu)勢顯著。且此時使用服務(wù)器CPU求解時需要936 ms,遠(yuǎn)不能滿足實(shí)時子結(jié)構(gòu)試驗(yàn)的實(shí)時性要求。

為了對比使用CPU與GPU的求解精度,分別使用CPU與GPU計算,數(shù)值模型白由度為3888白由度,中心差分法積分步長分別取為1,5,20 ms,對比三個時間步長條件下使用CPU與GPU求解的數(shù)值模型頂部中心點(diǎn)加速度時程響應(yīng),響應(yīng)結(jié)果對比如圖4所示。圖4(a)為△t=1 ms使用CPU與GPU求解時時程曲線對比,可見CPU與GPU求解結(jié)果一致。為進(jìn)一步研究GPU求解精度,圖4(b)和(d)為△t=1,5,20 ms,將GPU求解位移時程DCPU作為X軸,CPU求解位移時程DCPU作為Y軸繪圖。從圖中可見均為直線,說明GPU求解結(jié)果與CPU具有同樣的精度,可以使用GPU代替CPU對數(shù)值模型進(jìn)行動力分析,提高求解效率。

3 試驗(yàn)實(shí)現(xiàn)與驗(yàn)證

將基于MATLAB軟件GPU求解數(shù)值模型應(yīng)用于實(shí)時子結(jié)構(gòu)試驗(yàn)中,設(shè)計基于GPU的實(shí)時子結(jié)構(gòu)試驗(yàn)系統(tǒng),并驗(yàn)證試驗(yàn)系統(tǒng)可行性。本文設(shè)計試驗(yàn)系統(tǒng)數(shù)值子結(jié)構(gòu)部分由ABAQUS軟件前處理并提取模型參數(shù),在LABVIEW軟件中調(diào)用MAT-LAB軟件的T具箱,實(shí)現(xiàn)基于GPU的數(shù)值模型動力分析。LABVIEW軟件保證數(shù)值子結(jié)構(gòu)求解的時間固定,同時完成數(shù)值與物理子結(jié)構(gòu)之間的數(shù)據(jù)傳輸。根據(jù)MATLAB軟件數(shù)值求解單步長平均用時及數(shù)值積分算法的積分步長,改變LABVIEW軟件的定時循環(huán)結(jié)構(gòu)周期,以保證數(shù)值求解的時間固定。

試驗(yàn)加載系統(tǒng)采用振動臺,對應(yīng)的實(shí)時試驗(yàn)系統(tǒng)架構(gòu)如圖5所示,試驗(yàn)子結(jié)構(gòu)對數(shù)值子結(jié)構(gòu)的反力與地震動荷載作為數(shù)值子結(jié)構(gòu)的外荷載?;贕PU的數(shù)值子結(jié)構(gòu)求解完成后將數(shù)值子結(jié)構(gòu)與試驗(yàn)子結(jié)構(gòu)接觸點(diǎn)的位移或加速度信號通過信號傳輸部分傳輸?shù)皆囼?yàn)子結(jié)構(gòu)。本文試驗(yàn)的目的在于驗(yàn)證基于GPU的實(shí)時子結(jié)構(gòu)試驗(yàn)實(shí)現(xiàn)過程的可行性,為了避免對研究中物理子結(jié)構(gòu)模型建模誤差的影響,此處的物理子結(jié)構(gòu)也通過數(shù)值建模實(shí)現(xiàn),只有振動臺為真實(shí)的,物理子結(jié)構(gòu)通過在dSPACE建模仿真。測量振動臺臺面的位移及加速度,將信號傳輸?shù)皆囼?yàn)子結(jié)構(gòu)仿真部分。試驗(yàn)子結(jié)構(gòu)部分采用dSPACE實(shí)時仿真環(huán)境進(jìn)行仿真,計算動力響應(yīng)并通過信號傳輸部分傳輸?shù)綌?shù)值子結(jié)構(gòu)部分,由此構(gòu)成基于GPU求解的實(shí)時子結(jié)構(gòu)試驗(yàn)系統(tǒng)。在本文試驗(yàn)系統(tǒng)中數(shù)值子結(jié)構(gòu)求解部分與表1中服務(wù)器配置相同,其他各部分配置情況如表3所示。

3.1 試驗(yàn)參數(shù)選取

數(shù)值子結(jié)構(gòu)模型與第2.2節(jié)仿真模型相同,試驗(yàn)子結(jié)構(gòu)選擇為水平方向單白由度模型,位于數(shù)值子結(jié)構(gòu)頂部中心與數(shù)值子結(jié)構(gòu)之間錨固連接。試驗(yàn)子結(jié)構(gòu)質(zhì)量m=7240 kg,剛度k=753250 N/m,阻尼c=440 N/( m/s)。在振動臺臺面布置加速度傳感器及位移傳感器。將白噪聲信號輸入振動臺,對振動臺系統(tǒng)識別,使用4階傳遞函數(shù)辨識振動臺特性,傳遞函數(shù)如下所示:

振動臺特性與辨識得到的傳遞函數(shù)幅值相位對比如圖6所示。振動臺系統(tǒng)信號在0--2 Hz之間時幅值和相位誤差都較小,振動臺信號在此頻率區(qū)間控制較為精準(zhǔn)。超過2 Hz后,振動臺幅值及相位差隨頻率增加而增大,因此需要在信號輸入振動臺之前添加外環(huán)控制器,對振動臺動力特性進(jìn)行補(bǔ)償?;谑剑?)所示振動臺動力模型,采用Tang等[18]提出的FSCS補(bǔ)償控制器進(jìn)行控制。

本試驗(yàn)系統(tǒng)基于Windows系統(tǒng),Windows系統(tǒng)是非實(shí)時系統(tǒng),由于系統(tǒng)實(shí)時性不穩(wěn)定問題,及LABVIEW軟件調(diào)用MATLAB的方法有通訊延遲,由此造成的信號傳輸有近3 ms的延遲。即數(shù)值子結(jié)構(gòu)動力分析完成后需要增加3 ms才能發(fā)送信號到信號傳輸部分,且在此3 ms期間MATLAB腳本停止計算。因此試驗(yàn)中最小時間步長如下所示:

△t=t solve+3

(4)式中 △t為中心差分法積分步長,t solve為數(shù)值模型求解所用時間,由此算法積分步長最小取為4 ms。步長太大對數(shù)值積分算法精度的影響較大,綜合考慮將本試驗(yàn)中最大時間步長取為20 ms。

3.2 試驗(yàn)結(jié)果

影響數(shù)值求解精度與效率的因素主要包括硬件性能、積分步長、自由度數(shù)和浮點(diǎn)數(shù)精度。本節(jié)對采用GPU和CPU求解時,不同積分步長、不同自由度和不同浮點(diǎn)數(shù)精度的試驗(yàn)性能進(jìn)行了對比。表4給出了步長為4和20 ms時使用GPU/CPU、雙精度/單精度時數(shù)值子結(jié)構(gòu)模型的最大自由度數(shù)。

將子結(jié)構(gòu)試驗(yàn)結(jié)果與MATLAB整體結(jié)構(gòu)計算結(jié)果對比,表4中△t=4 ms、使用GPU求解、模型精度為雙精度條件下振動臺子結(jié)構(gòu)試驗(yàn)結(jié)果與整體仿真計算試驗(yàn)子結(jié)構(gòu)頂部位移時程對比如圖7所示。圖7中子結(jié)構(gòu)試驗(yàn)與整體仿真結(jié)果吻合,說明該試驗(yàn)架構(gòu)能滿足實(shí)時子結(jié)構(gòu)試驗(yàn)的精度需要。表4中工況1~8對應(yīng)的試驗(yàn)與整體仿真時程對比如圖8所示。圖8為△t=4,20 ms時,實(shí)時子結(jié)構(gòu)試驗(yàn)中測試所得物理子結(jié)構(gòu)位移時程與整體仿真結(jié)果對比。8組工況條件下基于GPU的子結(jié)構(gòu)試驗(yàn)與整體仿真結(jié)果一致,說明使用GPU求解數(shù)值模型的子結(jié)構(gòu)試驗(yàn)與CPU具有同樣精度,實(shí)現(xiàn)了與CPU試驗(yàn)性能相同但數(shù)值計算體量更大的實(shí)時子結(jié)構(gòu)試驗(yàn)。

除計算白由度需求外,數(shù)值子結(jié)構(gòu)求解精度也直接影響實(shí)時子結(jié)構(gòu)試驗(yàn)性能。由于各數(shù)值積分算法只能求得近似解,其求解精度隨積分步長減小而增大。因此,如何通過減小積分步長提高數(shù)值積分求解精度和穩(wěn)定性,是數(shù)值子結(jié)構(gòu)求解要面臨的另一個問題。為了討論積分步長對子結(jié)構(gòu)試驗(yàn)性能的影響,采用3888白由度的數(shù)值子結(jié)構(gòu)模型,使用表1中CPU時最小只能進(jìn)行步長為20 ms的實(shí)時計算,使用(JPU時最小實(shí)時計算步長為5 ms。對△t=5,20 ms時分別進(jìn)行了實(shí)時子結(jié)構(gòu)試驗(yàn)。所得試驗(yàn)子結(jié)構(gòu)頂部位移時程與整體仿真結(jié)果如圖9所示。由圖9可知,△t=5 ms子結(jié)構(gòu)試驗(yàn)結(jié)果與整體仿真結(jié)果峰值誤差為4.92%,△t=20 ms試驗(yàn)結(jié)果與仿真結(jié)果峰值誤差為10.28%。由此可見,采用GPU求解可以允許在實(shí)時子結(jié)構(gòu)試驗(yàn)中使用更小的時間步長,從而進(jìn)一步提高試驗(yàn)精度。

3.3 試驗(yàn)結(jié)果分析

由圖8(a)即表4工況1--4條件下△t=4 ms,雙精度條件下,GPU求解數(shù)值模型最大白由度數(shù)為1500,使用CPU求解數(shù)值模型最大白由度數(shù)為1080,GPU求解的優(yōu)勢并不明顯。當(dāng)使用單精度數(shù)據(jù)求解時,GPU求解最大白由度數(shù)為3168,CPU求解最大白由度數(shù)為1500,可見使用單精度數(shù)據(jù)GPU求解的優(yōu)勢相比雙精度更明顯。目前因Windows系統(tǒng)不穩(wěn)定性及LABVIEW軟件調(diào)用MATLAB軟件的方法通訊需要3 ms的問題有待解決,因此在較小步長時GPU的優(yōu)勢受到限制,此方法調(diào)用GPU求解時存在改進(jìn)優(yōu)化空間。

由圖8(b)即表4 工況5~8即△t= 20 ms條件下,使用雙精度數(shù)據(jù)(JPU求解最大白由度可達(dá)18876,此時CPU求解白由度僅為2904。使用單精度數(shù)據(jù)GPU求解最大白由度可達(dá)27000,使用CPU求解白由度僅為3888??梢娫凇鱰=20 ms時,使用GPU求解優(yōu)勢明顯,無論是單精度數(shù)據(jù)還是雙精度數(shù)據(jù)都遠(yuǎn)超CPU求解時的數(shù)值模型白由度數(shù)。使用GPU求解可以實(shí)現(xiàn)相同時間步長條件下CPU無法求解的大規(guī)模數(shù)值模型的實(shí)時子結(jié)構(gòu)試驗(yàn)。

實(shí)時子結(jié)構(gòu)試驗(yàn)中數(shù)值模型求解需滿足積分算法收斂性要求,使用本文配置的服務(wù)器在△t=20 ms條件下,基于MATLAB軟件GPU 工具箱最多可進(jìn)行27000白由度的實(shí)時子結(jié)構(gòu)試驗(yàn)。相同數(shù)值模型使用CPU時間步長需936 ms,使用GPU已實(shí)現(xiàn)相比CPU求解55倍加速效果,此時CPU已經(jīng)遠(yuǎn)不能滿足實(shí)時子結(jié)構(gòu)試驗(yàn)的實(shí)時性需要。本試驗(yàn)求解是基于MATLAB軟件的GPU 具箱進(jìn)行求解,受限于MATLAB軟件,GPU求解的性能還有進(jìn)一步提升的余地,在GPU并行運(yùn)算、資源配置、及硬件數(shù)據(jù)通訊等方面還可進(jìn)行優(yōu)化,有可能進(jìn)一步提升求解規(guī)模與效率。

表4中數(shù)值子結(jié)構(gòu)模型為3888自由度時,使用GPU求解相比CPU求解時間步長從20 ms減小至5 ms。且由圖9相同數(shù)值模型,進(jìn)行不同時間步長試驗(yàn)對比可以得出,使用更小的時間步長可以提高試驗(yàn)精度。因此在實(shí)時子結(jié)構(gòu)試驗(yàn)中,相同數(shù)值子結(jié)構(gòu)使用GPU求解代替?zhèn)鹘y(tǒng)CPU求解可以減小時間步長,提高試驗(yàn)精度。

4 結(jié) 論

本文基于GPU數(shù)值求解建立了實(shí)時子結(jié)構(gòu)試驗(yàn)系統(tǒng)架構(gòu),通過數(shù)值仿真與振動臺子結(jié)構(gòu)試驗(yàn),驗(yàn)證了該試驗(yàn)系統(tǒng)的可行性和實(shí)際試驗(yàn)性能,得到如下結(jié)論:

(1)在相同的時間步長條件下,基于MATLAB軟件使用GPU相比CPU可求解更高白由度數(shù)值子結(jié)構(gòu)。在△t=20 ms條件下,使用GPU可實(shí)現(xiàn)27000白由度數(shù)值模型的實(shí)時子結(jié)構(gòu)試驗(yàn)。

(2)在相同自由度的數(shù)值模型條件下,基于MATLAB軟件使用GPU相比CPU求解實(shí)現(xiàn)更小時間步長的實(shí)時子結(jié)構(gòu)試驗(yàn)。在3888白由度條件下,使用CPU求解可實(shí)現(xiàn)最小△t= 20ms的實(shí)時子結(jié)構(gòu)試驗(yàn),而使用GPU求解可實(shí)現(xiàn)的試驗(yàn)最小△t=5 ms。

(3)由于Windows是非實(shí)時系統(tǒng),以及使用LABVIEW調(diào)用MATLAB軟件存在信號傳輸延遲問題,因此在試驗(yàn)中最小取△t=4 ms,這限制了GPU性能的發(fā)揮。有必要研究基于硬件實(shí)時系統(tǒng)的GPU求解方法,徹底發(fā)揮GPU求解的性能,進(jìn)一步拓展實(shí)時子結(jié)構(gòu)試驗(yàn)的使用空間。

參考文獻(xiàn):

[1]

Nakashima M,Kato H.Takaoka E.Development of re-al-time pseudo dynamic testing [J]. Earthquake Engineering&Structural Dynamics, 1992, 21(1):7992.

[2]吳斌,王倩穎.實(shí)時子結(jié)構(gòu)實(shí)驗(yàn)的研究進(jìn)展[J].實(shí)驗(yàn)力學(xué),2007(6):547-555.

Wu Bin, Wang Qianying, Development of real-timesubstructure testing[Jl. Journal of Experimental Mechanics, 2007(6):547-555.

[3]孟凡濤,趙建鋒,于廣明.實(shí)時子結(jié)構(gòu)混合試驗(yàn)中的數(shù)值積分方法對比分析[J].地震工程與工程振動,2011,31(5):60-67.

Meng Fantao. Zhao Jianfeng, Yu (Juangming. Studyon numerical integration methods in real-time hybridtesting experiment[J].Earthquake Engineering and En-gineer Vibration, 2011, 31(5):6067.

[4]

Zhu F,Wang J,Jin F,et al.Simulation of large-scalenumerical substructure in real-time dynamic hybrid testing[J].Earthquake Engineering and Engineering Vibration, 2014, 13(4) : 599609.

[5]Wang Q Y, Wu B, ()u J P. Stability analysis of real-time substructure testing considering actuator delay andcompensation [Jl. Engineering Mechanics, 2007, 24(2): 9-14.

[6]洪越 ,唐貞云,何濤 ,等 .大尺寸非線性實(shí)時動力子結(jié)構(gòu)試驗(yàn) 實(shí)現(xiàn) [J].振動工程學(xué)報 , 2017. 30 (6) :913920.

Hong Yue, Tang Zhenyun. He Tao, et al. The implementation of nonlinear real-time dynamics substructuring for large scale specimen [ J] . Journal of Vibration En-gineering, 2017 , 30( 6) : 913920.

[7]Chang S Y , Sung Y C. An enhanced explicit pseudo dynamic algorithm with unconditional stability [Cl. lOOthAnniversary Earthquake Conference. 2006.

[8]Nakashima M. Ishida M. Ando K. Integration tech-niques for substructure pseudo dynamic test: pseudo dynamic test using substructuring techniques [Jl. Journalof Structural& Construction Engineering, 1990, 417:107-117.

[9]Wu B. Xu G, Wang Q, et al. Operator-splitting meth-od for real-time substructure testing [ J] . Earthquake En-gineering& Structural Dynamics, 2010, 35 (3) :293314.

[10]Nakashima M. Masaoka N. Real-time on-line test forMDOF systems [Jl. Earthquake Engineering& Struc-tural Dynamics , 1999 , 28(4) : 393420.

[11]Cheng C , Ricles J M. Stability analysis of SDOF real-time hybrid testing systems with explicit integration al-gorithms and actuator delay [Jl. Earthquake Engineer-ing & Structural Dynamics, 2008, 37(4) : 597-613.

[12]Chae Y. Kazemibidokhti K. Ricles J M. Adaptive timeseries compensator for delay compensation of servo-hydraulic actuator systems for real-time hybrid simulation[Jl. Earthquake Engineering& Structural Dynamics,2013, 42( 11): 1697-1715.

[13]Saouma V, Kang D, Haussmann G.A computationalfiniteelement program for hybrid simulation[Jl. Earthquake Engineering&Structural Dynamics. 2012. 41(3):375389.

[14]Durand M. Marin P. Faure F. et al. DEM_based simulation of concrete structures on (JPU[J].European Jour_nal of Environmental&Civil Engineering, 2012, 16(9):1102-1114.

[15]解琳琳,韓博,許鎮(zhèn),等.基于OpenSees的大型結(jié)構(gòu)分析GPU高性能計算方法[J].土木建筑T程信息技術(shù),2014.6(5):2225.

Xie Linlin, Han Bo, Xu Zhen. et al.(JPU poweredhigh-performance computing method for the analysis oflarge-scale structures based on OpenSees[J]. Journal ofInformation Technology in Civil Engineering and Architecture. 2014.6(5):2225.

[16]武唯一,田石柱,李雙江.基于ABAous與OpenFresco的結(jié)構(gòu)抗震混合試驗(yàn)平臺的研究[J].江蘇建筑,2016(4):21-25.

Wu Weiyi, Tian Shizhu. Li Shuangjiang. Study of Structure seismic hybrid simulation based on ABAous andOpenFresco[Jl. Jiangsu Construction. 2016(4):21-25.

[17]許國山,郝偉,陳永盛,等.基于OpenFrescoLab-VIEWdSPACE的混合試驗(yàn)系統(tǒng)研究[J].工程力學(xué),2013,30(3):417-423.

Xu Guoshan. Hao Wei, Chen Yongsheng, et al.Experimental validation on hybrid testing system based onOpenFrescoLabVIEWdSPACE[J]. Engineering Me-chanics, 2013, 30(3):417-423.

[18]Tang Z, Dietz M, Hong Y, et al. Performance extension of shaking table_based real-time dynamic hybridtesting through full state control via simulation[Jl.Structural Control and Health Monitoring, 2020, 27(10):e2611.