陳皓 郭明明 田 野, 陳爾達鄧雪 樂嘉陵 李林靜
* (西南科技大學信息工程學院,四川綿陽 621010)
? (中國空氣動力研究與發(fā)展中心,四川綿陽 621000)
通常情況下,飛行器氣動設計時,通過實驗或者計算流體力學(computational fluid dynamics,CFD)模擬獲得流場信息.CFD 通過對流場基本物理方程的高精度數值求解,在眾多應用中發(fā)揮著越來越重要的作用[1].工程中常用的做法是: 通過實驗或者CFD 計算獲得能包絡飛行軌跡的一組流場作為采樣流場,再通過插值方法可以得到飛行軌跡的任意參數狀態(tài)的流場信息,例如升力系數、阻力系數、流場中某點的壓力(或者密度等)數據[2-3].然而,CFD 對網格質量要求高、數值求解過程復雜、動網格處理難度大導致計算耗費大,限制了CFD 方法在諸如高精度氣動優(yōu)化設計、氣動伺服彈性、閉環(huán)流動控制等多學科耦合建模與優(yōu)化等問題中應用[4-5].
本征正交分解理論(proper orthogonal decomposition,POD)[6]、動模態(tài)分解(dynamic mode decomposition,DMD)[7]是經典的數學方法,可以在保證流場結構信息精度的前提下,將冗余信息忽略,從而大幅度降低計算問題的自由度,減小模型預測的時間.羅杰等[8]以三段翼型流場作為研究對象,POD 降階模型分別與三次樣條插值和徑向基插值結合,實現(xiàn)設計狀態(tài)處流場信息快速預測.然而,三次樣條插值與徑向基插值等假設插值對象是連續(xù)的,因此,當流場信息隨狀態(tài)參數變化存在間斷(如激波現(xiàn)象)時,流場預測結果在間斷區(qū)域會產生較大的誤差.侯強等[9]基于POD 理論和徑向基函數建立了高超聲速乘波前體流場結構和氣動性能參數的快速預測模型,并對擴容設計的乘波前體流場開展了快速預測研究.該研究表明基于本征正交分解理論的快速預測方法可精確、快速地獲得不同幾何設計參數下乘波前體的流場,預測誤差不高于2%.李天一等[10]提出了Gappy POD 方法用于重構湍流場數據,并解釋了此方法重構誤差的兩個來源.第一部分來自截斷誤差,當流場復雜程度較低時,應當采用增大POD 模態(tài)數目來減小截斷誤差,當其復雜度較高時,需要采用流場所有的 POD 模態(tài)進行重構以消除截斷誤差;第二部分來自 POD 基函數在已知點上的值組成的矩陣的非列滿秩性,它主要取決于破損區(qū)域的面積大小和幾何形狀,與其面積大小呈正相關性.張人會等[11]采用POD 方法對2 BE-203 型液環(huán)泵內單個葉輪流道的氣液兩相流流場進行了重構,精確地重構了單個葉輪內流場結構的各個特征,除在氣液交界面附近有一定的誤差,整體預測結果具有較高的精度,大大減少了流場預估的計算量.但傳統(tǒng)模型降階方法也存在一些顯著的不足: 不適合或難以應用于多尺度、瞬態(tài)過程、間斷過程,并且在發(fā)生移動、縮放及旋轉變換時無法保證不變性[12].
與POD 和DMD 等方法相比,深度神經網絡(deep neural network,DNN)則有望解決傳統(tǒng)降階方法所固有的缺點.得益于當前流體力學積累的大量數值模擬數據、實驗測量數據以及現(xiàn)場監(jiān)測數據,深度學習可以從大量的數據中挖掘出有用的信息[13]并擁有強大的非線性函數擬合能力.越來越多的研究者傾向于使用深度學習方法來預測物理模型周圍的流場,并學習數值模擬中使用的方程.計算成本的顯著降低和模擬結果準確性的提高顯示了深度學習方法在處理計算流體動力學數據方面的潛力[14-15].本文將從以下五個章節(jié)進行講解.第一節(jié)講解了深度學習的基本知識;第二節(jié)調研了國內外的流場超分辨率重構的研究,包括傳統(tǒng)卷積神經網絡與生成對抗網絡兩種結構的超分辨率網絡;第三節(jié)調研了基于特征信息的流場映射重構研究;第四節(jié)調研了長短期記憶神經網絡對流場的重建;第五節(jié)得出結論并做了展望.
卷積神經網絡是深度學習主要方法之一,近年來已在流場重構中得到廣泛應用.卷積神經網絡發(fā)展至今已出現(xiàn)許多經典的網絡結構,例如文獻[16-20].這些網絡在圖像識別等領域表現(xiàn)出越來越好的效果,盡管結構越來越復雜多變,但本質上還是由卷積、激活、池化、全連接、殘差結構等基本的元素組成.深度學習過程實際上是一個參數優(yōu)化問題,通過定義損失函數作為網絡收斂的判據,網絡不斷地學習所提供訓練數據的特征,最終學習到的模型可用于解決實際工程中的預測、分類等問題.
卷積操作是用一個卷積核矩陣在一個輸入圖像矩陣上面以一定的步長進行滑動,每次滑動前計算卷積核矩陣中的權重參數與對應的輸入圖像矩陣中的參數的乘積并相加,把每一次滑動計算所得數據拼接起來,最終組合成一個輸出特征矩陣,如圖1 所示.深度學習中激活函數有多種,例如: Tanh 函數、Sigmoid 函數、Softmax 函數及ReLU 等.激活函數一般用于卷積操作之后.激活函數的引入增加了網絡的非線性特性,增強了擬合能力.
圖1 卷積Fig.1 Convolution
池化相當于對圖像進行下采樣操作,通過利用某一位置相鄰輸出的整體統(tǒng)計特性來代替該位置的網絡輸出,起到下采樣的作用.池化可以有效減少參數數量,降低網絡復雜度.池化主要有兩種類型,一種是最大池化下采樣,一種是平均池化下采樣,最常見的下采樣方式即最大池化下采樣.如圖2 所示.
圖2 最大池化Fig.2 Maxpooling
全連接層的輸入是一維數組,多維數組需先進行一維化處理,然后連接全連接層.全連接層的每一個結點都與上一層的所有結點相連,用來把前邊提取到的特征綜合起來.一個簡單的兩層全連接圖結構如圖3 所示.
圖3 全連接層Fig.3 Full connection layer
非常深的神經網絡存在梯度消失和梯度爆炸問題,難以訓練.ResNet 采用跳躍連接,每兩層增加一個捷徑,構成一個殘差塊,殘差結構可以減小梯度消失、梯度爆炸的現(xiàn)象,結構如圖4 所示.
殘差結構主要包括兩種結構,第一種如圖4 中BasicBlock 模塊,采用兩個3×3 的卷積進行串聯(lián);第二種如圖4 中Bottleneck 模塊,采用1×1 卷積,3×3 卷積,1×1 卷積進行串聯(lián).對于ResNet 系列較淺層的模型,例如ResNet18,34,選用BasicBlock 模塊,對于ResNet44,50,101 等采用Bottleneck 模塊,首先,利用1×1 的卷積進行通道降維;然后,進行3×3 卷積操作,提取特征;最后,再利用1×1 的卷積恢復通道數.通過1×1 的卷積,看似增加了模型結構的復雜性,實則可以有效減少模型的計算量.
圖4 殘差結構Fig.4 Residual structure
在認知科學中,由于信息處理的瓶頸,人類會選擇性地關注所有信息的一部分,同時忽略其他可見的信息,上述機制通常被稱為注意力機制.在空間域上的應用就是讓網絡去注意那些“顯眼”的地方,怎么去注意“顯眼”的地方呢?哪些地方又是屬于“顯眼”的呢?主要解決的就是這兩個問題.一張圖片,把它劃分成幾塊,每一塊給定一個權重,權重大的地方就是“顯眼”的位置.
Woo 等[21]提出了卷積塊注意模塊CBAM,如圖5 所示,這是一個簡單而有效的注意模塊,可以與任何前饋卷積神經網絡集成.給定一個中間特征圖,模塊沿兩個單獨的維度(通道和空間)順序推斷注意力圖,然后將注意力圖乘以輸入特征圖以進行自適應特征細化.因為CBAM 是一個輕量級的通用模塊,它可以無縫集成到任何CNN 架構中,開銷可以忽略不計.該模塊可以與基礎CNN 一起進行端到端的訓練.Fei 等[22]提出了“residual attention network”,這是一種使用注意力機制的卷積神經網絡,它可以以端到端的訓練方式與最先進的前饋網絡架構相結合.剩余注意力網絡是通過堆疊注意力模塊構建的,這些注意力模塊會產生注意力感知功能.隨著層的深入,來自不同模塊的注意力感知特征會自適應地變化.在每個“attention module”內部,采用自下而上、自上而下的前饋結構,將前饋和反饋注意過程展開為單個前饋過程.重要的是,提出的注意力殘差學習來訓練非常深的殘差注意力網絡,該網絡可以很容易地擴展到數百層.
圖5 CBAM 結構Fig.5 CBAM structure
2.1.1 超分辨率網絡簡介
超分辨率技術(super-resolution,SR)是指從觀測到的低分辨率圖像重建出相應的高分辨率圖像,在監(jiān)控設備、衛(wèi)星圖像和醫(yī)學影像等領域都有重要的應用價值.超分辨率卷積神經網絡(super-resolution convolutional neutral network,SRCNN)是深度學習用在超分辨率重建上的開山之作.SRCNN[23]的網絡結構非常簡單,僅僅用了三個卷積層,網絡結構如圖6 所示.SRCNN 首先使用雙三次(bicubic)插值將低分辨率圖像放大成目標尺寸,接著通過三層卷積網絡擬合非線性映射,最后輸出高分辨率圖像結果.作者將三層卷積的結構解釋成三個步驟: 圖像塊的提取和特征表示,特征非線性映射和最終的重建.
圖6 SRCNN 結構Fig.6 SRCNN structure
Zhou 等[24]在基于正則化的SR 框架下,針對雙邊全變分BTV 超分辨率重建模型的不足,提出一種基于局部結構自適應BTV 正則化的超分辨率重建方法.該方法根據局部結構自適應地選擇先驗模型和正則化參數.實驗結果表明,該方法能夠獲得較好的重構效果,顯著減少了正則化參數選擇的人工工作量.Anwar 等[25]比較了30 多個最先進的超分辨率卷積神經網絡在三個經典數據集和三個最近引入的具有挑戰(zhàn)性的數據集中的表現(xiàn),以對單張圖像的超分辨率進行基準測試,為基于深度學習的超分辨率網絡引入了一種分類法,將現(xiàn)有方法分為九類,包括線性、殘差、多分支、遞歸、漸進式、基于注意力和對抗性設計,如圖7 所示,在網絡復雜性、內存占用、模型輸入和輸出、學習細節(jié)、網絡損失的類型和重要的架構差異(例如深度、跳躍連接、過濾器)方面提供了模型之間的比較.
圖7 基于最顯著特征的現(xiàn)有單圖像超分辨率技術的分類Fig.7 Classification of existing single image super-resolution technology based on the most salient features
線性網絡具有簡單的結構,僅由沒有任何跳躍連接的信號流的單一路徑或多個分支組成.在這樣的網絡設計中,幾個卷積層相互堆疊,并且輸入按順序從初始層流向后面的層.線性網絡在上采樣操作的方式上有所不同,即早期上采樣或后期上采樣.DnCNN[26]直接學習預測高頻殘差而不是潛在的超分辨率圖像.殘差圖像基本上是低分辨率LR 和高分辨率HR 圖像之間的差異.DnCNN 的架構非常簡單,類似于SRCNN,因為它只堆疊了卷積層、批量歸一化層和ReLU 層,盡管兩個模型都能夠得出有利的結果,但它們的性能在很大程度上取決于噪聲估計的準確性,而不知道圖像中存在的底層結構和紋理.此外,由于每個卷積層之后的批量歸一化操作,導致它們的計算成本很高.與線性網絡相比,殘差學習在網絡設計中使用跳躍連接來避免梯度消失,并使設計非常深的網絡變得可行.它的重要性首先在圖像分類問題中得到證實.Lim 等[27]開發(fā)了一種增強的深度超分辨率網絡EDSR,通過刪除傳統(tǒng)殘差網絡中不必要的模塊進行的優(yōu)化,在穩(wěn)定訓練過程的同時,通過擴大模型大小進一步提高性能.為了在單個模型中能更魯棒性地重建不同放大因子的高分辨率圖像,文中還提出了一種新的多尺度深度超分辨率系統(tǒng)MDSR 和訓練方法.Tai 等[28]提出一種非常深的CNN 模型(最多52 個卷積層),名為深度遞歸殘差網絡(deep recursive residual network,DRRN),旨在實現(xiàn)深度而簡潔的網絡.具體來說,采用全局和局部方式的殘差學習,以減輕訓練非常深的網絡的難度,遞歸學習用于在增加深度的同時控制模型參數.通常CNN 算法一步預測出結果,但是,對于較大的比例因子較為困難,利用漸進式重建設計,分步式預測.Lai 等[29]提出拉普拉斯金字塔超分辨率網絡LapSRN 來逐步重建高分辨率圖像的子帶殘差.在每個金字塔級別,將粗分辨率特征圖作為輸入,預測高頻殘差,并使用轉置卷積進行上采樣到更精細的級別.該方法不需要雙三次插值作為預處理步驟,因此極大降低了計算復雜度.并且使用魯棒的Charbonnier 損失函數對提出的LapSRN 進行深度監(jiān)督訓練,并實現(xiàn)高質量的重建.此外,文中通過漸進式重建在一次前饋傳遞中生成多尺度預測,從而促進資源感知應用.密集連接網絡結合沿網絡深度可用的分層線索,以實現(xiàn)高靈活性和更豐富的特征表示.Zhang 等[30]提出了用于圖像超分辨率的密集特征融合DFF.由于不同自然圖像中的相同內容通常具有不同的尺度和視角,因此聯(lián)合學習分層特征對于圖像SR 至關重要,以局部和全局方式充分利用所有有意義的卷積特征,使用密集連接的卷積層來提取豐富的局部特征,使用局部特征融合來自適應地從先前和當前的局部特征中學習更有效的特征,在充分獲得密集的局部特征后,使用全局特征融合來聯(lián)合和自適應地學習全局層次特征.該方法在定量和視覺上與最先進的方法相比取得了良好的性能.Shi 等[31]為了實現(xiàn)在單個K2 GPU 上對1080 p視頻進行實時SR 的卷積神經網絡,提出了一種新穎的CNN 架構,其中在LR 空間中提取特征圖.此外,還引入了一個高效的亞像素卷積層,它學習了一系列放大濾波器,以將最終的LR 特征圖放大到HR 輸出中.有效地為每個特征圖訓練更復雜的升級過濾器替換了SR 管道中的手工制作的雙三次過濾器,同時還降低了整體SR 操作的計算復雜度.
以上的網絡設計認為所有空間位置和通道對超分辨率具有統(tǒng)一的重要性.在某些情況下,它有助于選擇性地只關注給定層的少數特征.基于注意力的模型允許這種靈活性,并認為并非所有特征對于超分辨率都是必不可少的,這些特征具有不同的重要性.文獻[32]受其他超分辨率方法中使用的線性映射技術的啟發(fā),將ReLU 重新解釋為單位映射和開關的逐點乘法,最后提出了一種新的非線性單元,稱為選擇單元SU.雖然傳統(tǒng)的ReLU 無法直接控制數據的傳遞,但所提出的SU 優(yōu)化了這種開關控制,因此能夠以更靈活的方式比ReLU 更好地處理非線性功能,有效降低模型的計算復雜度.密集殘余拉普拉斯注意力網絡(dense residual Laplace attention network,DRLN)[33]被引入于超分辨率圖像.網絡結構是模塊化和分層的,網絡的主要亮點是: (1) 模塊化架構;(2) 密集連接的殘差單元;(3) 級聯(lián)連接;(4) 拉普拉斯注意.DRLN 利用不同的連接方式.在每個塊中,三個殘差單元密集連接以學習緊湊表示;然后,在同一塊中使用拉普拉斯注意力對學習到的特征進行加權.目前,所有數據集的最佳結果由DRLN 提供.與RCAN[34]類似,DRLN 采用L1 損失函數來訓練網絡.訓練的設置與RCAN 相同,即訓練塊大小、時期數、優(yōu)化器等.DRLN 的改進可歸功于具有拉普拉斯注意和級聯(lián)結構的創(chuàng)新模塊.與RCAN 相比,DRLN 的卷積層數顯著減少.而另一方面,DRLN 的參數數量更高;對于多重退化處理網絡僅僅考慮雙三次退化,在現(xiàn)實中可能不是一個可行的假設,因為多個降級可能同時發(fā)生.現(xiàn)有的基于CNN 的SISR方法大多假設從高分辨率圖像中對低分辨率圖像進行雙三次下采樣,因此當真正的退化不遵循該假設時,不可避免地會導致性能不佳.此外,它們在學習單個模型以非盲目地處理多個降級方面缺乏可擴展性.為了解決這些問題,Zhang 等[35]提出了一個具有維度拉伸策略的通用框架,該框架使單個卷積超分辨率網絡能夠將SISR 退化過程的兩個關鍵因素,即模糊核和噪聲水平作為輸入.因此,超級解析器可以處理多個甚至空間變化的降級,大大提高了實用性.合成和真實LR 圖像的大量實驗結果表明,所提出的卷積超分辨率網絡不僅可以在多次退化上產生良好的結果,而且計算效率高,為實際的SISR 應用提供了一種高效且可擴展的解決方案.多重退化的超分辨率網絡(super-resolution multiple degenerate network,SRMD)[36]采用連接的低分辨率圖像及其退化圖.SRMD 的架構類似于SRCNN[37],DnCNN[26],IRCNN[38].首先,將3×3 濾波器大小的卷積層級聯(lián)應用于提取的特征,然后是一系列Conv,ReLU 和Batch 歸一化層.此外,類似于ESPCN[31],使用卷積運算來提取HR 子圖像,作為最后一步,將多個HR 子圖像轉換為最終的單個HR 輸出.SRMD直接學習HR 圖像,而不是圖像的殘差.
2.1.2 改進的SRCNN 在流場超分辨率重建中的應用
對高分辨率流動數據的追求一直是實驗和計算流體動力學的主要追求之一.隨著高性能計算機和實驗技術的進步,研究人員更容易獲得高分辨率的流體數據.實驗流場測量,例如粒子圖像測速術,可以捕捉湍流的復雜細節(jié).還能采用CFD 方法獲得高分辨率流場.然而,實驗和模擬方法仍然是昂貴且耗時的工作.Liu 等[39]提出了一個靜態(tài)卷積神經網絡(static convolutional neural network,SCNN)和一個新穎的多時間路徑卷積神經網絡(multi time path convolution neural network,MTPC)來重建高分辨率流場.該方法與傳統(tǒng)的雙三次插值相比,有很明顯的提升.圖8 顯示了各向同性湍流的低分辨率、雙三次插值、SCNN、MTPC 和DNS (direct numerical simulation)結果的比較.
圖8 幾種超分辨率重建方法的對比Fig.8 Comparison of several super-resolution reconstruction methods
與之相似的工作,Kong 等[40]提出了一個超分辨率卷積神經網絡(SRCNN)和一個多路徑超分辨卷積神經網絡(multipath super-resolution convolutional neural network,MPSRC)用來實現(xiàn)超分辨溫度場的重構,并與雙三次插值法進行了比較.結果表明,這兩種方法都可以大大提高超分辨率重建精度,而MPSRC 重建算法能夠以較低的均方誤差和較高的峰值信噪比提供較好的重建結果.其中一組重建結果比較如圖9 所示.該方法雖然取得了很大的進步,但仍然存在一些挑戰(zhàn).例如,當放大比例因子較大時,超分辨率重建性能有一定程度的下降,這將是下一步工作需要研究的問題.二維圓柱尾流被認為是第一個展示整體超分辨率過程并展示其在層流數據上的能力的例子,Kai 等[41]開發(fā)了兩種機器學習模型,即卷積神經網絡和混合下采樣跳躍連接/多尺度模型.這些機器學習模型作為初步測試應用于二維圓柱尾流,并顯示出從低分辨率流場數據重建湍流和層流的顯著能力.Ferdian 等[42]開發(fā)了4DFlowNet能夠產生無噪聲的超分辨率4D 流動圖像.快速計算的應用十分廣泛,除了醫(yī)學中的流動成像問題,電影等視頻領域也希望能通過流體的快速計算達到逼真的視覺效果.
圖9 Bicubic,SRCNN,MPSRC 重建結果的對比Fig.9 Comparison of reconstruction results of Bicubic,SRCNN and MPSRC
Kong 等[43]研究單路徑模型采用簡單的卷積層和全連接層串行架構,多路徑模型通過增加池化層來增加分支路徑,實現(xiàn)融合結構,其中多路徑的模型架構如圖10 所示.并在各種工作條件下進行超音速隔離段中流動的地面實驗,以建立實驗數據集.將訓練后的單路徑和多路徑CNN 與傳統(tǒng)插值方法在流場SR 重建精度上進行比較.結果如圖11 所示,單路徑CNN 具有一定的學習能力,但SR 精度不理想;多路徑CNN 顯著提高了流場SR 的準確性,并且具有一個分支路徑的多路徑CNN,實現(xiàn)了最佳的SR 性能.
圖10 多路徑的模型架構Fig.10 Multipath model architecture
圖11 模型重建和實驗結果之間瞬時流場的比較: (a)楔角為0°,(b)楔角為14°,(c)楔角為20°Fig.11 Comparison of instantaneous flow field between model reconstruction and experimental results: (a) wedge angle of 0°,(b) wedge angle of 14° and (c) wedge angle of 20°
從圖12 中可以看出,傳統(tǒng)的插值只是簡單的數據平滑.當SR 因子較小(r=4)時,基于插值法重建的SR 流場看起來比LR 流場更清晰,但實際上雙三次插值法只是機械地增加了像素密度,沒有添加新的SR 結果的流場詳細信息.當SR 因子較大(r=8)時,雙三次插值提供的流場過于平滑,SSIM 只有0.3 左右,非常低.輸入的LR 流場包含的信息較少,插值方法不具備學習能力,不能通過簡單的像素平滑重建激波串結構.單路徑CNN (CNN-I)的SR 性能似乎優(yōu)于雙三次插值.超音速流場中的背景波基本重建清晰,但激波序列學習得不好,特別是當SR因子較大時(r=8),激波串結構完全被丟失,重建結果嚴重失真.CNN-I 具有一定的學習能力,但學習能力較弱,無法提供足夠的流場細節(jié),與簡單插值相比,SSIM 和PSNR 略有提高,但仍遠不能令人滿意.
圖12 四種方法的重建結果Fig.12 Reconstruction results of four methods
2.2.1 生成對抗網絡簡介
生成對抗網絡 (generative adversarial nets,GAN)[44]實際上包含了2 個網絡,一個是生成網絡(generator),另一個是判別網絡(discriminator).GAN 的終極目的是學習一個高質量的生成器G,GAN 通過引入判別器D來得到高質量的生成器G.G在訓練過程中的目的是生成盡可能逼真的圖片去讓判別器判斷不了這張圖片到底是真實圖片還是生成的虛假照片,D在訓練過程中的目的就是盡可能去辨別真假圖片,所以G是希望D的犯錯率最大化,而D則是希望自己犯錯率最小,二者互為對抗,在競爭中共同進步.理論上這種關系可以達到一個平衡點,即所謂的納什均衡,也就是說G生成的圖片D判別它為真實數據的概率是0.5,即現(xiàn)在判別器已經無法區(qū)分生成器所生成的圖片的真假,那么生成器的目的也就達到以假亂真.GAN 的優(yōu)化目標函數如式(1)所示其中x是先驗概率分布Pz的一個噪聲樣本,x是一個服從特定分布Pdata 的一個真實樣本.
訓練網絡D使得最大概率地分對訓練樣本的標簽(最大化lgD(x)和lg[1-D(G(z))],訓練網絡G最小化lg[1-D(G(z))],即最大化D的損失.而訓練過程中固定一方,更新另一個網絡的參數,交替迭代,使得對方的錯誤最大化,最終,G能估測出樣本數據的分布,也就是生成的樣本更加真實.基本的GAN 結構可以用圖13 表示.生成模型G: 可以是神經網絡或者其他方式擬合出的一個函數,給定輸入,負責生成整個GAN 所需的輸出.判別模型D: 可以當作一個判斷輸入真假的二分類器,也是一個函數.
圖13 生成對抗網絡結構Fig.13 Generate countermeasure network structure
2.2.2 改進的GAN 在流場超分辨率重建中的應用
在四維物理場的問題中,生成對抗網絡同樣能夠對流動進行處理.Xie 等[45]提出的TempoGAN 網絡在判別器的部分進行了兩方面考慮,分別對空間和時間進行了判別.這種方式能夠生成更詳細真實和時間一致的物理量.Xu 等[46]提出了一種數據驅動的三維超分辨率方法,以沿著每個空間方向將空間分辨率提高兩倍.該方法被稱為3D 超分辨率生成對抗網絡(3D-SR-GAN),它構建了一個生成器和一個鑒別器網絡,以學習地形信息,并以給定的低分辨率“counterpart”推斷高分辨率的3D 湍流火焰結構.Lee 等[47]提出了模擬湍流小尺度特征的深度學習GAN 網絡方法.該方法有望在利用未處理的模擬數據、通過處理三維卷積實現(xiàn)三維結構預測以及用更少的計算成本預測精確解方面具有新穎性.從時間的角度考慮,Liu 等[48]將深度學習引入到計算流體力學數據壓縮中,提出了一種新的基于GAN 的原位壓縮方法.利用計算流體力學數據中的小塊,訓練了一個包含兩個神經網絡的壓縮網絡:負責在計算節(jié)點上壓縮數據的鑒別網絡和用于在可視化節(jié)點上重構數據的生成網絡.在訓練階段,神經網絡相互協(xié)作,同時進行優(yōu)化,實現(xiàn)高質量的數據壓縮和重構.該方法在壓縮時間上有很大的優(yōu)勢,并且能夠根據可接受的重建效果來調整壓縮比.Deng 等[49]使用基于GAN 的人工智能框架從低空間分辨率流場開發(fā)了超分辨率重建方法,結果證明了超分辨率生成對抗網絡SRGAN 和增強型的超分辨率生成對抗網絡ESRGAN 在湍流速度場超分辨率重建中的性能,對重建的瞬時流場、流動統(tǒng)計量和空間相關性的分析表明,在復雜的流動結構中,兩種模型都可以準確地重建高空間分辨率的流場.速度場的空間分辨率可提高42倍和82倍.
然而,GAN 在訓練中是非常困難的,并且可能收斂到局部極小值,在局部極小值處,生成的樣本不能捕獲訓練數據的真實統(tǒng)計,針對這種情況,Wu等[50]提出了一個嵌入統(tǒng)計約束的生成對抗網絡,通過強制訓練數據的協(xié)方差約束,產生了一個改進的基于機器學習的仿真器來捕獲通過求解完全分解的偏微分方程生成的訓練數據的統(tǒng)計量.研究表明,與標準GAN 相比,這種統(tǒng)計正則化帶來了更好的性能.文獻[51]使用4 種不同的深度學習網絡(考慮和不考慮守恒定律的生成對抗網絡和考慮和不考慮守恒定律的卷積神經網絡)訓練和預測圓柱上的非定常流場.通過對不同流態(tài)下圓柱周圍非定常流場的研究,發(fā)現(xiàn)4 種深度學習網絡在短期預測時均可預測流量,但在長期預測時,是否考慮物理損失對預測結果產生了一定的影響.如何正確的向網絡中引入物理信息(例如質量和動量守恒的信息)是值得關注的問題.Lin 等[52]針對傳統(tǒng)GAN 網絡難以收斂問題提出了一種新的GAN 網絡,生成網絡不再盡量去欺騙判別網絡而是尋找對應關系的匹配問題.與傳統(tǒng)的GAN 相比較,該方法在迭代收斂方面以及視覺檢測方面都是優(yōu)越的.
深度學習對被證明具有學習變量之間復雜非線性關系的能力,基于這種能力,研究人員做了許多基于相關參數重建相應流場信息的工作.Kong 等[53]通過搭建一個雙路徑CNN 網絡成功學習到了超燃沖壓發(fā)動機隔離段上下壁面壓力數據到隔離段內流場紋影圖像的映射關系,重建效果如圖11 所示,并將此重建出來的流場用于激波串前緣位置的檢測,結果表明通過深度學習重建出來的流場進行激波前緣檢測的精度與效率優(yōu)于傳統(tǒng)的壓力增量法和壓力比法,并且能夠感知到激波跳躍現(xiàn)象.
除此工作之外,Kong 等[54]基于此CNN 網絡(圖14)利用隔離器上的壓力測量來重建超燃沖壓發(fā)動機隔離段中的速度場.在不同的馬赫數和背壓下對訓練好的網絡模型進行測試,結果表明該模型能夠高精度地重建速度場.
圖14 速度場預測模型的CNN 網絡架構Fig.14 CNN network architecture of velocity field prediction model
中國空氣動力研究與發(fā)展中心在樂嘉陵院士的指導下開展了深度學習在超燃沖壓發(fā)動機燃燒流場重構的研究,陳皓等[55]創(chuàng)新性的提出了一種多分支融合的卷積神經(multi-branch fusion convolution neural network,MBFCNN)架構,如圖15 所示,針對于來流Ma2.5 的條件下,建立了不同當量比的壁面壓力與燃燒流場紋影圖像同步對應的數據集,結果表明訓練好的模型可以準確應用壁面壓力重構燃燒流場,平均相關系數0.952 左右,驗證了卷積神經網絡在超聲速燃燒流場重構的可能性.
圖15 超聲速燃燒室流場重構MBFCNN 模型架構Fig.15 MBFCNN model architecture for flow field reconstruction in supersonic combustor
Marai 等[56]引入了一種深度學習方法來識別大規(guī)模張量場數據集中的激波位置,使用神經網絡來學習從應變張量到用作標簽的紋影圖像的映射.研究表明這種方法可以用于快速預測二維和三維張量場的紋影值,潛在地允許張量流中的異常檢測.Wang 等[57]對傳統(tǒng)的基于人工神經網絡的流場重建方法進行了改進,提出了一種陣列神經網絡方法有效地預測未知的流場數據.計算結果表明,陣列神經網絡能夠比傳統(tǒng)方法更準確地重構目標問題的流場,收斂速度明顯加快.Hadikhani 等[58]提出了一種通過光學監(jiān)測液滴流動來測量微流控芯片中不同流體性質的非侵入式方法,從液滴圖像中提取所需信息,并用于訓練深度神經網絡來預測流量或濃度,所提出的方法原則上可用于測量流體的其他性質,如表面張力和黏度.Bhatnagar 等[59]證明了CNN 能夠在最少的監(jiān)督下自動檢測基本特征,在給定雷諾數、攻角和翼形的情況下能夠有效預測氣動流場中的速度和壓力場,并顯示出比RANS 解算器更快地有效估計速度和壓力場數量級,使近實時研究翼型形狀和操作條件對氣動力和流場的影響成為可能.Jin等[60]提出了一種數據驅動模型,通過融合卷積神經網絡CNNs 利用圓柱體上壓力系數的測量來預測圓柱體周圍的速度場.研究發(fā)現(xiàn)該模型的預測結果與計算流體動力學結果很好地一致(圖16),并且數據驅動模型成功地學習了潛在的流動狀態(tài),即尾流結構和圓柱體表面上的壓力之間的關系被很好地建立.金曉威等[61]對物理增強的深度學習方法在流體力學降階模型、流動控制方程求解問題進行了研究.他們介紹了如何將流體物理規(guī)律嵌入深度學習模型,發(fā)現(xiàn)物理融合的神經網絡能夠加速計算流場重構問題,但其所逼近的流場無法嚴格滿足物理規(guī)律.如何改進網絡結構設計使其逼近的流場自然滿足流體物理規(guī)律是需要進一步解決的問題.Hui 等[62]使用符號距離函數(signed distance function,SDF)結合CNN 的數據驅動翼型壓力分布預測方法.在給定機翼幾何形狀的情況下,提出了一個用于預測氣動性能的有監(jiān)督學習問題,均方誤差結果小于2%,模型可以在幾秒鐘內預測壓力系數,比CFD 仿真快3 個數量級.
圖16 不同雷諾數的CFD 結果與模型預測值之間的瞬時流量比較Fig.16 Comparison of instantaneous flow between CFD results of different Reynolds numbers and model predicted values
圖16 不同雷諾數的CFD 結果與模型預測值之間的瞬時流量比較(續(xù))Fig.16 Comparison of instantaneous flow between CFD results of different Reynolds numbers and model predicted values (continued)
針對流場預測與外形優(yōu)化設計問題,Sekar 等[63]提出了一種基于深度卷積神經網絡和深度多層感知器MLP 相結合的數據驅動方法來預測翼型不可壓縮層流定常流場.對流體在物體周圍流動的評估時,Umetani 等[64-65]提出了一個機器學習框架,該框架可以預測給定三維形狀輸入的氣動力、速度和壓力場.提出的新的基于多管映射的參數化方法可以對設計和啟動優(yōu)化進行交互,對學習流動的響應十分快速.Guo 等[14]提出了一種基于CNNs 的二維或三維非均勻定常層流實時預測的通用、靈活的近似模型.研究表明,卷積神經網絡可以估計速度場,比GPU 加速的CFD 解算器快兩個數量級,比基于CPU 的CFD 解算器快四個數量級,且誤差率較低.這種方法可以在設計的早期階段為實時設計迭代提供即時反饋.Zhang 等[66]對多個CNN 結構以及多層感知器進行訓練,預測在多個流動馬赫數、雷諾數和不同迎角下具有各種形狀的翼型的升力系數.研究表明所提CNN 模型在幾何表示的最小約束條件下具有競爭性的預測精度.王怡星等[67]提出一種流場特征提取方法,主要采用Laplace 形式的偏微分方程生成流場網格,并將各網格點曲率值作為深度學習網絡輸入數據,通過這種方法在一定程度上表達了邊界對周圍流場造成的影響.何磊等[68]提出了多種機器學習方法并比較了這幾種方法的優(yōu)勢和不足之處,同時,將流動條件參數組成向量,再映射為圖像,與翼型圖像構成“合成圖像”建立了基于翼型幾何圖像、來流馬赫數、迎角的翼型氣動特性深度神經網絡模型,得到了比較好的預測效果,拓展了氣動特性深度學習建模方法的使用范圍.楊從新等[69]為克服計算流體力學方法計算成本高及無法重復利用計算結果的缺陷,基于深度學習方法,利用132 組二維流場數據建立NACA0018 翼型α=2°~8°,Re=1.0×105~1.6×106下壓力場、速度場的神經網絡定常預測模型,將低速不可壓縮流動能量守恒方程作為約束條件,考慮到翼型升阻力與表面壓力的相關性及流場靜壓與動壓的關系,提出一種能間接約束翼型壓力場與速度場之間關系的激活函數,與傳統(tǒng)的激活函數相比,改進的激活函數因存在內部間接約束,故在翼型速度場的預測中更準確,流場過渡更均勻,并且神經網絡方法通過保存模型可實現(xiàn)重復利用數值模擬結果目的,相比傳統(tǒng)CFD 方法數小時的計算,訓練完成的神經網絡只需要數秒即可得到計算結果,可極大地提升計算效率.惠心雨等[70]為了克服傳統(tǒng)CFD 效率低、成本高的缺陷,提出了一種基于深度學習的非定常周期性流場的預測框架,可以實時生成給定狀態(tài)的高可信度的流場結果.將條件生成對抗網絡與卷積神經網絡相結合,改進條件生成對抗網絡對生成樣本的約束方法,建立了基于深度學習策略,采用改進的回歸生成對抗網絡模型,并與常規(guī)的條件生成對抗網絡模型的預測結果進行對比.基于改進的回歸生成對抗網絡的深度學習策略能準確預測出指定時刻的流場變量,且總時長比CFD 數值模擬減少至少1 個量級.Zhao 等[71]提出了一種基于壓縮傳感的翼型表面壓力精細重構方法,可以用較少的壓力測量數據高精度地重構壓力分布.典型翼型亞音速繞流試驗表明,由4~8 個測點重構壓力積分后的升力和力矩精度可以滿足國家軍用標準的要求.該算法對噪聲具有較強的魯棒性,為工程中從稀疏表面壓力試驗中獲取精確的力數據提供了新的思路.此外,Hu 和Zhang[72]提出一種新的卷積算子(Mesh-Conv),該算子允許CNN 在不需要對像素進行預處理的情況下模擬流場.數值實驗表明,Mesh-Conv 算子比標準卷積算子具有更高的建模精度.模型預測的流場相關系數均在0.999 以上,不存在棋盤格現(xiàn)象.并且,Mesh-Conv 算子很容易擴展到大多數現(xiàn)有的CNN 結構中.
對于定常流場深度學習技術,Ribeiro 等[73]提出了U-net 模型,該模型能成功從CFD 生成的真實數據中學習出不同幾何構型周圍的流場信息,有效地逼近非均勻穩(wěn)定層流問題的解.研究表明與CFD 方法相比速度提高了3 個數量級.作者文中也提到引入物理約束是未來網絡模型的重要環(huán)節(jié).對于引入了物理約束的流場重構工作,堯少波等[74]提出了融合Navier-Stokes (N-S)方程的PINN 神經網絡模型,賦予了傳統(tǒng)神經網絡所不具備的先驗知識和可解釋性,研究結果證實了PINN 方法可為建立流動物理模型提供工具和算法支撐.Raissi 等[75]將流體力學基本方程N-S 方程引入損失函數,實現(xiàn)對圓柱尾流流場以及顱內動脈瘤影像的生物流場重構,這一成果發(fā)表在國際頂級學術期刊Science上.其具體做法是通過自動微分技術對網絡輸出變量求導,并代入N-S 方程計算殘差,損失函數定義為傳統(tǒng)二范數誤差與這一殘差的和.預測結果表明訓練過程所用到的損失函數確實提升了神經網絡的學習效果.相關方法被同一作者應用于渦致振動的研究中,同樣顯示出了良好效果[4].
近年來,基于降階模型的流場重構同樣在基于參數的流場映射重建中取得良好的效果.文獻[76]提出了利用深度前饋神經網絡(deep feedforward neural networks,DFNN)結合流動模態(tài)分解構建流體流動的降階模型,應用提出的方法對動態(tài)失速下的湍流流場進行了模擬,降價模型(reduced order models,ROMs)準確捕捉了前緣失速渦和隨后的后緣渦的流動動力學特性,與傳統(tǒng)的稀疏回歸方法相比,DNN 方法能夠學習流動的瞬態(tài)特征,并提供穩(wěn)定和準確的長期預測.Hasegawa等[77]將卷積神經網絡自編碼器(convolutional neural network autoencoder,CNN-AE) 和長短時記憶(long short-term memory,LSTM)相結合,構造了一種非定常流場降階模型的方法,利用直接數值模擬數據對CNNAE 進行了訓練,將高維流場數據映射到低維空間,應用LSTM 網絡建立流場的時間預測系統(tǒng),應用不同鈍體形狀的繞流驗證了方法的有效性.H u等[78]針對現(xiàn)有的CFD 計算成本高導致獲取大規(guī)模數據的可行性差等問題,提出了基于徑向基函數(radial basis functions,RBF)的生成對抗網絡方法(generative adversarial networks,GANs),開展了流場重構的研究,能夠從有限和稀疏的數據集高精度地重構流場,與基本的GANs 進行流場重構相比穩(wěn)定性提升了34.62%.Ma 等[79]提出了一種基于殘差網絡(residual neural network,ResNet)的非嵌入式流場重構的降階模型,將本征正交分解與ResNet 結合,在NACA0012 翼型流動、可壓縮的M6 機翼流動和非定常圓柱繞流等典型試驗,獲得了比基于前饋神經網絡(feedforward neural networks,FNN) 與POD 結合的非嵌入式降階模型更高的流場重構精度.最近,Brahmachary 等[80]針對于高超聲速Busemann 進氣道和三坡道進氣道提出了一種內流場快速預測的降階模型,應用不同的設計變量通過拉丁超立方抽樣構建樣本庫,結合CFD 計算獲取了流場數據,利用POD 對內流場進行降階,同時采用移動最小二乘法的回歸模型和基于多層感知器的神經網絡技術重構流場,試驗結果表明應用多層感知器的神經網絡對降階后的內流場數據能夠準確估計.上述研究證明了基于降階模型與神經網絡結合的流場重構方法在快速性和準確性等方面具有一定優(yōu)勢.
對具有時間結構信息的數據進行建模時,長短期記憶[81]網絡具有良好的性能.網路結構圖如圖17 所示.網絡主要由三個門結構來控制狀態(tài): 遺忘門、輸入門和輸出門.遺忘門主要是用來遺忘某些信息,輸入門用來保留部分新的信息,使用到tanh 激活函數,最后就是輸出門了,這里使用到Sigmoid 激活函數,表示輸出哪些內容,而前面已被更新的狀態(tài)通過tanh 激活函數后與之相乘,這就是一個時間步長的輸出了,由多個這樣的步長共同組成了整個網絡結構.
圖17 LSTM 結構Fig.17 LSTM structure
針對非定常流動具有時空特性同時變化的特點問題,必須考慮時間效應,因此長短期記憶網絡被廣泛采用.
文獻[82-84]將POD 降階方法與LSTM 網絡相結合成功預測了流場的變化.Huang 等[5]將最先進的實驗技術(即時間分辨體積層析成像)與深度學習算法CNN-LSTM 相結合,以快速預測三維火焰演變.湍流研究方面,Mohan 等[85]提出的CNN 與LSTM 混合網絡則展現(xiàn)出對時空特征的良好建模能力,同時作者也指出還需要進一步的工作,以便在LSTM 模型中包含更多的物理約束和可解釋性.Li 等[86]設計了一個包含特殊卷積LSTM 層和卷積層的深度神經網絡(ConvLSTM),如圖18 所示.該網絡可以通過超聲速葉柵的上游壓力場重建出下游壓力場,在不同的背壓下對訓練后的模型進行測試,重建結果與計算流體力學吻合良好,特別是在識別激波位置變化和高精度識別三維流動中復雜彎曲激波方面.此外,Li 等[87]提出了一種基于全卷積神經網絡(FCNN)的時間序列預測結構用于根據前一時刻的壁面壓力重構超聲速葉柵的未來流場.此網絡將卷積嵌入到長短期記憶中,并在輸出層使用卷積操作代替以往使用的全連接操作.實驗結果表明,所提出的網絡能準確預測激波串前緣位置,最大相對誤差小于4.4%.并且提出雙向LSTM (BiLSTM)預測葉珊通道的壁面壓力,該模型能夠準確地捕捉壁面壓力隨時間變化的非線性特征.本研究結果為后續(xù)確定流場穩(wěn)定裕度奠定了堅實的基礎.
圖18 通過上游壓力場重建超聲速葉柵下游壓力場的ConvLSTM 結構Fig.18 Reconstruction of convlstm structure of downstream pressure field of supersonic cascade through upstream pressure field
Han 等[88]設計了一種新的混合深度神經網絡結構,直接從高維數值非定常流場數據中獲取非定常流動的時空特征.混合DNN 由卷積神經網絡、卷積長短時記憶神經網絡和反卷積神經網絡組成.尹云飛等[89]針對現(xiàn)有的火災煙氣流動與溫度分布預測工作煩瑣、預測準確度低的現(xiàn)狀,提出基于趨勢特征向量的火災煙氣流動與溫度分布預測模型的LSTM-TFV 算法,所提模型能夠抽取火災時間序列數據中的趨勢特征,并將這些特征作為先驗知識來加速和優(yōu)化深度神經網絡的訓練過程.本研究顯示了基于混合深度神經網絡的降階模型在非定常流快速預測中的潛在能力.
本文主要介紹了深度學習中各種不同類型的卷積神經網絡在流場重建中的應用.流場重建可以分為流場超分辨率重構、基于相關參數的流場映射重建、基于LSTM 的流場預測.針對特定問題進行了分類介紹,歸納了相關研究領域的進展與成果.
(1)深度學習中圖像超分辨率技術已經發(fā)展出大量的卷積神經網絡,相比于傳統(tǒng)的插值方法,這些網絡在流場重構方面表現(xiàn)出更好的性能.相比于傳統(tǒng)的CFD 方法,這些網絡在流場重構方面表現(xiàn)出速度上的優(yōu)勢.基于改進的SRCNN 在重構指標上面表現(xiàn)出優(yōu)異的性能,但從重構的圖像上來看出現(xiàn)了平滑的現(xiàn)象.而改進的GAN 則能夠重構出流場中更多的紋理細節(jié),更加符合人眼的主觀感受.如何選擇合適的機器學習方法,需要結合研究的流場數據多尺度時空效應來設計模型架構,進而提高超分辨率算法的魯棒性和計算效率.
(2)通過流場的相關參數對流場進行映射重建,其本質是建立相關參數作為輸入、流場參數作為輸出的網絡模型.與CFD 等傳統(tǒng)計算方法相比較,卷積神經網絡能夠加速基于流場的外形優(yōu)化計算.同時,通過引入物理約束條件可以使得重構效果更佳.
(3)具有時空特性的非定常流場的預測需要使用LSTM 結構的卷積神經網絡模型.此模型可以通過前一時間段的流場數據預測未來某一時段的流場數據.模型中的卷積層部分捕捉流場的空間結構特征并進行降維處理,LSTM 結構部分在保留流場空間結構特征的同時捕捉流場的時間演化特征.
深度學習與流場重構領域相關工作的結合正在逐漸發(fā)展,已經取得了大量卓有成效的結果,但同時也面臨許多挑戰(zhàn).首先,解決不同的流場重構問題,使用合適的神經網絡模型十分重要.沒有一個萬能的網絡模型能夠適用于所有流場數據.并且神經網絡模型的訓練調參是一個非常耗時的過程,這不僅需要計算機擁有強大的運算能力,也需要大量的流場數據驅動.因此,標準流場數據集的建立對流場重構的發(fā)展具有重要意義,這將有助于模型的檢驗與改進,也有助于深度學習與流體力學學科之間的融合發(fā)展.其次,現(xiàn)有的深度學習流場重構模型是基于可獲得的流場圖像數據發(fā)展的,在面對一些地面風洞無法獲得流場圖像的工況下,如何基于已有工況的數據集,基于地面風洞試驗的多源數據進行融合,結合遷移學習等方法,準確重構出流場是一種可工程化推廣的新趨勢.最后,從文獻發(fā)展來看,目前研究主要是關心重構出來的流場精確程度,但針對深度學習流場重構的應用場景研究還相對較少,如何發(fā)展輕量化的深度學習架構模型,并基于FPGA、嵌入式開發(fā)板等進行硬件化設計與工程緊密結合,將流場實時重構方法與流動控制結合,可提升空天飛行器等在復雜多變的飛行環(huán)境過程智能化水平,避免傳統(tǒng)被動控制的局限性.
當前,深度學習在流場重構中的研究更多的是應用于經典方法,如CNN,LSTM,ResNet,GANs 等,而新興的神經網絡模型如針對圖像的Capsule[90]模型,針對序列問題的Transformer[91]模型、Bert[92]模型,針對“non-uniform”數據的GNN[93]模型等在其他領域如遙感圖像檢測等方面取得了一定成效,但是在流場重構方面研究成果較少,將其應用于飛行器/發(fā)動機的流場圖像智能解釋及重構方面可能會進一步取得新的成果.
此外,神經網絡技術在計算流體力學方面也正逐步引起科研人員的廣泛關注和研究.當前針對于飛行器外流的機器學習湍流模型研究較多,可以預見機器學習、CFD 及超級計算機的融合發(fā)展勢必會加速數值模擬計算速度,成為一種新的范式.首先,當前基于數據驅動的湍流不確定度量化及建模方法,有望針對于復雜流動特定的工程問題形成統(tǒng)一的湍流模型,可有效解決傳統(tǒng)的湍流模型參數較多是根據經驗或者人工反復調節(jié)的問題.其次,流體力學數據驅動的建模方法正處于探索階段,研究者應更加關注可解釋性的深度學習技術,而不僅是建立一個湍流代理的黑箱模型,為了提升神經網絡的可解釋性和泛化性,需要考慮基于物理特性的湍流建模方法,這些物理特性主要包括多樣化的幾何構型、湍流模型的時空特征、激波與激波/邊界層的相互作用等,目前通過在神經網絡的損失函數中引入流體力學物理方程對提升精度來說是一個較好的辦法,這同時也增加了傳統(tǒng)神經網絡所不具備的先驗知識和可解釋性,物理約束的引入是未來深度學習技術與流體力學融合發(fā)展的趨勢.最后,深度學習需要大量的數據,計算流體力學受限于數據獲取的高昂價值的缺陷,如何發(fā)展小樣本的神經網絡流動建模方法是工程上可以廣泛推廣的重要研究方向.