劉 罡,李永勝,劉禮文,王晨宇
(中國船舶集團有限公司 第705 研究所,陜西 西安,710077)
尾流是艦船航行時由螺旋槳空化、艦船殼體與水的摩擦、卷入水中的空氣攪拌破碎等因素共同作用下,在船體后方區(qū)域內(nèi)形成的一條含有氣泡的湍流[1]。尾流自導技術(shù)是指水下航行器利用尾流區(qū)域內(nèi)發(fā)生了較明顯變化的水聲、溫度、電磁與光學等物理場性質(zhì)進行制導,以實現(xiàn)檢測和跟蹤目標的目的。相比于其他目標特性,尾流場的物理尺寸大、持續(xù)時間長、不易復制或消除,且與艦船航行軌跡高度重合,尤其針對聲尾流自導技術(shù)的理論研究和工程實踐應用最廣泛,使聲尾流自導方式具備了高命中率等優(yōu)勢,例如美國MK45-F和俄羅斯56 型魚雷使用的頂視尾流聲自導以及側(cè)視尾流聲自導[2]。然而,現(xiàn)有尾流檢測方法都是通過檢測尾流區(qū)域內(nèi)氣泡對聲脈沖多次反射產(chǎn)生的回波脈沖展寬特性實現(xiàn)的,主要基于人工提取的時域特征,過分依賴經(jīng)驗,人為主觀因素影響過大,環(huán)境適應性較差,不符合未來設備智能化發(fā)展的趨勢,而深度學習方法則可以解決這一問題。
深度學習[3-4]通過模擬生物大腦神經(jīng)網(wǎng)絡,具備數(shù)據(jù)驅(qū)動、自主學習、提取目標特征的特點,避免了人工特征的缺陷。近年來,利用深度學習理論進行水下目標檢測與識別方面的研究不斷深入。王強等[5]結(jié)合深度置信網(wǎng)絡(deep brief net,DBN)和有限長單位沖激響應 (finite impulse response,FIR)濾波器證明了深度學習模型在水下目標特征提取方面的可行性。宋達[6]采用時頻分析圖像和深度學習模型實現(xiàn)了對水下蛙人目標的正確識別。呂海濤等[7]利用卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)對艦船輻射噪聲進行分類,分類結(jié)果優(yōu)于傳統(tǒng)識別方案。
但是,在水下目標識別領域中,尤其是針對艦船檢測和識別問題,無法獲取深度學習所需要的海量訓練數(shù)據(jù),導致深度學習模型訓練效果不佳。作為深度學習的一個分支,遷移學習可以將神經(jīng)網(wǎng)絡從源領域?qū)W習到的知識遷移至目標領域,有效解決訓練樣本不足的問題,在降低人力、物力消耗的同時保證了較好的訓練效果。近年來遷移學習技術(shù)[8-9]在水下目標檢測和識別領域發(fā)展迅速。朱兆彤等[10]利用預訓練好的AlexNet 模型實現(xiàn)了對仿真聲吶圖像的精確識別。鄧晉等[11]則利用遷移VGG 模型和梅爾頻譜圖完成了對艦船噪聲信號的有效分類。付同強等[12]通過結(jié)合遷移學習和優(yōu)化二維變分模態(tài)分解方法,完成了對ShipsEar數(shù)據(jù)集中5 類水中目標的分類測試,表現(xiàn)出良好的特征提取能力和噪聲抑制能力。將遷移學習策略應用于水下目標檢測、識別領域的模型中,可以在樣本數(shù)量不足的情況下迅速使深度學習模型獲得目標領域的檢測和識別能力。然而,目前在水下方面應用研究較多的遷移模型主要是卷積神經(jīng)網(wǎng)絡,對聲尾流回波信號并不適用。因此,如何在尾流信號上遷移預訓練的CNN 模型仍需要進行深入研究。
基于以上研究進展及問題,文中提出了一種基于時頻分析和遷移學習的艦船尾流檢測方法。該方法通過對艦船尾流回波進行短時傅里葉變換,得到尾流時頻圖作為遷移模型訓練樣本,進而完成對CNN 模型的遷移;通過對比遷移學習和傳統(tǒng)檢測算法之間、不同遷移學習策略之間以及4 種遷移模型之間的識別性能和時間成本差異,驗證了所提方法的有效性。
尾流回波信號是一種由尾流內(nèi)部氣泡對聲脈沖散射結(jié)果相互疊加產(chǎn)生的混響,因此,可將尾流回波類比于海水混響處理。根據(jù)聲波在氣泡層中散射的能量學理論可知,自導系統(tǒng)接收到的尾流回波聲壓可表示為[13]式中:p0為距離發(fā)射基陣1 m 處的聲壓;r為氣泡散射點和接收基陣之間的距離;β為衰減系數(shù);mkc為尾流散射系數(shù);H為艦船尾流厚度;c為水中聲速;τ為發(fā)射聲脈沖寬度;b(θ,φ)和b′(θ,φ)分別為發(fā)射和接收基陣按照壓力的指向性系數(shù)。
由式(1)可知,艦船尾流的聲學特性主要由尾流散射系數(shù)mkc決定
式中:R為氣泡半徑;n(R)為氣泡分布函數(shù);fr為氣泡諧振頻率;f0為發(fā)射聲脈沖頻率;δ為氣泡諧振的阻尼系數(shù),δ ≈KR=2πf0R/c。
因為尾流回波信號是由尾流區(qū)內(nèi)部的大量氣泡散射產(chǎn)生的,所以mkc取決于氣泡群的聲學特性,如大小、數(shù)量和諧振頻率等。
艦船尾流與正常海水的聲學特性區(qū)別主要由氣泡的半徑和密度體現(xiàn),即
式中,u(R)為單位體積內(nèi)半徑相等的氣泡體積之和。
氣泡諧振頻率計算過程則可以簡化為
又知r=ct/2,則尾流回波信號的聲壓公式為
若從0 時刻開始發(fā)射探測信號,水下航行器航行深度為HT,則航行器接收到尾流信號的開始時間為
則由式(5)和(6)可知,航行器接收到的艦船尾流回波為
其中
通過對上述艦船尾流回波聲學模型進行仿真,進而完成尾流信號的時頻域特性分析。
如圖1 所示,假設艦船航速為10 kn,尾流年齡約3 min,尾流層厚度H為6 m,寬度W為36 m,內(nèi)部氣泡半徑范圍為8 ~200 μm,水中聲速1 530 m/s,衰減系數(shù)為0.1 dB/m,水面風速為3 m/s。假定航行器在艦船尾流正下方,航行深度為10 m,以等時間間隔垂直向上發(fā)射固定頻率的單頻信號。
圖1 尾流探測示意圖Fig.1 Diagram of wake detection
若聲線按照直線傳播,根據(jù)上述條件得到的尾流仿真數(shù)據(jù)與實測數(shù)據(jù)的對比結(jié)果如圖2 所示。根據(jù)圖中結(jié)果可以看出,雖然由于實際水文與尾流厚度等條件變化導致仿真數(shù)據(jù)與實測數(shù)據(jù)在尾流持續(xù)時間、噪聲強度等方面具備一定的差異性,但是二者的慢變包絡比較相似,在體積混響之后都緊跟著尾流反射信號,具備很明顯的時域展寬現(xiàn)象。
圖2 實測與仿真數(shù)據(jù)對比Fig.2 Comparison between measured data and simulation data
水下航行器工作在尾流區(qū)及非尾流區(qū)的回波信號仿真結(jié)果如圖3 所示。從仿真結(jié)果可知,當水下航行器工作在非尾流區(qū)域內(nèi)時,回波信號中僅包含了海水體積混響和海面混響;當水下航行器工作在艦船尾流區(qū)域時,探測脈沖較難透過尾流層,因此回波信號主要由體積混響和尾流的反射信號組成。從圖3 中可以看出,尾流回波在時域上具有明顯的展寬,與非尾流信號有著明顯的差異。然而在實際應用中,尾流回波的時域特征易受到環(huán)境的影響,適應性不足。
圖3 尾流回波與非尾流回波對比Fig.3 Comparison between wake echo and non-wake echo
尾流信號的時間展寬是無法確定的,且容易受到強混響的干擾。因此,可以利用短時傅里葉變換(short-time Fourier transform,STFT)對尾流信號進行時頻分析,觀察尾流回波在時頻域分布特性,獲取更加穩(wěn)定的特征,結(jié)果如圖4 和圖5 所示。
圖4 無尾流回波時頻圖Fig.4 Time-frequency map of non-wake echo
與圖4 結(jié)果相比,圖5 的信號在近距離上存在著較強的尾流反射信號,不但具備明顯的時域展寬效應,而且也表現(xiàn)出很強的頻率擴展,遠大于無尾流區(qū)。因此,與混響相比,艦船尾流信號在回波強度、時域及頻域展寬方面都有著明顯的差異。
艦船尾流檢測可以看作一種特殊的二分類問題。由于回波信號的時頻域結(jié)果可以作為圖像處理的輸入,所以能夠利用圖像識別的方法進行艦船尾流檢測。
CNN 指在網(wǎng)絡的結(jié)構(gòu)中至少使用一層卷積代替一般矩陣運算的神經(jīng)網(wǎng)絡,專門用于處理類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),在網(wǎng)絡輸入為圖像格式時具備顯著的效果,是目前在圖像識別領域應用最成功的深度學習模型。
經(jīng)典的CNN 結(jié)構(gòu)基本由卷積層、池化層和全連接層組成,如圖6 所示。CNN 通過卷積層實現(xiàn)特征學習,池化層對卷積層的學習結(jié)果進行抽象和降維,降低運算壓力。通常利用卷積層和池化層的交替疊加提升模型的學習能力,提取輸入圖像的層次化特征,疊加層數(shù)越多,模型的特征學習能力越強。最終由若干個全連接層對輸入特征進行加權(quán)組合,映射至各類別空間完成目標識別。
在訓練樣本、超參數(shù)等條件一致的情況下,不同的CNN 模型對同一問題的識別效果是不同的,因此選擇模型時需要全面考慮識別精度和訓練效率的問題。文中共選擇了4 個經(jīng)典的CNN 模型進行對比,分別是AlexNet、Inception-v3、ResNet-50以 及ShuffleNet。對比試驗結(jié)果可知,AlexNet 模型效果最佳。
AlexNet 是一種典型的CNN 模型,曾經(jīng)在ImageNet 數(shù)據(jù)集上共1 000 個類別的圖像識別問題中取得了優(yōu)異的成績[14]。標準的AlexNet 共有8 層網(wǎng)絡結(jié)構(gòu),前5 層為卷積 層(Layer1~ Layer5),后3 層為全連接層(Layer6~Layer8),最后一個全連接層輸出連接到softmax 分類器,最終得到輸入樣本分布在1 000 個類別的概率。
一個標準的CNN 模型經(jīng)常具有復雜的結(jié)構(gòu)和龐大的參數(shù)量,訓練一個包含如此多參數(shù)的模型需要海量的樣本數(shù)據(jù)作為支撐,耗時耗力。然而,水下目標識別數(shù)據(jù)集樣本較少,無法支持CNN模型有效訓練,容易發(fā)生過擬合問題,導致網(wǎng)絡性能下降,因此引入遷移學習模型來解決數(shù)據(jù)不足問題。
遷移學習的本質(zhì)是知識的遷移再利用,其定義如下:給定源域Ds和目標域Dt,其中,D={X,P(X)},并且給定源任務T s以及目標任務Tt,其中,T={Y,P(Y|X)}。在Ds≠Dt并且T s≠Tt的情況下,利用來源于Ds和Ts的信息學習得到目標域Dt中的條件概率密度分布P(Yt|Xt)。遷移學習是深度學習理論在缺少大量標注數(shù)據(jù)的任務中規(guī)?;瘧盟匦璧?。
根據(jù)文獻[15]結(jié)論,CNN 模型的淺層結(jié)構(gòu)在不同任務中的特征學習過程具備較高相似性,即具備可移植性,深層結(jié)構(gòu)才體現(xiàn)出不同任務的差異性。因此,可以將在其余任務中完成預訓練的CNN 模型作為特征提取器,遷移至目標數(shù)據(jù)集,結(jié)合其淺層結(jié)構(gòu)搭建合適的網(wǎng)絡模型。
基于遷移學習的艦船尾流檢測方法主要分為2 個部分:艦船尾流檢測框架和基于CNN 模型的遷移學習策略。尾流檢測的設計流程如圖7 所示,首先采集尾流試驗數(shù)據(jù)作為初始樣本;然后對初始樣本數(shù)據(jù)進行離散時間傅里葉變換(discrete-time Fourier transform,DTFT),得到時頻圖作為待檢測樣本集;其次,遷移AlexNet 等預訓練CNN 模型,在時頻圖上進行二次訓練;最終得到尾流檢測結(jié)果,完成試驗性能對比分析。
圖7 艦船尾流檢測框架Fig.7 Ship wake detection framework
基于CNN 模型的遷移學習主要基于參數(shù)凍結(jié)和模型微調(diào)方法實現(xiàn)。如圖8 所示,遷移CNN模型的特征提取層,重新構(gòu)建全連接層與softmax層形成新的模型對艦船尾流進行檢測,具體步驟包括:1) 選定已完成預訓練的CNN 模型;2) 遷移模型的底層結(jié)構(gòu)及相關(guān)參數(shù)至目標模型中;3) 調(diào)整模型的高層結(jié)構(gòu),移除最后一個全連接層,在目標模型中替換成節(jié)點數(shù)為2 的全連接層,構(gòu)成新的模型;4) 在目標數(shù)據(jù)集中重新訓練模型,完成整個CNN 模型的遷移學習過程。
圖8 基于CNN 模型的遷移學習策略Fig.8 Transfer learning strategy based on CNN model
為驗證該方法的有效性,采用某海域下實航數(shù)據(jù)對遷移學習結(jié)果進行驗證,試驗條件如下:試驗船只航行速度為15 kn,吃水深度6 m,航行器航行深度10~15 m,航速50 kn,1 級海況。樣本數(shù)據(jù)共2 500 組,其中620 組為尾流數(shù)據(jù),其余為非尾流數(shù)據(jù),按照8∶2 的比例劃分訓練集和驗證集。由于遷移CNN 模型輸入尺寸與時頻圖原始結(jié)果具有差異,在輸入時需對目標時頻圖進行縮放。
訓練環(huán)境:Inter(R) Core(TM) i9-9900K CPU@3.60 GHz 3.60 GHz,內(nèi)存32 G,程序在windows10系統(tǒng)下Matlab2019 軟件下運行。模型學習率參數(shù)為1×10?4,為加快訓練速度,將新添加層的權(quán)重學習率因子設置為10。
為了測試遷移學習對于訓練樣本量的需求,文中設計了對比試驗,在遷移模型參數(shù)及訓練超參數(shù)不變的情況下,觀察訓練樣本占總樣本量30%~80%下的模型泛化能力,試驗結(jié)果如圖9 所示。
圖9 不同訓練樣本條件下遷移學習性能對比Fig.9 Performance comparison of transfer learning methods based on different training samples
根據(jù)圖中結(jié)果可知,隨著訓練樣本的增加,遷移學習檢測性能緩慢提升。當僅使用30%訓練樣本時,驗證集的檢測正確率在94.17%,損失為0.196 1;當訓練樣本達到80%時,驗證集檢測正確率提升至97.16%,增加了約3%,損失為0.105 7。從試驗結(jié)果上講,增加訓練樣本可以提升尾流檢測的效果,但是,遷移學習方法即使僅使用少量的訓練樣本同樣能夠達到較好的檢測性能。
如上所述,傳統(tǒng)的艦船尾流檢測方法主要依賴于尾流時域回波的展寬效應。為了對比傳統(tǒng)算法與遷移學習方法之間的性能差異,文中設計了時域檢測、時頻圖+深度學習與時頻圖+遷移學習3 類方法的對比仿真試驗。其中人工方法無訓練過程;深度學習方法使用與AlexNet 模型相同的結(jié)構(gòu),隨機初始化模型內(nèi)部參數(shù)值后進行訓練;遷移學習方法則使用已完成預訓練的AlexNet 模型,采用上節(jié)中描述的遷移策略重新訓練模型,3 種尾流檢測方法的結(jié)果如表1 所示。
根據(jù)表1 中算法性能的對比結(jié)果可知,文中所用的時頻圖+遷移學習的尾流檢測方法正確率在96.37%左右,比傳統(tǒng)時域檢測的方法正確率提升了10%左右,高于單獨深度學習模型88.45%的正確檢測率。時頻圖+遷移學習方法的虛警率與漏警率均在4%以下,遠低于傳統(tǒng)時域檢測方法和深度學習方法。此外,深度學習方法和傳統(tǒng)時域檢測方法的虛警率、漏警率和正確率比較接近,即2 種方法之間不存在明顯的性能差異。
表1 3 種算法性能對比Table 1 Performance comparison among three methods
遷移學習與深度學習的訓練過程對比如圖10所示。由圖中的結(jié)果可知,遷移學習方法在經(jīng)過20 多次迭代訓練后驗證集檢測正確率迅速達到95%左右,損失降低至0.3 附近,之后擬合程度緩步提升;而深度學習模型的擬合速度則遠低于遷移學習模型,經(jīng)過100 多次的迭代訓練后,其擬合程度與遷移學習的差距才慢慢縮小,但擬合程度一直低于遷移模型。此外,結(jié)合表1 中結(jié)果,深度學習模型的泛化能力同樣不足。因此,針對文中問題,相比于常規(guī)深度學習模型,遷移學習的泛化能力和訓練效率均占優(yōu)勢。
圖10 遷移學習與深度學習訓練過程對比Fig.10 The training process comparison between transfer learning and deep learning
在遷移模型訓練的過程中,需要對網(wǎng)絡內(nèi)部參數(shù)進行訓練,通常可以采用凍結(jié)參數(shù)和微調(diào)的方法對網(wǎng)絡參數(shù)進行調(diào)整。一般情況下,可以凍結(jié)所有的遷移結(jié)構(gòu)參數(shù),僅對新添加的層進行訓練,也可以對整個模型的參數(shù)進行重新訓練。
為比較不同遷移策略下檢測性能,文中基于AlexNet 模型設計了以下3 種對比試驗:1) 凍結(jié)所有遷移層(Layer1~Layer7)參數(shù),只對全連接層Layer8 進行訓練;2) 凍結(jié)所有卷積層(Layer1~Layer5)參數(shù),訓練全連接層Layer8,同時對前兩層全連接層參數(shù)進行微調(diào);3) 不凍結(jié)參數(shù),訓練全連接層Layer8 的同時對模型的其余參數(shù)進行微調(diào)。3 種對比試驗的訓練過程和最終性能分別如圖11和表2 所示。
由圖11 中3 類方法下遷移學習的重新訓練過程可知,模型的凍結(jié)參數(shù)量越少,擬合結(jié)果越好。在預訓練模型的參數(shù)基礎上,只需要經(jīng)過數(shù)10 次的迭代訓練,遷移模型就可以快速收斂,其損失函數(shù)和擬合狀況都能達到一個較好的狀態(tài)。
圖11 不同凍結(jié)參數(shù)方法訓練過程對比Fig.11 The training process comparison between different freezing parameter methods
根據(jù)表2 中性能對比結(jié)果可知:凍結(jié)所有遷移層需要重新訓練的參數(shù)最少,其運算時間最少,為204 s。與其時間成本相對的是,由于可調(diào)參數(shù)數(shù)量下降,其測試正確率也是最低的。隨著參數(shù)凍結(jié)數(shù)量的減少,3 類方式的正確率和運算時間也逐步提升,最終可達96.37%和266 s。對比方式1、2 與方式2、3 之間的性能差異可知,雖然方式2、3 之間解凍的參數(shù)數(shù)量更多,但是性能提升幅度卻小于方式1、2 之間的差異。此現(xiàn)象說明Layer1~Layer5 之間的卷積層在源數(shù)據(jù)域上已經(jīng)得到了充分的訓練,可以較好地學習圖像的通用特征,微調(diào)卷積層參數(shù)對文中問題的性能提升不明顯,與Yosinski[15]提出的CNN 淺層結(jié)構(gòu)在不同數(shù)據(jù)集上具備高度相似性的論點相符。
表2 不同凍結(jié)參數(shù)方式性能對比Table 2 Performance comparison of different freezing parameter methods
為了對比不同模型的尾流檢測性能,選取AlexNet、ShuffleNet、ResNet-50 以 及 Inception-V3 等4 種預訓練模型進行對比試驗,試驗結(jié)果如圖12 所示。
根據(jù)圖12 結(jié)果可知,各種遷移網(wǎng)絡模型均能夠在較低的迭代次數(shù)后對訓練樣本達到較高的擬合程度。相比其他3 類模型,由于AlexNet 模型的深度較淺且結(jié)構(gòu)相對簡單,所以擬合度在4 類模型中最低。
圖12 不同遷移學習模型訓練過程對比Fig.12 The training process comparison between different transfer learning models
由表3 結(jié)果可知,所有參與對比試驗的CNN模型測試正確率都達到了95%以上,優(yōu)于傳統(tǒng)尾流檢測方法。其中,采用Inception-V3 模型的遷移學習性能最高,正確率達到了97.49%,但耗費時間較多,運算時間為6 749 s;AlexNet 模型的重新訓練所需的時間最短,運算時間為266 s,正確率為96.37%??傮w而言,遷移AlexNet 模型是最優(yōu)的選擇。
表3 不同遷移學習模型泛化能力對比Table 3 Generalization ability comparison between different transfer learning models
通過STFT 獲取尾流信號時頻圖構(gòu)建目標數(shù)據(jù)集,提出了一種基于時頻分析和遷移學習的艦船尾流檢測新方法,并利用實航數(shù)據(jù)驗證了所提方法的有效性。試驗結(jié)果表明,文中方法可以實現(xiàn)對尾流信號時頻特征的有效提取,結(jié)合遷移學習策略能夠在小樣本條件下達到較高的識別正確率,性能超過傳統(tǒng)識別方法10%以上;通過對比試驗比較不同訓練策略和遷移模型的時間成本和正確率差異,結(jié)果表明,綜合時間成本和識別性能,AlexNet 模型為最佳選擇,采用第3 種訓練方式遷移AlexNet 模型可以達到最優(yōu)的識別性能,正確率為96.37%,但運算時間有少量增加。綜上所述,基于時頻分析和遷移學習的方法可以有效地實現(xiàn)艦船尾流檢測,兼顧了時間成本低、樣本需求量低和識別性能高等優(yōu)點,相比傳統(tǒng)尾流檢測算法具有明顯優(yōu)勢。通過實航數(shù)據(jù)測試,驗證了深度學習模型以及遷移學習策略在聲尾流檢測中的可行性,在水下目標回波檢測和識別任務中具有廣闊的應用前景。未來工作中將對此方法進行改進,嘗試對更加復雜的水下目標進行檢測和識別。