国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于雙對(duì)數(shù)譜和卷積網(wǎng)絡(luò)的船舶輻射噪聲分類

2022-06-25 08:40:08徐源超蔡志明孔曉鵬
電子與信息學(xué)報(bào) 2022年6期
關(guān)鍵詞:線譜同源對(duì)數(shù)

徐源超 蔡志明 孔曉鵬

(海軍工程大學(xué)電子工程學(xué)院 武漢 430033)

1 引言

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)在圖像識(shí)別領(lǐng)域[1,2]展現(xiàn)出強(qiáng)大的建模能力,其在船舶輻射噪聲分類中的應(yīng)用也取得進(jìn)展。CNN在分類任務(wù)中的應(yīng)用分3種:一是先人工提取特征,然后將CNN作為分類器;二是利用CNN進(jìn)行特征提??;三是將原始目標(biāo)信號(hào)輸入CNN,構(gòu)建端到端的分類模型。王念濱等人[3]將MFCC(Mel-Frequency Cepstral Coefficients)特征輸入CNN,提出了結(jié)合注意力機(jī)制的快速降維卷積模型。MFCC特征最初用于語音識(shí)別,其濾波器組的中心頻率和帶寬根據(jù)人耳聽覺特性設(shè)計(jì)。船舶輻射噪聲特征信息多集中于低頻線譜,甚至低于人耳聽覺頻率下限,因此直接將MFCC用于船舶輻射噪聲會(huì)丟失信息。Shen等人[4]以時(shí)域信號(hào)為輸入,利用Gammatone濾波器組初始化第1層卷積核并構(gòu)建端到端的CNN。Gammatone濾波器經(jīng)訓(xùn)練后雖然提高了識(shí)別性能,但是增加了過擬合的風(fēng)險(xiǎn);且也是根據(jù)人耳聽覺原理設(shè)計(jì)。Hu等人[5]以時(shí)域信號(hào)輸入CNN自動(dòng)提取目標(biāo)特征,然后用極限學(xué)習(xí)機(jī)作為分類器。Li等人[6]先用不同尺寸的卷積核處理時(shí)域信號(hào),然后在時(shí)頻域上構(gòu)建端到端的CNN。這些研究表明,CNN可以直接對(duì)高維的時(shí)域信號(hào)建模;但這會(huì)引入大量冗余信息,特別是高頻端的冗余信息。Chen等人[7]利用卷積自編碼器在低頻分析記錄(LOw Frequency Analysis Record, LOFAR)中提取特征用于目標(biāo)分類。王念濱等人[8]和Chen等人[9]也以LOFAR輸入CNN。Zhang等人[10]則將包括LOFAR在內(nèi)的多種譜輸入CNN。這些方法把LOFAR看作2維圖像輸入CNN,其在頻率方向上均采用線性坐標(biāo)??紤]由同一噪聲源激發(fā)的諧波特征(以下稱同源特征),當(dāng)基頻變化時(shí),各次諧波特征在線性頻率坐標(biāo)上的變化距離不等,這與卷積層對(duì)輸入的平移等變性不適配。平移等變性[11]是指,當(dāng)輸入平移時(shí)函數(shù)輸出也做相等平移。線性頻率坐標(biāo)的功率譜輸入CNN時(shí),當(dāng)噪聲源工況變化,其“激活”的卷積核不同。

對(duì)數(shù)頻率坐標(biāo)下同源特征等距變化的特點(diǎn)與CNN相適配。同時(shí),對(duì)數(shù)坐標(biāo)放大噪聲譜低頻部分信息,有利于目標(biāo)分類。文獻(xiàn)[12]發(fā)現(xiàn)恒Q變換(Constant Q Transform, CQT)特征比其他特征分類性能更強(qiáng),其在頻率方向采用對(duì)數(shù)坐標(biāo)。CQT多用于音樂分析[13],頻點(diǎn)選取一般根據(jù)十二平均律,而船舶輻射噪聲信息主要包含在低頻段,且CQT特征高頻端分辨率不足可能導(dǎo)致信息丟失,所以分析頻點(diǎn)應(yīng)更加細(xì)密。

減小對(duì)數(shù)的底可以提高頻率分辨率,但同時(shí)會(huì)增加輸入特征長度,導(dǎo)致CNN需要在深層才能對(duì)長距離依賴的同源特征建立連接。本文提出雙對(duì)數(shù)譜,將分辨率很高的對(duì)數(shù)譜頻點(diǎn)排列成矩陣,以此作為網(wǎng)絡(luò)輸入可以兼顧保留信息和控制CNN深度及參數(shù)規(guī)模。針對(duì)輻射噪聲雙對(duì)數(shù)譜的各行表征同一目標(biāo)的特點(diǎn),設(shè)計(jì)一種集成卷積網(wǎng)絡(luò)(Aggregating CNN, ACNN),使各行輸入共享網(wǎng)絡(luò)參數(shù)。進(jìn)一步地,在損失函數(shù)中加入深層特征距離損失作為約束懲罰項(xiàng),提高了分類正確率。

2 模型

2.1 船舶輻射噪聲特征

2.1.1 平移等變性

圖1為某船LOFAR,可以觀察到一組同源特征(圖中紅色方框)。參考白色輔助線,當(dāng)船舶工況變化時(shí),線性坐標(biāo)下線譜間的距離隨之變化,特征尺度變大;對(duì)數(shù)坐標(biāo)下同源特征的尺度則保持不變。CNN的卷積核用于在輸入的不同位置檢測(cè)特定特征。圖2是線性坐標(biāo)下,同源特征激活CNN神經(jīng)元的示意圖。工況1時(shí),同源特征基頻較小,3根線譜的間距較小,激活第1層的卷積核1。工況2時(shí),同源特征基頻增大,3根線譜間距變大,這組特征首先激活第1層的卷積核2,而后激活第2層的卷積核3。線性坐標(biāo)下,不同工況的同源特征激活的神經(jīng)元不同,這種情況不利于CNN層次化地提取目標(biāo)特征。若在對(duì)數(shù)坐標(biāo)下,由于同源特征尺度不變,兩種工況下同源特征激活的卷積核相同,僅是輸出產(chǎn)生了與輸入相等的平移(即平移等變性),這有利于特征的表達(dá)。

圖1 工況變化時(shí),同源特征在線性和對(duì)數(shù)頻率下的表現(xiàn)

圖2 線性頻率坐標(biāo)下同源特征激活神經(jīng)元不同

CNN中的卷積運(yùn)算定義為

2.1.2 雙對(duì)數(shù)譜

兩個(gè)頻率間隔很大的相關(guān)特征要在深層才能建立連接,位于邊緣的特征對(duì)輸出的影響很小,CNN難以捕捉輸入特征的長距離依賴-位置相距很遠(yuǎn)且非獨(dú)立的特征。文獻(xiàn)[14]指出CNN的有效感受野小于理論感受野,在CNN的深層特征圖中,輸入的影響隨其與中心的距離增加而減小,且層數(shù)越多這種情況越嚴(yán)重。雙對(duì)數(shù)譜把增加的頻點(diǎn)放在列方向上以避免一個(gè)方向上的維數(shù)太多,一定程度上規(guī)避了CNN對(duì)長距離依賴建模能力不足的問題。以下介紹雙對(duì)數(shù)譜的計(jì)算過程。首先計(jì)算線性譜(圖3(a)),然后將其轉(zhuǎn)為對(duì)數(shù)譜(圖3(c))??紤][fmin,fmax]頻率范圍內(nèi)取M個(gè)頻點(diǎn)的作為輸入特征,則對(duì)數(shù)坐標(biāo)的底為

圖3 雙對(duì)數(shù)譜處理流程

2.2 分類模型

2.2.1 網(wǎng)絡(luò)結(jié)構(gòu)

圖4 集成卷積網(wǎng)絡(luò)(ACNN)結(jié)構(gòu)

2.2.2 損失函數(shù)

3 方法

3.1 數(shù)據(jù)集和預(yù)處理

本文基于DeepShip[12]數(shù)據(jù)集驗(yàn)證分類算法。

3.2 模型參數(shù)設(shè)置

表1 DeepShip 數(shù)據(jù)集樣本統(tǒng)計(jì)

表2 ACNN 的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)

對(duì)照組CNN結(jié)構(gòu)參數(shù)如表3所示。針對(duì)1維譜(包括線性譜和對(duì)數(shù)譜),用1維卷積網(wǎng)絡(luò)(CNN1d)作為分類器;針對(duì)雙對(duì)數(shù)譜,用2維卷積網(wǎng)絡(luò)作為分類器(C N N 2 d)。需注意,與A C N N 不同,CNN2d將雙對(duì)數(shù)譜當(dāng)作普通2維特征(類似圖像),從第1層開始就使用2維卷積。表中展示CNN各層卷積核數(shù)目,“CNN1d-256維”、“CNN2d”第1層卷積核尺寸分別為5和3×5,其余卷積核尺寸均為3;網(wǎng)絡(luò)最后若干層使用尺寸為2的最大池化將特征維度降至1024,然后連接相同的4層全連接結(jié)構(gòu)。

表3 對(duì)照組 CNN 結(jié)構(gòu)參數(shù)

試驗(yàn)中所有網(wǎng)絡(luò)均使用了批標(biāo)準(zhǔn)化和ReLU(Rectified Linear Unit)激活函數(shù),網(wǎng)絡(luò)輸出使用Softmax激活函數(shù),目標(biāo)函數(shù)為交叉熵?fù)p失。注意,試驗(yàn)中ACNN與“CNN1d-256維”的網(wǎng)絡(luò)參數(shù)量一致,ACNN在最后一層用平均池化集成了I個(gè)輸出。

3.3 訓(xùn)練和驗(yàn)證

4 試驗(yàn)

4.1 分類性能比較

各算法分類正確率如表4所示(“ACNN”指不加約束,“ACNN+約束”指施加約束),有如下結(jié)果:(1)對(duì)數(shù)譜特征優(yōu)于線性譜。CNN1d的輸入特征分別為256,1024和2048維時(shí),對(duì)數(shù)譜的正確率比線性譜分別高1.40%, 1.55%和0.71%。256維對(duì)數(shù)譜的正確率比1024和2048維線性譜都略高。(2)對(duì)于線性譜和對(duì)數(shù)譜,CNN輸入特征的維數(shù)不宜太高。無論是線性譜還是對(duì)數(shù)譜,CNN1d的輸入為1024維時(shí)分類性能都是最好的。頻率分辨率太低會(huì)模糊特征的頻率信息,分辨率太高則會(huì)導(dǎo)致特征維數(shù)太高、冗余信息太多。(3)當(dāng)特征維數(shù)很高時(shí),雙對(duì)數(shù)譜可以克服對(duì)數(shù)譜維數(shù)太高的問題。輸入特征為1024維時(shí),“CNN2d+雙對(duì)數(shù)譜”比“CNN1d+對(duì)數(shù)譜”的正確率略低0.18%,因?yàn)榇藭r(shí)雙對(duì)數(shù)譜I=4,特征會(huì)在首行和尾行之間跳躍。而當(dāng)輸入特征增加到2048維時(shí),“CNN1d+對(duì)數(shù)譜”正確率下降了,“CNN2d+雙對(duì)數(shù)譜”的正確率則提高到66.35%,比前者高1.04%,表明雙對(duì)數(shù)譜可以規(guī)避CNN對(duì)長距離依賴建模能力不足的問題。(4)本文提出的ACNN適配雙對(duì)數(shù)譜,性能高于普通2維卷積網(wǎng)絡(luò)CNN2d。雙對(duì)數(shù)譜維數(shù)分別為4×256和8×256時(shí),ACNN的正確率比CNN2d分別高0.79%和0.97%。(5)施加約束懲罰可進(jìn)一步提高ACNN的分類性能。雙對(duì)數(shù)譜維數(shù)分別為4×256和8×256時(shí),施加約束后正確率分別提高0.25%和0.15%。

表4 分類正確率

4.2 平移等變性

利用仿真信號(hào)探究線性譜和對(duì)數(shù)譜輸入下CNN的平移等變性。產(chǎn)生一組線性調(diào)頻諧波信號(hào)

圖5(a)中,線性坐標(biāo)下,線譜特征隨基頻增加向高頻端移動(dòng),同時(shí)10根線譜組成的特征尺度逐漸增加。當(dāng)基頻增加到原來的2倍,表達(dá)線譜特征的分辨單元數(shù)由23增加到45,相鄰線譜間隔由2增加到5個(gè)分辨單元。在這個(gè)過程中,如圖5(c)所示,CNN1d第1層最大輸出卷積核發(fā)生變化:第0~40 s,22號(hào)卷積核的輸出最大;第40~160 s, 10號(hào)卷積核的輸出最大;第160~380 s, 24號(hào)卷積核的輸出最大。由于第1層卷積核尺寸為5,第380~400 s后,相鄰線譜間隔達(dá)到5個(gè)分辨單元,各卷積核的輸出均較小,此時(shí)相鄰線譜構(gòu)成的局部特征要在卷積網(wǎng)絡(luò)的下一層才能被檢測(cè)到。

圖5(b)中,對(duì)數(shù)坐標(biāo)下,線譜特征隨基頻增加向高頻端平移。與線性譜不同,基頻增加過程中,對(duì)數(shù)譜中10根線譜組成的特征尺度保持不變,表達(dá)這個(gè)同源特征的分辨單元始終為32個(gè)左右,相鄰線譜間隔的分辨單元?jiǎng)t因線譜頻率不同為1至3個(gè)不等,同階次線譜的間隔不隨頻率變化。如圖5(d)所示,CNN1d第1層最大輸出卷積核始終為22或24號(hào),且各卷積核輸出值基本不變,這表明同源特征在對(duì)數(shù)譜中的表達(dá)方式與卷積的平移等變性相適配。

圖5 卷積網(wǎng)絡(luò)第1層的最大輸出

4.3 約束懲罰系數(shù)

為考察目標(biāo)函數(shù)中懲罰系數(shù)α的影響,分別設(shè)置其為0, 0.01, 0.1, 1和10,交叉熵?fù)p失LCE和深層特征距離損失Lstd隨訓(xùn)練輪數(shù)的變化情況如圖6所示,其中圖6(b)中小圖是第20~30輪的局部放大。

如圖6(b)所示,模型在測(cè)試集上的LCE均隨訓(xùn)練輪數(shù)增加而減小。當(dāng)α=0時(shí),即損失函數(shù)中忽略Lstd時(shí) ,圖6(a)中Lstd隨訓(xùn)練輪數(shù)增加而增加。這表明不添加約束時(shí),雙對(duì)數(shù)譜的I個(gè)“樣本”在ACNN深層特征空間中的距離會(huì)隨著訓(xùn)練增大,這不滿足I個(gè)“樣本”為同一個(gè)體的先驗(yàn)。相應(yīng)地,圖6(b)的局部放大圖中,α為0時(shí)的LCE大于α為0.01,0.1和1時(shí)的LCE。這表明,ACNN的損失函數(shù)中加入Lstd作為約束懲罰,有助于提高分類性能,這與4.1節(jié)的結(jié)果一致。

注意到LCE的值在1~1.3,而不加約束(α=0)時(shí)Lstd的值在0.25~1.45,二者大致處于同一量級(jí),因此考慮設(shè)置α≤1??梢钥吹疆?dāng)α=10時(shí),雖然Lstd被 控制得很小,但是圖6(b)中LCE遠(yuǎn)高于其余曲線。這表明,損失函數(shù)中約束懲罰的比重太大,影響了模型收斂速度和分類性能。

具體地,懲罰系數(shù)α的值可通過試驗(yàn)確定。當(dāng)α=0.01時(shí) ,隨著訓(xùn)練輪數(shù)增加Lstd的值逐漸增大到0.75,明顯小于不加約束時(shí)Lstd的值;相應(yīng)地,圖6(b)中LCE的值略小于不加約束的情況。當(dāng)α=0.1時(shí),Lstd的 值先略微增大而后緩慢減小,LCE的值進(jìn)一步減小。當(dāng)α=1時(shí) ,Lstd迅速減小(僅訓(xùn)練2輪就收斂);此時(shí),圖6(b)中LCE的 值略小于α=0.1時(shí)的情況,且前10輪的收斂速度變慢。綜上,約束懲罰系數(shù)α的值可設(shè)置為0.1~1,考慮到訓(xùn)練的收斂速度,4.1節(jié)分類性能比較試驗(yàn)中α均設(shè)置為0.1。

圖6 懲罰系數(shù)對(duì)損失函數(shù)的影響

5 結(jié)束語

本文針對(duì)CNN的平移等變性原理,探究了線性譜和對(duì)數(shù)譜作為輸入特征時(shí)的分類性能差異。結(jié)果表明,對(duì)數(shù)譜優(yōu)于線性譜。針對(duì)CNN在深層才能對(duì)長距離依賴建模的缺陷,本文提出雙對(duì)數(shù)譜特征。試驗(yàn)表明,在輸入維數(shù)較高的情況下,雙對(duì)數(shù)譜仍能有效建模,分類性能優(yōu)于對(duì)數(shù)譜。提出的ACNN把雙對(duì)數(shù)譜各行看作來自同一個(gè)體的多個(gè)樣本,集成分類打分結(jié)果;構(gòu)造深層特征距離損失作為約束懲罰,進(jìn)一步提高分類正確率??傮w上,特征為1024和2048維時(shí),以雙對(duì)數(shù)譜為輸入的ACNN(加約束)的正確率,比以線性譜為輸入的CNN1d分別提高了2.41%和2.87%。本文著重研究單幀譜特征作為CNN輸入時(shí)的分類性能,考慮時(shí)頻特征CQT的良好表現(xiàn),下一步將把雙對(duì)數(shù)譜拓展為時(shí)頻特征。

猜你喜歡
線譜同源對(duì)數(shù)
藥食同源
——紫 蘇
兩岸年味連根同源
UUV慣導(dǎo)系統(tǒng)多線譜振動(dòng)抑制研究
含有對(duì)數(shù)非線性項(xiàng)Kirchhoff方程多解的存在性
指數(shù)與對(duì)數(shù)
以同源詞看《詩經(jīng)》的訓(xùn)釋三則
指數(shù)與對(duì)數(shù)
對(duì)數(shù)簡史
虔誠書畫乃同源
“”維譜在艦船輻射噪聲線譜提取中的應(yīng)用
道孚县| 繁昌县| 绵阳市| 鄂州市| 济南市| 邵武市| 隆化县| 德清县| 开封市| 师宗县| 花莲市| 忻城县| 芮城县| 卫辉市| 武穴市| 岳阳县| 高要市| 宜章县| 信宜市| 光山县| 常州市| 福海县| 改则县| 凌云县| 庄河市| 曲靖市| 长岛县| 安平县| 马龙县| 马鞍山市| 库尔勒市| 鱼台县| 文水县| 米易县| 屏边| 双城市| 文登市| 松阳县| 洮南市| 赤峰市| 宜川县|