陽(yáng)凡林,朱正任,李家彪,馮成凱,邢 喆,吳自銀
1. 山東科技大學(xué)測(cè)繪科學(xué)與工程學(xué)院,山東 青島 266590; 2. 自然資源部海洋測(cè)繪重點(diǎn)實(shí)驗(yàn)室,山東 青島 266590; 3. 自然資源部第二海洋研究所,浙江 杭州 310012; 4. 國(guó)家海洋信息中心,天津 300171
海底底質(zhì)是海洋環(huán)境的重要指標(biāo),底質(zhì)類型的分類和識(shí)別在海洋資源的開(kāi)發(fā)利用、海洋工程、環(huán)境科學(xué)和海洋漁業(yè)等諸多領(lǐng)域具有重要意義。傳統(tǒng)的海底底質(zhì)探測(cè)主要通過(guò)拖曳式采樣器、表層采樣器、柱狀采樣器、重力活塞采樣器、海底照相等,這些方法存在機(jī)械笨重、費(fèi)時(shí)費(fèi)力及深水區(qū)域采樣困難等缺點(diǎn),因此,利用聲學(xué)遙感進(jìn)行海底底質(zhì)分類得到了廣泛關(guān)注[1-3]。多波束測(cè)深系統(tǒng)(multibeam echo sounder,MBES)可同時(shí)采集測(cè)深和反向散射強(qiáng)度數(shù)據(jù)(backscatter strength,BS),具有覆蓋面積廣、分辨率高等優(yōu)點(diǎn),可以快速、準(zhǔn)確地獲取調(diào)查區(qū)域內(nèi)底質(zhì)的分布情況[4-5]。
國(guó)內(nèi)外學(xué)者對(duì)多波束海底底質(zhì)分類進(jìn)行了廣泛研究。文獻(xiàn)[6]提取反向散射圖像分形維數(shù)、光譜長(zhǎng)度等特征作為K-means聚類參數(shù)進(jìn)行分類;文獻(xiàn)[7]通過(guò)反向散射圖像的紋理和振幅特征,使用貝葉斯分類器進(jìn)行分類;文獻(xiàn)[8]通過(guò)提取反向散射圖像的均值、標(biāo)準(zhǔn)差等特征,構(gòu)建單元特征向量,利用遺傳小波神經(jīng)網(wǎng)絡(luò)進(jìn)行海底底質(zhì)分類。由于多波束反向散射圖像具有強(qiáng)噪聲特點(diǎn),很難將圖像處理到比較理想的水平,特別是影響顯著的入射角效應(yīng)。為了避開(kāi)此影響,文獻(xiàn)[9]利用角度響應(yīng)(angle response,AR)曲線進(jìn)行無(wú)監(jiān)督聚類,實(shí)現(xiàn)了海底底質(zhì)的劃分;文獻(xiàn)[10]通過(guò)提取角度響應(yīng)曲線特征,結(jié)合反向散射圖像紋理使用隨機(jī)森林算法進(jìn)行分類;文獻(xiàn)[11]通過(guò)提取角度響應(yīng)曲線的一階導(dǎo)數(shù)、二階導(dǎo)數(shù)和曲率等特征進(jìn)行分類;文獻(xiàn)[12]利用角度響應(yīng)曲線構(gòu)建其三維概率密度進(jìn)行分類。上述方法主要利用多波束反向散射強(qiáng)度形成的圖像及其提取的角度響應(yīng)曲線進(jìn)行分類,分類數(shù)據(jù)類型單一,反向散射強(qiáng)度數(shù)據(jù)質(zhì)量直接決定了分類的精度。除反向散射強(qiáng)度外,多波束測(cè)深數(shù)據(jù)具有較高的精度,研究表明,海底地形變化與海底底質(zhì)的空間分布存在密切關(guān)系[13-14]。因此,本文在反向散射強(qiáng)度的基礎(chǔ)上加入了地形數(shù)據(jù)輔助進(jìn)行分類,改善了分類數(shù)據(jù)類型單一的問(wèn)題,提高了分類精度。
決定多波束底質(zhì)分類精度和效果有兩方面因素,除需要有效特征外,還取決于優(yōu)秀的分類器。文獻(xiàn)[15—18]提出深度學(xué)習(xí)的概念,闡述了深層神經(jīng)網(wǎng)絡(luò)特征學(xué)習(xí)的優(yōu)越性并提出了“逐層預(yù)訓(xùn)練”的方法,從此掀起了深度學(xué)習(xí)的熱潮。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是深層神經(jīng)網(wǎng)絡(luò)的一種,因其具有權(quán)值共享,適用性強(qiáng)等優(yōu)點(diǎn),廣泛應(yīng)用于手寫(xiě)數(shù)字識(shí)別、地震波波形檢測(cè)與分類、影像匹配和高光譜遙感圖像分類等領(lǐng)域[19-22]。目前,關(guān)于人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于海底底質(zhì)分類已有相關(guān)研究[14,23],但利用CNN進(jìn)行多波束底質(zhì)分類的研究較少,文獻(xiàn)[24—25]將反向散射圖像分割后利用CNN進(jìn)行分類,取得了較高的分類精度,但分類結(jié)果圖的空間分辨率降低。為此,本文將以像元為單元,將一維特征向量轉(zhuǎn)換為二維波形圖作為CNN的輸入層,在保證全特征、高空間分辨率的同時(shí),實(shí)現(xiàn)對(duì)海底底質(zhì)的快速、高精度識(shí)別。
特征提取是進(jìn)行訓(xùn)練和分類的重要前提,海底底質(zhì)分類特征按其數(shù)據(jù)類型劃分主要包括:反向散射強(qiáng)度特征和海底地形特征。
反向散射強(qiáng)度是海底底質(zhì)分類的主要數(shù)據(jù)類型,本文提取反向散射圖像(灰度、角二階矩、能量、對(duì)比度及相關(guān)性)5個(gè)及AR曲線(均值、斜率、峰度、偏度)4個(gè),共9個(gè)特征用于底質(zhì)分類。
1.1.1 反向散射圖像特征
反向散射圖像除灰度這個(gè)基本統(tǒng)計(jì)特征外,還蘊(yùn)含豐富的紋理信息。紋理信息反映了圖像表面信息及其與周圍環(huán)境的關(guān)系,更好地兼顧了圖像的宏觀結(jié)構(gòu)和微觀結(jié)構(gòu)[26-27]?;叶裙采仃?gray level co-occurrence matrix,GLCM)是描述和分析圖像紋理的一種有效手段,本文利用灰度共生矩陣法,選取了最具有代表性的4個(gè)紋理特征參數(shù):角二階矩(angular second moment,ASM)、能量(energy,E)、對(duì)比度(contrast,CON)、相關(guān)性(correlation,COR)。具體計(jì)算方法參見(jiàn)文獻(xiàn)[28—29]。
1.1.2 角度響應(yīng)曲線特征
角度響應(yīng)(AR)曲線是反向散射強(qiáng)度隨入射角變化的曲線,與底質(zhì)的屬性有關(guān),提取AR特征能實(shí)現(xiàn)海底底質(zhì)分類。
如圖1所示,在常見(jiàn)底質(zhì)下,入射角θ在0°~15°時(shí),換能器受鏡面反射的影響,接收的反向散射強(qiáng)度較大,稱為D1區(qū),即中央異常區(qū);入射角θ在15°~65°時(shí),換能器主要接收散射模式中的后向散射部分,成為D2區(qū),即漫反射區(qū);入射角θ超過(guò)65°時(shí),稱為D3區(qū),即高入射區(qū)[30-31]?;谏鲜鯝R曲線的分段理論,提取數(shù)據(jù)質(zhì)量較好的D2區(qū),將其斜率絕對(duì)值|K2|及均值Mean2作為AR曲線的特征參數(shù),其中取絕對(duì)值的目的是為了左舷和右舷斜率符號(hào)統(tǒng)一。
圖1 AR曲線分區(qū)Fig.1 Schematic depiction of AR curve division
在同一底質(zhì)類型下,多波束每ping(一個(gè)發(fā)射接收周期)數(shù)據(jù)對(duì)應(yīng)的AR曲線(圖2),其整體變化趨勢(shì)也可應(yīng)用于海底底質(zhì)分類。峰度(kurtosis)和偏度(skewness)是統(tǒng)計(jì)學(xué)中常用的統(tǒng)計(jì)量,可以描述和分析數(shù)據(jù)的分布形態(tài),選取峰度和偏度作為AR曲線的特征參數(shù),具體計(jì)算方法見(jiàn)文獻(xiàn)[32—33]。
圖2 1 ping測(cè)量數(shù)據(jù)對(duì)應(yīng)的AR曲線Fig.2 Schematic depiction of AR curve of one ping data
AR曲線特征提取具體步驟如下。
(1) 以ping為單位,分別提取AR曲線左舷和右舷D2區(qū)的數(shù)據(jù),計(jì)算均值Mean2和斜率絕對(duì)值|K2|,將其作為左舷和右舷所有采樣點(diǎn)的AR特征值。
(2) 重復(fù)步驟(1),直至測(cè)區(qū)所有條帶的采樣點(diǎn)都獲取其對(duì)應(yīng)的AR特征值。
(3) 在地理坐標(biāo)約束下,將測(cè)區(qū)內(nèi)所有采樣點(diǎn)的AR特征值進(jìn)行重采樣(格網(wǎng)化),得到AR曲線均值和斜率絕對(duì)值特征圖。
(4) 以ping為單位,計(jì)算整體AR曲線的峰度和偏度,將其作為該ping內(nèi)所有采樣點(diǎn)的AR特征值。
(5) 重復(fù)步驟(4),直至測(cè)區(qū)所有條帶的采樣點(diǎn)都獲取其對(duì)應(yīng)的AR特征值。
(6) 在地理坐標(biāo)約束下,將測(cè)區(qū)內(nèi)所有采樣點(diǎn)的AR特征值進(jìn)行重采樣(格網(wǎng)化),得到AR曲線峰度和偏度特征圖。
多波束系統(tǒng)以測(cè)深為主,能獲取高質(zhì)量的海底地形,而海底地形信息往往與底質(zhì)的空間分布息息相關(guān)。本文利用測(cè)深數(shù)據(jù),提取了水深均值(mean)、坡度(slope)、地表曲率(curvature)和粗糙度(roughness)4個(gè)地形特征應(yīng)用于海底底質(zhì)分類。具體計(jì)算方法參見(jiàn)文獻(xiàn)[34]。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)多波束海底底質(zhì)分類流程如圖3所示。首先,將原始數(shù)據(jù)進(jìn)行數(shù)據(jù)解析及各項(xiàng)預(yù)處理;然后,進(jìn)行特征提取構(gòu)建特征向量,將特征向量轉(zhuǎn)換為波形圖;最后,建立CNN模型進(jìn)行迭代訓(xùn)練,直至滿足期望誤差,輸出分類結(jié)果,完成精度評(píng)價(jià)。其中,特征向量到波形圖的轉(zhuǎn)換是利用CNN模型進(jìn)行高空間分辨率海底底質(zhì)分類的關(guān)鍵。
圖3 CNN底質(zhì)分類流程Fig.3 Process for seafloor classification using CNN
隨著大數(shù)據(jù)時(shí)代的到來(lái),深度學(xué)習(xí)得到快速發(fā)展,CNN是一種基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),因其具有局部連接、權(quán)值共享及池化操作等特性,可以有效降低網(wǎng)絡(luò)復(fù)雜度,減少訓(xùn)練參數(shù),且易于優(yōu)化和訓(xùn)練,已成為當(dāng)前圖像分類與識(shí)別領(lǐng)域的研究熱點(diǎn)[35-36]。
CNN結(jié)構(gòu)一般由輸入輸出層、卷積層(S)、池化層(C)和全連接層(F)等組成。卷積層包含若干組可以學(xué)習(xí)的卷積核,這些參數(shù)是CNN訓(xùn)練的核心。當(dāng)前層的卷積核對(duì)上一層的特征圖做卷積運(yùn)算,然后通過(guò)一個(gè)激活函數(shù)(activation function)得到新的特征圖
(1)
(2)
池化層常與卷積層交替出現(xiàn),池化層的主要作用是降采樣,減少數(shù)據(jù)量。常見(jiàn)的池化模式包含“最大池化(max poling)”和“平均池化(mean poling)”兩種。經(jīng)過(guò)卷積層和池化層交替操作后,全連接層將得到的二維特征圖拼接成一維特征,對(duì)其進(jìn)行訓(xùn)練和分類。
CNN對(duì)參數(shù)的學(xué)習(xí)訓(xùn)練是通過(guò)梯度反向傳播算法實(shí)現(xiàn)的,其主要優(yōu)化參數(shù)包括卷積核k,全連接層網(wǎng)絡(luò)權(quán)重w和各層偏置b。網(wǎng)絡(luò)訓(xùn)練過(guò)程中,輸入樣本標(biāo)記和實(shí)際輸出樣本標(biāo)記會(huì)有一定誤差,誤差在梯度下降算法中逐層傳播,逐層更新網(wǎng)絡(luò)參數(shù)。為保證代價(jià)函數(shù)盡可能小,需要不斷反向誤差傳播,更新每一層的參數(shù)。CNN基本算法原理參見(jiàn)文獻(xiàn)[18,20]。
以像元為單位構(gòu)成的特征向量是海底底質(zhì)分類的基本單元。如圖4所示,將提取的特征按層結(jié)構(gòu)存儲(chǔ),本文共有13層,包含反向散射強(qiáng)度特征9層、海底地形特征4層。逐層進(jìn)行歸一化,提取每層相同位置的特征數(shù)據(jù),構(gòu)成特征向量。其中,歸一化的目的是防止特征向量中元素值差別過(guò)大,導(dǎo)致特征向量向特征曲線圖轉(zhuǎn)換過(guò)程中信息被忽略。
圖4 特征向量Fig.4 Schematic depiction of feature vector
針對(duì)CNN網(wǎng)絡(luò)輸入層的特點(diǎn),本文將數(shù)據(jù)分類與圖像分類相結(jié)合,以特征序號(hào)為橫坐標(biāo),特征值大小為縱坐標(biāo),繪制特征向量的波形圖,將其輸入CNN模型中進(jìn)行訓(xùn)練和分類(圖5)。該方法將單個(gè)樣本點(diǎn)所包含的全部特征信息(特征向量)及其空間信息(各特征變量之間的相對(duì)位置關(guān)系)通過(guò)波形變化的形式展現(xiàn)出來(lái),即每張波形圖代表某像元的特征信息+空間信息,通過(guò)CNN模型對(duì)波形圖的深度學(xué)習(xí)來(lái)實(shí)現(xiàn)海底底質(zhì)分類。
海底底質(zhì)分類模型的精度評(píng)價(jià)是在分類結(jié)束后,根據(jù)海底底質(zhì)的真實(shí)類別標(biāo)記,統(tǒng)計(jì)分類結(jié)果,以評(píng)估所采用分類算法的準(zhǔn)確性。本文將CNN模型分類結(jié)果與海底底質(zhì)的真實(shí)類別標(biāo)記進(jìn)行對(duì)比得到分類混淆矩陣(confusion matrix,CM),據(jù)此計(jì)算得到總分類精度(overall accuracy,OA)、使用者精度(user accuracy,UA)、生產(chǎn)者精度(producer accuracy,PA)和Kappa系數(shù)(Kappa coefficient)4個(gè)指標(biāo),對(duì)其進(jìn)行精度評(píng)價(jià),具體計(jì)算方法見(jiàn)文獻(xiàn)[37]。
圖5 特征向量到波形圖的轉(zhuǎn)換Fig.5 Schematic depiction of conversion from feature vector to waveform
本文數(shù)據(jù)來(lái)源于2012年的淺水調(diào)查會(huì)議資料,該測(cè)量數(shù)據(jù)滿足國(guó)際海道測(cè)量規(guī)范(IHO SP-44 Ed 5)特級(jí)精度要求。試驗(yàn)數(shù)據(jù)采集于2011年3月8日,在新西蘭首都惠靈頓附近海域使用Kongsberg-EM2040多波束測(cè)深系統(tǒng)測(cè)得的部分?jǐn)?shù)據(jù)作為研究對(duì)象(圖6(a))。該次試驗(yàn)多波束測(cè)深系統(tǒng)(已檢校)的工作頻率為300 kHz,波束寬度為1°×1°,測(cè)區(qū)水深14~25 m,測(cè)線布設(shè)為西北和東北方向共16條測(cè)線。首先,將原始數(shù)據(jù)進(jìn)行解析、預(yù)處理(處理軟件:CARIS HIPS&SIPS10.0),由于測(cè)區(qū)條帶重疊區(qū)域較多,測(cè)量點(diǎn)密度達(dá)到70~90 points/m2,在地理坐標(biāo)下進(jìn)行重采樣(分辨率為0.5 m),最后,進(jìn)行灰度量化,形成多波束反向散射圖像(圖6(b))。
調(diào)查區(qū)域在惠靈頓港口附近,根據(jù)現(xiàn)有資料[38],碼頭及其周圍海域海底底質(zhì)類型主要為基巖和砂,港口外的南部海岸主要為砂和裸露的珊瑚礁。結(jié)合本次試驗(yàn)區(qū)域26個(gè)現(xiàn)場(chǎng)底質(zhì)取樣資料及水下攝像機(jī)提供的高清影像資料,研究區(qū)域底質(zhì)分為3類,即基巖、砂及泥。另外,調(diào)查區(qū)域還有一艘軍艦殘骸,該艦為HMNZS Wellington,所處位置為(41°21′10.8″S,174°46′48″E)。為驗(yàn)證算法的有效性、適用性,及后續(xù)海底目標(biāo)自動(dòng)檢測(cè)與識(shí)別工作的進(jìn)行,本次試驗(yàn)將沉艦也納為分類對(duì)象。試驗(yàn)提取采樣點(diǎn)及其附近相對(duì)應(yīng)的1150組數(shù)據(jù),其中沉艦240組、基巖270組、砂340組、泥300組。(隨機(jī)選取800組數(shù)據(jù)作為訓(xùn)練樣本,剩余350組數(shù)據(jù)為測(cè)試樣本)。
為便于說(shuō)明,選取調(diào)查區(qū)域的一部分作為試驗(yàn)區(qū)域(圖6(b)中虛線方框)進(jìn)行本文算法介紹。利用測(cè)區(qū)內(nèi)的反向散射強(qiáng)度和測(cè)深數(shù)據(jù)進(jìn)行特征提取,包含反向散射圖像紋理特征(角二階矩、能量、對(duì)比度和相關(guān)性)、角度響應(yīng)曲線特征(均值、斜率、峰度和偏度)及海底地形特征(水深均值、坡度、地表曲率和粗糙度)。為便于后續(xù)特征向量的提取,格網(wǎng)大小均為0.5 m×0.5 m,提取結(jié)果如圖7、圖8和圖9所示。
圖6 惠靈頓調(diào)查區(qū)域多波束反向散射圖像及底質(zhì)采樣Fig.6 Schematic depiction of multibeam backscatter image and seafloor sampling in Wellington survey area
圖7 多波束反向散射圖像紋理特征Fig.7 Texture features of multibeam backscatter image
圖8 角度響應(yīng)曲線特征Fig.8 Features of angular response curve
將3.2節(jié)中得到的特征進(jìn)行逐層歸一化,提取特征向量轉(zhuǎn)換為波形圖,如圖10所示,分別展示了沉艦、基巖、砂和泥的4種波形圖(特征組合:反向散射圖像特征+AR特征+海底地形特征),本次試驗(yàn)波形圖大小為28×28像素。與傳統(tǒng)的CNN輸入層相比,本文的波形圖包含了不同特征之間的空間信息(相對(duì)位置關(guān)系),更加直觀、清晰地展示了不同類別之間的差異,更易于模型的分類與識(shí)別;波形圖以像元為單位,在分類結(jié)果圖的空間分辨率上更占優(yōu)勢(shì)。
建立深層CNN模型,輸入訓(xùn)練樣本800組,輸出目標(biāo)向量為T,表示3種自然底質(zhì)類型和1種人工目標(biāo)(沉艦),C1卷積層包含6個(gè)卷積核,卷積核大小為3×3;S1池化層選取最大池化模式,池化窗口為2×2;C2卷積層包含12個(gè)卷積核,卷積核大小為3×3;S2池化層選取最大池化模式,池化窗口為2×2;全連接層數(shù)為1,學(xué)習(xí)率為0.01;每次批處理特征圖5張,所有特征圖循環(huán)迭代5次,共800次(具體CNN參數(shù)的選擇和性能對(duì)比可參考文獻(xiàn)[18])。反向散射圖像的紋理特征是在原始反向散射圖像(灰度)上提取的,海底坡度、曲率、粗糙度等特征是在水深均值(海底DEM)基礎(chǔ)上提取的,上述非原始特征受提取精度和方法的影響,與原始特征(原始反向散射圖像+水深均值+AR特征)的分類效果可能不同,需要定量評(píng)估。另外,也需要分析CNN模型本身對(duì)原始信息的特征提取能力以及加入海底地形特征對(duì)分類結(jié)果的影響,因此,試驗(yàn)選取了5種不同的特征組合進(jìn)行分類,分別是:①反向散射圖像特征;②AR特征;③反向散射圖像特征+AR特征;④原始反向散射圖像+水深均值+AR特征;⑤反向散射圖像特征+AR特征+海底地形特征。通過(guò)上述5種不同的組合模式可以驗(yàn)證本文所提取的不同特征以及加入非原始特征輔助分類的有效性,分類結(jié)果如圖11所示,分類精度見(jiàn)表1。
圖9 多波束海底地形特征Fig.9 Seabed terrain features from multibeam bathymetric data
圖10 沉艦及各自然底質(zhì)波形Fig.10 The waveform map of wreck and seafloor types
圖11 不同特征組合的海底底質(zhì)分類結(jié)果Fig.11 Result maps of seafloor classification by different feature combination models
結(jié)合圖11和表1,可以看出,只利用反向散射圖像特征進(jìn)行分類,不同底質(zhì)邊緣輪廓清晰,但整體連續(xù)性較差,總分類精度和Kappa系數(shù)分別只有66.86%和0.54;只利用AR特征進(jìn)行分類,底質(zhì)連續(xù)性較好,但存在“條紋”現(xiàn)象,總分類精度和Kappa系數(shù)分別為82.29%和0.76;利用反向散射圖像和AR組合特征進(jìn)行分類有效結(jié)合了兩者的優(yōu)勢(shì),在保證底質(zhì)連續(xù)的情況下,消除了“條紋”現(xiàn)象,取得較好的分類結(jié)果(總分類精度88.86%,Kappa系數(shù)為0.82);在此基礎(chǔ)上加入海底地形特征后,使得與地形變化相關(guān)的類別,如沉艦錯(cuò)分為其他底質(zhì)的情況減少,分類精度由88.57%提升到93.75%,總分類精度和Kappa系數(shù)也分別由88.86%、0.82提升到94.86%、0.93,驗(yàn)證了加入地形特征輔助分類的有效性。為了分析非原始特征對(duì)分類結(jié)果的影響,利用原始反向散射圖像、水深均值及AR特征組合進(jìn)行分類,如圖11(d)所示,取得了較好的分類結(jié)果(總分類精度90.00%,Kappa系數(shù)為0.86),但整體低于本文模型算法的分類效果(總分類精度94.86%,Kappa系數(shù)為0.93)。
表1 不同特征組合模型分類精度
為驗(yàn)證本文CNN模型的優(yōu)越性,利用BP網(wǎng)絡(luò)、支持向量機(jī)(support vector machine,SVM)、K近鄰(K-nearest neighbor,KNN)、隨機(jī)森林(random forest,RF)4種經(jīng)典分類器基于同樣的特征組合(反向散射圖像特征+AR特征+海底地形特征)對(duì)同樣的數(shù)據(jù)進(jìn)行分類。BP神經(jīng)網(wǎng)絡(luò)分類時(shí),輸入層設(shè)置為13,隱含層設(shè)置為15,輸出層設(shè)置為4,學(xué)習(xí)率設(shè)置為0.1;SVM分類時(shí),核函數(shù)為徑向基函數(shù)(radial basis function,RBF),網(wǎng)格搜索法尋找最優(yōu)參數(shù)(懲罰因子c:0.7;核函數(shù)參數(shù)g:4);KNN分類時(shí),k設(shè)置為5;RF分類時(shí),樹(shù)最大深度取100,分類結(jié)果見(jiàn)圖12和表2。BP神經(jīng)網(wǎng)絡(luò)作為傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)分類器,其網(wǎng)形結(jié)構(gòu)復(fù)雜,訓(xùn)練參數(shù)較多,但總體分類精度不高(總體分類精度為85.14%,Kappa系數(shù)為0.80);SVM作為常用的監(jiān)督分類方法,算法簡(jiǎn)單、穩(wěn)健性較好,但其泛化能力較弱,不適合大樣本的數(shù)據(jù)訓(xùn)練,易出現(xiàn)過(guò)擬合現(xiàn)象,總體分類精度為88.85%,Kappa系數(shù)為0.85;KNN作為一種懶惰學(xué)習(xí)算法,模型簡(jiǎn)單,易于理解,但其依賴于訓(xùn)練樣本質(zhì)量及參數(shù)k的選取,總體分類精度只有84.57%,Kappa系數(shù)為0.79;RF作為一種決策樹(shù)的集成算法,泛化能力較強(qiáng),分類精度較高(總體分類精度為90.00%,Kappa系數(shù)為0.87),但整體仍低于本文CNN模型得到的結(jié)果(總體分類精度94.86%,Kappa系數(shù)為0.93),體現(xiàn)了深度學(xué)習(xí)算法在海底底質(zhì)分類中的優(yōu)勢(shì)。
表2 不同分類器分類精度
續(xù)表2
圖13為CNN與BP網(wǎng)絡(luò)訓(xùn)練集迭代次數(shù)與誤差精度的關(guān)系(試驗(yàn)采用的處理器:Intel Core i5 4210H,內(nèi)存:4 GB)??梢钥闯?,CNN在收斂速度和性能上均優(yōu)于BP網(wǎng)絡(luò),當(dāng)CNN訓(xùn)練迭代到603步時(shí),收斂到期望誤差0.1;而B(niǎo)P網(wǎng)絡(luò)計(jì)算至1593步時(shí)才達(dá)到期望誤差,耗時(shí)2 min 28 s,這是由于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)(如BP網(wǎng)絡(luò))輸入層的每個(gè)神經(jīng)元都要連接到隱含層,對(duì)全局進(jìn)行感知,計(jì)算和收斂速度較慢且容易陷入局部極值。除此之外,SVM作為二分類器,算法簡(jiǎn)單,運(yùn)行效率高,但當(dāng)執(zhí)行多分類任務(wù)時(shí),需要訓(xùn)練多個(gè)分類器,增加計(jì)算量,試驗(yàn)耗時(shí)1 min 46 s;KNN結(jié)構(gòu)簡(jiǎn)單,運(yùn)算較快,試驗(yàn)耗時(shí)58 s,但其整體分類精度較低;RF作為集成學(xué)習(xí)算法,可以并行訓(xùn)練,提高運(yùn)行效率,試驗(yàn)耗時(shí)1 min 12 s;本文CNN模型算法可以實(shí)現(xiàn)局部感知、權(quán)值共享,試驗(yàn)耗時(shí)1 min 25 s,分類效率高于BP網(wǎng)絡(luò)和SVM,略低于KNN和RF,但整體精度大于上述4種分類器。
利用反向散射與海底地形特征組合采用CNN模型對(duì)整個(gè)調(diào)查區(qū)域進(jìn)行分類,結(jié)果如圖14所示。
可以看出,不同底質(zhì)之間界限清晰,過(guò)渡自然,結(jié)合測(cè)區(qū)已有海底底質(zhì)資料[38](圖6(b)),分類結(jié)果符合真實(shí)的海底底質(zhì)變化情況,驗(yàn)證了本文模型算法對(duì)多波束海底底質(zhì)分類的適用性。
圖13 CNN與BP網(wǎng)絡(luò)訓(xùn)練集迭代次數(shù)與訓(xùn)練誤差的關(guān)系Fig.13 The relationship between iteration times and training error of CNN and BP network training sets
圖14 整個(gè)測(cè)區(qū)海底底質(zhì)分類結(jié)果Fig.14 Result maps of seafloor classification in the whole survey area
多波束海底底質(zhì)分類是近幾十年來(lái)一直延續(xù)的研究熱點(diǎn)。針對(duì)常規(guī)分類手段中數(shù)據(jù)類型單一,分類器的分類精度和效率較低等問(wèn)題,本文在傳統(tǒng)多波束分類數(shù)據(jù)類型(反向散射強(qiáng)度數(shù)據(jù))的基礎(chǔ)上加入了測(cè)深數(shù)據(jù)進(jìn)行輔助分類,并通過(guò)將特征向量轉(zhuǎn)換成波形圖的方式,利用CNN網(wǎng)絡(luò)進(jìn)行訓(xùn)練和分類,最終以94.86%的整體分類精度區(qū)分出基巖、砂和泥等不同自然底質(zhì),且準(zhǔn)確劃分出沉艦?zāi)繕?biāo)的輪廓和位置。試驗(yàn)結(jié)果表明,根據(jù)測(cè)深數(shù)據(jù)所提取的海底地形特征與底質(zhì)的空間分布具有很強(qiáng)的相關(guān)性,在反向散射強(qiáng)度信息的基礎(chǔ)上,組合測(cè)深信息進(jìn)行分類,可有效提高分類精度?;谏疃葘W(xué)習(xí)的CNN網(wǎng)絡(luò),能夠?qū)Σ煌踪|(zhì)和目標(biāo)的波形圖(特征信息+空間信息)進(jìn)行局部感知,充分發(fā)揮其權(quán)值共享的優(yōu)勢(shì),兼顧分類精度的同時(shí),提高了分類效率。利用深層卷積神經(jīng)網(wǎng)絡(luò),組合多波束測(cè)深和反向散射特征進(jìn)行海底底質(zhì)分類,具有特征提取和分類模型的優(yōu)勢(shì),提高了分類精度和效率,對(duì)多波束海底底質(zhì)分類具有參考意義。