夏顯文
(中交第三航務(wù)工程局有限公司,上海 200032)
海底底質(zhì)分布是水下工程、海洋礦產(chǎn)資源探測、海洋漁業(yè)、海洋環(huán)境研究等活動的基礎(chǔ)保障信息。利用多波束背散射數(shù)據(jù)進行海底底質(zhì)分類是目前多波束聲吶系統(tǒng)研究應(yīng)用的熱點和難點[1],許多學(xué)者就此開展了相關(guān)研究。Jackson等[2]采用微分法提取實測回波強度的角度響應(yīng)曲線特征參數(shù),可以較好地描述底質(zhì)的聲散射特性,但是測量誤差對提取的特征參數(shù)影響較大。Hellequin等[3]提出的GSAB模型是根據(jù)聲散射特性建立的整個角度范圍內(nèi)的近似模型,具備良好的抗誤差能力,但往往使用數(shù)十ping數(shù)據(jù)的均值進行參數(shù)提取,導(dǎo)致分類結(jié)果的空間分辨率低。Clarke等[4]統(tǒng)計了不同入射角度與反向散射強度之間的關(guān)系,建立了區(qū)分不同底質(zhì)的回波強度與入射角關(guān)系對;金紹華等[5]結(jié)合Jackson模型和GSAB模型,使用非線性最小二乘擬合提取底質(zhì)相關(guān)特征參數(shù)。上述方法主要基于角度響應(yīng)曲線進行分類,盡管具有明確的物理依據(jù),但是角度響應(yīng)曲線只能用于單ping數(shù)據(jù)的分類,ping內(nèi)數(shù)據(jù)無法分類。
相對于上述方法,基于統(tǒng)計特征的方法可使得同一ping的不同底質(zhì)也能夠被區(qū)分[6]。呂良等[7]基于紋理特征和K-均值聚類算法實現(xiàn)了海底底質(zhì)分類以及最佳分類數(shù)目的選取研究。Landmark等[8]提出了一種基于標準Bayesian模型的底質(zhì)分類方法,依據(jù)單一角度下回波強度服從正態(tài)分布這一統(tǒng)計特征實現(xiàn)了底質(zhì)分類。盡管這些方法能實現(xiàn)單個像素的底質(zhì)分類,具有較高的分辨率,但復(fù)雜水體環(huán)境導(dǎo)致聲吶圖像包含較多噪聲,使得類別劃分存在錯誤[9]。
基于角響應(yīng)特征分類分辨率低,而基于像素統(tǒng)計性特征分類抗噪性低。針對這一問題,本文提出一種基于對象的底質(zhì)分類方法,即在背散射圖像處理完成后,先使用SLIC超像素分割算法將聲吶圖像分割成內(nèi)部均一的對象塊;再對每個對象塊提取統(tǒng)計性特征,顯著降低噪聲的影響,獲得準確清晰的類別邊緣;進而基于K-means++聚類算法實現(xiàn)對象塊底質(zhì)分類。
背散射強度數(shù)據(jù)處理的流程、算法等在不同聲吶系統(tǒng)、同一系統(tǒng)不同的運行模式、不同的后處理軟件之間都有差異,而且很多是黑箱操作,這樣導(dǎo)致回波強度的最后產(chǎn)品存在未知的改正殘余,影響后續(xù)使用。為了解決這一情況,Schimel等[10]整理出了適用不同聲吶系統(tǒng)、改正步驟完整的通用回波強度數(shù)據(jù)處理流程,見圖1。
圖1 強度處理流程
傳統(tǒng)的基于聲吶圖像的底質(zhì)分類算法以像素點或矩形像素塊作為分類的基本單元。以像素點為最小分類單元的算法將像素點對應(yīng)的強度值作為特征參數(shù)進行分類,分類后的結(jié)果往往存在大量噪點,精度較差。因此本文采用SLIC算法先對背散射圖進行對象分割,獲得內(nèi)部屬性均一、邊界輪廓清晰的對象塊[11-12]。下面給出SLIC算法的實現(xiàn)步驟。
1)初始化種子點(聚類中心)。設(shè)定圖像的超像素個數(shù)為K,將K個種子點均勻地分布在圖像上。假設(shè)圖像的像素點個數(shù)為N,則每個超像素的像素點數(shù)大約為N/K,相鄰種子點距離近似為S=sqrt(N/K)。
2)優(yōu)化聚類中心。計算初始種子點各方向上的灰度梯度值,將種子點向梯度最小的方向移動,避免種子點正好處于不同對象的邊界上,影響后續(xù)的聚類效果。
3)對每個種子點,搜索其鄰域內(nèi)的所有像素點,計算種子點到像素點的距離,為每個像素點分配標簽,即所屬聚類。以I號種子為例,分配標簽的方法是若該像素點無標簽,則該像素屬于類別I,并記錄到I號種子的距離。若已有標簽J,則比較像素到兩個種子的距離,取最小距離的種子編號為類別標簽,記錄最小距離。不同于K-means方法搜索整張圖像,SLIC算法只搜索種子附近的像素,搜索窗口大小為2S×2S,提高了搜索速度。
4)距離的計算方式。距離計算采用的是5維向量,分別是表示LAB顏色空間距離的l、a、b和表示空間距離的x、y。距離計算方式如下:
(1)
(2)
(3)
5)迭代優(yōu)化。所有種子搜索完畢后,重新計算每個聚類中心,不斷迭代上述步驟直至聚類中心不再發(fā)生變化。實際操作中,迭代10次左右即可實現(xiàn)收斂。
6)增強連通性。經(jīng)過上述步驟產(chǎn)生的分割結(jié)果可能存在超像素多連通或像素尺寸過小等情況,需要通過將多連通區(qū)域分割、將小尺寸超像素分配給鄰近超像素等增強連通性。
聲吶圖像一般包括測區(qū)強度圖和背景,使用SLIC算法對聲吶圖像分割之后還需將背景與前景分開,剔除背景像素,只保留存在強度信息的像素,對處理后的像素塊重新編號便于后續(xù)處理。
聲吶圖像的灰度反映了底質(zhì)的后向散射強度,部分類別底質(zhì)的散射回波強度存在明顯差異,此外,聲吶圖像上還存在少量的紋理特征,能夠反映回波強度相近的不同底質(zhì)間的差異。經(jīng)典的紋理特征提取方法是基于統(tǒng)計的方法,如灰度共生矩陣、灰度差分統(tǒng)計等,本文采用的是應(yīng)用較為廣泛的灰度共生矩陣?;叶裙采仃囃ㄟ^統(tǒng)計不同灰度值對的出現(xiàn)頻率得到,基于灰度共生矩陣可以計算出能量、熵、對比度、均勻性、相關(guān)性、方差、和平均、和方差、和熵、差方差、差平均、差熵、相關(guān)信息測度以及最大相關(guān)系數(shù)等14種統(tǒng)計量[13]。大部分統(tǒng)計量存在一定的相關(guān)性,本文選取了常見的底質(zhì)分類器中選用的相關(guān)性較小、識別能力較大的能量、對比度、均勻性和相關(guān)性4個特征量,以及灰度特征,共5維特征[14]。對SLIC處理后獲取的每個對象塊內(nèi)的背散射圖像提取以上5維特征,可獲得底質(zhì)類別描述性特征向量,用于后續(xù)分類。
K-means++算法[15]是一種非監(jiān)督分類算法,相對于傳統(tǒng)的K-means算法,該算法對初值不敏感,理論更為嚴謹,其聚類實現(xiàn)過程如下:1)設(shè)置聚類數(shù)目K、樣本總數(shù)N,從樣本集中隨機選取1個樣本作為第1個聚類中心;2)計算樣本集中每個樣本到已選出的聚類中心中最近聚類中心的距離;3)從未被選中的樣本點中選出1個新的聚類中心,選取規(guī)則是:對所有未被選中的樣本點,第2步計算的距離越大,其被選作新聚類中心的概率越大;4)重復(fù)第2步和第3步直至選擇出K個聚類中心。
經(jīng)過上述步驟選擇出K個樣本點作為初始聚類中心,運行標準的K-means算法對樣本集進行聚類。已確定初始聚類中心的K-means算法的步驟如下:1)計算N個樣本點到K個聚類中心的距離;2)遍歷所有樣本,每個樣本點記錄與其距離最近的聚類中心作為所屬類別標簽;3)重新計算聚類后的K個樣本集的中心,作為新的聚類中心;4)重復(fù)第1步和第2步直至聚類結(jié)果不再發(fā)生變化或者到達最大迭代次數(shù)。
對每個對象塊的特征向量采用上述聚類算法進行對象塊聚類合并,獲得最終底質(zhì)分類結(jié)果。
本文試驗數(shù)據(jù)所在測區(qū)位于山東青島膠州灣海區(qū),地理位置見圖2a)。膠州灣具有典型的港灣海岸與淤泥海岸特征,沿岸地貌類型復(fù)雜,海底地貌類型多樣。膠州灣海底底質(zhì)類型豐富多樣,有淤泥質(zhì)粉砂黏土、粉砂質(zhì)黏土、黏土質(zhì)粉砂、泥質(zhì)砂、砂質(zhì)泥、粉砂、細砂、粗砂、礫石、泥巖、基巖等,有利于開展海底底質(zhì)分類方法研究。
試驗選取了2002年海底測量過程中使用Kongsberg EM3000多波束系統(tǒng)以單扇區(qū)模式測量的16條測線。測量時儀器工作頻率300 kHz、波束寬度1.5°×1.5°、脈沖長度150 μs。設(shè)備采用等角模式,扇面開角130°。測量過程中對測區(qū)內(nèi)的海底底質(zhì)進行了實地采樣,通過現(xiàn)場目視判斷資料,采樣底質(zhì)包括泥質(zhì)砂、砂質(zhì)泥、細砂、粗砂、礫石、基巖等,利用采樣點信息作為非監(jiān)督分類的類別數(shù)目確定依據(jù)和分類精度評定依據(jù),以及監(jiān)督分類方法的不同底質(zhì)類型的樣本采樣依據(jù)。為了得到用于底質(zhì)分類的聲吶圖像,需要對記錄原始數(shù)據(jù)的*.all文件進行處理。因為測量時采用了單扇區(qū)測量模式,所以無需顧及不同扇區(qū)發(fā)射、接收模式不同造成的條帶差異,主要的輻射畸變改正步驟包括傳播損失改正、照射面積改正及角度響應(yīng)移除。最終形成的歸一化海底強度圖像,回波強度范圍在-53~-3 dB。試驗使用了23個底質(zhì)采樣點信息,其分布見圖2b),可見不同底質(zhì)類型的回波強度存在明顯差異,如基巖和泥質(zhì)砂采樣點所在區(qū)域,在背散射圖像上尤為突出,分別呈現(xiàn)為高亮和暗區(qū)域。傳統(tǒng)的聲吶圖像最小分類單元的劃分策略存在不足,以像素點進行分類的結(jié)果存在較多噪點,以矩形像素塊進行分類則大大降低了分辨率,為彌補以上不足,試驗采用了SLIC分割算法,以分割后的超像素為最小分類單元,見圖2c)。使用SLIC算法對聲吶圖像進行分割首先要設(shè)計超像素的大小,即每個超像素大致包含的像素點的個數(shù),本文試驗設(shè)計SLIC算法的超像素大小為10。
圖2 處理結(jié)果
分割完畢后提取超像素的特征參數(shù)用于分類算法。經(jīng)過輻射畸變改正后的多波束回波強度直接反映了底質(zhì)對于聲波的散射能力,回波強度存在明顯差異的海底分布著不同的底質(zhì),而回波強度的大小直接對應(yīng)著聲吶圖像上像素的灰度級高低。本文試驗采用的映射是回波強度越大、灰度級越高,在聲吶圖像上表現(xiàn)越亮。除灰度特征以外,聲吶圖像還包含少量的紋理信息,具有區(qū)分灰度特征相似的不同底質(zhì)的潛力。試驗選取了基于灰度共生矩陣的部分特征量,分別是能量、對比度、相關(guān)性、均一性。試驗數(shù)據(jù)覆蓋范圍內(nèi)的采樣點包括了砂質(zhì)泥、泥質(zhì)砂、細砂、粗砂、礫石及基巖6種底質(zhì),但是基于聲吶圖像的底質(zhì)分類不能將6種底質(zhì)精準區(qū)分,選擇類別數(shù)為4。最終的分類結(jié)果見圖3a),同底質(zhì)區(qū)域超像素形狀較為規(guī)則,不同底質(zhì)邊界處超像素形狀契合底質(zhì)邊界形狀。
表1給出了分類結(jié)果。表1顯示,5個基巖采樣點全部位于class 1區(qū)域,且此區(qū)域不包含其他采樣點;砂/礫石采樣點中有10個位于class 2區(qū)域,1個位于class 4區(qū)域,該點處于細砂與泥質(zhì)砂的過渡區(qū)域;砂質(zhì)泥有2個采樣點位于class 3,其余2個位于砂/礫石區(qū)域class 2;泥質(zhì)砂背散射強度較低,3個采樣點全部位于class 4區(qū)域,整體分類精度達到了86.96%。由分類結(jié)果可以發(fā)現(xiàn),此方法對基巖和泥質(zhì)砂的識別度較高,且能區(qū)分砂/礫石和砂質(zhì)泥區(qū)域,但部分砂質(zhì)泥采樣點被劃分到砂/礫石區(qū)域。
表1 本文方法分類結(jié)果混淆矩陣
對比聲吶圖像和分類結(jié)果圖像,底質(zhì)變化明顯的邊界輪廓保留較好。相對于聲吶圖像中存在較高的噪聲,分類結(jié)果圖像同底質(zhì)區(qū)域內(nèi)噪點壓制效果較好。
圖3b)和c)分別給出了基于貝葉斯方法和基于K-means++方法的底質(zhì)分類結(jié)果。貝葉斯方法是一種估計角響應(yīng)特征和底質(zhì)回波強度統(tǒng)計信息的方法,相對于傳統(tǒng)角度響應(yīng)分類方法具有更好的分辨率;基于K-means++的底質(zhì)分類方法是基于像素點及其鄰域特征開展分類的方法,抗噪性更差。具體的分類結(jié)果統(tǒng)計見表2,基于貝葉斯的底質(zhì)分類方法取得了82.6%的分類精度,而基于K-means++的方法取得了73.91%的分類精度,這表明噪聲的干擾較為顯著地降低了分類精度。對比本文方法可知,基于對象的方法可顯著增強方法魯棒性,提升分類精度。
注:所有分類中類別數(shù)均設(shè)置為4。
表2 基于貝葉斯方法和K-means++分類結(jié)果混淆矩陣
1)本文提出了一種基于對象的底質(zhì)分類方法,有效解決了基于角響應(yīng)特征分類分辨率低和基于像素統(tǒng)計性特征分類抗噪性低的問題,試驗中取得了86.96%的精度,較顧及角響應(yīng)特性的貝葉斯分類方法和基于像素的K-means++分類方法精度分別提升了3%、13%,實現(xiàn)了底質(zhì)類別高精度劃分。
2)基于對象的底質(zhì)分類方法可顯著降低噪點對分類結(jié)果的影響,同時保證類別邊界精細度,使分類結(jié)果精度提升。
3)本文試驗表明基于傳統(tǒng)多波束設(shè)備的聲學(xué)底質(zhì)分類方法對礫砂、粗砂、礫石等分辨力有限。近年來,基于多頻多波束設(shè)備的聲學(xué)底質(zhì)分類方興未艾,有望提升多種底質(zhì)下類別劃分能力。