楊進濤,仇曉蘭,丁赤飚,,雷 斌,,盧曉軍
(1 中國科學院大學, 北京 100049; 2 中國科學院電子學研究所 微波成像技術(shù)國家重點實驗室, 北京 100190; 3 中國國際工程咨詢公司, 北京 100048)(2017年12月26日收稿; 2018年3月2日收修改稿)
SAR(synthetic aperture radar)圖像的絕對輻射精度對SAR定量化應用具有至關(guān)重要的影響,現(xiàn)有的SAR絕對輻射定標方法主要利用點目標通過“端到端”的方法實現(xiàn),即在定標場布置多個已知雷達截面積(radar cross section, RCS)的標準反射器,然后對比圖像功率和反射器的真實RCS得到定標常數(shù)。標準反射器自身RCS穩(wěn)定性可優(yōu)于0.1 dB,但考慮到角反射器制造工藝帶來的RCS偏差以及數(shù)據(jù)獲取與處理過程中大氣、噪聲等的影響,當前基于定標器的絕對定標精度約為0.4 dB[1]。此外,亞馬遜熱帶雨林等大面積均勻分布的自然目標具有穩(wěn)定的后向散射特性,其γ0的季節(jié)穩(wěn)定性為0.2 dB[2-3],因此可作為對點目標定標結(jié)果的補充。然而,點目標的大面積布置和長期維護需要耗費大量的人力物力,成本較高;且點目標和熱帶雨林均存在地理空間的限制,只能隔一段時間照射一次,難以實現(xiàn)在正常完成觀測任務(wù)的同時進行常態(tài)化輻射定標。
為了增加對系統(tǒng)傳遞特性的測量頻次,有學者致力于在自然地物中找到更多諸如熱帶雨林般可用于定標的大面積均勻地物,如沙漠、海洋等,但該類地物在用于定標時對入射角、地形起伏、風速等有一定的限制,只能在特定條件下實現(xiàn)短期穩(wěn)定[4-7]。同時,上述思路仍未解決空間局限性問題。
有學者提出永久散射體(permanent scatter, PS)和點目標結(jié)合的輻射定標方法[1,8-10],即首先用點目標(如角反射器、雷達轉(zhuǎn)發(fā)器等)對PS進行RCS標定。由于PS的RCS隨時間變化很小,因此可以在點目標定標后利用PS完成圖像之間的相對輻射標定。經(jīng)驗證,其與雷達轉(zhuǎn)發(fā)器的定標差異小于0.2 dB,但該方法要求相對標定的圖像地理位置相同且具有高度相似的成像幾何,并且圖像之間需要精確配準,PS點要一一對應,條件非??量?。
若能在普通的地物場景中,找到具有穩(wěn)定性的散射特征量,則可將其作為定標參考,實現(xiàn)對SAR系統(tǒng)的持續(xù)監(jiān)測。本文在對C波段SAR圖像進行地物分類并建立散射樣本庫的基礎(chǔ)上,分析發(fā)現(xiàn)城區(qū)的后向散射系數(shù)中值重心具有良好的時間穩(wěn)定性,進而提出一種基于神經(jīng)網(wǎng)絡(luò)的城區(qū)地物精篩與散射穩(wěn)定特性提取方法,為常態(tài)化的SAR輻射定標提供技術(shù)支撐。
本文開展SAR圖像散射穩(wěn)定特性分析和提取的總體流程如圖1所示。首先利用現(xiàn)有已精確定標的SAR圖像集進行場景分類并建立不同類別的地物樣本庫,為后續(xù)分析提供海量的數(shù)據(jù)支撐。然后確定一個合理的能夠描述散射穩(wěn)定特性且能夠作為定標參考的散射特征量。接著分析比較不同地物類型中該特征量的穩(wěn)定性,從而優(yōu)選地物類型。在此基礎(chǔ)上,訓練用于分類的神經(jīng)網(wǎng)絡(luò),對穩(wěn)定地物類型進行精細篩選,得到更加穩(wěn)定的散射特性。隨后對所提取的散射特征穩(wěn)定性進行驗證,并給出以此穩(wěn)定特征為參考的輻射定標方法。
圖1 C波段SAR地物散射穩(wěn)定性分析方法Fig.1 Analysis method for stability of target backscattering at C-band
本文中所考慮的散射穩(wěn)定性主要是指散射特性的時間穩(wěn)定性,即是否能夠在較長的時間內(nèi)保持后向散射系數(shù)的恒定,這是其能夠作為定標參考的重要衡量標準。為衡量某類地物樣本切片的時間穩(wěn)定性,引入“同名切片”的概念,定義為同一地理區(qū)域在不同時間所成圖像中對應的圖像樣本切片,如圖2所示。時間穩(wěn)定性通過同名切片的后向散射系數(shù)統(tǒng)計量的標準差來衡量。
圖2 同名切片示意圖Fig.2 Homologue slices
散射樣本庫的建立是穩(wěn)定特性分析的基礎(chǔ),本文利用哨兵1號數(shù)據(jù)開展樣本庫的構(gòu)建工作,下面對數(shù)據(jù)源和樣本庫構(gòu)建方法進行說明。
Sentinel-1(哨兵1號)是歐空局的地球觀測衛(wèi)星,由搭載C波段SAR的Sentinel-1 A、Sentinel-1B兩顆衛(wèi)星組成。二者相互配合,可在全球?qū)崿F(xiàn)重訪周期為6 d的連續(xù)觀測,提供大量多時相的觀測數(shù)據(jù)。相比其他在軌雷達衛(wèi)星,Sentinel-1具有較高的輻射精度,其輻射定標穩(wěn)定性為0.5 dB(3σ),絕對輻射精度為1 dB(3σ)[11-12],可滿足散射穩(wěn)定性挖掘?qū)AR圖像輻射精度的要求。
分析所用的圖像成像于美國休斯頓地區(qū),產(chǎn)品級別為L1級GRD(ground range detected),經(jīng)過聚焦、多視、地距轉(zhuǎn)換等處理并去除噪聲。時間跨度為2015年1月到2017年9月,共33幅圖像,時間間隔約30 d,詳細參數(shù)如表1所示。
表1 Sentinel-1圖像參數(shù)Table 1 Parameters of Sentinel-1 images
為了對大量SAR圖像進行快速便捷的地物分類,本文參考已在全球范圍內(nèi)實現(xiàn)地物分類的Modis產(chǎn)品。Modis是搭載在美國Terra和Aqua衛(wèi)星上的中分辨率成像光譜儀,其三級土地覆蓋類型產(chǎn)品MCD12Q1綜合Terra和Aqua一年的觀測結(jié)果,采用有監(jiān)督的決策樹分類方法,按照IGBP(國際地圈生物圈計劃)將地物分為17類,空間分辨率為500 m。產(chǎn)品使用正弦投影,在赤道處按照10°×10°的網(wǎng)格分幅。由于研究區(qū)域的分類信息可能分布在不同Modis分幅上,因此在使用前需要先對相關(guān)的若干個Modis圖像進行拼接。
基于已有的Modis產(chǎn)品,本文提出一種SAR圖像快速分類及切片自動提取方法,流程如圖3所示,主要包括以下3個部分:
1)Modis產(chǎn)品的預處理。用Modis的專用數(shù)據(jù)處理軟件MRT對全球范圍內(nèi)的MCD12Q1產(chǎn)品進行拼接以實現(xiàn)對任意地理位置的查詢,然后進行正弦投影到經(jīng)緯度的坐標轉(zhuǎn)換。
2)SAR圖像的預處理。用Sentinel的專用數(shù)據(jù)處理軟件SNAP對其進行輻射校正、幾何校正以及UTM到經(jīng)緯度的坐標變換,生成σ0圖像。
3)SAR圖像切片生成及分類標簽查詢。經(jīng)過預處理后,Modis圖像和SAR圖像均轉(zhuǎn)換到WGS84基準下的經(jīng)緯度坐標系中,可將二者進行地理位置匹配。具體過程為:獲取待分類SAR圖像中每個點的經(jīng)緯度信息,并在Modis產(chǎn)品中查找該地理位置處的分類標簽,然后在SAR圖像中以R×R大小為基本單位提取切片,該切片對應于MCD12Q1中的一個像素。R的計算公式為
(1)
式中:?」表示向下取整;RESMODIS為MCD12Q1的地距分辨率;RESSAR為SAR圖像的地距分辨率。
利用該方法,現(xiàn)已積累Sentinel-1各類地物切片總量達227萬,如圖4所示。經(jīng)目視檢驗,切片分類基本正確,但仍存在一些由于城市變遷等引起的分類誤差,然而在大量數(shù)據(jù)的統(tǒng)計意義下,這類誤差對于穩(wěn)定性分析的影響可以忽略。
在分析地物的散射穩(wěn)定性之前,首先要確定一個后向散射系數(shù)的描述特征,它應該滿足以下條件:1)與地物后向散射系數(shù)直接線性相關(guān),是對后向散射系數(shù)的定量描述,最簡單的就是后向散射系數(shù)的均值、中值等;2)在同類地物切片之間,該特征具有更好的穩(wěn)定性。為了從統(tǒng)計分布模型入手選取合適的描述特征,本文選用Fisher分布進行散射統(tǒng)計量穩(wěn)定性的理論分析,因為該模型對海面、農(nóng)田、森林、城市、山區(qū)等多種類型地表區(qū)域的圖像強度均具有建模適用性[13-14],其概率密度函數(shù)如下:
圖3 地物分類及切片提取的流程圖Fig.3 Flow chart of classification and slice extraction
圖4 散射樣本庫的切片數(shù)量Fig.4 Slice amount in the sample database
(2)
式中:L為視數(shù),I為圖像強度,M為形狀參數(shù),μ為平均強度,Γ(·) 為伽馬函數(shù)。
選取休斯頓地區(qū)3種典型的地物類型:城區(qū)、農(nóng)田、林地,每種地類選用40個圖像切片,分別用Fisher分布進行擬合,得到模型參數(shù)M和μ。對每一組擬合參數(shù),生成3 000次Fisher分布隨機數(shù),相當于對該分布進行多次隨機抽樣,而每組抽樣樣本模擬一個地物切片中的后向散射系數(shù)。計算每組樣本的均值和中值,并求出相同模型參數(shù)下,均值和中值在多次隨機抽樣中的平均值和標準差,如圖5所示。圖中橫軸代表Fisher分布40組不同的模型參數(shù),縱軸是3 000次抽樣中統(tǒng)計量的平均值,誤差棒表示統(tǒng)計量的標準差。對于城區(qū)這類非均勻區(qū)域,中值的穩(wěn)定性明顯優(yōu)于均值,而對于農(nóng)田、林地等自然地物,中值和均值的穩(wěn)定性接近。為適應多類地物的散射特性,本文選用統(tǒng)計中值作為切片后向散射系數(shù)的定量描述值。
圖5 Fisher分布統(tǒng)計量的穩(wěn)定性Fig.5 Stability of statistics using Fisher model
選用休斯頓地區(qū)33幅多時相圖像,按照2.2節(jié)的方法將SAR圖像打散為17類地物切片,并獲取同名切片,Modis分類結(jié)果如圖6所示。對每一組同名切片,求出后向散射系數(shù)的中值標準差stdmedian。為評價每一類地物隨時間變化的穩(wěn)定性,按照類別對中值標準差統(tǒng)計最小值、25分位數(shù)、中值、均值、75分位數(shù)、最大值,以箱線圖的形式畫于圖7中。其中,同名切片中值標準差的統(tǒng)計量沿縱軸位置的高低代表該類地物同名切片標準差的整體大小,而沿縱軸分布的稠密程度反映該類地物切片標準差的分布集中程度。第1,3,4,7,9,15類的切片數(shù)量較少,統(tǒng)計意義下的結(jié)論不具有代表性,因此不參與比較。在剩余的11種地物中,第13類城市與建筑區(qū)(以下簡稱“城區(qū)”)箱線圖的箱體最扁,位置最低,說明所有城區(qū)同名切片的中值標準差集中在一個較小的值處,平均為0.42 dB。一些植被覆蓋類型如第14類農(nóng)用地/自然植被拼接、第12類農(nóng)用地、第10類草地等由于具有一定的生長周期,不同生長階段的形態(tài)、含水量不同,導致其后向散射特性隨季節(jié)有著較大變化;而城區(qū)中的建筑、道路、橋梁等人工目標的結(jié)構(gòu)、形態(tài)不像自然地物那樣易受季節(jié)的影響,所以后向散射特性隨時間具有一定的穩(wěn)定性。
圖6 同名切片的Modis分類結(jié)果Fig.6 Classification results of homologue slices based on Modis
圖7 各類地物的時間穩(wěn)定性Fig.7 Temporal stability of all categories
城區(qū)同名切片具有很好的時間穩(wěn)定性,但是基于同名切片進行穩(wěn)定特征提取的方案仍對圖像地理位置的匹配精度具有較高要求,存在和PS定標方法相同的局限。因此本文同名切片僅在分析過程中用來衡量地物的時間穩(wěn)定性,而最終用于定標的參考值是用所有城區(qū)切片計算得到的中值平均值(稱為“中值重心”)。由此用該方法定標時并不需要提取同名切片,從而降低了對地理位置匹配精度的要求。
盡管城區(qū)是所有17類地物中隨時間變化最穩(wěn)定的類別,但是由圖7可知,城區(qū)同名切片的中值標準差在0.1~2.5 dB之間均有分布,即同為城區(qū)類別,不同切片之間仍存在隨時間變化穩(wěn)定/不穩(wěn)定的差異。畫出所有城區(qū)同名切片的中值標準差分布(圖8)并對照實物(圖9)發(fā)現(xiàn),穩(wěn)定城區(qū)切片在SAR圖像中的整體亮度均勻,有少量強散射點,對應的實物主要為一些排布整齊的低矮居民區(qū),房屋的高度和形狀相似;不穩(wěn)定城區(qū)切片在SAR圖像中整體呈亮色,散射強度較大,對應的實物多為高樓林立的市中心,房屋高度形狀參差不齊。
圖8 城區(qū)切片的標準差分布圖Fig.8 Standard deviation distribution of urban slices
圖9 實物(來源于Google Earth)Fig.9 Actual objects (from Google Earth)
由于二者存在較為明顯的圖像特征差異,本文采用一個二分類模型對城區(qū)切片進行精細篩選,從而選出相對更穩(wěn)定的切片。其中,訓練集中的正負類樣本是按照城區(qū)同名切片的中值標準差stdmedian以某個閾值進行劃分的。在確保正負類樣本的圖像特征具有區(qū)分度的前提下,為使得篩選后切片的中值重心具有盡可能好的穩(wěn)定性,閾值應越小越好,但考慮到正類樣本須具備一定的數(shù)量規(guī)模以保證統(tǒng)計意義,從圖10中的切片數(shù)量分布來看,0.3 dB是一個合適的閾值。即正類樣本:stdmedian≤0.3 dB,負類樣本:stdmedian>0.3 dB。
圖10 不同閾值處正類樣本的數(shù)量分布Fig.10 Quantity distribution of positive samples at different thresholds
對于模型的分類效果,本文主要考慮查全率recall和查準率precision兩個指標,計算公式如下:
(3)
其中,TP、FN、FP分別是模型將正類預測為正類、將正類預測為負類、將負類預測為正類的樣本數(shù)。因此較高的查全率表示模型能夠?qū)⒋蟛糠址€(wěn)定切片篩選出來,保證最終參與計算中值重心的切片數(shù)量可以達到統(tǒng)計意義的要求;較高的查準率表示模型選出的正類樣本大部分為穩(wěn)定的城區(qū)切片,從而保證中值重心的穩(wěn)定性能得到一定程度的提升。
在模型選取方面,嘗試支持向量機(SVM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、全連接神經(jīng)網(wǎng)絡(luò)(FNN)等常用分類模型,三者在測試集上的平均查全率和平均查準率如表2所示,分類效果最好的是全連接神經(jīng)網(wǎng)絡(luò)。為使得相差一個定標常數(shù)的已定標圖像和未定標圖像在輸入分類模型時是等效的,圖像經(jīng)過取dB并去除均值的預處理,然后將所有圖像像素作為特征輸入網(wǎng)絡(luò)。FNN網(wǎng)絡(luò)模型如圖11所示,采用Dropout、修正線性單元(Relu)激活函數(shù)等技巧以避免過擬合并提高模型訓練速度[15-16]。
表2 不同模型的分類效果(在測試集上取平均值)
圖11 全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.11 Structure of full-connected neural network
從圖12(a)可以看出,F(xiàn)NN模型在18幅測試場景中對穩(wěn)定城區(qū)切片達到95%以上的查全率和80%以上的查準率,分類效果較好,同時也說明兩類樣本是可分的。從圖12(b)同名切片的中值標準差的分布來看,模型選出的正類樣本的標準差大多集中在0.3 dB以內(nèi),只有少量樣本大于0.3 dB,且不超過0.3 dB的樣本幾乎全部被分類為正,因此模型對于城區(qū)穩(wěn)定城區(qū)切片有很好的篩選能力。圖13表明,經(jīng)神經(jīng)網(wǎng)絡(luò)精選后城區(qū)切片的穩(wěn)定性得到了有效提升,中值重心隨時間變化的標準差由0.31 dB降為0.21 dB。
圖12 全連接神經(jīng)網(wǎng)絡(luò)的分類效果Fig.12 Classification results using the full-connected neural network
圖13 城區(qū)切片篩選前后的中值重心穩(wěn)定性Fig.13 Stability of median center calculated for urban slices before and after filtering
為驗證城區(qū)中值重心用于系統(tǒng)長期標定的可行性,將其散射穩(wěn)定性與熱帶雨林的分析結(jié)果進行比較,并給出基于城區(qū)中值重心的定標常數(shù)估計方案。
熱帶雨林一直以來被認為是均勻穩(wěn)定的自然地物,因此用Sentinel-1熱帶雨林的散射穩(wěn)定性作為參考來衡量城區(qū)中值重心的穩(wěn)定性。所用熱帶雨林數(shù)據(jù)采集于72.61°W~64.15°W,3.46°S~11.74°S的地理區(qū)域,包含條帶模式S1~S6波位、HH和VV兩種極化模式共64幅圖像,時間跨度為2014年10月至2016年8月。
將所有熱帶雨林圖像的后向散射系數(shù)γ0均值隨時間的變化畫于圖14(a)中,可以看出大部分γ0均值集中在-6.5~-5 dB之間,標準差為0.46 dB。由于衛(wèi)星升、降軌情況下分別會在晚上、早上經(jīng)過亞馬遜熱帶雨林,兩個時間段植被含水量的不同會對雨林后向散射系數(shù)產(chǎn)生較大影響,因此區(qū)分升降軌來分析雨林的γ0均值,分別如圖14(b)、14(c)所示。
升、降軌數(shù)據(jù)的γ0均值隨時間變化的標準差分別為0.37和0.49 dB,升軌情況下具有更好的時間穩(wěn)定性。由上述分析可知,城區(qū)切片的σ0中值重心穩(wěn)定性優(yōu)于熱帶雨林γ0均值穩(wěn)定性,且和Sentinel-1自身的輻射定標精度0.33 dB(1σ)接近,因此城區(qū)中值重心可以作為一個穩(wěn)定的定標參考值。
基于精選后城區(qū)中值重心的穩(wěn)定性,可以提出一種絕對定標常數(shù)估計方案,流程如圖15所示。對于一組同區(qū)域同波位的多時相SAR圖像集,首先根據(jù)Modis產(chǎn)品對SAR圖像進行地物分類,并提取第13類城區(qū)切片;然后用神經(jīng)網(wǎng)絡(luò)模型對所有城區(qū)切片進行二分類,對分類結(jié)果為正的穩(wěn)定城區(qū)切片計算中值重心;最后根據(jù)已定標圖像和待定標圖像的中值重心之差計算絕對定標常數(shù)。
圖14 Sentinel-1熱帶雨林的時間穩(wěn)定性Fig.14 Temporal stability of Sentinel-1 rainforest data
圖15 定標流程圖Fig.15 Flow chart of calibration
用哨兵1號休斯頓地區(qū)另外18幅未參與模型訓練的圖像對上述定標方案進行測試,以圖像強度作為輸入,將系統(tǒng)提供的定標常數(shù)-47.36 dB作為真值,得到定標常數(shù)的估計結(jié)果如圖16所示。估計誤差在0.05~0.33 dB,均方根(RMS)為0.21 dB,精度較好。因此基于同區(qū)域同波位多時相圖像集對該波位定標常數(shù)進行長期監(jiān)測和校正的方案是可行的,且和永久散射體的相對輻射定標精度相當。與后者基于同名PS點的思路相比,該方案利用同類地物的散射穩(wěn)定性進行定標,不要求圖像之間的精確配準,且更有利于后續(xù)將定標方案在不同區(qū)域以及不同波位進行推廣。
本文針對C波段SAR圖像,提出一種散射穩(wěn)定特性的分析與提取方法?;谏诒?號休斯頓S3波位的多時相圖像集,在利用Modis產(chǎn)品構(gòu)建不同類別地物散射樣本庫的基礎(chǔ)上,分析發(fā)現(xiàn)城區(qū)的散射穩(wěn)定性優(yōu)于其他地物類別。通過神經(jīng)網(wǎng)絡(luò)對城區(qū)切片的進一步精細篩選,最終得到城區(qū)切片后向散射系數(shù)中值重心的時間穩(wěn)定性為0.21 dB,與系統(tǒng)自身的絕對輻射精度相當。經(jīng)驗證,城區(qū)中值重心的時間穩(wěn)定性優(yōu)于熱帶雨林,且該特征用于定標常數(shù)估計時的均方根誤差為0.21 dB,可以作為系統(tǒng)長期標定的參考值。
圖16 定標常數(shù)的估計誤差Fig.16 Estimation error of calibration constant