李 瀾,田 華,季鐵梅,鞏彩蘭,胡 勇,王歆暉,何志杰
1. 中國科學(xué)院上海技術(shù)物理研究所,上海 200083 2. 中國科學(xué)院紅外探測與成像技術(shù)重點實驗室,上海 200083 3. 中國科學(xué)院大學(xué),北京 100049 4. 上海市水文總站,上海 200232
城市河道是城市生態(tài)環(huán)境的重要組成部分,改革開放以來我國城市經(jīng)濟快速發(fā)展,但也造成河道出現(xiàn)不同程度的污染[1-2]。城市河道水污染治理的前提和關(guān)鍵是水質(zhì)狀況的實時監(jiān)測; 目前水質(zhì)監(jiān)測方法以傳統(tǒng)采樣監(jiān)測為主遙感監(jiān)測為輔,傳統(tǒng)的水質(zhì)監(jiān)測通過實驗室化驗確定水質(zhì)指標(biāo)濃度再根據(jù)相關(guān)標(biāo)準(zhǔn)確定水質(zhì)級別; 遙感監(jiān)測方法是通過衛(wèi)星、飛機、無人機等平臺搭載的傳感器獲取河道區(qū)域的遙感影像,再經(jīng)過一系列處理分析建立水質(zhì)參數(shù)與光譜反射率之間的定量關(guān)系,進而確定河道的水質(zhì)級別。傳統(tǒng)采樣監(jiān)測技術(shù)已較為成熟,但存在費時、費力、只能獲得斷面點位水質(zhì)等不足。隨著遙感和高光譜技術(shù)的發(fā)展,可以準(zhǔn)確、快速地獲取各種地物的各波段的光譜信息,國內(nèi)外學(xué)者提出了眾多基于遙感反演水質(zhì)參數(shù)進而判斷水質(zhì)類型的研究方法[3-6]。王麗艷等使用MODIS數(shù)據(jù)反演了呼倫湖水體COD濃度并確定水質(zhì)級別[7]。Wang等提出了一種綜合水質(zhì)評價方法,并利用該方法反演了多個水質(zhì)參數(shù)濃度[8]。但河道水質(zhì)類別的劃分指標(biāo)如溶解氧(DO)、總磷(TP)、氨氮(NH3-N)等不具有明顯的光學(xué)特性,通過遙感反演各水質(zhì)指標(biāo)進而判斷水質(zhì)類型這類方法的局限性在于最終級別的識別精度受各個水質(zhì)指標(biāo)反演精度共同決定,單一指標(biāo)反演精度不高必然整體識別精度低下,模型應(yīng)用局限性大、泛化能力不強,適用性不足。
水體反射率是諸多水質(zhì)參數(shù)綜合作用下的結(jié)果,水體的光譜特征與水質(zhì)類型之間存在某種映射關(guān)系。提出一種基于光譜二階微分波動指數(shù)的光譜分析方法,能有效反映各波段光譜二階微分的波動情況,在此基礎(chǔ)上可實現(xiàn)城市河道水質(zhì)類型的快速識別,可推廣應(yīng)用于利用其他遙感平臺獲得的高光譜數(shù)據(jù)監(jiān)測內(nèi)陸水體的水質(zhì)類型。
基于光譜二階微分波動特性的水質(zhì)光譜特征提取及分類方法,其基本思想在于利用上下包絡(luò)線來提取光譜二階微分曲線的振動范圍,具體的數(shù)據(jù)處理流程如圖1。
圖1 基于光譜二階微分波動指數(shù)計算流程圖Fig.1 Flow chart of second-order differentialfluctuation index calculation
(1)光譜二階微分計算。光譜二階微分計算包括差分計算和平滑兩部分,首先利用光譜差分計算原始光譜的二階微分,隨后使用Savitzky-Golay Smoothing法[9]對原始二階光譜進行平滑處理,消除噪點和其他干擾。
(2)局部極大值極小值提取。曲線的波峰和波谷通常對應(yīng)局部極大值和極小值,而波峰波谷的值可以反映曲線局部的變化范圍,使用3×3的滑動窗口逐點提取局部極值,滿足式(1)或(2)的即為局部極大值或極小值點。
(1)
(2)
(3)無關(guān)極值點去除。曲線上的波峰波谷對應(yīng)著局部極值點,通常光譜二階微分曲線某一波段附近只會對應(yīng)一個峰值,由于儀器探測性能限制或其他原因的影響,峰值周圍會出現(xiàn)一系列無關(guān)極值點,這會對后續(xù)處理產(chǎn)生干擾,為此可設(shè)定一個距離閾值m,采用循環(huán)迭代方式去除無關(guān)極值點,下面以極大值為例介紹具體實現(xiàn)步驟。①尋找當(dāng)前所有極大值中最大值以及對應(yīng)的波長位置; ②去除最大值周圍距離小于閾值m的所有極大值點; ③彈出并保存最大值和波長位置。重復(fù)①②③,直到所有的無關(guān)極大值點均消除。無關(guān)極小值的去除與上述步驟類似,只需每次彈出最小值和位置即可。
(4)雙包絡(luò)線生成。在上一步處理后可得到光譜二階微分曲線上的各波峰點和波谷點,使用三次樣條插值法得到光譜二階微分曲線的上下兩條包絡(luò)線。圖2是某光譜二階微分及雙包絡(luò)線示意圖。
圖2 光譜二階微分曲線與雙包絡(luò)線Fig.2 Second-order differential curve and double envelope
(5)光譜二階微分波動指數(shù)計算。上下包絡(luò)線能表示光譜二階微分的振動范圍,而某一波段處的對應(yīng)上下包絡(luò)線函數(shù)值之間的差值能表示該波段附近光譜二階微分變化的劇烈程度。因此可定義一種光譜二階微分波動特性指數(shù)來描述這一特征,具體計算公式如式(3)
F(λ)=eA(f(λ)-g(λ))
(3)
式(3)中,F(xiàn)(λ)表示波長為λ處附近的變化特征,f(λ)和g(λ)分別對應(yīng)該波段上下包絡(luò)線的函數(shù)值,A是固定的放大系數(shù)用于增加區(qū)分度。
先后多次在上海市嘉定區(qū)采集了各水質(zhì)類型水體的光譜數(shù)據(jù),光譜數(shù)據(jù)獲取采用ASD公司生產(chǎn)的FieldSpec3便攜式地物光譜儀,波長范圍選擇為400~900 nm。測量和處理參照國家標(biāo)準(zhǔn)《水體可見光-短波紅外光譜反射率測量GB/T 36540—2018》進行。圖3是獲取的水體反射光譜曲線圖。
圖3 反射光譜曲線圖Fig.3 Reflectance spectral curves
采集光譜數(shù)據(jù)的同時,還需要獲取相應(yīng)的水質(zhì)數(shù)據(jù)。將現(xiàn)場采樣的水體樣本密封保存帶回實驗室化驗獲得各水質(zhì)指標(biāo),再根據(jù)《地表水環(huán)境質(zhì)量評價辦法(試行)》等標(biāo)準(zhǔn)劃分類別,共得到Ⅰ和Ⅱ類樣本11個(由于Ⅰ類樣本稀少,將其與Ⅱ類樣本合并)、Ⅲ類14個、Ⅳ類20個、Ⅴ類23,劣Ⅴ類20個。
采用上述的數(shù)據(jù)處理方法計算各類水體的光譜二階微分波動系數(shù),合適的距離閾值和放大系數(shù)可以有效去除虛假極值點,增加不同類別之間的區(qū)分度,經(jīng)多次試驗最小距離閾值m設(shè)置為10,放大系數(shù)A設(shè)為500效果較好,圖4是計算的各類水體的平均光譜二階微分波動指數(shù)曲線圖。
圖4 各類型水體的平均波動指數(shù)Fig.4 Average fluctuation index of each type of water body
從圖4可以看出,各類水體波動指數(shù)在720~740,750~770以及820~840 nm處均有明顯的峰值,且不同水質(zhì)類型水體峰值高度不同,隨后統(tǒng)計了各類樣本中這三個波段內(nèi)的平均波動指數(shù)的均值、標(biāo)準(zhǔn)差等特征,結(jié)果見表1—表3。
上述統(tǒng)計結(jié)果表明,水體在720~740,750~770和820~840 nm內(nèi)的光譜二階微分平均波動系數(shù)與水質(zhì)級別具有正向相關(guān)關(guān)系,隨著水質(zhì)級別的上升,這三個波段內(nèi)的平均波動指數(shù)的平均值和中位數(shù)也隨之上升,且水質(zhì)級別越高上升幅度越大,變化越劇烈,同樣平均波動指數(shù)的標(biāo)準(zhǔn)差也在增加。因此可利用這一特性實現(xiàn)河道水質(zhì)類型的自動識別分類。
表1 各類型水體720~740 nm平均波動指數(shù)統(tǒng)計Table 1 Average fluctuation index from 720~740 nm
表2 各類型水體750~770 nm平均波動指數(shù)統(tǒng)計Table 2 Average fluctuation index from 750~770 nm
表3 各類型水體820~840 nm平均波動指數(shù)統(tǒng)計Table 3 Average fluctuation index from 820~840 nm
首先將各類樣本按照2∶1的比例隨機劃分為測試集和訓(xùn)練集,隨后采用本方法計算訓(xùn)練集內(nèi)各樣本的二階微分波動指數(shù)曲線,得到三個特征波段內(nèi)的平均波動指數(shù),最后以這三個特征波段的平均波動指數(shù)為輸入,使用LSSVM[10]構(gòu)建水質(zhì)類型識別模型,訓(xùn)練完成后進行測試,取重復(fù)10次實驗的平均值作為最終結(jié)果,具體結(jié)果見圖5(a)。
圖5(a)顯示平均識別準(zhǔn)確度達80.65%,而通過對誤分類的樣本進行分析后發(fā)現(xiàn),誤分類樣本多集中在兩類樣本特征邊界處,故單獨測試了分類誤差不超過1類的識別準(zhǔn)確度,重復(fù)測試10次,如圖5(b)所示。結(jié)果表明誤差不超過1類的平均識別準(zhǔn)確度達96.77%,在31個測試樣本中,僅1個樣本分類誤差超過1類,因此光譜二階微分波動系數(shù)結(jié)合機器學(xué)習(xí)模型可實現(xiàn)城市河道水質(zhì)的快速識別,且識別誤差不超過1類。
針對目前城市水體大面積水質(zhì)類型調(diào)查的需求,提出了基于光譜二階微分波動指數(shù)的高光譜數(shù)據(jù)處理和分析方法,在對各類型水體的波動指數(shù)分析后得到如下結(jié)論: (1)720~740,750~770和820~840 nm波段內(nèi)的平均波動指數(shù)與水質(zhì)級別具有正相關(guān)關(guān)系,隨著水質(zhì)級別的上升,平均波動指數(shù)值升高,對應(yīng)波段附近的光譜二階微分振幅越大,這表明水質(zhì)狀況越差的水體,其光譜二階微分波動越大。(2)以三個特征波段的平均波動指數(shù)作為輸入特征,采用LSSVM模型構(gòu)建水質(zhì)類型識別模型,經(jīng)測試,模型的平均識別準(zhǔn)確度達80.65%,誤差不超過一類的識別準(zhǔn)確度達96.77%,能較準(zhǔn)確地識別城市河道水質(zhì)類型。