吳艷平
(安徽亳州新能源學(xué)校 安徽 亳州 236700)
云是地球水循環(huán)的中間環(huán)節(jié),是水汽在高空遇冷液化凝集而形成的一種可見(jiàn)聚合物,對(duì)地球水循環(huán)、地表輻射平衡的調(diào)節(jié)均有著重要意義。 通過(guò)遙感偏振技術(shù)對(duì)云進(jìn)行檢測(cè),是去除陸地氣溶膠物理特性的關(guān)鍵步驟,隨著研究的不斷深入,計(jì)算機(jī)算法應(yīng)用于云的檢測(cè)已較為普遍,通過(guò)計(jì)算機(jī)算法和大氣遙感技術(shù)、人工智能技術(shù)的結(jié)合,能夠?qū)崿F(xiàn)智能化、自動(dòng)化的大氣監(jiān)測(cè)。 基于機(jī)器學(xué)習(xí)的云檢測(cè)算法逐漸成為研究的熱點(diǎn)[1]。 但現(xiàn)有偏振遙感云檢測(cè)中算法及數(shù)據(jù)在識(shí)別高反射率地表環(huán)境以及高反射云像時(shí)存在偏差,容易出現(xiàn)判定模糊等問(wèn)題。 本文在現(xiàn)有偏振遙感云檢測(cè)算法基礎(chǔ)上,基于機(jī)器學(xué)習(xí)構(gòu)建一種更具泛用性、實(shí)用性和可靠性的偏振遙感云檢測(cè)算法模型,以期為偏振遙感云檢測(cè)工作的優(yōu)化提供啟發(fā)與參考。
在云和氣溶膠檢測(cè)與分析中,偏振信息更具特異性和靈敏性,檢測(cè)偏振信息更能夠體現(xiàn)云和氣溶膠的特性,我國(guó)廣泛應(yīng)用偏振遙感技術(shù)實(shí)施云檢測(cè)。 目前,偏振遙感技術(shù)的常用偏振算法主要有兩種,分別是多角度偏振(polarization and directionality of the Earth’s reflectances,POLDER3)衛(wèi)星載荷和多角度偏振成像儀(directional polarimetric camera,DPC)衛(wèi)星載荷[2]。 基于490 nm、670 nm、865 nm 三個(gè)偏振頻段的托克斯矢量I、Q、U檢測(cè)來(lái)識(shí)別和鑒定陸地氣溶膠特性,算法規(guī)則為式(1)、式(2)所示:
式(1)、式(2)中,R代表反射率,RP代表偏振反射率,而I、Q、U則是對(duì)應(yīng)的托克斯矢量數(shù)據(jù),θS代表天頂角(太陽(yáng)),將遙感數(shù)據(jù)代入對(duì)應(yīng)算法,可得到與云有關(guān)氣溶膠的特質(zhì)信息,同時(shí)這兩個(gè)基本算法均支持可逆計(jì)算。
誤差逆向傳播算法(back propagation,BP)訓(xùn)練的多層前饋網(wǎng)絡(luò)是一種常見(jiàn)的人工神經(jīng)網(wǎng)絡(luò)模型,用于解決分類(lèi)、回歸和模式識(shí)別等問(wèn)題。 它由輸入層、隱藏層和輸出層組成,每個(gè)層都由一系列神經(jīng)元(或稱為節(jié)點(diǎn))組成。每個(gè)神經(jīng)元都與前一層的所有神經(jīng)元相連,并且每條連接都有一個(gè)表示連接強(qiáng)度的權(quán)重系數(shù)。
粒子群算法(particle swarm optimization,PSO)是一種元啟發(fā)式優(yōu)化算法,靈感來(lái)源于鳥(niǎo)群或魚(yú)群等群體在搜索食物或棲息地時(shí)的行為。 它通過(guò)模擬粒子在解空間中的移動(dòng)和信息共享來(lái)尋找最優(yōu)解。 算法基本思想是將解空間看作是粒子的運(yùn)動(dòng)空間,每個(gè)粒子代表一個(gè)潛在解。 粒子在解空間中通過(guò)速度和位置進(jìn)行搜索,通過(guò)與其他粒子的交互,不斷調(diào)整自己的位置和速度,以找到更優(yōu)的解。
雖然BP 神經(jīng)網(wǎng)絡(luò)和PSO 算法的核心規(guī)則不同,但兩者的連接權(quán)值與粒子群維度一致,能夠使用統(tǒng)一的計(jì)算公式計(jì)算權(quán)值。 如式(3)所示。
式(3)中,m、l、q分別代表輸入層、輸出層、隱藏層的節(jié)點(diǎn)數(shù)量;d為連接權(quán)值。 在迭代過(guò)程中,適應(yīng)函數(shù)需要與BP網(wǎng)絡(luò)中的均方差保持一致,它不僅可以用于計(jì)算適應(yīng)度值,還可作為評(píng)價(jià)函數(shù)[3]。 適應(yīng)度函數(shù)E為式(4)所示:
式(4)中,N表示樣本總數(shù),和分別表示樣本數(shù)據(jù)在第k個(gè)輸出節(jié)點(diǎn)的網(wǎng)絡(luò)輸出值和網(wǎng)絡(luò)期望輸出值。
在POLDER3 衛(wèi)星載荷和DPC 衛(wèi)星載荷兩種算法基礎(chǔ)上進(jìn)行算法構(gòu)建,利用衛(wèi)星觀測(cè)數(shù)據(jù)進(jìn)行測(cè)算,具體構(gòu)建思路如下:
(1)首先對(duì)衛(wèi)星觀測(cè)數(shù)據(jù)進(jìn)行提取和處理,其次遵循偏振遙感的基本原理[式(1)和式(2)]進(jìn)行數(shù)據(jù)截取,最后共提取出4 個(gè)矢量方向上14 組有效數(shù)據(jù),再根據(jù)算法公式分別計(jì)算出90 nm、670 nm 和865 nm 通道的偏振反射率。
(2)首先以像元的經(jīng)緯度為依據(jù)對(duì)衛(wèi)星信息數(shù)據(jù)進(jìn)行分類(lèi)和匹配,識(shí)別和鑒別不同地表環(huán)境下的偏振遙感數(shù)據(jù)參數(shù);其次建立典型數(shù)據(jù)模型,并基于其建立機(jī)器學(xué)習(xí)模型,初步完成識(shí)別和鑒別不同條件下氣象云或氣溶膠現(xiàn)象。
(3)首先對(duì)訓(xùn)練好的偏振遙感云檢測(cè)模型進(jìn)行測(cè)試,其次通過(guò)將衛(wèi)星觀測(cè)數(shù)據(jù)輸入機(jī)器學(xué)習(xí)模型;最后通過(guò)比對(duì)實(shí)際數(shù)據(jù)和機(jī)器學(xué)習(xí)模型運(yùn)算數(shù)據(jù)來(lái)檢驗(yàn)算法的準(zhǔn)確性,再根據(jù)結(jié)果進(jìn)行調(diào)整與優(yōu)化,直至調(diào)試至最佳狀態(tài)。
為提高算法構(gòu)建效率,確保算法模型有效性,有必要就POLDER3 載荷和星載激光雷達(dá)(cloud?aerosol lidar with orthogonal polarization,CALIOP)載荷在云檢測(cè)中的特性進(jìn)行分析。 依據(jù)偏振遙感的算法規(guī)則,從以下幾方面對(duì)算法特性進(jìn)行描述[4]:
(1)反射率
不同波段代表了不同的地表?xiàng)l件,如443 nm 波段的反射率能夠有效區(qū)別晴空和云的像元,兩個(gè)不同的像元在這一波段有著最大的對(duì)比度,因此想要識(shí)別與鑒別兩個(gè)像元,可選用該波段;而在670 nm 的波段中,云的反射率最高、地表的反射率最低,因此想要降低復(fù)雜地表對(duì)云檢測(cè)結(jié)果的影響,可在該波段下進(jìn)行遙感信息分析,也可將參數(shù)設(shè)定在670 nm 來(lái)尋找對(duì)比度較低圖像中的亮云。
(2)偏振反射率
通過(guò)調(diào)整偏振反射率能夠識(shí)別和鑒別圖像中的不同構(gòu)成,490 nm 的波段偏振反射核心對(duì)象是大氣分子,670 nm 的波段偏振反射核心對(duì)象是云和晴空,而在865 nm 波段的偏振反射核心則是云,因此選擇不同的偏振反射率可以使圖像顯示不同的要素,可根據(jù)實(shí)際數(shù)據(jù)分析需要來(lái)設(shè)置合適的偏振反射率參數(shù)。
(3)多角度觀測(cè)
POLDER3 載荷搭載于衛(wèi)星時(shí),支持從多個(gè)角度對(duì)同一目標(biāo)進(jìn)行觀測(cè),通過(guò)多角度觀測(cè)能夠獲得更具代表性和典型性的圖像數(shù)據(jù),因此POLDER3 載荷在識(shí)別云與地表信息上有著極高的靈敏度和特異度。
(4)波段組合
通過(guò)不同的波段組合能夠定向獲取遙感信息,比如云在670 nm 和865 nm 的波段有著較高的反射率,在近紅外波段的670 nm 和可見(jiàn)光波段的865 nm 處,云的反射率非常接近,而無(wú)云的晴空在這兩個(gè)波段的反射率則相對(duì)較低,因此可以通過(guò)波段組合的方式來(lái)更高效地識(shí)別云和晴空。
根據(jù)特征變量的性質(zhì)和數(shù)據(jù)規(guī)模,選擇適合的機(jī)器學(xué)習(xí)算法模型,如支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等。 使用訓(xùn)練集對(duì)選定的模型進(jìn)行訓(xùn)練和調(diào)優(yōu),以得到較好的云檢測(cè)模型。 使用獨(dú)立的測(cè)試數(shù)據(jù)集對(duì)訓(xùn)練好的模型進(jìn)行測(cè)試和驗(yàn)證,評(píng)估云檢測(cè)算法的準(zhǔn)確性和效果,并進(jìn)行調(diào)整和優(yōu)化[5]。 將訓(xùn)練好的模型應(yīng)用到實(shí)際,并根據(jù)實(shí)際情況進(jìn)行優(yōu)化調(diào)整,以進(jìn)一步提高準(zhǔn)確性和效率。
選擇偏振遙感數(shù)據(jù),通過(guò)將經(jīng)算法處理的數(shù)據(jù)與實(shí)際數(shù)據(jù)進(jìn)行比對(duì),以檢驗(yàn)算法的有效性。 本研究中所用數(shù)據(jù)集包共包含了22 270 個(gè)像元點(diǎn),在數(shù)據(jù)規(guī)模上可保證數(shù)據(jù)分析結(jié)果的普遍性。
在云檢測(cè)模型上綜合PSO 和BP 兩種檢測(cè)規(guī)則,建立一個(gè)具有5 層神經(jīng)網(wǎng)絡(luò)、以sigmoid 函數(shù)為激活函數(shù)的具有啟示性和自我優(yōu)化能力的云檢測(cè)模型,經(jīng)過(guò)46 次迭代時(shí)系統(tǒng)提示達(dá)到了最佳適應(yīng)度。 初始化BP 神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值,然后遵循混合算法的一般運(yùn)行邏輯進(jìn)行反復(fù)訓(xùn)練,直至訓(xùn)練精度達(dá)到偏振遙感云檢測(cè)的靈敏度需求[6]。
采用交叉驗(yàn)證法進(jìn)一步優(yōu)化網(wǎng)絡(luò)模型和超參數(shù),從預(yù)先準(zhǔn)備的數(shù)據(jù)集包中隨機(jī)選取15%的數(shù)據(jù)量進(jìn)行模型測(cè)試,通過(guò)反復(fù)演算來(lái)檢驗(yàn)最佳效果,檢驗(yàn)新構(gòu)建模型算法的有效性。 設(shè)定云檢測(cè)概率閾值為60%,隨機(jī)從數(shù)據(jù)集包中選取15%的數(shù)據(jù)再進(jìn)行測(cè)試,結(jié)果顯示測(cè)試的擬合率達(dá)到0.919,該結(jié)果說(shuō)明了構(gòu)建的PSO?BPNN 算法具有較高的魯棒性、靈敏度,在理論上是一種較為優(yōu)質(zhì)的偏振遙感云檢測(cè)模型。
基于機(jī)器學(xué)習(xí)的優(yōu)化算法可以有效地提高偏振遙感云檢測(cè)的準(zhǔn)確性和效率,并且可以根據(jù)實(shí)際情況進(jìn)行調(diào)整和優(yōu)化,以適應(yīng)不同的遙感數(shù)據(jù)和場(chǎng)景。 從而在遙感數(shù)據(jù)處理和應(yīng)用中有更好的應(yīng)用前景[7]。
選取POLDER3 -L1B 在2007 年8 月1 日的數(shù)據(jù),其中包含了常規(guī)地表環(huán)境以及高反射地表環(huán)境,將這些數(shù)據(jù)提交到構(gòu)建的PSO?BPNN 云檢測(cè)算法進(jìn)行重復(fù)檢測(cè),將檢測(cè)結(jié)果與已知數(shù)據(jù)進(jìn)行比對(duì),以此來(lái)檢驗(yàn)PSO?BPNN 云檢測(cè)算法的靈敏度和可靠性。
為了驗(yàn)證實(shí)驗(yàn)的有效性和科學(xué)性,進(jìn)行了多種算法的試驗(yàn)結(jié)果對(duì)比驗(yàn)證,主要有POLDER 官方算法、中分辨率成像光譜儀(moderate resolution imaging spectroradiometer,MODIS)官方算法、BP 神經(jīng)網(wǎng)絡(luò)法以及經(jīng)過(guò)PSO 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)法。 其中,POLDER 官方算法和MODIS 官方算法采用傳統(tǒng)的閾值法進(jìn)行云檢測(cè)。 POLDER 算法是根據(jù)單個(gè)像元的反射率、偏振反射率、表觀壓強(qiáng)和方向等多個(gè)閾值進(jìn)行云檢測(cè),而MODIS 官方算法則利用多通道反射率和亮溫的閾值法進(jìn)行云識(shí)別。
在本研究中,選擇相同的地區(qū)和時(shí)間范圍,對(duì)比POLDER3 官方云檢測(cè)產(chǎn)品和MODIS 衛(wèi)星的MOD06_L2云檢測(cè)產(chǎn)品進(jìn)行對(duì)比驗(yàn)證。 其中,MOD06_L2 數(shù)據(jù)的空間分辨率為1 km,高于POLDER3-L1B 的6 km,每個(gè)像元的尺寸約為POLDER3-L1B 的1/36。
為了便于觀察和鑒別,遵循目視法的基本理念,對(duì)不同區(qū)域進(jìn)行著色標(biāo)記,官方確認(rèn)的云像元、晴空分別標(biāo)記為藍(lán)色和黃色,而官方未確認(rèn)的像元?jiǎng)t標(biāo)記為綠色。 通過(guò)目視觀察發(fā)現(xiàn)在官方衛(wèi)星的遙感圖像中,未確定區(qū)域主要存在于云像元和晴空的交界處,主要原因是存在閾值模糊的問(wèn)題,這提示衛(wèi)星載荷算法無(wú)法有效識(shí)別偏振遙感閾值模糊的部分,導(dǎo)致這一結(jié)果的原因主要與云的反射率有關(guān),當(dāng)云層較厚時(shí),云的反射率明顯提高,而云的邊緣區(qū)域厚度較低,因此反射情況并不理想,最終導(dǎo)致邊緣模糊的問(wèn)題。 出現(xiàn)這一現(xiàn)象,說(shuō)明官方傳統(tǒng)閾值算法可以有效篩選出云像元,但如果云本身厚度不足或處于高反射性的地表上時(shí),傳統(tǒng)閾值算法的不確定性增加,最終可能導(dǎo)致云像元識(shí)別錯(cuò)誤的問(wèn)題。 本研究構(gòu)建的PSO?BPNN 云檢測(cè)法能夠避免這一問(wèn)題,提高反射性云和地表的識(shí)別能力,因此能夠識(shí)別出更多的云像元。
為了便于觀測(cè)與統(tǒng)計(jì),在測(cè)試時(shí)以MODIS 云檢測(cè)結(jié)果中每36 個(gè)像元為一個(gè)比對(duì)窗口,如果一個(gè)比對(duì)窗口內(nèi)云像元的數(shù)量占半數(shù)以上,則將該比對(duì)窗口標(biāo)記為云,如果一個(gè)比對(duì)窗口內(nèi)云像元數(shù)量占半數(shù)以下,則將該比對(duì)窗口標(biāo)記為晴空。 使用新構(gòu)建的算法對(duì)每一個(gè)比對(duì)窗口進(jìn)行重新識(shí)別與檢測(cè),通過(guò)對(duì)比檢測(cè)結(jié)果來(lái)評(píng)價(jià)PSO?BPNN云檢測(cè)算法的靈敏度和準(zhǔn)確度,結(jié)果顯示在對(duì)比對(duì)窗口像元的評(píng)價(jià)上,新算法與MODIS 云檢測(cè)保持著高度的一致性,符合率大于90%,而在具體的圖像上,PSO?BPNN 云檢測(cè)算法的結(jié)果對(duì)比度與分辨率更高,在云像邊緣和薄云識(shí)別上仍保持著較高的靈敏度與準(zhǔn)確度[8]。 因此,PSO?BPNN 云檢測(cè)算法比當(dāng)前廣泛應(yīng)用的偏振遙感云檢測(cè)算法更加高效,在像元識(shí)別上與常規(guī)算法保持高度一致,在高反射區(qū)域的識(shí)別上卻優(yōu)于常規(guī)算法。
傳統(tǒng)偏振遙感經(jīng)驗(yàn)閾值云檢測(cè)測(cè)算規(guī)則在高反射云層和地表同時(shí)出現(xiàn)時(shí)存在識(shí)別模糊的問(wèn)題,為了解決這一問(wèn)題,本文提出了一種同時(shí)結(jié)合主動(dòng)和被動(dòng)遙感衛(wèi)星載荷的機(jī)器學(xué)習(xí)云檢測(cè)算法,利用BP 網(wǎng)絡(luò)和PSO 算法的啟示性和可訓(xùn)練特點(diǎn),不斷提高算法在偏振遙感云檢測(cè)中的魯棒性,最終建立了一種適用于多種地表上空云的檢測(cè)模型。 測(cè)試結(jié)果表明,基于PSO?BPNN 的云檢測(cè)算法有更高的精度和靈敏度,與官方數(shù)據(jù)保持高度一致性。