江金昊 劉海磊 王乙竹 張升蘭
(成都信息工程大學(xué)電子工程學(xué)院,四川 成都 610225)
大氣中的水汽及其變化是天氣和氣候變化的主要驅(qū)動(dòng)力,是影響氣候變化和維持地球生態(tài)平衡的關(guān)鍵要素[1],其在降水和災(zāi)害性天氣預(yù)報(bào)、大氣輻射研究、水循環(huán)和全球氣候變化研究等方面具有重要應(yīng)用[2-3]。此外,大氣中的水汽含量也是影響遙感應(yīng)用的主要物理量之一,如地表參數(shù)精確反演、遙感數(shù)據(jù)大氣訂正等均需要精確的水汽信息[4-6]。
大氣可降水量(precipitable water vapor,PWV)是表征大氣水汽的一個(gè)重要參數(shù),指單位面積空氣柱里含有的水汽總量[7]。目前,有多種技術(shù)手段可以進(jìn)行PWV的探測(cè),根據(jù)探測(cè)手段可分為無線電探空、地基遙感和衛(wèi)星遙感[8-10]3類。雖然無線電探空、地基遙感探測(cè)精度較好,但這兩類探測(cè)方式僅能給出固定點(diǎn)上空的水汽分布情況,通常無法準(zhǔn)確、客觀地反映某一地區(qū)水平尺度上的水汽含量梯度變化[11-12]。
青藏高原占中國領(lǐng)土面積的四分之一,平均海拔高度4000 m以上,是世界上海拔最高、地形最復(fù)雜的高原[13]。青藏高原地氣作用過程,尤其是能量與水分循環(huán)過程對(duì)亞洲季風(fēng)、東亞大氣環(huán)流及全球氣候變化均有重要影響[14]。因此,高原的水汽分布、來源、輸送等一直都是非常關(guān)注的高原氣象科學(xué)問題[14-15]。
極軌氣象衛(wèi)星每天僅可以提供同一地區(qū)一至兩次的PWV觀測(cè),加之青藏高原云量偏多使極軌衛(wèi)星獲取的有效數(shù)據(jù)非常有限[16]。相比之下,靜止氣象衛(wèi)星具有觀測(cè)區(qū)域大、頻次高的優(yōu)勢(shì),是目前獲取青藏高原高時(shí)空分辨率水汽信息的有效手段[17]。因此開展基于靜止氣象衛(wèi)星的青藏高原高精度水汽探測(cè)研究具有重要實(shí)際應(yīng)用價(jià)值與現(xiàn)實(shí)意義。
目前,靜止氣象衛(wèi)星沒有近紅外和微波水汽探測(cè)通道,因此其PWV反演算法主要是基于熱紅外通道數(shù)據(jù)展開的。PWV紅外反演算法大致可分為線性分裂窗算法、分裂窗方差協(xié)方差比值算法和物理分裂窗算法[18-19],這些算法均是基于水汽在分裂窗區(qū)通道吸收差異原理開發(fā)的[9]。線性分裂窗算法和分裂窗方差協(xié)方差比值算法通常假定分裂窗區(qū)通道發(fā)射率相同,且鄰近像元需存在一定的溫度差異,這一定程度限制了算法的精度和適用性。物理分裂窗算法由于考慮了輻射傳輸過程,其精度優(yōu)于線性分裂窗算法[20]。
傳統(tǒng)的分裂窗算法實(shí)質(zhì)是利用水汽在分裂窗區(qū)通道吸收差異原理開展的。在干燥環(huán)境下(比如PWV<2.0 cm),水汽吸收差異引起的分裂窗區(qū)通道亮溫差較小(可小于1.0 K),這可與通道發(fā)射率不確定性引起的亮溫差、儀器噪聲和定標(biāo)誤差相當(dāng)。算法更容易受到發(fā)射率不確定性和觀測(cè)誤差的影響,因此低水汽環(huán)境下僅利用分裂窗通道估算PWV存在較大的不確定性[19]。青藏高原平均海拔高度超過4000 m,水汽含量相比同緯度地區(qū)明顯偏低,再加之高原地形復(fù)雜、發(fā)射率等輔助數(shù)據(jù)缺乏,使僅基于分裂窗區(qū)通道無法獲取青藏高原可靠的PWV信息[9]。
近年來國際上都在發(fā)展新一代靜止氣象衛(wèi)星,比如日本的Himawari-8/9、美國的GOES-R、中國的 FY-4A/4B和歐洲的MTG-I/S等陸續(xù)發(fā)射升空[21-22]。新一代衛(wèi)星搭載的成像輻射儀在時(shí)間、空間、光譜分辨率及觀測(cè)精度等方面顯著提升,可提供更加豐富的大氣溫度、濕度信息,這為青藏高原高海拔、低水汽環(huán)境下的高精度PWV反演提供了良好的機(jī)遇。
目前,AGRI/FY-4A和ABI/GOES-R已發(fā)布了總水汽含量和分層水汽產(chǎn)品。AGRI和ABI的水汽產(chǎn)品算法相似,都是基于一維變分(1DVAR)方法,利用衛(wèi)星的多通道觀測(cè)進(jìn)行物理迭代,實(shí)現(xiàn)大氣溫度和濕度廓線的反演[7,23]。之后,對(duì)反演的大氣廓線進(jìn)行積分獲得分層和總水汽含量。由于靜止氣象衛(wèi)星成像儀通道較少,這給大氣溫度和濕度廓線的反演帶來較大不確定性。此外,該方法對(duì)大氣廓線初始場(chǎng)的依賴性較強(qiáng)。已有的研究表明AGRI和ABI產(chǎn)品在低水汽情況下的誤差較大,其中AGRI水汽產(chǎn)品在青藏高原的相對(duì)誤差可達(dá)30%~80%[7]。
Himawari-8搭載的高級(jí)成像儀(advanced himawari imagers,AHI)除提供2個(gè)紅外分裂窗通道以外,還具備6.2 μm、7.0 μm和7.3 μm附近的水汽通道觀測(cè)能力[24-25]。這有助于中高層水汽探測(cè),也有利于提高低水汽環(huán)境下的PWV反演精度。目前,Himawari-8衛(wèi)星并未發(fā)布官方PWV產(chǎn)品,使用AHI數(shù)據(jù)開展青藏高原PWV反演的研究較少。本研究將利用AHI多通道紅外觀測(cè)和其他輔助數(shù)據(jù),基于神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建一種適用于青藏高原低水汽情況下的PWV反演算法。
1.1.1 Himawari-8數(shù)據(jù)
Himawari-8是日本氣象廳的新一代靜止氣象衛(wèi)星,于2014年10月7日發(fā)射,2015年7月7日正式業(yè)務(wù)化運(yùn)行,位于140.7°E的赤道上空,覆蓋范圍為60°N~60°S,80°E~160°W。其搭載的成像儀AHI共有16個(gè)光譜通道,包括3個(gè)可見光通道,3個(gè)近紅外通道和10個(gè)紅外通道[22]。每10 min可進(jìn)行一次全圓盤掃描,每2.5 min對(duì)日本周邊地區(qū)進(jìn)行一次區(qū)域掃描。目前,Himawari-8衛(wèi)星沒有發(fā)布PWV業(yè)務(wù)化產(chǎn)品。
AHI具有2 個(gè)紅外分裂窗通道和6.2 μm、7.0 μm和7.3 μm 3個(gè)水汽通道觀測(cè)能力。利用中光譜分辨率大氣輻射傳輸模式(MODTRAN5.2)開展這些通道的水汽敏感性分析,圖1給出了不同高度中緯度冬季標(biāo)準(zhǔn)大氣濕度廓線5%變化,所引起的通道亮溫變化情況。AHI的6.2 μm、7.0 μm和7.3 μm通道權(quán)重函數(shù)的峰值在400 hPa、520 hPa和580 hPa附近,通常情況主要提供中上層水汽信息,受地表參數(shù)(如地表溫度和發(fā)射率)的影響較小。11.2 μm和12.3 μm窗區(qū)通道主要對(duì)低層水汽更為敏感,權(quán)重函數(shù)峰值為800 hPa和780 hPa附近。
通道敏感性在不同大氣條件下會(huì)有所不同,青藏高原平均海拔高度達(dá)4000 m,AHI水汽吸收通道具備提供整個(gè)空氣柱水汽含量的潛力。此外,紅外分裂窗區(qū)通道的差分吸收也能提供PWV。因此,選用AHI的水汽吸收和分裂窗區(qū)5個(gè)紅外通道亮溫進(jìn)行水汽反演。表1為使用通道的主要特征,使用數(shù)據(jù)的時(shí)間是2016年1月1日-12月30日。此外,還使用了AHI L2級(jí)云檢測(cè)產(chǎn)品,主要用于分辨晴空和云天像元。AHI數(shù)據(jù)下載于日本宇宙航空研究開發(fā)機(jī)構(gòu)地球觀測(cè)研究中心(http://www.eorc.jaxa.jp/ptree/index.html)。由于JAXA的P-Tree數(shù)據(jù)網(wǎng)發(fā)布的云檢測(cè)產(chǎn)品只有白天的數(shù)據(jù),因此本研究?jī)H使用了0-12 UTC的數(shù)據(jù),時(shí)間間隔為1 h。
表1 算法所使用AHI通道的主要特征
1.1.2 GPS PWV數(shù)據(jù)
全球定位系統(tǒng)(global positioning system,GPS)地基站點(diǎn)在接收信號(hào)時(shí)的大氣延遲可用于大氣水汽反演,精度通常為1~2 mm[11]。GPS PWV數(shù)據(jù)已被廣泛應(yīng)用于衛(wèi)星水汽產(chǎn)品的評(píng)估和驗(yàn)證。選用2016年1月1日-12月30日的逐小時(shí)GPS PWV作為真實(shí)參考數(shù)據(jù),用于建模和驗(yàn)證AHI反演的PWV精度。
青藏高原24°N~40°N,80°E~105°E共 32個(gè)GPS站點(diǎn)(圖2),站點(diǎn)海拔高度從2585~4705 m,年均PWV變化3.03~10.05 mm。2016年的逐小時(shí)PWV變化0.2~35.0 mm。
1.1.3 GFS PWV預(yù)報(bào)場(chǎng)
全球天氣預(yù)報(bào)系統(tǒng)(GFS)可以提供全球范圍0.25°,0.5°和1°的網(wǎng)格PWV數(shù)據(jù)。預(yù)測(cè)時(shí)間步長分別為0~240(間隔為3 h),240~384(間隔為12 h)。模式預(yù)報(bào)每天在UTC 00、06、12和18時(shí)運(yùn)行。根據(jù)已有的研究,數(shù)值預(yù)報(bào)可以有效提高基于衛(wèi)星數(shù)據(jù)的大氣參數(shù)估算精度[26]。將0.25°分辨率的GFS PWV數(shù)據(jù)作為模型的一個(gè)輸入,以期待通過融合衛(wèi)星觀測(cè)和GFS PWV的預(yù)報(bào)信息,并減少云污染對(duì)衛(wèi)星反演結(jié)果可能的影響,進(jìn)而提高PWV反演精度。
美國大學(xué)大氣科學(xué)研究聯(lián)盟(UCAR)提供了非常便捷獲得GFS歷史數(shù)據(jù)子集的方式(https://rda.ucar.edu/datasets/ds084.1/)。實(shí)時(shí)的GFS PWV預(yù)報(bào)數(shù)據(jù)可從NOAA NCEP下載(https://www.nco.ncep.noaa.gov/pmb/products/gfs/)。由于GFS僅提供3 h間隔的數(shù)據(jù),根據(jù)AHI的觀測(cè)時(shí)間和經(jīng)緯度信息對(duì)GFS PWV進(jìn)行了時(shí)空插值。
神經(jīng)網(wǎng)絡(luò)是由多個(gè)神經(jīng)元構(gòu)成的非線性模型,其可以較好地描述訓(xùn)練數(shù)據(jù)的輸入和輸出變量的非線性和復(fù)雜關(guān)系,也被廣泛應(yīng)用于地球物理參數(shù)的反演和估算[26-27]。本研究選用多層前饋神經(jīng)網(wǎng)絡(luò)來構(gòu)建青藏高原PWV快速反演模型。
模型的輸入主要包括AHI的5個(gè)紅外亮溫、衛(wèi)星觀測(cè)角、GFS PWV預(yù)報(bào)場(chǎng)、海拔高度、經(jīng)度、緯度、儒略日和小時(shí)。利用最近鄰方法提取與GPS站點(diǎn)時(shí)空匹配的AHI像元多通道亮溫,對(duì)GFS數(shù)據(jù)進(jìn)行時(shí)空插值以匹配AHI觀測(cè)。經(jīng)過時(shí)空匹配和云檢測(cè)處理,最終形成21156組樣本。為分析GFS PWV預(yù)報(bào)場(chǎng)對(duì)反演模型的影響,將建立2個(gè)模型,模型1是基于全部預(yù)測(cè)因子的NN模型;模型2則為未包含GFS PWV的NN模型。針對(duì)2個(gè)模型均隨機(jī)選擇一半數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),余下的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)集。
為驗(yàn)證方法的可靠性和評(píng)價(jià)結(jié)果的質(zhì)量,使用相關(guān)系數(shù)(R)、均方根誤差(RMSE)和偏差(Bias)3個(gè)統(tǒng)計(jì)指標(biāo):
其中,PWVNN和PWVGPS分別是神經(jīng)網(wǎng)絡(luò)模型反演和GPS站點(diǎn)的和分別是神經(jīng)網(wǎng)絡(luò)模型反演和GPS站點(diǎn)的PWV平均值,N是數(shù)據(jù)樣本總數(shù)。
圖3給出了模型1和2反演結(jié)果與GPS PWV的二維直方分布圖。兩模型反演值與GPS PWV數(shù)據(jù)的相關(guān)系數(shù)大于0.94,RMSE小于1.52 mm,這意味兩個(gè)模型均能有效反演PWV。模型1的PWV數(shù)據(jù)比模型2更集中于1∶1線,這說明模型1估算值與GPS PWV吻合度更高。模型 1的 R、RMSE和 Bias分別為0.957、1.33 mm和-0.004 mm,模型2則分別為0.943、1.52 mm和0.01 mm。模型1和2輸入數(shù)據(jù)的差異是有無GFS PWV,這意味著引入GFS PWV預(yù)報(bào)場(chǎng)數(shù)據(jù)可以提高PWV反演精度。
圖4為兩個(gè)模型PWV反演誤差(反演值-GPS PWV)直方分布圖,兩模型誤差均呈現(xiàn)正態(tài)分布,絕大部分誤差在±4.0 mm以內(nèi)(>97.3%樣本)。模型1和2的PWV反演誤差小于2.0 mm的數(shù)據(jù)點(diǎn)分別占90.75%和87.51%,誤差小于1.0 mm的數(shù)據(jù)點(diǎn)則分別為72.1%和67.1%。Lee等[27]利用AHI多通道亮溫、經(jīng)緯度和觀測(cè)角數(shù)據(jù),基于機(jī)器學(xué)習(xí)模型估算了東北亞地區(qū)的PWV。模型加入了更多與水汽相關(guān)的影響因子(比如海拔高度、時(shí)間信息和PWV預(yù)報(bào)場(chǎng)),因此展現(xiàn)了與GPS PWV的更好的吻合度。
通常情況下,衛(wèi)星反演PWV的精度會(huì)受大氣含水量、海拔高度、經(jīng)緯度和地表類型等多種因素影響,進(jìn)而呈現(xiàn)一定的時(shí)空分布特征。為進(jìn)一步分析本文模型的精度,逐個(gè)站點(diǎn)評(píng)估了PWV反演的精度。圖5給出了模型1和2的R和RMSE空間分布圖??傮w而言,兩個(gè)模型在大部分站點(diǎn)均有較好的表現(xiàn),RMSE主要在0.5~2.5 mm,相關(guān)系數(shù)主要在0.9~0.98。相比之下,由于引入了GFS PWV預(yù)報(bào)場(chǎng),模型1在各站點(diǎn)均比模型2精度好,展現(xiàn)了較高的R和較小的RMSE。值得注意的是,也存在個(gè)別站點(diǎn)誤差偏大,RMSE可達(dá)3.0 mm,這可能跟云污染或訓(xùn)練樣本代表性有限有關(guān)。
此外,對(duì)模型誤差的季節(jié)變化特征進(jìn)行分析。圖6給出了模型的月平均相關(guān)系數(shù)、均方根誤差和偏差的時(shí)間序列。兩個(gè)模型的月平均RMSE和R展現(xiàn)了相似的季節(jié)變化特征。模型RMSE均從1月1.0 mm開始上升,7月達(dá)到最大值3.0 mm,然后又逐漸下降。整體來說,夏季呈現(xiàn)出較大的RMSE,冬季RMSE較小。RMSE趨勢(shì)跟PWV的季節(jié)變化特征相似,意味著水汽含量數(shù)值對(duì)RMSE有明顯影響,這與之前的研究結(jié)果是一致的[7,23]。冬季模型的相關(guān)系數(shù)低于其他季節(jié),這可能跟冬季PWV動(dòng)態(tài)變化范圍小有關(guān)。兩模型的月平均偏差小于0.25 mm,說明沒有明顯的高估或者低估。
總體而言,神經(jīng)網(wǎng)絡(luò)模型反演結(jié)果與GPS PWV吻合度較好,具體表現(xiàn)在較高的相關(guān)系數(shù)、較低的均方根誤差和平均偏差,說明該算法可以有效反演青藏高原PWV。
神經(jīng)網(wǎng)絡(luò)建模時(shí)使用了GPS站點(diǎn)數(shù)據(jù)。當(dāng)有GPS PWV參考數(shù)據(jù)可用時(shí),推薦使用模型1進(jìn)行PWV的反演。沒有GPS PWV可用時(shí),構(gòu)建模型1將變得非常困難。此時(shí),可以使用模型2進(jìn)行PWV反演。具體操作如下:(1)收集研究區(qū)域有代表性的地表、大氣廓線數(shù)據(jù)(如月平均的同化模型數(shù)據(jù));(2)利用輻射傳輸模型(如MODTRAN或者RTTOV)模擬衛(wèi)星觀測(cè)的多通道亮溫;(3)基于模擬的多通道亮溫、大氣廓線積分的PWV以及模擬計(jì)算的輸入各種輔助參數(shù),構(gòu)建PWV神經(jīng)網(wǎng)絡(luò)反演模型。模型2精度略差于模型1,其優(yōu)點(diǎn)是在無GPS PWV數(shù)據(jù)可用時(shí),可以通過模擬數(shù)據(jù)來構(gòu)建模型。
新一代靜止氣象衛(wèi)星為高時(shí)空分辨率PWV探測(cè)提供了良好的機(jī)遇。利用Himawari-8 AHI多通道紅外亮溫、GFS PWV預(yù)報(bào)場(chǎng)和其他輔助數(shù)據(jù),基于神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建了適用于青藏高原低水汽環(huán)境下的PWV快速反演方法。引入水汽吸收通道和GFS PWV預(yù)報(bào)場(chǎng),可以有效提高低水汽情況下的PWV反演精度?;贕PS PWV數(shù)據(jù)的驗(yàn)證結(jié)果表明,反演的PWV的R和RMSE分別為0.957和1.33 mm,這意味著模型能夠提供青藏高原較高精度的PWV。此外,由于反演過程不需要輻射傳輸計(jì)算,因此算法速度遠(yuǎn)高于物理反演算法,適合于實(shí)時(shí)的PWV反演。
分析了模型誤差的時(shí)空變化特征,大部分站點(diǎn)RMSE誤差小于2.0 mm,說明算法表現(xiàn)較穩(wěn)定可靠。模型RMSE和R展現(xiàn)了一定的季節(jié)變化特征,RMSE夏季誤差大于冬季,與大氣水汽含量變化展現(xiàn)了相似的變化趨勢(shì)。冬季R小于其他季節(jié),這可能跟冬季PWV動(dòng)態(tài)范圍小有關(guān)。僅利用青藏高原地區(qū)32個(gè)臺(tái)站數(shù)據(jù)進(jìn)行建模,沒有進(jìn)行基于無線電氣象探空的PWV數(shù)據(jù)的驗(yàn)證、對(duì)比,在其他地區(qū)的適用于性有待于進(jìn)一步驗(yàn)證。FY-4A/B的星載成像儀與AHI通道配置相近,算法也適用于FY-4A/B數(shù)據(jù)。